wiki:Legacy Texts

Version 10 (modified by Klaus Thoden, 12 years ago) (diff)

--

Schlick-Korrspondenz

  • Einfügen von echodir-Pfad in den Header.
  • Metadaten einfügen
  • s-Tags einfügen!
  • body-Tag einfügen
  • Ersetzung <lb/> zu <lb/>, außer wenn vor dem <lb/> ein - steht (Hier Leerzeichen beachten!). Bei pagebreak funktioniert dies nicht.
  • Notes: Vor der Note muß ein Leerzeichen sein:
    auf einige Ein-<lb/>zelheiten Ihrer Schrift <note id="id7601728" n="2"><p
    type="main" id="id7601800"> Hans Reichenbach, Relativitätstheorie und
    Erkenntnis apriori. Berlin: Springer 1920.</p></note>Punkt für Punkt
    eingehen.<lb/></p>
    
  • index.meta korrigieren:
  • Etwaige Metadaten in info.xml korrigieren.

Schlick nach ECHO

  • schön formatieren mit xmllint --format Reichenbach_an_MS_19201129.xml
  • Manuelle Änderung des Headers mit Anreicherung (GND)
  • Seitensynchronisation
  • Hyphenisierte Wörter werden vom Wörterbuch erkannt, aber keine, die einfach so ein <lb/> haben
    • ein einfaches " <lb/>" -> " <lb/>") bringt nichts, weil dann die hyphenisierten Wörter nicht mehr gehen. Daher (replace-regexp "\([^-]\)<lb/> " "\1 <lb/>")
  • Was fällt auf? Sperrung ist zwar toll, sollte aber im XML kodiert sein und über CSS dargestellt werden
  • Sonderzeichen müssen identifiziert und durch Unicodezeichen ersetzt werden
  • Notes?

Volta

Volta ist schon im Archimedes-Format. Es müssen aber die Zeilenumbrüche transformiert werden, damit die Worterkennung funktioniert.

  • Einfügen von echodir in den Header
  • text-url-path in index.meta einfügen
  • Eventuell Metadaten in info.xml korrigieren
  • Bei Abbildungen müssen noch pagebreaks eingefügt werden.

LISE

LISE ist ein Format zur Gliederung von XML-Texten. Seitenbilder werden nicht mit Volltexten verbunden, sondern nur in ein XML mit Überschriften eingesetzt. Es wird produktiv noch von den Kooperationspartnern auf Teneriffa eingesetzt.

Die Texte liegen auf xserve02/volume/data/webserve/humboldt/documents. Auf der Foxridge liegen dann auch die entsprechenden Bilder: beispielsweise online_permanent/humboldt/webb_histo_fr_01_1839/012-01-pageimg/

Per XSLT sollte eine Konversion nach ECHO möglich sein. Oder möglicherweise nach METS/MODS

Einstein Annalen

Die Texte können wie sie sind in ihrem XHTML-Format bleiben, da es nun eine Dokumentenbasis im Viewer gibt, die das unterstützt. Es muß nur im index.meta ein entsprechender Eintrag für <text-url-path> gemacht werden.

Folgende Probleme sind noch zu beheben:

  • (Links in der chronologischen Ordnung):
  • Weitere (Links in der alphabetischen Ordnung):