Changes between Version 69 and Version 70 of SongYingxing


Ignore:
Timestamp:
Aug 24, 2010, 2:45:18 PM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • SongYingxing

    v69 v70  
    7676  * Dagmar und Grace: small text nicht als notes herausziehen, sondern im Text lassen! Eigentlich nie Fußnoten. In anderen Büchern sogar Hierarchien, d.h. noch kleinerer Text.
    7777  * Ja, Stellen, wo es sich mit <s> beißt, korrigieren.
    78   * Ja, Seitenzahlen nachtragen. (Und es gibt Faksimile-Seitenzahlen!)
     78  * Ja, Seitenzahlen nachtragen. (Und es gibt Faksimile-Seitenzahlen!) (erledigt)
    7979  * 8B: Dagmar will large space in Überschriften vollständig getippt haben, also zum Beispiel ein 3-space als dreimal U+3000. Dann kann man auch den Doppelpunkt entfernen. Die Einrückung der Überschrift muss nicht getippt werden.
    8080  * 25B: spaces in <p> tippen: ok
     
    8282Einzelnes:
    8383  * 5A: Da war etwas vorgesehen (Astronomie etc.) und wurde dann gelöscht.
    84   * 108B: nicht weglassen; tippe es als eine caption, mit einem space dazwischen
    85   * 207B: als Liste markieren, nicht als Absätze; 208A: die beiden Punkte in einer Zeile sind nicht in einer Zeile, weil es optisch zufällig passt, sondern es hat eine Bedeutung. Wiedergeben in einer Zeile. (Bzw. Unterpunkt?)
     84  * 108B: nicht weglassen; tippe es als eine caption, mit einem space dazwischen (erledigt)
     85  * 207B: als Liste markieren, nicht als Absätze; 208A: die beiden Punkte in einer Zeile sind nicht in einer Zeile, weil es optisch zufällig passt, sondern es hat eine Bedeutung. Wiedergeben in einer Zeile. (Bzw. Unterpunkt?) (vorläufig erledigt, siehe unten)
    8686
    8787
     
    130130  * Zeilen korrekt einrücken, sobald klar ist, ob die div's so in Ordnung sind. (auch <div float>! Helper-script schreiben!)
    131131  * ZWS (zero-width space U+200B) korrigieren (Skript?)
    132   * ersetze `\\` in <description> durch <lb/>, in <sm> noch unklar. (Siehe auch unten: die Frage der Darstellung von <sm>.)
     132  * ersetze `\\` in <description> durch <lb/> (erledigt), in <sm> noch unklar. (Siehe auch unten: die Frage der Darstellung von <sm>.)
    133133  * <pb> tiefer in die Hierarchie? Und andersrum: <pb> auf eigene Zeile wie in westlichen Texten? Optisch eigentlich nicht nötig, weil die <s> sehr kurz sind.
    134134  * Title: Sprachkürzel für Pinyin?
     
    146146=== von einem Studenten ===
    147147
    148   * Seitenbilder kopieren: erledigt. Aber 83B besser ausschneiden!
     148  * Seitenbilder kopieren: erledigt.
    149149  * fehlende Zeichenvarianten einfügen, insbesondere aus Extension B. Siehe Madlens Begleittext: [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.doc DOC], [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.pdf PDF]. Siehe auch @ im Text.
    150150  * verbotene Zeichen am Anfang von <s>, zum Beispiel ” (Artefakt des damaligen <s>-Skripts; für ” habe ich es schon gemacht); überhaupt wäre es am besten, alles zwischen “ und ” in ein einziges <s> zu tun
    151151  * Text durchgehen auf Absatzenden (i.e. unvollständige Zeilen), zum Beispiel 194B, 195A.
    152   * spaces und large spaces in Überschriften, immer als genau ein ideographic space (ok für ch. 1-3)
     152  * spaces und large spaces in Überschriften mit der korrekten Anzahl von ideographic spaces tippen (die Einrückung der Überschrift muss nicht getippt werden)
    153153  * Large spaces in Absätzen: markieren mit #
    154154
     
    223223    * wenn im post-processing: Man hat die Information, welche Zeichen es betrifft. Man hat auch (oder erstellt mit wenig Aufwand) eine Liste der möglichen Zeichen. Gehe alle Vorkommnisse des Schriftzeichens im Text durch. Standardzeichen: ok: Variante: prüfe, ob nicht doch in Unicode. Sonst IDS-Sequenz erstellen. Im Text nur markieren mit v1, v2, etc. hinter dem Zeichen. Wird dann automatiisiert durch ein <reg> ersetzt, das im besten Fall die IDS-Sequenz verwendet. Wie groß wäre der Aufwand in der Praxis?
    224224  * `\\` in <desc> erlauben, oder nur einfach damit umgehen können, falls es gemacht wird?
     225  * nochmal darüber nachdenken: large spaces in Überschriften doch genau tippen lassen?
     226
    225227
    226228=== für das Schema ===
     
    244246}}}
    245247(und genauso für <caption>, aber nicht für <variables>). Die Lösung mit <explanation> kommt mir aber geeigneter vor. Insbesondere weil <description> normalerweise im Bild ist und nicht neben oder unter dem Bild.
     248
     249xhtml-Listen:
     250  * ich musste ein <pb> (Seite 208A / 417) tiefer verschieben, d.h. vorher zwischen </dd> und <dt>, nachher auf einer Höhe wie <s> im <dd> davor. Ist das so gewünscht?
     251  * <dl> kann laut Schema überall da sein, wo auch ein float sein kann, also nicht direkt in <dl>, sondern nur in <s>. Das ist aber bei verschachtelten Listen Unsinn. Schema ändern? (Das Flow-Model und Inline-Model von xhtml wurde ja im Schema umdefiniert und würde dann nochmal umdefiniert werden.) Erstmal jedenfalls: auf die Einrückung verzichtet. (Ändern, sobald es geht!)
    246252
    247253mögliche Änderungen in echo-chinese-text:
     
    253259  * <anchor> direkt in <p> erlauben?
    254260  * Attribut für "73B" in <pb>? Oder doch "o" verwenden?
    255 
     261  * Inhalt von xhtml?
    256262
    257263=== für den Workflow ===
     
    302308
    303309Problem des Bildbeschreibungstextes auf Seite [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=168 83B / 168]. Gehört nicht zum Haupttext, sondern unterbricht den Haupttext. Deshalb eine Textzeile von Seite 84A auf Seite 83A verschoben. (Kann man zurückändern, wenn man etwas wie <explanation> einführt, siehe unten.)
     310
     311Wimmelbild auf Seite 154: im figures-Ordner das identische Seitenbild dreimal abgelegt. Die Kopie kann man löschen, sobald es <figurepart> gibt.
    304312
    305313Problem der Überschriften, die eigentlich captions für Figure-Gruppen sind: zum Beispiel Seite 14A / 29 und 63A / 127. (In beiden Fällen trotzdem ein neues div begonnen.)
     
    464472  * Die Lösung, Figures in <div float> rechtsbündig anzuzeigen, funktioniert bei Seitenbildern optisch nicht. Vergleiche [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=37 Figure 12] ohne <div float> und [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=42 Figure 13] mit <div float>. Vermutlich sollten wir also doch als Standard nehmen, Bilder linksbündig anzuzeigen. (Würde sich die Lage verändern, wenn man in bei den Bildern noch die Position definiert?)
    465473  * <caption> wird über dem Bild gezeigt, alle <description> hintereinander ohne return oder space neben "[Figure: ...]:" ( [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=385 Beispiel]). Aber descriptions sind keine Unter-Überschriften. Die caption sollte dort gezeigt werden, wo jetzt die descriptions sind. Die descriptions dann darunter, jeweils in einer neuen Zeile für jede description. (Problem der mehrzeiligen descriptions: Listenpunkte für die descriptions?)
    466   * Die Bilder mit <div float> werden nicht korrekt durchnumeriert und auch nicht korrekt angezeigt, siehe z.B. Seite 154. Intern stimmt die Numerierung aber offenbar: Nach viermal 13 kommt 17.
     474  * Die Bilder mit <div float> werden nicht korrekt durchnumeriert und auch nicht korrekt angezeigt, siehe z.B. Seite 154. Intern stimmt die Numerierung aber offenbar: Nach viermal 13 kommt 17. (Möglicherweise vergleichbar: Im Benedetti sollen laut [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/la/Benedetti_1585.xml&pn=26&mode=text&query-type=figures&query-result-pn=1 TOF] die Figures 26 bis 29 auf Seite 26 sein, angezeigt werden aber, korrekterweise, nur zwei figures.)
    467475  * Das Symbol für ein fehlendes Bild wird angezeigt unabhängig davon, ob die Figure ein <image> hat oder nicht. Beispiel: Bilder 1-6 haben kein <image>, aber Bild 7 und 10 haben <image>. (Zumindest für diesen Text hat es sich erledigt, denn die figures haben jetzt <image>.)
    468476  * Aufruf der [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fzh%2FSongYingxing_1637.xml&mode=image&pn=1&sn=-1&query-type=figures&query-result-pn=1 Table of Figures] ergibt eine Fehlermeldung. (Bei Andrey wird daraus eine [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?url=%2Fmpiwg%2Fonline%2Fpermanent%2Fecho%2Fchina%2Fsongy_tiang_zh_1637&tocMode=figures ECHO-Fehlermeldung].)
     
    490498Es sollte auch der Name der Halbseite angezeigt werden, also zum Beispiel 168 / 83B und 169 / 84A. Ansonsten ist es mühsam, eine Seite zu finden. Aus dem file-Attribut in <pb> extrahieren, oder neues Attribut? (Das o-Attribut, in dem die originale Seitenzahl steht, passt hier eigentlich nicht, denn zum Beispiel "83B" steht ja nicht auf der Seite, sondern ist eine nachträgliche Zählung. Außerdem gibt es ja echte Seitenzahlen, auch wenn sie noch nicht abgetippt wurden!)
    491499
     500Neuer Stand: Die Seitenzahlen sind eingefügt. Problem ist jetzt, dass die Seitenzahl offenbar nicht in eine Zeile passt um umgebrochen wird, siehe z.B. Seite 154.
     501
     502== xhtml ==
     503
     504Seiten 416-417 enthalten eine xhtml-Liste (xhtml:dl). Die seiten werden nicht angezeigt.
     505
    492506== Suche ==
    493507