Changes between Version 3 and Version 4 of SongYingxing


Ignore:
Timestamp:
Aug 5, 2010, 12:48:14 PM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • SongYingxing

    v3 v4  
    1818  * <sm> in <p> als note herausziehen, oder drinlassen? Bisher war die Idee, es als note herauszuziehen, allerdings wurde es bisher noch nie gemacht. Es gibt, trotz der suggestiven Aufteilung in <s>, keine technischen Gründe dagegen. Testweise beide Versionen erzeugen und dann vergleichen?
    1919
     20== Darstellung der Abbildungen ==
     21
     22Seitenbilder werden nicht ausgeschnitten.
     23
     24Problem des Textes auf Seite [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=168 83B / 168]. Scheint nicht zum Haupttext zu gehören, unterbricht den Haupttext. Deshalb eine Textzeile von Seite 84A auf Seite 83A verschoben.
     25
     26Problem der Überschriften, die eigentlich captions für Figure-Gruppen sind: zum Beispiel Seite 14A / 29
     27
     28Problem der Doppelseitenbilder: Die Bildhälften passen nicht so zusammen, wie sie gedruckt sind (zum Beispiel 016A und 016B, die auf dem gleichen Blatt gedruckt sind), sondern wenn man das gebundene Buch aufschlägt. Ein Beispiel (mit der Figure-Gruppen-caption am Anfang und den captions der Figures, "--" bedeutet, dass es auf der entsprechenden Seite keine caption gibt; danach in Klammern die descriptions):
     29
     30|| Buchseiten ||||  caption  ||||  descriptions  ||
     31||14A  |||||||| 汲水圖 (Figure-Gruppen-caption) ||
     32|| || || || || ||
     33|| 015A 014B   ||  -- ||  筒車  ||   橛障  坡水  坡水  牐   ||   規水  規水  岸 ||
     34|| 016A 015B  ||  人車 ||  --   ||  蘢骨   ||  -- ||
     35|| 017A 016B  ||  -- ||  --   ||  --   ||   中柱 牛轉盤外 ||
     36|| 017B   ||||  拔車  ||||   --  ||
     37|| 018A ||||   桔槔   ||||  墜石  井  ||
     38 
     39Sollte man auch JPGs der zusammengehörenden Bilder zur Verfügung stellen? Die Bilder wären leichter zu erfassen, aber die Numerierung der Seiten im Anzeigesystem wäre dann (zumindest zurzeit) verwirrender. Man müsste dann auch die Information "014B" etc. anzeigen (das wäre allerdings sowieso sinnvoll!).
     40
     41|| JPG || bisher || nachher ||
     42|| 014B || 30 || 30 ||
     43|| 015A || 31 || 31 ||
     44|| 015A_014B || || 32 ||
     45|| 015B || 32 || 33 ||
     46|| 016A || 33 || 34 ||
     47|| 016A_015B || || 35 ||
     48|| 016B || 34 || 36 ||
     49|| 017A || 35 || 37 ||
     50|| 017A_016B || || 38 ||
     51|| 017B || 36 || 39 ||
     52|| 018A || 37 || 40 ||
     53|| || || ||
     54|| 018B || 38 || 41 ||
     55
     56Alternative wäre eine zwei-Seiten-Ansicht. Beachte außerdem die Umkehrung der links-rechts-Metapher.
     57
     58
    2059== noch zu tun ==
    2160
     
    2362
    2463  * div-Struktur prüfen (u.a. preface)
    25   * neue Textstücke in <s> aufteilen
     64  * neue Textstücke in <s> aufteilen, und interpunktion
    2665
    2766=== von mir ===
     
    3170  * ZWS korrigieren (Skript?)
    3271  * entferne die letzten <image>-tags in den Figures, mit der Ausnahme 83B.
    33   * ersetze \\. In <description> durch <lb/>, in <sm> noch unklar. (Siehe auch unten: die Frage der Darstellung von <sm>.)
     72  * ersetze `\\` In <description> durch <lb/>, in <sm> noch unklar. (Siehe auch unten: die Frage der Darstellung von <sm>.)
    3473  * fehlende xml:id ergänzen
    3574  * <pb> tiefer in die Hierarchie? Und andersrum: <pb> auf eigene Zeile wie in westlichen Texten? Optisch eigentlich nicht nötig, weil die <s> sehr kurz sind.
     
    4281
    4382  * fehlende Zeichenvarianten einfügen, insbesondere aus Extension B. Siehe Madlens Begleittext: [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.doc DOC], [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.pdf PDF].
    44   * gehe die nachträglich erstellte [source:trunk/texts/SongYingxing_1637/raw/Song_pseudo-rohtext.txt?format=txt Rohfassung] durch:
     83  * markiere alle <s> in kleiner Schrift
     84  * gehe die vom Skript nachträglich erstellte [source:trunk/texts/SongYingxing_1637/raw/Song_pseudo-rohtext.txt?format=txt Rohfassung] durch (Rohtext nach dem Markieren der kleinen Schrift updaten!):
     85  * prüfe alle <s>, die kein Satzzeichen am Ende haben
    4586  * Wenn alle anderen Probleme abgearbeitet sind: Places einfügen, i.e. von den Markierungen auf Papier in den Text eintragen. Vorschlag: Einfach mit ( ) markieren.
    4687
     
    5596
    5697  * ein bisschen (aber nicht völlig) analog zu <pb>: <figure> in <p> erlauben, damit man nicht </s> hinter die Figure verschieben muss? Kein großer Leidensdruck, und das Ergebnis wäre auch nicht konsequent.
    57   * `< V>` vorläufig als <reg norm="鬵" type="unresolved">鬵</reg>. Explizite Typen einführen, z.B. "variant/auto" (entspricht `< V>`) und "variant/auto?" (bei Zeichen, die an anderer Stelle als `< V>` markiert wurden). Siehe Variantenmarkierung in den DESpecs.
     98  * `< V>` vorläufig als <reg norm="鬵" type="unresolved">鬵</reg>. Explizite Typen einführen, z.B. "variant/auto" (entspricht `< V>`) und "variant?/auto" (bei Zeichen, die an anderer Stelle als `< V>` markiert wurden). Siehe Variantenmarkierung in den DESpecs.
    5899  * Attribut von <head>: Verschachtelungstiefe. Siehe unten.
    59100  * aufgeteiltes Bild auf Seite 76B / 154: Lösung für das Problem von mehr als einer caption. Okay so, oder muss man in <figure> etwas wie Unter-Figures erlauben?
     101  * Bild mit Beschreibungstext auf Seite 83B / 168 (stimmt das?): Weitere Kategorie neben caption, description, variables?
    60102
    61103=== für den Workflow ===
     
    100142=== figures ===
    101143
    102 Alle Bilder sind Seitenbilder und werden daher nicht ausgeschnitten. Die einzige Ausnahme ist das Bild auf Seite [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=168 83B]. Eine Besonderheit dieses Textes ist also, dass fast alle Figures kein `<image>` haben.
     144Alle Bilder sind Seitenbilder und werden daher nicht ausgeschnitten. Die einzige Ausnahme ist das Bild auf Seite [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=168 83B / 168]. Eine Besonderheit dieses Textes ist also, dass fast alle Figures kein `<image>` haben.
    103145
    104146  * Die Lösung, Figures in <div float> rechtsbündig anzuzeigen, funktioniert in diesem chinesischen Text optisch nicht. Vergleiche [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=37 Figure 12] ohne <div float> und [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=42 Figure 13] mit <div float>. Vermutlich sollten wir also doch als Standard nehmen, Bilder linksbündig anzuzeigen. Würde sich die Lage verändern, wenn man in bei den Bildern noch die Position definiert?
     
    107149  * Das Symbol für ein fehlendes Bild wird angezeigt unabhängig davon, ob die Figure ein <image> hat oder nicht.
    108150  * Aufruf der [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fzh%2FSongYingxing_1637.xml&mode=image&pn=1&sn=-1&query-type=figures&query-result-pn=1 Table of Figures] ergibt eine Fehlermeldung.
    109 
     151  * Insbesondere für die Doppelseitenbilder braucht man die umgekehrte links-rechts-Metapher der Pfeile.
    110152
    111153=== small text ===
     
    122164Die div's der front matter werden nicht angezeigt: Title, preface, toc. Bei toc sollten die verschachtelten div's nicht angezeigt werden. Ich werde das ändern, sobald ich dazu komme.
    123165
     166=== Seitenzahlen ===
     167
     168Es sollte auch der Name der Halbseite angezeigt werden, also zum Beispiel 168 / 83B und 189 / 84A. Ansonsten ist es mühsam, eine Seite zu finden. Aus dem file-Attribut in <pb> extrahieren, oder neues Attribut? Das o-Attribut passt hier nicht, denn zum Beispiel "83B" steht ja nicht auf der Seite, sondern ist eine nachträgliche Setzung.
     169
    124170=== Suche ===
    125171
    126172Es kann immer wieder passieren, dass die ZWS durcheinandergeraten. Wie geht die Suche damit um? Suchoption "ignoriere ZWS"?
     173
     174=== Zeichen-Varianten ===
     175
     176Infrastruktur für die Anzeige von ⿱金尖.svg schaffen. <image> muss anders behandelt werden als bei Figures.
    127177
    128178=== PDF-Darstellung ===