Changes between Version 10 and Version 11 of SongYingxing


Ignore:
Timestamp:
Aug 6, 2010, 7:30:15 AM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • SongYingxing

    v10 v11  
    2020  * <sm> in <p> als note herausziehen, oder drinlassen? Bisher war die Idee, es als note herauszuziehen, allerdings wurde es bisher noch nie gemacht. Es gibt, trotz der suggestiven Aufteilung in <s>, keine technischen Gründe dagegen. Testweise beide Versionen erzeugen und dann vergleichen?
    2121  * 194A: was ist das: eine Aufzählung?
    22   * 25B ff: Aufzählung; spaces im Text plus 一 bedeuten: hier fängt ein neuer Punkt an. Diese spaces in den Text einfügen, weil sie im Text stehen, auch wenn sie durch die <s> praktisch überflüssig geworden sind? Aber dann ein Problem, wenn man die Zeichen prüfen will, siehe unten.
     22  * 25B ff: Aufzählung; spaces im Text plus 一 bedeuten: hier fängt ein neuer Punkt an. Diese spaces in den Text einfügen, weil sie im Text stehen, auch wenn sie durch die <s> praktisch überflüssig geworden sind? Denn sonst ein Problem, wenn man die Zeichen prüfen will, siehe unten.
    2323  * 118B-122A: was bedeutet das? keine offensichtliche Aufzählung. Mehrere Absätze??
    2424  * 207B f: was ist das?附 = Anhang? Jedenfalls: N405BEF zu heading gemacht, Doppelpunkt aber dringelassen
    25   * 226a-227b: zwei Absätze. Ein Nachwort? (das moderne Nachwort kommt dahinter und wurde nicht abgetippt)
     25  * 226A-227B: zwei Absätze. Ein Nachwort? (das moderne Nachwort kommt dahinter und wurde nicht abgetippt)
    2626  * <s xml:id="N40501B"></s> am Ende von 178B / 358 entfernt. Ok?
    2727  * 108B: die identische caption steht zweimal da (im Bild und deshalb auch im Text). Ich habe sie einmal gelöscht, um den Text schemakonform zu machen. Ist das okay?
    28   *  Überschriften N40032D (zwei <head>) und N400574 (ein <head>) vereinheitlichen? Beispiel 8B,  稻​工  /  耕 耙 磨耙 耘耔 + <sm>. Zwei head vielleicht besser, weil ein large space dazwischen ist. Andererseits N4006C6 ein 3-space und noch ein 2-space. (Alternative: die spaces genau tippen, anstatt large spaces in Überschriften zu einem einzigen space zu machen? Aber ist dadurch etwas gewonnen, wenn die large spaces nicht ausdrücklich bedeutungstragend sind? Und um wirklich das Buch-Design wiederzugeben, müssten wir dann zusätzlich auch noch bei zum Beispiel der heading N401D3B auf Seite 60B / 122 am Anfang ein Einrückungs-space tippen.)
    29 
     28  *  Überschriften N40032D (zwei <head>) und N400574 (ein <head>) vereinheitlichen? Beispiel 8B,  稻​工  /  耕 耙 磨耙 耘耔 + <sm>. Zwei head vielleicht besser, weil ein large space dazwischen ist. Andererseits N4006C6 ein 3-space und noch ein 2-space. (Alternative: die spaces genau tippen, anstatt large spaces in Überschriften zu einem einzigen space zu machen? Aber ist dadurch etwas gewonnen, wenn die large spaces nicht ausdrücklich bedeutungstragend sind? Und um wirklich das Buch-Design wiederzugeben, müssten wir dann zusätzlich auch noch bei zum Beispiel der heading N401D3B auf Seite 60B / 122 am Anfang ein Einrückungs-space tippen. In den DESpecs 2.0.1 sollen large spaces in Überschriften ausdrücklich als ein einziger space getippt werden.)
     29
     30(vergleiche die Version des Textes bei [http://www.gutenberg.org/files/25273/25273-0.txt Gutenberg])
    3031
    3132== Darstellung der Abbildungen ==
     
    3536Problem der Überschriften, die eigentlich captions für Figure-Gruppen sind: zum Beispiel Seite 14A / 29 und 63A / 127. (In beiden Fällen trotzdem ein neues div begonnen.)
    3637
    37 Problem der Doppelseitenbilder: Die Bildhälften passen nicht so zusammen, wie sie gedruckt sind (zum Beispiel 016A und 016B, die auf dem gleichen Blatt gedruckt sind), sondern wenn man das gebundene Buch aufschlägt. Ein Beispiel ("--" bedeutet, dass es auf der entsprechenden Seite keine caption gibt):
     38Problem der Doppelseitenbilder: Die Bildhälften passen nicht so zusammen, wie sie gedruckt sind (zum Beispiel 016A und 016B, die auf dem gleichen Blatt gedruckt sind), sondern wenn man das gebundene Buch aufschlägt. Ein Beispiel ("--" bedeutet, dass es auf der entsprechenden Seite keine caption bzw. description gibt):
    3839
    3940|| Buchseiten ||||  caption  ||||  descriptions  ||
     
    7071=== von Dagmar ===
    7172
    72   * div-Struktur prüfen (u.a. preface). Und part statt chapter für 上, 中, 下? Bei europäischen Texten würde eine fortlaufende Abschnitt-Zählung (1-6, 7-13, 14-18) nahelegen, dass es Teile und keine Kapitel sind. Funktioniert diese Logik auch bei chinesischen Texten?
     73  * div-Struktur prüfen (u.a. preface). Ist die unterste Ebene sinnvoll oder störend (ich finde sie sinnvoll)? Und part statt chapter für 上, 中, 下? Bei europäischen Texten würde eine fortlaufende Abschnitt-Zählung (1-6, 7-13, 14-18) nahelegen, dass es Teile und keine Kapitel sind. Funktioniert diese Logik auch bei chinesischen Texten?
    7374  * neue Textstücke in <s> aufteilen, und interpunktion (Liste machen? Insbesondere die <s> ohne xml:id)
    7475
     
    99100
    100101Fehlende und überflüssige Zeichen: Gehe die vom Skript [source:trunk/texts/SongYingxing_1637/scripts/Song_lb-anzeigen.pl lb-anzeigen.pl] nachträglich erstellte [source:trunk/texts/SongYingxing_1637/raw/Song_pseudo-rohtext.txt?format=txt Rohfassung] durch (Rohtext nach dem Markieren der kleinen Schrift updaten!). Danach kann ich mit dem Skript [source:trunk/texts/SongYingxing_1637/scripts/Song_lb-einfuegen.pl lb-einfuegen.pl] die <lb/> einfügen.
    101   * Zeichen zuviel: Beispiel 214A [N405E93]
     102  * Zeichen zuviel: Beispiel 214A [N405E93] (eine ID in eckigen Klammern bedeutet, dass der <p> keine ID hat und statt dessen die ID des ersten <s> verwendet wird)
    102103  * Zeichen zuwenig: Beispiel 6B N40015A
    103104  * Struktur stimmt, aber trotzdem falsche Zeichen (einzelne falsche Zeichen, oder verschobene Stücke): Beispiel N400814 (letztes Zeichen in Zeile 4 stimmt sicher nicht; um eins verschoben)
     
    105106  * Spaces von Aufzählungen nicht eingefügt (aber: will man das denn?)
    106107
    107 haben Leerzeichen in den folgenden Zeilen eine Bedeutung (manchmal stehen ASCII-spaces für full-width spaces, ich habe das nicht ienzeln geprüft):
     108Haben Leerzeichen in den folgenden Zeilen eine Bedeutung (manchmal stehen ASCII-spaces für full-width spaces, ich habe das nicht einzeln geprüft):
    108109  * 41B: <desc>坑 坑</desc>
    109110  * 43A: <caption>印架 過糊</caption>
     
    122123  * N404EB2
    123124
    124 Wenn alle anderen Probleme abgearbeitet sind: Places einfügen, i.e. von den Markierungen auf Papier in den Text eintragen. Vorschlag: Einfach mit ( ) markieren.
     125Wenn alle anderen Probleme abgearbeitet sind: Places einfügen, i.e. von den Markierungen auf Papier in den Text eintragen. Vorschlag: Einfach mit ( ) markieren, ich wandle es dann anschließend um. Beispiel:
     126{{{
     127<s xml:id="N404318">(北京)有​磨​法,</s>
     128}}}
     129Wie werden Orte wie das Pekinger Münzamt in N403023 (唯北京寶源局黃錢與廣東高州爐青錢) markiert? Wird Peking und/oder das Münzamt markiert? (Ähnliches Problem wie bei <ref> im Benedetti.)
     130
    125131
    126132== mögliche Konsequenzen ==
     
    200206Lösung ist wohl einfach, dass <head> (aber wohl nur bei chinesischen Texten) ein Attribut "headlevel" bekommt, siehe oben. Sonst: Eine Überschrift "weiß" von seinem übergeordneten div, wie weit es verschachtelt ist, allerdings fängt die Zählung nicht bei null an.
    201207
    202 Dann kann ich mir auch die verschachtelten div's im toc sparen. Allerdings funktioniert das dann nur bei chinesischen Texten, nicht bei europäischen.
     208Dann kann ich mir auch die verschachtelten div's im toc sparen. Allerdings funktioniert das dann nur bei chinesischen Texten, nicht bei europäischen. (andererseits: wenn man "headlevel" auch für europäische Texte einführt, müsste man es zwar im post-processing per Hand einfügen, aber danach könnte das div-Skript automatisch eine hierarchische div-Struktur einfügen.)
    203209
    204210=== figures ===
     
    208214Die einzige Ausnahme ist das Bild auf Seite [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=168 83B / 168]. Eine Besonderheit dieses Textes ist also, dass fast alle Figures kein `<image>` haben.
    209215
    210   * Die Lösung, Figures in <div float> rechtsbündig anzuzeigen, funktioniert in diesem chinesischen Text optisch nicht. Vergleiche [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=37 Figure 12] ohne <div float> und [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=42 Figure 13] mit <div float>. Vermutlich sollten wir also doch als Standard nehmen, Bilder linksbündig anzuzeigen. Würde sich die Lage verändern, wenn man in bei den Bildern noch die Position definiert?
     216  * Die Lösung, Figures in <div float> rechtsbündig anzuzeigen, funktioniert bei Seitenbildern optisch nicht. Vergleiche [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=37 Figure 12] ohne <div float> und [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=42 Figure 13] mit <div float>. Vermutlich sollten wir also doch als Standard nehmen, Bilder linksbündig anzuzeigen. Würde sich die Lage verändern, wenn man in bei den Bildern noch die Position definiert?
    211217  * <caption> wird über dem Bild gezeigt, alle <description> hintereinander ohne return oder space neben "[Figure: ...]:" ( [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=385 Beispiel]). Aber descriptions sind keine Unter-Überschriften. Die caption sollte dort gezeigt werden, wo jetzt die descriptions sind. Die descriptions dann darunter, jeweils in einer neuen Zeile für jede description. (Problem der mehrzeiligen descriptions: Listenpunkte für die descriptions?)
    212218  * Die Bilder mit <div float> werden nicht korrekt durchnumeriert. Intern stimmt die Numerierung aber: Nach viermal 13 kommt 17.