Changes between Version 6 and Version 7 of SongYingxing


Ignore:
Timestamp:
Aug 5, 2010, 3:24:58 PM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • SongYingxing

    v6 v7  
    1111  * div's eingefügt (Skript plus Nachbearbeitung für die hierarchische Struktur)
    1212  * Einrückungen normalisiert
    13   * Überschriften markiert
     13  * Überschriften markiert. N403115, N404D1B, N404EB2, N4051B4, N405238: zwei <s> zu einer <head>, inklusive Entfernen einer ID. Erkennbar am Fullwidth-Doppelpunkt in der neuentstandenen heading.
     14  * N404548: typo im Original korrigiert (十三 statt 十一)
     15  * wenige Zeichen verbessert: Kurzzeichen in 天工开物 durch Langzeichen ersetzt, ein paar Zeichen in Überschriften ergänzt, N402CA2: space vor 回 eingefügt
    1416
    1517== Fragen zum Text ==
     
    1719  * Was will mir der geschwärzte Abschnitt am Ende des TOC (Seite 5A) sagen?
    1820  * <sm> in <p> als note herausziehen, oder drinlassen? Bisher war die Idee, es als note herauszuziehen, allerdings wurde es bisher noch nie gemacht. Es gibt, trotz der suggestiven Aufteilung in <s>, keine technischen Gründe dagegen. Testweise beide Versionen erzeugen und dann vergleichen?
     21  * 194A: was ist das: eine Aufzählung?
     22  * 25B ff: Aufzählung; spaces im Text plus 一 bedeuten: hier fängt ein neuer Punkt an. Diese spaces in den Text einfügen, weil sie im Text stehen, auch wenn sie durch die <s> praktisch überflüssig geworden sind? Aber dann ein Problem, wenn man die Zeichen prüfen will, siehe unten.
     23  * 118B-122A: was bedeutet das? keine offensichtliche Aufzählung. Mehrere Absätze??
     24  * 207B f: was ist das?附 = Anhang? Jedenfalls: N405BEF zu heading gemacht, Doppelpunkt aber dringelassen
     25  * 226a-227b: zwei Absätze. Ein Nachwort? (das moderne Nachwort kommt dahinter und wurde nicht abgetippt)
     26
    1927
    2028== Darstellung der Abbildungen ==
     
    6472  * neue Textstücke in <s> aufteilen, und interpunktion
    6573  * 108B: die identische caption steht zweimal da (im Bild und deshalb auch im Text). Ich habe sie einmal gelöscht, um den Text schemakonform zu machen. Ist das okay?
    66   * Wie sollen die Überschriften vereinheitlicht werden? Beispiel 8B,  稻​工  /  耕 耙 磨耙 耘耔 + <sm>
     74  *  Überschriften N40032D (zwei <head>) und N400574 (ein <head>) vereinheitlichen? Beispiel 8B,  稻​工  /  耕 耙 磨耙 耘耔 + <sm>. Zwei head vielleicht besser, weil ein large space dazwischen ist. Andererseits N4006C6 ein 3-space und noch ein 2-space. Alternative: die spaces genau tippen?
    6775
    6876=== von mir ===
     
    7987  * Skript für die Rohfassung des Textes sollte mit <sm> umgehen können
    8088  * ersetze <figure/> wieder durch <figure> </figure>, damit kein <image> ergänzt wird
    81 
     89  * nach dem Einfügen von <s> und Interpunktion nochmal normalisieren, zum Beispiel beim eingefügten Text 25B / 26A.
    8290
    8391=== von Student ===
     
    8593  * fehlende Zeichenvarianten einfügen, insbesondere aus Extension B. Siehe Madlens Begleittext: [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.doc DOC], [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.pdf PDF].
    8694  * markiere alle <s> in kleiner Schrift analog zu `<s xml:id="N4001B1" style="sm">`
    87   * prüfe alle <s>, die kein Satzzeichen am Ende haben
     95  * prüfe alle <s>, die kein Satzzeichen am Ende haben, zum Beispiel N404EFF, N405E70
    8896  * verbotene Zeichen am Anfang von <s>, zum Beispiel ” (kann ich auch schnell selber machen); überhaupt wäre es am besten, alles zwischen “ und ” in ein einziges <s> zu tun
     97  * Haben die ASCII-spaces vor </s> irgendeine Bedeutung? Ansonsten entfernen.
    8998
    9099Problem von inkorrekten Langzeichen: Haben die Taiwanesen nach dem Abtippen einen Konverter verwendet? Beispiel Seite 300: Das letzte Zeichen vor der Überschrift (in N404302) ist falsch: [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=300 Bild], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=300 Text]. Das zugrundeliegende Problem ist offenbar, dass das korrekte Zeichen 云 als Kurzzeichen interpretiert und durch das Langzeichen 雲 ersetzt wurde. Ebenso falsch in N4007E2, N4047A1, aber möglicherweise ist 雲 an anderen Stellen korrekt. Aber zum Beispiel 麵 kommt nicht vor. (Und das letzte Zeichen auf Seite 168B / 338 ist im Text 後, das Kurzzeichen wäre 后. Im Buch steht aber 左 ?)
     
    97106  * Spaces von Aufzählungen nicht eingefügt (aber: will man das denn?)
    98107
    99 
    100   * Wenn alle anderen Probleme abgearbeitet sind: Places einfügen, i.e. von den Markierungen auf Papier in den Text eintragen. Vorschlag: Einfach mit ( ) markieren.
     108Einzelne Funde:
     109  * falsche Zeichen: N401F3F, N403112, N405D72, N405D75
     110
     111
     112Wenn alle anderen Probleme abgearbeitet sind: Places einfügen, i.e. von den Markierungen auf Papier in den Text eintragen. Vorschlag: Einfach mit ( ) markieren.
    101113
    102114== mögliche Konsequenzen ==
     
    131143  * Die ZWS sind schwierig zu kontrollieren, weil sie für den normalen Bearbeiter nicht sichtbar sind. Gibt es Alternativen, die auch in Arboreal funktionieren und den optischen Eindruck nicht stören? (Ich fürchte nicht; sichtbare Zeichen ASCII-spaces zwischen den Schriftzeichen fallen als eurozentrische Lösungen weg.) Normalisierungs-Skript schreiben. Darf bestehende bedeutungstragende ZWS (wo ihre Abwesenheit also bereits ein mehr-Zeichen-Wort ausdrückt) nicht verändern.
    132144  * Die Logik, die <pb> so weit wie möglich in der Hierarchie zu verstecken, habe ich bei diesem Text nicht angewendet. Sollte man das nachholen? Dann müsste zum Beispiel eine Seiten-Figure auch den nachfolgenden <pb> enthalten. Keine technische, sondern eine konzeptionelle Frage. Zumindest bei <div> ist aber klar, dass <pb> hineingezogen wird. Und in <s> könnte man <pb> auch problemlos hineinziehen.
     145  * In chinesischen Texten können problemlos Überschriften in der letzten Zeile auftreten, das ist also kein Hinweis auf einen Fehler, im Gegensatz zu europäischen Texten. Beispiel 104B, wo man den folgenden Text auf 105A im aufgeschlagenen Buch nebeneinander sieht, und auch 148A / 148B, wo das nicht der Fall ist. (Die Überschrift auf Seite 85B ist wirklich ein footer.) Konsequenterweise müsste man <pb> auch in <head> verschieben. Dieser Fall kommt in europäischen Texten bisher nur bei mehreren Textflows vor, also beispielsweise beim Eipo-Text.
     146  * Skript für "pb verstecken"? Das wäre auch wichtig, um andere workflows zu integrieren.
    133147  * Ich könnte genauso gut mit der Version arbeiten, wo die Figures bereits aus <p> herausgezogen sind. (Ansonsten: Einen Arbeitsschritt, in dem alle Skripte sind, mit dem aus der Bearbeitungsversion die Anzeigeversion wird? Problem: Dann wäre der Text vorher noch nicht schemakonform, also wahrscheinlich keine gute Idee.)
    134148