Context Navigation

← Previous Change
Wiki History
Next Change →

Changes between Version 2 and Version 3 of SongYingxing-specific

Timestamp:: Aug 25, 2010, 4:06:07 PM (14 years ago)
Author:: Wolfgang Schmidle
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

SongYingxing-specific

-                      v2
+                      v3
   * wenige Zeichen verbessert: Kurzzeichen in 天工开物 durch Langzeichen ersetzt, ein paar Zeichen in Überschriften ergänzt, N402CA2: full-width space vor 回 eingefügt
+== Fragen zum Text ==
+  * ASCII-Punkte und -Kommas im Text: Kann ich die einfach durch ihre Fullwidth-Äquivalente ersetzen? z.B. N400028 (Punkt), N40003D (Komma).
+    * ja, einfach ersetzen (ok)
+  * entferne überflüssige spaces, insbesondere vor </s>, auch vor <emph style="sm"> und </head>.
+    * ja, entfernen vor </s> etc. (ok)
+  * Skript für die Rohfassung des Textes sollte mit <sm> umgehen können; beachte <sm> über Zeilenumbruch hinaus
+  * Seitenbilder kopieren: erledigt.
+== beantwortete Fragen zum Text ==
   * div-Struktur: part statt chapter für 上, 中, 下? Bei europäischen Texten würde eine fortlaufende Abschnitt-Zählung (1-6, 7-13, 14-18) nahelegen, dass es Teile und keine Kapitel sind. Funktioniert diese Logik auch bei chinesischen Texten?
 …
     * Ähnlich wie 8B, aber Unterschied: Dort keine neuen Absätze, sondern Teile in einem Absatz.
+== noch zu tun ==
+=== von Dagmar ===
+== erledigte Fragen zur Struktur ==
   * div-Struktur prüfen (u.a. preface). Ist die unterste Ebene sinnvoll oder störend (vermutlich sinnvoll, siehe auch Übersetzung)?
 …
   * Seitenzahlen im Buch nachtragen? Zum Beispiel 6A/B ist 一, etc. (getrennt für jeden der drei Teile)
 ==== Treffen 2010-08-18 ====
+=== Treffen 2010-08-18 ===
 Grundsätzliches:
 …
   * 207B: als Liste markieren, nicht als Absätze; 208A: die beiden Punkte in einer Zeile sind nicht in einer Zeile, weil es optisch zufällig passt, sondern es hat eine Bedeutung. Wiedergeben in einer Zeile. (Bzw. Unterpunkt?) (vorläufig erledigt, siehe unten)
+==== Seitenzahlen ====
+=== Seitenzahlen ===
 Offsets der drei Teile:
 || 1 || 5 ||
 || 2 ||  85 ||
+|| 3 ||  162, 161 ||
+Seitenzahlen:
+  * preface:
+|| 3 ||  162 bzw. 161 ||
+Bei der Schreibweise der Zahlen wird 十 falls möglich weggelassen, also bei Zahlen ab 21, außer bei 20, 30, 40, etc.
+  * preface: 1A = 一a  (offset 0)
+    * 0 keine Seitenzahl
     * 1-3 ok
     * 4-5 keine Seitenzahlen
   * part 1: 6A = 一a (offset 5)
     * 6-85: 十 falls möglich weglassen
+    * 6-85: ok
   * part 2: 86A = 一a  (offset 85)
     * 86-162: 十 falls möglich weglassen
+    * 86-162: ok
     * Ausnahmen 111-113 mit 十
   * part 3: 163A = 一a (offset 162)
     * 163-227: 十 falls möglich weglassen
+    * 163-227: ok
     * Ausnahmen 183, 184, 187 mit 十
     * Ausnahme 185: "二十三　四", danach offset 161
     * 228-230: keine Seitenzahl
+==== Martina zu small text ====
+=== Martina zu small text ===
 Es gibt small text, der eindeutig wie eine Fußnote ist: "dieses Zeichen wird ... gelesen", oder die Quelle eines Zitats. Beispiele angucken:
 …
 Genauer: Es kann ein generisches <sm> geben, oder der Bearbeiter eines Textes kann entscheiden, ob small text im Text, als Fußnoten oder als textflows angezeigt wird. Wenn der Bearbeiter das nicht im XML festlegt (wie?), kann der User es im Anzeigesystem wählen. Es geht also um die Frage, ob man mehrere Modi überhaupt erlauben soll.
 Für den vorliegenden Text hat die Bearbeiterein jedenfalls die Entscheidung getroffen: Im Text lassen. Diesen Modus muss es also auf alle Fälle geben. Wahrscheinlich ist es auch der default-Modus für <sm>.
+Für den vorliegenden Text hat die Bearbeiterin jedenfalls die Entscheidung getroffen: Im Text lassen. Diesen Modus muss es also auf alle Fälle geben. Wahrscheinlich ist es auch der default-Modus für <sm>.
 …
 === von mir ===
+  * ASCII-Punkte und -Kommas im Text: Kann ich die einfach durch ihre Fullwidth-Äquivalente ersetzen? z.B. N400028 (Punkt), N40003D (Komma).
+    * ja, einfach ersetzen (ok)
+  * Zeilen korrekt einrücken, sobald klar ist, ob die div's so in Ordnung sind. (auch <div float>! Helper-script schreiben!)
+  * Zeilen korrekt einrücken, sobald klar ist, ob die div's so in Ordnung sind. (teilweise erledigt, aber auch <div float>! Helper-script schreiben!)
   * ZWS (zero-width space U+200B) korrigieren (Skript?)
   * ersetze `\\` in <description> durch <lb/> (erledigt), in <sm> noch unklar. (Siehe auch unten: die Frage der Darstellung von <sm>.)
+  * ersetze `\\` in <description> durch <lb/> (erledigt), in <sm> noch unklar. (Siehe auch: die Frage der Darstellung von <sm>.)
   * <pb> tiefer in die Hierarchie? Und andersrum: <pb> auf eigene Zeile wie in westlichen Texten? Optisch eigentlich nicht nötig, weil die <s> sehr kurz sind.
   * Title: Sprachkürzel für Pinyin?
-  * entferne überflüssige spaces, insbesondere vor </s>, auch vor <emph style="sm"> und </head>.
-    * ja, entfernen vor </s> etc. (ok)
-  * Skript für die Rohfassung des Textes sollte mit <sm> umgehen können; beachte <sm> über Zeilenumbruch hinaus
   * nach dem Einfügen von <s> und Interpunktion nochmal normalisieren, zum Beispiel beim eingefügten Text 25B / 26A. Beachte insbesondere längere Stellen wie N405661, N4057D8, N4061DE, N406241, wo die <lb> zurzeit als returns drin sind.
   * am Ende: fehlende xml:id ergänzen
 …
 === von einem Studenten ===
-  * Seitenbilder kopieren: erledigt.
   * fehlende Zeichenvarianten einfügen, insbesondere aus Extension B. Siehe Madlens Begleittext: [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.doc DOC], [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.pdf PDF]. Siehe auch @ im Text.
   * verbotene Zeichen am Anfang von <s>, zum Beispiel ” (Artefakt des damaligen <s>-Skripts; für ” habe ich es schon gemacht); überhaupt wäre es am besten, alles zwischen “ und ” in ein einziges <s> zu tun
 …
   * Mache eine Liste aller Stellen, wo die <s> und <sm> sich beißen würden. Beispiel N405817 ff und N405BF2 ff.
 Problem von inkorrekten Langzeichen: Haben die Taiwanesen nach dem Abtippen einen Konverter verwendet? Beispiel Seite 300: Das letzte Zeichen vor der Überschrift (in N404302) ist falsch: [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=300 Bild], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=300 Text]. Das zugrundeliegende Problem ist offenbar, dass das korrekte Zeichen 云 als Kurzzeichen interpretiert und durch das Langzeichen 雲 ersetzt wurde. Ebenso falsch in N4007E2, N4047A1, aber möglicherweise ist 雲 an anderen Stellen korrekt. Deshalb kann man es nicht blind ersetzen.
+Problem von inkorrekten Langzeichen: Beispiel Seite 300: Das letzte Zeichen vor der Überschrift (in N404302) ist falsch: [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=300 Bild], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=300 Text]. Das zugrundeliegende Problem ist offenbar, dass das korrekte Zeichen 云 als Kurzzeichen interpretiert und durch das Langzeichen 雲 ersetzt wurde. Ebenso falsch in N4007E2, N4047A1, aber möglicherweise ist 雲 an anderen Stellen korrekt. Deshalb kann man es nicht blind ersetzen.
   * Aber zum Beispiel 麵 kommt nicht vor.
   * Und das letzte Zeichen auf Seite 168B / 338 ist im Text 後, das Kurzzeichen wäre 后. Im Buch steht aber 左 ?
 …
     * Das ist so nicht richtig. Das Zeichen kommt zweimal vor, also zwei identische descriptions mit je einem Zeichen. Und: Nach den specs dann nur einmal tippen. (Aber: wenn es schon mal da ist, drinlassen?)
   * 43A: <caption>印架 過糊</caption>
     * Zwei Teile, also entweder space, oder zwei descriptions, oder Komma. Das soll Dagmar entscheiden.
+    * Zwei Teile, also entweder space, oder zwei descriptions, oder Komma. Das soll Dagmar entscheiden. Nach der Logik von 108B: einfach ein ideographic space dazwischen.
   * N40386D, N403973, N403C49, N403E5B, N403F0E, N404786, N404864, N40487F, N4048AB, etc.
     * N40386D: da fehlt nichts, man kann den space einfach wegmachen. (Rest nicht angeschaut.)