Changes between Version 48 and Version 49 of SongYingxing
- Timestamp:
- Aug 12, 2010, 11:11:43 AM (15 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
SongYingxing
v48 v49 5 5 Song Yingxing (宋應星) 1637, Tian gong kai wu (天工開物): [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml link] zum Text im Anzeigesystem; XML-Text in der Version [source:trunk/texts/SongYingxing_1637/xml/SongYingxing_1637.xml zum Bearbeiten] und [source:trunk/texts/eXist/echo/zh/SongYingxing_1637.xml im Anzeigesystem]. 6 6 7 "Übersetzung" bezieht sich auf "Sung Ying-Hsing: Chinese technology in the seventeenth century, T'ien-kung k'ai-wu". 7 "Übersetzung" bezieht sich auf "Sung Ying-Hsing: Chinese technology in the seventeenth century, T'ien-kung k'ai-wu". (Vergleiche eventuell auch die Version des Textes bei [http://www.gutenberg.org/files/25273/25273-0.txt Gutenberg]; diese Version erfüllt allerdings keine philologischen Standards; Klassiker-Leseausgabe. Beispiel 稻工 (vgl. 8B): "Unterüberschriften" fehlen.) 8 8 9 9 10 = 1. Der Text = … … 37 38 * und ja, die genaue Größe der space in Überschriften interessiert uns nicht, das ist keine über mehrere Bücher konsistente Information 38 39 * Siehe auch 226A. 39 * 25B / 52 ff: Aufzählung; spaces im Text plus 一 bedeuten: hier fängt ein neuer Punkt an. Diese spaces in den Text einfügen, weil sie im Text stehen, auch wenn sie durch die <s> praktisch überflüssig geworden sind? Denn sonst ein Problem, wenn man die Zeichen prüfen will, siehe unten.40 * 25B / 52 ff: Aufzählung; spaces im Text plus 一 bedeuten: hier fängt ein neuer Punkt an. Diese spaces in den Text einfügen, weil sie im Text stehen, auch wenn sie durch die <s> praktisch überflüssig geworden sind? Denn sonst ein Problem, wenn man die Zeichen mit Hilfe des Pseudo-Rohtextes prüfen will, siehe unten. 40 41 * Ja, spaces tippen. (und typo auf 26B korrigieren!) (ok) 41 42 * 108B / 218: die identische caption steht zweimal da (im Bild und deshalb auch im Text). Ich habe sie einmal gelöscht, um den Text schemakonform zu machen. Ist das okay? … … 48 49 * Ja, Aufzählung ohne Aufzählungspunkte. 二 und 三 sind keine Listenpunkte, sondern gehören zum Text. Die letzten beiden Zeilen auf 194B sind ein Absatz für sich. (ok) 49 50 * Genauso 195A: Ein Absatz mit zwei Zeilen, dann noch einer mit drei Zeilen. N405817: Space vor 二 einfügen. Zwei <s> daraus machen? (ok) 50 * 207B / 416 f: was ist das? 附 = Anhang? Jedenfalls: N405BEF zu heading gemacht, Doppelpunkt aber dringelassen .51 * 207B / 416 f: was ist das? 附 = Anhang? Jedenfalls: N405BEF zu heading gemacht, Doppelpunkt aber dringelassen (rausnehmen?). 51 52 * Ja, Anhang. Aufzählung. Eigentlich wie 194B, aber anders gesetzt: Überschrift normal, eigentlicher Text klein (194B: Überschrift und Text normal). In beiden Fällen wohl Überschrift nicht markieren. (ok) 52 53 * 208A: N405C2A und davor: zwei "Absätze" in einer Zeile. Space oder Absatz? (optisch space, semantisch Absatz) (vorläufig zu Absatz gemacht: Semantik wichtiger als Optik) … … 55 56 * Ähnlich wie 8B, aber Unterschied: Dort keine neuen Absätze, sondern Teile in einem Absatz. 56 57 57 (Vergleiche eventuell auch die Version des Textes bei [http://www.gutenberg.org/files/25273/25273-0.txt Gutenberg]; diese Version erfüllt allerdings keine philologischen Standards; Klassiker-Leseausgabe. Beispiel 稻工 (vgl. 8B): "Unterüberschriften" fehlen.)58 59 58 60 59 == noch zu tun == … … 62 61 === von Dagmar === 63 62 64 * div-Struktur prüfen (u.a. preface). Ist die unterste Ebene sinnvoll oder störend (ich finde sie sinnvoll)? 65 * neue Textstücke in <s> aufteilen, und interpunktion, und Beispiel N405817 ff und N405BF2 ff: umstrukturieren, damit es mit <sm> übereinstimmt? (Liste machen? Insbesondere die <s> ohne xml:id) 66 * <sm> in <p> als note herausziehen, oder drinlassen? Siehe auch Workflow: small text, und Textanzeige: small text. 67 * GIS: was wird markiert? 63 * div-Struktur prüfen (u.a. preface). Ist die unterste Ebene sinnvoll oder störend (vermutlich sinnvoll, siehe auch Übersetzung)? 64 * Interpunktion bei neuen Textstücke, ich teile sie dann in <s> auf (Liste für Dagmar machen? Insbesondere die <s> ohne xml:id) 65 * prüfe alle <s>, die kein Satzzeichen am Ende haben, zum Beispiel N404EFF, N405E70. Vorsicht bei Stellen, wo Text ergänzt wurde, z.B. nach N402826. 66 * Beispiel N4001B7, N405817 ff und N405BF2 ff: umstrukturieren, damit es mit <sm> übereinstimmt? 67 * <sm> in <p> als note herausziehen, oder drinlassen? Siehe auch die "small text"-Abschnitte in "1. Workflow" und "2. Textanzeige". 68 * GIS: was wird markiert? Und Bildtexte durchgehen, siehe zum Beispiel 43A unten. 68 69 69 70 === von mir === … … 71 72 * ASCII-Punkte und -Kommas im Text: Kann ich die einfach durch ihre Fullwidth-Äquivalente ersetzen? z.B. N400028 (Punkt), N40003D (Komma). 72 73 * ja, einfach ersetzen (ok) 73 * Zeilen korrekt einrücken, sobald klar ist, ob die div's so in Ordnung sind. 74 * Zeilen korrekt einrücken, sobald klar ist, ob die div's so in Ordnung sind. (auch <div float>!) 74 75 * ZWS (zero-width space U+200B) korrigieren (Skript?) 75 76 * ersetze `\\` in <description> durch <lb/>, in <sm> noch unklar. (Siehe auch unten: die Frage der Darstellung von <sm>.) … … 85 86 * Problem der Zeichenvarianten, aber nur 1x < V>: noch ungeklärt. 86 87 * Text für authority file 87 * Änderungen in echo-chinese-text (siehe unten):88 * <sm>, <hb/>89 * "variant/auto", "variant?/auto"90 * headlevel (oder nur level)? wenn, dann optional91 * figure: <part>? <explanation> oder <subcaption>?92 * bei note-Type footnote: position "sm"93 * <anchor> direkt in <p> erlauben?94 88 95 89 … … 97 91 98 92 * fehlende Zeichenvarianten einfügen, insbesondere aus Extension B. Siehe Madlens Begleittext: [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.doc DOC], [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.pdf PDF]. Siehe auch @ im Text. 99 * markiere alle <s> in kleiner Schrift, zum Beispiel N40565E, analog zu 93 * verbotene Zeichen am Anfang von <s>, zum Beispiel ” (Artefakt des damaligen <s>-Skripts; für ” habe ich es schon gemacht); überhaupt wäre es am besten, alles zwischen “ und ” in ein einziges <s> zu tun 94 * Text durchgehen auf Absatzenden (i.e. unvollständige Zeilen), zum Beispiel 194B, 195A. 95 * spaces und large spaces in Überschriften, immer als genau ein ideographic space (ok für ch. 1-3) 96 * Large spaces in Absätzen: markieren mit # 97 98 Markiere alle <s> in kleiner Schrift, zum Beispiel N40565E, analog zu 100 99 {{{ 101 100 <p xml:id="N40019A"> … … 110 109 </p> 111 110 }}} 112 * Das <hb/> ist hier nur zur Veranschaulichung. Die <hb/> muss man nicht per Hand hineinmachen, das geht im wesentlichen automatisch. (Die Logik ist wohl wie bei <lb/>, also zum Beispiel `<s xml:id="N400515">凡火未經人間傳燈者,<hb/></s>`.) 113 * Lösche dann die `style="sm"` in <s>, die schon im Text sind. 114 * Mache eine Liste aller Stellen, wo die <s> und <sm> sich beißen würden. Beispiel N405817 ff und N405BF2 ff. 115 * prüfe alle <s>, die kein Satzzeichen am Ende haben, zum Beispiel N404EFF, N405E70. Vorsicht bei Stellen, wo Text ergänzt wurde, z.B. nach N402826. 116 * verbotene Zeichen am Anfang von <s>, zum Beispiel ” (Artefakt des damaligen <s>-Skripts; für ” habe ich es schon gemacht); überhaupt wäre es am besten, alles zwischen “ und ” in ein einziges <s> zu tun 117 * Text durchgehen auf Absatzenden (i.e. unvollständige Zeilen), zum Beispiel 194B, 195A. 118 * spaces und large spaces in Überschriften, immer als genau ein ideographic space (ok für ch. 1-3) 119 * Large spaces in Absätzen: markieren mit # 111 * Das <hb/> ist hier nur zur Veranschaulichung. Die <hb/> muss man nicht per Hand hineinmachen, das geht im wesentlichen automatisch. (Die Logik ist wohl wie bei <lb/>, also zum Beispiel `<s xml:id="N400515">凡火未經人間傳燈者,<hb/></s>`.) Eigentlich würde mir sogar reichen, wenn die Zeilen mt einem tab eingerückt werden: 112 {{{ 113 <s xml:id="N4001AB">米曰<pb file="X06.01.007A" n="15"/>糯。</s> 114 <s xml:id="N4001B1">南方無粘黍,</s> 115 <s xml:id="N4001B4">酒皆糯米所為。</s> 116 <s xml:id="N4001B7">質本粳而晚收帶粘俗名婺源光之類不可為酒,</s> 117 }}} 118 * Lösche dann die `style="sm"` in <s>, die schon im Text sind. 119 * Mache eine Liste aller Stellen, wo die <s> und <sm> sich beißen würden. Beispiel N405817 ff und N405BF2 ff. 120 120 121 121 Problem von inkorrekten Langzeichen: Haben die Taiwanesen nach dem Abtippen einen Konverter verwendet? Beispiel Seite 300: Das letzte Zeichen vor der Überschrift (in N404302) ist falsch: [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=300 Bild], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=300 Text]. Das zugrundeliegende Problem ist offenbar, dass das korrekte Zeichen 云 als Kurzzeichen interpretiert und durch das Langzeichen 雲 ersetzt wurde. Ebenso falsch in N4007E2, N4047A1, aber möglicherweise ist 雲 an anderen Stellen korrekt. Deshalb kann man es nicht blind ersetzen. … … 158 158 159 159 160 = 2. DerWorkflow =160 = 2. Workflow = 161 161 162 162 == mögliche Konsequenzen == … … 187 187 }}} 188 188 (und genauso für <caption>, aber nicht für <variables>). Die Lösung mit <explanation> kommt mir aber geeigneter vor. Insbesondere weil <description> normalerweise im Bild ist und nicht neben oder unter dem Bild. 189 190 mögliche Änderungen in echo-chinese-text: 191 * <sm>, <hb/> 192 * "variant", "variant/auto", "variant?/auto" 193 * headlevel (oder nur level)? wenn, dann optional 194 * figure: <part>? <explanation> oder <subcaption>? 195 * bei note-Type footnote: position "sm" 196 * <anchor> direkt in <p> erlauben? 197 * Attribut für "73B" in <pb>? Oder doch "o" verwenden? 189 198 190 199