Changes between Version 48 and Version 49 of SongYingxing


Ignore:
Timestamp:
Aug 12, 2010, 11:11:43 AM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • SongYingxing

    v48 v49  
    55Song Yingxing (宋應星) 1637, Tian gong kai wu (天工開物): [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml link] zum Text im Anzeigesystem; XML-Text in der Version [source:trunk/texts/SongYingxing_1637/xml/SongYingxing_1637.xml zum Bearbeiten] und [source:trunk/texts/eXist/echo/zh/SongYingxing_1637.xml im Anzeigesystem].
    66
    7 "Übersetzung" bezieht sich auf "Sung Ying-Hsing: Chinese technology in the seventeenth century, T'ien-kung k'ai-wu".
     7"Übersetzung" bezieht sich auf "Sung Ying-Hsing: Chinese technology in the seventeenth century, T'ien-kung k'ai-wu". (Vergleiche eventuell auch die Version des Textes bei [http://www.gutenberg.org/files/25273/25273-0.txt Gutenberg]; diese Version erfüllt allerdings keine philologischen Standards; Klassiker-Leseausgabe. Beispiel 稻工 (vgl. 8B): "Unterüberschriften" fehlen.)
     8
    89
    910= 1. Der Text =
     
    3738    * und ja, die genaue Größe der space in Überschriften interessiert uns nicht, das ist keine über mehrere Bücher konsistente Information
    3839    * Siehe auch 226A.
    39   * 25B / 52 ff: Aufzählung; spaces im Text plus 一 bedeuten: hier fängt ein neuer Punkt an. Diese spaces in den Text einfügen, weil sie im Text stehen, auch wenn sie durch die <s> praktisch überflüssig geworden sind? Denn sonst ein Problem, wenn man die Zeichen prüfen will, siehe unten.
     40  * 25B / 52 ff: Aufzählung; spaces im Text plus 一 bedeuten: hier fängt ein neuer Punkt an. Diese spaces in den Text einfügen, weil sie im Text stehen, auch wenn sie durch die <s> praktisch überflüssig geworden sind? Denn sonst ein Problem, wenn man die Zeichen mit Hilfe des Pseudo-Rohtextes prüfen will, siehe unten.
    4041    * Ja, spaces tippen. (und typo auf 26B korrigieren!) (ok)
    4142  * 108B / 218: die identische caption steht zweimal da (im Bild und deshalb auch im Text). Ich habe sie einmal gelöscht, um den Text schemakonform zu machen. Ist das okay?
     
    4849    * Ja, Aufzählung ohne Aufzählungspunkte. 二 und 三 sind keine Listenpunkte, sondern gehören zum Text. Die letzten beiden Zeilen auf 194B sind ein Absatz für sich. (ok)
    4950    * Genauso 195A: Ein Absatz mit zwei Zeilen, dann noch einer mit drei Zeilen. N405817: Space vor 二​ einfügen. Zwei <s> daraus machen? (ok)
    50   * 207B / 416 f: was ist das? 附 = Anhang? Jedenfalls: N405BEF zu heading gemacht, Doppelpunkt aber dringelassen.
     51  * 207B / 416 f: was ist das? 附 = Anhang? Jedenfalls: N405BEF zu heading gemacht, Doppelpunkt aber dringelassen (rausnehmen?).
    5152    * Ja, Anhang. Aufzählung. Eigentlich wie 194B, aber anders gesetzt: Überschrift normal, eigentlicher Text klein (194B: Überschrift und Text normal). In beiden Fällen wohl Überschrift nicht markieren. (ok)
    5253  * 208A: N405C2A und davor: zwei "Absätze" in einer Zeile. Space oder Absatz? (optisch space, semantisch Absatz) (vorläufig zu Absatz gemacht: Semantik wichtiger als Optik)
     
    5556    * Ähnlich wie 8B, aber Unterschied: Dort keine neuen Absätze, sondern Teile in einem Absatz.
    5657
    57 (Vergleiche eventuell auch die Version des Textes bei [http://www.gutenberg.org/files/25273/25273-0.txt Gutenberg]; diese Version erfüllt allerdings keine philologischen Standards; Klassiker-Leseausgabe. Beispiel 稻工 (vgl. 8B): "Unterüberschriften" fehlen.)
    58 
    5958
    6059== noch zu tun ==
     
    6261=== von Dagmar ===
    6362
    64   * div-Struktur prüfen (u.a. preface). Ist die unterste Ebene sinnvoll oder störend (ich finde sie sinnvoll)?
    65   * neue Textstücke in <s> aufteilen, und interpunktion, und Beispiel N405817 ff und N405BF2 ff: umstrukturieren, damit es mit <sm> übereinstimmt? (Liste machen? Insbesondere die <s> ohne xml:id)
    66   * <sm> in <p> als note herausziehen, oder drinlassen? Siehe auch Workflow: small text, und Textanzeige: small text.
    67   * GIS: was wird markiert?
     63  * div-Struktur prüfen (u.a. preface). Ist die unterste Ebene sinnvoll oder störend (vermutlich sinnvoll, siehe auch Übersetzung)?
     64  * Interpunktion bei neuen Textstücke, ich teile sie dann in <s> auf (Liste für Dagmar machen? Insbesondere die <s> ohne xml:id)
     65  * prüfe alle <s>, die kein Satzzeichen am Ende haben, zum Beispiel N404EFF, N405E70. Vorsicht bei Stellen, wo Text ergänzt wurde, z.B. nach N402826.
     66  * Beispiel N4001B7, N405817 ff und N405BF2 ff: umstrukturieren, damit es mit <sm> übereinstimmt?
     67  * <sm> in <p> als note herausziehen, oder drinlassen? Siehe auch die "small text"-Abschnitte in "1. Workflow" und "2. Textanzeige".
     68  * GIS: was wird markiert? Und Bildtexte durchgehen, siehe zum Beispiel 43A unten.
    6869
    6970=== von mir ===
     
    7172  * ASCII-Punkte und -Kommas im Text: Kann ich die einfach durch ihre Fullwidth-Äquivalente ersetzen? z.B. N400028 (Punkt), N40003D (Komma).
    7273    * ja, einfach ersetzen (ok)
    73   * Zeilen korrekt einrücken, sobald klar ist, ob die div's so in Ordnung sind.
     74  * Zeilen korrekt einrücken, sobald klar ist, ob die div's so in Ordnung sind. (auch <div float>!)
    7475  * ZWS (zero-width space U+200B) korrigieren (Skript?)
    7576  * ersetze `\\` in <description> durch <lb/>, in <sm> noch unklar. (Siehe auch unten: die Frage der Darstellung von <sm>.)
     
    8586  * Problem der Zeichenvarianten, aber nur 1x < V>: noch ungeklärt.
    8687  * Text für authority file
    87   * Änderungen in echo-chinese-text (siehe unten):
    88     * <sm>, <hb/>
    89     * "variant/auto", "variant?/auto"
    90     * headlevel (oder nur level)? wenn, dann optional
    91     * figure: <part>? <explanation> oder <subcaption>?
    92     * bei note-Type footnote: position "sm"
    93     * <anchor> direkt in <p> erlauben?
    9488   
    9589
     
    9791
    9892  * fehlende Zeichenvarianten einfügen, insbesondere aus Extension B. Siehe Madlens Begleittext: [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.doc DOC], [source:trunk/texts/SongYingxing_1637/variant-problems/SongEchoKorrupteZeichen.pdf PDF]. Siehe auch @ im Text.
    99   * markiere alle <s> in kleiner Schrift, zum Beispiel N40565E, analog zu
     93  * verbotene Zeichen am Anfang von <s>, zum Beispiel ” (Artefakt des damaligen <s>-Skripts; für ” habe ich es schon gemacht); überhaupt wäre es am besten, alles zwischen “ und ” in ein einziges <s> zu tun
     94  * Text durchgehen auf Absatzenden (i.e. unvollständige Zeilen), zum Beispiel 194B, 195A.
     95  * spaces und large spaces in Überschriften, immer als genau ein ideographic space (ok für ch. 1-3)
     96  * Large spaces in Absätzen: markieren mit #
     97
     98Markiere alle <s> in kleiner Schrift, zum Beispiel N40565E, analog zu
    10099{{{
    101100<p xml:id="N40019A">
     
    110109</p>
    111110}}}
    112     * Das <hb/> ist hier nur zur Veranschaulichung. Die <hb/> muss man nicht per Hand hineinmachen, das geht im wesentlichen automatisch. (Die Logik ist wohl wie bei <lb/>, also zum Beispiel `<s xml:id="N400515">凡​火​未​經​人​間​傳​燈​者,<hb/></s>`.)
    113     * Lösche dann die `style="sm"` in <s>, die schon im Text sind.
    114     * Mache eine Liste aller Stellen, wo die <s> und <sm> sich beißen würden. Beispiel N405817 ff und N405BF2 ff.
    115   * prüfe alle <s>, die kein Satzzeichen am Ende haben, zum Beispiel N404EFF, N405E70. Vorsicht bei Stellen, wo Text ergänzt wurde, z.B. nach N402826.
    116   * verbotene Zeichen am Anfang von <s>, zum Beispiel ” (Artefakt des damaligen <s>-Skripts; für ” habe ich es schon gemacht); überhaupt wäre es am besten, alles zwischen “ und ” in ein einziges <s> zu tun
    117   * Text durchgehen auf Absatzenden (i.e. unvollständige Zeilen), zum Beispiel 194B, 195A.
    118   * spaces und large spaces in Überschriften, immer als genau ein ideographic space (ok für ch. 1-3)
    119   * Large spaces in Absätzen: markieren mit #
     111  * Das <hb/> ist hier nur zur Veranschaulichung. Die <hb/> muss man nicht per Hand hineinmachen, das geht im wesentlichen automatisch. (Die Logik ist wohl wie bei <lb/>, also zum Beispiel `<s xml:id="N400515">凡​火​未​經​人​間​傳​燈​者,<hb/></s>`.) Eigentlich würde mir sogar reichen, wenn die Zeilen mt einem tab eingerückt werden:
     112{{{
     113        <s xml:id="N4001AB">米​曰​<pb file="X06.01.007A" n="15"/>糯。</s>
     114                <s xml:id="N4001B1">南​方​無​粘​黍,</s>
     115                <s xml:id="N4001B4">酒​皆​糯​米​所​為。</s>
     116        <s xml:id="N4001B7">質​本​粳​而​晚​收​帶​粘​俗​名​婺​源​光​之​類​不​可​為​酒,</s>
     117}}}
     118  * Lösche dann die `style="sm"` in <s>, die schon im Text sind.
     119  * Mache eine Liste aller Stellen, wo die <s> und <sm> sich beißen würden. Beispiel N405817 ff und N405BF2 ff.
    120120
    121121Problem von inkorrekten Langzeichen: Haben die Taiwanesen nach dem Abtippen einen Konverter verwendet? Beispiel Seite 300: Das letzte Zeichen vor der Überschrift (in N404302) ist falsch: [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=300 Bild], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=300 Text]. Das zugrundeliegende Problem ist offenbar, dass das korrekte Zeichen 云 als Kurzzeichen interpretiert und durch das Langzeichen 雲 ersetzt wurde. Ebenso falsch in N4007E2, N4047A1, aber möglicherweise ist 雲 an anderen Stellen korrekt. Deshalb kann man es nicht blind ersetzen.
     
    158158
    159159
    160 = 2. Der Workflow =
     160= 2. Workflow =
    161161
    162162== mögliche Konsequenzen ==
     
    187187}}}
    188188(und genauso für <caption>, aber nicht für <variables>). Die Lösung mit <explanation> kommt mir aber geeigneter vor. Insbesondere weil <description> normalerweise im Bild ist und nicht neben oder unter dem Bild.
     189
     190mögliche Änderungen in echo-chinese-text:
     191  * <sm>, <hb/>
     192  * "variant", "variant/auto", "variant?/auto"
     193  * headlevel (oder nur level)? wenn, dann optional
     194  * figure: <part>? <explanation> oder <subcaption>?
     195  * bei note-Type footnote: position "sm"
     196  * <anchor> direkt in <p> erlauben?
     197  * Attribut für "73B" in <pb>? Oder doch "o" verwenden?
    189198
    190199