Changes between Version 1 and Version 2 of workflow-chinese


Ignore:
Timestamp:
Aug 25, 2010, 3:38:25 PM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • workflow-chinese

    v1 v2  
    33[[PageOutline(1-4,,pullout)]]
    44
    5 
    6 == mögliche Konsequenzen ==
    7 
    8 === für die DESpecs ===
    9 
    10   * Die Regelung, dass Zeichenvarianten nur beim ersten Mal markiert werden sollen, muss noch überarbeitet werden. Problem ist, dass ein Text sowohl das Standardzeichen als auch mehr als eine Variante enthalten kann. An welcher Ebene setzt man an, beim Abtippen oder bei der Nachbearbeitung?
    11     * wenn im post-processing: Man hat die Information, welche Zeichen es betrifft. Man hat auch (oder erstellt mit wenig Aufwand) eine Liste der möglichen Zeichen. Gehe alle Vorkommnisse des Schriftzeichens im Text durch. Standardzeichen: ok: Variante: prüfe, ob nicht doch in Unicode. Sonst IDS-Sequenz erstellen. Im Text nur markieren mit v1, v2, etc. hinter dem Zeichen. Wird dann automatiisiert durch ein <reg> ersetzt, das im besten Fall die IDS-Sequenz verwendet. Wie groß wäre der Aufwand in der Praxis?
    12   * `\\` in <desc> erlauben, oder nur einfach damit umgehen können, falls es gemacht wird?
    13   * nochmal darüber nachdenken: large spaces in Überschriften doch genau tippen lassen?
    14 
    15 
    16 === für das Schema ===
    17 
    18   * `< V>` vorläufig als <reg norm="鬵" type="unresolved">鬵</reg>. Explizite Typen einführen, z.B. "variant/auto" (für  mit `< V>` markierte Zeichen) und "variant?/auto" (für Zeichen, die bereits an anderer Stelle als `< V>` markiert wurden). Siehe Variantenmarkierung in den DESpecs.
    19   * Attribut von <head>: Verschachtelungstiefe. Siehe unten.
    20   * aufgeteiltes Bild auf Seite 76B / 154: Lösung für das Problem von mehr als einer caption. Okay so, oder muss man in <figure> etwas wie Unter-Figures oder <teil-figure> erlauben? Problem ist auch: Nach den bisherigen Erfahrungen wird das bei der Transkription nicht funktionieren, wir sprechen also über etwas, was man im post-processing machen müsste.
    21   * ein bisschen (aber nicht völlig) analog zu <pb>: <anchor> direkt in <p> erlauben, damit man nicht </s> hinter die Figure verschieben muss? Kein großer Leidensdruck, und das Ergebnis wäre auch nicht konsequent.
    22 
    23 Bild mit Beschreibungstext auf Seite 83B / 168: Weitere Kategorie neben caption, description, variables? Zum Beispiel <explanation>. (Oder man erlaubt einfach <p> in <figure>? Aber das wäre ein bisschen inkonsequent.)
    24 
    25 Eine Alternative wäre, in <description> das echo.flexible.model zu erlauben: Also
    26 {{{
    27 echo.description.attlist = echo.inline.attrib
    28 echo.description.content = echo.inline.model
    29 }}}
    30 wird zu
    31 {{{
    32 echo.description.attlist = empty
    33 echo.description.content = echo.flexible.model
    34 }}}
    35 (und genauso für <caption>, aber nicht für <variables>). Die Lösung mit <explanation> kommt mir aber geeigneter vor. Insbesondere weil <description> normalerweise im Bild ist und nicht neben oder unter dem Bild.
    36 
    37 Beispiel Bion 1765 (WO 6):
    38 {{{
    39 <cap><rom>TABULA I</rom>.</cap>
    40 <cap it>pag. 6.</cap>
    41 }}}
    42 Das hat Klaus jeweils zu einer caption mit einem <lb> gemacht. Analogie zu Überschriften wäre aber, es als zwei captions zu lassen. Brauchen wir also auch caption-Gruppen analog zu head-Gruppen? (Diese Frage ist unabhängig von de figurepart-Frage, denn es bezieht sich nur auf captions, die unmittelbar hintereinander kommen.)
    43 
    44 
    45 xhtml-Listen:
    46   * ich musste ein <pb> (Seite 208A / 417) tiefer verschieben, d.h. vorher zwischen </dd> und <dt>, nachher auf einer Höhe wie <s> im <dd> davor. Ist das so gewünscht?
    47   * <dl> kann laut Schema überall da sein, wo auch ein float sein kann, also nicht direkt in <dl>, sondern nur in <s>. Das ist aber bei verschachtelten Listen Unsinn. Schema ändern? (Das Flow-Model und Inline-Model von xhtml wurde ja im Schema umdefiniert und würde dann nochmal umdefiniert werden.) Erstmal jedenfalls: auf die Einrückung verzichtet. (Ändern, sobald es geht!)
    48 
    49 mögliche Änderungen in echo-chinese-text:
    50   * <sm>, <hb/>
    51   * "variant", "variant/auto", "variant?/auto"
    52   * headlevel (oder nur level)? wenn, dann optional
    53   * figure: <part>? <explanation> oder <subcaption>? Wie heißen figure-Teile bei TEI?
    54   * bei note-Type footnote: position "sm"
    55   * <anchor> direkt in <p> erlauben?
    56   * Attribut für "73B" in <pb>? Oder doch "o" verwenden?
    57   * Inhalt von xhtml?
    58 
    59 === für den Workflow ===
    60 
    61   * Die Logik, die <pb> so weit wie möglich in der Hierarchie zu verstecken, habe ich bei diesem Text nicht angewendet. Sollte man das nachholen? Dann müsste zum Beispiel eine Seiten-Figure auch den nachfolgenden <pb> enthalten. Keine technische, sondern eine konzeptionelle Frage. Zumindest bei <div> ist aber klar, dass <pb> hineingezogen wird. Und in <s> könnte man <pb> auch problemlos hineinziehen.
    62   * In chinesischen Texten können problemlos Überschriften in der letzten Zeile auftreten, das ist also kein Hinweis auf einen Fehler, im Gegensatz zu europäischen Texten. Beispiel 104B, wo man den folgenden Text auf 105A im aufgeschlagenen Buch nebeneinander sieht, und auch 148A / 148B, wo das nicht der Fall ist. (Die Überschrift auf Seite 85B ist wirklich ein footer.) Konsequenterweise müsste man <pb> auch in <head> verschieben. Dieser Fall kommt in europäischen Texten bisher nur bei mehreren Textflows vor, also beispielsweise beim Eipo-Text.
    63   * Skript für "pb verstecken"? Das wäre auch wichtig, um andere workflows zu integrieren.
     5= 1. textspezifisch =
     6
    647  * Ich könnte genauso gut mit der Version arbeiten, wo die Figures bereits aus <p> herausgezogen sind. Aber erst, wenn entschieden ist, ob sm-Text raus kommt oder nicht. (Ansonsten: Einen Arbeitsschritt, in dem alle Skripte sind, mit dem aus der Bearbeitungsversion die Anzeigeversion wird? Problem: Dann wäre der Text vorher noch nicht schemakonform, also wahrscheinlich keine gute Idee.)
    65   * Was machen wir aus large spaces?
    66     * Laut DESpecs als ein einzige space getippt. (Large) spaces zu Doppelpunkten wenigstens in Überschriften, siehe 8B; wird nicht immer sinnvoll sein, insbesondere bei mehr als einem large space.
    67     * # in <p>? Gibt es eine allgemeine Lösung? (Manchmal auch "übersehenes" Absatzende?)
    68   * Aufzählungen: Gibt es überhaupt Bedarf, Aufzählungen ausdrücklich zu markieren? Wenn ja: Wie beschreibt man die verschiedenen Aufzählungstypen in chinesischen Texten? Zum Beispiel 194B: Wohl nicht mit xhtml? Einfach als <s>, und akzeptieren, dass es "zu kurze Zeilen" gibt? Wenn man 25B ff zu einer Aufzählung machen will innerhalb des Absatzes, wie sollte das dann aussehen? Woran erkennt man den Unterschied "Aufzählung innerhalb eines Absatzes" vs "neuer Absatz"?
    69 
     8
     9= 2. allgemein =
    7010
    7111== GIS ==
     
    230170Vielleicht ist es am besten, eine IVS-Sequenz zu verwenden, wenn es das Zeichen in der Liste schon gibt, und sonst eine IDS-Sequenz.
    231171
     172
     173== weitere mögliche Konsequenzen ==
     174
     175=== für die DESpecs ===
     176
     177  * Die Regelung, dass Zeichenvarianten nur beim ersten Mal markiert werden sollen, muss noch überarbeitet werden. Problem ist, dass ein Text sowohl das Standardzeichen als auch mehr als eine Variante enthalten kann. An welcher Ebene setzt man an, beim Abtippen oder bei der Nachbearbeitung?
     178    * wenn im post-processing: Man hat die Information, welche Zeichen es betrifft. Man hat auch (oder erstellt mit wenig Aufwand) eine Liste der möglichen Zeichen. Gehe alle Vorkommnisse des Schriftzeichens im Text durch. Standardzeichen: ok: Variante: prüfe, ob nicht doch in Unicode. Sonst IDS-Sequenz erstellen. Im Text nur markieren mit v1, v2, etc. hinter dem Zeichen. Wird dann automatiisiert durch ein <reg> ersetzt, das im besten Fall die IDS-Sequenz verwendet. Wie groß wäre der Aufwand in der Praxis?
     179  * `\\` in <desc> erlauben, oder nur einfach damit umgehen können, falls es gemacht wird?
     180  * nochmal darüber nachdenken: large spaces in Überschriften doch genau tippen lassen?
     181
     182=== für das Schema ===
     183
     184  * `< V>` vorläufig als <reg norm="鬵" type="unresolved">鬵</reg>. Explizite Typen einführen, z.B. "variant/auto" (für  mit `< V>` markierte Zeichen) und "variant?/auto" (für Zeichen, die bereits an anderer Stelle als `< V>` markiert wurden). Siehe Variantenmarkierung in den DESpecs.
     185  * Attribut von <head>: Verschachtelungstiefe. Siehe unten.
     186  * aufgeteiltes Bild auf Seite 76B / 154: Lösung für das Problem von mehr als einer caption. Okay so, oder muss man in <figure> etwas wie Unter-Figures oder <teil-figure> erlauben? Problem ist auch: Nach den bisherigen Erfahrungen wird das bei der Transkription nicht funktionieren, wir sprechen also über etwas, was man im post-processing machen müsste.
     187  * ein bisschen (aber nicht völlig) analog zu <pb>: <anchor> direkt in <p> erlauben, damit man nicht </s> hinter die Figure verschieben muss? Kein großer Leidensdruck, und das Ergebnis wäre auch nicht konsequent.
     188
     189Bild mit Beschreibungstext auf Seite 83B / 168: Weitere Kategorie neben caption, description, variables? Zum Beispiel <explanation>. (Oder man erlaubt einfach <p> in <figure>? Aber das wäre ein bisschen inkonsequent.)
     190
     191Eine Alternative wäre, in <description> das echo.flexible.model zu erlauben: Also
     192{{{
     193echo.description.attlist = echo.inline.attrib
     194echo.description.content = echo.inline.model
     195}}}
     196wird zu
     197{{{
     198echo.description.attlist = empty
     199echo.description.content = echo.flexible.model
     200}}}
     201(und genauso für <caption>, aber nicht für <variables>). Die Lösung mit <explanation> kommt mir aber geeigneter vor. Insbesondere weil <description> normalerweise im Bild ist und nicht neben oder unter dem Bild.
     202
     203Beispiel Bion 1765 (WO 6):
     204{{{
     205<cap><rom>TABULA I</rom>.</cap>
     206<cap it>pag. 6.</cap>
     207}}}
     208Das hat Klaus jeweils zu einer caption mit einem <lb> gemacht. Analogie zu Überschriften wäre aber, es als zwei captions zu lassen. Brauchen wir also auch caption-Gruppen analog zu head-Gruppen? (Diese Frage ist unabhängig von de figurepart-Frage, denn es bezieht sich nur auf captions, die unmittelbar hintereinander kommen.)
     209
     210
     211xhtml-Listen:
     212  * ich musste ein <pb> (Seite 208A / 417) tiefer verschieben, d.h. vorher zwischen </dd> und <dt>, nachher auf einer Höhe wie <s> im <dd> davor. Ist das so gewünscht?
     213  * <dl> kann laut Schema überall da sein, wo auch ein float sein kann, also nicht direkt in <dl>, sondern nur in <s>. Das ist aber bei verschachtelten Listen Unsinn. Schema ändern? Das Flow-Model und Inline-Model von xhtml wurde ja im Schema umdefiniert und würde dann nochmal umdefiniert werden. Konkret könnte man in <dl> auch weiteres xhtml erlauben. (Oder in <dd> sowohl das echo-inline-model als auch weiteres xhtml ?) Erstmal jedenfalls: auf die Einrückung verzichtet. (Ändern, sobald es geht!)
     214
     215mögliche Änderungen in echo-chinese-text:
     216  * <sm>, <hb/>
     217  * "variant", "variant/auto", "variant?/auto"
     218  * headlevel (oder nur level)? wenn, dann optional
     219  * figure: <part>? <explanation> oder <subcaption>? Wie heißen figure-Teile bei TEI?
     220  * bei note-Type footnote: position "sm"
     221  * <anchor> direkt in <p> erlauben?
     222  * Attribut für "73B" in <pb>? Oder doch "o" verwenden?
     223  * Inhalt von xhtml?
     224
     225=== für den Workflow ===
     226
     227  * Die Logik, die <pb> so weit wie möglich in der Hierarchie zu verstecken, habe ich bei diesem Text nicht angewendet. Sollte man das nachholen? Dann müsste zum Beispiel eine Seiten-Figure auch den nachfolgenden <pb> enthalten. Keine technische, sondern eine konzeptionelle Frage. Zumindest bei <div> ist aber klar, dass <pb> hineingezogen wird. Und in <s> könnte man <pb> auch problemlos hineinziehen.
     228  * In chinesischen Texten können problemlos Überschriften in der letzten Zeile auftreten, das ist also kein Hinweis auf einen Fehler, im Gegensatz zu europäischen Texten. Beispiel 104B, wo man den folgenden Text auf 105A im aufgeschlagenen Buch nebeneinander sieht, und auch 148A / 148B, wo das nicht der Fall ist. (Die Überschrift auf Seite 85B ist wirklich ein footer.) Konsequenterweise müsste man <pb> auch in <head> verschieben. Dieser Fall kommt in europäischen Texten bisher nur bei mehreren Textflows vor, also beispielsweise beim Eipo-Text.
     229  * Skript für "pb verstecken"? Das wäre auch wichtig, um andere workflows zu integrieren.
     230  * Was machen wir aus large spaces?
     231    * In Song Yingxing will Dagmar sie genau so getippt haben, wie sie im Text stehen.
     232    * Laut DESpecs als ein einzige space getippt. (Large) spaces zu Doppelpunkten wenigstens in Überschriften, siehe 8B; wird nicht immer sinnvoll sein, insbesondere bei mehr als einem large space.
     233    * # in <p>? Gibt es eine allgemeine Lösung? (Manchmal auch "übersehenes" Absatzende?)
     234  * Aufzählungen: Gibt es überhaupt Bedarf, Aufzählungen ausdrücklich zu markieren? Wenn ja: Wie beschreibt man die verschiedenen Aufzählungstypen in chinesischen Texten? Zum Beispiel 194B: Wohl nicht mit xhtml? Einfach als <s>, und akzeptieren, dass es "zu kurze Zeilen" gibt? Wenn man 25B ff zu einer Aufzählung machen will innerhalb des Absatzes, wie sollte das dann aussehen? Woran erkennt man den Unterschied "Aufzählung innerhalb eines Absatzes" vs "neuer Absatz"?
     235