Changes between Version 4 and Version 5 of xml-display


Ignore:
Timestamp:
Jun 2, 2010, 8:54:23 PM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • xml-display

    v4 v5  
    33[[PageOutline(2-4,,pullout)]]
    44
    5 
     5== 1. core modules ==
    66
    77=== echo-start ===
     
    1212
    1313=== echo-metadata ===
     14
    1415Die Metadaten-Suche sollte die hierarchische Struktur der dcterms-Metadaten berücksichtigen: Wenn "A refines B", dann findet eine Such nach einem Inhalt von B auch Einträge in A finden, aber nicht umgekehrt.
    1516
    16 ==== <dcterms:creator> ====
     17==== <dcterms:identifier> ====
     18
     19==== <dcterms:title>, <dcterms:alternative> ====
     20
     21
     22==== <dcterms:creator>, <dcterms:contributor> ====
    1723`@identifier:` Die Einträge sollten in links umgewandelt werden.
     24
     25==== <dcterms:publisher> ====
    1826
    1927==== <dcterms:language> ====
    2028Alle angegebenen Sprachen sind Haupt-Sprachen des Textes. Text in einer der Haupt-Sprachen sollte korrekt mit Donatus / Pollux analysiert und indiziert werden. Textabschnitte in anderen Sprachen müssen nicht unbedingt morphologisch analysiert werden.
    2129
     30==== <dcterms:date> ====
     31
     32==== <dcterms:description> ====
     33
     34==== <dcterms:rights> ====
     35==== <dcterms:license> ====
    2236==== <dcterms:accessRights> ====
    2337Texte mit `<dcterms:accessRights>restricted</dcterms:accessRights>` sollten wohl nicht in eXist aufgenommen werden.
     38==== <dcterms:rightsHolder> ====
     39==== <dcterms:provenance> ====
     40==== <dcterms:dateCopyrighted> ====
    2441
    2542==== <font>, <font-family> ====
    2643Umsetzen als Anweisung für den Browser? Beispiel "Fraktur". Noch nicht ausgereift.
    2744
    28 === echo-div ===
     45==== <echo:stylesheet> ====
     46==== <echo:echolink> ====
     47==== <echo:echodir> ====
     48
     49=== echo-text ===
    2950
    3051==== <text> ====
    3152`@xml:lang` siehe `<dcterms:language>`
    3253
    33 ==== <div> ====
    34 
    35 Regeln für das Anzeigen des Inhaltsverzeichnisses siehe [wiki:toc-display hier].
    3654
    3755=== echo-block ===
     
    4159
    4260(`<pb>` in `<head>` sollten nur innerhalb von Flows vorkommen; siehe echo-textflows)
     61
     62==== <p> ====
    4363
    4464==== <s> ====
     
    5171siehe echo-float
    5272
    53 ==== <set-off> ====
    54 sollte in eigenen Zeilen und eingerückt dargestellt werden
     73==== <quote> ====
     74
     75(wie in echo-block-scholarly)
    5576
    5677
     
    5879
    5980==== <reg> ====
    60 In der Standard-Anzeige wird der Inhalt des reg-Tags angezeigt. Der User kann aber wählen, ob er stattdessen jeweils den Inhalt des orig-Attributs angezeigt bekommen möchte. Zusätzlich sollte es eine dritte Version geben, nämlich wo die Wortformen noch orthographisch normalisiert sind. Diese Darstellung ist sprachspezifisch; im Lateinischen sind das  u/v, i/j, ſ/s, ß/ss, æ/ae, œ/oe. Beispiel:
    61 
    62 {{{
    63 XML:           totum <reg orig="relatiuum" type="context">relatiuũ</reg> ipſius 
     81In der Standard-Anzeige wird der Inhalt des norm-Attributs angezeigt. Der User kann aber wählen, ob er stattdessen jeweils den Inhalt des reg-tags angezeigt bekommen möchte. Zusätzlich gibt es eine dritte Version, nämlich wo die Wortformen noch orthographisch normalisiert sind. Diese Darstellung ist sprachspezifisch; im Lateinischen sind das  u/v, i/j, ſ/s, ß/ss, æ/ae, œ/oe. Beispiel:
     82{{{
     83XML:           totum <reg norm="relatiuum" type="context">relatiuũ</reg> ipſius 
    6484
    6585Original:      totum                                      relatiuũ       ipſius
     
    7090In der Original-Darstellung kann es Zeichen geben, die nur mit speziellen Fonts darstellbar sind. Zeichen, die in Unicode enthalten sind, werden normalerweise vom Browser korrekt angezeigt, wenn es irgendeinen Font auf dem Computer gibt, der das Zeichen enthält. Manchmal muss man Zeichen aus der Private Use Area nehmen, zum Beispiel U+E8BF für die Ligatur  von q und ꝫ (U+A76B). Bei dieser Darstellung sollte der User also darüber aufgeklärt werden, dass er eventuell spezielle Fonts braucht.
    7191
    72 ==== <ref> ====
    73 CSS: z.B. kursiv
    74 
    75 Innerhalb von `<ref>` werden Abkürzungen nicht aufgelöst. Innerhalb von `<ref>` werden daher normale Wörter morphologisch analysiert (d.h. an Donatus / Pollux weitergeleitet), aber Wörter mit Punkt nicht. Zum Beispiel wird "lib." in
    76 {{{
    77 ex <ref>.7. propoſitione lib. Archimedis de inſidentibus aquæ</ref>
    78 }}}
    79 nicht analysiert.
    80 
    81 Wenn es in `<ref>` ein `@standard` gibt, kann der ganze Inhalt unanalysiert bleiben, und stattdessen gibt es einen link, der zu der reference passt. Beispiel:
    82 {{{
    83 ... ex <ref standard="Eucl:11:1">prima <lb/>vndecimi Euclid.</ref> poſitæ erunt.
    84 }}}
    85 
    86 Frage ist, wohin der link führen soll.
    87 
    88 ==== <sic> ====
    89 kann hier ignoriert werden; wird im scholarly workflow in Arboreal gebraucht
    90 
    91 ==== <foreign> ====
    92 CSS: Der Übergang von Fraktur zu Antiqua oder oder von A. zu F. sollte durch einen passenden Font ausgedrückt werden.
    93 `@xml:lang` sollte ausgewertet werden.
    94 
    9592==== <emph> ====
    9693`@style` sollte als `@class` und ein CSS-Stylesheet an den Browser weitergegeben werden.
    9794`@class` sollte nur in Ausnahmefällen vorkommen, z.B. in xhtml. Falls es im Text vorkommt, kann es direkt weitergegeben werden.
    9895
    99 ==== <q> ====
    100 CSS: Sollte optisch erkennbar sein.
    101 
    102 Für kurze quotes innerhalb eines `<s>`. Beachte `@open` und `@close`.
    103 
    104 ==== <quote> ====
    105 ähnlich wie `<q>`; als blockquote wie `<set-off>`
    106 
    107 
    108 === echo-gap ===
    109 
    110 ==== <gap> ====
    111 Darstellung als [...] ?
    112 
    113 ==== <unsure> ====
    114 Ignorieren?
    115 
    116 
    117 === echo-de ===
    118 
    119 ==== <unknown> ====
    120 Ignorieren?
    121 Sollte aber möglichst nicht mehr im Text enthalten sein.
    122 
    123 ==== <wrong> ====
    124 Ignorieren?
    125 Sollte aber möglichst nicht mehr im Text enthalten sein.
     96
     97=== echo-attribute ===
     98
     99`@xml:lang` siehe `<dcterms:language>` und `<foreign>`. Druch `@xml:lang` ist im Prinzip für jeden Textabschnitt  klar, welche Sprache es ist, insbesondere welche Schreibrichtung es ist. Zeigt der Browser zum Beispiel Arabisch problemlos korrekt an, oder muss man dem Browser auf der Grundlage von `@xml:lang` explizit sagen, was er tun soll?
     100
     101`@style` und `@class` siehe `<emph>`
     102
     103`@xml:id` kann ignoriert werden, wird aber für die links im TOC gebraucht. Floats verwenden `@xlink:label` statt `@xml:id`.
     104
     105`@xml:space` sollte für die Ausgabe des XML-Textes beachtet werden.
     106
     107
     108=== echo-datatype ===
     109
     110
     111== 2. text structure ==
     112
     113=== echo-div ===
     114
     115==== <div> ====
     116
     117Regeln für das Anzeigen des Inhaltsverzeichnisses siehe [wiki:toc-display hier].
     118
     119
     120=== echo-milestone ===
     121
     122==== <lb> ====
     123Zeilenumbruch: `<lb/>` ist so weit wie möglich/sinnvoll im XML-Baum verschwunden, also zum Beispiel:
     124
     125{{{
     126<s>Bla Bla. <lb/><s>
     127}}}
     128
     129statt
     130
     131{{{
     132<s>Bla Bla. <s>
     133<lb/>
     134}}}
     135
     136Bei der Anzeige des XML-Textes für eine Seite sollte `<lb/>` innerhalb von `<s>` nicht in einer eigenen Zeile stehen. In anderen Worten: `<lb>` sollte nur dann in eigener Zeile stehen, wenn es auch im XML-Text in eigener Zeile steht.
     137
     138==== <cb> ====
     139Im Prinzip wie `<lb>`. Aus dem `<cb>` ist nicht mehr automatisch renkonstuierbar, wo die erste Spalte anfängt und die letzte Spalte aufhört. Daher kann man es wie `<lb>` behandeln. Allerdings kann eine Spalte einen "running head" haben, der dargestellt wird wie ein running head einer Seite.
     140
     141==== <pb> ====
     142CSS: Optisch klar vom "echten" Text abgrenzen: gesperrt?
     143
     144Werden running heads dargestellt? Oder kann der User sie ein- und ausblenden?
     145
     146Worttrennungen: Das System muss umgehen können mit Fällen wie
     147
     148{{{
     149eue-<lb/>
     150<anchor type="figure" xlink:href="..."/><lb/>
     151<anchor type="figure" xlink:href="..."/>
     152<pb ... />
     153niet
     154}}}
     155
     156
     157== 3. additional text blocks: floats ==
     158
     159=== echo-float ===
     160
     161==== <anchor> ====
     162Wenn es `@symbol` gibt, sollte das Symbol angezeigt werden, denn es steht ja im Text. Hochgestellt, wenn kein space davor ist, sonst nicht hochgestellt, aber kursiv. Beispiel:
     163
     164Anmerkung^2^ und anchor ''a'' eines anchored comment
     165
     166Wenn es auch `@xlink:href` gibt, sollte das Symbol ein link zum zugehörigen Float sein.
     167
     168Floats sind entweder als Teil des normalen Textflows, oder sie sind getrennt. Floats als Teil des normales Textflows sollten, wie Bilder auf einer Webseite, an der richtigen Stelle angezeigt werden, d.h dort, wo ihr `<anchor>` ist. Getrennte Floats sollten erst angezeigt werden, wenn der User sie anfordert.
     169
     170normaler Textflow:
     171  * `<figure>`
     172  * `<xhtml:*>` (Tabellen, Listen)
     173  * `<mml:*>` (MathML)
     174
     175getrennt:
     176  * `<note>` mit `@position=foot` (zumindest sollten Fußnoten, die über mehr als eine Seite gehen, auf Wunsch vollständig angezeigt werden)
     177  * `<handwritten>`
     178  * `<note>` mit `@position=end` (sollten bei ihrem `<div endnotes>` angezeigt werden, d.h. auf der Seite, auf der sie sind)
     179
     180unklar:
     181  * `<note>` mit `@position=left/right`: Peter hätte sie gerne im normalen Textflow
     182
     183
     184=== echo-note ===
     185
     186==== <note> ====
     187
     188=== echo-import-xhtml ===
     189
     190==== <xhtml:*> ====
     191
     192`<xhtml:*>` kann direkt an den Browser weitergereicht werden. Beachte allerdings, dass wir nicht das content model von xhtml verwenden; man kann also nicht einfach die ganze Tabelle ohne Änderungen übergeben, sondern nur die Elemente mit dem Namespace `xhtml`.
    126193
    127194
     
    145212[figure 156][[BR]]'''Geometrische Formen'''[[BR]]Kreis[[BR]]Dreieck[[BR]]Viereck[[BR]]''a, b, c''
    146213
    147 
    148214==== <image> ====
    149215Falls es `@xlink:href` gibt, sollte das Bild an dieser Stelle angezeigt werden.
     
    156222
    157223
    158 === echo-float ===
    159 
    160 ==== <anchor> ====
    161 Wenn es `@symbol` gibt, sollte das Symbol angezeigt werden, denn es steht ja im Text. Hochgestellt, wenn kein space davor ist, sonst nicht hochgestellt, aber kursiv. Beispiel:
    162 
    163 Anmerkung^2^ und anchor ''a'' eines anchored comment
    164 
    165 Wenn es auch `@xlink:href` gibt, sollte das Symbol ein link zum zugehörigen Float sein.
    166 
    167 Floats sind entweder als Teil des normalen Textflows, oder sie sind getrennt. Floats als Teil des normales Textflows sollten, wie Bilder auf einer Webseite, an der richtigen Stelle angezeigt werden, d.h dort, wo ihr `<anchor>` ist. Getrennte Floats sollten erst angezeigt werden, wenn der User sie anfordert.
    168 
    169 normaler Textflow:
    170   * `<figure>`
    171   * `<xhtml:*>` (Tabellen, Listen)
    172   * `<mml:*>` (MathML)
    173 
    174 getrennt:
    175   * `<note>` mit `@position=foot` (zumindest sollten Fußnoten, die über mehr als eine Seite gehen, auf Wunsch vollständig angezeigt werden)
    176   * `<handwritten>`
    177   * `<note>` mit `@position=end` (sollten bei ihrem `<div endnotes>` angezeigt werden, d.h. auf der Seite, auf der sie sind)
    178 
    179 unklar:
    180   * `<note>` mit `@position=left/right`: Peter hätte sie gerne im normalen Textflow
    181 
    182 
    183 === echo-milestone ===
    184 
    185 ==== <lb> ====
    186 Zeilenumbruch: `<lb/>` ist so weit wie möglich/sinnvoll im XML-Baum verschwunden, also zum Beispiel:
    187 
    188 {{{
    189 <s>Bla Bla. <lb/><s>
    190 }}}
    191 
    192 statt
    193 
    194 {{{
    195 <s>Bla Bla. <s>
    196 <lb/>
    197 }}}
    198 
    199 Bei der Anzeige des XML-Textes für eine Seite sollte `<lb/>` innerhalb von `<s>` nicht in einer eigenen Zeile stehen. In anderen Worten: `<lb>` sollte nur dann in eigener Zeile stehen, wenn es auch im XML-Text in eigener Zeile steht.
    200 
    201 ==== <cb> ====
    202 Im Prinzip wie `<lb>`. Aus dem `<cb>` ist nicht mehr automatisch renkonstuierbar, wo die erste Spalte anfängt und die letzte Spalte aufhört. Daher kann man es wie `<lb>` behandeln. Allerdings kann eine Spalte einen "running head" haben, der dargestellt wird wie ein running head einer Seite.
    203 
    204 ==== <pb> ====
    205 CSS: Optisch klar vom "echten" Text abgrenzen: gesperrt?
    206 
    207 Werden running heads dargestellt? Oder kann der User sie ein- und ausblenden?
    208 
    209 Worttrennungen: Das System muss umgehen können mit Fällen wie
    210 
    211 {{{
    212 eue-<lb/>
    213 <anchor type="figure" xlink:href="..."/><lb/>
    214 <anchor type="figure" xlink:href="..."/>
    215 <pb ... />
    216 niet
    217 }}}
    218 
    219 
    220 === echo-attribute ===
    221 
    222 `@xml:lang` siehe `<dcterms:language>` und `<foreign>`. Druch `@xml:lang` ist im Prinzip für jeden Textabschnitt  klar, welche Sprache es ist, insbesondere welche Schreibrichtung es ist. Zeigt der Browser zum Beispiel Arabisch problemlos korrekt an, oder muss man dem Browser auf der Grundlage von `@xml:lang` explizit sagen, was er tun soll?
    223 
    224 `@style` und `@class` siehe `<emph>`
    225 
    226 `@xml:id` kann ignoriert werden, wird aber für die links im TOC gebraucht. Floats verwenden `@xlink:label` statt `@xml:id`.
    227 
    228 `@xml:space` sollte für die Ausgabe des XML-Textes beachtet werden.
     224== 4. additional text blocks: non-floats ==
     225
     226=== echo-textflows ===
     227
     228Wie die div-Typen "multiflow" und "parallel" angezeigt werden könnten: User kann wählen zwischen
     229  * Seitendarstellung mit allen Flows auf dieser Seite
     230  * Seitendarstellung mit einem bestimmten Flow
     231  * Darstellung in der Reihenfolge wie im XML, ohne auf dei Seiteneinteilung Rücksicht zu nehmen
     232Wenn es `@flow` in `<pb>` gibt, gilt `<pb>` nur für diesen Flow. Beispiele sind Eipo, Conimbricenses, Fußnoten. Wie mehrere Flows, insbesondere der Haupttext und die Fußnoten, gleichzeitig angezeigt werden können, müssen wir uns noch überlegen.
     233
     234(`<pb>` in Fußnoten sind mit flow="footnote" gekennzeichnet. `<pb>` in Endnoten haben kein `@flow`.)
     235
     236
     237=== echo-block-scholarly ===
     238
     239==== <set-off> ====
     240sollte in eigenen Zeilen und eingerückt dargestellt werden
     241
     242==== <quote> ====
     243ähnlich wie `<q>`; als blockquote wie `<set-off>`
     244
     245
     246== 5. additions to the inline model ==
     247
     248=== echo-gap ===
     249
     250==== <gap> ====
     251Darstellung als [...] ?
     252
     253==== <unsure> ====
     254Ignorieren?
     255
     256
     257=== echo-de ===
     258
     259==== <unknown> ====
     260Ignorieren?
     261Sollte aber möglichst nicht mehr im Text enthalten sein.
     262
     263==== <wrong> ====
     264Ignorieren?
     265Sollte aber möglichst nicht mehr im Text enthalten sein.
    229266
    230267
     
    239276
    240277Das Anzeigesystem könnte eine GUI für eine XQuery zur Verfügung stellen, mit der man nach den value-Attributen suchen kann.
    241 
    242278
    243279==== <var> ====
     
    250286
    251287xml: auch <var> nicht in eigener Zeile anzeigen! sondern <s> in einer Zeile lassen, Fließtext, wird vom Browser umgebrochen
     288
     289
     290=== echo-import-mathml ===
     291
     292==== <mml:*> ====
     293`<mml:*>` kann direkt und ohne Änderungen an den Browser weitergereicht werden. Zumindest Firefox kann Formeln annähernd korrekt darstellen.
     294
     295
     296=== echo-gis ===
     297
     298Die Element-Namen werden sich voraussichtlich noch ändern. Siehe auch [wiki:"2010-04-15 GIS meeting" hier].
     299
     300==== <place> ====
     301CSS: Sollte optisch erkennbar sein, z.B. kursiv
     302
     303Am besten ein link zum Beispiel zum entsprechenden Eintrag in einem Authority file.
     304Sollte an das GIS-System weitergereicht werden können.
     305(Wie bei `<num>` könnte der User wählen, den standardisierten Namen angezeigt zu bekommen.)
     306
     307==== <time> ====
     308CSS: Sollte optisch erkennbar sein, z.B. kursiv
     309
     310Sollte in irgendeiner Form an das GIS-System weitergereicht werden können.
     311
     312==== <person>, <event> ====
     313Es wird auch noch `<person>` und `<event>` geben, aber die Details sind noch unklar.
     314
     315
     316=== echo-content-scholarly ===
     317
     318==== <sic> ====
     319kann hier ignoriert werden; wird im scholarly workflow in Arboreal gebraucht
     320
     321==== <ref> ====
     322CSS: z.B. kursiv
     323
     324Innerhalb von `<ref>` werden Abkürzungen nicht aufgelöst. Innerhalb von `<ref>` werden daher normale Wörter morphologisch analysiert (d.h. an Donatus / Pollux weitergeleitet), aber Wörter mit Punkt nicht. Zum Beispiel wird "lib." in
     325{{{
     326ex <ref>.7. propoſitione lib. Archimedis de inſidentibus aquæ</ref>
     327}}}
     328nicht analysiert.
     329
     330Wenn es in `<ref>` ein `@standard` gibt, kann der ganze Inhalt unanalysiert bleiben, und stattdessen gibt es einen link, der zu der reference passt. Beispiel:
     331{{{
     332... ex <ref standard="Eucl:11:1">prima <lb/>vndecimi Euclid.</ref> poſitæ erunt.
     333}}}
     334
     335Frage ist, wohin der link führen soll.
     336
     337==== <foreign> ====
     338CSS: Der Übergang von Fraktur zu Antiqua oder oder von A. zu F. sollte durch einen passenden Font ausgedrückt werden.
     339`@xml:lang` sollte ausgewertet werden.
     340
     341==== <q> ====
     342CSS: Sollte optisch erkennbar sein.
     343
     344Für kurze quotes innerhalb eines `<s>`. Beachte `@open` und `@close`.
     345
     346
     347== 6. additional attributes for Chinese text ==
    252348
    253349=== echo-chinese-text ===
     
    280376}}}
    281377(Farbe nachtragen!)
    282 
    283 === echo-gis ===
    284 
    285 Die Element-Namen werden sich voraussichtlich noch ändern. Siehe auch [wiki:"2010-04-15 GIS meeting" hier].
    286 
    287 ==== <place> ====
    288 CSS: Sollte optisch erkennbar sein, z.B. kursiv
    289 
    290 Am besten ein link zum Beispiel zum entsprechenden Eintrag in einem Authority file.
    291 Sollte an das GIS-System weitergereicht werden können.
    292 (Wie bei `<num>` könnte der User wählen, den standardisierten Namen angezeigt zu bekommen.)
    293 
    294 ==== <time> ====
    295 CSS: Sollte optisch erkennbar sein, z.B. kursiv
    296 
    297 Sollte in irgendeiner Form an das GIS-System weitergereicht werden können.
    298 
    299 ==== <person>, <event> ====
    300 Es wird auch noch `<person>` und `<event>` geben, aber die Details sind noch unklar.
    301 
    302 
    303 === echo-textflows ===
    304 
    305 Wie die div-Typen "multiflow" und "parallel" angezeigt werden könnten: User kann wählen zwischen
    306   * Seitendarstellung mit allen Flows auf dieser Seite
    307   * Seitendarstellung mit einem bestimmten Flow
    308   * Darstellung in der Reihenfolge wie im XML, ohne auf dei Seiteneinteilung Rücksicht zu nehmen
    309 Wenn es `@flow` in `<pb>` gibt, gilt `<pb>` nur für diesen Flow. Beispiele sind Eipo, Conimbricenses, Fußnoten. Wie mehrere Flows, insbesondere der Haupttext und die Fußnoten, gleichzeitig angezeigt werden können, müssen wir uns noch überlegen.
    310 
    311 (`<pb>` in Fußnoten sind mit flow="footnote" gekennzeichnet. `<pb>` in Endnoten haben kein `@flow`.)
    312 
    313 
    314 === echo-import-xhtml ===
    315 
    316 ==== <xhtml:*> ====
    317 
    318 `<xhtml:*>` kann direkt an den Browser weitergereicht werden. Beachte allerdings, dass wir nicht das content model von xhtml verwenden; man kann also nicht einfach die ganze Tabelle ohne Änderungen übergeben, sondern nur die Elemente mit dem Namespace `xhtml`.
    319 
    320 
    321 === echo-import-mathml ===
    322 
    323 ==== <mml:*> ====
    324 `<mml:*>` kann direkt und ohne Änderungen an den Browser weitergereicht werden. Zumindest Firefox kann Formeln annähernd korrekt darstellen.
    325 
    326