Changes between Version 1 and Version 2 of xml-display


Ignore:
Timestamp:
Jun 2, 2010, 4:11:46 PM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • xml-display

    v1 v2  
    33[[PageOutline(2-4,,pullout)]]
    44
    5 <num>: Das Anzeigesystem könnte eine GUI für eine XQuery zur Verfügung stellen, mit der man nach den value-Attributen suchen kann.
     5
     6
     7=== echo ===
     8
     9--
     10
     11=== echo-start ===
     12
     13==== <echo> ====
     14Es sollten die zu `@version` passenden XSLT-Skripte verwendet werden.
     15
     16
     17=== echo-metadata ===
     18
     19Die Metadaten-Suche sollte die hierarchische Struktur der dcterms-Metadaten berücksichtigen: Wenn "A refines B", dann findet eine Such nach einem Inhalt von B auch Einträge in A finden, aber nicht umgekehrt.
     20
     21==== <dcterms:creator> ====
     22`@identifier:` Die Einträge sollten in links umgewandelt werden.
     23
     24==== <dcterms:language> ====
     25Alle angegebenen Sprachen sind Haupt-Sprachen des Textes. Text in einer der Haupt-Sprachen sollte korrekt mit Donatus / Pollux analysiert und indiziert werden. Textabschnitte in anderen Sprachen müssen nicht unbedingt morphologisch analysiert werden.
     26
     27==== <dcterms:accessRights> ====
     28Texte mit `<dcterms:accessRights>restricted</dcterms:accessRights>` sollten wohl nicht in eXist aufgenommen werden.
     29
     30==== <font>, <font-family> ====
     31Umsetzen als Anweisung für den Browser? Beispiel "Fraktur". Noch nicht ausgereift.
     32
     33
     34=== echo-div ===
     35
     36==== <text> ====
     37`@xml:lang` siehe `<dcterms:language>`
     38
     39==== <div> ====
     40Erzeuge ein TOC aus den `<div>`. Berücksichtige dabei nur die `<div>` mit folgenden Werten von `@type:`
     41volume, front, body, back, chapter, section, ...
     42
     43{{{
     44body
     45  chapter 1: Kapitel-Überschrift
     46    section 1.1: Abschnitt-Überschrift
     47      section 1.1.1: Unterabschnitt-Überschrift
     48}}}
     49
     50Alternativ kann man auch eine Liste von div-Typen ausschließen:
     51multiflow, parallel, other, ...
     52
     53Wahrscheinlich ist der opt-in-Ansatz aber besser als der opt-out-Ansatz. Als grobe Orientierung könnte jedenfalls dienen, dass Typen, die in anderen Modulen als echo-div definiert sind, nicht im TOC angezeigt werden.
     54
     55Das TOC sollte Seitennummern sowie links zu den entsprechenden Abschnitten haben.
     56
     57(Für die Numerierung und Seitennummern habe ich ein XSL-Skript. Das kann ich noch um das Einfügen der Überschrift erweitern. Schematron stellt sicher, dass alle `<div chapter>` und `<div section>` wirklich mit einer Überschrift anfangen.)
     58
     59Zusammenspiel mit eSciDoc-TOC ?
     60
     61
     62=== echo-block ===
     63
     64==== <head> ====
     65CSS: fett
     66
     67(`<pb>` in `<head>` sollten nur innerhalb von Flows vorkommen; siehe echo-textflows)
     68
     69==== <s> ====
     70Kann ignoriert werden. Die Attribute sollen natürlich beachtet werden.
     71(Ausnahme sind eventuell `<s>` mit implizitem `<lb/>` in `<div lines>`)
     72
     73xml: <s> in einer Zeile lassen, Fließtext, wird vom Browser umgebrochen
     74
     75==== <note> ====
     76siehe echo-float
     77
     78==== <set-off> ====
     79sollte in eigenen Zeilen und eingerückt dargestellt werden
     80
     81
     82=== echo-content ===
     83
     84==== <reg> ====
     85In der Standard-Anzeige wird der Inhalt des reg-Tags angezeigt. Der User kann aber wählen, ob er stattdessen jeweils den Inhalt des orig-Attributs angezeigt bekommen möchte. Zusätzlich sollte es eine dritte Version geben, nämlich wo die Wortformen noch orthographisch normalisiert sind. Diese Darstellung ist sprachspezifisch; im Lateinischen sind das  u/v, i/j, ſ/s, ß/ss, æ/ae, œ/oe. Beispiel:
     86
     87{{{
     88XML:          totum <reg orig="relatiuũ" type="context">relatiuum</reg> ipſius 
     89Standard:     totum                                     relatiuum       ipſius
     90Original:     totum            relatiuũ                                 ipſius
     91normalisiert: totum                                     relativum       ipsius
     92}}}
     93
     94In der Original-Darstellung kann es Zeichen geben, die nur mit speziellen Fonts darstellbar sind. Zeichen, die in Unicode enthalten sind, werden normalerweise vom Browser korrekt angezeigt, wenn es irgendeinen Font auf dem Computer gibt, der das Zeichen enthält. Manchmal muss man Zeichen aus der Private Use Area nehmen, zum Beispiel U+E8BF für die Ligatur  von q und ꝫ (U+A76B). Bei dieser Darstellung sollte der User also darüber aufgeklärt werden, dass er eventuell spezielle Fonts braucht.
     95
     96==== <ref> ====
     97CSS: z.B. kursiv
     98
     99Innerhalb von `<ref>` werden Abkürzungen nicht aufgelöst. Innerhalb von `<ref>` werden daher normale Wörter morphologisch analysiert (d.h. an Donatus / Pollux weitergeleitet), aber Wörter mit Punkt nicht. Zum Beispiel wird "lib." in
     100
     101{{{
     102ex <ref>.7. propoſitione lib. Archimedis de inſidentibus aquæ</ref>
     103}}}
     104
     105nicht analysiert.
     106
     107Wenn es in `<ref>` ein `@standard` gibt, kann der ganze Inhalt unanalysiert bleiben, und stattdessen gibt es einen link, der zu der reference passt. Beispiel:
     108
     109{{{
     110... ex <ref standard="Eucl:11:1">prima <lb/>vndecimi Euclid.</ref> poſitæ erunt.
     111}}}
     112
     113Frage ist, wohin der link führen soll.
     114
     115==== <sic> ====
     116kann hier ignoriert werden; wird in Arboreal gebraucht
     117
     118==== <foreign> ====
     119CSS: Der Übergang von Fraktur zu Antiqua oder oder von A. zu F. sollte durch einen passenden Font ausgedrückt werden.
     120`@xml:lang` sollte ausgewertet werden.
     121
     122==== <emph> ====
     123`@style` sollte als `@class` und ein CSS-Stylesheet an den Browser weitergegeben werden.
     124`@class` sollte nur in Ausnahmefällen vorkommen, z.B. in xhtml. Falls es im Text vorkommt, kann es direkt weitergegeben werden.
     125
     126==== <q> ====
     127CSS: Sollte optisch erkennbar sein.
     128
     129Für kurze quotes innerhalb eines `<s>`. Beachte `@open` und `@close`.
     130
     131==== <quote> ====
     132ähnlich wie `<q>`; als blockquote wie `<set-off>`
     133
     134
     135=== echo-gap ===
     136
     137==== <gap> ====
     138Darstellung als [...] ?
     139
     140==== <unsure> ====
     141Ignorieren?
     142
     143
     144=== echo-de ===
     145
     146==== <unknown> ====
     147Ignorieren?
     148Sollte aber möglichst nicht mehr im Text enthalten sein.
     149
     150==== <wrong> ====
     151Ignorieren?
     152Sollte aber möglichst nicht mehr im Text enthalten sein.
     153
     154
     155=== echo-figure ===
     156
     157==== <figure>, <caption>, <description>, <variables> ====
     158
     159Figures, die nicht in `<div float>` sind, sollte auf alle Fälle an der richtigen Stelle angezeigt werden. Ansonsten siehe Floats
     160(\sect{wunschliste echo-float}). Beispiel:
     161
     162{{{
     163<figure>
     164    <caption>Geometrische Formen</caption>
     165    <despription>Kreis</description>
     166    <despription>Dreieck</description>
     167    <despription>Viereck</description>
     168    <variables>a, b, c</variables>
     169</figure>
     170}}}
     171
     172wird zu:
     173
     174[figure 156][[BR]]'''Geometrische Formen'''[[BR]]Kreis[[BR]]Dreieck[[BR]]Viereck[[BR]]''a, b, c''
     175
     176
     177==== <image> ====
     178Falls es `@xlink:href` gibt, sollte das Bild an dieser Stelle angezeigt werden.
     179
     180
     181=== echo-handwritten ===
     182
     183==== <handwritten> ====
     184gehört nicht zum Textflow und wird erst auf Anforderung gezeigt. Meistens ist `<handwritten>` leer.
     185
     186
     187=== echo-float ===
     188
     189
     190==== <anchor> ====
     191Wenn es `@symbol` gibt, sollte das Symbol angezeigt werden, denn es steht ja im Text. Hochgestellt, wenn kein space davor ist, sonst nicht hochgestellt, aber kursiv. Beispiel:
     192
     193Anmerkung^2^ und anchor ''a'' eines anchored comment
     194
     195Wenn es auch `@xlink:href` gibt, sollte das Symbol ein link zum zugehörigen Float sein.
     196
     197Floats sind entweder als Teil des normalen Textflows, oder sie sind getrennt. Floats als Teil des normales Textflows sollten, wie Bilder auf einer Webseite, an der richtigen Stelle angezeigt werden, d.h dort, wo ihr `<anchor>` ist. Getrennte Floats sollten erst angezeigt werden, wenn der User sie anfordert.
     198
     199normaler Textflow:
     200  * `<figure>`
     201  * `<xhtml:*>` (Tabellen, Listen)
     202  * `<mml:*>` (MathML)
     203
     204getrennt:
     205  * `<note>` mit `@position=foot` (zumindest sollten Fußnoten, die über mehr als eine Seite gehen, auf Wunsch vollständig angezeigt werden)
     206  * `<handwritten>`
     207  * `<note>` mit `@position=end` (sollten bei ihrem `<div endnotes>` angezeigt werden, d.h. auf der Seite, auf der sie sind)
     208
     209unklar:
     210  * `<note>` mit `@position=left/right`: Peter hätte sie gerne im normalen Textflow
     211
     212
     213=== echo-milestone ===
     214
     215==== <lb> ====
     216Zeilenumbruch: `<lb/>` ist so weit wie möglich/sinnvoll im XML-Baum verschwunden, also zum Beispiel:
     217
     218{{{
     219<s>Bla Bla. <lb/><s>
     220}}}
     221
     222statt
     223
     224{{{
     225<s>Bla Bla. <s>
     226<lb/>
     227}}}
     228
     229Bei der Anzeige des XML-Textes für eine Seite sollte `<lb/>` innerhalb von `<s>` nicht in einer eigenen Zeile stehen. In anderen Worten: `<lb>` sollte nur dann in eigener Zeile stehen, wenn es auch im XML-Text in eigener Zeile steht.
     230
     231==== <cb> ====
     232Im Prinzip wie `<lb>`. Aus dem `<cb>` ist nicht mehr automatisch renkonstuierbar, wo die erste Spalte anfängt und die letzte Spalte aufhört. Daher kann man es wie `<lb>` behandeln. Allerdings kann eine Spalte einen "running head" haben, der dargestellt wird wie ein running head einer Seite.
     233
     234==== <pb> ====
     235CSS: Optisch klar vom "echten" Text abgrenzen: gesperrt?
     236
     237Werden running heads dargestellt? Oder kann der User sie ein- und ausblenden?
     238
     239Worttrennungen: Das System muss umgehen können mit Fällen wie
     240
     241{{{
     242eue-<lb/>
     243<anchor type="figure" xlink:href="..."/><lb/>
     244<anchor type="figure" xlink:href="..."/>
     245<pb ... />
     246niet
     247}}}
     248
     249
     250=== echo-attribute ===
     251
     252`@xml:lang` siehe `<dcterms:language>` und `<foreign>`. Druch `@xml:lang` ist im Prinzip für jeden Textabschnitt  klar, welche Sprache es ist, insbesondere welche Schreibrichtung es ist. Zeigt der Browser zum Beispiel Arabisch problemlos korrekt an, oder muss man dem Browser auf der Grundlage von `@xml:lang` explizit sagen, was er tun soll?
     253
     254`@style` und `@class` siehe `<emph>` (\sect{wunschliste <emph>})
     255
     256`@xml:id` kann ignoriert werden, wird aber für die links im TOC gebraucht. Floats verwenden `@xlink:label` statt `@xml:id`.
     257
     258`@xml:space` sollte für die Ausgabe des XML-Textes beachtet werden.
     259
     260
     261=== echo-datatype ===
     262
     263--
     264
     265=== echo-mathematics ===
     266
     267Ob div-Typen wie "math:definition" im TOC angezeigt werden sollen, ist unklar.
     268
     269==== <num> ====
     270Der Inhalt von `<num>` wird nicht morphologisch analysiert. (Wird er in den Index aufgenommen?)
     271
     272Falls es `@value` gibt, könnte man dem User anbieten, `@value` statt dem Inhalt anzuzeigen, also zum Beispiel "0.5" statt "½".
     273
     274Das Anzeigesystem könnte eine GUI für eine XQuery zur Verfügung stellen, mit der man nach den value-Attributen suchen kann.
     275
     276
     277==== <var> ====
     278
     279Der Inhalt von `<var>` wird nicht morphologisch analysiert und nicht in den Index aufgenommen.
     280
     281Außerdem sollte @type berücksichtigt werden, wenn vorhanden. Beispielsweise könnte
     282`<type="segment">.A.B.</var>`
     283mit einer Linie über dem Namen dargestellt werden.
     284
     285xml: auch <var> nicht in eigener Zeile anzeigen! sondern <s> in einer Zeile lassen, Fließtext, wird vom Browser umgebrochen
     286
     287=== echo-chinese-text ===
     288
     289Senkrechte Schrift im Original ist im XML bereits waagerecht und wird daher auch waagerecht angezeigt.
     290
     291`<head>` mit `@ti:` CSS: z.B. in größerer Schrift
     292
     293`<p>` und `<pb>` mit `@ics:` CSS: z.B. kursiv (allerdings sehen kursive chinesische Zeichen etwas merkwürdig aus)
     294
     295`<p>` mit `@indent:` Chinesische Schrift ist monspaced (d.h. hat eine feste Laufweite). Rücke die erste Zeile um entsprechen viele Zeichen ein.
     296Wie stark die weiteren Zeilen eingerückt werden, ist unklar. Die wichtige Information war die Einrückung der ersten Zeile, und `@indent` bezieht sich deshalb auf die erste Zeile eines Absatzes. Die restlichen Zeilen können im Original entweder genauso eingerückt sein oder auch nicht.
     297  * rücke nur die erste Zeile ein
     298  * rücke alle Zeilen des Absatzes gleich weit ein
     299  * erste Zeile eingerückt, alle Zeilen rechtsbündig passend, letzte Zeile linksbündig mit der Zeile davor.
     300Beachte: Der Wert von `@indent` kann auch negativ sein. Die Grundlinie sollte auf allen Seiten gleich angezeigt werden.
     301
     302Notes: Die Entscheidung, ob eine Note (d.h. kleinere Schrift im Text) zum Textflow dazugehört oder nicht, ist im XML bereits gefallen. Dementsprechend gibt es `<anchor>` und `<note>` (mit `type="inline"`, der nicht angibt, wo sie angezeigt werden soll, sondern wo sie im Original stand), oder `<emph style="sm">`.
     303
     304`<lb>` mit `type="halfline"` innerhalb von `<emph style="sm">`: setze die beiden Zeilen untereinander und markiere die Note farblich. Beispiel:
     305
     306{{{
     307<head>鑄造大小守銃尺量法<emph style="sm">近者多<lb type="halfline"/>遠者少</emph></head>
     308}}}
     309wird zu:
     310
     311{{{
     312鑄造大小守銃尺量法 近者多
     313          遠者少
     314}}}
     315(Farbe nachtragen!)
     316
     317=== echo-gis ===
     318
     319Dieses Modul ist noch experimentell.
     320
     321==== <place> ====
     322CSS: Sollte optisch erkennbar sein, z.B. kursiv
     323
     324Am besten ein link zum Beispiel zum entsprechenden Eintrag in einem Authority file.
     325Sollte an das GIS-System weitergereicht werden können.
     326(Wie bei `<num>` könnte der User wählen, den standardisierten Namen angezeigt zu bekommen.)
     327
     328==== <time> ====
     329CSS: Sollte optisch erkennbar sein, z.B. kursiv
     330
     331Sollte in irgendeiner Form an das GIS-System weitergereicht werden können.
     332
     333==== <person>, <event> ====
     334Es wird auch noch `<person>` und `<event>` geben, aber die Details sind noch unklar.
     335
     336
     337=== echo-textflows ===
     338
     339Wie die div-Typen "multiflow" und "parallel" angezeigt werden könnten: User kann wählen zwischen
     340  * Seitendarstellung mit allen Flows auf dieser Seite
     341  * Seitendarstellung mit einem bestimmten Flow
     342  * Darstellung in der Reihenfolge wie im XML, ohne auf dei Seiteneinteilung Rücksicht zu nehmen
     343Wenn es `@flow` in `<pb>` gibt, gilt `<pb>` nur für diesen Flow. Beispiele sind Eipo, Conimbricenses, Fußnoten. Wie mehrere Flows, insbesondere der Haupttext und die Fußnoten, gleichzeitig angezeigt werden können, müssen wir uns noch überlegen.
     344
     345(`<pb>` in Fußnoten sind mit flow="footnote" gekennzeichnet. `<pb>` in Endnoten haben kein `@flow`.)
     346
     347
     348=== echo-import-xhtml ===
     349
     350==== <xhtml:*> ====
     351
     352`<xhtml:*>` kann direkt an den Browser weitergereicht werden. Beachte allerdings, dass wir nicht das content model von xhtml verwenden; man kann also nicht einfach die ganze Tabelle ohne Änderungen übergeben, sondern nur die Elemente mit dem Namespace `xhtml`.
     353
     354
     355=== echo-import-mathml ===
     356
     357==== <mml:*> ====
     358`<mml:*>` kann direkt und ohne Änderungen an den Browser weitergereicht werden. Zumindest Firefox kann Formeln annähernd korrekt darstellen.
     359
     360