= Die Anzeige von chinesischen Texten = [[PageOutline(1-4,,pullout)]] = 1. Diskussionspunkte = == Parallel-Ansichten == * Eine Option bei Seitenbildern für eine Ansicht mit Bild und Text auf einer Seite statt auf zwei Seiten wäre sinnvoll. * Dagmar hat eine Übersetzung des Textes mit IDs. Die Übersetzung sollte parallel zum Originaltext angezeigt werden können. Das wäre ein killer feature. Im Gegensatz zu Arboreal ohne Bearbeitungsmöglichkeit, aber die im Original und in der Übersetzung sollten optisch klar zuordenbar sein. (Letztlich könnte das Anzeigesystem eine web-Version von Arboreal werden.) == Seitenzahlen == Es sollte auch der Name der Halbseite angezeigt werden, also zum Beispiel 168 / 83B und 169 / 84A. Ansonsten ist es mühsam, eine Seite zu finden. Allerdings steht die Information nicht so im Text. Aus dem file-Attribut in extrahieren, oder neues Attribut? Anders gesagt: Es sollte eine Option geben, den Dateinamen des JPG angezeigt zu bekommen. == Suche == Es kann immer wieder passieren, dass die ZWS (U+200B) durcheinandergeraten. * Wie geht die Suche damit um? Suchoption "ignoriere ZWS"? * Wie wird der Index bei chinesischen Texten erstellt? Wird ZWS dabei beachtet oder nicht? * Und ZWJ (U+200D) als positives Signal, dass die Zeichen Teil eines Wortes sind? Bricht das die Suche bei uns der bei anderen? Ausprobieren? == Zeichen-Varianten == Infrastruktur für die Anzeige von ⿱金尖.svg schaffen. muss anders behandelt werden als bei Figures. Außerdem Infrastruktur für IVS-Sequenzen. = 2. Feature Requests = * Insbesondere für die Doppelseitenbilder braucht man die umgekehrte links-rechts-Metapher der Pfeile. * Eine Option, small text ein- und auszublenden, wäre sinnvoll. Genauer gesagt, der Benutzer sollte wählen können zwischen Dartsellung im Text, als Fußnoten und als textflow in getrennten Spalten, die miteinander koordiniert sind. = 3. Anzeigeprobleme = == chinesische Satzzeichen == Manche Satzzeichen werden fälschlicherweise durch ihre ASCII-Äquivalente ersetzt: ||= Satzzeichen =|| 。 || ! || ? || , || 、 || : || ; || " " || ||= Unicode =|| 3002 || FF01 || FF1F || FF0C || 3001 || FF1A || FF1B || 3000 || ||= angezeigt als =|| . || ok || ok || ok || , || ok || ok || " " || Unicode-Namen: 300x: "ideographic ...", FFxx: "fullwidth ..." (i.e. fullwidth-Versionen von ASCII-Zeichen). Beim Punkt gibt es beides (fullwidth-Version ist FF0E), aber verwendet wird 3002. Beim Komma gibt es auch beides, und beide werden mit verschiedenen Bedeutungen verwendet (normales Komma FF0C vs. Aufzählungskomma 3001). Es werden also die "ideographic"-Zeichen 3000-3002 nicht korrekt dargestellt. Ein Beipiel für den ideographic space U+3000 ist die Überschrift auf [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=18 Seite 18]. Ein Beispiel für 。 ist [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=445&sn=1 hier]. Im Gesamt-XML ist es 。: {{{ 則​又​非​也。 }}} aber im Seiten-XML und bei der Textanzeige ist es ein ASCII-Punkt: {{{ 則​又​非​也. }}} (Am Ende einer Note werden die Punkte korrekt angezeigt, siehe Seite [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=21 10A / 21], obwohl im Seiten-XML ein ASCII-Punkt ist, siehe [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=xml&pn=23 hier]!) == Überschriften == Die Überschriften werden zentriert angezeigt. Bei Absätzen mit kann es passieren, dass die Überschrift rechts neben dem Text steht, zum Beispiel auf Seite 3. Besser wäre linksbündig, und Einrückung je nach headlevel (falls vorhanden), oder proportional zur div-Tiefe. == figures == Alle Bilder sind Seitenbilder. Die einzige Ausnahme ist eventuell das Bild auf Seite [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=168 83B / 168]; wir haben es aber auch zum Seitenbild erklärt, weil der Text auf der Seite zum Bild gehört. Die Seitenbilder sind als JPGs (also nicht als TIFFs) im figures-Ordner (Kopien der Seiten aus dem pageimg-Ordner, mit Zusatz "-01".) * Die Lösung, Figures in
rechtsbündig anzuzeigen, funktioniert bei Seitenbildern optisch nicht. Vergleiche [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=37 Figure 12] ohne
und [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=42 Figure 13] mit
. Vermutlich sollten wir also doch als Standard nehmen, Bilder linksbündig anzuzeigen. (Würde sich die Lage verändern, wenn man in bei den Bildern noch die Position definiert?) * wird über dem Bild gezeigt, alle hintereinander ohne return oder space neben "[Figure: ...]:" ( [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=385 Beispiel]). Aber descriptions sind keine Unter-Überschriften. Die caption sollte dort gezeigt werden, wo jetzt die descriptions sind. Die descriptions dann darunter, jeweils in einer neuen Zeile für jede description. (Problem der mehrzeiligen descriptions: Listenpunkte für die descriptions?) * Die Bilder mit
werden nicht korrekt durchnumeriert und auch nicht korrekt angezeigt, siehe z.B. Seite 154. Intern stimmt die Numerierung aber offenbar: Nach viermal 13 kommt 17. (Möglicherweise vergleichbar: Im Benedetti sollen laut [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/la/Benedetti_1585.xml&pn=26&mode=text&query-type=figures&query-result-pn=1 TOF] die Figures 26 bis 29 auf Seite 26 sein, angezeigt werden aber, korrekterweise, nur zwei figures.) * Das Symbol für ein fehlendes Bild wird angezeigt unabhängig davon, ob die Figure ein hat oder nicht. Beispiel: Bilder 1-6 haben kein , aber Bild 7 und 10 haben . (Zumindest für diesen Text hat es sich erledigt, denn die figures haben jetzt .) * Aufruf der [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fzh%2FSongYingxing_1637.xml&mode=image&pn=1&sn=-1&query-type=figures&query-result-pn=1 Table of Figures] ergibt eine Fehlermeldung. (Bei Andrey wird daraus eine [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?url=%2Fmpiwg%2Fonline%2Fpermanent%2Fecho%2Fchina%2Fsongy_tiang_zh_1637&tocMode=figures ECHO-Fehlermeldung].) == small text == Small text wird im Song Yingxing im Text angezeigt, und nicht als Fußnote oder als separater textflow. * sollte sich optisch klarer von normal großem Text unterscheiden, d.h. etwas kleinere Schriftgröße in chinesischen Texten (und damit auch in europäischen Texten, wenn man nicht verschiedene CSS-Versionen pflegen will) * Ist es technisch möglich, wie im Buch in zwei Reihen darzustellen, die zusammen genauso hoch sind wie ein normales Zeichen? Beispiel [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=image&pn=28 Bild], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=28 Text]. Im Text wäre das `` (oder ``), was nicht wie ein normaler behandelt werden darf, sondern sich nur auf bezieht. (Das `\\` in table cells wird zu einem normalen , weil es hier keine Probleme gibt.) Wäre denn eine Tabellendarstellung on-the-fly mit einer quasi unsichtbaren Tabelle bei cinesischen Texten eine sinnvolle Lösung? Oder erzeugt das weitere Probleme beim Suchen, cut&paste, etc.? * (`` wird korrekt angezeigt: [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=74 Beispiel] (beide Überschriften auf Seite 74), aber `` nicht: [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=17&sn=25 Beispiel]. Die Art, wie markiert wird, hat sich inzwischen geändert, aber das Problem tritt auch bei kursivem Text etc. auf, siehe unten.) == Table of Contents == Die div's der front matter werden nicht angezeigt: Title, preface, toc. Bei toc sollten die verschachtelten div's nicht angezeigt werden. Ich werde das ändern, sobald ich dazu komme. == xhtml == Seiten 416-417 enthalten eine xhtml-Liste (xhtml:dl). Die seiten werden nicht angezeigt. == PDF-Darstellung == Sun-ExtA sollte nur für chinesische Zeichen und Interpunktion verwendet werden. Beispiel [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=text&pn=100&export=pdf Text], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/zh/SongYingxing_1637.xml&mode=xml&pn=100&export=pdf XML]. Beachte Extension B einerseits und lateinische Zeichen andererseits. == Vermischtes == * Die originalen Seitenzahlen passen offenbar nicht in eine Zeile und werden umgebrochen, siehe z.B. Seite 154. * Der URL-Zusatz `&sn=...` numeriert die Überschriften nicht mit durch, man kann also beispielsweise die Überschriften im Beispiel für `` nicht explizit markieren. Bug oder feature? * Anzeige von Marginalien funktioniert noch nicht. Beispiel [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/la/Benedetti_1585.xml&mode=text&pn=398 Benedetti]: * Immer noch als Fußnoten * und mit dem internen link, den der Benutzer gar nicht sehen soll; statt dessen das Symbol, falls vorhanden, oder 1, 2, 3, etc. Auf jeder Seite neu anfangen zu zählen. * Die notes sollten nicht kursiv gemacht werden. * Auf der gleichen Seite in der [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/la/Benedetti_1585.xml&mode=xml&pn=398 XML-Ansicht] nach Marginalie 0398-03: {{{ quadruplũ }}} wird im Seiten-XML zu {{{ quadruplum }}} Auch auf dieser Seite: {{{ compararetq; (ok) consequente (normalisiert statt original) }}} * innerhalb von

(testweise für auf Seite 15; nicht zu verwechseln mit auf der gleichen Ebene wie

) wird nicht korrekt angezeigt: * nicht kursiv (das war nur zu Textzwecken im CSS) * nicht eingerückt * nicht in neuer Zeile (wenn es eingerückt sein soll, gibt es ein zusätzliches ) * beachte open/close-Attribute * `` wird korrekt angezeigt, aber `` nicht. Beispiel siehe [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/la/Benedetti_1585.xml&mode=text&pn=11 hier]: {{{ vt mala ſcilicet prius ... Omnes qui dere-bus ... }}} Bei Andrey wird sogar beides upright dargestellt. * options=withoutLBs: Geht noch nicht richtig mit Bindestrichen um, siehe zum Beispiel [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=/echo/la/alvarus_1509.xml&mode=text&pn=10&options=withoutLBs&sn=0 su-perparticularis]. (Verwirrung: Die Datei heißt "alvarus_1509", der alte link mit "Alvarus_1509" funktioniert deshalb nicht. Dateinamen ändern?)