Changes between Version 16 and Version 17 of anzeige-modi
- Timestamp:
- May 18, 2010, 9:56:14 AM (15 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
anzeige-modi
v16 v17 12 12 Zeichen, die in Unicode nicht verfügbar sind, werden im xml durch links auf Bilder oder SVG-Fragmente ersetzt, die an einer zentralen Stelle abgelegt sind. Zeichen-Bilder müssen genau an der richtigen Stelle angezeigt werden. 13 13 14 Die sprachspezifische Normalisierung ist im Lateinischen und Griechischen nicht identisch mit der Normalisierung für Donatus /Pollux (Beispiel ἀλλὰ versus ἀλλά), sondern wohl eine Teilmenge davon. Die Normalisierung für Sprachen wie Chinesisch muss noch genauer beschrieben werden.14 Die sprachspezifische Normalisierung ist im Lateinischen und Griechischen nicht identisch mit der Normalisierung für Donatus / Pollux (Beispiel ἀλλὰ versus ἀλλά), sondern wohl eine Teilmenge davon. Die Normalisierung für Sprachen wie Chinesisch muss noch genauer beschrieben werden. 15 15 16 16 Probleme der sprachspezifischen Suche müssen wir noch getrennt besprechen. … … 89 89 90 90 Latein: 91 * Wenn man für die normalisierte Version den sprachspezifischen Normalisierungs-Service für Donatus /Pollux verwendet, wenn man also in der normalisierten Version genau die Vereinheitlichungen macht, die man auch für Donatus/Pollux macht, muss man im Lateinischen aër und verò zu aer und vero vereinheitlichen. Will man das? (Noch problematischer ist es im Griechischen, siehe unten.)91 * Wenn man für die normalisierte Version den sprachspezifischen Normalisierungs-Service für Donatus / Pollux verwendet, wenn man also in der normalisierten Version genau die Vereinheitlichungen macht, die man auch für Donatus / Pollux macht, muss man im Lateinischen aër und verò zu aer und vero vereinheitlichen. Will man das? (Noch problematischer ist es im Griechischen, siehe unten.) 92 92 * Ich gehe davon aus, dass ſcīa zu ſcientia regularisiert wird und nicht gleich zu scientia, und entsprechend rñdẽs zu reſpondens und nicht zu respondens. 93 93 * Wir versuchen die Private Use Area in Unicode nach Möglichkeit zu vermeiden, aber zum Beispiel bei der "que"-Ligatur geht das nicht gut. Daher wird ideḿ nur mit dem richtigen Font korrekt angezeigt. Brauchen wir noch einen vierten Anzeigemodus, wo ́ durch ein Bild ersetzt ist, oder kann man erwarten, dass jemand, der das Original korrekt angezeigt haben will, sich die Mühe macht, einen Font herunterzuladen und zu installieren? 94 94 95 95 Griechisch: 96 * Spätestens im Griechischen muss man auf alle Fälle unterscheiden zwischen dem normalisierten Text und den Normalisierungen für Donatus /Pollux: Zum Beispiel ein Gravis auf dem letzten Buchstaben von ἀλλὰ in ἀλλὰ ξύλινον sollte auch in der normalisierten Textversion ἀλλὰ bleiben, an das Wörterbuch sollte jedoch ἀλλά mit Akut geschickt werden. Wahrscheinlich sind die Textnormalisierungen eine Teilmenge der Normalisierungen für Donatus/Pollux, sodass man den Normalisierungsservice in zwei Teile teilen kann und für die Textnormaliserung nur den ersten Teil aufruft.96 * Spätestens im Griechischen muss man auf alle Fälle unterscheiden zwischen dem normalisierten Text und den Normalisierungen für Donatus / Pollux: Zum Beispiel ein Gravis auf dem letzten Buchstaben von ἀλλὰ in ἀλλὰ ξύλινον sollte auch in der normalisierten Textversion ἀλλὰ bleiben, an das Wörterbuch sollte jedoch ἀλλά mit Akut geschickt werden. Wahrscheinlich sind die Textnormalisierungen eine Teilmenge der Normalisierungen für Donatus / Pollux, sodass man den Normalisierungsservice in zwei Teile teilen kann und für die Textnormaliserung nur den ersten Teil aufruft. 97 97 * Mit den weiteren Problemen im Griechischen (verschiedene {και}-Ligaturen, Ligaturen versus Abbreviaturen, Akzente auf dem falschen Buchstaben bei Diphthongen, etc.) habe ich mich noch nicht näher beschäftigt. Bei falsch gesetzten Akzenten in Diphthongen ist die Frage, ob der Akzent schon im Text regularisiert wird, oder ob das als Merkwürdigkeit des Buches akzeptiert wird und erst in der normalisierten Version korrigiert wird. 98 98