Changes between Version 19 and Version 20 of normalization/5
- Timestamp:
- Dec 18, 2010, 5:21:39 PM (13 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
normalization/5
v19 v20 11 11 Beispiele für Regularisierungen sind in [wiki:normalization/4 dieser Tabelle] zu sehen. 12 12 13 === Ziele bei der Regulierung === 13 === Ziele === 14 15 Durch die Regularisierung soll im Idealfall eine Textgestalt geschaffen werden, die zusammen mit der Normalisierung einer klassischen Text-Edition entspricht. 14 16 15 17 * Wissen über den einzelnen Text und einzelne Textstellen muss in <reg> und nicht in die Normalisierung. … … 102 104 * Ein konzeptionelles Argument ist, dass der Original-Modus aus offiziellen Unicode-Zeichen bestehen sollte, und dass die PUA-Zeichen, selbst wenn es MUFI-Zeichen sind, eher unseren idiosynkratischen Notationen aus den DESpecs entsprechen. Paul könnte sich den Text dann im faithful-Modus anschauen. 103 105 * Im faithful-Attribut könnte man auch die Idee wiederbeleben, das Zeichen durch die Sequenz q́ ZWJ ꝫ darzustellen. Hätte das irgendwelche Vorteile gegenüber dem PUA-Zeichen? Das Problem des ''ZWJ'' war, dass er nicht tut, was er tun soll, nämlich dem Font mitzuteilen, dass hier eine Ligatur ist, sondern im Gegenteil Ligaturen aktiv verhindert und die Suche bricht. 106 * Der XML-Text soll ohne Änderungen auch in zehn Jahren noch korrekt anzeigbar sein. Wenn ein MUFI-Zeichen aus der PUA einen offiziellen Unicode-Codepoint erhält, können aktualisierte Versionen der MUFI-Fonts das Zeichen vom PUA-Codepoint entfernen und nur noch den offiziellen Codepoint korrekt anzeigen. Die Nachbesserung am XML ist zwar trivial und kann von einem maintenance-Skript übernommen werden, aber vielleicht wäre es trotzdem besser, wenn solche Probleme nur innerhalb des faithful-Attributs auftreten können. 104 107 105 108 Ein weiteres Argument: Benedetti enthält einige medievalist characters, sie werden aber nicht mehr wie im Alvarus standardmäßig verwendet. Ein schwieriger Fall ist das kursive Wort $enatori\'{que} (Benedetti p.296). Das Zeichen {que} könnte wieder mit dem PUA-Zeichen wiedergegeben werden: … … 149 152 Bestimmte Fehler, wie zum Beispiel überflüssige oder fehlende spaces, werden wir voraussichtlich von vornherein stillschweigend korrigieren. 150 153 154 Lesehilfe-Diakritika können wir möglicherweise zur Wortgrenzenerkennung verwenden, zum Beispiel beim fehlenden Leerzeichen in "ferècæteri" (Benedetti p.7). 155 151 156 === Standard-Regularisierungen in allen Sprachen === 152 157