Changes between Version 19 and Version 20 of normalization/5


Ignore:
Timestamp:
Dec 18, 2010, 5:21:39 PM (13 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • normalization/5

    v19 v20  
    1111Beispiele für Regularisierungen sind in [wiki:normalization/4 dieser Tabelle] zu sehen.
    1212
    13 === Ziele bei der Regulierung ===
     13=== Ziele ===
     14
     15Durch die Regularisierung soll im Idealfall eine Textgestalt geschaffen werden, die zusammen mit der Normalisierung einer klassischen Text-Edition entspricht.
    1416
    1517 * Wissen über den einzelnen Text und einzelne Textstellen muss in <reg> und nicht in die Normalisierung.
     
    102104 * Ein konzeptionelles Argument ist, dass der Original-Modus aus offiziellen Unicode-Zeichen bestehen sollte, und dass die PUA-Zeichen, selbst wenn es MUFI-Zeichen sind, eher unseren idiosynkratischen Notationen aus den DESpecs entsprechen. Paul könnte sich den Text dann im faithful-Modus anschauen.
    103105 * Im faithful-Attribut könnte man auch die Idee wiederbeleben, das Zeichen durch die Sequenz q́ ZWJ ꝫ darzustellen. Hätte das irgendwelche Vorteile gegenüber dem PUA-Zeichen? Das Problem des ''ZWJ'' war, dass er nicht tut, was er tun soll, nämlich dem Font mitzuteilen, dass hier eine Ligatur ist, sondern im Gegenteil Ligaturen aktiv verhindert und die Suche bricht.
     106 * Der XML-Text soll ohne Änderungen auch in zehn Jahren noch korrekt anzeigbar sein. Wenn ein MUFI-Zeichen aus der PUA einen offiziellen Unicode-Codepoint erhält, können aktualisierte Versionen der MUFI-Fonts das Zeichen vom PUA-Codepoint entfernen und nur noch den offiziellen Codepoint korrekt anzeigen. Die Nachbesserung am XML ist zwar trivial und kann von einem maintenance-Skript übernommen werden, aber vielleicht wäre es trotzdem besser, wenn solche Probleme nur innerhalb des faithful-Attributs auftreten können.
    104107
    105108Ein weiteres Argument: Benedetti enthält einige medievalist characters, sie werden aber nicht mehr wie im Alvarus standardmäßig verwendet. Ein schwieriger Fall ist das kursive Wort $enatori\'{que} (Benedetti p.296). Das Zeichen {que} könnte wieder mit dem PUA-Zeichen  wiedergegeben werden:
     
    149152Bestimmte Fehler, wie zum Beispiel überflüssige oder fehlende spaces, werden wir voraussichtlich von vornherein stillschweigend korrigieren.
    150153
     154Lesehilfe-Diakritika können wir möglicherweise zur Wortgrenzenerkennung verwenden, zum Beispiel beim fehlenden Leerzeichen in "ferècæteri" (Benedetti p.7).
     155
    151156=== Standard-Regularisierungen in allen Sprachen ===
    152157