Version 8 (modified by 14 years ago) (diff) | ,
---|
Normalisierung
Für die Anzeige unserer XML-Volltexte haben wir mehrere Anzeige-Modi, nämlich
- Original: grob gesprochen die größtmögliche Annäherung der Vorlage mit Unicode-Mitteln
- Regularized: die Ansicht mit buchspezifischen Korrekturen
- Normalized: die Ansicht mit einer sprachspezifische Normalisierung des Textes
In diesem Text geht es darum, wie die Normalisierung im Detail funktioniert. Details von Original und Regularized werden hier? diskutiert.
- Wie werden Wörter zurzeit normalisiert?
- Was bedeutet das?
- Wann wird zurzeit normalisiert?
- Wie soll normalisiert werden?
- Was ist zu tun?
Abschnitt 1 beschreibt die bisherigen Normalisierungsregeln in Arboreal und im Backend im Detail. In Abschnitt 2 werden diese Regeln diskutiert. Abschnitt 3 beschreibt, in welchen Situationen diese Regeln angewendet werden. In Abschnitt 4 beschreibe ich, wie bei uns normalisiert werden soll. Abschnitt 5 listet auf, was dafür konkret zu tun ist.
Insbesondere Abschnitt 1 ist recht technisch. Am einfachsten ist es wohl, mit Abschnitt 4 anzufangen.