Version 7 (modified by 14 years ago) (diff) | ,
---|
Normalisierung
Für die Anzeige unserer XML-Volltexte haben wir mehrere Anzeige-Modi, nämlich
- Original
- Regularized
- Normalized
Grob gesprochen meint Original die größtmögliche Annäherung der Vorlage mit Unicode-Mitteln. Regularized meint die Ansicht mit buchspezifischen Korrekturen. Normalized meint die Ansicht mit einer sprachspezifische Normalisierung des Textes. In diesem Text geht es darum, wie die Normalisierung funktioniert:
- Wie werden Wörter zurzeit normalisiert?
- Was bedeutet das?
- Wann wird zurzeit normalisiert?
- Wie soll normalisiert werden?
- Was ist zu tun?
Abschnitt 1 beschreibt die bisherigen Normalisierungsregeln in Arboreal und im Backend im Detail. In Abschnitt 2 werden diese Regeln diskutiert. Abschnitt 3 beschreibt, in welchen Situationen diese Regeln angewendet werden. In Abschnitt 4 beschreibe ich, wie bei uns normalisiert werden soll. Abschnitt 5 listet auf, was dafür konkret zu tun ist.
Insbesondere Abschnitt 1 ist recht technisch. Am einfachsten ist es wohl, mit Abschnitt 4 anzufangen.