wiki:normalization

Version 10 (modified by Wolfgang Schmidle, 13 years ago) (diff)

--

Normalisierung

Für die Anzeige unserer XML-Volltexte haben wir mehrere Anzeige-Modi, nämlich

  • Original: grob gesprochen die größtmögliche Annäherung der Vorlage mit Unicode-Mitteln
  • Regularized: die Ansicht mit buchspezifischen Korrekturen
  • Normalized: die Ansicht mit einer sprachspezifischen Normalisierung des Textes

In diesem Text geht es darum, wie die Normalisierung im Detail funktioniert. Details von Original und Regularized werden hier? diskutiert.

  1. Wie werden Wörter zurzeit normalisiert?
  2. Was bedeutet das?
  3. Wann wird zurzeit normalisiert?
  4. Wie soll normalisiert werden?
  5. Was ist zu tun?

Abschnitt 1 beschreibt die bisherigen Normalisierungsregeln in Arboreal und im Backend im Detail. In Abschnitt 2 werden diese Regeln diskutiert, und Abschnitt 3 beschreibt, in welchen Situationen diese Regeln angewendet werden. In Abschnitt 4 beschreibe ich, wie bei uns normalisiert werden soll. Abschnitt 5 listet auf, was dafür konkret zu tun ist.

Am einfachsten ist es wohl, mit Abschnitt 4 anzufangen.