wiki:normalization

Version 12 (modified by Wolfgang Schmidle, 13 years ago) (diff)

--

Normalisierung

Für die Anzeige unserer XML-Volltexte haben wir mehrere Anzeige-Modi, nämlich

  • Original: die größtmögliche Annäherung der Vorlage mit Unicode-Mitteln
  • Regularized: die Ansicht mit buchspezifischen Korrekturen
  • Normalized: die Ansicht mit einer sprachspezifischen Normalisierung des Textes

In diesem Text geht es darum, wie die Regularisierung und insbesondere die Normalisierung funktionieren.

Teil 1 ("alt"):

  1. Wie werden Wörter zurzeit normalisiert?
  2. Was bedeuten die Normalisierungsregeln?
  3. Wo werden die Normalisierungsregeln angewendet?

Teil 2 ("neu"):

  1. Überblick über Regularisierung und Normalisierung?
  2. Wie soll regularisiert werden??
  3. Wie soll normalisiert werden?
  4. Was ist konkret zu tun?