wiki:normalization

Regularisierung und Normalisierung

Wolfgang Schmidle

Für die Anzeige unserer XML-Volltexte haben wir mehrere Anzeige-Modi, nämlich

  • Original: die größtmögliche Annäherung der Vorlage mit Unicode-Mitteln
  • Regularized: die Ansicht mit buchspezifischen Korrekturen
  • Normalized: die Ansicht mit einer sprachspezifischen Normalisierung des Textes

In diesem Text geht es darum, wie die Regularisierung und die Normalisierung funktionieren.

Teil I: Wie es ist

  1. Wie werden Wörter zurzeit normalisiert?
  2. Was bedeuten die Normalisierungsregeln?
  3. Wo werden die Normalisierungsregeln angewendet?

Teil II: Wie es sein sollte

  1. Überblick über Regularisierung und Normalisierung
  2. Wie soll regularisiert werden?
  3. Wie soll normalisiert werden?
  4. Was ist konkret zu tun?

Kursive Begriffe im Text werden im Glossar erklärt.

Last modified 13 years ago Last modified on Jul 22, 2011, 9:51:43 AM