Changes between Version 3 and Version 4 of normalization/4


Ignore:
Timestamp:
Dec 12, 2010, 1:36:41 PM (13 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • normalization/4

    v3 v4  
    1 === Überblick ===
     1=== 4. Überblick über Regularisierung und Normalisierung ===
    22
    33Die folgende Tabelle zeigt einige Wörter vom Rohtext über das XML bis zum Anzeigesystem.
     
    5555
    5656 1. "=" in Regularisierung: es gibt kein <reg>, d.h. Regularized = Original (das gilt auch, wenn es kein @norm gibt); "=" in Normalisierung: die Wortform wird nicht normalisiert
    57  1. falls möglich, verwende die Diakritika zur Disambiguierung
    58  1. in Original-Spalte in Klammern: neues Original, sobald es <reg> mit faithful-Attribut gibt
    59  1. automatisiert eventuell eine Zwischenstufe 中<reg faithful="{国}" type="unresolved">国</reg>, damit die Suche nicht bricht; per Hand <reg faithful="中{⿴口或}">中国</reg> (Wortgrenzen beachten, IDS-Sequenz einfügen)
    60  1. Semantisches {quis} wird in den DESpecs noch auf optisch umgestellt, eventuell auf den etwas länglichen MUFI-Namen {qslstrok}; {que} mit Makron kann zum Beispiel im Alvarus auch quam bedueten, also zu {q3app} oder kürzer {q3}?
    61  1. Es ist wohl auch im Original-Textmodus nicht sinnvoll, die Zeichenvariante an das Wörterbuch zu senden.
    62  1. Um die PUA zu vermeiden, könnte man statt <reg norm="idemque">idem́</reg> auch <reg faithful="idem́" norm="idemque">idemq́ꝫ</reg> schreiben, siehe [wiki:regularization#DiePrivateUseArea hier].
    63  1. Beachte die Klammern in der Original-Spalte. Zur Erläuterung siehe [wiki:regularization#Latein hier].
    64  1. Siehe die Diskussion [wiki:normalization/4#Latein hier].
    65  1. Das Symbol wird von uns nicht optisch, sondern semantisch beschrieben: "Earth". Offenbar gibt es zwei verschiedene übliche Formen. Wie es dargestellt wird, hängt vom jeweiligen Font ab.
    66  1. Celex möchte offenbar ae statt ä haben.
     57 2. falls möglich, verwende die Diakritika zur Disambiguierung
     58 3. in Original-Spalte in Klammern: neues Original, sobald es <reg> mit faithful-Attribut gibt
     59 4. automatisiert eventuell eine Zwischenstufe 中<reg faithful="{国}" type="unresolved">国</reg>, damit die Suche nicht bricht; per Hand <reg faithful="中{⿴口或}">中国</reg> (Wortgrenzen beachten, IDS-Sequenz einfügen)
     60 5. Semantisches {quis} wird in den DESpecs noch auf optisch umgestellt, eventuell auf den etwas länglichen MUFI-Namen {qslstrok}; {que} mit Makron kann zum Beispiel im Alvarus auch quam bedueten, also zu {q3app} oder kürzer {q3}?
     61 6. Es ist wohl auch im Original-Textmodus nicht sinnvoll, die Zeichenvariante an das Wörterbuch zu senden.
     62 7. Um die PUA zu vermeiden, könnte man statt <reg norm="idemque">idem́</reg> auch <reg faithful="idem́" norm="idemque">idemq́ꝫ</reg> schreiben, siehe [wiki:normalization/5#DiePrivateUseArea hier].
     63 8. Beachte die Klammern in der Original-Spalte. Zur Erläuterung siehe [wiki:normalization/5#Latein hier].
     64 9. Siehe die Diskussion [wiki:normalization/6#Latein hier].
     65 10. Das Symbol wird von uns nicht optisch, sondern semantisch beschrieben: "Earth". Offenbar gibt es zwei verschiedene übliche Formen. Wie es dargestellt wird, hängt vom jeweiligen Font ab.
     66 11. Celex möchte offenbar ae statt ä haben.
    6767
    6868Hinweis: Die Tabelle kann am besten mit Safari in der Ausrichtung "landscape" mit zwei Seiten auf einem Blatt und ohne Kopf- und Fußzeilen ausgedruckt werden; siehe [attachment:normalization-overview.pdf diese PDF-Datei].