Changes between Version 4 and Version 5 of normalization/2


Ignore:
Timestamp:
Dec 12, 2010, 10:28:15 AM (13 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • normalization/2

    v4 v5  
    1919Eine Regel wie "Æ wird zu Ae" ist hier konsequent, weil alle Buchstaben bis auf den ersten schon in Kleinbuchstaben umgewandelt wurden. Also: ÆQVALIS wird zu Aequalis. Ohne die Umwandlung in Kleinbuchstaben ergibt die Regel für Æ keinen Sinn.
    2020
    21 Warum werden in Latein (und nur dort) die angle brackets〈 (2329) 〉(232A) aus dem Block "Technische Symbole" (nicht zu verwechseln mit z.B. full-width less/greater than < (FF1E) > (FF1C)) entfernt? Wo kommen die überhaupt vor? War es ein Hack für einen einzelnen Text?
     21Warum werden in Latein (und nur dort) die angle brackets〈 (2329) 〉(232A) aus dem Block "Technische Symbole" (nicht zu verwechseln mit z.B. full-width less/greater than < (FF1E) > (FF1C)) entfernt? Wo kommen die überhaupt vor? War es ein Hack für einen einzelnen Text? Solange nicht klar ist, warum Malcolm sie normalisiert hat, werden sie bei uns nicht normalisiert.
     22
     23Was bedeutet ç im Lateinischen? Muss es regularisiert werden, oder kann es normalisiert werden?
    2224
    2325=== Italienisch ===
     
    3739=== Chinesisch ===
    3840
    39 Die Normalisierung des fullwidth space, der Aufzählungskommas und des Punkts scheint ein Hack für die Wortlistenerstellung in Arboreal zu sein.
     41Die Normalisierung des fullwidth space, der Aufzählungskommas und des chinesischen Punkts scheint ein Hack für die Wortlistenerstellung in Arboreal zu sein.
    4042
    4143Was ist der Sinn, die hochgestellten Zahlen 1 bis 5 zu normalisieren? War es ein Hack für einen einzelnen Text? Hat das einen Einfluss auf die Wortende-Markierung?
     44
     45Die Regeln für fullwidth space, Satzzeichen und hochgestellte 1 bis 5 werden von uns nicht übernommen.
    4246 
    4347=== Griechisch ===