Changes between Version 5 and Version 6 of normalization/6


Ignore:
Timestamp:
Dec 5, 2010, 5:44:33 PM (13 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • normalization/6

    v5 v6  
    55||= '''Latein''' =||||  vnum  ||||  = 1)  ||||  unum  || v wird zwischen Konsonanten zu u ||
    66||= =|| periti{$s}imo || peritißimo ||||  =  ||||  peritissimo  || ß in Latein wird normalisiert ||
    7 ||= =||||  aër  ||||  =  || aer || aer 2) || Trema ||
     7||= =||||  aër  ||||  =  || aer || aer 2) || Trema: "kein Diphthong" ||
    88||= =||||  verò  ||||  =  || vero || vero 2) || Gravis ||
    9 ||= =|| re$iduũ || reſiduũ || || reſiduum ||||  residuum  || Tilde ||
     9||= =|| re$iduũ || reſiduũ || || reſiduum ||||  residuum  || Abkürzungszeichen Tilde ||
    1010||= =|| re$idu\~u || reſiduũ || || reſiduum ||||  residuum  || andere Schreibweise im Rohtext ||
    1111||= =|| $ph{ae}ræ || ſphęræ ||||  =  ||||  sphaerae  || ę verschwindet erst in der Normalisierung ||
    1212||= =|| {quis} || ꝙ || || u.a. quod ||||  =  || MUFI, offizielles Unicode-Zeichen ||
    1313||= =|| idem\'{que} || idem́ || || idemque ||||  =  || MUFI, PUA ||
    14 ||= =|| || ſcīa || || ſcientia ||||  scientia  || type="wordlist" ||
    1514||= =|| <001>dã || ꝗdã || || quidam ||||  =  || MUFI-Zeichen als Teil eines Wortes ||
    16 || ||||  QVIDAM  ||||  =  || QUIDAM || quidam || Großbuchstaben ||
     15||= =|| || ſcīa || || ſcientia ||||  scientia  || Wortliste ||
     16||= =||||  QVIDAM  ||||  =  || QUIDAM || quidam || Großbuchstaben ||
     17||= =||||  tertij  ||||  =  ||||  tertii  || j wird zu i ||
     18||= =|| tert{ij} || tertij ||||  =  ||||  tertii  || einfache Ligatur ||
    1719|||||||||||||||| ||
    1820||= '''Deutsch''' =||||  Wasserstraße  ||||  =  ||||  =  || ß im Deutschen wird nicht normalisiert ||
    19 || ||||  Käse  ||||  =  ||||  =  || Umlaute ||
    20 || ||||  Tee-Ei  ||||  =  ||||  =  || Bindestriche ||
     21||= =||||  Käse  ||||  =  ||||  =  || Umlaute ||
     22||= =||||  Tee-Ei  ||||  =  ||||  =  || Bindestriche ||
    2123|||||||||||||||| ||
    2224||= '''Chinesisch''' =||||  歴 (6B74)  ||||  =  ||||  歷 (6B77)  || Zeichenvariante in Unicode ||
    2325||= =|| 中<国V> || 中{国V} (中国) 3) || 中{⿴口玉} 4) || ||||  =  || Zeichenvariante nicht in Unicode ||
    2426|||||||||||||||| ||
    25 ||= '''Griechisch''' =|| {πρ}ός || {πρ}ός (πρός) || {πρ}ός || ||||  =  || einfache Ligatur ||
    26 ||= =||||  ἀλλὰ ...  ||||  =  ||  =  || ἀλλά ... || Gravis wird für Wörterbuch zu Akut ||
    27 || |||| |||| |||| || ||
     27||= '''Griechisch''' =||||  ἀλλὰ ...  ||||  =  ||  =  || ἀλλά ... || Gravis wird für Wörterbuch zu Akut ||
     28||= =||||  βασιλεύς  ||||  =  ||||  =  || ϐασιλεύς: letter variation ||
     29||= =|| {πρ}ός || {πρ}ός (πρός) || {πρ}ός || ||||  =  || einfache Ligatur ||
     30||= =|| {μετὰ} || {μετὰ} (μετὰ) || {μετὰ} || || μετά̀ ||  =  || schwierige Ligatur ||
     31||= =|||| |||| |||| || ||
    2832
    2933 1. "=" in Regularisierung: es gibt kein <reg>, d.h. Regularized = Original (das gilt auch, wenn es kein @norm gibt); "=" in Normalisierung: die Wortform wird nicht normalisiert