Changes between Version 2 and Version 3 of normalization/6


Ignore:
Timestamp:
Dec 5, 2010, 1:12:02 PM (13 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • normalization/6

    v2 v3  
    1 || ||||  Transkription  ||||  Regularisierung  ||||  Normalisierung  ||
    2 || ||  Rohtext  ||  nachbearbeitet  ||  faithful  ||  norm  ||  Anzeige  ||  !Donatus/Pollux  ||
    3 ||= =||= =||= '''Original''' =||= '''faithful''' =||= '''Regularized''' =||= '''Normalized''' =||= =||
    4 ||= '''Latein''' =||||  vnum  |||| ||||  unum  ||
    5 ||= =|| periti{$s}imo || peritißimo |||| ||||  peritissimo  ||
    6 ||= =||||  aër  |||| || aer || aer 1) ||
    7 ||= =||||  verò  |||| || vero || vero 1) ||
    8 ||= =|| re$iduũ || reſiduũ || || reſiduum ||||  residuum  ||
    9 ||= =|| re$idu\~u || reſiduũ || || reſiduum ||||  residuum  ||
    10 ||= =|| $ph{ae}ræ || ſphęræ |||| ||||  sphaerae  ||
    11 ||= =|| idem\'{que} || idem́ || || idemque |||| ||
    12 ||= =|| || ſcīa || || ſcientia ||||  scientia  ||
    13 ||= =|| <001> || ꝙ || || quod |||| ||
    14 ||= =|| || ꝗdã || || quidam |||| ||
    15 ||= '''Chinesisch''' =||||  歴 (6B74)  |||| ||||  歷 (6B77)  ||
    16 ||= =|| 中<国V> || 中{国V} (中国) || 中{⿴口玉} 2) || |||| ||
    17 ||= '''Griechisch''' =|| {πρ}ός || {πρ}ός (πρός) || {πρ}ός || |||| ||
    18 ||= =||||  ἀλλὰ ...  || || || || ἀλλά ... ||
     1|| ||||  Transkription  ||||  <reg> (im XML)  ||||  Normalisierung (System)  || ||
     2|| ||  Rohtext  ||  nachbearbeitet  ||  @faithful  ||  @norm  ||  Anzeige  ||  !Donatus/Pollux  || ||
     3||= =||= =||= '''Original''' =||= '''faithful''' =||= '''Regularized''' =||= '''Normalized''' =||= =|| ||
     4|||||||||||||||| ||
     5||= '''Latein''' =||||  vnum  ||||  = 1)  ||||  unum  || v wird zwischen Konsonanten zu u ||
     6||= =|| periti{$s}imo || peritißimo ||||  =  ||||  peritissimo  || ß in Latein ||
     7||= =||||  aër  ||||  =  || aer || aer 2) || Trema ||
     8||= =||||  verò  ||||  =  || vero || vero 2) || Gravis ||
     9||= =|| re$iduũ || reſiduũ || || reſiduum ||||  residuum  || Tilde ||
     10||= =|| re$idu\~u || reſiduũ || || reſiduum ||||  residuum  || andere Schreibweise im Rohtext ||
     11||= =|| $ph{ae}ræ || ſphęræ ||||  =  ||||  sphaerae  || ę verschwindet erst in der Normalisierung ||
     12||= =|| {quis} || ꝙ || || quod ||||  =  || MUFI, offizielles Unicode-Zeichen ||
     13||= =|| idem\'{que} || idem́ || || idemque ||||  =  || MUFI, PUA ||
     14||= =|| || ſcīa || || ſcientia ||||  scientia  || type="wordlist" ||
     15||= =|| <001>dã || ꝗdã || || quidam ||||  =  || MUFI-Zeichen als Teil eines Wortes ||
     16|||||||||||||||| ||
     17||= '''Chinesisch''' =||||  歴 (6B74)  ||||  =  ||||  歷 (6B77)  || Zeichenvariante in Unicode ||
     18||= =|| 中<国V> || 中{国V} (中国) 3) || 中{⿴口玉} 4) || ||||  =  || Zeichenvariante nicht in Unicode ||
     19|||||||||||||||| ||
     20||= '''Griechisch''' =|| {πρ}ός || {πρ}ός (πρός) || {πρ}ός || ||||  =  || einfache Ligatur ||
     21||= =||||  ἀλλὰ ...  ||||  =  ||  =  || ἀλλά ... || Gravis für Wörterbuch zu Akut ||
    1922
    20 in Original-Spalte in Klammern: neues Original, sobald es <reg> mit faithful-Attribut gibt
    21 
    22  1. verwende die Diakritika zur Lemma-Disambiguierung
    23  1. automatisiert eventuell eine Zwischenstufe 中<reg faithful="{国}" type="unresolved">国</reg>, per Hand <reg faithful="中{⿴口玉}">中国</reg> (Wortgrenzen beachten, IDS-Sequenz einfügen)
     23 1. "=" in Regularisierung: es gibt kein <reg>, d.h. Regularized = Original (das gilt auch, wenn es kein @norm gibt); "=" in Normalisierung: die Wortform wird nicht normalisiert
     24 1. falls möglich, verwende die Diakritika zur Lemma-Disambiguierung
     25 1. in Original-Spalte in Klammern: neues Original, sobald es <reg> mit faithful-Attribut gibt
     26 1. automatisiert eventuell eine Zwischenstufe 中<reg faithful="{国}" type="unresolved">国</reg>, damit die Suche nicht bricht; per Hand <reg faithful="中{⿴口玉}">中国</reg> (Wortgrenzen beachten, IDS-Sequenz einfügen)