wiki:normalization/6

Version 4 (modified by Wolfgang Schmidle, 13 years ago) (diff)

--

Transkription <reg> (im XML) Normalisierung (System) Kommentar
Rohtext nachbearbeitet @faithful @norm Anzeige Donatus/Pollux
Original faithful Regularized Normalized
Latein vnum = 1) unum v wird zwischen Konsonanten zu u
periti{$s}imo peritißimo = peritissimo ß in Latein wird normalisiert
aër = aer aer 2) Trema
verò = vero vero 2) Gravis
re$iduũ reſiduũ reſiduum residuum Tilde
re$idu\~u reſiduũ reſiduum residuum andere Schreibweise im Rohtext
$ph{ae}ræ ſphęræ = sphaerae ę verschwindet erst in der Normalisierung
{quis} u.a. quod = MUFI, offizielles Unicode-Zeichen
idem\'{que} idem́ idemque = MUFI, PUA
ſcīa ſcientia scientia type="wordlist"
<001>dã ꝗdã quidam = MUFI-Zeichen als Teil eines Wortes
Chinesisch 歴 (6B74) = 歷 (6B77) Zeichenvariante in Unicode
中<国V> 中{国V} (中国) 3) 中{⿴口玉} 4) = Zeichenvariante nicht in Unicode
Griechisch {πρ}ός {πρ}ός (πρός) {πρ}ός = einfache Ligatur
ἀλλὰ ... = = ἀλλά ... Gravis wird für Wörterbuch zu Akut
  1. "=" in Regularisierung: es gibt kein <reg>, d.h. Regularized = Original (das gilt auch, wenn es kein @norm gibt); "=" in Normalisierung: die Wortform wird nicht normalisiert
  2. falls möglich, verwende die Diakritika zur Lemma-Disambiguierung
  3. in Original-Spalte in Klammern: neues Original, sobald es <reg> mit faithful-Attribut gibt
  4. automatisiert eventuell eine Zwischenstufe 中<reg faithful="{国}" type="unresolved">国</reg>, damit die Suche nicht bricht; per Hand <reg faithful="中{⿴口玉}">中国</reg> (Wortgrenzen beachten, IDS-Sequenz einfügen)