Changes between Version 5 and Version 6 of normalization/6
- Timestamp:
- Dec 5, 2010, 5:44:33 PM (13 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
normalization/6
v5 v6 5 5 ||= '''Latein''' =|||| vnum |||| = 1) |||| unum || v wird zwischen Konsonanten zu u || 6 6 ||= =|| periti{$s}imo || peritißimo |||| = |||| peritissimo || ß in Latein wird normalisiert || 7 ||= =|||| aër |||| = || aer || aer 2) || Trema ||7 ||= =|||| aër |||| = || aer || aer 2) || Trema: "kein Diphthong" || 8 8 ||= =|||| verò |||| = || vero || vero 2) || Gravis || 9 ||= =|| re$iduũ || reſiduũ || || reſiduum |||| residuum || Tilde ||9 ||= =|| re$iduũ || reſiduũ || || reſiduum |||| residuum || Abkürzungszeichen Tilde || 10 10 ||= =|| re$idu\~u || reſiduũ || || reſiduum |||| residuum || andere Schreibweise im Rohtext || 11 11 ||= =|| $ph{ae}ræ || ſphęræ |||| = |||| sphaerae || ę verschwindet erst in der Normalisierung || 12 12 ||= =|| {quis} || ꝙ || || u.a. quod |||| = || MUFI, offizielles Unicode-Zeichen || 13 13 ||= =|| idem\'{que} || ideḿ || || idemque |||| = || MUFI, PUA || 14 ||= =|| || ſcīa || || ſcientia |||| scientia || type="wordlist" ||15 14 ||= =|| <001>dã || ꝗdã || || quidam |||| = || MUFI-Zeichen als Teil eines Wortes || 16 || |||| QVIDAM |||| = || QUIDAM || quidam || Großbuchstaben || 15 ||= =|| || ſcīa || || ſcientia |||| scientia || Wortliste || 16 ||= =|||| QVIDAM |||| = || QUIDAM || quidam || Großbuchstaben || 17 ||= =|||| tertij |||| = |||| tertii || j wird zu i || 18 ||= =|| tert{ij} || tertij |||| = |||| tertii || einfache Ligatur || 17 19 |||||||||||||||| || 18 20 ||= '''Deutsch''' =|||| Wasserstraße |||| = |||| = || ß im Deutschen wird nicht normalisiert || 19 || 20 || 21 ||= =|||| Käse |||| = |||| = || Umlaute || 22 ||= =|||| Tee-Ei |||| = |||| = || Bindestriche || 21 23 |||||||||||||||| || 22 24 ||= '''Chinesisch''' =|||| 歴 (6B74) |||| = |||| 歷 (6B77) || Zeichenvariante in Unicode || 23 25 ||= =|| 中<国V> || 中{国V} (中国) 3) || 中{⿴口玉} 4) || |||| = || Zeichenvariante nicht in Unicode || 24 26 |||||||||||||||| || 25 ||= '''Griechisch''' =|| {πρ}ός || {πρ}ός (πρός) || {πρ}ός || |||| = || einfache Ligatur || 26 ||= =|||| ἀλλὰ ... |||| = || = || ἀλλά ... || Gravis wird für Wörterbuch zu Akut || 27 || |||| |||| |||| || || 27 ||= '''Griechisch''' =|||| ἀλλὰ ... |||| = || = || ἀλλά ... || Gravis wird für Wörterbuch zu Akut || 28 ||= =|||| βασιλεύς |||| = |||| = || ϐασιλεύς: letter variation || 29 ||= =|| {πρ}ός || {πρ}ός (πρός) || {πρ}ός || |||| = || einfache Ligatur || 30 ||= =|| {μετὰ} || {μετὰ} (μετὰ) || {μετὰ} || || μετά̀ || = || schwierige Ligatur || 31 ||= =|||| |||| |||| || || 28 32 29 33 1. "=" in Regularisierung: es gibt kein <reg>, d.h. Regularized = Original (das gilt auch, wenn es kein @norm gibt); "=" in Normalisierung: die Wortform wird nicht normalisiert