Changes between Version 6 and Version 7 of normalization/1
- Timestamp:
- Dec 13, 2010, 12:59:31 PM (14 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
normalization/1
v6 v7 17 17 ";" wird getilgt, wenn das Zeichen direkt davor kein Buchstabe ("Character.isLetter") ist. 18 18 19 || -- || combining ò (0300) combining ó (0301) combining ô (0302) soft hyphen (00AD) || 19 || -- || soft hyphen (00AD) || 20 || Ae || Æ (00C6) Ę (0118) || 21 || Oe || Œ (0152) || 22 || ae || æ (00E6) ę (0119) || 23 || oe || œ (0153) || 24 || s || ſ (017F) || 25 || ss || ß (00DF) || 26 || -- || 〈 (2329) 〉 (232A) || 27 28 ersatzlos entfernte Diakritika: 29 30 || -- || combining ò (0300) combining ó (0301) combining ô (0302) || 20 31 || A || À (00C0) Á (00C1)  (00C2) Ä (00C4) Ā (0100) Ă (0102) || 21 || Ae || Æ (00C6) Ę (0118) ||22 || C || Ç (00C7) ||23 32 || E || È (00C8) É (00C9) Ê (00CA) Ë (00CB) Ē (0112) Ĕ (0114) || 24 33 || I || Ì (00CC) Í (00CD) Î (00CE) Ï (00CF) Ī (012A) Ĭ (012C) || 25 34 || O || Ò (00D2) Ó (00D3) Ô (00D4) Ö (00D6) Ō (014C) Ŏ (014E) || 26 || Oe || Œ (0152) ||27 35 || U || Ù (00D9) Ú (00DA) Û (00DB) Ü (00DC) Ū (016A) Ŭ (016C) || 28 36 || a || à (00E0) á (00E1) â (00E2) ä (00E4) ā (0101) ă (0103) || 29 || ae || æ (00E6) ę (0119) ||30 || c || ç (00E7) ||31 37 || e || è (00E8) é (00E9) ê (00EA) ë (00EB) ē (0113) ĕ (0115) || 32 38 || i || ì (00EC) í (00ED) î (00EE) ï (00EF) ī (012B) ĭ (012D) || 33 39 || o || ò (00F2) ó (00F3) ô (00F4) ö (00F6) ō (014D) ŏ (014F) || 34 || oe || œ (0153) ||35 || s || ſ (017F) ||36 || ss || ß (00DF) ||37 40 || u || ù (00F9) ú (00FA) û (00FB) ü (00FC) ū (016B) ŭ (016D) || 38 || -- || 〈 (2329) 〉 (232A) || 41 || C || Ç (00C7) || 42 || c || ç (00E7) || 39 43 40 44 Das Zirkumflex (z.B. û 00FB, ê 00EA) wird normalisiert, aber nicht die Tilde (z.B. ũ 0169, ẽ 1EBD).