| 1 | |
| 2 | |
| 3 | Unicode Han Database: |
| 4 | [http://www.unicode.org/charts/unihan.html web-Version], |
| 5 | [http://www.unicode.org/Public/UNIDATA/Unihan.zip Text-Version] |
| 6 | |
| 7 | [http://www.unicode.org/reports/tr38/ Unicode Standard Annex #38] (insbesondere [http://www.unicode.org/reports/tr38/#N10211 3.7 Variants]) |
| 8 | |
| 9 | Drei Achsen: |
| 10 | * x-Varianten: Bedeutung: Zeichen mit unterschiedlicher Bedeutung können keine Varianten voneinander sein. |
| 11 | * y-Varianten: abstrakte Form |
| 12 | * kSimplifiedVariant / kTraditionalVariant |
| 13 | * kSemanticVariant, kSpecializedSemanticVariant |
| 14 | * z-Varianten: rein stilistische Varianten, sollten idealerweise gar nicht mehr als einen Codepoint haben |
| 15 | * kZVariant |
| 16 | |
| 17 | Mehrere Langzeichen können auf dasselbe Kurzzeichen abgebildet werden. |
| 18 | |
| 20 | |
| 21 | Standardzeichen U+6B77, Variante U+6B74: Die Variante hat einen niedrigeren Codepoint als das Standardzeichen. |
| 22 | |
| 23 | Wenn ich es recht verstehe: |
| 24 | * Die semantischen Varianten 66C6 und 6B77 sind beide OK als Langzeichen, aber werden beide mit dem gleichen Kurzzeichen wiedergegeben. Wenn man daraus wieder ein Langzeichen macht, dann 6B77. |
| 25 | * Die Verbindung von 5386 zu 53B2 wird nur in Fenn gemacht, nicht in Lau, Matthews, !MeyerWempe. |
| 26 | |
| 27 | Trotzdem kommt mir die Verbindung der Zeichen inkonsequent vor. |