Changes between Version 3 and Version 4 of unihan


Ignore:
Timestamp:
Aug 16, 2010, 11:20:58 AM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • unihan

    v3 v4  
     1
     2
     3Unicode Han Database:
     4[http://www.unicode.org/charts/unihan.html web-Version],
     5[http://www.unicode.org/Public/UNIDATA/Unihan.zip Text-Version]
     6
     7[http://www.unicode.org/reports/tr38/ Unicode Standard Annex #38] (insbesondere [http://www.unicode.org/reports/tr38/#N10211 3.7 Variants])
     8
     9Drei Achsen:
     10  * x-Varianten: Bedeutung: Zeichen mit unterschiedlicher Bedeutung können keine Varianten voneinander sein.
     11  * y-Varianten: abstrakte Form
     12    * kSimplifiedVariant / kTraditionalVariant
     13    * kSemanticVariant, kSpecializedSemanticVariant
     14  * z-Varianten: rein stilistische Varianten, sollten idealerweise gar nicht mehr als einen Codepoint haben
     15    * kZVariant
     16
     17Mehrere Langzeichen können auf dasselbe Kurzzeichen abgebildet werden.
     18
    119== Beispiel ==
     20
     21Standardzeichen U+6B77, Variante U+6B74: Die Variante hat einen niedrigeren Codepoint als das Standardzeichen.
     22
     23Wenn ich es recht verstehe:
     24  * Die semantischen Varianten 66C6 und 6B77 sind beide OK als Langzeichen, aber werden beide mit dem gleichen Kurzzeichen wiedergegeben. Wenn man daraus wieder ein Langzeichen macht, dann 6B77.
     25  * Die Verbindung von 5386 zu 53B2 wird nur in Fenn gemacht, nicht in Lau, Matthews, !MeyerWempe.
     26
     27Trotzdem kommt mir die Verbindung der Zeichen inkonsequent vor.
    228
    329|| || [http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=5386&useutf8=true 5386] || [http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=5389&useutf8=true 5389] || [http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=53A4&useutf8=true 53A4] || [http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=53B2&useutf8=true 53B2] || [http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=66C6&useutf8=true 66C6] || [http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6B74&useutf8=true 6B74] || [http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=6B77&useutf8=true 6B77] ||
     
    1743  1. calendar, era
    1844  1. take place, past, history
     45
     46Zeichentabelle für 5386: 66C6 6B74 6B77, aber auch 53AF 66A6 (und F98B F98C)  --> wo kommt das her?
     47