Changes between Version 1 and Version 2 of normalization/3


Ignore:
Timestamp:
Dec 8, 2010, 5:33:36 PM (13 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • normalization/3

    v1 v2  
    33== 3. Wann wird zurzeit normalisiert? ==
    44
    5 Die Arboreal-Regeln sind gar nicht für die Textanzeige gedacht, werden aber im Backend dafür verwendet. Dieser Irrtum ist wohl durch die verwirrende Nomenklatur entstanden: "orthographic normalization" meint in Arboreal und bei uns verschiedene Dinge. Das ist wohl der Grund für die Normalisierungsprobleme, die in den Tickets [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/32 #32] für Chinesisch und [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/50 #50] für Deutsch beschrieben sind.
     5Die Arboreal-Regeln sind gar nicht für die Textanzeige gedacht, werden aber im Backend dafür verwendet. Dieser Irrtum ist wohl durch die verwirrende Nomenklatur entstanden: "orthographic normalization" meint in Arboreal und bei uns verschiedene Dinge. Das ist wohl der Grund für die Normalisierungsprobleme, die in den Tickets [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/32 #32] für Chinesisch, [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/50 #50] für Deutsch und möglicherweise [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/64 #64] für Griechisch beschrieben sind.
    66
    77In Arboreal geht es bei der orthographischen Normalisierung darum, orthographische Varianten von Wortformen zu standardisieren. Das Ziel ist, eine Wortformenliste anzulegen, in der verschiedenen Schreibweisen zur selben normalisierten Form führen, aber verschiedene Wortformen zu verschiedenen Zeichenfolgen normalisiert werden. Es wird dabei aber keine reale Wortform angestrebt, sondern eine Pseudo-Form wie uolumine, Kaese oder πλῆθοσ.