Changes between Version 4 and Version 5 of normalization/3
- Timestamp:
- Dec 13, 2010, 1:10:14 PM (13 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
normalization/3
v4 v5 14 14 * πλῆθος wird zu πλῆθοσ 15 15 16 Die Normalisierungsregeln sind also nicht für die Textanzeige gedacht. Stattdessen geht es bei der Normalisierung darum, orthographische Varianten von Wortformen zu standardisieren. Das Ziel ist, eine Wortformenliste anzulegen, in der verschiedenen Schreibweisen zur selben normalisierten Form führen, aber verschiedene Wortformen zu verschiedenen Zeichenfolgen normalisiert werden. Es wird dabei keine reale Wortform angestrebt, sondern eine Pseudo-Form wie uolumine, Kaese oder πλῆθοσ. Es wäre sonst unklar, warum Malcolmdie u/v-Regeln nicht einfach vom Italienischen ins Lateinische übernommen hat.16 Die Normalisierungsregeln sind also nicht für die Textanzeige gedacht. Stattdessen geht es bei der Normalisierung darum, orthographische Varianten von Wortformen zu standardisieren. Das Ziel ist, eine Wortformenliste anzulegen, in der verschiedenen Schreibweisen zur selben normalisierten Form führen, aber verschiedene Wortformen zu verschiedenen Zeichenfolgen normalisiert werden. Es wird dabei keine reale Wortform angestrebt, sondern eine Pseudo-Form wie uolumine, Kaese oder πλῆθοσ. Wären echte Wortformen beabsichtigt, so wäre unklar, warum Malcolm zum Beispiel die u/v-Regeln nicht einfach vom Italienischen ins Lateinische übernommen hat. 17 17 18 Im Backend werden die Normalisierungsregeln aus Arboreal dann für die Textanzeige verwendet. Dieser Irrtum ist wohl durch die verwirrende Nomenklatur entstanden: "orthographic normalization" bedeutet in Arboreal etwas anderes als in unserem Anzeigesystem. Das ist wohl der Grund für die Normalisierungsprobleme, die in den Tickets [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/32 #32] für Chinesisch, [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/50 #50] für Deutsch und möglicherweise [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/64 #64] für Griechisch beschrieben sind.18 Im Backend werden die Normalisierungsregeln aus Arboreal dann für die Textanzeige verwendet. Dieser Irrtum ist wohl durch die verwirrende Nomenklatur entstanden: "orthographic normalization" bedeutet in Arboreal etwas anderes als in unserem Anzeigesystem. Das ist wohl auch der Grund für die Normalisierungsprobleme, die in den Tickets [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/32 #32] für Chinesisch, [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/50 #50] für Deutsch und möglicherweise [https://it-dev.mpiwg-berlin.mpg.de/tracs/mpdl-project-software/ticket/64 #64] für Griechisch beschrieben sind. 19 19 20 20 Wofür werden die Regeln in Arboreal tatsächlich verwendet? Gibt es Dokumentation von Malcolm zu diesem Thema?