Changes between Version 23 and Version 24 of normalization/7


Ignore:
Timestamp:
Jan 10, 2011, 2:46:51 PM (13 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • normalization/7

    v23 v24  
    134134 * verwende hîc zur Disambiguierung (Adverb "hier" statt Demonstrativpronomen "dieser")
    135135
     136=== Kurzfristige Umsetzung der Regeln für Latein ===
     137
     138Die neuen Regeln ersetzen die jetzigen Regeln. Was hier nicht explizit angegeben ist, wird nicht normalisiert.
     139
     140Die Regeln sollten mittelfristig in Lex formuliert werden, und die Normalisierungsmodule sollen die oben beschriebene Architektur haben.
     141
     142Kurzfristig kann man die Regeln größtenteils aus dem Arboreal-Quellcode übernehmen:
     143  * Die einfachen Ersetzungsregeln können direkt aus dem Lateinischen übernommen werden: ſ ß æ ę Æ œ.
     144   * Beachte bei Æ, dass es zu AE und nicht wie in Arboreal zu Ae wird.
     145  * die Regel für ij kann aus dem Italienischen übernommen werden.
     146  * Die u/v-Regeln für Kleinbuchstaben können aus dem Italienischen übernommen werden.
     147   * Anpassungen beim Umgang mit Zeilenumbrüchen: entferne für die Normalisierung den Zeilenumbruch, arbeite also zum Beispiel mit ſphærę statt mit ſphæ-<lb/>rę. Beachte <pb> und <anchor>.
     148   * Der [wiki:normalization/1#Italienisch hier] beschriebene Fehler im Arboreal-Programmcode muss korrigiert werden, wenn er sich durch den anderen Umgang mit Zeilenumbrüchen nicht sowieso erledigt hat.
     149   * Die Regel für qv muss neu implementiert werden, als Vorbild kann man die ij-Regel verwenden.
     150   * Die u/v-Regeln müssen dann noch für die Großbuchstaben U/V wiederholt werden.
     151   * Die Vokalklasse muss umdefiniert werden: A E I O U Æ in groß/klein sowie œ ę à è ò ù
     152  * Die Diakritika-Regeln müssen neu implementiert werden.
     153   * -à -è -ò: Vokal gefolgt von Wortende --> Gravis fällt weg
     154   * -àm -ùm: Vokal gefolgt von "m" und dann Wortende --> Gravis fällt weg
     155  * einzelne Wörter: Explizite Regeln für aliàs, hîc, quòd, Quòd, QVòd, Cùmque, aër. Die Regeln für die einzelnen Wörter sollten (zumindest in der Lex-Version) vor allen anderen Regeln abgearbeitet werden. Einzelwörter mit Regeln wie in der Arboreal-Java-Klasse zu beschreiben ist nicht schwierig, aber sehr umständlich. Kurzfristig könnte man das deshalb teilweise durch folgende Regeln ersetzen:
     156   * aliàs durch -às (am Wortende)
     157   * quòd, Quòd, QVòd durch -òd (am Wortende)
     158   * aër durch eine Regel: aë wird zu ae
     159   * hîc und Cùmque bleiben
     160  * Die Disambiguierung von hîc kann man in der kurzfristigen Version weglassen.
     161
    136162=== Italienisch ===
    137163