Changes between Version 9 and Version 10 of donatus-unicode


Ignore:
Timestamp:
Jul 31, 2011, 7:14:14 AM (13 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • donatus-unicode

    v9 v10  
    7676Das ist zwar für die Arbeit mit Arboreal immer noch eher eine Symptombekämpfung als eine echte Lösung, aber dafür ist dieser Service auch unabhängig von Arboreal sinnvoll. Man kann diesen Service noch so erweitern, dass man auf Knopfdruck auch den regularisierten Text bekommen kann, sowie das Ergebnis jedes beliebigen Lex-States für diese Sprache. Die XML-Struktur und die IDs werden dabei beibehalten.
    7777
    78 Dann bleibt noch zu prüfen, ob Arboreal anschließend tatsächlich mit der Donatus-Liste umgehen kann, auch wenn es noch nichts von der neuen <reg>-Struktur weiß. (Muss man zum Beispiel bei <lemma form="alteratio" lang="la"> noch die Wortform <variant form="alṫatiõis"></variant> ergänzen, oder ist das nicht nötig?)
     78Die Versatzstücke für diesen Service existieren bereits im Backend: Worterkennung, Regularisierung, Lex anwenden, zusammenfügen zu einer Textseite.
    7979
    80 Die Versatzstücke für diesen Service existieren bereits im Backend: Worterkennung, Regularisierung, Lex anwenden, zusammenfügen zu einer Textseite.
     80Dann bleibt noch zu prüfen, ob Arboreal anschließend tatsächlich mit der Donatus-Liste umgehen kann, auch wenn es noch nichts von der neuen <reg>-Struktur weiß. (Gibt es überhaupt ein Problem? Wenn ja, kann es gelöst werden, indem man zum Beispiel bei <lemma form="alteratio" lang="la"> noch die Wortform <variant form="alṫatiõis"></variant> ergänzt?)
    8181
    8282Vielleicht sollte DICT dann bei problematischen Wörtern nicht einen leeren String, sondern besser ein Sternchen * zurückliefern, oder das Originalwort in eckigen Klammern, also zum Beipsiel [alṫatiõis]. Das müsste dann aber vom Backend abgefangen werden, so dass es nicht an Donatus geschickt wird. Und zurzeit tilgt DICT Zeilenumbrüche, d.h. aus "di- uerſa" wird nicht "di- versa", sondern "diversa". Aber für eine so entstandene Textversion wäre eine Verschiebung des Zeilenumbruchs hinter das Wort wohl gut genug. Alternative wäre ein neuer State DONATUS, der recht einfach zu erstellen wäre.