Mercurial > hg > mpdl-group
diff software/eXist/mpdl-modules/src/de/mpg/mpiwg/berlin/mpdl/lt/analyzer/lang/MpdlNormalizerLexZH.lex @ 14:5df60f24e997
diverse Fehlerbehebungen
author | Josef Willenborg <jwillenborg@mpiwg-berlin.mpg.de> |
---|---|
date | Mon, 29 Aug 2011 17:40:02 +0200 |
parents | 1ec29fdd0db8 |
children |
line wrap: on
line diff
--- a/software/eXist/mpdl-modules/src/de/mpg/mpiwg/berlin/mpdl/lt/analyzer/lang/MpdlNormalizerLexZH.lex Tue Apr 19 16:51:59 2011 +0200 +++ b/software/eXist/mpdl-modules/src/de/mpg/mpiwg/berlin/mpdl/lt/analyzer/lang/MpdlNormalizerLexZH.lex Mon Aug 29 17:40:02 2011 +0200 @@ -3,8 +3,7 @@ * [this is a JFlex specification] * * Wolfgang Schmidle - * version 0.96 - * 2011-02-21 + * version 2011-02-28 * */ @@ -107,13 +106,15 @@ /* Annahmen: -- die Routine wird wortweise aufgerufen, mit einem \n am Ende des Strings -- Wörter mit Zeilenumbrüchen wurden bereits wieder zusammengesetzt +- die Routine wird zeichenweise (oder mit mehr als einem Zeichen) aufgerufen, mit einem \n am Ende des Strings +- es gibt keine Zeilenumbrüche TO DO: ZH: Liste ergänzen ZH: was ist, wenn man wirklich die Variante, die im Text steht, nachschlagen will? Dann muss man das Zeichen wohl selbst rauskopieren. ZH: sollen lateinische Buchstaben bewirken, dass problem = 1 ist? +ZH: sollen Zeilenumbrüche rausgenommen werden, auch wenn sie in korrekt markiertem Text nicht vorkommen? +ZH: was ist, wenn beijing übergeben wird und einen Zeilenumbruch enthält? Verlässt sich der Wrapper darauf, dass die Zeichenzahl gleich bleibt, oder macht er ein hyphen rein? was macht <place> oder <reg>? */