mpdl-group: software/mpdl-services/mpiwg-mpdl-lt/src/de/mpg/mpiwg/berlin/mpdl/lt/text/tokenize/XmlTokenizerContentHandler.java comparison

little corrections

author	Josef Willenborg <jwillenborg@mpiwg-berlin.mpg.de>
date	Wed, 14 Dec 2011 12:48:43 +0100
parents	4a3641ae14d2
children	e845310098ba

comparison

equal deleted inserted replaced

-:4a3641ae14d2
+:7d6d969b10cf
 import de.mpg.mpiwg.berlin.mpdl.exception.ApplicationException;
 import de.mpg.mpiwg.berlin.mpdl.lt.dict.db.LexHandler;
 import de.mpg.mpiwg.berlin.mpdl.lt.general.Language;
 import de.mpg.mpiwg.berlin.mpdl.lt.morph.app.Form;
 import de.mpg.mpiwg.berlin.mpdl.lt.morph.app.Lemma;
+import de.mpg.mpiwg.berlin.mpdl.lt.text.norm.Normalizer;
 import de.mpg.mpiwg.berlin.mpdl.util.StringUtils;
 public class XmlTokenizerContentHandler implements ContentHandler {
 private static String COMPLEX_ELEMENT_MARK = new Character('\u2425').toString();  // word delimiting element
 private static String COMPLEX_ELEMENT_NWD_MARK = new Character('\u2424').toString();  // not word delimiting element
 wordForm = wordForm.toLowerCase();
 String origWordFormDeresolved = StringUtils.deresolveXmlEntities(origWordForm);
 ArrayList<Lemma> lemmas = null;
 if (withForms() || withLemmas()) {
 LexHandler lexHandler = LexHandler.getInstance();
-lemmas = lexHandler.getLemmas(wordForm, "form", language, "none");
+lemmas = lexHandler.getLemmas(wordForm, "form", language, Normalizer.NONE);
 }
 wordTag = insertWordTags(origWordFormDeresolved, wordForm, language, null, lemmas);
 return wordTag;
 }

Mercurial > hg > mpdl-group