diff software/mpdl-services/mpiwg-mpdl-lt/src/de/mpg/mpiwg/berlin/mpdl/lt/text/norm/lang/MpdlNormalizerLexIT.java @ 23:e845310098ba

diverse Korrekturen
author Josef Willenborg <jwillenborg@mpiwg-berlin.mpg.de>
date Tue, 27 Nov 2012 12:35:19 +0100
parents 4a3641ae14d2
children
line wrap: on
line diff
--- a/software/mpdl-services/mpiwg-mpdl-lt/src/de/mpg/mpiwg/berlin/mpdl/lt/text/norm/lang/MpdlNormalizerLexIT.java	Wed Dec 14 13:57:09 2011 +0100
+++ b/software/mpdl-services/mpiwg-mpdl-lt/src/de/mpg/mpiwg/berlin/mpdl/lt/text/norm/lang/MpdlNormalizerLexIT.java	Tue Nov 27 12:35:19 2012 +0100
@@ -1,4 +1,4 @@
-/* The following code was generated by JFlex 1.4.3 on 21.07.11 11:22 */
+/* The following code was generated by JFlex 1.4.3 on 28.03.12 18:57 */
 
 /*
  * Normalization rules for Italian text
@@ -15,8 +15,8 @@
 /**
  * This class is a scanner generated by 
  * <a href="http://www.jflex.de/">JFlex</a> 1.4.3
- * on 21.07.11 11:22 from the specification file
- * <tt>MpdlNormalizerLexIT.lex</tt>
+ * on 28.03.12 18:57 from the specification file
+ * <tt>/Users/jwillenborg/test/jflexNew/MpdlNormalizerLexIT.lex</tt>
  */
 public class MpdlNormalizerLexIT {
 
@@ -46,15 +46,16 @@
    * Translates characters to character classes
    */
   private static final String ZZ_CMAP_PACKED = 
-    "\12\0\1\6\25\0\1\5\14\0\1\4\22\0\1\52\1\1\3\2"+
-    "\1\1\3\2\1\41\1\0\1\2\1\3\2\2\1\42\1\2\1\50"+
-    "\1\3\1\2\1\40\1\45\1\51\2\2\1\0\1\2\6\0\1\44"+
-    "\3\2\1\12\2\2\1\43\1\7\1\36\1\2\1\3\1\2\1\10"+
-    "\1\37\1\14\1\46\1\13\1\2\1\11\1\16\1\47\2\2\1\0"+
-    "\1\2\62\0\1\4\22\0\1\17\5\0\1\33\1\0\1\20\3\0"+
-    "\1\21\5\0\1\22\6\0\1\23\5\0\1\31\1\24\5\0\1\32"+
-    "\1\0\1\25\3\0\1\26\5\0\1\27\6\0\1\30\37\0\1\1"+
-    "\70\0\1\35\1\34\53\0\1\15\ufe80\0";
+    "\12\0\1\6\25\0\1\5\14\0\1\22\1\0\1\21\14\0\1\17"+
+    "\1\0\1\20\1\0\1\56\1\1\3\2\1\1\3\2\1\45\1\0"+
+    "\1\2\1\3\2\2\1\46\1\2\1\54\1\3\1\2\1\44\1\51"+
+    "\1\55\2\2\1\0\1\2\6\0\1\50\3\2\1\12\2\2\1\47"+
+    "\1\7\1\42\1\2\1\3\1\2\1\10\1\43\1\14\1\52\1\13"+
+    "\1\2\1\11\1\16\1\53\2\2\1\0\1\2\62\0\1\4\22\0"+
+    "\1\23\5\0\1\37\1\0\1\24\3\0\1\25\5\0\1\26\6\0"+
+    "\1\27\5\0\1\35\1\30\5\0\1\36\1\0\1\31\3\0\1\32"+
+    "\5\0\1\33\6\0\1\34\37\0\1\1\70\0\1\41\1\40\53\0"+
+    "\1\15\ufe80\0";
 
   /** 
    * Translates characters to character classes
@@ -67,17 +68,18 @@
   private static final int [] ZZ_ACTION = zzUnpackAction();
 
   private static final String ZZ_ACTION_PACKED_0 =
-    "\11\0\1\1\1\2\2\3\1\1\1\4\1\2\1\3"+
-    "\1\5\1\2\1\6\1\7\1\10\1\11\1\12\5\3"+
-    "\1\13\1\2\1\3\1\5\1\2\1\14\1\15\1\16"+
-    "\1\17\1\20\1\21\1\22\1\23\1\24\1\25\1\26"+
-    "\1\27\1\30\4\0\1\31\1\32\1\33\1\0\1\34"+
-    "\1\0\1\35\1\36\1\0\1\37\1\40\1\41\4\0"+
-    "\1\42\6\0\1\43\1\44\4\0\1\45\1\0\1\46"+
-    "\10\0\1\47\4\0\1\45\2\0\1\50";
+    "\13\0\1\1\1\2\2\3\1\1\1\4\1\2\1\3"+
+    "\1\5\1\2\2\1\1\6\1\7\1\10\1\11\1\12"+
+    "\5\3\1\13\1\2\1\3\1\5\1\2\1\14\1\15"+
+    "\1\16\1\17\1\20\1\21\1\22\1\23\1\24\1\25"+
+    "\1\26\1\27\1\30\5\0\1\31\1\32\1\33\1\0"+
+    "\1\34\1\0\1\35\1\36\1\0\1\37\1\40\1\41"+
+    "\4\0\1\42\10\0\1\43\1\44\4\0\1\45\1\0"+
+    "\1\46\6\0\1\32\3\0\1\47\5\0\1\45\3\0"+
+    "\1\50";
 
   private static int [] zzUnpackAction() {
-    int [] result = new int[100];
+    int [] result = new int[111];
     int offset = 0;
     offset = zzUnpackAction(ZZ_ACTION_PACKED_0, offset, result);
     return result;
@@ -102,22 +104,23 @@
   private static final int [] ZZ_ROWMAP = zzUnpackRowMap();
 
   private static final String ZZ_ROWMAP_PACKED_0 =
-    "\0\0\0\53\0\126\0\201\0\254\0\327\0\u0102\0\u012d"+
-    "\0\u0158\0\0\0\0\0\0\0\u0183\0\u01ae\0\0\0\u01d9"+
-    "\0\u0204\0\0\0\u022f\0\0\0\0\0\0\0\0\0\0"+
-    "\0\u025a\0\u0285\0\u02b0\0\u02db\0\u0306\0\0\0\u0331\0\u035c"+
-    "\0\u0387\0\u03b2\0\u03dd\0\0\0\0\0\0\0\0\0\0"+
-    "\0\0\0\0\0\0\0\0\0\0\0\0\0\0\0\u0408"+
-    "\0\u0433\0\u045e\0\u0489\0\0\0\0\0\0\0\u04b4\0\0"+
-    "\0\u04df\0\0\0\0\0\u050a\0\0\0\0\0\0\0\u0535"+
-    "\0\u0560\0\u058b\0\u05b6\0\0\0\u05e1\0\u060c\0\u0637\0\u0662"+
-    "\0\u068d\0\0\0\0\0\0\0\u06b8\0\u06e3\0\u070e\0\u035c"+
-    "\0\u0739\0\u0764\0\0\0\u078f\0\u07ba\0\u07e5\0\0\0\u0810"+
-    "\0\u083b\0\u0866\0\u0891\0\0\0\u08bc\0\u08e7\0\u0912\0\u093d"+
-    "\0\0\0\u0968\0\u0993\0\0";
+    "\0\0\0\57\0\136\0\215\0\274\0\353\0\u011a\0\u0149"+
+    "\0\u0178\0\u01a7\0\u01d6\0\u0205\0\u0205\0\u0205\0\u0234\0\u0263"+
+    "\0\u0205\0\u0292\0\u02c1\0\u0205\0\u02f0\0\u01a7\0\u031f\0\u0205"+
+    "\0\u0205\0\u0205\0\u0205\0\u0205\0\u034e\0\u037d\0\u03ac\0\u03db"+
+    "\0\u040a\0\u0205\0\u0439\0\u0468\0\u0497\0\u04c6\0\u04f5\0\u0205"+
+    "\0\u0205\0\u0205\0\u0205\0\u0205\0\u0205\0\u0205\0\u0205\0\u0205"+
+    "\0\u0205\0\u0205\0\u0205\0\u0524\0\u0553\0\u0582\0\u05b1\0\u05e0"+
+    "\0\u0205\0\u0205\0\u0205\0\u060f\0\u0205\0\u063e\0\u0205\0\u0205"+
+    "\0\u066d\0\u0205\0\u0205\0\u0205\0\u069c\0\u06cb\0\u06fa\0\u0729"+
+    "\0\u0205\0\u0758\0\u0787\0\u07b6\0\u07e5\0\u0814\0\u0205\0\u0843"+
+    "\0\u0872\0\u0205\0\u0205\0\u08a1\0\u08d0\0\u08ff\0\u0468\0\u092e"+
+    "\0\u095d\0\u0205\0\u098c\0\u09bb\0\u09ea\0\u0205\0\u0a19\0\u0a48"+
+    "\0\u0843\0\u0a77\0\u0aa6\0\u0ad5\0\u0205\0\u0b04\0\u0b33\0\u0b62"+
+    "\0\u0b91\0\u0bc0\0\u0205\0\u0bef\0\u0c1e\0\u0c4d\0\u0205";
 
   private static int [] zzUnpackRowMap() {
-    int [] result = new int[100];
+    int [] result = new int[111];
     int offset = 0;
     offset = zzUnpackRowMap(ZZ_ROWMAP_PACKED_0, offset, result);
     return result;
@@ -140,67 +143,76 @@
   private static final int [] ZZ_TRANS = zzUnpackTrans();
 
   private static final String ZZ_TRANS_PACKED_0 =
-    "\53\0\1\12\1\13\1\14\1\15\1\16\1\12\1\17"+
-    "\1\20\1\14\1\21\1\13\1\15\1\14\1\22\1\23"+
-    "\5\12\2\13\1\12\2\13\1\24\1\25\1\26\1\27"+
-    "\1\30\1\12\1\13\1\31\2\13\1\14\1\13\1\23"+
-    "\1\32\1\33\1\34\1\35\1\36\1\12\1\13\1\14"+
-    "\1\15\1\16\1\12\1\17\1\37\1\14\1\21\1\13"+
-    "\1\15\1\40\1\41\1\42\5\12\2\13\1\12\2\13"+
-    "\1\24\1\25\1\26\1\27\1\30\1\12\1\13\1\31"+
-    "\2\13\1\43\1\13\1\42\1\32\1\33\1\34\1\35"+
-    "\1\36\1\12\1\13\1\14\1\15\1\16\1\12\1\44"+
-    "\1\20\1\14\1\21\1\13\1\15\1\14\1\22\1\23"+
-    "\1\45\1\46\1\47\1\50\1\51\1\52\1\53\1\54"+
-    "\1\55\1\56\1\24\1\25\1\26\1\27\1\30\1\12"+
-    "\1\13\1\31\2\13\1\14\1\13\1\23\1\32\1\33"+
-    "\1\34\1\35\1\36\1\12\1\13\1\14\1\15\1\16"+
-    "\1\12\1\44\1\37\1\14\1\21\1\13\1\15\1\40"+
-    "\1\41\1\42\1\45\1\46\1\47\1\50\1\51\1\52"+
-    "\1\53\1\54\1\55\1\56\1\24\1\25\1\26\1\27"+
-    "\1\30\1\12\1\13\1\31\2\13\1\43\1\13\1\42"+
-    "\1\32\1\33\1\34\1\35\1\36\1\12\1\13\1\14"+
-    "\1\15\1\16\1\12\1\57\1\20\1\14\1\21\1\13"+
-    "\1\15\1\14\1\22\1\23\1\45\1\46\1\47\1\50"+
-    "\1\51\1\52\1\53\1\54\1\55\1\56\1\24\1\25"+
-    "\1\26\1\27\1\30\1\12\1\13\1\31\2\13\1\14"+
-    "\1\13\1\23\1\32\1\33\1\34\1\35\1\36\1\12"+
-    "\1\13\1\14\1\15\1\16\1\12\1\57\1\37\1\14"+
-    "\1\21\1\13\1\15\1\40\1\41\1\42\1\45\1\46"+
-    "\1\47\1\50\1\51\1\52\1\53\1\54\1\55\1\56"+
-    "\1\24\1\25\1\26\1\27\1\30\1\12\1\13\1\31"+
-    "\2\13\1\43\1\13\1\42\1\32\1\33\1\34\1\35"+
-    "\1\36\7\0\1\60\4\0\1\61\1\62\42\0\1\63"+
-    "\114\0\1\64\1\0\1\64\6\0\1\65\103\0\1\66"+
-    "\23\0\1\67\44\0\1\70\5\0\1\70\2\0\1\70"+
-    "\3\0\1\70\5\0\2\70\1\0\2\70\1\0\3\70"+
-    "\2\0\1\70\1\0\2\70\1\0\2\70\46\0\1\71"+
-    "\60\0\1\72\5\0\2\73\1\74\3\0\2\73\1\0"+
-    "\3\73\13\0\1\73\6\0\1\73\2\0\1\73\2\0"+
-    "\4\73\50\0\1\75\1\0\1\76\3\0\2\77\1\100"+
-    "\3\0\2\77\1\0\3\77\13\0\1\77\6\0\1\77"+
-    "\2\0\1\77\2\0\4\77\11\0\1\101\25\0\1\66"+
-    "\26\0\1\102\52\0\1\102\3\0\1\103\35\0\1\104"+
-    "\5\0\1\104\2\0\1\104\3\0\1\104\5\0\2\104"+
-    "\1\0\2\104\1\0\3\104\2\0\1\104\1\0\2\104"+
-    "\1\0\2\104\44\0\1\105\4\0\1\106\16\0\1\107"+
-    "\54\0\1\110\52\0\1\110\3\0\1\111\40\0\1\112"+
-    "\105\0\1\113\55\0\1\114\15\0\1\115\52\0\1\116"+
-    "\51\0\1\117\4\0\1\120\54\0\1\121\43\0\1\122"+
-    "\7\0\1\120\44\0\1\123\52\0\1\123\1\124\1\125"+
-    "\46\0\1\126\4\0\1\61\54\0\1\127\43\0\1\130"+
-    "\7\0\1\61\40\0\2\73\4\0\2\73\1\0\3\73"+
-    "\13\0\1\73\6\0\1\73\2\0\1\73\2\0\4\73"+
-    "\3\0\2\77\4\0\2\77\1\0\3\77\13\0\1\77"+
-    "\6\0\1\77\2\0\1\77\2\0\4\77\6\0\1\131"+
-    "\51\0\1\132\53\0\1\133\53\0\1\134\50\0\1\135"+
-    "\3\0\1\136\47\0\1\137\52\0\1\140\56\0\1\120"+
-    "\46\0\1\141\61\0\1\120\43\0\1\142\104\0\1\143"+
-    "\24\0\1\61\55\0\1\61\46\0\1\136\50\0\1\144"+
-    "\44\0";
+    "\17\0\1\12\2\0\1\13\34\0\1\14\1\15\1\16"+
+    "\1\17\1\20\1\14\1\21\1\22\1\16\1\23\1\15"+
+    "\1\17\1\16\1\24\1\25\1\26\2\14\1\27\5\14"+
+    "\2\15\1\14\2\15\1\30\1\31\1\32\1\33\1\34"+
+    "\1\14\1\15\1\35\2\15\1\16\1\15\1\25\1\36"+
+    "\1\37\1\40\1\41\1\42\1\14\1\15\1\16\1\17"+
+    "\1\20\1\14\1\21\1\43\1\16\1\23\1\15\1\17"+
+    "\1\44\1\45\1\46\1\26\2\14\1\27\5\14\2\15"+
+    "\1\14\2\15\1\30\1\31\1\32\1\33\1\34\1\14"+
+    "\1\15\1\35\2\15\1\47\1\15\1\46\1\36\1\37"+
+    "\1\40\1\41\1\42\1\14\1\15\1\16\1\17\1\20"+
+    "\1\14\1\50\1\22\1\16\1\23\1\15\1\17\1\16"+
+    "\1\24\1\25\1\26\2\14\1\27\1\51\1\52\1\53"+
+    "\1\54\1\55\1\56\1\57\1\60\1\61\1\62\1\30"+
+    "\1\31\1\32\1\33\1\34\1\14\1\15\1\35\2\15"+
+    "\1\16\1\15\1\25\1\36\1\37\1\40\1\41\1\42"+
+    "\1\14\1\15\1\16\1\17\1\20\1\14\1\50\1\43"+
+    "\1\16\1\23\1\15\1\17\1\44\1\45\1\46\1\26"+
+    "\2\14\1\27\1\51\1\52\1\53\1\54\1\55\1\56"+
+    "\1\57\1\60\1\61\1\62\1\30\1\31\1\32\1\33"+
+    "\1\34\1\14\1\15\1\35\2\15\1\47\1\15\1\46"+
+    "\1\36\1\37\1\40\1\41\1\42\1\14\1\15\1\16"+
+    "\1\17\1\20\1\14\1\63\1\22\1\16\1\23\1\15"+
+    "\1\17\1\16\1\24\1\25\1\26\2\14\1\27\1\51"+
+    "\1\52\1\53\1\54\1\55\1\56\1\57\1\60\1\61"+
+    "\1\62\1\30\1\31\1\32\1\33\1\34\1\14\1\15"+
+    "\1\35\2\15\1\16\1\15\1\25\1\36\1\37\1\40"+
+    "\1\41\1\42\1\14\1\15\1\16\1\17\1\20\1\14"+
+    "\1\63\1\43\1\16\1\23\1\15\1\17\1\44\1\45"+
+    "\1\46\1\26\2\14\1\27\1\51\1\52\1\53\1\54"+
+    "\1\55\1\56\1\57\1\60\1\61\1\62\1\30\1\31"+
+    "\1\32\1\33\1\34\1\14\1\15\1\35\2\15\1\47"+
+    "\1\15\1\46\1\36\1\37\1\40\1\41\1\42\7\0"+
+    "\1\64\4\0\1\65\1\66\46\0\1\67\51\0\17\70"+
+    "\2\0\36\70\17\0\1\12\171\0\1\71\1\0\1\71"+
+    "\6\0\1\72\113\0\1\73\23\0\1\74\50\0\1\75"+
+    "\5\0\1\75\2\0\1\75\3\0\1\75\11\0\2\75"+
+    "\1\0\2\75\1\0\3\75\2\0\1\75\1\0\2\75"+
+    "\1\0\2\75\12\0\1\72\11\0\1\12\104\0\1\76"+
+    "\64\0\1\77\5\0\2\100\1\101\3\0\2\100\1\0"+
+    "\3\100\4\0\1\101\12\0\1\100\6\0\1\100\2\0"+
+    "\1\100\2\0\4\100\54\0\1\102\1\0\1\103\3\0"+
+    "\2\104\1\105\3\0\2\104\1\0\3\104\4\0\1\105"+
+    "\12\0\1\104\6\0\1\104\2\0\1\104\2\0\4\104"+
+    "\11\0\1\106\31\0\1\73\26\0\1\107\56\0\1\107"+
+    "\3\0\1\110\41\0\1\111\5\0\1\111\2\0\1\111"+
+    "\3\0\1\111\11\0\2\111\1\0\2\111\1\0\3\111"+
+    "\2\0\1\111\1\0\2\111\1\0\2\111\50\0\1\112"+
+    "\4\0\1\113\16\0\1\114\60\0\1\115\56\0\1\115"+
+    "\3\0\1\116\44\0\1\117\15\0\1\117\34\0\17\70"+
+    "\1\0\1\120\1\121\35\70\43\0\1\122\61\0\1\123"+
+    "\15\0\1\124\56\0\1\125\55\0\1\126\4\0\1\127"+
+    "\10\0\1\126\47\0\1\130\47\0\1\131\7\0\1\127"+
+    "\5\0\1\131\42\0\1\132\56\0\1\132\1\133\1\134"+
+    "\52\0\1\135\4\0\1\65\10\0\1\135\47\0\1\136"+
+    "\47\0\1\137\7\0\1\65\5\0\1\137\53\0\1\140"+
+    "\37\0\17\70\1\0\1\141\1\121\35\70\2\0\2\100"+
+    "\4\0\2\100\1\0\3\100\17\0\1\100\6\0\1\100"+
+    "\2\0\1\100\2\0\4\100\3\0\2\104\4\0\2\104"+
+    "\1\0\3\104\17\0\1\104\6\0\1\104\2\0\1\104"+
+    "\2\0\4\104\6\0\1\142\55\0\1\143\15\0\1\143"+
+    "\41\0\1\144\57\0\1\145\54\0\1\146\3\0\1\147"+
+    "\11\0\1\146\41\0\1\150\56\0\1\151\72\0\1\152"+
+    "\46\0\1\127\52\0\1\153\65\0\1\127\47\0\1\154"+
+    "\114\0\1\155\24\0\1\65\61\0\1\65\42\0\17\156"+
+    "\2\0\36\156\10\0\1\147\54\0\1\157\50\0\17\156"+
+    "\1\0\1\72\36\156";
 
   private static int [] zzUnpackTrans() {
-    int [] result = new int[2494];
+    int [] result = new int[3196];
     int offset = 0;
     offset = zzUnpackTrans(ZZ_TRANS_PACKED_0, offset, result);
     return result;
@@ -238,14 +250,15 @@
   private static final int [] ZZ_ATTRIBUTE = zzUnpackAttribute();
 
   private static final String ZZ_ATTRIBUTE_PACKED_0 =
-    "\1\10\7\0\1\1\3\11\2\1\1\11\2\1\1\11"+
-    "\1\1\5\11\5\1\1\11\5\1\14\11\4\0\3\11"+
+    "\10\0\1\1\2\0\3\11\2\1\1\11\2\1\1\11"+
+    "\3\1\5\11\5\1\1\11\5\1\14\11\5\0\3\11"+
     "\1\0\1\11\1\0\2\11\1\0\3\11\4\0\1\11"+
-    "\5\0\3\11\4\0\1\1\1\0\1\11\3\0\1\11"+
-    "\4\0\1\11\4\0\1\11\2\0\1\11";
+    "\5\0\1\11\2\0\2\11\4\0\1\1\1\0\1\11"+
+    "\3\0\1\11\2\0\1\1\3\0\1\11\5\0\1\11"+
+    "\3\0\1\11";
 
   private static int [] zzUnpackAttribute() {
-    int [] result = new int[100];
+    int [] result = new int[111];
     int offset = 0;
     offset = zzUnpackAttribute(ZZ_ATTRIBUTE_PACKED_0, offset, result);
     return result;
@@ -362,7 +375,7 @@
     char [] map = new char[0x10000];
     int i = 0;  /* index in packed string  */
     int j = 0;  /* index in unpacked array */
-    while (i < 172) {
+    while (i < 184) {
       int  count = packed.charAt(i++);
       char value = packed.charAt(i++);
       do map[j++] = value; while (--count > 0);