Diff for /cdli/cdliSplitter.py between versions 1.7.2.11 and 1.9

version 1.7.2.11, 2008/01/09 18:49:07 version 1.9, 2008/09/25 12:37:55
Line 36  wordBounds="_|,|\"" Line 36  wordBounds="_|,|\""
 wordIgnore="<|>|\#|\||\]|\[|\!|\?\*|;"  wordIgnore="<|>|\#|\||\]|\[|\!|\?\*|;"
                         
 class cdliSplitter:  class cdliSplitter:
   
     """base class for splitter.       """base class for splitter. 
     the difference between word and grapheme splitter       the difference between word and grapheme splitter 
     is the word boundary list."""      is the word boundary list."""
           
       
     default_encoding = "utf-8"      default_encoding = "utf-8"
     bounds=graphemeBounds      bounds=graphemeBounds
     boundsex=re.compile(graphemeBounds)      boundsex=re.compile(graphemeBounds)
Line 73  class cdliSplitter: Line 75  class cdliSplitter:
                                                   
                     elif not (s[0] in ignoreLines):                      elif not (s[0] in ignoreLines):
                         # regular line                          # regular line
                         lineparts=s.split(".")                          lineparts=s.split(". ",1)
                         if len(lineparts)==1:                           if len(lineparts)==1: 
                             # no line number                              # no line number
                             txt=s                              txt=s

Removed from v.1.7.2.11  
changed lines
  Added in v.1.9


FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>