Diff for /documentViewer/MpdlXmlTextServer.py between versions 1.226 and 1.228

version 1.226, 2011/02/15 11:12:39 version 1.228, 2011/02/24 13:55:28
Line 176  class MpdlXmlTextServer(SimpleItem): Line 176  class MpdlXmlTextServer(SimpleItem):
         return myList          return myList
                       
                         
     def getTextPage(self, mode="text", pn=1, docinfo=None, pageinfo=None):      def getTextPage(self, mode="text_dict", pn=1, docinfo=None, pageinfo=None):
         """returns single page from fulltext"""          """returns single page from fulltext"""
         docpath = docinfo['textURLPath']          docpath = docinfo['textURLPath']
         path = docinfo['textURLPath']          path = docinfo['textURLPath']
         url = docinfo.get('url',None)          url = docinfo.get('url',None)
         name = docinfo.get('name',None)          name = docinfo.get('name',None)
         pn =pageinfo['current']          pn =pageinfo['current']
         viewMode= pageinfo['viewMode']  
         sn = pageinfo['sn']          sn = pageinfo['sn']
         highlightQuery = pageinfo['highlightQuery']          highlightQuery = pageinfo['highlightQuery']
         #mode = pageinfo ['viewMode']          #mode = pageinfo ['viewMode']
Line 208  class MpdlXmlTextServer(SimpleItem): Line 207  class MpdlXmlTextServer(SimpleItem):
         if pagedivs == dom.xpath("//div[@class='pageNumberOrig']"):          if pagedivs == dom.xpath("//div[@class='pageNumberOrig']"):
             if len(pagedivs)>0:              if len(pagedivs)>0:
                 docinfo['pageNumberOrig']= getTextFromNode(pagedivs[0])                  docinfo['pageNumberOrig']= getTextFromNode(pagedivs[0])
                 logging.debug("ORIGINAL PAGES: %s"%(docinfo['pageNumberOrig']))                  #logging.debug("ORIGINAL PAGES: %s"%(docinfo['pageNumberOrig']))
                   
         #original Pages Norm          #original Pages Norm
         pagedivs = dom.xpath("//div[@class='pageNumberOrigNorm']")          pagedivs = dom.xpath("//div[@class='pageNumberOrigNorm']")
         if pagedivs == dom.xpath("//div[@class='pageNumberOrigNorm']"):          if pagedivs == dom.xpath("//div[@class='pageNumberOrigNorm']"):
             if len(pagedivs)>0:              if len(pagedivs)>0:
                 docinfo['pageNumberOrigNorm']= getTextFromNode(pagedivs[0])                  docinfo['pageNumberOrigNorm']= getTextFromNode(pagedivs[0])
                 logging.debug("ORIGINAL PAGES: %s"%(docinfo['pageNumberOrigNorm']))                  #logging.debug("ORIGINAL PAGES: %s"%(docinfo['pageNumberOrigNorm']))
   
                   
         #figureEntries          #figureEntries
Line 227  class MpdlXmlTextServer(SimpleItem): Line 226  class MpdlXmlTextServer(SimpleItem):
                 if s=='0':                  if s=='0':
                     try:                      try:
                         docinfo['countFigureEntries'] = int(s)                          docinfo['countFigureEntries'] = int(s)
                         logging.debug("FIGURE ENTRIES: %s"%(s))                          #logging.debug("FIGURE ENTRIES: %s"%(s))
                     except:                      except:
                         docinfo['countFigureEntries'] = 0                          docinfo['countFigureEntries'] = 0
                 else:                  else:
                     s1 = int(s)/30+1                      s1 = int(s)/30+1
                     try:                      try:
                         docinfo['countFigureEntries'] = int(s1)                          docinfo['countFigureEntries'] = int(s1)
                         logging.debug("FIGURE ENTRIES: %s"%(s1))                          #logging.debug("FIGURE ENTRIES: %s"%(s1))
                     except:                      except:
                         docinfo['countFigureEntries'] = 0                                docinfo['countFigureEntries'] = 0      
                   
Line 246  class MpdlXmlTextServer(SimpleItem): Line 245  class MpdlXmlTextServer(SimpleItem):
                 s = getTextFromNode(pagedivs[0])                  s = getTextFromNode(pagedivs[0])
                 try:                  try:
                     docinfo['countPlaces'] = int(s)                      docinfo['countPlaces'] = int(s)
                     logging.debug("PLACES HERE: %s"%(s))                      #logging.debug("PLACES HERE: %s"%(s))
                 except:                  except:
                     docinfo['countPlaces'] = 0                      docinfo['countPlaces'] = 0
                   
Line 259  class MpdlXmlTextServer(SimpleItem): Line 258  class MpdlXmlTextServer(SimpleItem):
                 if s=='0':                  if s=='0':
                     try:                      try:
                         docinfo['countTocEntries'] = int(s)                          docinfo['countTocEntries'] = int(s)
                         logging.debug("TEXT ENTRIES: %s"%(s))                          #logging.debug("TEXT ENTRIES: %s"%(s))
                     except:                      except:
                         docinfo['countTocEntries'] = 0                          docinfo['countTocEntries'] = 0
                 else:                  else:
                     s1 = int(s)/30+1                      s1 = int(s)/30+1
                     try:                      try:
                         docinfo['countTocEntries'] = int(s1)                          docinfo['countTocEntries'] = int(s1)
                         logging.debug("TEXT ENTRIES: %s"%(s1))                          #logging.debug("TEXT ENTRIES: %s"%(s1))
                     except:                      except:
                         docinfo['countTocEntries'] = 0                          docinfo['countTocEntries'] = 0
                   
Line 279  class MpdlXmlTextServer(SimpleItem): Line 278  class MpdlXmlTextServer(SimpleItem):
                                   
                 try:                  try:
                     docinfo['numPages'] = int(s)                      docinfo['numPages'] = int(s)
                     logging.debug("PAGE NUMBER: %s"%(s))                      #logging.debug("PAGE NUMBER: %s"%(s))
                                   
                     np = docinfo['numPages']                      np = docinfo['numPages']
                     pageinfo['end'] = min(pageinfo['end'], np)                      pageinfo['end'] = min(pageinfo['end'], np)
Line 302  class MpdlXmlTextServer(SimpleItem): Line 301  class MpdlXmlTextServer(SimpleItem):
         # plain text mode          # plain text mode
         if mode == "text":          if mode == "text":
             # first div contains text              # first div contains text
               #mode = viewMode
             pagedivs = dom.xpath("/div")              pagedivs = dom.xpath("/div")
             if len(pagedivs) > 0:                    if len(pagedivs) > 0:      
                 pagenode = pagedivs[0]                  pagenode = pagedivs[0]
Line 311  class MpdlXmlTextServer(SimpleItem): Line 311  class MpdlXmlTextServer(SimpleItem):
                     if hrefNode:                      if hrefNode:
                         href= hrefNode.nodeValue                          href= hrefNode.nodeValue
                         if href.startswith('#note-'):                          if href.startswith('#note-'):
                             hrefNode.nodeValue = href.replace('#note-',"?url=%s&viewMode=%s&tocMode=%s&tocPN=%s&pn=%s#note-"%(url,viewMode,tocMode,tocPN,pn))                              hrefNode.nodeValue = href.replace('#note-',"?url=%s&viewMode=text&tocMode=%s&tocPN=%s&pn=%s#note-"%(url,tocMode,tocPN,pn))
                 return serializeNode(pagenode)                  return serializeNode(pagenode)
         if mode == "xml":          if mode == "xml":
               # first div contains text                # first div contains text
Line 343  class MpdlXmlTextServer(SimpleItem): Line 343  class MpdlXmlTextServer(SimpleItem):
         # text-with-links mode          # text-with-links mode
         if mode == "text_dict":          if mode == "text_dict":
             # first div contains text              # first div contains text
               #mode = pageinfo ['viewMode']
             pagedivs = dom.xpath("/div")              pagedivs = dom.xpath("/div")
             if len(pagedivs) > 0:              if len(pagedivs) > 0:
                 pagenode = pagedivs[0]                  pagenode = pagedivs[0]
Line 369  class MpdlXmlTextServer(SimpleItem): Line 370  class MpdlXmlTextServer(SimpleItem):
                             l.setAttributeNS(None, 'onClick',"popupWin = window.open(this.href, 'contacts', 'location,width=500,height=600,top=180, left=700, scrollbars=1'); return false;")                              l.setAttributeNS(None, 'onClick',"popupWin = window.open(this.href, 'contacts', 'location,width=500,height=600,top=180, left=700, scrollbars=1'); return false;")
                             l.setAttributeNS(None, 'onClick', 'popupWin.focus();')                                 l.setAttributeNS(None, 'onClick', 'popupWin.focus();')   
                         if href.startswith('#note-'):                          if href.startswith('#note-'):
                             hrefNode.nodeValue = href.replace('#note-',"?url=%s&viewMode=%s&tocMode=%s&tocPN=%s&pn=%s#note-"%(url,viewMode,tocMode,tocPN,pn))                                  hrefNode.nodeValue = href.replace('#note-',"?url=%s&viewMode=text_dict&tocMode=%s&tocPN=%s&pn=%s#note-"%(url,tocMode,tocPN,pn))    
                 return serializeNode(pagenode)                  return serializeNode(pagenode)
         return "no text here"          return "no text here"
           
     def getText(self, mode="text", pn=1, docinfo=None, pageinfo=None):  
         data = self.getTextPage(mode="text", pn=1 ,docinfo=docinfo, pageinfo=pageinfo)  
         logging.debug("TEXT ALL data: %s"%(data))  
         return data  
       
     def getXML(self, mode="xml", pn=1, docinfo=None, pageinfo=None):  
         data = self.getTextPage(mode="xml", pn=1 ,docinfo=docinfo, pageinfo=pageinfo)  
         logging.debug("TEXT ALL data: %s"%(data))  
         return data  
       
     def getDictionary(self, mode="text_dict", pn=1, docinfo=None, pageinfo=None):  
         data = self.getTextPage(mode="text_dict", pn=1 ,docinfo=docinfo, pageinfo=pageinfo)  
         logging.debug("TEXT ALL data: %s"%(data))  
         return data  
       
     def getTranslate(self, query=None, language=None):      def getTranslate(self, query=None, language=None):
         """translate into another languages"""          """translate into another languages"""
         data = self.getServerData("lt/lex.xql","document=&language="+str(language)+"&query="+urllib.quote(query))          data = self.getServerData("lt/lex.xql","document=&language="+str(language)+"&query="+urllib.quote(query))
Line 420  class MpdlXmlTextServer(SimpleItem): Line 406  class MpdlXmlTextServer(SimpleItem):
          pagedom = Parse(pagexml)           pagedom = Parse(pagexml)
          numdivs = pagedom.xpath("//div[@class='queryResultHits']")           numdivs = pagedom.xpath("//div[@class='queryResultHits']")
          tocSearch = int(getTextFromNode(numdivs[0]))           tocSearch = int(getTextFromNode(numdivs[0]))
          logging.debug("documentViewer (gettoc) tocSearch: %s"%(tocSearch))           #logging.debug("documentViewer (gettoc) tocSearch: %s"%(tocSearch))
          tc=int((tocSearch/10)+1)           tc=int((tocSearch/10)+1)
          logging.debug("documentViewer (gettoc) tc: %s"%(tc))           #logging.debug("documentViewer (gettoc) tc: %s"%(tc))
          return tc           return tc
           
     def getToc(self, mode="text", docinfo=None):      def getToc(self, mode="text", docinfo=None):
         """loads table of contents and stores in docinfo"""          """loads table of contents and stores in docinfo"""
         logging.debug("documentViewer (gettoc) mode: %s"%(mode))          #logging.debug("documentViewer (gettoc) mode: %s"%(mode))
         if mode == "none":          if mode == "none":
             return docinfo                      return docinfo        
         if 'tocSize_%s'%mode in docinfo:          if 'tocSize_%s'%mode in docinfo:
Line 480  class MpdlXmlTextServer(SimpleItem): Line 466  class MpdlXmlTextServer(SimpleItem):
         page = data.replace('page-fragment.xql?document=%s'%str(path),'%s?url=%s&viewMode=%s&tocMode=%s&tocPN=%s&optionToggle=1'%(selfurl,url, viewMode, tocMode, tocPN))          page = data.replace('page-fragment.xql?document=%s'%str(path),'%s?url=%s&viewMode=%s&tocMode=%s&tocPN=%s&optionToggle=1'%(selfurl,url, viewMode, tocMode, tocPN))
         text = page.replace('mode=image','mode=texttool')          text = page.replace('mode=image','mode=texttool')
         #logging.debug("documentViewer (characterNormalization) characterNormalization: %s"%(characterNormalization))          #logging.debug("documentViewer (characterNormalization) characterNormalization: %s"%(characterNormalization))
         logging.debug("TEXT %s"%(text))          #logging.debug("TEXT %s"%(text))
         return text          return text
           
     def manage_changeMpdlXmlTextServer(self,title="",serverUrl="http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/interface/",timeout=40,RESPONSE=None):      def manage_changeMpdlXmlTextServer(self,title="",serverUrl="http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/interface/",timeout=40,RESPONSE=None):

Removed from v.1.226  
changed lines
  Added in v.1.228


FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>