Changeset 412:759ed7577eef in documentViewer for MpdlXmlTextServer.py


Ignore:
Timestamp:
Dec 20, 2010, 1:52:07 PM (13 years ago)
Author:
abukhman
Branch:
default
Message:

zwei neue Methoden

File:
1 edited

Legend:

Unmodified
Added
Removed
  • MpdlXmlTextServer.py

    r411 r412  
    118118        return "no text here"   
    119119                       
    120     """def getNumPages(self, docinfo):
    121         ""get list of pages from fulltext and put in docinfo""
    122         if 'numPages' in docinfo:
    123             # already there
    124             return docinfo       
    125         xquery = '//pb'
    126         text = self.getServerData("xquery.xql","document=%s&xquery=%s"%(docinfo['textURLPath'],xquery))
    127         docinfo['numPages'] = text.count("<pb ")
    128         return docinfo
    129      """
    130     def getNumTextPages (self, docinfo):
     120   
     121    def getNumTextPages (self, docinfo=None):
    131122        """get list of pages from fulltext (texts without images) and put in docinfo"""
     123        docpath = docinfo['textURLPath']
     124        selfurl = self.absolute_url()   
     125        #viewMode=  pageinfo['viewMode']
    132126        if 'numPages' in docinfo:
    133127            # allredy there
    134128            return docinfo
    135         xpath ='/count(//pb)'
    136         text=self.getServerData("xpath.xql", "document=%s&xpath=%s"%(docinfo['textURLPath'], xpath))
    137         dom = Parse(text)
    138         result= dom.xpath("//result/resultPage")
    139          
    140         docinfo['numPages']=int(getTextFromNode(result[0]))
    141         return docinfo
     129       
     130        text = self.getServerData("page-fragment.xql","document=%s"%(docinfo['textURLPath']))
     131        dom =Parse(text)
     132        pagedivs = dom.xpath("//div[@class='countPages']")
     133        logging.debug ("pagedivs=%s"%(pagedivs))
     134        if len(pagedivs)>0:
     135            docinfo['numPages']= int(getTextFromNode(pagedivs[0]))
     136            return docinfo
     137     
     138    def getTocEntries (self, docinfo=None):
     139        """ number of text entries"""
     140        docpath = docinfo['textURLPath']
     141        selfurl = self.absolute_url()
     142        if (docpath!=None):
     143            text = self.getServerData("page-fragment.xql","document=%s"%(docinfo['textURLPath']))
     144            dom =Parse(text)
     145            pagedivs = dom.xpath("//div[@class='countTocEntries']")
     146            logging.debug ("pagedivs=%s"%(pagedivs))
     147            originalPage = getTextFromNode(pagedivs[0])
     148            tc = int (originalPage)
     149            return tc
    142150           
     151    def getFigureEntries (self, docinfo=None):
     152        """ number of figure entries"""
     153        docpath = docinfo['textURLPath']
     154        selfurl = self.absolute_url()
     155        if (docpath!=None):   
     156            text = self.getServerData("page-fragment.xql","document=%s"%(docinfo['textURLPath']))
     157            dom = Parse(text)
     158            pagedivs = dom.xpath("//div[@class='countFigureEntries']")
     159            logging.debug ("pagedivs=%s"%(pagedivs))
     160            originalPage = getTextFromNode(pagedivs[0])
     161            tc = int (originalPage)
     162            return tc
     163                       
    143164    def getGisPlaces(self, docinfo=None, pageinfo=None):
    144165        """ Show all Gis Places of whole Page"""
     
    184205            logging.debug("getALLGisPlaces :%s"%(myList))
    185206        return myList
    186    
    187    
    188     def getPDF (self, docinfo=None, pageinfo=None):
    189         """Show and Save different Pages as PDF in Options"""
    190         selfurl=self.absolute_url()
    191         pn=pageinfo['current']
    192        
    193         viewMode =pageinfo['viewMode']
    194        
    195         #text = ("page-fragment.xql","document=%s&mode=%s&pn=%s&export=%s"%(docinfo['textURLPath'], 'text',  pn,'pdf'))
    196         #text = self.getServerData("page-fragment.xql", "document=%s&mode=%s&pn=%s&export=%s"(docinfo['textURLPath'],'text', pn,'pdf'))
    197         #logging.debug("text :%s"%(text))
    198         #dom =Parse(text)
    199         #logging.debug("text :%s"%(text))
    200         #return text
    201            
     207               
    202208    def getOrigPages (self, docinfo=None, pageinfo=None):
    203209        """Show original page """
     
    229235        pagedivs = dom.xpath("//div[@class='countPlaces']")
    230236        logging.debug ("pagedivs=%s"%(pagedivs))
    231         #originalPage= getTextFromNode(pagedivs[0])
    232         #return allPlaces
    233237        if len(pagedivs)>0:
    234238            originalPage= getTextFromNode(pagedivs[0])
    235             #return docinfo['originalPage']
    236239            return originalPage
    237240           
    238     def getTextPage(self, mode="text", pn=1, docinfo=None, pageinfo=None, viewMode=None, tocMode=None, tocPN=None, characterNormalization="regPlusNorm", highlightQuery=None, sn=None, optionToggle=None):
     241    def getTextPage(self, mode="text", pn=1, docinfo=None, pageinfo=None, viewMode=None, tocMode=None, tocPN=None, characterNormalization="reg", highlightQuery=None, sn=None, optionToggle=None):
    239242        """returns single page from fulltext"""
    240243        docpath = docinfo['textURLPath']
     
    397400    def getQueryResultHitsText(self,  docinfo=None, pageinfo=None):     
    398401         """number of hits in Text of Contents mode"""
     402         selfurl = self.absolute_url()
     403         docpath = docinfo['textURLPath']
     404         viewMode=  pageinfo['viewMode']
     405         text = self.getServerData("page-fragment.xql","document=%s&mode=%s"%(docinfo['textURLPath'], 'text'))
     406         dom =Parse(text)
     407         pagedivs = dom.xpath("//div[@class='countTocEntries']")
     408         logging.debug ("pagedivs=%s"%(pagedivs))
     409         if len(pagedivs)>0:
     410            originalPage= (getTextFromNode(pagedivs[0]))
     411            tc = int (originalPage)
     412            tc1 =tc/30+1
     413            return tc1
    399414         
    400          docpath = docinfo['textURLPath']
    401          pagesize = pageinfo['queryPageSize']
    402          pn = pageinfo['searchPN']
    403          query =pageinfo['query']
    404          queryType =pageinfo['queryType']
    405          tocSearch = 0
    406          tocDiv = None
    407          tocMode = pageinfo['tocMode']
    408          tocPN = pageinfo['tocPN'] 
    409          pagexml=self.getServerData("doc-query.xql", "document=%s&queryType=%s"%(docpath,'toc'))
    410          pagedom = Parse(pagexml)
    411          logging.debug("documentViewer (pagedom) pagedom: %s"%(pagedom))
    412          numdivs = pagedom.xpath("//div[@class='queryResultHits']")
    413          tocSearch = int(getTextFromNode(numdivs[0])) 
    414          tc=int((tocSearch/30)+1) 
    415          return tc
    416 
    417415    def getQueryResultHitsFigures(self,  docinfo=None, pageinfo=None):     
    418416         """number of hits in Text of Figures mode"""
    419417         
    420          docpath = docinfo['textURLPath']
    421          pagesize = pageinfo['queryPageSize']
    422          pn = pageinfo['searchPN']
    423          query =pageinfo['query']
    424          queryType =pageinfo['queryType']
    425          tocSearch = 0
    426          tocDiv = None
    427          tocMode = pageinfo['tocMode']
    428          tocPN = pageinfo['tocPN'] 
    429          pagexml=self.getServerData("doc-query.xql", "document=%s&queryType=%s"%(docpath,'figures'))
    430          pagedom = Parse(pagexml)
    431          logging.debug("documentViewer (pagedom) pagedom: %s"%(pagedom))
    432          numdivs = pagedom.xpath("//div[@class='queryResultHits']")
    433          tocSearch = int(getTextFromNode(numdivs[0])) 
    434          tc=int((tocSearch/30)+1) 
    435          return tc
     418         selfurl = self.absolute_url()
     419         docpath = docinfo['textURLPath']
     420         viewMode=  pageinfo['viewMode']
     421         text = self.getServerData("page-fragment.xql","document=%s&mode=%s"%(docinfo['textURLPath'], 'text'))
     422         dom =Parse(text)
     423         pagedivs = dom.xpath("//div[@class='countFigureEntries']")
     424         logging.debug ("pagedivs=%s"%(pagedivs))
     425         if len(pagedivs)>0:
     426            originalPage= (getTextFromNode(pagedivs[0]))
     427            tc = int (originalPage)
     428            tc1 =tc/30+1
     429            return tc1
    436430
    437431
Note: See TracChangeset for help on using the changeset viewer.