documentViewer: documentViewer.py comparison

comparison documentViewer.py @ 587:6000c7e24d8a

new parameter "pf" to specify image file name. (still some issues)

author	casties
date	Thu, 15 Nov 2012 17:09:45 +0100
parents	83eeed69793f
children	d8d6975cebcb

comparison

equal deleted inserted replaced

-:230ba358da3c
+:6000c7e24d8a
 """returns pathname shortened by cnt"""
 # make sure path doesn't end with /
 path = path.rstrip('/')
 # split by /, shorten, and reassemble
 return '/'.join(path.split('/')[0:-cnt])
+def getPnForPf(docinfo, pf):
+"""returns image number for image file name or 0"""
+if 'imgFileNames' in docinfo:
+pn = docinfo['imgFileNames'].get(pf, None)
+if pn is None:
+# try to cut extension
+xi = pf.rfind('.')
+if xi > 0:
+pf = pf[:xi]
+# try again, else return 0
+pn = docinfo['imgFileNames'].get(pf, 0)
+return pn
+return 0
 ##
 ## documentViewer class
 ##
 if not self.digilibBaseUrl:
 self.digilibBaseUrl = self.findDigilibUrl() or "http://nausikaa.mpiwg-berlin.mpg.de/digitallibrary"
 docinfo = self.getDocinfo(mode=mode,url=url)
 #pageinfo = self.getPageinfo(start=start,current=pn,docinfo=docinfo)
-pageinfo = self.getPageinfo(start=start,current=pn, docinfo=docinfo)
+pageinfo = self.getPageinfo(start=start,pn=pn, docinfo=docinfo)
 ''' ZDES '''
 pt = getattr(self.template, 'thumbs_main_rss')
 if viewMode=="auto": # automodus gewaehlt
 if docinfo.has_key("textURL") or docinfo.get('textURLPath',None): #texturl gesetzt und textViewer konfiguriert
 return pt(docinfo=docinfo,pageinfo=pageinfo,viewMode=viewMode)
 security.declareProtected('View','index_html')
-def index_html(self,url,mode="texttool",viewMode="auto",viewLayer=None,tocMode=None,start=1,pn=1):
+def index_html(self,url,mode="texttool",viewMode="auto",viewLayer=None,tocMode=None,start=None,pn=None,pf=None):
 """
 show page
 @param url: url which contains display information
 @param mode: defines how to access the document behind url
 @param viewMode: 'images': display images, 'text': display text, 'xml': display xml, default is 'auto'
 @param viewLayer: sub-type of viewMode, e.g. layer 'dict' for viewMode='text'
 @param tocMode: type of 'table of contents' for navigation (thumbs, text, figures, none)
 """
-logging.debug("documentViewer(index_html) mode=%s url=%s viewMode=%s viewLayer=%s start=%s pn=%s"%(mode,url,viewMode,viewLayer,start,pn))
+logging.debug("documentViewer(index_html) mode=%s url=%s viewMode=%s viewLayer=%s start=%s pn=%s pf=%s"%(mode,url,viewMode,viewLayer,start,pn,pf))
 if not hasattr(self, 'template'):
 # this won't work
 logging.error("template folder missing!")
 return "ERROR: template folder missing!"
 # safe viewLayer in userinfo
 userinfo['viewLayer'] = viewLayer
 # pageinfo: information about page (not cached)
-pageinfo = self.getPageinfo(start=start, current=pn, docinfo=docinfo, userinfo=userinfo, viewMode=viewMode, viewLayer=viewLayer, tocMode=tocMode)
+pageinfo = self.getPageinfo(start=start, pn=pn, pf=pf, docinfo=docinfo, userinfo=userinfo, viewMode=viewMode, viewLayer=viewLayer, tocMode=tocMode)
 # get template /template/viewer_$viewMode
 pt = getattr(self.template, 'viewer_%s'%viewMode, None)
 if pt is None:
 logging.error("No template for viewMode=%s!"%viewMode)
 return (user is not None)
 logging.error("documentViewer (accessOK) unknown access type %s"%access)
 return False
 def getUserinfo(self):
 """returns userinfo object"""
 logging.debug("getUserinfo")
 userinfo = {}
 # look for cached userinfo in session
 pass
 return docinfo
 def getDocinfoFromDigilib(self, docinfo, path):
-infoUrl=self.digilibBaseUrl+"/dirInfo-xml.jsp?mo=dir&fn="+path
+infoUrl=self.digilibBaseUrl+"/dirInfo-xml.jsp?fn="+path
 # fetch data
 txt = getHttpData(infoUrl)
 if not txt:
 logging.error("Unable to get dir-info from %s"%(infoUrl))
 return docinfo
 dom = ET.fromstring(txt)
-size = getText(dom.find("size"))
+dir = dom
+# save size
+size = dir.findtext('size')
 logging.debug("getDocinfoFromDigilib: size=%s"%size)
 if size:
 docinfo['numPages'] = int(size)
 else:
 docinfo['numPages'] = 0
+return docinfo
-# TODO: produce and keep list of image names and numbers
+# save list of image names and numbers
+imgNames = {}
+for f in dir:
+fn = f.findtext('name')
+pn = f.findtext('index')
+imgNames[fn] = getInt(pn)
+docinfo['imgFileNames'] = imgNames
 return docinfo
 def getDocinfoFromPresentationInfoXml(self,docinfo):
 """gets DC-like bibliographical information from the presentation entry in texttools"""
 if url.startswith("http://"):
 # real URL
 metaUrl = url
 else:
 # online path
 server=self.digilibBaseUrl+"/servlet/Texter?fn="
 metaUrl=server+url
 txt=getHttpData(metaUrl)
 if txt is None:
 docinfo['title']=getText(dom.find(".//title"))
 docinfo['date']=getText(dom.find(".//date"))
 return docinfo
-def getPageinfo(self, current=None, start=None, rows=None, cols=None, docinfo=None, userinfo=None, viewMode=None, viewLayer=None, tocMode=None):
+def getPageinfo(self, pn=None, pf=None, start=None, rows=None, cols=None, docinfo=None, userinfo=None, viewMode=None, viewLayer=None, tocMode=None):
 """returns pageinfo with the given parameters"""
-logging.debug("getPageInfo(current=%s, start=%s, rows=%s, cols=%s, viewMode=%s, viewLayer=%s, tocMode=%s)"%(current,start,rows,cols,viewMode,viewLayer,tocMode))
+logging.debug("getPageInfo(pn=%s, pf=%s, start=%s, rows=%s, cols=%s, viewMode=%s, viewLayer=%s, tocMode=%s)"%(pn,pf,start,rows,cols,viewMode,viewLayer,tocMode))
 pageinfo = {}
 pageinfo['viewMode'] = viewMode
 # split viewLayer if necessary
 if isinstance(viewLayer,basestring):
 viewLayer = viewLayer.split(',')
 pageinfo['viewLayer'] = viewLayer
 pageinfo['tocMode'] = tocMode
 # TODO: unify current and pn!
-current = getInt(current)
+#pageinfo['current'] = current
-pageinfo['current'] = current
+# pf takes precedence over pn
-pageinfo['pn'] = current
+if pf:
+pageinfo['pf'] = pf
+pn = getPnForPf(docinfo, pf)
+else:
+pn = getInt(pn, 1)
+pageinfo['pn'] = pn
 rows = int(rows or self.thumbrows)
 pageinfo['rows'] = rows
 cols = int(cols or self.thumbcols)
 pageinfo['cols'] = cols
 grpsize = cols * rows
 pageinfo['groupsize'] = grpsize
-# is start is empty use one around current
+# is start is empty use one around pn
-start = getInt(start, default=(math.ceil(float(current)/float(grpsize))*grpsize-(grpsize-1)))
+start = getInt(start, default=(math.ceil(float(pn)/float(grpsize))*grpsize-(grpsize-1)))
 # int(current / grpsize) * grpsize +1))
 pageinfo['start'] = start
 # get number of pages
 np = int(docinfo.get('numPages', 0))
 if np == 0:
 pageinfo['pageBatch'] = self.getPageBatch(start=start, rows=rows, cols=cols, pageFlowLtr=pageFlowLtr, pageZero=pageZero, minIdx=1, maxIdx=np)
 # more page parameters
 pageinfo['characterNormalization'] = self.REQUEST.get('characterNormalization','reg')
 if docinfo.get('pageNumbers'):
 # get original page numbers
-pageNumber = docinfo['pageNumbers'].get(current, None)
+pageNumber = docinfo['pageNumbers'].get(pn, None)
 if pageNumber is not None:
 pageinfo['pageNumberOrig'] = pageNumber['no']
 pageinfo['pageNumberOrigNorm'] = pageNumber['non']
 # cache search results

Mercurial > hg > documentViewer

comparison documentViewer.py @ 587:6000c7e24d8a