Context Navigation

← Previous Change
Next Change →

Changeset 566:4a31608f8b0e in documentViewer for MpiwgXmlTextServer.py

Timestamp:

Oct 10, 2012, 4:09:49 PM (12 years ago)

Author:

casties

Branch:

default

Message:

more new MpiwgXmlTextServer?.

File:

: 1 edited

MpiwgXmlTextServer.py (modified) (7 diffs)

Legend:

: Unmodified
: Added
: Removed

MpiwgXmlTextServer.py

-                      r565
+                      r566
         logging.debug("pagediv: %s"%repr(pagediv))
         # plain text mode
         if textmode == "text":
+        # plain text or text-with-links mode
+        if textmode == "text" or textmode == "dict":
             if pagediv is not None:
+                # handle pb-tag
+                self._extractPbTag(pagediv, pageinfo)
+                self._processPbTag(pagediv, pageinfo)
+                self._processFigures(pagediv, docinfo)
+                #self._fixEmptyDivs(pagediv)
                 # get full url assuming documentViewer is parent
                 selfurl = self.getLink()
-                if punditMode:
-                    self._addPunditAttributes(pagediv, pageinfo, docinfo)
-                # fix empty div tags
-                self._fixEmptyDivs(pagediv)
                 # check all a-tags
                 links = pagediv.findall('.//a')
-                for l in links:
-                    href = l.get('href')
-                    # handle notes FIXME!
-                    if href and href.startswith('#note-'):
-                        href = href.replace('#note-',"%s#note-"%selfurl)
-                        l.set('href', href)
-                return serialize(pagediv)
-        # text-with-links mode
-        elif textmode == "dict":
-            if pagediv is not None:
-                # handle pb-div
-                self._extractPbTag(pagediv, pageinfo)
-                viewerurl = docinfo['viewerUrl']
-                selfurl = self.getLink()
-                if punditMode:
-                    pagediv = self.addPunditAttributes(pagediv, pageinfo, docinfo)
-                # fix empty div tags
-                self._fixEmptyDivs(pagediv)
-                # check all a-tags
-                links = pagediv.findall(".//a")
                 for l in links:
                     href = l.get('href')
 …
                         # is link with href
                         linkurl = urlparse.urlparse(href)
-                        #logging.debug("getTextPage: linkurl=%s"%repr(linkurl))
                         if linkurl.path.endswith('GetDictionaryEntries'):
                             #TODO: replace wordInfo page
 …
                             l.set('target', '_blank')
                         if href.startswith('#note-'):
                             # note link
+                        elif href.startswith('#note-'):
+                            # note link FIXME!
                             l.set('href', href.replace('#note-',"%s#note-"%selfurl))
+                if punditMode:
+                    self._addPunditAttributes(pagediv, pageinfo, docinfo)
                 return serialize(pagediv)
 …
                 return serialize(pagediv)
         # gis mode
+        # gis mode FIXME!
         elif textmode == "gis":
             if pagediv is not None:
 …
         return None
     def _extractPbTag(self, pagediv, pageinfo):
+    def _processPbTag(self, pagediv, pageinfo):
         """extracts information from pb-tag and removes it from pagediv"""
         pbdiv = pagediv.find(".//span[@class='pb']")
 …
             id = d.get('id')
             if id:
+                # TODO: check path (cf RFC2396)
                 d.set('about', "http://echo.mpiwg-berlin.mpg.de/%s/pn=%s/#%s"%(textid,pn,id))
                 cls = d.get('class','')
 …
         return pagediv
+    def _processFigures(self, pagediv, docinfo):
+        """processes figure-tags"""
+        divs = pagediv.findall(".//span[@class='figure']")
+        scalerUrl = docinfo['digilibScalerUrl']
+        viewerUrl = docinfo['digilibViewerUrl']
+        for d in divs:
+            try:
+                a = d.find('a')
+                img = a.find('img')
+                imgsrc = img.get('src')
+                imgurl = urlparse.urlparse(imgsrc)
+                imgq = imgurl.query
+                imgparams = urlparse.parse_qs(imgq)
+                fn = imgparams.get('fn', None)
+                if fn is not None:
+                    # parse_qs puts parameters in lists
+                    fn = fn[0]
+                    # TODO: check valid path
+                    # fix img@src
+                    newsrc = '%s?fn=%s&dw=200&dh=200'%(scalerUrl,fn)
+                    img.set('src', newsrc)
+                    # fix a@href
+                    newlink = '%s?fn=%s'%(viewerUrl,fn)
+                    a.set('href', newlink)
+                    a.set('target', '_blank')
+            except:
+                logging.warn("processFigures: strange figure!")
     def _fixEmptyDivs(self, pagediv):
         """fixes empty div-tags by inserting a space"""

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 566:4a31608f8b0e in documentViewer for MpiwgXmlTextServer.py

Legend:

MpiwgXmlTextServer.py

Download in other formats: