Context Navigation

source: documentViewer/MpdlXmlTextServer.py @ 414:ad201f406dd1

Last change on this file since 414:ad201f406dd1 was 414:ad201f406dd1, checked in by abukhman, 13 years ago
* empty log message *
File size: 26.3 KB

Line
1
2	from OFS.SimpleItem import SimpleItem
3	from Products.PageTemplates.PageTemplateFile import PageTemplateFile
4	from Ft.Xml import EMPTY_NAMESPACE, Parse
5
6	import sys
7	import logging
8	import urllib
9	import documentViewer
10	from documentViewer import getTextFromNode, serializeNode
11
12	class MpdlXmlTextServer(SimpleItem):
13	"""TextServer implementation for MPDL-XML eXist server"""
14	meta_type="MPDL-XML TextServer"
15
16	manage_options=(
17	{'label':'Config','action':'manage_changeMpdlXmlTextServerForm'},
18	)+SimpleItem.manage_options
19
20	manage_changeMpdlXmlTextServerForm = PageTemplateFile("zpt/manage_changeMpdlXmlTextServer", globals())
21
22	def __init__(self,id,title="",serverUrl="http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/interface/", serverName=None, timeout=40):
23	"""constructor"""
24	self.id=id
25	self.title=title
26	self.timeout = timeout
27	if serverName is None:
28	self.serverUrl = serverUrl
29	else:
30	self.serverUrl = "http://%s/mpdl/interface/"%serverName
31
32	def getHttpData(self, url, data=None):
33	"""returns result from url+data HTTP request"""
34	return documentViewer.getHttpData(url,data,timeout=self.timeout)
35
36	def getServerData(self, method, data=None):
37	"""returns result from text server for method+data"""
38	url = self.serverUrl+method
39	return documentViewer.getHttpData(url,data,timeout=self.timeout)
40
41	def getSearch(self, pn=1, pageinfo=None, docinfo=None, query=None, queryType=None, lemma=None, characterNormalization=None, optionToggle=None):
42	"""get search list"""
43	docpath = docinfo['textURLPath']
44	url = docinfo['url']
45	pagesize = pageinfo['queryPageSize']
46	pn = pageinfo['searchPN']
47	sn = pageinfo['sn']
48	highlightQuery = pageinfo['highlightQuery']
49	query =pageinfo['query']
50	queryType =pageinfo['queryType']
51	viewMode= pageinfo['viewMode']
52	tocMode = pageinfo['tocMode']
53	characterNormalization = pageinfo['characterNormalization']
54	optionToggle = pageinfo['optionToggle']
55	tocPN = pageinfo['tocPN']
56	selfurl = self.absolute_url()
57
58	data = self.getServerData("doc-query.xql","document=%s&mode=%s&queryType=%s&query=%s&queryResultPageSize=%s&queryResultPN=%s&sn=%s&viewMode=%s&characterNormalization=%s&optionToggle=%s&highlightQuery=%s"%(docpath, 'text', queryType, urllib.quote(query), pagesize, pn, sn, viewMode,characterNormalization,optionToggle ,urllib.quote(highlightQuery)))
59	#page=self.template.fulltextclient.eval("/mpdl/interface/doc-query.xql","document=%s&mode=%s&queryType=%s&query=%s&queryResultPageSize=%s&queryResultPN=%s&sn=%s&viewMode=%s&highlightQuery=%s"%(docpath, 'text', queryType, query, pagesize, pn, sn, viewMode,highlightQuery) ,outputUnicode=False)
60
61	pagexml = data.replace('?document=%s'%str(docpath),'?url=%s'%url)
62	pagedom = Parse(pagexml)
63	if (queryType=="fulltext")or(queryType=="xpath")or(queryType=="xquery")or(queryType=="fulltextMorphLemma"):
64	pagedivs = pagedom.xpath("//div[@class='queryResultPage']")
65	if len(pagedivs)>0:
66	pagenode=pagedivs[0]
67	links=pagenode.xpath("//a")
68	for l in links:
69	hrefNode = l.getAttributeNodeNS(None, u"href")
70	if hrefNode:
71	href = hrefNode.nodeValue
72	if href.startswith('page-fragment.xql'):
73	selfurl = self.absolute_url()
74	pagexml=href.replace('mode=text','mode=texttool&viewMode=%s&queryType=%s&query=%s&queryResultPageSize=%s&queryResultPN=%s&tocMode=%s&searchPN=%s&tocPN=%s&optionToggle=%s&characterNormalization=%s'%(viewMode,queryType,urllib.quote(query),pagesize,pn,tocMode,pn,tocPN,optionToggle,characterNormalization))
75	hrefNode.nodeValue = pagexml.replace('page-fragment.xql','%s'%selfurl)
76	return serializeNode(pagenode)
77	if (queryType=="fulltextMorph"):
78	pagedivs = pagedom.xpath("//div[@class='queryResult']")
79	if len(pagedivs)>0:
80	pagenode=pagedivs[0]
81	links=pagenode.xpath("//a")
82	for l in links:
83	hrefNode = l.getAttributeNodeNS(None, u"href")
84	if hrefNode:
85	href = hrefNode.nodeValue
86	if href.startswith('page-fragment.xql'):
87	selfurl = self.absolute_url()
88	pagexml=href.replace('mode=text','mode=texttool&viewMode=%s&queryType=%s&query=%s&queryResultPageSize=%s&queryResultPN=%s&tocMode=%s&searchPN=%s&tocPN=%s&optionToggle=%s&characterNormalization=%s'%(viewMode,queryType,urllib.quote(query),pagesize,pn,tocMode,pn,tocPN,optionToggle,characterNormalization))
89	hrefNode.nodeValue = pagexml.replace('page-fragment.xql','%s'%selfurl)
90	if href.startswith('../lt/lemma.xql'):
91	hrefNode.nodeValue = href.replace('../lt/lemma.xql','%s/template/head_main_lemma_New'%(selfurl))
92	l.setAttributeNS(None, 'target', '_blank')
93	l.setAttributeNS(None, 'onClick',"popupWin = window.open(this.href, 'contacts', 'location,width=500,height=600,top=180, left=400, scrollbars=1'); return false;")
94	l.setAttributeNS(None, 'onClick', 'popupWin.focus();')
95	pagedivs = pagedom.xpath("//div[@class='queryResultMorphExpansion']")
96	return serializeNode(pagenode)
97	if (queryType=="ftIndex")or(queryType=="ftIndexMorph"):
98	pagedivs= pagedom.xpath("//div[@class='queryResultPage']")
99	if len(pagedivs)>0:
100	pagenode=pagedivs[0]
101	links=pagenode.xpath("//a")
102	for l in links:
103	hrefNode = l.getAttributeNodeNS(None, u"href")
104	if hrefNode:
105	href = hrefNode.nodeValue
106	hrefNode.nodeValue=href.replace('mode=text','mode=texttool&viewMode=%s&tocMode=%s&tocPN=%s&pn=%s&optionToggle=%s&characterNormalization=%s'%(viewMode,tocMode,tocPN,pn,optionToggle,characterNormalization))
107	if href.startswith('../lt/lex.xql'):
108	hrefNode.nodeValue = href.replace('../lt/lex.xql','%s/template/head_main_voc'%selfurl)
109	l.setAttributeNS(None, 'target', '_blank')
110	l.setAttributeNS(None, 'onClick',"popupWin = window.open(this.href, 'contacts', 'location,width=500,height=600,top=180, left=400, scrollbars=1'); return false;")
111	l.setAttributeNS(None, 'onClick', 'popupWin.focus();')
112	if href.startswith('../lt/lemma.xql'):
113	hrefNode.nodeValue = href.replace('../lt/lemma.xql','%s/template/head_main_lemma'%selfurl)
114	l.setAttributeNS(None, 'target', '_blank')
115	l.setAttributeNS(None, 'onClick',"popupWin = window.open(this.href, 'contacts', 'location,width=500,height=600,top=180, left=400, scrollbars=1'); return false;")
116	l.setAttributeNS(None, 'onClick', 'popupWin.focus();')
117	return serializeNode(pagenode)
118	return "no text here"
119
120
121	def getNumTextPages (self, docinfo=None):
122	"""get list of pages from fulltext (texts without images) and put in docinfo"""
123	docpath = docinfo['textURLPath']
124	selfurl = self.absolute_url()
125	#viewMode= pageinfo['viewMode']
126	if 'numPages' in docinfo:
127	# allredy there
128	return docinfo
129
130	text = self.getServerData("page-fragment.xql","document=%s"%(docinfo['textURLPath']))
131	dom =Parse(text)
132	pagedivs = dom.xpath("//div[@class='countPages']")
133	logging.debug ("pagedivs=%s"%(pagedivs))
134	if len(pagedivs)>0:
135	docinfo['numPages']= int(getTextFromNode(pagedivs[0]))
136	return docinfo
137
138	def getTocEntries (self, docinfo=None):
139	""" number of text entries"""
140	docpath = docinfo['textURLPath']
141	selfurl = self.absolute_url()
142	if 'tocEntries' in docinfo:
143	# allredy there
144	return docinfo['tocEntries']
145	if (docpath!=None):
146	text = self.getServerData("page-fragment.xql","document=%s"%(docinfo['textURLPath']))
147	dom =Parse(text)
148	pagedivs = dom.xpath("//div[@class='countTocEntries']")
149	#logging.debug ("pagedivs=%s"%(pagedivs))
150	docinfo['tocEntries'] = getTextFromNode(pagedivs[0])
151	#tc = int (originalPage)
152	return docinfo['tocEntries']
153
154	def getFigureEntries (self, docinfo=None):
155	""" number of figure entries"""
156	docpath = docinfo['textURLPath']
157	selfurl = self.absolute_url()
158	if 'figureEntries' in docinfo:
159	# allredy there
160	return docinfo['figureEntries']
161	if (docpath!=None):
162	text = self.getServerData("page-fragment.xql","document=%s"%(docinfo['textURLPath']))
163	dom = Parse(text)
164	pagedivs = dom.xpath("//div[@class='countFigureEntries']")
165	#logging.debug ("pagedivs=%s"%(pagedivs))
166	docinfo['figureEntries'] = getTextFromNode(pagedivs[0])
167	#tc = int (docinfo['figureEntries'])
168	return docinfo['figureEntries']
169
170	def getGisPlaces(self, docinfo=None, pageinfo=None):
171	""" Show all Gis Places of whole Page"""
172	xpath='//place'
173	docpath = docinfo.get('textURLPath',None)
174	if not docpath:
175	return None
176
177	url = docinfo['url']
178	selfurl = self.absolute_url()
179	pn = pageinfo['current']
180	hrefList=[]
181	myList= ""
182	text=self.getServerData("xpath.xql", "document=%s&xpath=%s&pn=%s"%(docinfo['textURLPath'],xpath,pn))
183	dom = Parse(text)
184	result = dom.xpath("//result/resultPage/place")
185	for l in result:
186	hrefNode= l.getAttributeNodeNS(None, u"id")
187	href= hrefNode.nodeValue
188	hrefList.append(href)
189	myList = ",".join(hrefList)
190	logging.debug("getGisPlaces :%s"%(myList))
191	return myList
192
193	def getAllGisPlaces (self, docinfo=None, pageinfo=None):
194	"""Show all Gis Places of whole Book """
195	xpath ='//echo:place'
196	docpath =docinfo['textURLPath']
197	url = docinfo['url']
198	selfurl =self.absolute_url()
199	pn =pageinfo['current']
200	hrefList=[]
201	myList=""
202	text=self.getServerData("xpath.xql", "document=%s&xpath=%s"%(docinfo['textURLPath'],xpath))
203	dom =Parse(text)
204	result = dom.xpath("//result/resultPage/place")
205
206	for l in result:
207	hrefNode = l.getAttributeNodeNS(None, u"id")
208	href= hrefNode.nodeValue
209	hrefList.append(href)
210	myList = ",".join(hrefList)
211	logging.debug("getALLGisPlaces :%s"%(myList))
212	return myList
213
214	def getOrigPages (self, docinfo=None, pageinfo=None):
215	"""Show original page """
216	docpath = docinfo.get('textURLPath',None)
217	if not docpath:
218	return None
219	selfurl = self.absolute_url()
220	pn =pageinfo['current']
221
222	viewMode= pageinfo['viewMode']
223	text = self.getServerData("page-fragment.xql","document=%s&mode=%s&pn=%s"%(docinfo['textURLPath'], 'text', pn))
224	dom =Parse(text)
225	pagedivs = dom.xpath("//div[@class='pageNumberOrig']")
226	if len(pagedivs)>0:
227	originalPage= getTextFromNode(pagedivs[0])
228	#return docinfo['originalPage']
229	return originalPage
230
231	def getAllPlaces (self, docinfo=None):
232	"""Show all Places if no places than 0"""
233	docpath = docinfo['textURLPath']
234	selfurl = self.absolute_url()
235	if 'allPlaces' in docinfo:
236	# allredy there
237	return docinfo['allPlaces']
238
239	text = self.getServerData("page-fragment.xql","document=%s"%(docinfo['textURLPath']))
240	dom =Parse(text)
241	pagedivs = dom.xpath("//div[@class='countPlaces']")
242	logging.debug ("pagedivs=%s"%(pagedivs))
243	if len(pagedivs)>0:
244	docinfo['allPlaces']= getTextFromNode(pagedivs[0])
245	#logging.debug ("docinfo['allPlaces']=%s"%(docinfo['allPlaces']))
246	return docinfo['allPlaces']
247
248	def getTextPage(self, mode="text", pn=1, docinfo=None, pageinfo=None, viewMode=None, tocMode=None, tocPN=None, characterNormalization="reg", highlightQuery=None, sn=None, optionToggle=None):
249	"""returns single page from fulltext"""
250	docpath = docinfo['textURLPath']
251	path = docinfo['textURLPath']
252	url = docinfo['url']
253	name = docinfo['name']
254	viewMode= pageinfo['viewMode']
255	sn = pageinfo['sn']
256	highlightQuery = pageinfo['highlightQuery']
257
258	tocMode = pageinfo['tocMode']
259	characterNormalization=pageinfo['characterNormalization']
260	tocPN = pageinfo['tocPN']
261	selfurl = self.absolute_url()
262	if mode == "text_dict":
263	textmode = "textPollux"
264	else:
265	textmode = mode
266	#logging.debug("documentViewer highlightQuery: %s"%(highlightQuery))
267	textParam = "document=%s&mode=%s&pn=%s&characterNormalization=%s"%(docpath,textmode,pn,characterNormalization)
268	if highlightQuery is not None:
269	textParam +="&highlightQuery=%s&sn=%s"%(urllib.quote(highlightQuery),sn)
270	#logging.debug("documentViewer highlightQuery: %s"%(highlightQuery))
271	pagexml = self.getServerData("page-fragment.xql",textParam)
272	logging.debug("documentViewer highlightQuery: %s"%(highlightQuery))
273	#pagexml=self.template.fulltextclient.eval("/mpdl/interface/page-fragment.xql", textParam, outputUnicode=False)
274
275	pagedom = Parse(pagexml)
276	# plain text mode
277	if mode == "text":
278	# first div contains text
279	pagedivs = pagedom.xpath("/div")
280	if len(pagedivs) > 0:
281	pagenode = pagedivs[0]
282	links = pagenode.xpath("//a")
283	for l in links:
284	hrefNode = l.getAttributeNodeNS(None, u"href")
285	if hrefNode:
286	href= hrefNode.nodeValue
287	if href.startswith('#note-'):
288	hrefNode.nodeValue = href.replace('#note-',"?url=%s&viewMode=%s&tocMode=%s&tocPN=%s&pn=%s#note-"%(url,viewMode,tocMode,tocPN,pn))
289	return serializeNode(pagenode)
290	if mode == "xml":
291	# first div contains text
292	pagedivs = pagedom.xpath("/div")
293	if len(pagedivs) > 0:
294	pagenode = pagedivs[0]
295	return serializeNode(pagenode)
296	if mode == "gis":
297	# first div contains text
298	pagedivs = pagedom.xpath("/div")
299	if len(pagedivs) > 0:
300	pagenode = pagedivs[0]
301	links =pagenode.xpath("//a")
302	for l in links:
303	hrefNode =l.getAttributeNodeNS(None, u"href")
304	if hrefNode:
305	href=hrefNode.nodeValue
306	if href.startswith('http://chinagis.mpiwg-berlin.mpg.de'):
307	hrefNode.nodeValue =href.replace('chinagis_REST/REST/db/chgis/mpdl','chinagis/REST/db/mpdl/%s'%name)
308	l.setAttributeNS(None, 'target', '_blank')
309	return serializeNode(pagenode)
310
311	if mode == "pureXml":
312	# first div contains text
313	pagedivs = pagedom.xpath("/div")
314	if len(pagedivs) > 0:
315	pagenode = pagedivs[0]
316	return serializeNode(pagenode)
317	# text-with-links mode
318	if mode == "text_dict":
319	# first div contains text
320	pagedivs = pagedom.xpath("/div")
321	if len(pagedivs) > 0:
322	pagenode = pagedivs[0]
323	# check all a-tags
324	links = pagenode.xpath("//a")
325	for l in links:
326	hrefNode = l.getAttributeNodeNS(None, u"href")
327	if hrefNode:
328	# is link with href
329	href = hrefNode.nodeValue
330	if href.startswith('lt/lex.xql'):
331	# is pollux link
332	selfurl = self.absolute_url()
333	# change href
334	hrefNode.nodeValue = href.replace('lt/lex.xql','%s/template/head_main_voc'%selfurl)
335	# add target
336	l.setAttributeNS(None, 'target', '_blank')
337	l.setAttributeNS(None, 'onClick',"popupWin = window.open(this.href, 'contacts', 'location,width=500,height=600,top=180, left=700, scrollbars=1'); return false;")
338	l.setAttributeNS(None, 'onClick', 'popupWin.focus();')
339	if href.startswith('lt/lemma.xql'):
340	selfurl = self.absolute_url()
341	hrefNode.nodeValue = href.replace('lt/lemma.xql','%s/template/head_main_lemma'%selfurl)
342	l.setAttributeNS(None, 'target', '_blank')
343	l.setAttributeNS(None, 'onClick',"popupWin = window.open(this.href, 'contacts', 'location,width=500,height=600,top=180, left=700, scrollbars=1'); return false;")
344	l.setAttributeNS(None, 'onClick', 'popupWin.focus();')
345	if href.startswith('#note-'):
346	hrefNode.nodeValue = href.replace('#note-',"?url=%s&viewMode=%s&tocMode=%s&tocPN=%s&pn=%s#note-"%(url,viewMode,tocMode,tocPN,pn))
347	return serializeNode(pagenode)
348	return "no text here"
349
350	def getTranslate(self, query=None, language=None):
351	"""translate into another languages"""
352	data = self.getServerData("lt/lex.xql","document=&language="+str(language)+"&query="+urllib.quote(query))
353	#pagexml=self.template.fulltextclient.eval("/mpdl/interface/lt/lex.xql","document=&language="+str(language)+"&query="+url_quote(str(query)))
354	return data
355
356	def getLemma(self, lemma=None, language=None):
357	"""simular words lemma """
358	data = self.getServerData("lt/lemma.xql","document=&language="+str(language)+"&lemma="+urllib.quote(lemma))
359	#pagexml=self.template.fulltextclient.eval("/mpdl/interface/lt/lemma.xql","document=&language="+str(language)+"&lemma="+url_quote(str(lemma)))
360	return data
361
362	def getLemmaNew(self, query=None, language=None):
363	"""simular words lemma """
364	data = self.getServerData("lt/lemma.xql","document=&language="+str(language)+"&lemma="+urllib.quote(query))
365	#pagexml=self.template.fulltextclient.eval("/mpdl/interface/lt/lemma.xql","document=&language="+str(language)+"&lemma="+url_quote(str(query)))
366	return data
367
368	def getQuery (self, docinfo=None, pageinfo=None, query=None, queryType=None, pn=1, optionToggle=None):
369	"""number of"""
370	docpath = docinfo['textURLPath']
371	pagesize = pageinfo['queryPageSize']
372	pn = pageinfo['searchPN']
373	query =pageinfo['query']
374	queryType =pageinfo['queryType']
375	tocSearch = 0
376	tocDiv = None
377
378	pagexml = self.getServerData("doc-query.xql","document=%s&mode=%s&queryType=%s&query=%s&queryResultPageSize=%s&queryResultPN=%s"%(docpath, 'text', queryType, urllib.quote(query), pagesize, pn))
379	#pagexml=self.template.fulltextclient.eval("/mpdl/interface/doc-query.xql","document=%s&mode=%s&queryType=%s&query=%s&queryResultPageSize=%s&queryResultPN=%s"%(docpath, 'text', queryType, query, pagesize, pn) ,outputUnicode=False)
380	pagedom = Parse(pagexml)
381	numdivs = pagedom.xpath("//div[@class='queryResultHits']")
382	tocSearch = int(getTextFromNode(numdivs[0]))
383	logging.debug("documentViewer (gettoc) tocSearch: %s"%(tocSearch))
384	tc=int((tocSearch/10)+1)
385	logging.debug("documentViewer (gettoc) tc: %s"%(tc))
386	return tc
387
388	def getQueryResultHits(self, docinfo=None, pageinfo=None, query=None, queryType=None, pn=1, optionsClose=None):
389
390	"""number of hits in Search mode"""
391	docpath = docinfo['textURLPath']
392	pagesize = pageinfo['queryPageSize']
393	pn = pageinfo['searchPN']
394	query =pageinfo['query']
395	queryType =pageinfo['queryType']
396	tocSearch = 0
397	tocDiv = None
398
399	pagexml = self.getServerData("doc-query.xql","document=%s&mode=%s&queryType=%s&query=%s&queryResultPageSize=%s&queryResultPN=%s"%(docpath, 'text', queryType, urllib.quote(query), pagesize, pn))
400	#pagexml=self.template.fulltextclient.eval("/mpdl/interface/doc-query.xql","document=%s&mode=%s&queryType=%s&query=%s&queryResultPageSize=%s&queryResultPN=%s"%(docpath, 'text', queryType, query, pagesize, pn) ,outputUnicode=False)
401	pagedom = Parse(pagexml)
402	numdivs = pagedom.xpath("//div[@class='queryResultHits']")
403	tocSearch = int(getTextFromNode(numdivs[0]))
404	tc=int((tocSearch/10)+1)
405	return tc
406
407	def getQueryResultHitsText(self, docinfo=None, pageinfo=None):
408	"""number of hits in Text of Contents mode"""
409	selfurl = self.absolute_url()
410	docpath = docinfo['textURLPath']
411	viewMode= pageinfo['viewMode']
412	text = self.getServerData("page-fragment.xql","document=%s&mode=%s"%(docinfo['textURLPath'], 'text'))
413	dom =Parse(text)
414	pagedivs = dom.xpath("//div[@class='countTocEntries']")
415	logging.debug ("pagedivs=%s"%(pagedivs))
416	if len(pagedivs)>0:
417	originalPage= (getTextFromNode(pagedivs[0]))
418	tc = int (originalPage)
419	tc1 =tc/30+1
420	return tc1
421
422	def getQueryResultHitsFigures(self, docinfo=None, pageinfo=None):
423	"""number of hits in Text of Figures mode"""
424
425	selfurl = self.absolute_url()
426	docpath = docinfo['textURLPath']
427	viewMode= pageinfo['viewMode']
428	text = self.getServerData("page-fragment.xql","document=%s&mode=%s"%(docinfo['textURLPath'], 'text'))
429	dom =Parse(text)
430	pagedivs = dom.xpath("//div[@class='countFigureEntries']")
431	logging.debug ("pagedivs=%s"%(pagedivs))
432	if len(pagedivs)>0:
433	originalPage= (getTextFromNode(pagedivs[0]))
434	tc = int (originalPage)
435	tc1 =tc/30+1
436	return tc1
437
438
439	def getToc(self, mode="text", docinfo=None):
440	"""loads table of contents and stores in docinfo"""
441	logging.debug("documentViewer (gettoc) mode: %s"%(mode))
442	if mode == "none":
443	return docinfo
444	if 'tocSize_%s'%mode in docinfo:
445	# cached toc
446	return docinfo
447
448	docpath = docinfo['textURLPath']
449	# we need to set a result set size
450	pagesize = 1000
451	pn = 1
452	if mode == "text":
453	queryType = "toc"
454	else:
455	queryType = mode
456	# number of entries in toc
457	tocSize = 0
458	tocDiv = None
459
460	pagexml = self.getServerData("doc-query.xql","document=%s&queryType=%s&queryResultPageSize=%s&queryResultPN=%s"%(docpath,queryType, pagesize, pn))
461	#pagexml=self.template.fulltextclient.eval("/mpdl/interface/doc-query.xql", "document=%s&queryType=%s&queryResultPageSize=%s&queryResultPN=%s"%(docpath,queryType,pagesize,pn), outputUnicode=False)
462	# post-processing downloaded xml
463	pagedom = Parse(pagexml)
464	# get number of entries
465	numdivs = pagedom.xpath("//div[@class='queryResultHits']")
466	if len(numdivs) > 0:
467	tocSize = int(getTextFromNode(numdivs[0]))
468	docinfo['tocSize_%s'%mode] = tocSize
469	return docinfo
470
471	def getTocPage(self, mode="text", pn=1, pageinfo=None, docinfo=None):
472	"""returns single page from the table of contents"""
473	# TODO: this should use the cached TOC
474	if mode == "text":
475	queryType = "toc"
476	else:
477	queryType = mode
478	docpath = docinfo['textURLPath']
479	path = docinfo['textURLPath']
480	pagesize = pageinfo['tocPageSize']
481	pn = pageinfo['tocPN']
482	url = docinfo['url']
483	selfurl = self.absolute_url()
484	viewMode= pageinfo['viewMode']
485	characterNormalization = pageinfo ['characterNormalization']
486	optionToggle =pageinfo ['optionToggle']
487	tocMode = pageinfo['tocMode']
488	tocPN = pageinfo['tocPN']
489
490	data = self.getServerData("doc-query.xql","document=%s&queryType=%s&queryResultPageSize=%s&queryResultPN=%s&characterNormalization=regPlusNorm&optionToggle=1"%(docpath,queryType, pagesize, pn))
491	page = data.replace('page-fragment.xql?document=%s'%str(path),'%s?url=%s&viewMode=%s&tocMode=%s&tocPN=%s&optionToggle=1'%(selfurl,url, viewMode, tocMode, tocPN))
492	text = page.replace('mode=image','mode=texttool')
493	logging.debug("documentViewer (characterNormalization) characterNormalization: %s"%(characterNormalization))
494	#logging.debug("documentViewer (characterNormalization) text: %s"%(text))
495	return text
496
497	def manage_changeMpdlXmlTextServer(self,title="",serverUrl="http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/interface/",timeout=40,RESPONSE=None):
498	"""change settings"""
499	self.title=title
500	self.timeout = timeout
501	self.serverUrl = serverUrl
502	if RESPONSE is not None:
503	RESPONSE.redirect('manage_main')
504
505	# management methods
506	def manage_addMpdlXmlTextServerForm(self):
507	"""Form for adding"""
508	pt = PageTemplateFile("zpt/manage_addMpdlXmlTextServer", globals()).__of__(self)
509	return pt()
510
511	def manage_addMpdlXmlTextServer(self,id,title="",serverUrl="http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/interface/",timeout=40,RESPONSE=None):
512	"""add zogiimage"""
513	newObj = MpdlXmlTextServer(id,title,serverUrl,timeout)
514	self.Destination()._setObject(id, newObj)
515	if RESPONSE is not None:
516	RESPONSE.redirect('manage_main')
517
518
519

Note: See TracBrowser for help on using the repository browser.

Download in other formats: