--- MPIWGWeb/MPIWGProjects.py	2006/08/15 13:28:29	1.47.2.58
+++ MPIWGWeb/MPIWGProjects.py	2006/09/13 08:17:33	1.47.2.59
@@ -33,6 +33,7 @@ from Ft.Xml.XPath import Evaluate
 from Ft.Xml.XPath.Context import Context
 from Ft.Xml.Domlette import NonvalidatingReader,PrettyPrint, Print
 from Ft.Xml import EMPTY_NAMESPACE
+import psycopg
 
 definedFields=['WEB_title','xdata_01','xdata_02','xdata_03','xdata_04','xdata_05','xdata_06','xdata_07','xdata_08','xdata_09','xdata_10','xdata_11','xdata_12','xdata_13','WEB_project_header','WEB_project_description','WEB_related_pub']
 
@@ -1444,7 +1445,61 @@ class MPIWGRoot(ZSQLExtendFolder):
         
         return (fieldname in checkFields)
 
-        
+    
+    def generateNameIndex(self):
+        """erzeuge einen index verwendeter personen"""
+        o = psycopg.connect('dbname=authorities user=dwinter password=3333',serialize=0) 
+        results={}
+        print self.fulltext.historicalNames.items()
+        for nameItem in self.fulltext.historicalNames.items(): #gehe durch alle namen des lexikons
+            
+            c = o.cursor() 
+            name=nameItem[0]
+            print "check",name
+            c.execute("select lastname,firstname from persons where lower(lastname) = '%s'"%quote(name))
+            tmpres=c.fetchall()
+            firstnames=[result[1] for result in tmpres] # find all firstnames
+            if tmpres:
+                lastname=tmpres[0][0]
+                
+            for found in self.fulltext({'names':name}):
+                if found.getObject().isActual():
+                    for nh in found.getObject().getGetNeighbourhood(name, length=50,tagging=False): #hole umgebung
+                        #schaue nun ob der vorname hinter oder vor dem name ist
+                        position=nh.find(lastname)
+                        # vorher
+                        #print "NH",nh
+                        bevorS=nh[0:position].split()
+                        #print "BV",bevorS
+                        if len(bevorS)>1:
+                            try:
+                                bevor=[bevorS[-1],bevorS[-2]]
+                            except:
+                                bevor=[bevorS[0]]
+                        else:
+                            bevor=[]
+                        #nachher
+                        behindS= re.split("[,|;| ]",nh[position:]) 
+                        #print "BH",behindS
+                        if len(behindS)>2:
+                            try:
+                                behind=behindS[1:3]
+                            except:
+                                behind=[bevorS[1]]
+                        else:
+                            behind=[]
+                        for firstname in firstnames:
+                            if firstname in bevor+behind: #Namen wie mit Adelspraedikaten werden so erstmal nich gefunden
+                                id="%s,%s"%(lastname,firstname)
+                                if not results.has_key(id):
+                                    results[id]=[]
+                                objId=found.getObject().getId()
+                                if not (objId in results[id]):
+                                    print "added %s for %s"%(id,objId)    
+                                    results[id].append(objId)    
+            self.nameIndex=results
+        return results
+                    
 def manage_addMPIWGRootForm(self):
     """form for adding the root"""
     pt=PageTemplateFile(os.path.join(package_home(globals()),'zpt','addMPIWGRootForm.zpt')).__of__(self)
@@ -1730,7 +1785,7 @@ class MPIWGProject(CatalogAware,Folder):
         if RESPONSE:
             RESPONSE.redirect('manageImages')
 
-    
+ 
     def hasChildren(self,date=None,onlyActive=True):
         """check if project has children"""
         ct=self.getContexts(childs=self.getContent('xdata_05'),
@@ -1969,13 +2024,14 @@ class MPIWGProject(CatalogAware,Folder):
         pt=PageTemplateFile(os.path.join(package_home(globals()),'zpt','no_project')).__of__(self)
         return pt()
      
-    def getGetNeighbourhood(self,wordStr, length=100):
+    def getGetNeighbourhood(self,wordStr, length=100,tagging=True):
         """finde umgebung um die worte in wordStr, zurŸckgegeben wird eine Array mit den Umgebungen von Fundstellen der Worte
         alle Tags werden entfernt, die Fundstellen werden mit <span class="found">XX</span> getaggt, die Umgebungen werden 
         case insensitive gesucht
         @param wordStr: string mit Worten getrennt durch Leerzeichen, Phrasen sind mit " gekennzeichnet
                         "eine phrase", "*"  bezeichnet wildcards und wird ignoriert"
         @param length: optional, default wert 100, 2*length ist die grš§e der Umgebung
+        @param tagging: optional default wert true, kein span tag wird erzweugt falls tag=false
         """
         
         ret=[] # nimmt das Array auf, dass spŠter zurŸckgegeben wird
@@ -2008,7 +2064,8 @@ class MPIWGProject(CatalogAware,Folder):
         #   words=[words]
             
         txt=self.harvest_page()
-       
+        if not txt:
+            return ret
         txt=re.sub("<.*?>", "", txt) # loesche alle Tags
         for word in words:
             word=re.sub("_"," ",word) # ersetze zurueck "_" durch " "
@@ -2046,10 +2103,11 @@ class MPIWGProject(CatalogAware,Folder):
                     break;
                 
         # now highlight everything        
-        for x in range(len(ret)):
-            for word in words:
-                repl=re.compile(word,re.IGNORECASE)
-                ret[x]=repl.sub(""" <span class="found">%s</span>"""%word.upper(),ret[x])
+        if tagging:
+            for x in range(len(ret)):
+                for word in words:
+                    repl=re.compile(word,re.IGNORECASE)
+                    ret[x]=repl.sub(""" <span class="found">%s</span>"""%word.upper(),ret[x])
 
         return ret