diff addDriToIndexMeta.py @ 36:be8640c08d99

Updatedri in harbestToPUrl ge?ndert. jetzt werden gegebenenfalls dris aus den index.meta gelesen und in die db geschrieben, falls sie noch nicht existieren. ausserdem wird in den daten isdri=TRUE gesetzt, wenn es ich bei der PURL um eine handelt die auf ein DRI in den index.meta verweist.
author dwinter
date Mon, 03 Mar 2014 17:32:06 +0100
parents 0190f49bce88
children a33fa2377075
line wrap: on
line diff
--- a/addDriToIndexMeta.py	Wed Oct 23 12:28:22 2013 +0200
+++ b/addDriToIndexMeta.py	Mon Mar 03 17:32:06 2014 +0100
@@ -34,7 +34,23 @@
                 changed=True
     
     return changed
+
+
+def getDRIfromIndexMeta(fl):
+    try:
+        tree = etree.parse(fl)
+    except:
+        parseErrorFile.write("PARSE ERROR:"+fl+"\n")
+        return False
     
+    dris = tree.xpath("/resource/meta/dri[@type='mpiwg']")
+    
+    if len(dris)==0:
+        return None
+    else:
+        return dris[0].text
+
+
 def addPURL(fl,purl,test=False):
     try:
         tree = etree.parse(fl)