Annotation of ECHO_content/ECHO_language.py, revision 1.1

1.1     ! dwinter     1: """Methoden fuer Language Technologies"""
        !             2: def donatus(txt2):
        !             3:    import xmlrpclib
        !             4: 
        !             5:    server = xmlrpclib.ServerProxy("http://archimedes.fas.harvard.edu/cgi-bin/donatus-rpc")
        !             6: 
        !             7:    txt=txt2.encode('utf-8')
        !             8:    bin=xmlrpclib.Binary(txt)
        !             9: 
        !            10:    
        !            11: 
        !            12:    ret=server.donatus.analyze(bin)
        !            13: 
        !            14:        
        !            15:    return ret['morphData'].data
        !            16: 
        !            17: 
        !            18: def donatusVariant2Lemma(morphData):
        !            19:    """creates hash variant -> morphdata"""
        !            20:    ret={}
        !            21:    dom=xml.dom.minidom.parseString(morphData)
        !            22:    lemmas=dom.getElementsByTagName('lemma')
        !            23:    for lemma in lemmas:
        !            24:        variants=lemma.getElementsByTagName('variant')
        !            25:        for variant in variants:
        !            26:            atr=variant.getAttribute('form')
        !            27:            if ret.has_key(atr):
        !            28:                ret[atr].append=lemma.getAttribute('form')
        !            29:            else:
        !            30:                ret[atr]=[lemma.getAttribute('form')]
        !            31: 
        !            32:    return ret

FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>