== Themen == * chinesische Texte: links-rechts-Metapher * zzzz.jpg * draft des Fortführungsantrags? * Benedetti-Email 5.7.10 * nochmal Normalisierung: * normalisiert als default * normalisiert = original --> regularisiert --> normalisiert * Normalisierung für Deutsch: Beispiel George Adams [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0 original], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0&characterNormalization=norm normalisiert] * Wieso werden in einem deutschen Text keine Pollux-links angezeigt? --> es gibt kein deutsches Wörterbuch * Module für Normalisierung in Lex? * worinn, Elektricität: wo ansiedeln? Sprachspezifische Entscheidungen, je nach Standardisierbarkeit der Orthographie? Deutsch: 21. Jh. (Rechtschreibreform), 20. Jh (nach der Rechtschreibkonferenz), 19. Jh (bereits weitgehend standardisiert, aber zum Beispiel "Thier"?) 18. Jh. und früher: unterschiedliche Schreibweisen im gleichen Text. Zwischenschicht zwischen Regularisierung und Normalisierung? * Adams index.meta: "Versuch über die Elektrizität [Elektricität], worinn Theorie und ..." * Normalisierung für Englisch: Es kann nicht sinnvoll sein, "thou hast" zu "you have" zu machen. * Betacode-Umwandlung auch bei als Latein markierten Stellen: Heron in [source:trunk/texts/eXist/archimedesOldCVSRepository/archimedes/xml/heron_mecha_089_el_1899.xml Betacode] (Archimedes-CVS), und in [source:trunk/texts/eXist/archimedes/el/heron_mecha_089_el_1899.xml Unicode]; aber: getrenntes Archimedes-Meeting! * Neue Pipeline: * chinesische Texte für Cathleen Päthe * Pauls Text: Swineshead * EchoBildskalierung und Roberts Antwort == halb erledigt == * Stand bei ? Josefs Teil ist fertig, Falks Teil soll 2010-07-13 fertig sein, Andreys Teil ist noch nicht fertig. == erledigt == * xmllint-Email 2.7.10 * Texte jetzt schon einsortieren, oder erst mit überarbeiteten Skripten erzeugte Versionen? --> Mehrheit für jetzt schon einsortieren