6 | | * Benedetti-Email 5.7.10 |
7 | | * nochmal Normalisierung: |
| 4 | |
| 5 | === Workflow === |
| 6 | |
| 7 | * Simones Email 2010-07-12: Koordination mit ECHO |
| 8 | * Texte jetzt schon einsortieren, oder erst mit überarbeiteten Skripten erzeugte Versionen? --> 2010-07-08: so früh wie möglich verfügbar machen |
| 9 | * Es gibt offenbar keinen zentralen Ort in Echo mehr, wo auf alle MPDL-Texte verwiesen wird. In Josefs System gibt es aber noch eine Liste. |
| 10 | * Was passiert, wenn Benedetti_1585.xml in Benedetti_1585_163127KK.xml umbenannt wird? Ist das ein Problem? |
| 11 | |
| 12 | * Problem mit zero width space U+200B ? |
| 13 | |
| 14 | * zzzz.jpg: Gehört diese Seite zum Buch und sollte deshalb ein <pb> haben, oder nicht? |
| 15 | |
| 16 | * Normalisierung für Deutsch: |
| 17 | * Beispiel George Adams [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0 original], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0&characterNormalization=norm normalisiert]: ich werde Normalisierungsmodule schreiben, mit Unterscheidung von Anzeige und Version für Pollux. |
| 18 | * In Lex? --> 2010-07-08: Ja, JFlex. |
| 19 | * worinn, Elektricität: wo ansiedeln? Sprachspezifische Entscheidungen, je nach Standardisierbarkeit der Orthographie? Deutsch: 21. Jh. (Rechtschreibreform), 20. Jh (nach der Rechtschreibkonferenz), 19. Jh (bereits weitgehend standardisiert, aber zum Beispiel "Thier"?) 18. Jh. und früher: unterschiedliche Schreibweisen im gleichen Text. Zwischenschicht zwischen Regularisierung und Normalisierung? |
| 20 | * Adams index.meta: "Versuch über die Elektrizität [Elektricität], worinn Theorie und ..." |
| 21 | * Normalisierung für Englisch: Es kann nicht sinnvoll sein, "thou hast" zu "you have" zu machen, nicht einmal in der Version für Pollux. Was macht man statt dessen? |
| 22 | |
| 23 | * Status: |
| 24 | * über 60 Texte |
| 25 | * Verbesserungen der Workflow-Skripte sind in Arbeit |
| 26 | * reg |
| 27 | * Chinesisch |
| 28 | |
| 29 | === Frontend === |
| 30 | |
| 31 | * chinesische Texte: Implementierung der links-rechts-Metapher (links-Pfeil geht von Seite 100 auf Seite 101, rechts-Pfeil von Seite 100 auf Seite 99) steht noch an |
| 32 | |
| 33 | * Pollux: [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView/template/fulltextclient?url=/mpiwg/online/permanent/library/163127KK&viewMode=text_dict&tocMode=text&tocPN=5&mode=texttool&pn=296 Beispiel-Seite], dort klick auf (ex) [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView/template/fulltextclient/template/head_main_voc?language=la&query=sue%20suo%20sus%20suum%20suus ſuis]: |
| 34 | * Die Popup-Seite wird nicht in den Vordergrund gebracht, wenn sie im Hintergrund ist und man nochmal auf einen Wörterbuch-link klickt. |
| 35 | |
| 36 | * EchoBildskalierung (erstmal mit Robert besprechen) |
| 37 | |
| 38 | === Backend === |
| 39 | |
| 40 | * Pollux: [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView/template/fulltextclient?url=/mpiwg/online/permanent/library/163127KK&viewMode=text_dict&tocMode=text&tocPN=5&mode=texttool&pn=296 Beispiel-Seite], dort klick auf (ex) [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView/template/fulltextclient/template/head_main_voc?language=la&query=sue%20suo%20sus%20suum%20suus ſuis]: |
| 41 | * Als erstes kommt "Suē, ēs, f., a town in Assyria", was sicher extrem selten das ist, was der Benutzer sucht (verschieben auf "linguistische Analyse", 2011 ?) |
| 42 | * Der Eintrag ist nicht richtig formatiert. |
| 43 | * Normalisierung: |
10 | | * Normalisierung für Deutsch: Beispiel George Adams [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0 original], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0&characterNormalization=norm normalisiert] |
11 | | * Wieso werden in einem deutschen Text keine Pollux-links angezeigt? --> es gibt kein deutsches Wörterbuch |
12 | | * Module für Normalisierung in Lex? |
13 | | * worinn, Elektricität: wo ansiedeln? Sprachspezifische Entscheidungen, je nach Standardisierbarkeit der Orthographie? Deutsch: 21. Jh. (Rechtschreibreform), 20. Jh (nach der Rechtschreibkonferenz), 19. Jh (bereits weitgehend standardisiert, aber zum Beispiel "Thier"?) 18. Jh. und früher: unterschiedliche Schreibweisen im gleichen Text. Zwischenschicht zwischen Regularisierung und Normalisierung? |
14 | | * Adams index.meta: "Versuch über die Elektrizität [Elektricität], worinn Theorie und ..." |
15 | | * Normalisierung für Englisch: Es kann nicht sinnvoll sein, "thou hast" zu "you have" zu machen. |
| 46 | * Wieso werden in einem deutschen Text keine Pollux-links angezeigt? --> 2010-07-08: es gibt kein deutsches Wörterbuch |
| 47 | * Numerierung der figures: Die Numererirung sollte nicht völlig durcheinandergeraten, wenn Verzierungen den Status als Figure verlieren ([http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fla%2FArchimedes_1565_YS05QMU8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0 Beispiel]) |
| 48 | * Entschlackung der URLs beim Prototyp-Frontend: Zum Beispiel [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?tocMode=thumbs&url=%2Fmpiwg%2Fonline%2Fpermanent%2Flibrary%2F1X8T70WB&viewMode=text&tocPN=1&searchPN=1&query=&pn=5&queryType= diese URL] (unwichtig?) |
| 49 | |
| 50 | === Archimedes-Texte === |
| 51 | |
32 | | * xmllint-Email 2.7.10 |
33 | | * Texte jetzt schon einsortieren, oder erst mit überarbeiteten Skripten erzeugte Versionen? --> Mehrheit für jetzt schon einsortieren. Von Simone bereits umgesetzt. |
34 | | * Es gibt offenbar keinen zentralen Ort in Echo mehr, wo auf alle MPDL-Texte verwiesen wird. In Josefs System gibt es aber noch eine Liste. |
35 | | * Was passiert, wenn Benedetti_1585.xml in Benedetti_1585_163127KK.xml umbenannt wird? Ist das ein Problem? |
| 62 | * Stand bei <place> ? Josefs Teil ist fertig, Falks Teil ist fertig. Andreys Teil? |
| 63 | * xmllint-Email 2.7.10: Ursache des Kodierungsproblems ist zwar nicht völlig geklärt, tritt aber im Normalfall nicht auf |