Changes between Version 30 and Version 31 of TeamMeeting


Ignore:
Timestamp:
Jul 15, 2010, 8:33:10 AM (14 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • TeamMeeting

    v30 v31  
    1 == Themen ==
     1== Team Meeting: Themen ==
    22
    3   * chinesische Texte: links-rechts-Metapher
    4   * zzzz.jpg
    53  * draft des Fortführungsantrags?
    6   * Benedetti-Email 5.7.10
    7   * nochmal Normalisierung:
     4
     5=== Workflow ===
     6
     7  * Simones Email 2010-07-12: Koordination mit ECHO
     8    * Texte jetzt schon einsortieren, oder erst mit überarbeiteten Skripten erzeugte Versionen?  --> 2010-07-08: so früh wie möglich verfügbar machen
     9    * Es gibt offenbar keinen zentralen Ort in Echo mehr, wo auf alle MPDL-Texte verwiesen wird. In Josefs System gibt es aber noch eine Liste.
     10    * Was passiert, wenn Benedetti_1585.xml in Benedetti_1585_163127KK.xml umbenannt wird? Ist das ein Problem?
     11
     12  * Problem mit zero width space U+200B ?
     13
     14  * zzzz.jpg: Gehört diese Seite zum Buch und sollte deshalb ein <pb> haben, oder nicht?
     15
     16  * Normalisierung für Deutsch:
     17    * Beispiel George Adams [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0 original], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0&characterNormalization=norm normalisiert]: ich werde Normalisierungsmodule schreiben, mit Unterscheidung von Anzeige und Version für Pollux.
     18    * In Lex? --> 2010-07-08: Ja, JFlex.
     19    * worinn, Elektricität: wo ansiedeln? Sprachspezifische Entscheidungen, je nach Standardisierbarkeit der Orthographie? Deutsch: 21. Jh. (Rechtschreibreform), 20. Jh (nach der Rechtschreibkonferenz), 19. Jh (bereits weitgehend standardisiert, aber zum Beispiel "Thier"?) 18. Jh. und früher: unterschiedliche Schreibweisen im gleichen Text. Zwischenschicht zwischen Regularisierung und Normalisierung?
     20    * Adams index.meta: "Versuch über die Elektrizität [Elektricität], worinn Theorie und ..."
     21  * Normalisierung für Englisch: Es kann nicht sinnvoll sein, "thou hast" zu "you have" zu machen, nicht einmal in der Version für Pollux. Was macht man statt dessen?
     22
     23  * Status:
     24    * über 60 Texte
     25    * Verbesserungen der Workflow-Skripte sind in Arbeit
     26    * reg
     27    * Chinesisch
     28 
     29=== Frontend ===
     30
     31  * chinesische Texte: Implementierung der links-rechts-Metapher (links-Pfeil geht von Seite 100 auf Seite 101, rechts-Pfeil von Seite 100 auf Seite 99) steht noch an
     32
     33  * Pollux: [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView/template/fulltextclient?url=/mpiwg/online/permanent/library/163127KK&viewMode=text_dict&tocMode=text&tocPN=5&mode=texttool&pn=296 Beispiel-Seite], dort klick auf (ex) [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView/template/fulltextclient/template/head_main_voc?language=la&query=sue%20suo%20sus%20suum%20suus ſuis]:
     34   * Die Popup-Seite wird nicht in den Vordergrund gebracht, wenn sie im Hintergrund ist und man nochmal auf einen Wörterbuch-link klickt.
     35
     36  * EchoBildskalierung (erstmal mit Robert besprechen)
     37 
     38=== Backend ===
     39
     40  * Pollux: [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView/template/fulltextclient?url=/mpiwg/online/permanent/library/163127KK&viewMode=text_dict&tocMode=text&tocPN=5&mode=texttool&pn=296 Beispiel-Seite], dort klick auf (ex) [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView/template/fulltextclient/template/head_main_voc?language=la&query=sue%20suo%20sus%20suum%20suus ſuis]:
     41   * Als erstes kommt "Suē, ēs, f., a town in Assyria", was sicher extrem selten das ist, was der Benutzer sucht (verschieben auf "linguistische Analyse", 2011 ?)
     42   * Der Eintrag ist nicht richtig formatiert.
     43  * Normalisierung:
    844    * normalisiert als default
    945    * normalisiert = original --> regularisiert --> normalisiert
    10   * Normalisierung für Deutsch: Beispiel George Adams [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0 original], [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fde%2FAdams_1785_S7ECRGW8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0&characterNormalization=norm normalisiert]
    11     * Wieso werden in einem deutschen Text keine Pollux-links angezeigt? --> es gibt kein deutsches Wörterbuch
    12     * Module für Normalisierung in Lex?
    13     * worinn, Elektricität: wo ansiedeln? Sprachspezifische Entscheidungen, je nach Standardisierbarkeit der Orthographie? Deutsch: 21. Jh. (Rechtschreibreform), 20. Jh (nach der Rechtschreibkonferenz), 19. Jh (bereits weitgehend standardisiert, aber zum Beispiel "Thier"?) 18. Jh. und früher: unterschiedliche Schreibweisen im gleichen Text. Zwischenschicht zwischen Regularisierung und Normalisierung?
    14     * Adams index.meta: "Versuch über die Elektrizität [Elektricität], worinn Theorie und ..."
    15   * Normalisierung für Englisch: Es kann nicht sinnvoll sein, "thou hast" zu "you have" zu machen.
     46    * Wieso werden in einem deutschen Text keine Pollux-links angezeigt? --> 2010-07-08: es gibt kein deutsches Wörterbuch
     47  * Numerierung der figures: Die Numererirung sollte nicht völlig durcheinandergeraten, wenn Verzierungen den Status als Figure verlieren ([http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fla%2FArchimedes_1565_YS05QMU8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0 Beispiel])
     48  * Entschlackung der URLs beim Prototyp-Frontend: Zum Beispiel [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?tocMode=thumbs&url=%2Fmpiwg%2Fonline%2Fpermanent%2Flibrary%2F1X8T70WB&viewMode=text&tocPN=1&searchPN=1&query=&pn=5&queryType= diese URL] (unwichtig?)
     49
     50=== Archimedes-Texte ===
     51
    1652  * Betacode-Umwandlung auch bei als Latein markierten Stellen: Heron in [source:trunk/texts/eXist/archimedesOldCVSRepository/archimedes/xml/heron_mecha_089_el_1899.xml Betacode] (Archimedes-CVS), und in [source:trunk/texts/eXist/archimedes/el/heron_mecha_089_el_1899.xml Unicode]; aber: getrenntes Archimedes-Meeting!
    17   * Neue Pipeline:
    18     * chinesische Texte für Cathleen Päthe
    19     * Pauls Text: Swineshead
    20   * EchoBildskalierung und Roberts Antwort
    21   * Entschlackung der URLs: Zum Beispiel [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?tocMode=thumbs&url=%2Fmpiwg%2Fonline%2Fpermanent%2Flibrary%2F1X8T70WB&viewMode=text&tocPN=1&searchPN=1&query=&pn=5&queryType= diese URL]
    22   * Numerierung der figures: [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/page-query-result.xql?document=%2Fecho%2Fla%2FArchimedes_1565_YS05QMU8.xml&mode=text&pn=5&sn=-1&query-type=&query=&query-result-pn=0 Beispiel]
    23   * Simones Email 2010-07-12
    24   * Problem mit zero width space U+200B ?
    2553
    26 == halb erledigt ==
     54=== Text-Pipeline ===
    2755
    28   * Stand bei <place> ? Josefs Teil ist fertig, Falks Teil soll 2010-07-13 fertig sein, Andreys Teil ist noch nicht fertig.
     56  * chinesische Texte für Cathleen Päthe: SIs in Arbeit; Testseiten, Kostenvoranschläge
     57  * Pauls Text: Swineshead
     58
    2959
    3060== erledigt ==
    3161
    32   * xmllint-Email 2.7.10
    33   * Texte jetzt schon einsortieren, oder erst mit überarbeiteten Skripten erzeugte Versionen?  --> Mehrheit für jetzt schon einsortieren. Von Simone bereits umgesetzt.
    34     * Es gibt offenbar keinen zentralen Ort in Echo mehr, wo auf alle MPDL-Texte verwiesen wird. In Josefs System gibt es aber noch eine Liste.
    35     * Was passiert, wenn Benedetti_1585.xml in Benedetti_1585_163127KK.xml umbenannt wird? Ist das ein Problem?
     62  * Stand bei <place> ? Josefs Teil ist fertig, Falks Teil ist fertig. Andreys Teil?
     63  * xmllint-Email 2.7.10: Ursache des Kodierungsproblems ist zwar nicht völlig geklärt, tritt aber im Normalfall nicht auf
    3664
    3765