durchnumerieren (auch für DTD-Fragment)
* Wrapper für XSLT-Skripte, um Nebenwirkungen zu korrigieren
* Chinesischer Workflow:
* Skript für Zeichenvarianten
Bearbeitungsstand
* Konzept fertig
* die Grundstruktur ist implementiert und verwendbar
* müssen überarbeitet werden: s, emph, ...
* fehlen noch: korrekte Verarbeitung von Tabellen, Fußnoten, ...
* kurzfristiges Ziel: Skripte so einfach wie möglich verwendbar machen
*
und allgemein overlays weiter ausarbeiten
Problem der Fehlerkorrektur:
* interessant sind nur echte Satzfehler
* Transkriptionsfehler werden stillschweigend korrigiert
Konzept: Editionssystem
* killer feature
* geht über klassische Text-Editionen hinaus
* Werkzeug zur Beseitigung von Transkriptionsfehlern
* Regularisierung: -Skript, Zusammenarbeit mit Paul
* Normalisierung: Lex-Skripte, Koordinierung mit Josef und Robert
* was wird übergeben
* was kommt zurück
* Zeilenumbrüche
für 1.0:
* Konzept: ist 1.0
* Skripte: alle Skripte durchgehen, so dass die vorhandenen Texte als fertig bezeichnet werden können. insbesondere
*
* Tabellen
*
* Brüche
* chinesischer Workflow
* (Formeln: nur eine erste Version)
* (noch nicht: Textflows)
* 3 Wochen
* Workflow anwenden:
* chinesische Texte mit neuen Specs nach China schicken
* überarbeitete Skripte anwenden auf die vorhandenen Texte (Klaus)
* aber zuerst, dringend: Texte von WO 10 prüfen
* 0,5 Wochen
für Version 1.x:
* Workflow für Texte, die nicht aus China kommen
* weitere Texte schicken, insbesondere Special Instructions für Pauls Texte
* schwierigere Texte fertig umwandeln
* chinesische Texte umwandeln
* Programm-Code der Skripte glatter machen, damit es nicht so unübersichtlich wie in Arboreal ist
* Textflow-Skript
* Konzept für overlays aus XML-Sicht
für Version 2.0:
* Einfaches Paket, das von interessierten Forschern leicht verwendet werden kann. (siehe auch 8. Scholarly Workflow)
* Umgang mit Formeln
== 4. Zusammenspiel XML und Anzeigesystem
Mitarbeit am Konzept für die Anzeige von:
* Buchstruktur
* Textseite
* Bildseite
* Anzeige-Optionen
* Wörterbuch-Informationen
* Suchergebnissen
* Besonderheiten bei chinesischem Text
* statische Versionen, Lite-Version, URLs, etc.
[wiki:ticket-overview Überblick] über die Tickets
* für Frontend, Backend, GIS
* Umsetzungen des Konzepts, und Bugs
Liste: Verhalten für jedes tag, [wiki:echo-schema#a3.UmsetzungderXML-tags im Text] und [source:"trunk/papers/discussion_papers/Regeln zum Erstellen eines Inhaltsverzeichnisses.pdf" im Inhaltsverzeichnis]
* Beispiele für Darstellung von tags:
* CSS-level: optisch erkennbar
* Sprachtechnologie: wird nicht oder anders analysiert: ,
[wiki:normalization Normalisierung]:
* genaue Analyse des Ist-Zustands in Arboreal und im Backend
* [wiki:normalization/4 Übersicht] über das Zusammenspiel von Regularisierung und Normalisierung
* [wiki:normalization/5 Regularisierung] im Detail:
* Ziele
* Zusammenhang mit Anzeige-Modi
* @faithul-Attribut
* für "überschüssige" Information und zur Unterstützung bei der Korrektur von Transkriptionsfehlern
* Abgrenzung von Orig und faithful
* Umgang mit PUA-Zeichen
* Umgang mit Abkürzungen im Text
* Aussicht: automatische Fehlerkorrektur
* Sprachübergreifende Regularisierungen
* Regularisierungen für einzelne Sprachen
* [wiki:normalization/6 Normalisierung] im Detail:
* Ziele
* Textgestalt, die die Normalisierung vorfindet
* Normalisierung für die Textanzeige
* Normalisierung für Wörterbücher (sprachimmanent und technisch bedingt)
* Normalisierung für die Suche
* Verhältnis von Wortform und Grundform
* Diakritika
* Sprachschichten
* sprachübergreifende Normalisierungen
* Normalisierungen für einzelne Sprachen, insbesondere Latein, und Umgang mit Zeichenvarianten im Chinesischen
* Umsetzung
* Liste: [wiki:normalization/7 konkret zu tun]
* [source:trunk/schema/scripts/MpdlNormalizerLex Lex] für jede Sprache (mit Java-Testerklassse)
für Version 1.0:
* Normalisierung fertig, wiki-Text an den aktuellen Stand anpassen, paper
* Lex testen
* 1 Woche
für Version 1.x:
* Umgang mit Textflows klären: Eipo, Conimbricenses, Übersetzungen, Notes, etc.
* TOC-Skript
== 5. Zusammenspiel XML und GIS
* Übergang vom alten Frontend (Falk) zum neuen Frontend (!Christopher/Robert) angestoßen und begleitet
* Konzept: Verknüpfung Frontend mit GIS (Integration der Projektteile)
* : mit Dagmar und Grace: Konzept für
* overlay mit Tabelle (GIS-System als Prototyp für overlay)
* Inhalt der Tabelle
* Struktur des authority file
für Version 1.0:
* Konzept für die Verzahnung von -Tabellen, Annotationen, Overlays, Kartenanzeige (gemeinsame Infrastruktur)
* 0,5 Wochen
== 6. Vorzeigetexte
Latein
* [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?url=/mpiwg/online/permanent/library/163127KK&pn=5 Benedetti]: europäischer Vorzeigetext; für Jürgen
* [http://echo.mpiwg-berlin.mpg.de/ECHOdocuView?url=/mpiwg/online/permanent/library/YHKVZ7B4&pn=5 Alvarus]: früher gedruckter Text mit vielen Abkürzungen; für Paul
* Clavius-Euklid: für das Euklid-Projekt
Chinesisch
* [http://echo.mpiwg-berlin.mpg.de/ECHOdocuViewfull?url=/mpiwg/online/permanent/echo/china/songy_tiang_zh_1637 Song Yingxing]: chinesischer Vorzeigetext; places; für Dagmar
* [http://mpdl-dev.mpiwg-berlin.mpg.de/ECHOdocuViewfull?url=/mpiwg/online/permanent/library/02NT95YF&viewMode=text&pn=5&characterNormalization=reg chinesischer Euklid]: für das Euklid-Projekt
Deutsch
* [http://mpdl-dev.mpiwg-berlin.mpg.de/ECHOdocuViewfull?url=/mpiwg/online/permanent/library/XYZATWZM Heeschen] (Eipomek und Deutsch): Textflows; für Martin T.
* [http://mpdl-dev.mpiwg-berlin.mpg.de/ECHOdocuViewfull?url=/mpiwg/online/permanent/library/0QDF6SH2&pn=7 Abruzzen]: Text ursprünglich von Martin R. erstellt, in Zusammenarbeit mit Martin in einen Schema-konformen Text umgewandelt.
Diverse Skripte für Einzeltexte, insbesondere bei den ersten Texten und für Nachbearbeitungen
für Version 1.0:
* Alvarus:
* Song Yingxing fertig, und an neue Schema-Version anpassen
* Clavius schemakonform machen
* 1 Woche
für Version 1.x:
* places in Benedetti markieren
== 7. Wiki und Dokumentation
* Dokumentation: DESpecs (fehlt), [wiki:echo-schema Schema], [wiki:workflow Workflow]
* werde ich in ein Unterverzeichnis documentation/de bzw. documentation/en verschieben
* Diskussionstexte: Ich versuche, meine Überlegungen zeitnah ins Wiki zu stellen, damit sie diskutiert werden können. (Beispiel [wiki:pagenumbers Seitenzahlen])
für Version 1.0:
* Skripte genauer dokumentieren
* 1 Woche
für Version 1.x:
* Computer durchgehen auf weitere Dinge, eventuell aufs wiki stellen
* Workflow-Dokumentation überarbeiten
* [wiki:echo-schema#a2.UsageGuide Usage Guide] weiter
* Dokumentation der DESpecs
* wiki aktualisieren
* [source:trunk/schema/xml-test-files Beispiel-XML-Dateien] überarbeiten
* Anbindung an andere Projekte und Europeana
* paper
== 8. Scholarly workflow
* im Schema bereits angelegt
* Anfänge sind gemacht mit -Skript
für Version 2.0:
* Skripte für scholarly workflow
* zusätzliche Auszeichnungen wie
* Korrektur von bestehenden Auszeichnungen wie
* Skripte für Texte aus anderen Quellen, z.B. Stabi
* Interaktivität insbesondere im scholarly workflow, aber auch in den Schritten davor
* Web-Services