Changes between Version 2 and Version 3 of workflow_tutorial
- Timestamp:
- Jun 16, 2011, 1:17:27 PM (13 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
workflow_tutorial
v2 v3 3 3 Die Textauswahl (Zonca) ist dadurch begründet, daß dieser Text mit nur 4 4 minimalem Eingreifen zu konvertieren ist. Dieses Tutorium beschreibt 5 die Konversion eines Textes, der gemäß der DE_Specsdigitalisiert5 die Konversion eines Textes, der gemäß der [wiki:despecs DE_Specs] digitalisiert 6 6 wurde. Es liegen also vor: 7 - Digitale Bilder jeder einzelnen Buchseite sowie Buchdeckel und -rücken 8 - eine Datei, die die Metadaten enthält: {{{index.meta}}} 7 - Digitale Bilder jeder einzelnen Buchseite sowie Buchdeckel und -rücken (auf Foxridge) 8 - eine Datei, die die Metadaten enthält: {{{index.meta}}} (auf Foxridge) 9 9 - Datei mit dem nach den DE_Specs abgetippten Inhalt des Buches ([source:/trunk/texts//WO_5/Zonca_1656/raw/Zonca_1656_UR271U6Y.txt hier]) 10 10 Dem Buch ist eine ID zugewiesen worden, mit der es auffindbar ist. 11 11 12 Es wird davon ausgegangen, daß eine Arbeitskopie des Text- und 13 Softwarerepositoriums vorliegt. Dieses befindet sich unter 14 Versionskontrolle (Subversion) und sollte ausgecheckt und aktualisiert sein. Eine Anleitung gibt es [wiki:Repository_tour#Versionskontrolle hier] 12 Es wird davon ausgegangen, daß eine Arbeitskopie des Text- und Softwarerepositoriums vorliegt. Dieses befindet sich unter Versionskontrolle (Subversion) und sollte ausgecheckt und aktualisiert sein. Eine Anleitung gibt es [wiki:Repository_tour#Versionskontrolle hier] 15 13 16 14 Zuletzt müssen in zwei Dateien Änderungen vorgenommen werden: 17 1. in {{{ trunk/schema/scripts/workflow/mpdl-workflow-settings.txt}}} muß der richtige Pfad für das Repositorium angegeben werden.18 1. in {{{ trunk/texts/aux/default-parameters.txt}}} ist anzugeben, welche Datei der unknown characters zu nehmen ist. Dies ist abhängig vom Work Order.15 1. in {{{<svn-Verzeichnis>/schema/scripts/workflow/mpdl-workflow-settings.txt}}} muß der richtige Pfad für das Repositorium angegeben werden. 16 1. in {{{<svn-Verzeichnis>/texts/aux/default-parameters.txt}}} ist anzugeben, welche Datei der unknown characters zu nehmen ist. Dies ist abhängig vom Work Order. 19 17 20 18 … … 34 32 1. {{{filter4makeschemaandcheck}}} ausführen und log prüfen (könnten 35 33 Warnungen wegen der Byte Order Mark auftreten) (Textwrangler: 36 {{{Filter_4_make_valid.pl}}} und {{{Filter_4_test_valid ty.pl}}})34 {{{Filter_4_make_valid.pl}}} und {{{Filter_4_test_validity.pl}}}) 37 35 1. {{{filter5numberdivs}}} ausführen, der das DTD-Fragment auflöst 38 36 (Textwrangler: {{{Filter_5_06_number_divs.pl}}}) … … 44 42 plattformunabhängige Arbeit. Eine Verbindung mit dem Internet ist 45 43 jedoch erforderlich. 44 45 NB: die in dieser Variante erwähnten Skripte ({{{filter...}}}) sind wie folgt aufzurufen: 46 {{{ 47 sh <svn-Verzeichnis>/schema/scripts/workflow/filter... Zonca_1656_UR271U6Y.<txt|xml> 48 }}} 49 50 Dabei wird bis einschließlich [wiki:workflow_tutorial#KonversionnachXMLundValidierung Konversion nach XML und Validierung], Schritt 1, mit der {{{txt}}}-Datei gearbeitet. 46 51 === Einfügen von Metadaten === 47 52 1. Der Dateiname der Textdatei sollte das folgende Format haben: 48 Nachname_Jahr_ID.txt. Die ID ist beispielsweise über den 49 Bibliothekskatalog auffindbar, in diesem Falle ist es also 53 {{{Nachname_Jahr_ID.txt}}} (ECHO-Konvention). Die ID ist beispielsweise über den [http://141.14.236.36/fmi/xsl/katalog/browserecord.xsl?-max=1&-lay=search&-sortorder.1=ascend&Biblio%3a%3a_FOR_AllePersonenUndTitel.op=bw&Biblio%3a%3a_FOR_AllePersonenUndTitel=zonca&-find=+++Search+++&-lop=and&-sortfield.1=Biblio%3a%3a_FOR_SortAutor1Titel&-db=katalog&-lay.response=table&-encoding=UTF-8&-grammar=fmresultset&-skip=2 Bibliothekskatalog] (dort in dem Link zu Scans (high quality)) auffindbar, in diesem Falle ist es also 50 54 {{{Zonca_1656_UR271U6Y.txt}}}. Idealerweise wird der Text in der 51 55 Verzeichnisstruktur des Text- und Softwarerepositoriums 52 abgelegt (beispielswiese innerhalb von {{{ /trunk/texts}}})53 1. {{{python <svn-Verzeichnis>/ trunk/schema/scripts/workflow/prepare_conversion.py Zonca_1656_UR271U6Y.txt}}} erledigt automatisch die Vorbereitung der56 abgelegt (beispielswiese innerhalb von {{{<svn-Verzeichnis>/texts}}}). 57 1. {{{python <svn-Verzeichnis>/schema/scripts/workflow/prepare_conversion.py Zonca_1656_UR271U6Y.txt}}} erledigt automatisch die Vorbereitung der 54 58 Konversion: 55 59 - Erstellen der Verzeichnisstruktur … … 60 64 - Untersuchen des Textes auf unbekannte Zeichen ({{{unknown}}}-Block). 61 65 - Vorbereitung der restlichen Blöcke ({{{log}}}, 62 {{{replacements}}}, {{{parameters}}}) Die sechs somit66 {{{replacements}}}, {{{parameters}}}). Die sechs somit 63 67 entstandenen Blöcke werden von nachfolgenden Skripten aufgelöst 64 68 ({{{pageimg}}}, {{{unknown}}}, {{{replacements}}}), … … 83 87 === Unknown characters === 84 88 1. Die entstandene Liste muß durchgegangen werden und entschieden 85 werden, wie die unbekannten Zeichen ersetzt werden sollen. Es89 werden, wie die unbekannten Zeichen zu ersetzen sind. Es 86 90 werden Vorschläge angezeigt, die auf den von der 87 91 Dateneingabefirma geführten Listen basieren. … … 131 135 == Variante 2: Arbeit mit Emacs == 132 136 Diese Variante ähnelt der Variante 1. Für die Arbeit mit Emacs gibt es 133 einen Major Mode ( {{{echo-mode.el}}}), der einige Befehle und zudem eine137 einen Major Mode ([source:/trunk/schema/scripts/workflow/echo-mode.el echo-mode.el]), der einige Befehle und zudem eine 134 138 Kommentarsyntax im XML-Stil bereitstellt, so daß in der txt-Version 135 139 mit Kommentaren gearbeitet werden kann, die auch in der XML-Version … … 143 147 144 148 1. Für die Arbeit mit Textwrangler müssen alle Skripte aus dem 145 {{{ schema/scripts/workflow}}}-Verzeichnis in das Skriptverzeichnis149 {{{<svn-Verzeichnis>/schema/scripts/workflow}}}-Verzeichnis in das Skriptverzeichnis 146 150 {{{~/Library/Application Support/TextWrangler/Unix Support/Unix Filters/}}} kopiert werden. 147 151 1. In den Einstellungen ist es möglich, einen Font auszuwählen, der 148 MUFI-Zeichen unterstützt . Beispielsweise Andron Scriptor.152 MUFI-Zeichen unterstützt, beispielsweise [http://www.mufi.info/fonts/#Andron Andron Scriptor]. 149 153 1. Das Skript {{{prepare_conversion.py}}} funktioniert nicht in 150 154 Textwrangler, da es kein Textfilter ist. Dieses muß über die