Changes between Version 2 and Version 3 of workflow_tutorial


Ignore:
Timestamp:
Jun 16, 2011, 1:17:27 PM (13 years ago)
Author:
Klaus Thoden
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • workflow_tutorial

    v2 v3  
    33Die Textauswahl (Zonca) ist dadurch begründet, daß dieser Text mit nur
    44minimalem Eingreifen zu konvertieren ist. Dieses Tutorium beschreibt
    5 die Konversion eines Textes, der gemäß der DE_Specs digitalisiert
     5die Konversion eines Textes, der gemäß der [wiki:despecs DE_Specs] digitalisiert
    66wurde. Es liegen also vor:
    7 - Digitale Bilder jeder einzelnen Buchseite sowie Buchdeckel und -rücken
    8 - eine Datei, die die Metadaten enthält: {{{index.meta}}}
     7- Digitale Bilder jeder einzelnen Buchseite sowie Buchdeckel und -rücken (auf Foxridge)
     8- eine Datei, die die Metadaten enthält: {{{index.meta}}} (auf Foxridge)
    99- Datei mit dem nach den DE_Specs abgetippten Inhalt des Buches ([source:/trunk/texts//WO_5/Zonca_1656/raw/Zonca_1656_UR271U6Y.txt hier])
    1010Dem Buch ist eine ID zugewiesen worden, mit der es auffindbar ist.
    1111
    12 Es wird davon ausgegangen, daß eine Arbeitskopie des Text- und
    13 Softwarerepositoriums vorliegt. Dieses befindet sich unter
    14 Versionskontrolle (Subversion) und sollte ausgecheckt und aktualisiert sein. Eine Anleitung gibt es [wiki:Repository_tour#Versionskontrolle hier]
     12Es wird davon ausgegangen, daß eine Arbeitskopie des Text- und Softwarerepositoriums vorliegt. Dieses befindet sich unter Versionskontrolle (Subversion) und sollte ausgecheckt und aktualisiert sein. Eine Anleitung gibt es [wiki:Repository_tour#Versionskontrolle hier]
    1513
    1614Zuletzt müssen in zwei Dateien Änderungen vorgenommen werden:
    17  1. in {{{trunk/schema/scripts/workflow/mpdl-workflow-settings.txt}}} muß der richtige Pfad für das Repositorium angegeben werden.
    18  1. in {{{trunk/texts/aux/default-parameters.txt}}} ist anzugeben, welche Datei der unknown characters zu nehmen ist. Dies ist abhängig vom Work Order.
     15 1. in {{{<svn-Verzeichnis>/schema/scripts/workflow/mpdl-workflow-settings.txt}}} muß der richtige Pfad für das Repositorium angegeben werden.
     16 1. in {{{<svn-Verzeichnis>/texts/aux/default-parameters.txt}}} ist anzugeben, welche Datei der unknown characters zu nehmen ist. Dies ist abhängig vom Work Order.
    1917
    2018
     
    3432   1. {{{filter4makeschemaandcheck}}} ausführen und log prüfen (könnten
    3533      Warnungen wegen der Byte Order Mark auftreten) (Textwrangler:
    36       {{{Filter_4_make_valid.pl}}} und {{{Filter_4_test_validty.pl}}})
     34      {{{Filter_4_make_valid.pl}}} und {{{Filter_4_test_validity.pl}}})
    3735   1. {{{filter5numberdivs}}} ausführen, der das DTD-Fragment auflöst
    3836      (Textwrangler: {{{Filter_5_06_number_divs.pl}}})
     
    4442plattformunabhängige Arbeit. Eine Verbindung mit dem Internet ist
    4543jedoch erforderlich.
     44
     45NB: die in dieser Variante erwähnten Skripte ({{{filter...}}}) sind wie folgt aufzurufen:
     46{{{
     47sh <svn-Verzeichnis>/schema/scripts/workflow/filter... Zonca_1656_UR271U6Y.<txt|xml>
     48}}}
     49
     50Dabei wird bis einschließlich [wiki:workflow_tutorial#KonversionnachXMLundValidierung Konversion nach XML und Validierung], Schritt 1, mit der {{{txt}}}-Datei gearbeitet.
    4651=== Einfügen von Metadaten ===
    4752    1. Der Dateiname der Textdatei sollte das folgende Format haben:
    48        Nachname_Jahr_ID.txt. Die ID ist beispielsweise über den
    49        Bibliothekskatalog auffindbar, in diesem Falle ist es also
     53       {{{Nachname_Jahr_ID.txt}}} (ECHO-Konvention). Die ID ist beispielsweise über den [http://141.14.236.36/fmi/xsl/katalog/browserecord.xsl?-max=1&-lay=search&-sortorder.1=ascend&Biblio%3a%3a_FOR_AllePersonenUndTitel.op=bw&Biblio%3a%3a_FOR_AllePersonenUndTitel=zonca&-find=+++Search+++&-lop=and&-sortfield.1=Biblio%3a%3a_FOR_SortAutor1Titel&-db=katalog&-lay.response=table&-encoding=UTF-8&-grammar=fmresultset&-skip=2 Bibliothekskatalog] (dort in dem Link zu Scans (high quality)) auffindbar, in diesem Falle ist es also
    5054       {{{Zonca_1656_UR271U6Y.txt}}}. Idealerweise wird der Text in der
    5155       Verzeichnisstruktur des Text- und Softwarerepositoriums
    52        abgelegt (beispielswiese innerhalb von {{{/trunk/texts}}})
    53     1. {{{python <svn-Verzeichnis>/trunk/schema/scripts/workflow/prepare_conversion.py Zonca_1656_UR271U6Y.txt}}} erledigt automatisch die Vorbereitung der
     56       abgelegt (beispielswiese innerhalb von {{{<svn-Verzeichnis>/texts}}}).
     57    1. {{{python <svn-Verzeichnis>/schema/scripts/workflow/prepare_conversion.py Zonca_1656_UR271U6Y.txt}}} erledigt automatisch die Vorbereitung der
    5458       Konversion:
    5559       - Erstellen der Verzeichnisstruktur
     
    6064       - Untersuchen des Textes auf unbekannte Zeichen ({{{unknown}}}-Block).
    6165       - Vorbereitung der restlichen Blöcke ({{{log}}},
    62        {{{replacements}}}, {{{parameters}}}) Die sechs somit
     66       {{{replacements}}}, {{{parameters}}}). Die sechs somit
    6367       entstandenen Blöcke werden von nachfolgenden Skripten aufgelöst
    6468       ({{{pageimg}}}, {{{unknown}}}, {{{replacements}}}),
     
    8387=== Unknown characters ===
    8488    1. Die entstandene Liste muß durchgegangen werden und entschieden
    85        werden, wie die unbekannten Zeichen ersetzt werden sollen. Es
     89       werden, wie die unbekannten Zeichen zu ersetzen sind. Es
    8690       werden Vorschläge angezeigt, die auf den von der
    8791       Dateneingabefirma geführten Listen basieren.
     
    131135== Variante 2: Arbeit mit Emacs ==
    132136Diese Variante ähnelt der Variante 1. Für die Arbeit mit Emacs gibt es
    133 einen Major Mode ({{{echo-mode.el}}}), der einige Befehle und zudem eine
     137einen Major Mode ([source:/trunk/schema/scripts/workflow/echo-mode.el echo-mode.el]), der einige Befehle und zudem eine
    134138Kommentarsyntax im XML-Stil bereitstellt, so daß in der txt-Version
    135139mit Kommentaren gearbeitet werden kann, die auch in der XML-Version
     
    143147
    144148   1. Für die Arbeit mit Textwrangler müssen alle Skripte aus dem
    145       {{{schema/scripts/workflow}}}-Verzeichnis in das Skriptverzeichnis
     149      {{{<svn-Verzeichnis>/schema/scripts/workflow}}}-Verzeichnis in das Skriptverzeichnis
    146150      {{{~/Library/Application Support/TextWrangler/Unix Support/Unix Filters/}}} kopiert werden.
    147151   1. In den Einstellungen ist es möglich, einen Font auszuwählen, der
    148       MUFI-Zeichen unterstützt. Beispielsweise Andron Scriptor.
     152      MUFI-Zeichen unterstützt, beispielsweise [http://www.mufi.info/fonts/#Andron Andron Scriptor].
    149153   1. Das Skript {{{prepare_conversion.py}}} funktioniert nicht in
    150154      Textwrangler, da es kein Textfilter ist. Dieses muß über die