Changes between Version 11 and Version 12 of workflow
- Timestamp:
- May 23, 2010, 10:52:55 AM (15 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
workflow
v11 v12 7 7 und 8 8 [http://echotest.mpiwg-berlin.mpg.de/content/historymechanics/Echo echotest]. 9 Der automatische XML-Workflow besteht aus einer Reihe von [source:trunk/schema/scripts/workflow Skripten]. Einige dieser Skripte sind noch leere Platzhalter, aber die Struktur stimmt bereits. 9 Der automatische XML-Workflow besteht aus einer 10 [source:trunk/schema/scripts/workflow Reihe von Skripten]. Einige dieser Skripte sind noch leere Platzhalter, aber die Workflow-Struktur stimmt bereits. 10 11 11 12 12 13 == Die Arbeitsschritte == 13 14 14 Im ersten Arbeitsschritt werden alle Vorbereitungen getroffen, um mit dem raw text zu arbeiten. Im zweiten Schritt wird der raw text korrigiert und annotiert. Im dritten Schritt wird der annotierte raw text in wohlgeformtes XML verwandelt. Im vierten Schritt wird der XML-Text schemakonform gemacht. 15 16 Im Gegensatz zu den früheren Skripten dürfen die hier beschriebenen Bearbeitungsschritte die Zeilenstruktur verändern, zum Beispiel eine Zeile hinzufügen. 17 18 Beachte, dass Work Orders 1 bis 5 mit den DESpecs 1.1.2 und Work Orders 6 bis 9 mit den DESpecs 2.0 geschickt wurden. Unterschiede sind zum Beispiel das Format von Figures und von Tabellen. 19 20 Ein Stern * bei einem Filter bedeutet: Wenn man zum raw text zurückkehrt, muss dieses Skript anschließend noch einmal angewendet werden. Alle Skripte mit * laufen automatisch ab; Ausnahme könnte später das {{{<s>}}}-Skript sein. Die automatischen Skripte sollten soweit wie möglich in Meta-Skripten abrufbar sein. 21 22 Namenskonvention bei den Skripten: {{{check}}} als Vorbereitung, {{{test}}} als Nachbereitung. Alle anderen Skripte müssen wiederholt werden, wenn man wieder mit dem raw text anfängt. 23 24 25 === Vorbereitungen === 15 Im ersten Arbeitsschritt werden alle Vorbereitungen getroffen, um mit dem raw text arbeiten zu können. Im zweiten Schritt wird der raw text korrigiert und annotiert. Im dritten Schritt wird der annotierte raw text in wohlgeformtes XML verwandelt. Im vierten Schritt wird der XML-Text schemakonform gemacht. 16 17 * Im Gegensatz zu den früheren Skripten dürfen die hier beschriebenen Bearbeitungsschritte die Zeilenstruktur verändern, zum Beispiel eine Zeile hinzufügen. 18 * Beachte, dass Work Orders 1 bis 5 mit den DESpecs 1.1.2 und Work Orders 6 bis 9 mit den DESpecs 2.0 geschickt wurden. Unterschiede sind zum Beispiel das Format von Figures und von Tabellen. 19 * Ein Stern * bei einem Filter bedeutet: Wenn man zum raw text zurückkehrt, muss dieses Skript anschließend noch einmal angewendet werden. Alle Skripte mit * laufen automatisch ab; Ausnahme könnte später das {{{<s>}}}-Skript sein. Die automatischen Skripte sollten soweit wie möglich in Meta-Skripten abrufbar sein. 20 * Namenskonvention bei den Skripten: {{{check}}} als Vorbereitung, {{{test}}} als Nachbereitung. Alle anderen Skripte müssen wiederholt werden, wenn man wieder mit dem raw text anfängt. 21 22 23 === 1. Vorbereitungen === 26 24 27 25 Beachte: In diesem Arbeitsschritt sind die Skripte vermutlich keine Text-Filter, denn man arbeitet hier noch gar nicht mit einem Text-Editor. 28 26 29 ==== Von Pythia ins svn-repository ====30 31 Es ist noch nicht ganz klar, wie neue Dateien in Zukunft verarbeitet werden: Kommen sie zuerst nach Pythia oder gleich in das wiki-repository? Jedenfalls muss geprüft werden, dass es die Datei reiner Text in utf-8 ist.27 ==== 1.01 Von Pythia ins svn-repository ==== 28 29 Es ist noch nicht ganz klar, wie neue Dateien in Zukunft verarbeitet werden: Kommen sie zuerst nach Pythia oder gleich in das wiki-repository? Jedenfalls muss geprüft werden, ob die Datei tatsächlich, wie in den DESpecs verlangt, reiner Text in utf-8 ist. Insbesondere akzeptieren wir keine doc-Dateien. 32 30 33 31 im [source:trunk/texts Texte-Verzeichnis] im repository: … … 41 39 42 40 43 ==== Kommunikation mit Foxridge ====41 ==== 1.02 Kommunikation mit Foxridge ==== 44 42 45 43 Klaus: Voraussetzung: der Identifier steht im Dateinamen, dann kann bis zur Synchronisation der pb vieles automatisch laufen (⟶ das Skript wird nicht mit legacy-Verzeichnissen funktionieren) … … 80 78 81 79 82 === raw text bearbeiten ===80 === 2. raw text bearbeiten === 83 81 84 82 In diesem Arbeitsschritt wird der raw text auf die Umwandlung in XML vorbereitet. Änderungen werden soweit möglich am Anfang der Datei gemacht. Nur wenn es nicht anders geht, wird der Text selbst geändert. … … 97 95 98 96 99 ==== Metadaten ====97 ==== 2.01 Metadaten ==== 100 98 101 99 Skript zur Korrektur der Metadaten aus index.meta: … … 116 114 117 115 118 ==== pb's synchronisieren ====116 ==== 2.02 pb's synchronisieren ==== 119 117 120 118 [source:trunk/schema/scripts/workflow/Filter_2_02_sync_pb.pl Filter_2_02_sync_pb] … … 129 127 130 128 131 ==== ersetze verbotene Zeichen im Text ====129 ==== 2.03 ersetze verbotene Zeichen im Text ==== 132 130 133 131 Das Skript … … 146 144 147 145 148 ==== prüfe unknown characters ====146 ==== 2.04 prüfe unknown characters ==== 149 147 150 148 [source:trunk/schema/scripts/workflow/Filter_2_04_check_unknown_characters.pl Filter_2_04_check_unknown_characters] … … 155 153 sollte die codes auch schon in die Datei schreiben, damit man sie nicht rüberkopieren muss 156 154 157 ==== prüfe escape sequences ====155 ==== 2.05 prüfe escape sequences ==== 158 156 159 157 Das Skript [source:trunk/schema/scripts/workflow/Filter_2_05_check_escape_sequences.pl Filter_2_05_check_escape_sequences] … … 166 164 167 165 168 ==== prüfe italics ====166 ==== 2.06 prüfe italics ==== 169 167 170 168 [source:trunk/schema/scripts/workflow/Filter_2_06_check_underscores.pl Filter_2_06_check_underscores] … … 173 171 174 172 175 ==== prüfe tags ====173 ==== 2.07 prüfe tags ==== 176 174 177 175 [source:trunk/schema/scripts/workflow/Filter_2_07_check_tags.pl Filter_2_07_check_tags] … … 184 182 185 183 186 ==== prüfe <s> ====184 ==== 2.08 prüfe <s> ==== 187 185 188 186 [source:trunk/schema/scripts/workflow/Filter_2_08_check_s.pl Filter_2_08_check_s] … … 190 188 kann man hier das s-Skript aufrufen, oder kommt man dann durcheinander? 191 189 192 ==== prüfe tables ==== 190 191 ==== 2.09 prüfe tables ==== 193 192 194 193 [source:trunk/schema/scripts/workflow/Filter_2_09_check_tables.pl Filter_2_09_check_tables] … … 199 198 200 199 201 ==== Special Instructions ====200 ==== 2.10 Special Instructions ==== 202 201 203 202 [source:trunk/schema/scripts/workflow/Filter_2_10_special_instructions_for_xxxxxxxx Filter_2_10_special_instructions_for_xxxxxxxx] … … 210 209 211 210 212 === Schritte bis zu wohlgeformtem xml ===211 === 3. Schritte bis zu wohlgeformtem xml === 213 212 214 213 Diese Skripte in diesem Arbeitsschritt sollten problemlos durchlaufen und können in einem Meta-Skript zusammengefasst werden: … … 217 216 218 217 219 ==== ersetze unknown characters ====218 ==== 3.01 ersetze unknown characters ==== 220 219 221 220 [source:trunk/schema/scripts/workflow/Filter_3_01_replace_unknown_characters.pl Filter_3_01_replace_unknown_characters] … … 223 222 (vor escape sequences als garantierte Reihenfolge, bevor die escape sequences umgewandelt werden) 224 223 225 ==== ersetze replacements ====224 ==== 3.02 ersetze replacements ==== 226 225 227 226 [source:trunk/schema/scripts/workflow/Filter_3_02_replace_replacements.pl Filter_3_02_replace_replacements] (blöder Name!) … … 232 231 233 232 234 ==== ersetze escape sequences ====233 ==== 3.03 ersetze escape sequences ==== 235 234 236 235 Das Skript [source:trunk/schema/scripts/workflow/Filter_3_03_replace_escape_sequences.pl Filter_3_03_replace_escape_sequences] … … 245 244 246 245 247 ==== ersetze italics ====246 ==== 3.04 ersetze italics ==== 248 247 249 248 [source:trunk/schema/scripts/workflow/Filter_3_04_replace_underscores.pl Filter_3_04_replace_underscores] 250 249 251 250 252 ==== Metadaten, root element ====251 ==== 3.05 Metadaten, root element ==== 253 252 254 253 [source:trunk/schema/scripts/workflow/Filter_3_05_add_basic_xml.pl Filter_3_05_add_basic_xml] … … 257 256 258 257 259 ==== wohlgeformtes xml ====258 ==== 3.06 wohlgeformtes xml ==== 260 259 261 260 [source:trunk/schema/scripts/workflow/Filter_3_06_make_tags_wellformed.pl Filter_3_06_make_tags_wellformed] … … 263 262 264 263 265 === schema-konform machen ===264 === 4. schema-konform machen === 266 265 267 266 wieder: Diese Skripte sollten problemlos durchlaufen und können in einem Meta-Skript zusammengefasst werden: … … 275 274 276 275 277 ==== <pb> ====276 ==== 4.01 <pb> ==== 278 277 279 278 [source:trunk/schema/scripts/workflow/Filter_4_01_pb.pl Filter_4_01_pb] 280 279 281 280 282 ==== floats herausziehen ====281 ==== 4.02 floats herausziehen ==== 283 282 284 283 [source:trunk/schema/scripts/workflow/Filter_4_02_move_floats.pl Filter_4_02_move_floats] … … 289 288 290 289 291 ==== <lb> ====290 ==== 4.03 <lb> ==== 292 291 293 292 [source:trunk/schema/scripts/workflow/Filter_4_03_insert_lb.pl Filter_4_03_insert_lb] 294 293 295 294 296 ==== <s> ====295 ==== 4.04 <s> ==== 297 296 298 297 [source:trunk/schema/scripts/workflow/Filter_4_04_insert_s.pl Filter_4_04_insert_s] (eventuell mit Parameter-Wahl; eventuelle manuelle Korrekturen im raw text!) … … 301 300 302 301 303 ==== <emph> ====302 ==== 4.05 <emph> ==== 304 303 305 304 [source:trunk/schema/scripts/workflow/Filter_4_05_emph.pl Filter_4_05_emph] 306 305 307 306 308 ==== tables ====307 ==== 4.06 tables ==== 309 308 310 309 [source:trunk/schema/scripts/workflow/Filter_4_06_tables.pl Filter_4_06_tables] … … 313 312 314 313 315 ==== <div> ====314 ==== 4.07 <div> ==== 316 315 317 316 [source:trunk/schema/scripts/workflow/Filter_4_07_insert_div.pl Filter_4_07_insert_div] (nicht wirklich nötig für Schema-konform, aber bekommt man quasi geschenkt) 318 317 319 318 320 === weitere Schritte ===319 === 5. weitere Schritte === 321 320 322 321 Legt die Hierarchie der inline-Elemente (z.B. <var> in plaintext, <ref> im inline model) eine Verarbeitungsreihenfolge nahe? 323 322 324 323 325 ==== <reg> ====324 ==== 5.01 <reg> ==== 326 325 327 326 [source:trunk/schema/scripts/workflow/Filter_5_01_insert_reg.pl Filter_5_01_insert_reg] (mit Parametern) 328 327 329 328 330 ==== <var> ====329 ==== 5.02 <var> ==== 331 330 332 331 [source:trunk/schema/scripts/workflow/Filter_5_02_insert_var.pl Filter_5_02_insert_var] (mit Parametern) 333 332 334 333 335 ==== Formeln ====334 ==== 5.03 Formeln ==== 336 335 337 336 [source:trunk/schema/scripts/workflow/Filter_5_03_formulae.pl Filter_5_03_formulae] … … 340 339 341 340 342 ==== div-Attribute ====341 ==== 5.04 div-Attribute ==== 343 342 344 343 [source:trunk/schema/scripts/workflow/Filter_5_04_number_divs.pl Filter_5_04_number_divs]