Changes between Version 8 and Version 9 of normalization/5
- Timestamp:
- Dec 12, 2010, 8:53:23 AM (13 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
normalization/5
v8 v9 3 3 == Regularisierung == 4 4 5 Die Regularisierung eines Textes mit Hilfe von <reg> ist wohlbekannt. Seit dem Archimedes-Projekt wurde insbesondere die Struktur von <reg> umgestellt von [[BR]] `<reg orig="Original">Korrektur</reg>` zu [[BR]] `<reg norm="Korrektur">Original</reg>`, [[BR]] also zu <reg> als einer Annotation des Originaltextes. 5 Die Regularisierung eines Textes mit Hilfe von <reg> ist wohlbekannt. Seit dem Archimedes-Projekt wurde insbesondere die Struktur von <reg> umgestellt: 6 alt: `<reg orig="Original">Korrektur</reg>` [[BR]] neu: `<reg norm="Korrektur">Original</reg>` 7 Damit ist <reg> jetzt wie alle anderen tags eine Annotation des Originaltextes. 6 8 7 9 Neu ist eine weitere Funktion von <reg>: Wenn wir im Rohtext Informationen haben, die wir nicht darstellen können, kommen diese in ein neues Attribut namens "faithful". Beispiele sind griechische Ligaturen und chinesische Zeichenvarianten, die nicht in Unicode sind. (Die Idee, solche Zeichenvarianten in ein Attribut von <reg> zu schieben, stammt von Robert.) … … 37 39 Umgekehrt kann ein Forscher auch beschließen, dass die {πρ}-Ligatur in diesem Text nicht markierenswert ist. Diese Entscheidung muss nicht für weitere Texte gelten, denn sie hängt vom im Buch verwendeten Font ab. (Vermutlich gibt es aber eine Liste von Ligaturen, die in allen Fonts trivial sind.) Dann kann er alle {πρ} durch das simplere πρ ersetzen, also zum Beispiel {πρ}ός durch πρός. 38 40 39 Es wird ein Workflow-Skript geben, das dabei hilft, `<reg faithful="{πρ}ός">πρός</reg>` durch πρός zu ersetzen. Beachte dabei insbesondere den Fall, dass in einem Wort wie {πα}ρε{σκ}{ευ}ασ{μέν}η die ersten beiden Ligaturen {πα} und {σκ} recht einfach sind, die Ligaturen {ευ} und {μέν} jedoch nicht. Dieses Skript wird auch helfen, beispielsweise [[BR]] `<reg norm="exem" type="context">exẽ</reg> <lb/>plo` durch [[BR]] `<reg norm="exem- plo" type="context">exẽ-<lb/>plo</reg>` [[BR]] zu ersetzen (mit soft hyphen). 41 Es wird ein Workflow-Skript geben, das dabei hilft, `<reg faithful="{πρ}ός">πρός</reg>` durch πρός zu ersetzen. Beachte dabei insbesondere den Fall, dass in einem Wort wie {πα}ρε{σκ}{ευ}ασ{μέν}η die ersten beiden Ligaturen {πα} und {σκ} recht einfach sind, die Ligaturen {ευ} und {μέν} jedoch nicht. Dieses Skript wird auch helfen, <reg> bei nachgetragenen Bindestrichen zu korrigieren, beispielsweise (eigentlich mit soft hyphen): 42 alt: `<reg norm="exem" type="context">exẽ</reg> <lb/>plo` [[BR]] neu: `<reg norm="exem- plo" type="context">exẽ-<lb/>plo</reg>` 40 43 41 44 Sobald der Inhalt von faithful sogar mit Unicode-Mitteln dargestellt werden kann, kommt er zurück in den Original-Text.