97 | | Das Skript `Filter_3_test_wellformedness` ist zurzeit ein Wrapper für xmllint. Ich werde es wahrscheinlich noch auf ein Perl-Modul statt xmllint umstellen. Insbesondere weil xmllint offenbar nicht UTF-8 verwendet. (Oder kann man das einstellen? `--encode UTF-8` scheint jedenfalls keinen Unterschied zu machen.) |
| 97 | Das Skript `Filter_3_test_wellformedness` ist zurzeit ein Wrapper für xmllint. Ich werde es wahrscheinlich noch auf ein Perl-Modul statt xmllint umstellen. Insbesondere weil xmllint offenbar nicht UTF-8 verwendet. (Oder kann man das einstellen? `--encode UTF-8` scheint jedenfalls keinen Unterschied zu machen.) |
| 98 | |
| 99 | Beispiel: verwandle Archimedes 16156 aus WO 3 in XML mit `Filter_3_make_wellformed`, wende dann `Filter_3_test_wellformedness` an: ein Wort wie "quæris" legt nahe, dass der output UTF-8 ist, aber als "Mac OS Roman" interpretiert wird. Das ist xmllint doch unschuldig, und das Problem ist irgendwo danach? |