=== Fulltext tools and OCR workflow === (Siehe auch: https://it-dev.mpiwg-berlin.mpg.de/tracs/luceneToolsJava). Der Fulltext-Service besteht aus mehreren Komponenten. 1. [wiki:ocr_tool Skripte die OCRopus aufrufen und ein OCR des Repositoriums durchführen.] 2. [wiki:harvester Java-Tools, die Indices in Lucene erstellen] 3. [wiki:java_Server Ein Java-Servlet, dass die Suche im Index durchführt.] 4. [wiki:zope_frontend Ein Zope-Frontend für Suche und Trefferanzeige.] 5. [wiki:jquery_frontend Ein jQuery-Frontend für Suche und Trefferanzeige.] == Hintergrund == * [wiki:workflow Workflow-Beschreibung] * [wiki:ocrxml-format Das XML Format des OCR] Urgently an [ticket:1 overview] over all files already ocred should be created, as well as a checker for the [ticket:2 quality of OCR].