Version 11 (modified by 14 years ago) (diff) | ,
---|
Fulltext tools and OCR workflow
(Siehe auch: https://it-dev.mpiwg-berlin.mpg.de/tracs/luceneToolsJava).
Der Fulltext-Service besteht aus mehreren Komponenten.
- Skripte die OCRopus aufrufen und ein OCR des Repositoriums durchführen.?
- Java-Tools, die Indices in Lucene erstellen?
- Ein Java-Servlet, dass die Suche im Index durchführt. 4a). Ein Zope-Frontend für Suche und Trefferanzeige.? 4b). Ein jQuery-Frontend für Suche und Trefferanzeige.
Hintergrund
Urgently an overview over all files already ocred should be created, as well as a checker for the quality of OCR.