Version 7 (modified by 14 years ago) (diff) | ,
---|
Fulltext tools and OCR workflow
Der Fulltext service besteht aus mehreren Komponenten.
- Skripte die OCRopus aufrufen und ein OCR des Repositoriums durchführen.?
- Java-Tools, die Indices in Lucene erstellen?
- Ein Java-Servlet, dass die Suche im Index durchführt.
- Ein Zope-Frontend für Suche und Trefferanzeige.?
Hintergrund
Urgently an overview over all files already ocred should be created, as well as a checker for the quality of OCR.