Fulltext tools and OCR workflow
(Siehe auch: https://it-dev.mpiwg-berlin.mpg.de/tracs/luceneToolsJava).
Der Fulltext-Service besteht aus mehreren Komponenten.
- Skripte die OCRopus aufrufen und ein OCR des Repositoriums durchführen.?
- Java-Tools, die Indices in Lucene erstellen?
- Ein Java-Servlet, dass die Suche im Index durchführt.
- Ein Zope-Frontend für Suche und Trefferanzeige.?
- Ein jQuery-Frontend für Suche und Trefferanzeige.
Hintergrund
Urgently an overview over all files already ocred should be created, as well as a checker for the quality of OCR.
Last modified 14 years ago
Last modified on Aug 11, 2010, 9:11:14 AM