wiki:WikiStart

Version 8 (modified by dwinter, 14 years ago) (diff)

--

Fulltext tools and OCR workflow

Der Fulltext service besteht aus mehreren Komponenten.

  1. Skripte die OCRopus aufrufen und ein OCR des Repositoriums durchführen.?
  2. Java-Tools, die Indices in Lucene erstellen?
  3. Ein Java-Servlet, dass die Suche im Index durchführt.
  4. Ein Zope-Frontend für Suche und Trefferanzeige.?

Hintergrund

Workflow-Beschreibung Das XML Format des OCR?

Urgently an overview over all files already ocred should be created, as well as a checker for the quality of OCR.