The workflow is going to be adapted to allow the use of OCRed text as input. The OCR engine is going to be [http://code.google.com/p/ocropus/ OCRopus]. [http://www.youtube.com/watch?v=pDYq0MlD8RQ Tutorial video] and [http://www.youtube.com/user/tmbdev#p/c/0B3367BC0E5CAF8D other videos] The documents of the previous [wiki:OverviewWorkOrders2008 workflows] were assessed in terms of how well they might perform being OCRed. * Easy * Bernstein, 1897 (Fraktur) * Berzelius 1819 * [http://mpdl-proto.mpiwg-berlin.mpg.de/mpdl/interface/echo/echoDocuView.xql?document=/echo/de/Ampere_1844_FA4H1833.xml Ampère 1844] * Medium * Vitruvius 1511 * Cataneo 1600 * Aristoteles 1547 (Kursiv) * Archimedes 1565 (4E7V2WGH): viele Bilder * Cataneo 1572 (schlechter Druck) * Viviani 1659 * Bianconi 1746 * Zanotti 1752 * Bion 1765 (Fraktur) * Vitruvius 1800 (klarer, aber leicht undeutlicher Druck, durchscheinende Seiten) * Gallaccini 1767 (kleine Schrift, aber recht deutlich) * Angeli 1668 (mit kursiv, aber sonst recht deutlich) * Trigault 1639 * Bernoulli 1738 * Hard * Vitruvius 1544 * Vitruvius 1757 (Fraktur und Fraktur gemischt) * Zonca 1656 (schlechter Druck) * Bacon 1670 (mit kursiv, schlechter Druck) * Clavius 1606 * Barrow 1674 (schlechter Druck, kursiv und Griechisch) * Gravesande 1721 * Vitruvius 1618 (Thesaurus am Anfang mit Spalten) * Mersenne 1635 (Mikrofilm) * Aristoteles 1548 (enthält griechisch) * Vitruvius 1556? (extrem kleine Schrift) * Aristoteles 1585 (schlechtes Druckbild) * Specklin 1599 (schlechte Fraktur) * Biancani 1635 (sehr kleine Schrift) * Vitruvius 1567 (extrem kleine Schrift, kursiv und nicht kursiv gemischt) * Archimedes 1565 (kursiv und nicht kursiv gemischt)