Einführung

Einführung#

Im vorigen Kapitel haben wir die Scans der Zeitungen per OCR automatisch in Klartext umgewandelt. In diesem Kapitel werden wir die Ergebnisse der OCR nachbearbeiten.

../_images/flow-chart_ocr-postprocessing.jpeg

Fig. 7 Flussdiagramm der Fallstudie. Wir befinden uns im vierten Arbeitspaket.#

Wie Sie bereits wissen, sind OCR-Ergebnisse selten perfekt. Dies gilt insbesondere für historische Texte. Daher ist in der Regel eine Nachbearbeitung erforderlich, um die üblichen Fehler zu korrigieren.