Einführung#
Groblernziel dieses Kapitels
Sie kennen unterschiedliche Verfahren der Nachbearbeitung von OCR-Output zur Qualitätsverbesserung.
Zu diesem Kapitel#
Im vorigen Kapitel haben wir die Scans der Zeitungen per OCR automatisch in Klartext umgewandelt. In diesem Kapitel werden wir die Ergebnisse der OCR nachbearbeiten.

Fig. 7 Flussdiagramm der Fallstudie. Wir befinden uns im vierten Arbeitspaket.#
Wie Sie bereits wissen, sind OCR-Ergebnisse selten perfekt. Dies gilt insbesondere für historische Texte. Daher ist in der Regel eine Nachbearbeitung erforderlich, um die üblichen Fehler zu korrigieren.