Resümee#
Dieses Kapitel demonstrierte, wie die Ergebnisse von OCR nachbearbeitet werden können. Es führte regelbasierte Nachkorrektur mit regulären Ausdrücken (in Python) ein und gab einen Einblick in die Möglichkeiten der LLM-basierten Nachkorrektur. Im nächsten Kapitel werden die nachkorrigierten Ergebnisse von OCR weiter mit NLP-Methoden verarbeitet.