Messung der OCR-Qualität#
In Bezug auf die optische Zeichenerkennung (OCR) werden Präzision, Recall und F-Maß zur Bewertung der Genauigkeit und Effizienz von OCR-Systemen verwendet. Diese Metriken helfen zu verstehen, wie gut ein OCR-System arbeitet, insbesondere in Bezug auf die korrekte Identifizierung von Zeichen, Wörtern oder spezifischen Informationen in Dokumenten. Hier ist, wie diese Metriken auf die Qualitätsevaluation von OCR angewendet werden:
Präzision in der OCR#
Bei der OCR misst die Präzision die Genauigkeit des erkannten Textes im Vergleich zum tatsächlichen Text in den Dokumentenbildern. Sie berechnet den Anteil der korrekt erkannten Zeichen oder Wörter an allen Zeichen oder Wörtern, die vom OCR-System identifiziert wurden. Hohe Präzision bedeutet, dass die meisten vom OCR-System als vorhanden erkannten Texte tatsächlich korrekt sind, was auf weniger falsch-positive Erkennungen hinweist (d.h. falsch als vorhanden identifiziert).
Recall in der OCR#
Recall im Kontext der OCR misst die Fähigkeit des OCR-Systems, alle relevanten Zeichen oder Wörter aus den Dokumentenbildern zu erfassen. Es ist das Verhältnis der korrekt identifizierten Zeichen oder Wörter zu allen Zeichen oder Wörtern, die tatsächlich in den Dokumenten vorhanden sind. Hoher Recall zeigt an, dass das OCR-System in der Lage ist, die meisten tatsächlich vorhandenen Texte zu erkennen, wodurch falsch-negative Erkennungen minimiert werden (d.h. das Versäumnis, vorhandenen Text zu erkennen).
F1-Score in der OCR#
Der F1-Score in der OCR bietet eine einzelne Metrik, die sowohl Präzision als auch Recall kombiniert, um eine ausgewogene Ansicht der Gesamtleistung des OCR-Systems zu geben. Da Präzision und Recall einen Trade-off haben (die Verbesserung des einen kann oft zu einer Verringerung des anderen führen), hilft der F1-Score dabei, die Effektivität des OCR-Systems bei der genauen Texterkennung und der Minimierung sowohl von falsch-positiven als auch von falsch-negativen Erkennungen zu bewerten.
Diese Metriken sind entscheidend für die Bewertung von OCR-Systemen, insbesondere in Anwendungen, bei denen die Genauigkeit der Texterkennung direkt das Ergebnis beeinflusst, wie z.B. bei der Dokumentenautomatisierung, der Datenerfassung aus gescannten Dokumenten und der automatisierten Verarbeitung handschriftlicher Formulare. Ein Gleichgewicht zwischen hoher Präzision und hohem Recall ist oft gewünscht, um sicherzustellen, dass das OCR-System sowohl genau als auch umfassend in seinen Texterkennungsfähigkeiten ist.