Groblernziele dieser Fallstudie#
Nach erfolgreichem Durchlaufen dieser Fallstudie können im Erfolgsfall die folgenden Groblernziele erreicht werden:
Sie kennen Grundfragen der geisteswissenschaftlichen Forschung mit Korpora nach dem qualitativen Methodenparadigma und wissen um das Konzept der “Operationalisierung” (siehe v.a. Kapitel “Fragestellung und Operationalisierung”).
Sie kennen unterschiedliche Ansätze des Korpusaufbaus und sind mit der Erstellung basaler Metadaten vertraut (siehe v.a. Kapitel “Korpusaufbau”).
Sie können Schritte zur Erstellung eines Forschungskorpus aus Bilddaten mittels Optical Character Recognition (OCR) aufzählen und die Qualität der Datensammlung anhand eines Samples bewerten (siehe v.a. Kapitel “OCR — Vom Bild zum Text”).
Sie kennen unterschiedliche Verfahren der Nachbearbeitung von OCR-Output zur Qualitätsverbesserung (siehe v.a. Kapitel “Nachkorrektur der OCR-Ergebnisse”).
Sie kennen Verfahren der Korpusverarbeitung mit Tools des Natural Language Processing und können Schritte zur Anwendung der Tools zur Tokenisierung und Lemmatisierung benennen (siehe v.a. Kapitel “Korpusverarbeitung – Von Strings zu Token”).
Sie können die auf einem Korpus ausgeführten Frequenzanalysen zu semantischen Feldern erklären und die Ergebnisse interpretieren (siehe v.a. Kapitel “Korpusanalyse”).