🏆Selbsttest: Wissen und Praxis#
Hinweis
Diese Übungsaufgaben dienen Ihrer Selbsteinschätzung und helfen Ihnen, das im Kapitel Gelernte zu reflektieren.
Sie können die Fragen in beliebiger Reihenfolge beantworten und auch mehrfach versuchen.
So funktioniert es:
Wählen Sie bei jeder Frage die Antwort(en), die Sie für richtig halten
Lesen Sie das Feedback zu den einzelnen Antwortoptionen sorgfältig durch
Die Erklärungen helfen Ihnen, Ihr Verständnis zu vertiefen – auch bei korrekten Antworten
Es erfolgt keine Bewertung oder Speicherung Ihrer Ergebnisse. Nutzen Sie dieses Assessment, um Wissenslücken zu identifizieren und gegebenenfalls die entsprechenden Abschnitte des Kapitels noch einmal zu bearbeiten.
Geschätzte Zeit: 45min
Viel Erfolg!
Frage 1#
Frage 2#
Frage 3#
Frage 4#
Frage 5#
Frage 6#
Analysieren Sie den folgenden Satz mit NLP-Methoden und beschreiben Sie die Ergebnisse:
Originaltext: “Die Forschenden untersuchten verschiedene Zeitungsartikel zur Spanischen Grippe.”
Führen Sie eine Tokenisierung durch.
Bestimmen Sie die Lemmata der einzelnen Token.
Reflektieren Sie, wie diese Verarbeitung eine quantitative Analyse unterstützen würde.
Lösung
Beispiellösung zur Selbstbewertung:
Tokenisierung: [“Die”, “Forschenden”, “untersuchten”, “verschiedene”, “Zeitungsartikel”, “zur”, “Spanischen”, “Grippe”, “.”]
Lemmatisierung: [“der”, “Forschende”, “untersuchen”, “verschieden”, “Zeitungsartikel”, “zu”, “spanisch”, “Grippe”, “.”]
Reflexion:
Die Tokenisierung ermöglicht die Analyse auf Wortebene und bereitet den Text für weitere Verarbeitung vor
Die Lemmatisierung würde alle Formen von “untersuchen” zusammenfassen, was bei einer Frequenzanalyse hilfreich ist
Durch die Lemmatisierung werden verschiedene Flexionsformen (wie “Spanischen” zu “spanisch”) vereinheitlicht (‘die’ wird standardmäßig zu ‘der’ lemmatisiert).
Bei einer größeren Textsammlung würden verschiedene grammatikalische Formen desselben Wortes nicht als unterschiedliche Begriffe gezählt
Diese Normalisierung verbessert die Qualität von Häufigkeitsanalysen, Keyword-Extraktion und thematischen Analysen
Die Informationen über die ursprüngliche Form bleiben erhalten und können für detailliertere linguistische Analysen genutzt werden
Bewertungskriterien für die Selbsteinschätzung:
Korrekte Tokenisierung mit Berücksichtigung von Satzzeichen als eigene Token
Korrekte Bestimmung der Grundformen bei der Lemmatisierung
Verständnis des Nutzens für quantitative Textanalyse, insbesondere für Häufigkeitsanalysen
Reflexion über die Vor- und Nachteile der Methoden für die spezifische Forschungsfrage
Frage 7#
(Wählen Sie alle zutreffenden Antworten aus)
Frage 8#
(Wählen Sie alle zutreffenden Antworten aus)