Resümee#
In diesem Kapitel wurde eine Übersicht über eine Auswahl an Methoden des Natural Language Processing gegeben (Tokenisierung, Lemmatisierung) und es wurde gezeigt, wie diese durch die Python-Bibliothek spaCy auf ein Textkorpus angewendet werden können. Im nächsten Schritt kann auf Grundlage der Token und Lemma das Korpus an Hand von Worthäufigkeiten analysiert werden.