(corpus-collection_summary)=
# Resümee

```{admonition} Key points des Kapitels
:class: keypoint
**Korpora als Forschungsobjekte**

Korpora sind systematisch zusammengestellte Sammlungen maschinenlesbarer Textdokumente. Je nach Forschungszweck können [verschiedene Strategien](corpus-collection_corpora-as-research-objects) zum Aufbau gewählt werden, von vollständigen bis hin zu repräsentativen Stichproben.

**Digitale Textformate**

Für die Korpuserstellung stehen [unterschiedliche Formate](corpus-collection_text_as_digital_objects) zur Verfügung: Bilddigitalisate (PDF, PNG) für visuelle Authentizität, Plain Text (TXT) für einfache Verarbeitung, XML/TEI für strukturierte Auszeichnung und CSV für tabellarische Annotationen.

**Metadaten**

Die systematische Dokumentation erfolgt durch [Metadaten](corpus-collection_metadata) auf zwei Ebenen: Korpus-Metadaten beschreiben die Gesamtsammlung, Element-Metadaten die einzelnen Dokumente. Etablierte Standards wie Dublin Core bieten hierfür standardisierte Schemata.

**Praktische Umsetzung**

Der praktische Korpusaufbau erfolgt in drei Schritten: Konzeptentwicklung, Metadatenerstellung und [Datensammlung](corpus-collection_building-our-corpus). Dabei müssen sowohl forschungsmethodische Anforderungen als auch praktische Beschränkungen berücksichtigt werden.
```

<!--
In diesem Kapitel haben wir uns zunächst über unterschiedliche [Typen von Korpora bzw. Strategien der Korpusbildung](corpus-collection_corpora-as-research-objects) in den Digital Humanities verständigt, um danach eine differenzierte Vorstellung von den u[nterschiedlichen Erscheinungsformen und Formaten von "Text" im digitalen Raum ](corpus-collection_text_as_digital_objects)zu entwickeln. Wir haben des Weiteren eine Idee von der [Funktion und der Struktur von Metadaten für die Korpusbeschreibung](corpus-collection_metadata) entwickelt und diese dann – sowohl auf Ebene des Gesamtkorpus als auch auf Ebene der einzelnen Korpuselemente – auf unser Forschungskorpus angewandt. Schließlich haben wir das mit Metadaten hinreichend beschriebene [Forschungskorpus durch einen automatisierten Download aufgebaut](corpus-collection_building-our-corpus). Damit ist unser Forschungskorpus fertig und kann in den nächsten Schritten aufbereitet und angereichert werden. 
-->
