Version 1.0

Vortrag: Wie erstelle und annotiere ich ein Korpus?

Möglichkeiten der digitalen Textanalyse

Für empirische linguistische Untersuchungen sind Daten unerlässlich. Doch wo nimmt man diese her? Und was kann man dann mit ihnen machen? Eine Möglichkeit sind Online-Korpora; es besteht jedoch auch die Möglichkeit, ein eigenes Korpus zu erstellen und dieses entsprechend der untersuchten Fragestellung zu annotieren. Im Rahmen der Präsentation soll anhand einer Untersuchung zum strukturellen Aufbau von Zeitungstexten gezeigt werden, wie mithilfe der Online-Datenbank Nexis Uni ein eigenes Korpus erstellt und dieses dann mithilfe des Tools CATMA im Hinblick auf Textteile annotiert wurde. Auf diese Annotation aufbauend wurde dann untersucht, wie sich bestimmte Begriffe auf die Textteile der untersuchten Zeitungstexte verteilen. Vergleichend wurde zudem eine quantitative Untersuchung im Digitalen Wörterbuchs der deutschen Sprache (DWDS) durchgeführt. Auf dieses Vorgehen soll ebenfalls im Rahmen der Präsentation näher eingegangen werden. Darüber hinaus soll abschließend noch auf eine Auswahl bestehender Online-Korpora sowie Tools zur Textaufbereitung und -exploration hingewiesen werden.

Ziel der Präsentation soll es sein, einen Einblick in die Arbeit mit Korpora und (Annotations-)Tools zu geben. Hierbei sollen zunächst die Begriffe „Korpus“ und „Annotation“ definiert werden, bevor auf die Erstellung eines eigenen Korpus eingegangen wird. Exemplarisch wird hierbei die Erstellung eines Zeitungskorpus vorgestellt, welches aus Texten besteht, die dem LGBTQ-Diskurs entstammen. Hierbei wird sowohl auf die Entscheidungen im Hinblick auf die Textauswahl als auch auf die Nutzung der Datenbank Nexis Uni eingegangen. Auch bei der Annotation wird sich exemplarisch auf das Tool CATMA beschränkt, welches im Rahmen der vorgestellten Untersuchung dazu diente, die unterschiedlichen Textteile zu annotieren. Andere Annotationstools und auch bereits bestehende Korpora sollen jedoch im Ausblick kurz Erwähnung finden, um einen Überblick über die Möglichkeiten der digitalen Textanalyse zu erhalten.

Info

Tag: 30.11.2019
Anfangszeit: 12:30
Dauer: 00:30
Raum: Schellingstr. 3 R153
Track: Computational Linguistics
Sprache: de

Links:

Dateien

Feedback

Uns interessiert Ihre Meinung! Wie fanden Sie diese Veranstaltung?

Gleichzeitige Events