Inhalt

Textkorpora bieten als Datengrundlage Möglichkeiten quantitativer und qualitativer Erforschung im Kontext vieler wissenschaftlicher Disziplinen. Ein Beispiel ist das Trainieren künstlicher neuronaler Netze auf bestimmte Sprachphänomene im Natural Language Processing.
Im Kurs sollen grundlegende Kenntnisse vermittelt werden, die benötigt werden, um spezifische Textkorpora anlegen und annotieren zu können. Hierzu werden zuerst Einführungen in die Korpuslinguistik gegeben. Anschließend sollen, anhand praktischer Beispiele aus der Politolinguistik, eigene Annotationsprojekte entwickelt werden.


Anforderungen

Grundlegende Programmierkenntnisse sind eventuell von Vorteil, aber nicht zwingend notwendig.


Studienleistung

Es wird in Gruppenarbeit ein eigenes Annotationsprojekt zu einem spezifischen Sprachphänomen in politischen Texten durchgeführt. Dazu wird eine erste Version von Annotationsrichtlinien erstellt, zu der anschließend annotiert wird. Nach der Vorstellung des Zwischenstands werden die Richtlinien angepasst und mit diesen eine zweite Annotationsrunde umgesetzt. Anschließend wird das Ergebnis in einer Abschlusspräsentation vorgestellt.


Modulprüfung

Modulprüfungen sind bei mir generell möglich. Wer interessiert ist, kann sich gerne bei mir melden und einen Sprechstundentermin ausmachen. Der Umfang der Prüfung hängt vom jeweiligen Modul ab.


Literatur


Links

  • Gliederung nach Reiter 2020
  • Link zur Annotationssoftware Inception auf dem Spinfo-Server
  • GitHub Repo zum Open-Discourse-Korpus (Plenarprotokolle)

ToDos

S. Ende der Folien!


Kursplan

Termin Thema

06.05.2023

- Einführung in Korpuslinguistik und Politolinguistik

27.05.2023

- Methodik des Annotierens
- Start der Projektarbeit

10.06.2023 - Vorstellung Zwischenstand der Projektarbeit
- Diskussion und Besprechung des weiteren Vorgehens
- Evaluation der Annotationsqualität
01.07.2023 - Abschlussvorstellung der Projektarbeit
- Abschlussdiskussion