Inhalt
Textkorpora bieten als Datengrundlage Möglichkeiten quantitativer und qualitativer Erforschung im Kontext vieler wissenschaftlicher Disziplinen. Ein Beispiel ist das Trainieren künstlicher neuronaler Netze auf bestimmte Sprachphänomene im Natural Language Processing.
Im Kurs sollen grundlegende Kenntnisse vermittelt werden, die benötigt werden, um spezifische Textkorpora anlegen und annotieren zu können. Hierzu werden zuerst Einführungen in die Korpuslinguistik gegeben. Anschließend sollen, anhand praktischer Beispiele aus der Politolinguistik, eigene Annotationsprojekte entwickelt werden.
Anforderungen
Grundlegende Programmierkenntnisse sind eventuell von Vorteil, aber nicht zwingend notwendig.
Studienleistung
Es wird in Gruppenarbeit ein eigenes Annotationsprojekt zu einem spezifischen Sprachphänomen in politischen Texten durchgeführt. Dazu wird eine erste Version von Annotationsrichtlinien erstellt, zu der anschließend annotiert wird. Nach der Vorstellung des Zwischenstands werden die Richtlinien angepasst und mit diesen eine zweite Annotationsrunde umgesetzt. Anschließend wird das Ergebnis in einer Abschlusspräsentation vorgestellt.
Modulprüfung
Modulprüfungen sind bei mir generell möglich. Wer interessiert ist, kann sich gerne bei mir melden und einen Sprechstundentermin ausmachen. Der Umfang der Prüfung hängt vom jeweiligen Modul ab.
Literatur
- Andresen, M., Zinsmeister, H. (2019). Korpuslinguistik. Narr Francke Attempto. https://www.ub.uni-koeln.de/usbportal?query=inst001:8151722
- Burkhardt, J. (1996). Sprachstrategien und Dialogblockaden. De Gruyter. https://www.ub.uni-koeln.de/usbportal?query=inst312:45968
- Cohen, J. (1960). A coefficient of agreement for nominal scales. In: Educational and Psychological Measurement. 20, 1960, S. 37–46.
- Girnth, H. (2015). Sprache und Sprachverwendung in der Politik. De Gruyter. https://www.ub.uni-koeln.de/usbportal?query=inst001:8571530
- Ide, N., Pustejovsky, J. (2017). Handbook of Linguistic Annotation. Springer Science+Business Media Dordrecht 2017. https://link.springer.com/book/10.1007/978-94-024-0881-2
- Landis, J., Koch, G. (1977). The Measurement of Observer Agreement for Categorial Data. In: Biometrics, Vol. 33, 1977, pp.159-174.
- Lemnitzer, L., Zinsmeister, H. (2015). Korpuslinguistik. Narr Francke Attempto. https://www.ub.uni-koeln.de/usbportal?query=inst001:7592721
- Niehr, T. (2014). Einführung in die Politolinguistik. UTB. https://www.ub.uni-koeln.de/usbportal?query=tmpebooks:9783838541730
- Nils Reiter. (2020) Anleitung zur Erstellung von Annotationsrichtlinien. In Nils Reiter, Axel Pichler, Jonas Kuhn (eds.): Reflektierte Algorithmische Textanalyse. Interdisziplinäre(s) Arbeiten in der CRETA-Werkstatt, pp. 193-202, Berlin, Boston: De Gruyter. DOI: 10.1515/9783110693973-009
- Pagel, J., Reiter, N., Rösiger, I., Schulz, S. (2020). Annotation als flexibel einsetzbare Methode. In Nils Reiter, Axel Pichler and Jonas Kuhn (eds.): Reflektierte algorithmische Textanalyse: Interdisziplinäre(s) Arbeiten in der CRETA-Werkstatt, pp. 125-142. Berlin, Boston: De Gruyter. DOI: https://doi.org/10.1515/9783110693973-006
- Pustejovsky, J., Stubbs, A. (2012). Natural Language Annotation for Machine Learning. O'Reilly Media, Inc.
- Rehbein, I., Ruppenhofer, J., Bernauer, J. (2021). Who is we? Disambiguating the referents of first person plural pronouns in parliamentary debates. In Proceedings of the 17th Conference on Natural Language Processing (KONVENS 2021), pages 147–158, Düsseldorf, Germany. KONVENS 2021 Organizers. https://aclanthology.org/2021.konvens-1.13/
- Stefanowitsch, A. (2020). Corpus linguistics. Language Science Press. https://www.ub.uni-koeln.de/usbportal?query=doab:oai:directory.doabooks.org:20.500.12854_26114
Links
- Gliederung nach Reiter 2020
- Link zur Annotationssoftware Inception auf dem Spinfo-Server
- GitHub Repo zum Open-Discourse-Korpus (Plenarprotokolle)
ToDos
S. Ende der Folien!
Kursplan
Termin | Thema |
06.05.2023 |
- Einführung in Korpuslinguistik und Politolinguistik |
27.05.2023 |
- Methodik des Annotierens |
10.06.2023 | - Vorstellung Zwischenstand der Projektarbeit - Diskussion und Besprechung des weiteren Vorgehens - Evaluation der Annotationsqualität |
01.07.2023 | - Abschlussvorstellung der Projektarbeit - Abschlussdiskussion |