Herausforderungen des Natural Language Processing: Hate Speech, diskriminierende Sprache und populistische Rhetorik

Inhalt

In dieser Übung erhalten Studierende Einblicke in Natural Language Processing im Kontext der automatisierten Erkennung von Hate Speech, diskriminierender, rassistischer und populistischer Sprache sowie missbräuchlicher Ausdrucksweisen. Wir werden die genannten Sprachphänomene detailliert analysieren, ihre Darstellungsformen in verschiedenen Textarten untersuchen und die angewandten Methoden zur automatisierten Klassifizierung dieser Textpassagen beleuchten. Nach einer theoretischen Einführung werden Diskussionsgruppen basierend auf ausgewählten wissenschaftlichen Arbeiten geleitet, um eine fundierte Analyse dieser Herausforderung des NLP zu ermöglichen und sie umfassend einschätzen zu können.

Studienleistung

Vorbereitung eines Papers
- Vorstellung des Papers
- Anschließende Diskussion leiten
- Fragen vorbereiten
Aktive Teilnahme an den Diskussionen
Alle Papers lesen und sich auf die Diskussionen vorbereiten

Modulprüfung

Nur für MA Informationsverarbeitung und MA Digital and Computational Archeaology im Modul "Digital Humanities"!

Umsetzung eines eigenen Experiments zu Hate Speech Detection (oder einem ähnlichen Sprachphänomen)
Fokus je nach Interesse auf Konzeptualisierung und Spezifikation des Sprachphänomens oder auf Realisierung mit Methoden des NLP mit anschließender Evaluation
Präsentation des Ergebnisses (ca. 30 min.)
Anschließende Fragerunde
90 Std. Arbeitsaufwand
3 CP
Prüfungstermine spätestens Ende August
Bei Interesse bitte Mail an mich

Termine

30.04.2024

Auftakttermin

07.05.2024

Recap
Operationalisierung
Konzeptionalisierung von Hate Speech und ähnlichen Sprachphänomenen
Kursplan
Folien
zu lesen: Ludger Hoffmann. 2020. Zur Sprache des Rassismus. In: Sprachreport 1/2020. 40-47. https://pub.ids-mannheim.de/laufend/sprachreport/pdf/sr20-1.pdf

14.05.2024

Recap
Spezifikation von Hate Speech und ähnlichen Sprachphänomenen
Folien
zu lesen: Melina Plakidis, Georg Rehm. 2022. A Dataset of Offensive German Language Tweets Annotated for Speech Acts. https://aclanthology.org/2022.lrec-1.513/

28.05.2024

Recap
Realisierung von Hate Speech Detection
Evaluation von Hate Speech Klassifikation
Folien
Nächste Woche erste Paper-Vorstellung und Diskussion. Bitte das Paper lesen und auf die Diskussion vorbereiten.

04.06.2024

Termin wird per Zoom abgehalten!
Tommaso Caselli, Valerio Basile, Jelena Mitrović, Michael Granitzer. 2021. HateBERT: Retraining BERT for Abusive Language Detection in English. https://aclanthology.org/2021.woah-1.3/

11.06.2024

Christopher Klamm, Ines Rehbein, Simone Paolo Ponzetto. 2023. Our kind of people? Detecting populist references in political debates. https://aclanthology.org/2023.findings-eacl.91/

18.06.2024

Pete Burnap, Matthew L Williams. 2016. Us and them: identifying cyber hate on Twitter across multiple protected characteristics. https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-016-0072-6

25.06.2024

Marcos Zampieri, Shervin Malmasi, Preslav Nakov, Sara Rosenthal, Noura Farra, Ritesh Kumar. 2019. Predicting the Type and Target of Offensive Posts in Social Media. https://arxiv.org/abs/1902.09666

02.07.2024

Julian Risch, Robin Ruff, Ralf Krestel. 2020. Offensive Language Detection Explained. https://aclanthology.org/2020.trac-1.22/

09.07.2024

Wenjie Yin, Vibhor Agarwal, Aiqi Jiang, Arkaitz Zubiaga, Nishanth Sastry. 2023. AnnoBERT: Effectively Representing Multiple Annotators' Label Choices to Improve Hate Speech Detection. https://arxiv.org/abs/2212.10405

16.07.2024

Fan Huang, Haewoon Kwak, Jisun An. 2023. Is ChatGPT better than Human Annotators? Potential and Limitations of ChatGPT in Explaining Implicit Hate Speech. https://arxiv.org/abs/2302.07736

Herausforderungen des Natural Language Processing: Hate Speech, diskriminierende Sprache und populistische Rhetorik

Übung im Sommersemester 2024

Inhalt

Studienleistung

Modulprüfung

Termine