Inhalt
In dieser Übung erhalten Studierende Einblicke in Natural Language Processing im Kontext der automatisierten Erkennung von Hate Speech, diskriminierender, rassistischer und populistischer Sprache sowie missbräuchlicher Ausdrucksweisen. Wir werden die genannten Sprachphänomene detailliert analysieren, ihre Darstellungsformen in verschiedenen Textarten untersuchen und die angewandten Methoden zur automatisierten Klassifizierung dieser Textpassagen beleuchten. Nach einer theoretischen Einführung werden Diskussionsgruppen basierend auf ausgewählten wissenschaftlichen Arbeiten geleitet, um eine fundierte Analyse dieser Herausforderung des NLP zu ermöglichen und sie umfassend einschätzen zu können.
Studienleistung
- Vorbereitung eines Papers
- Vorstellung des Papers
- Anschließende Diskussion leiten
- Fragen vorbereiten
- Aktive Teilnahme an den Diskussionen
- Alle Papers lesen und sich auf die Diskussionen vorbereiten
Modulprüfung
Nur für MA Informationsverarbeitung und MA Digital and Computational Archeaology im Modul "Digital Humanities"!
- Umsetzung eines eigenen Experiments zu Hate Speech Detection (oder einem ähnlichen Sprachphänomen)
- Fokus je nach Interesse auf Konzeptualisierung und Spezifikation des Sprachphänomens oder auf Realisierung mit Methoden des NLP mit anschließender Evaluation
- Präsentation des Ergebnisses (ca. 30 min.)
- Anschließende Fragerunde
- 90 Std. Arbeitsaufwand
- 3 CP
- Prüfungstermine spätestens Ende August
- Bei Interesse bitte Mail an mich
Termine
30.04.2024
- Auftakttermin
07.05.2024
- Recap
- Operationalisierung
- Konzeptionalisierung von Hate Speech und ähnlichen Sprachphänomenen
- Kursplan
- Folien
- zu lesen: Ludger Hoffmann. 2020. Zur Sprache des Rassismus. In: Sprachreport 1/2020. 40-47. https://pub.ids-mannheim.de/laufend/sprachreport/pdf/sr20-1.pdf
14.05.2024
- Recap
- Spezifikation von Hate Speech und ähnlichen Sprachphänomenen
- Folien
- zu lesen: Melina Plakidis, Georg Rehm. 2022. A Dataset of Offensive German Language Tweets Annotated for Speech Acts. https://aclanthology.org/2022.lrec-1.513/
28.05.2024
- Recap
- Realisierung von Hate Speech Detection
- Evaluation von Hate Speech Klassifikation
- Folien
- Nächste Woche erste Paper-Vorstellung und Diskussion. Bitte das Paper lesen und auf die Diskussion vorbereiten.
04.06.2024
- Termin wird per Zoom abgehalten!
- Tommaso Caselli, Valerio Basile, Jelena Mitrović, Michael Granitzer. 2021. HateBERT: Retraining BERT for Abusive Language Detection in English. https://aclanthology.org/2021.woah-1.3/
11.06.2024
- Christopher Klamm, Ines Rehbein, Simone Paolo Ponzetto. 2023. Our kind of people? Detecting populist references in political debates. https://aclanthology.org/2023.findings-eacl.91/
18.06.2024
- Pete Burnap, Matthew L Williams. 2016. Us and them: identifying cyber hate on Twitter across multiple protected characteristics. https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-016-0072-6
25.06.2024
- Marcos Zampieri, Shervin Malmasi, Preslav Nakov, Sara Rosenthal, Noura Farra, Ritesh Kumar. 2019. Predicting the Type and Target of Offensive Posts in Social Media. https://arxiv.org/abs/1902.09666
02.07.2024
- Julian Risch, Robin Ruff, Ralf Krestel. 2020. Offensive Language Detection Explained. https://aclanthology.org/2020.trac-1.22/
09.07.2024
- Wenjie Yin, Vibhor Agarwal, Aiqi Jiang, Arkaitz Zubiaga, Nishanth Sastry. 2023. AnnoBERT: Effectively Representing Multiple Annotators' Label Choices to Improve Hate Speech Detection. https://arxiv.org/abs/2212.10405
16.07.2024
- Fan Huang, Haewoon Kwak, Jisun An. 2023. Is ChatGPT better than Human Annotators? Potential and Limitations of ChatGPT in Explaining Implicit Hate Speech. https://arxiv.org/abs/2302.07736