Inhalt

In dieser Übung erhalten Studierende Einblicke in Natural Language Processing im Kontext der automatisierten Erkennung von Hate Speech, diskriminierender, rassistischer und populistischer Sprache sowie missbräuchlicher Ausdrucksweisen. Wir werden die genannten Sprachphänomene detailliert analysieren, ihre Darstellungsformen in verschiedenen Textarten untersuchen und die angewandten Methoden zur automatisierten Klassifizierung dieser Textpassagen beleuchten. Nach einer theoretischen Einführung werden Diskussionsgruppen basierend auf ausgewählten wissenschaftlichen Arbeiten geleitet, um eine fundierte Analyse dieser Herausforderung des NLP zu ermöglichen und sie umfassend einschätzen zu können.


Studienleistung

  • Vorbereitung eines Papers
    • Vorstellung des Papers
    • Anschließende Diskussion leiten
    • Fragen vorbereiten
  • Aktive Teilnahme an den Diskussionen
  • Alle Papers lesen und sich auf die Diskussionen vorbereiten

Modulprüfung

Nur für MA Informationsverarbeitung und MA Digital and Computational Archeaology im Modul "Digital Humanities"!

  • Umsetzung eines eigenen Experiments zu Hate Speech Detection (oder einem ähnlichen Sprachphänomen)
  • Fokus je nach Interesse auf Konzeptualisierung und Spezifikation des Sprachphänomens oder auf Realisierung mit Methoden des NLP mit anschließender Evaluation
  • Präsentation des Ergebnisses (ca. 30 min.)
  • Anschließende Fragerunde
  • 90 Std. Arbeitsaufwand
  • 3 CP
  • Prüfungstermine spätestens Ende August
  • Bei Interesse bitte Mail an mich

Termine

30.04.2024

  • Auftakttermin

07.05.2024

14.05.2024

  • Recap
  • Spezifikation von Hate Speech und ähnlichen Sprachphänomenen
  • Folien
  • zu lesen: Melina Plakidis, Georg Rehm. 2022. A Dataset of Offensive German Language Tweets Annotated for Speech Acts. https://aclanthology.org/2022.lrec-1.513/

28.05.2024

  • Recap
  • Realisierung von Hate Speech Detection
  • Evaluation von Hate Speech Klassifikation
  • Folien
  • Nächste Woche erste Paper-Vorstellung und Diskussion. Bitte das Paper lesen und auf die Diskussion vorbereiten.

04.06.2024

  • Termin wird per Zoom abgehalten!
  • Tommaso Caselli, Valerio Basile, Jelena Mitrović, Michael Granitzer. 2021. HateBERT: Retraining BERT for Abusive Language Detection in English. https://aclanthology.org/2021.woah-1.3/

11.06.2024

  • Christopher Klamm, Ines Rehbein, Simone Paolo Ponzetto. 2023. Our kind of people? Detecting populist references in political debates. https://aclanthology.org/2023.findings-eacl.91/

18.06.2024

  • Pete Burnap, Matthew L Williams. 2016. Us and them: identifying cyber hate on Twitter across multiple protected characteristics. https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-016-0072-6

25.06.2024

  • Marcos Zampieri, Shervin Malmasi, Preslav Nakov, Sara Rosenthal, Noura Farra, Ritesh Kumar. 2019. Predicting the Type and Target of Offensive Posts in Social Media. https://arxiv.org/abs/1902.09666

02.07.2024

  • Julian Risch, Robin Ruff, Ralf Krestel. 2020. Offensive Language Detection Explained. https://aclanthology.org/2020.trac-1.22/

09.07.2024

  • Wenjie Yin, Vibhor Agarwal, Aiqi Jiang, Arkaitz Zubiaga, Nishanth Sastry. 2023. AnnoBERT: Effectively Representing Multiple Annotators' Label Choices to Improve Hate Speech Detection. https://arxiv.org/abs/2212.10405

16.07.2024

  • Fan Huang, Haewoon Kwak, Jisun An. 2023. Is ChatGPT better than Human Annotators? Potential and Limitations of ChatGPT in Explaining Implicit Hate Speech. https://arxiv.org/abs/2302.07736