Inhalt

In dieser Übung erhalten Studierende Einblicke in Natural Language Processing im Kontext der automatisierten Erkennung von Hate Speech, diskriminierender, rassistischer und populistischer Sprache sowie missbräuchlicher Ausdrucksweisen. Wir werden die genannten Sprachphänomene detailliert analysieren, ihre Darstellungsformen in verschiedenen Textarten untersuchen und die angewandten Methoden zur automatisierten Klassifizierung dieser Textpassagen beleuchten. Nach einer theoretischen Einführung werden Diskussionsgruppen basierend auf ausgewählten wissenschaftlichen Arbeiten geleitet, um eine fundierte Analyse dieser Herausforderung des NLP zu ermöglichen und sie umfassend einschätzen zu können.


Studienleistung

  • Vorbereitung eines Papers
    • Vorstellung des Papers
    • Anschließende Diskussion leiten
    • Fragen vorbereiten
  • Aktive Teilnahme an den Diskussionen
  • Alle Papers lesen und sich auf die Diskussionen vorbereiten

Modulprüfung

Nur für MA Informationsverarbeitung und MA Digital and Computational Archeaology im Modul "Digital Humanities"!

  • Umsetzung eines eigenen Experiments zu Hate Speech Detection (oder einem ähnlichen Sprachphänomen)
  • Fokus je nach Interesse auf Konzeptualisierung und Spezifikation des Sprachphänomens oder auf Realisierung mit Methoden des NLP mit anschließender Evaluation
  • Präsentation des Ergebnisses (ca. 30 min.)
  • Anschließende Fragerunde
  • 90 Std. Arbeitsaufwand
  • 3 CP
  • Prüfungstermine spätestens Ende August
  • Bei Interesse bitte Mail an mich

Termine

30.04.2024

  • Auftakttermin

07.05.2024

14.05.2024

  • Recap
  • Spezifikation von Hate Speech und ähnlichen Sprachphänomenen
  • Folien
  • zu lesen: Melina Plakidis, Georg Rehm. 2022. A Dataset of Offensive German Language Tweets Annotated for Speech Acts. https://aclanthology.org/2022.lrec-1.513/

28.05.2024

  • Recap
  • Realisierung von Hate Speech Detection
  • Evaluation von Hate Speech Klassifikation
  • Folien
  • Nächste Woche erste Paper-Vorstellung und Diskussion. Bitte das Paper lesen und auf die Diskussion vorbereiten.

04.06.2024

  • Termin wird per Zoom abgehalten!
  • Tommaso Caselli, Valerio Basile, Jelena Mitrović, Michael Granitzer. 2021. HateBERT: Retraining BERT for Abusive Language Detection in English. https://aclanthology.org/2021.woah-1.3/

    Folien

    Inge Akyaa

11.06.2024

  • Christopher Klamm, Ines Rehbein, Simone Paolo Ponzetto. 2023. Our kind of people? Detecting populist references in political debates. https://aclanthology.org/2023.findings-eacl.91/

    Folien

    Svenja Bohlmann-Gjikokaj

18.06.2024

  • Pete Burnap, Matthew L Williams. 2016. Us and them: identifying cyber hate on Twitter across multiple protected characteristics. https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-016-0072-6

    Folien

    Alex Froitzheim

25.06.2024

  • Marcos Zampieri, Shervin Malmasi, Preslav Nakov, Sara Rosenthal, Noura Farra, Ritesh Kumar. 2019. Predicting the Type and Target of Offensive Posts in Social Media. https://arxiv.org/abs/1902.09666

    Folien

    Mariia Galevskaia

02.07.2024

  • Julian Risch, Robin Ruff, Ralf Krestel. 2020. Offensive Language Detection Explained. https://aclanthology.org/2020.trac-1.22/

    Folien

    Marco Joost

09.07.2024

  • Wenjie Yin, Vibhor Agarwal, Aiqi Jiang, Arkaitz Zubiaga, Nishanth Sastry. 2023. AnnoBERT: Effectively Representing Multiple Annotators' Label Choices to Improve Hate Speech Detection. https://arxiv.org/abs/2212.10405 Maria Gutierrez

16.07.2024

  • Fan Huang, Haewoon Kwak, Jisun An. 2023. Is ChatGPT better than Human Annotators? Potential and Limitations of ChatGPT in Explaining Implicit Hate Speech. https://arxiv.org/abs/2302.07736 Lukas Scheib