Hate Speech Detection

"Hassrede" ist zwar kein neues Phänomen, ihre automatische Erkennung (und ggf. Entfernung) aber ein Thema das erst in den letzten Jahren an relevanz gewonnen hat. Eine Herausforderung dabei besteht in der Kontextabhängigkeit: Die gleiche Wortfolge mag in einem Kontext hate speech sein, in einem anderen jedoch nicht. Zudem existieren unterschiedliche Formen von hate speech, die sich in ihrer Offensichtlichkeit und Explizitheit unterscheiden, sowie danach wie eine Gruppe definiert wird, gegen die sich die Rede richtet (z.B. sexistische vs. rassistische vs. antisemitische Rede).

Literatur

  • Madukwe, Kosisochukwu/Xiaoying Gao/Bing Xue (Nov. 2020): “In Data We Trust: A Critical Analysis of Hate Speech Detection Datasets”. In: Proceedings of the Fourth Workshop on Online Abuse and Harms. Online: Association for Computational Linguistics, pp. 150–161. doi: 10.18653/v1/2020.alw-1.18. url: https://aclanthology.org/2020.alw-1.18.
  • Warner, William/Julia Hirschberg (June 2012): “Detecting Hate Speech on the World Wide Web”. In: Proceedings of the Second Workshop on Language in Social Media. Montréal, Canada: Association for Computational Linguistics, pp. 19–26. url: http://www.aclweb.org/anthology/W12-2103.
  • Waseem, Zeerak/Dirk Hovy (June 2016): “Hateful Symbols or Hateful People? Predictive Features for Hate Speech Detection on Twitter”. In: Proceedings of the NAACL Student Research Workshop. San Diego, California: Association for Computational Linguistics, pp. 88–93. url: http://www.aclweb.org/anthology/N16-2013.
  • Posselt, Gerhard (2017): “Can Hatred Speak? On the Linguistic Dimensions of Hate Crime”. In: Linguistik online 82.3. doi: 10.13092/lo.82.3712.