Im Kurs Tools, Ressourcen, Infrastruktur beschäftigen wir uns mit der praktischen Seite angewandter Sprachtechnologie. Die behandelten Themen betreffen einerseits Basistechniken und -methoden des software engineerings (git, maven, unittesting). Andererseits beschäftigen wir uns mit verschiedenen machine-learning-Verfahren, die in der Sprachtechnologie relevant sind (Klassifikation, clustering, deep learning, topic modelling), wobei der Fokus des Kurses jeweils auf der praktischen Anwendung liegt.

Die Veranstaltung findet jeweils Donnerstags, 12 Uhr per Discord statt.

Termine

  • 05.11.2020: Einführung, Überblick, Setup
  • 12.11.2020: Versionskontrolle mit Git
  • 19.11.2020: Tabellarische Daten, Java-Projektverwaltung mit maven
  • 26.11.2020: Machine learning mit Weka 1: Preprocessing und Klassifikation
  • 03.12.2020: Machine learning mit Weka 2: Clustering und command line interface
  • 10.12.2020: Machine learning mit mallet: LDA / topic modelling
  • 17.12.2020: Deep learning mit DeepLearning4J
  • 07.01.2021: Datenstrukturen für's natural language processing
  • 14.01.2021: UIMA
  • 21.01.2021: UIMA und dkpro
  • 28.01.2021: Unit-testing
  • 04.02.2021: Noch offen
  • 11.02.2021: Noch offen