Im Kurs Tools, Ressourcen, Infrastruktur beschäftigen wir uns mit der praktischen Seite angewandter Sprachtechnologie. Die behandelten Themen betreffen einerseits Basistechniken und -methoden des software engineerings (git, maven, unittesting). Andererseits beschäftigen wir uns mit verschiedenen machine-learning-Verfahren, die in der Sprachtechnologie relevant sind (Klassifikation, clustering, deep learning, topic modelling), wobei der Fokus des Kurses jeweils auf der praktischen Anwendung liegt.

Die Veranstaltung findet jeweils Donnerstags, 12 Uhr per Discord statt.

Termine

  • 05.11.2020: Einführung, Überblick, Setup
  • 12.11.2020: Versionskontrolle mit Git
  • 19.11.2020: Versionskontrolle mit Git: Merging
  • 26.11.2020: Tabellarische Daten
  • 03.12.2020: Machine learning mit Weka 1: Klassifikation und Evaluation
  • 10.12.2020: Machine learning mit Weka 2: Clustering
  • 17.12.2020: Machine learning mit Weka 3: Weka as Java API
  • 07.01.2021: Datenstrukturen für's natural language processing
  • 14.01.2021: Apache UIMA (und maven)
  • 21.01.2021: UIMA und dkpro
  • 28.01.2021: Unit-testing
  • 04.02.2021: Texte schreiben mit LaTeX
  • 11.02.2021: Bibliographie verwalten mit BibTeX