Der Kurs beschäftigt sich mit praktischen Fragen zur Anwendung maschineller Lernverfahren zur Sprachverarbeitung mittels Java. Der Hauptteil des Kurses kreist um die open-source-Bibliotheken UIMA und Weka, am Ende werden wir noch etwas über deep learning in Java sprechen.
In jeder Sitzung wird in ein neues Thema theoretisch eingeführt, danach folgt eine lab session, in der an einer vorbereiteten Übung gearbeitet werden kann, die als Git repository zur Verfügung gestellt wird. Diese ist bis zur nächsten Übung fertigzustellen und via git hochzuladen.
Vorbereitung: Bitte richten Sie sich einen (kostenlosen) GitHub-Account ein und teilen Sie ihn mir per E-Mail mit. Sie werden dann in die Gruppe dort aufgenommen und können Repositories clonen und in diese committen.
Voraussetzungen: Es handelt sich bei dieser Übung nicht um einen Java-Einführungskurs. Programmierkenntnisse mit Java werden vorausgesetzt.
Termine
03.11.2020
10.11.2020
17.11.2020
24.11.2020
- Machine learning with the Weka API
- Slides
- Link to Weka Javadoc
- Exercise 4
01.12.2020
- Tree classifiers and parameter tuning
- Slides
- Exercise 5
08.12.2020
- Unit testing and decision tree implementation planning
- Slides
- Exercise 6
15.12.2020
- GitHub actions and continuous integration, data structures and utility functions for DT implementation
- Slides
- Exercise 7
22.12.2020
- Putting it all together: Implementing the training procedure
- Slides
- Exercise 8
12.01.2021
- Apache UIMA, UIMA type systems
- Slides
- Exercise 9
19.01.2021
- Apache UIMA, UIMA components and pipelines
- Slides
- Exercise 10
26.01.2021
- DKpro, Deep learning mit Java, Teil 1 (ND4J, Datavec)
- Slides
- Exercise 11
02.02.2021
- Deep learning mit Java, Teil 2
- Slides
- Exercise 12
09.02.2021
- Leftovers: Logging frameworks, Hadoop