Computerlinguistik am IDH
Seit dem Wintersemester 2022/2023 haben wir ein neues Konzept für die computerlinguistische Ausbildung im Studiengang BA Informationsverarbeitung ausgearbeitet.
- Modul Grundlagen der Computerlinguistik (alte Studienordnung "Computerlinguistische Grundlagen")
- Seminar Computerlinguistische Grundlagen (immer im WiSe, Dozent Hermes, Inhalt: Linguistische Grundlagen, Annotation)
- Vorlesung Sprachverarbeitung (immer im SoSe, Dozent Reiter, Quantitative Eigenschaften von Sprache, Machine Learning)
- Übung Sprachverarbeitung (immer im SoSe, Dozent Reiter, begleitend zur Vorlesung, früher Seminar II)
- Modulprüfung Klausur (immer im SoSe, 90 Minuten, Teilleistung im WiSe möglich, 30 Minuten)
- Modul Anwendungen der Computerlinguistik (alte Studienordnung "Angewandte Linguistische Datenverarbeitung")
- Übung Deep Learning (immer im WiSe, Dozentin Nester, Inhalt: Deep Learning Methoden)
- Hauptseminar Experimentelles Arbeiten in der Sprachverarbeitung (immer im WiSe, Dozent Reiter, Inhalt: Experimente in der CL, wo kommen Fortschritt und Erkenntnis her?)
- Modulprüfung Hausarbeit mit computerlinguistischem Experiment
Semesterüberblick (Wintersemester)
Datum | Thema | Präsentation | Material |
11.10.2022 |
Organisatorisches |
||
18.10.2022 |
Einführung: Computerlinguistik |
CL_01.pdf | |
25.10.2022 |
Einführung: Sprachwissenschaft |
CL_02.pdf | |
08.11.2022 |
(Fortsetzung) |
Video | |
15.11.2022 |
Annotation: Einführung | CL_03.pdf | |
22.11.2022 |
Zeichenebene: Methoden |
CL_04.pdf | |
29.11.2022 |
Annotation: Kuratierung |
||
06.12.2022 |
Wortebene: Methoden |
CL_05.pdf | |
13.12.2022 |
Annotation: Inter-Rater-Agreement |
||
20.12.2022 |
Satzebene: Methoden |
Video | |
10.01.2023 |
Satzebene: Annotation |
||
17.01.2023 |
Semantik: Methoden |
CL_07.pdf | |
24.01.2023 |
Semantik: Annotation | ||
31.01.2023 |
Zwischenklausur |
Wichtiges in Kürze
-
Literatur zu den jeweiligen Themen wird in den Präsentationen zu den einzelnen Sitzungen referenziert, den Teilnehmern über ILIAS zugänglich gemacht und ggfs. auf dieser Seite auch öffentlich verlinkt.
-
Studienleistung: Zu den Annotationssitzungen werden Hausaufgaben gestellt, deren Berabeitung obligatorisch ist.
-
Prüfungsleistung: Die Modulprüfung hat die Inhalte des gesamten Moduls zum Gegenstand und kann daher erst im Sommersemester stattfinden. Allerdings ist es für die Teilnehmer möglich, die im Wintersemester vermittelten Kompetenzen bereits in einer Klausur am 31.01.2023 nachzuweisen. Die in dieser Klausur erzielten Punkte können auf die Klausur zum Ende des Sommersemesters angerechnet werden.
Studienleistung – Hausaufgaben
(Wird in den nächtsten Wochen genauer spezifiziert)
Prüfungsleistung - Klausur
(Wird in den nächsten Wochen spezifiziert)
Fakultative Teil-Klausur: 31.01.2023 (16:00 Uhr), Genauere Informationen folgen
Modulabschlussprüfung: Zum Ende des Sommersemesters 2023
Wiederholung Modulabschlussprüfung: Ende September 2023
Literatur
(Wird in den nächsten Wochen aktualisiert)
Die Pflichtliteratur für den Kurs wird sich als Weblinks auf pdf-Dateien im ILIAS-Ordner zum Kurs befinden. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Werke gibt es inzwischen als Online-Ressource und / oder in der Lehrbuchsammlung in mehrfacher Ausführung.
-
Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Auflage). Heidelberg, Berlin: Spektrum.
[Relativ aktuelles und umfassendes Werk, das begleitend zum Kurs und darüber hinaus gelesen werden kann. 55 €, Gibt es an der UB auch als online-Ressource!]
-
Mitkov, R. (2014): The Oxford Handbook of Computational Linguistics 2. Auflage). Oxford, New York: Oxford University Press.
[Das englische Pendant zu dem Buch oben. Gliederung und Schwerpunktsetzung ein wenig abweichend aber mindestens genauso zu empfehlen. Gibt es an der UB auch als online-Ressource!]
-
Ide, Nancy und James Pustejovsky (2017): Handbook of Linguistic Annotation. Berlin/Heidelberg: Springer.
[Alles Wichtige zum Thema linguistische Annotation. Gibt es an der UB auch als online-Ressource!]
-
Jurafski, D. & J. Martin (2020): Speech and Language Processing. New Jersey: Prentice Hall.
[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, 75 €, Zum überwiegenden Teil sind die neu aktualisierten Kapitel online zugänglich]
-
Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.
[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik für weniger als 15 € - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“ für ca. 28 € zu beziehen)]
-
Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..
[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage (15 €)]
-
Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.
[Sprachwissenschaftliches Nachschlagewerk (35 €)]
Links
- Computerlinguistik: Was ist das eigentlich (Info-Seite zum Studiengang, IMS Stuttgart)
- Anschaulicher, einführender Artikel zu Hidden-Markov-Modellen (Stamp 2018)
- Link zur Annotationssoftware Inception auf dem Spinfo-Server
- ParZu Parser
- Dokumentation zu Universal Dependencies - Morphologie
- Dokumentation zu Universal Dependencies - Syntax
Veranstaltungsmaterialien
Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/