Computerlinguistik am IDH
Seit dem Wintersemester 2022/2023 haben wir ein neues Konzept für die computerlinguistische Ausbildung im Studiengang BA Informationsverarbeitung ausgearbeitet.
- Modul Grundlagen der Computerlinguistik (alte Studienordnung "Computerlinguistische Grundlagen")
- Seminar Computerlinguistische Grundlagen (immer im WiSe, Dozent Hermes, Inhalt: Linguistische Grundlagen, Annotation)
- Vorlesung Sprachverarbeitung (immer im SoSe, Dozent Reiter, Quantitative Eigenschaften von Sprache, Machine Learning)
- Übung Sprachverarbeitung (immer im SoSe, Dozent Reiter, begleitend zur Vorlesung, früher Seminar II)
- Modulprüfung Klausur (immer im SoSe, 90 Minuten, Teilleistung im WiSe möglich, 30 Minuten)
- Modul Anwendungen der Computerlinguistik (alte Studienordnung "Angewandte Linguistische Datenverarbeitung")
- Übung Deep Learning (immer im WiSe, Dozentin Nester, Inhalt: Deep Learning Methoden)
- Hauptseminar Anwendungen der Computerlinguistik (immer im WiSe, Dozent Reiter, Inhalt: Experimente in der CL, wo kommen Fortschritt und Erkenntnis her?)
- Modulprüfung Hausarbeit mit computerlinguistischem Experiment
Semesterüberblick (Wintersemester)
Datum | Ort | Thema | Präsentation | Material |
10.10.2023 |
S56 |
Organisatorisches |
||
17.10.2023 |
S56 |
Einführung: Computerlinguistik |
||
24.10.2023 |
S56 |
Einführung: Sprachwissenschaft |
||
31.10.2023 |
S56 |
Annotation: Einführung |
||
07.11.2023 |
S56 |
Zeichenebene: Methoden |
||
14.11.2023 |
S56 |
Annotation: Kuratierung |
||
21.11.2023 |
S56 |
Wortebene: Methoden |
||
28.11.2023 |
S56 |
Annotation: Inter-Rater-Agreement |
||
05.12.2023 |
S56 |
Satzebene: Methoden |
||
12.12.2022 |
S56 |
Annotation: Dependencies |
||
19.12.2023 |
S56 |
(Weihnachtssitzung: CL-Forschung) |
||
09.01.2024 |
S56 |
Semantik: Methoden |
CL_P09 | |
16.01.2024 |
S56 |
Annotation: Bedeutung |
CL_P10 | |
23.01.2024 |
S60 |
Wiederholung |
||
30.01.2024 |
S60 |
Zwischenklausur |
Studienleistung – Hausaufgaben
In den Sitzungen zur Annotation werden (in ILIAS, Ordner für Kursteilnehmende zugänglich) kleinere Hausaufgaben gestellt, die Sie (in INCEPTION, einem Service, der noch vorgestellt wird) bearbeiten müssen, um dem Kurs erfolgreich abzuschließen und den Kurs in Klips verbucht zu bekommen.
Prüfungsleistung – Klausur
Die Modulprüfung hat die Inhalte des gesamten Moduls zum Gegenstand und kann daher erst im Sommersemester stattfinden. Allerdings ist es für die Teilnehmer möglich, die im Wintersemester vermittelten Kompetenzen bereits in einer Klausur am Ende des Wintersemesters nachzuweisen. Die in dieser Klausur erzielten Punkte können auf die Klausur zum Ende des Sommersemesters angerechnet werden.
Fakultative Teil-Klausur: 30.01.2024 (16:00 Uhr), wahrscheinlich im Raum S60, es werden Aufgaben in ILIAS und in Inception gestellt.
Modulabschlussprüfung: Zum Ende des Sommersemesters 2024
Wiederholung Modulabschlussprüfung: Ende September 2024
Literatur
Die Pflichtliteratur für den Kurs wird auf den Präsentationen der einzelnen Sitzungen referenziert und im ILIAS-Ordner verlinkt. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Werke gibt es inzwischen als Online-Ressource [aus dem UKLAN-Netz der Uni Köln] und / oder in der Lehrbuchsammlung in mehrfacher Ausführung.
-
Mitkov, R. (2022): The Oxford Handbook of Computational Linguistics. Oxford, New York: Oxford University Press.
[Umfassendes Einführungswerk in das Gebiet der Computerlinguistik. In der online-Ressource (die über die USB abrufbar ist) wurden einzelne Kapitel aktualisiert ]
-
Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung. Heidelberg, Berlin: Spektrum.
[Deutsches Pendant zum Oxford Handbook, etwas in die Jahre gekommen. Gibt es an der USB auch als online-Ressource!]
-
Ide, Nancy und James Pustejovsky (2017): Handbook of Linguistic Annotation. Berlin/Heidelberg: Springer.
[Alles Wichtige zum Thema linguistische Annotation. Gibt es an der UB auch als online-Ressource!]
-
Jurafski, D. & J. Martin (2023): Speech and Language Processing. New Jersey: Prentice Hall.
[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, Zum überwiegenden Teil sind die neu aktualisierten Kapitel online zugänglich]
-
Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.
[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“)]
-
Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..
[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage, gibt es in der Lehrbuchsammlung der USB]
-
Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.
[Sprachwissenschaftliches Nachschlagewerk, gibt es als online-Ressource in der USB]
Links
- Google nGramViewer – Erwähnungen von (kombinierten) Termen in Millionen digitalisierter Bücher.
- chatGPT – Dialog-Interface zu Sprachmodellen von OpenAI
- Webservices auf unserem Spinfo-Server (INCEpTION --> launch)
- Kohen's Kappa Beispielrechnung
- Weblicht Services für automatische Annotation
- ParZu-Parser Dependency-Parser (der zwar leicht andere Labels als wir verwendet, aber einfach nutzbar ist)
- Universal Dependencies Übersichtsseite zu Dependenz-Relationen mit Annotationsrichtlinien
Veranstaltungsmaterialien
Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/