Computerlinguistik am IDH

Dieses Seminar bildet den Einstieg in die computerlinguistische Ausbildung im Studiengang Informationsverarbeitung. Diese besteht aus zwei Modulen:

  • Modul Grundlagen der Computerlinguistik
    • Seminar Computerlinguistische Grundlagen (immer im WiSe, Dozent Hermes, Inhalt: Linguistische Grundlagen, Annotation)
    • Vorlesung Sprachverarbeitung (immer im SoSe, Dozent Reiter, Quantitative Eigenschaften von Sprache, Machine Learning)
    • Übung Sprachverarbeitung (immer im SoSe, Dozent Reiter, begleitend zur Vorlesung)
    • Modulprüfung Klausur (immer im SoSe, 90 Minuten)
  • Modul Anwendungen der Computerlinguistik
    • Übung Deep Learning (immer im WiSe, Dozentin Nester, Inhalt: Deep Learning Methoden)
    • Hauptseminar Anwendungen der Computerlinguistik (immer im WiSe, Dozent Reiter, Inhalt: Experimente in der CL, wo kommen Fortschritt und Erkenntnis her?)
    • Modulprüfung Hausarbeit mit computerlinguistischem Experiment

Semesterüberblick (Wintersemester)

Datum Thema Präsentation Material

14.10.2025

Einführung: Organisatorisches

21.10.2025

Einführung: Computerlinguistik

CL25P01.pdf

29.10.2025

Einführung: Sprachwissenschaft

CL25P02.pdf

04.11.2025

Einführung: Annotation

CL25P03.pdf

11.11.2025

Methoden: Zeichenebene

CL25P04.pdf

Video: Youtube/OpenCast

18.11.2025

Annotation: Kuratierung

CL25P05.pdf

Inception User Guide

25.11.2025

Methoden: Wortebene

CL25P06.pdf

02.12.2025

Annotation: Inter-Rater-Agreement

CL25P07.pdf

09.12.2025

Methoden: Satzebene

CL25P08.pdf

Video: Youtube/OpenCast

16.12.2025

Annotation: Dependencies

CL25P09.pdf

13.01.2026

Methoden: Semantik

CL25P10.pdf

20.01.2026

Annotation: Bedeutung

CL25P11.pdf

27.01.2026

Wiederholung

03.02.2026

Fakultative Teil-Klausur


Studienleistung – Hausaufgaben und Abschlusstestat

In den Sitzungen zur Annotation werden (in ILIAS, Ordner für Kursteilnehmende zugänglich) kleinere Hausaufgaben gestellt, die Sie (in INCEPTION, einem Service, der noch vorgestellt wird) bearbeiten müssen, um dem Kurs erfolgreich abzuschließen und den Kurs in Klips verbucht zu bekommen.


Prüfungsleistung – Klausur (im Sommersemester)

Die Modulprüfung hat die Inhalte des gesamten Moduls zum Gegenstand und kann daher erst im Sommersemester stattfinden. Allerdings ist es für die Teilnehmer möglich, die im Wintersemester vermittelten Kompetenzen bereits in einer Klausur am Ende des Wintersemesters nachzuweisen. Die in dieser Klausur erzielten Punkte können auf die Klausur zum Ende des Sommersemesters angerechnet werden.

Fakultative Teil-Klausur: 03.02.2026 (16:00 Uhr), wahrscheinlich im Raum PC74, es werden Aufgaben in ILIAS und in Inception gestellt.

Modulabschlussprüfung: Zum Ende des Sommersemesters 2026

Wiederholung Modulabschlussprüfung: Ende September 2026

Literatur

Die Pflichtliteratur für den Kurs wird auf den Präsentationen der einzelnen Sitzungen referenziert und im ILIAS-Ordner verlinkt. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Werke gibt es inzwischen als Online-Ressource [aus dem UKLAN-Netz der Uni Köln] und / oder in der Lehrbuchsammlung der Universitäts- und Stadtbibliothek in mehrfacher Ausführung.

  • Mitkov, R. (2022): The Oxford Handbook of Computational Linguistics. Oxford, New York: Oxford University Press.

[Umfassendes Einführungswerk in das Gebiet der Computerlinguistik. In der online-Ressource (die über die USB abrufbar ist) wurden einzelne Kapitel aktualisiert ]

  • Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung. Heidelberg, Berlin: Spektrum.

[Deutsches Pendant zum Oxford Handbook, etwas in die Jahre gekommen. Gibt es an der USB auch als online-Ressource!]

  • Ide, Nancy und James Pustejovsky (2017): Handbook of Linguistic Annotation. Berlin/Heidelberg: Springer.

[Alles Wichtige zum Thema linguistische Annotation. Gibt es an der UB auch als online-Ressource!]

  • Jurafski, D. & J. Martin (2023): Speech and Language Processing. New Jersey: Prentice Hall.

[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, Zum überwiegenden Teil sind die neu aktualisierten Kapitel online zugänglich]

  • Andresen, M. (2024): Computerlinguistische Methoden für die Digital Humnaities. Eine Einführung für Geisteswissenschaftler:innen, Tübingen: Narr.

[Sehr frisches Buch einer Kollegin, die jetzt bei DeepL arbeitet, gibt es als online-Ressource in der USB]

  • Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.

[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik - Auf Deutsch und Englisch („The Cambridge Encyclopedia of Language“) in der USB einsehbar]

  • Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink.

[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage, gibt es in der Lehrbuchsammlung der USB]

  • Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.

[Sprachwissenschaftliches Nachschlagewerk, gibt es als online-Ressource in der USB]


Links (werden später im Kurs relevant / ergänzt)

Veranstaltungsmaterialien

Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/