Computerlinguistik am IDH

Seit dem Wintersemester 2022/2023 haben wir ein neues Konzept für die computerlinguistische Ausbildung im Studiengang BA Informationsverarbeitung ausgearbeitet.

  • Modul Grundlagen der Computerlinguistik (alte Studienordnung "Computerlinguistische Grundlagen")
    • Seminar Computerlinguistische Grundlagen (immer im WiSe, Dozent Hermes, Inhalt: Linguistische Grundlagen, Annotation)
    • Vorlesung Sprachverarbeitung (immer im SoSe, Dozent Reiter, Quantitative Eigenschaften von Sprache, Machine Learning)
    • Übung Sprachverarbeitung (immer im SoSe, Dozent Reiter, begleitend zur Vorlesung, früher Seminar II)
    • Modulprüfung Klausur (immer im SoSe, 90 Minuten, Teilleistung im WiSe möglich, 30 Minuten)
  • Modul Anwendungen der Computerlinguistik (alte Studienordnung "Angewandte Linguistische Datenverarbeitung")
    • Übung Deep Learning (immer im WiSe, Dozentin Nester, Inhalt: Deep Learning Methoden)
    • Hauptseminar Anwendungen der Computerlinguistik (immer im WiSe, Dozent Reiter, Inhalt: Experimente in der CL, wo kommen Fortschritt und Erkenntnis her?)
    • Modulprüfung Hausarbeit mit computerlinguistischem Experiment

Semesterüberblick (Wintersemester)

Datum Ort Thema Präsentation Material

10.10.2023

S56

Organisatorisches

17.10.2023

S56

Einführung: Computerlinguistik

CL_P01

24.10.2023

S56

Einführung: Sprachwissenschaft

CL_P02

31.10.2023

S56

Annotation: Einführung

CL_P03

07.11.2023

S56

Zeichenebene: Methoden

CL_P04

14.11.2023

S56

Annotation: Kuratierung

Inception User Guide

21.11.2023

S56

Wortebene: Methoden

CL_P05

28.11.2023

S56

Annotation: Inter-Rater-Agreement

CL_P06

05.12.2023

S56

Satzebene: Methoden

CL_P07

Video

12.12.2022

S56

Annotation: Dependencies

CL_P08

19.12.2023

S56

(Weihnachtssitzung: CL-Forschung)

09.01.2024

S56

Semantik: Methoden

CL_P09

16.01.2024

S56

Annotation: Bedeutung

CL_P10

23.01.2024

S60

Wiederholung

30.01.2024

S60

Zwischenklausur


Studienleistung – Hausaufgaben

In den Sitzungen zur Annotation werden (in ILIAS, Ordner für Kursteilnehmende zugänglich) kleinere Hausaufgaben gestellt, die Sie (in INCEPTION, einem Service, der noch vorgestellt wird) bearbeiten müssen, um dem Kurs erfolgreich abzuschließen und den Kurs in Klips verbucht zu bekommen.


Prüfungsleistung – Klausur

Die Modulprüfung hat die Inhalte des gesamten Moduls zum Gegenstand und kann daher erst im Sommersemester stattfinden. Allerdings ist es für die Teilnehmer möglich, die im Wintersemester vermittelten Kompetenzen bereits in einer Klausur am Ende des Wintersemesters nachzuweisen. Die in dieser Klausur erzielten Punkte können auf die Klausur zum Ende des Sommersemesters angerechnet werden.

Fakultative Teil-Klausur: 30.01.2024 (16:00 Uhr), wahrscheinlich im Raum S60, es werden Aufgaben in ILIAS und in Inception gestellt.

Modulabschlussprüfung: Zum Ende des Sommersemesters 2024

Wiederholung Modulabschlussprüfung: Ende September 2024


Literatur

Die Pflichtliteratur für den Kurs wird auf den Präsentationen der einzelnen Sitzungen referenziert und im ILIAS-Ordner verlinkt. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Werke gibt es inzwischen als Online-Ressource [aus dem UKLAN-Netz der Uni Köln] und / oder in der Lehrbuchsammlung in mehrfacher Ausführung.

  • Mitkov, R. (2022): The Oxford Handbook of Computational Linguistics. Oxford, New York: Oxford University Press.

[Umfassendes Einführungswerk in das Gebiet der Computerlinguistik. In der online-Ressource (die über die USB abrufbar ist) wurden einzelne Kapitel aktualisiert ]

  • Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung. Heidelberg, Berlin: Spektrum.

[Deutsches Pendant zum Oxford Handbook, etwas in die Jahre gekommen. Gibt es an der USB auch als online-Ressource!]

  • Ide, Nancy und James Pustejovsky (2017): Handbook of Linguistic Annotation. Berlin/Heidelberg: Springer.

[Alles Wichtige zum Thema linguistische Annotation. Gibt es an der UB auch als online-Ressource!]

  • Jurafski, D. & J. Martin (2023): Speech and Language Processing. New Jersey: Prentice Hall.

[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, Zum überwiegenden Teil sind die neu aktualisierten Kapitel online zugänglich]

  • Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.

[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“)]

  • Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..

[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage, gibt es in der Lehrbuchsammlung der USB]

  • Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.

[Sprachwissenschaftliches Nachschlagewerk, gibt es als online-Ressource in der USB]


Links

  • Google nGramViewer – Erwähnungen von (kombinierten) Termen in Millionen digitalisierter Bücher.
  • chatGPT – Dialog-Interface zu Sprachmodellen von OpenAI
  • Webservices auf unserem Spinfo-Server (INCEpTION --> launch)
  • Kohen's Kappa Beispielrechnung
  • Weblicht Services für automatische Annotation
  • ParZu-Parser Dependency-Parser (der zwar leicht andere Labels als wir verwendet, aber einfach nutzbar ist)
  • Universal Dependencies Übersichtsseite zu Dependenz-Relationen mit Annotationsrichtlinien

Veranstaltungsmaterialien

Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/