Computerlinguistik am IDH

Dieses Seminar bildet den Einstieg in die computerlinguistische Ausbildung im Studiengang Informationsverarbeitung. Diese besteht aus zwei Modulen:

  • Modul Grundlagen der Computerlinguistik
    • Seminar Computerlinguistische Grundlagen (immer im WiSe, Dozent Hermes, Inhalt: Linguistische Grundlagen, Annotation)
    • Vorlesung Sprachverarbeitung (immer im SoSe, Dozent Pagel, Quantitative Eigenschaften von Sprache, Machine Learning)
    • Übung Sprachverarbeitung (immer im SoSe, Dozent Pagel, begleitend zur Vorlesung, früher Seminar II)
    • Modulprüfung Klausur (immer im SoSe, 90 Minuten)
  • Modul Anwendungen der Computerlinguistik
    • Übung Deep Learning (immer im WiSe, Dozentin Nester, Inhalt: Deep Learning Methoden)
    • Hauptseminar Anwendungen der Computerlinguistik (immer im WiSe, Dozent Reiter, Inhalt: Experimente in der CL, wo kommen Fortschritt und Erkenntnis her?)
    • Modulprüfung Hausarbeit mit computerlinguistischem Experiment

Semesterüberblick (Wintersemester)

Datum Thema Präsentation Material

08.10.2024

Einführung: Organisatorisches

15.10.2024

Einführung: Computerlinguistik

CL_P01.pdf

22.10.2024

Einführung: Sprachwissenschaft

CL_P02.pdf

29.10.2024

Einführung: Annotation

CL_P03.pdf

05.11.2024

Methoden: Zeichenebene

CL_P04.pdf

12.11.2023

Annotation: Kuratierung

CL_P05.pdf

Inception User Guide

19.11.2023

Methoden: Wortebene

CL_P06.pdf

Video (Youtube)
Video (Opencast)

26.11.2023

Annotation: Inter-Rater-Agreement

CL_P07.pdf

03.12.2023

Methoden: Satzebene

CL_P08.pdf

Video (Youtube)
Video (Opencast)

10.12.2022

Annotation: Dependencies

CL_P09.pdf

17.12.2023

(Weihnachtssitzung: CL-Forschung)

Mural.pdf

voynichsc

07.01.2024

Methoden: Semantik

14.01.2024

Annotation: Bedeutung

21.01.2024

Wiederholung

28.01.2024

Abschluss-Testat


Studienleistung – Hausaufgaben und Abschlusstestat

In den Sitzungen zur Annotation werden (in ILIAS, Ordner für Kursteilnehmende zugänglich) kleinere Hausaufgaben gestellt, die Sie (in INCEPTION, einem Service, der noch vorgestellt wird) bearbeiten müssen, um dem Kurs erfolgreich abzuschließen und den Kurs in Klips verbucht zu bekommen.

In der letzten Unterrichtsstunde werden Sie außerdem ein kleineres Zwischentestat ablegen, das als bestanden gilt, wenn Sie mindestens die Hälfte der Punkte erreichen.


Prüfungsleistung – Klausur (im Sommersemester)

Die Modulprüfung wird im Rahmen der Sommersemesterveranstaltungen (Vorlesung / Übung) stattfinden. Da der Stoff in diesen Veranstaltungen teilweise auf dem dieses Seminars aufbaut, sind Fragen zum Stoff aus dem Wintersemester ebenso möglich. Näheres erfahren Sie in der Veranstaltung des Sommersemesters.


Literatur

Die Pflichtliteratur für den Kurs wird auf den Präsentationen der einzelnen Sitzungen referenziert und im ILIAS-Ordner verlinkt. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Werke gibt es inzwischen als Online-Ressource [aus dem UKLAN-Netz der Uni Köln] und / oder in der Lehrbuchsammlung der Universitäts- und Stadtbibliothek in mehrfacher Ausführung.

  • Mitkov, R. (2022): The Oxford Handbook of Computational Linguistics. Oxford, New York: Oxford University Press.

[Umfassendes Einführungswerk in das Gebiet der Computerlinguistik. In der online-Ressource (die über die USB abrufbar ist) wurden einzelne Kapitel aktualisiert ]

  • Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung. Heidelberg, Berlin: Spektrum.

[Deutsches Pendant zum Oxford Handbook, etwas in die Jahre gekommen. Gibt es an der USB auch als online-Ressource!]

  • Ide, Nancy und James Pustejovsky (2017): Handbook of Linguistic Annotation. Berlin/Heidelberg: Springer.

[Alles Wichtige zum Thema linguistische Annotation. Gibt es an der UB auch als online-Ressource!]

  • Jurafski, D. & J. Martin (2023): Speech and Language Processing. New Jersey: Prentice Hall.

[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, Zum überwiegenden Teil sind die neu aktualisierten Kapitel online zugänglich]

  • Andresen, M. (2024): Computerlinguistische Methoden für die Digital Humnaities. Eine Einführung für Geisteswissenschaftler:innen, Tübingen: Narr.

[Brandneues Buch, eBook frisch bei der USB bestellt eingetroffen]

  • Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.

[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik - Auf Deutsch und Englisch („The Cambridge Encyclopedia of Language“) in der USB einsehbar]

  • Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink.

[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage, gibt es in der Lehrbuchsammlung der USB]

  • Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.

[Sprachwissenschaftliches Nachschlagewerk, gibt es als online-Ressource in der USB]


Links (werden später im Kurs relevant / ergänzt)

Veranstaltungsmaterialien

Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/