Computerlinguistik am IDH

Seit dem Wintersemester 2022/2023 haben wir ein neues Konzept für die computerlinguistische Ausbildung im Studiengang BA Informationsverarbeitung ausgearbeitet.

  • Modul Grundlagen der Computerlinguistik (alte Studienordnung "Computerlinguistische Grundlagen")
    • Seminar Computerlinguistische Grundlagen (immer im WiSe, Dozent Hermes, Inhalt: Linguistische Grundlagen, Annotation)
    • Vorlesung Sprachverarbeitung (immer im SoSe, Dozent Reiter, Quantitative Eigenschaften von Sprache, Machine Learning)
    • Übung Sprachverarbeitung (immer im SoSe, Dozent Reiter, begleitend zur Vorlesung, früher Seminar II)
    • Modulprüfung Klausur (immer im SoSe, 90 Minuten, Teilleistung im WiSe möglich, 30 Minuten)
  • Modul Anwendungen der Computerlinguistik (alte Studienordnung "Angewandte Linguistische Datenverarbeitung")
    • Übung Deep Learning (immer im WiSe, Dozentin Nester, Inhalt: Deep Learning Methoden)
    • Hauptseminar Experimentelles Arbeiten in der Sprachverarbeitung (immer im WiSe, Dozent Reiter, Inhalt: Experimente in der CL, wo kommen Fortschritt und Erkenntnis her?)
    • Modulprüfung Hausarbeit mit computerlinguistischem Experiment

Semesterüberblick (Wintersemester)

Datum Thema Präsentation Material

11.10.2022

Organisatorisches

18.10.2022

Einführung: Computerlinguistik

CL_01.pdf

25.10.2022

Einführung: Sprachwissenschaft

CL_02.pdf

08.11.2022

(Fortsetzung)

Video

15.11.2022

Annotation: Einführung CL_03.pdf

22.11.2022

Zeichenebene: Methoden

CL_04.pdf

29.11.2022

Annotation: Kuratierung

06.12.2022

Wortebene: Methoden

CL_05.pdf

13.12.2022

Annotation: Inter-Rater-Agreement

20.12.2022

Satzebene: Methoden

CL_06.pdf

Video

10.01.2023

Satzebene: Annotation

17.01.2023

Semantik: Methoden

CL_07.pdf

24.01.2023

Semantik: Annotation

31.01.2023

Zwischenklausur


Wichtiges in Kürze

  • Literatur zu den jeweiligen Themen wird in den Präsentationen zu den einzelnen Sitzungen referenziert, den Teilnehmern über ILIAS zugänglich gemacht und ggfs. auf dieser Seite auch öffentlich verlinkt.

  • Studienleistung: Zu den Annotationssitzungen werden Hausaufgaben gestellt, deren Berabeitung obligatorisch ist.

  • Prüfungsleistung: Die Modulprüfung hat die Inhalte des gesamten Moduls zum Gegenstand und kann daher erst im Sommersemester stattfinden. Allerdings ist es für die Teilnehmer möglich, die im Wintersemester vermittelten Kompetenzen bereits in einer Klausur am 31.01.2023 nachzuweisen. Die in dieser Klausur erzielten Punkte können auf die Klausur zum Ende des Sommersemesters angerechnet werden.


Studienleistung – Hausaufgaben

(Wird in den nächtsten Wochen genauer spezifiziert)


Prüfungsleistung - Klausur

(Wird in den nächsten Wochen spezifiziert)

Fakultative Teil-Klausur: 31.01.2023 (16:00 Uhr), Genauere Informationen folgen

Modulabschlussprüfung: Zum Ende des Sommersemesters 2023

Wiederholung Modulabschlussprüfung: Ende September 2023


Literatur

(Wird in den nächsten Wochen aktualisiert)

Die Pflichtliteratur für den Kurs wird sich als Weblinks auf pdf-Dateien im ILIAS-Ordner zum Kurs befinden. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Werke gibt es inzwischen als Online-Ressource und / oder in der Lehrbuchsammlung in mehrfacher Ausführung.

  • Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Auflage). Heidelberg, Berlin: Spektrum.

[Relativ aktuelles und umfassendes Werk, das begleitend zum Kurs und darüber hinaus gelesen werden kann. 55 €, Gibt es an der UB auch als online-Ressource!]

  • Mitkov, R. (2014): The Oxford Handbook of Computational Linguistics 2. Auflage). Oxford, New York: Oxford University Press.

[Das englische Pendant zu dem Buch oben. Gliederung und Schwerpunktsetzung ein wenig abweichend aber mindestens genauso zu empfehlen. Gibt es an der UB auch als online-Ressource!]

  • Ide, Nancy und James Pustejovsky (2017): Handbook of Linguistic Annotation. Berlin/Heidelberg: Springer.

[Alles Wichtige zum Thema linguistische Annotation. Gibt es an der UB auch als online-Ressource!]

  • Jurafski, D. & J. Martin (2020): Speech and Language Processing. New Jersey: Prentice Hall.

[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, 75 €, Zum überwiegenden Teil sind die neu aktualisierten Kapitel online zugänglich]

  • Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.

[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik für weniger als 15 € - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“ für ca. 28 € zu beziehen)]

  • Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..

[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage (15 €)]

  • Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.

[Sprachwissenschaftliches Nachschlagewerk (35 €)]


Links

Veranstaltungsmaterialien

Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/