Computerlinguistik am IDH
Dieses Seminar bildet den Einstieg in die computerlinguistische Ausbildung im Studiengang Informationsverarbeitung. Diese besteht aus zwei Modulen:
- Modul Grundlagen der Computerlinguistik
- Seminar Computerlinguistische Grundlagen (immer im WiSe, Dozent Hermes, Inhalt: Linguistische Grundlagen, Annotation)
- Vorlesung Sprachverarbeitung (immer im SoSe, Dozent Pagel, Quantitative Eigenschaften von Sprache, Machine Learning)
- Übung Sprachverarbeitung (immer im SoSe, Dozent Pagel, begleitend zur Vorlesung, früher Seminar II)
- Modulprüfung Klausur (immer im SoSe, 90 Minuten)
- Modul Anwendungen der Computerlinguistik
- Übung Deep Learning (immer im WiSe, Dozentin Nester, Inhalt: Deep Learning Methoden)
- Hauptseminar Anwendungen der Computerlinguistik (immer im WiSe, Dozent Reiter, Inhalt: Experimente in der CL, wo kommen Fortschritt und Erkenntnis her?)
- Modulprüfung Hausarbeit mit computerlinguistischem Experiment
Semesterüberblick (Wintersemester)
Datum | Thema | Präsentation | Material |
08.10.2024 |
Einführung: Organisatorisches |
||
15.10.2024 |
Einführung: Computerlinguistik |
||
22.10.2024 |
Einführung: Sprachwissenschaft |
||
29.10.2024 |
Einführung: Annotation |
||
05.11.2024 |
Methoden: Zeichenebene |
||
12.11.2023 |
Annotation: Kuratierung |
||
19.11.2023 |
Methoden: Wortebene |
||
26.11.2023 |
Annotation: Inter-Rater-Agreement |
||
03.12.2023 |
Methoden: Satzebene |
||
10.12.2022 |
Annotation: Dependencies |
||
17.12.2023 |
(Weihnachtssitzung: CL-Forschung) |
||
07.01.2024 |
Methoden: Semantik |
||
14.01.2024 |
Annotation: Bedeutung |
||
21.01.2024 |
Wiederholung |
||
28.01.2024 |
Abschluss-Testat |
Studienleistung – Hausaufgaben und Abschlusstestat
In den Sitzungen zur Annotation werden (in ILIAS, Ordner für Kursteilnehmende zugänglich) kleinere Hausaufgaben gestellt, die Sie (in INCEPTION, einem Service, der noch vorgestellt wird) bearbeiten müssen, um dem Kurs erfolgreich abzuschließen und den Kurs in Klips verbucht zu bekommen.
In der letzten Unterrichtsstunde werden Sie außerdem ein kleineres Zwischentestat ablegen, das als bestanden gilt, wenn Sie mindestens die Hälfte der Punkte erreichen.
Prüfungsleistung – Klausur (im Sommersemester)
Die Modulprüfung wird im Rahmen der Sommersemesterveranstaltungen (Vorlesung / Übung) stattfinden. Da der Stoff in diesen Veranstaltungen teilweise auf dem dieses Seminars aufbaut, sind Fragen zum Stoff aus dem Wintersemester ebenso möglich. Näheres erfahren Sie in der Veranstaltung des Sommersemesters.
Literatur
Die Pflichtliteratur für den Kurs wird auf den Präsentationen der einzelnen Sitzungen referenziert und im ILIAS-Ordner verlinkt. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Werke gibt es inzwischen als Online-Ressource [aus dem UKLAN-Netz der Uni Köln] und / oder in der Lehrbuchsammlung der Universitäts- und Stadtbibliothek in mehrfacher Ausführung.
-
Mitkov, R. (2022): The Oxford Handbook of Computational Linguistics. Oxford, New York: Oxford University Press.
[Umfassendes Einführungswerk in das Gebiet der Computerlinguistik. In der online-Ressource (die über die USB abrufbar ist) wurden einzelne Kapitel aktualisiert ]
-
Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung. Heidelberg, Berlin: Spektrum.
[Deutsches Pendant zum Oxford Handbook, etwas in die Jahre gekommen. Gibt es an der USB auch als online-Ressource!]
-
Ide, Nancy und James Pustejovsky (2017): Handbook of Linguistic Annotation. Berlin/Heidelberg: Springer.
[Alles Wichtige zum Thema linguistische Annotation. Gibt es an der UB auch als online-Ressource!]
-
Jurafski, D. & J. Martin (2023): Speech and Language Processing. New Jersey: Prentice Hall.
[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, Zum überwiegenden Teil sind die neu aktualisierten Kapitel online zugänglich]
-
Andresen, M. (2024): Computerlinguistische Methoden für die Digital Humnaities. Eine Einführung für Geisteswissenschaftler:innen, Tübingen: Narr.
[Brandneues Buch, eBook frisch bei der USB bestellt eingetroffen]
-
Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.
[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik - Auf Deutsch und Englisch („The Cambridge Encyclopedia of Language“) in der USB einsehbar]
-
Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink.
[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage, gibt es in der Lehrbuchsammlung der USB]
-
Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.
[Sprachwissenschaftliches Nachschlagewerk, gibt es als online-Ressource in der USB]
Links (werden später im Kurs relevant / ergänzt)
- Google nGramViewer – Erwähnungen von (kombinierten) Termen in Millionen digitalisierter Bücher.
- Eine etwas ausholende Abhandlung zur Geschichte von Sprache, Maschinellen Übersetzung und Chatbots (Sammelbandbeitrag Hermes 2023: "Durch neuronale Netze zur lingua franca? Wie Algorithmen unsere Kommunikation bestimmen")
- chatGPT – Dialog-Interface zu Sprachmodellen von OpenAI
- Überlegungen zu Chatbots, menschlicher Kognition und Grenzen des aktuellen gpt4o1-Modells (Blogpost Hermes 2024: "Wie man auch GPT4-o1-preview noch ins Stolpern bringt")
- Computerlinguistik - was ist das eigentlich? (Archivierte Webseite des IDS Stuttgart)
- Über Sprache und Tierkommunikation (Blogpost Hermes 2013)
- Webservices auf unserem Spinfo-Server (INCEpTION --> launch)
- Kohen's Kappa Beispielrechnung
- Weblicht Services für automatische Annotation
- ParZu-Parser Dependency-Parser (der zwar leicht andere Labels als wir verwendet, aber einfach nutzbar ist)
- Universal Dependencies Übersichtsseite zu Dependenz-Relationen mit Annotationsrichtlinien
- Voynich Studies Cologne Übersichtsseite zu Beiträgen zu einer MA-Übung "Verarbeitung enigmatischer Schriftstücke"
Veranstaltungsmaterialien
Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/