Semesterüberblick (Wintersemester)

08.10.2019 - Vorbesprechung, Organisatorisches

15.10.2019 - Einführung: Computerlinguistik

22.10.2019 - Einführung: Sprachwissenschaft

28.10.2019 - Einführung: Sprachwissenschaft (cont)

05.11.2019 - Methoden: Phonetik/Phonologie

12.11.2019 - Anwendungen: Phonetik/Phonologie (Referate: Spracherkennung, Sprachsynthese)

19.11.2019 - Methoden: Morphologie

26.11.2019 - Anwendungen: Morphologie (Referate: Lemmatisierer, PoS-Tagger)

03.12.2019 - Methoden: Generative Morphologie

10.12.2019 - Methoden: Syntax

17.12.2019 - Anwendungen: Syntax (Referat: Dependenzparser)

07.01.2020 - Methoden: Semantik

14.01.2020 - Wiederholung / Anwendungen: Semantik (Referat: Wortsinndisambiguierung)

21.01.2020 - Klausur

28.01.2020 - Klausurrückgabe, Ausblick (Referate: Grammatikprüfung, Eigennamenerkennung)


Semesterüberblick (Sommersemester)

07.04.2020 - Organisatorisches, Überblick

14.04.2020 - Ressourcen: Korpora

21.04.2020 - Ressourcen: Lexika

28.04.2020 - Parser: Einführung

05.05.2020 - Parser: Charts

12.05.2020 - Parser: Statistische

19.05.2020 - Parser: Dependenz

26.05.2020 - Grammatikformalismen: Unifikation

09.06.2020 - Grammatikformalismen: HPSG

16.06.2020 - Grammatikformalismen: LFG

23.06.2020 - Anwendungen

30.06.2020 - Anwendungen

07.07.2020 - Klausur

14.07.2020 - Klausurbesprechung


Studienleistung - Referate

In Referaten (die in der Regel von zwei Studierenden gehalten werden) soll ein vorgegebenes Thema von den Studierenden an ihre Kommilitonen in etwa 20-30 Minuten vermittelt werden. Wichtig ist hierbei die Berücksichtigung des Adressaten: Referate werden nicht für Dozenten (die wissen im Regelfall um das Thema), sondern für die anderen Studierenden gehalten. Versuchen Sie also, das vorgegebene Thema so zu präsentieren, wie Sie es auch gerne präsentiert haben wollen. Verzichten Sie dabei auf Detailfülle und geben Sie stattdessen einen verständlichen Überblick mit anschaulichen Beispielen. Referate geben die Gelegenheit, relativ freies Reden und Präsentationstechniken einzuüben. Machen Sie von beidem Gebrauch!

Referatsthemen stehen sowohl im ersten, wie auch im zweiten Teil zur Verfügung. Eine Vorbesprechung des Referats, zu der auch eine erste Gliederung vorzulegen ist, muss spätestens in der Sprechstunde in der Woche vor dem Referatstermin erfolgen.

Themen: (Die angegebenen Daten sind Richtwerte. Referate können sich auch um eine oder zwei Wochen verschieben)

  • Erster Teil:
    • Spracherkennung (Zwirner, Mansaray, Brummel) 12.11.2019
    • Sprachsynthese (M. Schneider, Stasch, T. Schneider) 12.11.2019
    • Lemmatisierer (Eron, Schütz, Springer) 26.11.2019
    • PoS-Tagger (Sandker, Sponagel, Kislitcyn) 26.11.2019
    • Grammatikprüfung (Wernecke, Gavrilova) 28.01.2020
    • Dependency Parser (van Kan, Matheé, Hummel) 10.12.2019
    • Word Sense Disambiguation (Hochmann) 14.01.2020
    • Named Entity Recognition (Ludowicki, Urbanek, Kynast) 28.01.2020
  • Zweiter Teil: Information Retrieval, Information Extraction, Textzusammenfassung, Dependency Parsing, Opinion Mining, Plagiatserkennung, Question Answering, Maschinelle Übersetzung

Prüfungsleistung - Klausur

Für Studierende der Informationsverarbeitung:

Der erste Teil der Klausur wird am Ende des ersten Teils des Proseminars geschrieben, dauert 45 min. und bezieht sich auf den Stoff des ersten Proseminars aus dem Modul Computerlinguistik.

Der zweite Teil der Klausur am Ende des Sommersemesters geschrieben, dauert 45 min. und bezieht sich auf den Stoff des zweiten Proseminars und den der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Wer an der ersten Teilklausur nicht teilgenommen hat oder die Note dieser Teilklausur verbessern möchte (Achtung: Es gilt immer die Punktzahl der zuletzt abgegebenen Klausur), kann zu diesem Termin beide Teilklausuren bearbeiten.

Für eine erfolgreiche Modulprüfung ist es notwendig, im Durchschnitt der beiden Teilklausuren mindestens die Note 4,0 zu erreichen.

Ende September wird eine Wiederholungsklausur angeboten. Für den Fall, dass Sie an einer Wiederholungsklausur teilnehmen wollen (müssen), bitte ich um eine Anmeldung per Mail an mich mindestens eine Woche im Voraus.

Für Studierende, die Linguistik & Phonetik, aber nicht Informationsverarbeitung studieren:

Die Klausur wird gegen Ende des Proseminars geschrieben. Sie dauert 45 min. und bezieht sich auf den Stoff des von Ihnen besuchten Proseminars und den der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Für eine erfolgreiche Teilnahme am Modul ist es notwendig, mindestens die Note 4,0 zu erreichen.

Wenn sie in der Klausur die erforderliche Note nicht erreicht haben oder die erreichte Note verbessern wollen, gibt es Ende September (2. Proseminar) die Möglichkeit, an einer Wiederholungsklausur teilzunehmen. Für den Fall, dass Sie an einer Wiederholungsklausur teilnehmen wollen (müssen), bitte ich um eine Anmeldung per Mail an mich mindestens eine Woche im Voraus.

Termine:

Teilklausur CL1: 21.01.2020 (S 91, Philosophikum)

Wiederholung Teilklausur CL1: 7.7.2020 (S91, Philosophikum)

Teilklausur CL2: 7.7.2020 (S91, Philosophikum)

Wiederholung Teilklausur CL2: Ende September 2020


Literatur

Die Pflichtliteratur für den Kurs findet sich als Kopiervorlage unter dem ILIAS-Ordner zum Kurs. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Bücher (in der größten Stückzahl die ersten beiden Sammelbände) sind inzwischen in mehrfacher Ausführung i(Ort wird noch bekannt gegeben)n der Lehrbuchsammlung vorhanden.

  • Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Auflage). Heidelberg, Berlin: Spektrum.

[Relativ aktuelles und umfassendes Werk, das begleitend zum Kurs und darüber hinaus gelesen werden kann. 55 €, Gibt es an der UB auch als online-Ressource !]

  • Mitkov, R. (2014): The Oxford Handbook of Computational Linguistics 2. Auflage). Oxford, New York: Oxford University Press.

[Das englische Pendant zu dem Buch oben. Gliederung und Schwerpunktsetzung ein wenig abweichend aber mindestens genauso zu empfehlen. Gibt es an der UB auch als online-Ressource !]

  • Jurafski, D. & J. Martin (2008): Speech and Language Processing. New Jersey: Prentice Hall.

[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, 75 €, Teilweise sind die Kapitel online zugänglich]

  • Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.

[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik für weniger als 15 € - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“ für ca. 28 € zu beziehen)]

  • Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..

[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage (15 €)]

  • Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.

[Sprachwissenschaftliches Nachschlagewerk (35 €)]


Links

(in der Reihenfolge, in der sie im Seminar thematisiert wurden)

Veranstaltungsmaterialien

ILIAS-Kursmaterial und Klausurergebnisse https://www.ilias.uni-koeln.de/ilias/goto_uk_crs_207163.html (Passwort gibt es in der Sitzung)