Semesterüberblick (Wintersemester)
08.10.2019 - Vorbesprechung, Organisatorisches
15.10.2019 - Einführung: Computerlinguistik
22.10.2019 - Einführung: Sprachwissenschaft
28.10.2019 - Einführung: Sprachwissenschaft (cont)
05.11.2019 - Methoden: Phonetik/Phonologie
12.11.2019 - Anwendungen: Phonetik/Phonologie (Referate: Spracherkennung, Sprachsynthese)
19.11.2019 - Methoden: Morphologie
26.11.2019 - Anwendungen: Morphologie (Referate: Lemmatisierer, PoS-Tagger)
03.12.2019 - Methoden: Generative Morphologie
10.12.2019 - Methoden: Syntax
17.12.2019 - Anwendungen: Syntax (Referat: Dependenzparser)
07.01.2020 - Methoden: Semantik
14.01.2020 - Wiederholung / Anwendungen: Semantik (Referat: Wortsinndisambiguierung)
21.01.2020 - Klausur
28.01.2020 - Klausurrückgabe, Ausblick (Referate: Grammatikprüfung, Eigennamenerkennung)
Semesterüberblick (Sommersemester)
07.04.2020 - Organisatorisches, Überblick
14.04.2020 - Ressourcen: Korpora
21.04.2020 - Ressourcen: Lexika
28.04.2020 - Parser: Einführung
05.05.2020 - Parser: Charts
12.05.2020 - Parser: Statistische
19.05.2020 - Parser: Dependenz
26.05.2020 - Grammatikformalismen: Unifikation
09.06.2020 - Grammatikformalismen: HPSG
16.06.2020 - Grammatikformalismen: LFG
23.06.2020 - Anwendungen
30.06.2020 - Anwendungen
07.07.2020 - Klausur
14.07.2020 - Klausurbesprechung
Studienleistung - Referate
In Referaten (die in der Regel von zwei Studierenden gehalten werden) soll ein vorgegebenes Thema von den Studierenden an ihre Kommilitonen in etwa 20-30 Minuten vermittelt werden. Wichtig ist hierbei die Berücksichtigung des Adressaten: Referate werden nicht für Dozenten (die wissen im Regelfall um das Thema), sondern für die anderen Studierenden gehalten. Versuchen Sie also, das vorgegebene Thema so zu präsentieren, wie Sie es auch gerne präsentiert haben wollen. Verzichten Sie dabei auf Detailfülle und geben Sie stattdessen einen verständlichen Überblick mit anschaulichen Beispielen. Referate geben die Gelegenheit, relativ freies Reden und Präsentationstechniken einzuüben. Machen Sie von beidem Gebrauch!
Referatsthemen stehen sowohl im ersten, wie auch im zweiten Teil zur Verfügung. Eine Vorbesprechung des Referats, zu der auch eine erste Gliederung vorzulegen ist, muss spätestens in der Sprechstunde in der Woche vor dem Referatstermin erfolgen.
Themen: (Die angegebenen Daten sind Richtwerte. Referate können sich auch um eine oder zwei Wochen verschieben)
- Erster Teil:
- Spracherkennung (Zwirner, Mansaray, Brummel) 12.11.2019
- Sprachsynthese (M. Schneider, Stasch, T. Schneider) 12.11.2019
- Lemmatisierer (Eron, Schütz, Springer) 26.11.2019
- PoS-Tagger (Sandker, Sponagel, Kislitcyn) 26.11.2019
- Grammatikprüfung (Wernecke, Gavrilova) 28.01.2020
- Dependency Parser (van Kan, Matheé, Hummel) 10.12.2019
- Word Sense Disambiguation (Hochmann) 14.01.2020
- Named Entity Recognition (Ludowicki, Urbanek, Kynast) 28.01.2020
- Zweiter Teil: Information Retrieval, Information Extraction, Textzusammenfassung, Dependency Parsing, Opinion Mining, Plagiatserkennung, Question Answering, Maschinelle Übersetzung
Prüfungsleistung - Klausur
Für Studierende der Informationsverarbeitung:
Der erste Teil der Klausur wird am Ende des ersten Teils des Proseminars geschrieben, dauert 45 min. und bezieht sich auf den Stoff des ersten Proseminars aus dem Modul Computerlinguistik.
Der zweite Teil der Klausur am Ende des Sommersemesters geschrieben, dauert 45 min. und bezieht sich auf den Stoff des zweiten Proseminars und den der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Wer an der ersten Teilklausur nicht teilgenommen hat oder die Note dieser Teilklausur verbessern möchte (Achtung: Es gilt immer die Punktzahl der zuletzt abgegebenen Klausur), kann zu diesem Termin beide Teilklausuren bearbeiten.
Für eine erfolgreiche Modulprüfung ist es notwendig, im Durchschnitt der beiden Teilklausuren mindestens die Note 4,0 zu erreichen.
Ende September wird eine Wiederholungsklausur angeboten. Für den Fall, dass Sie an einer Wiederholungsklausur teilnehmen wollen (müssen), bitte ich um eine Anmeldung per Mail an mich mindestens eine Woche im Voraus.
Für Studierende, die Linguistik & Phonetik, aber nicht Informationsverarbeitung studieren:
Die Klausur wird gegen Ende des Proseminars geschrieben. Sie dauert 45 min. und bezieht sich auf den Stoff des von Ihnen besuchten Proseminars und den der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Für eine erfolgreiche Teilnahme am Modul ist es notwendig, mindestens die Note 4,0 zu erreichen.
Wenn sie in der Klausur die erforderliche Note nicht erreicht haben oder die erreichte Note verbessern wollen, gibt es Ende September (2. Proseminar) die Möglichkeit, an einer Wiederholungsklausur teilzunehmen. Für den Fall, dass Sie an einer Wiederholungsklausur teilnehmen wollen (müssen), bitte ich um eine Anmeldung per Mail an mich mindestens eine Woche im Voraus.
Termine:
Teilklausur CL1: 21.01.2020 (S 91, Philosophikum)
Wiederholung Teilklausur CL1: 7.7.2020 (S91, Philosophikum)
Teilklausur CL2: 7.7.2020 (S91, Philosophikum)
Wiederholung Teilklausur CL2: Ende September 2020
Literatur
Die Pflichtliteratur für den Kurs findet sich als Kopiervorlage unter dem ILIAS-Ordner zum Kurs. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Bücher (in der größten Stückzahl die ersten beiden Sammelbände) sind inzwischen in mehrfacher Ausführung i(Ort wird noch bekannt gegeben)n der Lehrbuchsammlung vorhanden.
-
Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Auflage). Heidelberg, Berlin: Spektrum.
[Relativ aktuelles und umfassendes Werk, das begleitend zum Kurs und darüber hinaus gelesen werden kann. 55 €, Gibt es an der UB auch als online-Ressource !]
-
Mitkov, R. (2014): The Oxford Handbook of Computational Linguistics 2. Auflage). Oxford, New York: Oxford University Press.
[Das englische Pendant zu dem Buch oben. Gliederung und Schwerpunktsetzung ein wenig abweichend aber mindestens genauso zu empfehlen. Gibt es an der UB auch als online-Ressource !]
-
Jurafski, D. & J. Martin (2008): Speech and Language Processing. New Jersey: Prentice Hall.
[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, 75 €, Teilweise sind die Kapitel online zugänglich]
-
Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.
[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik für weniger als 15 € - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“ für ca. 28 € zu beziehen)]
-
Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..
[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage (15 €)]
-
Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.
[Sprachwissenschaftliches Nachschlagewerk (35 €)]
Links
(in der Reihenfolge, in der sie im Seminar thematisiert wurden)
- Blogpost 101 – Schlüssel zu einem erfolgreichen Studium? (Blogpost zur Korrelation von Anwesenheit und Klausurergebnissen, TEXperimenTales)
- Computerlinguistik: Was ist das eigentlich (Info-Seite zum Studiengang, IMS Stuttgart)
- Über Sprache und Tierkommunikation (Blogpost zu menschlicher und tierischer Kommunikation, TEXperimenTales)
Veranstaltungsmaterialien
ILIAS-Kursmaterial und Klausurergebnisse https://www.ilias.uni-koeln.de/ilias/goto_uk_crs_207163.html (Passwort gibt es in der Sitzung)