Plan für den SoSe-Kurs ohne Präsenzveranstaltungen

  • Zu den jeweiligen Kursterminen werden vom Kursleiter Online-Videos veröffentlicht und den Kursteilnehmern zur Verfügung gestellt.

  • Literatur zu den jeweiligen Themen wird in den Videos referenziert den Teilnehmern über ILIAS zugänglich gemacht.

  • Es wird zu jeder Sitzung ein Etherpad geben, in dem Sie Fragen stellen können, die der Kursleiter versucht, zu beantworten (schriftlich oder ggfs. im Video aufgreift).

  • Studienleistung I: Zu den jeweiligen Themen wird es Hausaufgaben / Tests in ILIAS geben, die Sie bitte innerhalb von einer Woche bearbeiten.

  • Studienleistung II: Im Kapitel Anwendungen werden verschiedene Referate zur Auswahl gestellt, für die Sie sich eintragen können. Die Referatsgruppen werden aus 2-4 Personen bestehen, die zusammen ein Video (20-30 Minuten) produzieren, was den anderen Teilnehmer|inne|n vor den jeweiligen Terminen zur Verfügung gestellt wird. Am Termin des Referats soll es außerdem eine Aussprache über Videokonferenz geben. Wer bereits im Wintersemester 2019/2020 ein Referat im Kurs Computerlinguistik gehalten hat, muss nicht noch eins im Sommersemster 2020 halten.

  • Prüfungsleistung: Klausur zu den behandelten Themen, am 20.Juli 16:30-18:00 Uhr im Kurt-Alder-Hörsaal (in dem Gebäude der Chemie - 322 Kurt-Alder-Hörsaal - 664 Sitzpl. - 322/EG/Kurt-Alder-H)


Semesterüberblick (Sommersemester)

21.04.2020 - Organisatorisches, Überblick - Video

28.04.2020 - Ressourcen: Korpora - Video

05.05.2020 - Ressourcen: Lexika - Video - Präsentation

12.05.2020 - Parser: Einführung - Video - Präsentation

19.05.2020 - Parser: Charts - Video - Präsentation

26.05.2020 - Parser: Probabilistische - Video - Präsentation

09.06.2020 - Grammatikformalismen: Unifikation - Video - Präsentation

16.06.2020 - Grammatikformalismen: LFG - Video - Präsentation

23.06.2020 - Anwendungen I: Informationsextraktion | Textzusammenfassung | Plagiatserkennung - Link zum Video finden Sie auf ILIAS

30.06.2020 - Anwendungen II: Opinion Mining | Question Answering - Link zum Video finden Sie unter ILIAS

07.07.2020 - Anwendungen III: Maschinelle Übersetzung Regelbasiert | Statistisch - Link zum Video finden Sie unter ILIAS

14.07.2020 - Wiederholung (Sitzung findet statt, wenn es eine kritische Menge an Fragen gibt)

20.07.2020 - Klausur


Semesterüberblick (Wintersemester)

08.10.2019 - Vorbesprechung, Organisatorisches

15.10.2019 - Einführung: Computerlinguistik

22.10.2019 - Einführung: Sprachwissenschaft

28.10.2019 - Einführung: Sprachwissenschaft (cont)

05.11.2019 - Methoden: Phonetik/Phonologie

12.11.2019 - Anwendungen: Phonetik/Phonologie (Referate: Spracherkennung, Sprachsynthese)

19.11.2019 - Methoden: Morphologie

26.11.2019 - Anwendungen: Morphologie (Referate: Lemmatisierer, PoS-Tagger)

03.12.2019 - Methoden: Generative Morphologie

10.12.2019 - Methoden: Syntax

17.12.2019 - Anwendungen: Syntax (Referat: Dependenzparser)

07.01.2020 - Methoden: Semantik

14.01.2020 - Wiederholung / Anwendungen: Semantik (Referat: Wortsinndisambiguierung)

21.01.2020 - Klausur

28.01.2020 - Klausurrückgabe, Ausblick (Referate: Grammatikprüfung, Eigennamenerkennung)


Studienleistung - Referate

In Referaten (die in der Regel von zwei-drei Studierenden gehalten werden) soll ein vorgegebenes Thema von den Studierenden an ihre Kommilitonen in etwa 20-30 Minuten vermittelt werden. Wichtig ist hierbei die Berücksichtigung des Adressaten: Referate werden nicht für Dozenten (die wissen im Regelfall um das Thema), sondern für die anderen Studierenden gehalten. Versuchen Sie also, das vorgegebene Thema so zu präsentieren, wie Sie es auch gerne präsentiert haben wollen. Verzichten Sie dabei auf Detailfülle und geben Sie stattdessen einen verständlichen Überblick mit anschaulichen Beispielen. Referate geben die Gelegenheit, relativ freies Reden und Präsentationstechniken einzuüben. Machen Sie von beidem Gebrauch!

Referatsthemen stehen sowohl im ersten, wie auch im zweiten Teil zur Verfügung. Eine Vorbesprechung des Referats, zu der auch eine erste Gliederung vorzulegen ist, muss spätestens in der Sprechstunde in der Woche vor dem Referatstermin erfolgen.

Themen: (Die angegebenen Daten sind Richtwerte. Referate können sich auch um eine oder zwei Wochen verschieben)

  • Wintersemester:
    • Spracherkennung (Zwirner, Mansaray, Brummel) 12.11.2019
    • Sprachsynthese (M. Schneider, Stasch, T. Schneider) 12.11.2019
    • Lemmatisierer (Eron, Schütz, Springer) 26.11.2019
    • PoS-Tagger (Sandker, Sponagel, Kislitcyn) 26.11.2019
    • Grammatikprüfung (Wernecke, Gavrilova) 28.01.2020
    • Dependency Parser (van Kan, Matheé, Hummel) 10.12.2019
    • Word Sense Disambiguation (Hochmann) 14.01.2020
    • Named Entity Recognition (Ludowicki, Urbanek, Kynast) 28.01.2020
  • Sommersemester:
    • Information Extraction (Ben Bigalke, Alexander Lürwer) 23.06.2020
    • Textzusammenfassung (David Wegmann, Julia Koch) 23.06.2020
    • Plagiatserkennung (William Hesse, Eduardo Schneider) 23.06.2020 - Essay: Liza Jeanne Malki
    • Opinion Mining (Nicolas Werner, Marvin Kamphausen) 30.06.2020 - Essay: Arianna Bienati
    • Question Answering (Moritz Ulrich, Nicolas Alcock) 30.06.2020
    • Maschinelle Übersetzung - regelbasierte Ansätze (Sümeyye Peru, Anna Schmitz) 07.07.2020 - Essay: Océane Perret
    • Maschinelle Übersetzung - statistische Ansätze (Lena Weigel, Anna Lena Deeken, Johanna Blitsch) 07.07.2020 Essay: Ludovic Gervais

Prüfungsleistung - Klausur

Für Studierende der Informationsverarbeitung:

Der erste Teil der Klausur wird am Ende des ersten Teils des Proseminars geschrieben, dauert 45 min. und bezieht sich auf den Stoff des ersten Proseminars aus dem Modul Computerlinguistik.

Der zweite Teil der Klausur am Ende des Sommersemesters geschrieben, dauert 45 min. und bezieht sich auf den Stoff des zweiten Proseminars und den der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Wer an der ersten Teilklausur nicht teilgenommen hat oder die Note dieser Teilklausur verbessern möchte (Achtung: Es gilt immer die Punktzahl der zuletzt abgegebenen Klausur), kann zu diesem Termin beide Teilklausuren bearbeiten.

Für eine erfolgreiche Modulprüfung ist es notwendig, im Durchschnitt der beiden Teilklausuren mindestens die Note 4,0 zu erreichen.

Ende September wird eine Wiederholungsklausur angeboten. Für den Fall, dass Sie an einer Wiederholungsklausur teilnehmen wollen (müssen), bitte ich um eine Anmeldung per Mail an mich mindestens eine Woche im Voraus.

Für Studierende, die Linguistik & Phonetik, aber nicht Informationsverarbeitung studieren:

Die Klausur wird gegen Ende des Proseminars geschrieben. Sie dauert 45 min. und bezieht sich auf den Stoff des von Ihnen besuchten Proseminars und den der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Für eine erfolgreiche Teilnahme am Modul ist es notwendig, mindestens die Note 4,0 zu erreichen.

Wenn sie in der Klausur die erforderliche Note nicht erreicht haben oder die erreichte Note verbessern wollen, gibt es Ende September (2. Proseminar) die Möglichkeit, an einer Wiederholungsklausur teilzunehmen. Für den Fall, dass Sie an einer Wiederholungsklausur teilnehmen wollen (müssen), bitte ich um eine Anmeldung per Mail an mich mindestens eine Woche im Voraus.

Termine:

Teilklausur CL1: 21.01.2020 (S 91, Philosophikum)

Wiederholung Teilklausur CL1: 20.Juli 16:30-18:00 Uhr im Kurt-Alder-Hörsaal (in dem Gebäude der Chemie - 322 Kurt-Alder-Hörsaal - 664 Sitzpl. - 322/EG/Kurt-Alder-H)

Teilklausur CL2: am 20.Juli 16:30-18:00 Uhr im Kurt-Alder-Hörsaal (in dem Gebäude der Chemie - 322 Kurt-Alder-Hörsaal - 664 Sitzpl. - 322/EG/Kurt-Alder-H)

Wiederholung Teilklausur CL2: voraussichtlich Ende September 2020


Literatur

Die Pflichtliteratur für den Kurs findet sich als Kopiervorlage unter dem ILIAS-Ordner zum Kurs. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Bücher (in der größten Stückzahl die ersten beiden Sammelbände) sind inzwischen in mehrfacher Ausführung i(Ort wird noch bekannt gegeben)n der Lehrbuchsammlung vorhanden.

  • Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Auflage). Heidelberg, Berlin: Spektrum.

[Relativ aktuelles und umfassendes Werk, das begleitend zum Kurs und darüber hinaus gelesen werden kann. 55 €, Gibt es an der UB auch als online-Ressource !]

  • Mitkov, R. (2014): The Oxford Handbook of Computational Linguistics 2. Auflage). Oxford, New York: Oxford University Press.

[Das englische Pendant zu dem Buch oben. Gliederung und Schwerpunktsetzung ein wenig abweichend aber mindestens genauso zu empfehlen. Gibt es an der UB auch als online-Ressource !]

  • Jurafski, D. & J. Martin (2008): Speech and Language Processing. New Jersey: Prentice Hall.

[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, 75 €, Teilweise sind die Kapitel online zugänglich]

  • Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.

[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik für weniger als 15 € - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“ für ca. 28 € zu beziehen)]

  • Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..

[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage (15 €)]

  • Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.

[Sprachwissenschaftliches Nachschlagewerk (35 €)]


Links

(in der Reihenfolge, in der sie im Seminar thematisiert wurden)

Veranstaltungsmaterialien

ILIAS-Kursmaterial und Klausurergebnisse https://www.ilias.uni-koeln.de/