Plan für den SoSe-Kurs ohne Präsenzveranstaltungen

  • Zu einem Teil der Kurstermine werden vom Kursleiter Online-Videos veröffentlicht und den Kursteilnehmern zur Verfügung gestellt. In den Wochen, in denen es Videos gibt, treffen wir uns dienstags um 17:00 Uhr im Chat für Rückfragen und Diskussion. In Wochen, in denen Referate gehalten werden, treffen wir uns dienstags um 16:00 Uhr bei Zoom (Termine siehe Übersichtstabelle, in den einzelnen Wochen werden Sie jeweils montags eine Infomail bekommen).

  • Literatur zu den jeweiligen Themen wird in den Videos referenziert den Teilnehmern über ILIAS zugänglich gemacht.

  • Studienleistung: Im Kapitel Anwendungen werden verschiedene Referate zur Auswahl gestellt, für die Sie sich eintragen können. Die Referatsgruppen werden aus 2 Personen bestehen, die zusammen ein Referat von 20-30 Minuten Länge vorbereiten und über Zoom halten werden. Wer bereits im Wintersemester 2020/21 ein Referat im Kurs Computerlinguistik gehalten hat, muss nicht noch eins im Sommersemster 2021 halten.

  • Prüfungsleistung: Klausur zu den behandelten Themen, am 22.Juli 10:00-11:30 Uhr, Ort wird noch bekannt gegeben


Semesterüberblick (Sommersemester)

Datum Uhrzeit Ort Thema Video Präsentationen Mural
13.04.2021 16:00 Zoom Organisatorisches, Überblick
20.04.2021 17:00 Riot Ressorcen: Korpora Video
27.04.2021 17:00 Riot Ressourcen: Lexika Video CL_07.pdf
04.05.2021 16:00 Zoom Anwendungen I
11.05.2021 17:00 Riot Parser: Einführung
18.05.2021 16:00 Riot Parser: Charts
01.06.2021 17:00 Riot Parser: Probabilistische
08.06.2021 16:00 Zoom Anwendungen II
15.06.2021 16:00 Riot Grammatikformalismen: Unifikation
22.06.2021 17:00 Riot Grammatikformalismen: LFG
29.06.2021 16:00 Zoom Anwendungen III
06.07.2021 16:00 Zoom Evaluation
13.07.2021 16:00 Zoom Zusammenfassung, Ausblick
20.07.2021 16:00 Zoom Fragestunde (Klausur am 22.07. 10:00 Uhr)

Semesterüberblick (Wintersemester)

Datum Uhrzeit Ort Thema Video Präsentationen Mural
03.11.2020 17:00 Riot Organisatorisches Video
10.11.2020 17:00 Riot Einführung: Computerlinguistik Video

CL_01.pdf

17.11.2020 17:00 Riot Einführung: Sprachwissenschaft Video

CL_02.pdf

Mural
24.11.2020 17:00 Riot Methoden: Phonetik & Phonologie Video

CL_03.pdf

Mural
01.12.2020 16:00 Zoom Anwendungen: Phonetik

Spracherkennung.pdf

Sprachsynthese.pdf

08.12.2020 17:00 Riot Methoden: Morphologie Video

CL_04.pdf

Mural
15.12.2020 16:00 Zoom Anwendungen: Morphologie

PoS-Tagger.pdf

Lemmatisierer.pdf

12.01.2021 17:00 Riot Methoden: Syntax Video

CL_05.pdf

Mural
19.01.2021 16:00 Zoom Anwendungen: Syntax

Grammatikprüfung

26.01.2021 17:00 Riot Methoden: Semantik Video

CL_06.pdf

02.02.2021 16:00 Zoom Anwendungen: Semantik
09.02.2021 16:00 Zoom Online-Klausur

Studienleistung - Referate

In Referaten (die in der Regel von zwei-drei Studierenden gehalten werden) soll ein vorgegebenes Thema von den Studierenden an ihre Kommilitonen in etwa 20-30 Minuten vermittelt werden. Wichtig ist hierbei die Berücksichtigung des Adressaten: Referate werden nicht für Dozenten (die wissen im Regelfall um das Thema), sondern für die anderen Studierenden gehalten. Versuchen Sie also, das vorgegebene Thema so zu präsentieren, wie Sie es auch gerne präsentiert haben wollen. Verzichten Sie dabei auf Detailfülle und geben Sie stattdessen einen verständlichen Überblick mit anschaulichen Beispielen. Referate geben die Gelegenheit, relativ freies Reden und Präsentationstechniken einzuüben. Machen Sie von beidem Gebrauch!

Referatsthemen stehen sowohl im ersten, wie auch im zweiten Teil zur Verfügung. Eine Vorbesprechung des Referats, zu der auch eine erste Gliederung vorzulegen ist, muss spätestens in der Sprechstunde in der Woche vor dem Referatstermin erfolgen.

Themen:

  • Erster Teil (Vergabe am 03.11.2020):
    • Spracherkennung - 01.12.2020 (Einreichung Konzept bis 25.11.) - Alessandro Marini, Cindy Hartmann
    • Sprachsynthese - 01.12.2020 (Einreichung Konzept bis 25.11.) - André Schucht, Jasmin Druyen
    • Lemmatisierer - 15.12.2020 (Einreichung Konzept bis 7.12.) - Jonas Reinhardt, Max Wieck
    • PoS-Tagger - 15.12.2020 (Einreichung Konzept bis 7.12.) - Elke Smith, Nilay Karagözuglu
    • Grammatikprüfung - 19.01.2021 (Einreichung Konzept bis 11.01.) - Célia Descharreaux, Camille Braud, Léana Hhusset
    • Information Retrieval - 02.02.2021 (Einreichung Konzept bis 25.01.) - Claudia Biniossek, Ben Musolff
  • Zweiter Teil (Vergabe am 13.4.):
    • Anwendungen I (4.5.2021, Einreichung Konzept bis 30.4.2021)
      • Textklassifikation - Ariana Halimi, Alexander Lürwer
      • Sentiment Analysis / Opinion Mining - Johannes Höch, Till Pussel
    • Anwendungen II (8.6.2021, Einreichung Konzept bis 31.05.2021)
      • Question Answering (Marc Benscheid, 1 frei)
      • Information Extraction (2 frei)
      • Plagiatserkennung - Marcel von der Heide, Jana Zündel
    • Anwendungen III (29.6.2021, Einreichung Konzept bis 21.06.2021)
      • Maschinelle Übersetzung - Regelbasierte Ansätze - Milo Reinmöller, Caspar Thilo
      • Maschinelle Übersetzung - Statistische / Deep Learning Ansätze - Marius Klossek, Philipp Heitmann

Prüfungsleistung - Klausur

Für Studierende der Informationsverarbeitung:

Zum Ende des Semesters findet eine Präsenzklausur statt. Diese dauert 90 min. und bezieht sich auf den Stoff der beiden Proseminare und der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Wenn Sie im ersten Teil bereits die Online-Klausur geschrieben haben, können Sie die dort erreichten Punkte anrechnen lassen, so dass Sie in der Präsenzklausur nur noch Fragen zu den beiden anderen Veranstaltungen (SoSe-Seminar, Vorlesung) des Moduls beantworten müssen.

Für eine erfolgreiche Modulprüfung ist es notwendig, in der Abschlussklausur mindestens die Note 4,0 zu erreichen.

Für Studierende, die Linguistik & Phonetik, aber nicht Informationsverarbeitung studieren:

Zum Ende des Semesters findet eine Präsenzklausur statt. Diese dauert 60 min. und bezieht sich auf den Stoff des Proseminars und der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Wenn Sie im ersten Teil bereits die Online-Klausur geschrieben haben, können Sie die dort erreichten Punkte anrechnen lassen, so dass Sie in der Präsenzklausur nur noch Fragen zur Vorlesung beantworten müssen.

Für eine erfolgreiche Modulprüfung ist es notwendig, in der Abschlussklausur mindestens die Note 4,0 zu erreichen.

Für Erasmus-Studierende:

Als Erasmus-Studierende|r können Sie sowohl das einsemestrige (WiSe oder SoSe, 6 CP), als auch das zweisemestrige Modul (WiSe und SoSe, 12 CP) belegen. Wenn Sie das Modul für 6 CP belegen, gilt für Sie das Gleiche wie für Studierende, die nicht Informationsverabeitung studieren. Wenn Sie das Modul für 12 CP belegen, gilt für Sie das Gleiche wie für Studierende der Informationsverarbeitung.

Termine:

Modulabschlussprüfung: 22.Juli 10:00-11:30 Uhr, Ort wird noch bekannt gegeben

Wiederholung Modulabschlussprüfung: Ende September 2021


Literatur

Die Pflichtliteratur für den Kurs findet sich als Kopiervorlage unter dem ILIAS-Ordner zum Kurs. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Bücher (in der größten Stückzahl die ersten beiden Sammelbände) sind inzwischen in mehrfacher Ausführung in der Lehrbuchsammlung vorhanden.

  • Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Auflage). Heidelberg, Berlin: Spektrum.

[Relativ aktuelles und umfassendes Werk, das begleitend zum Kurs und darüber hinaus gelesen werden kann. 55 €, Gibt es an der UB auch als online-Ressource !]

  • Mitkov, R. (2014): The Oxford Handbook of Computational Linguistics 2. Auflage). Oxford, New York: Oxford University Press.

[Das englische Pendant zu dem Buch oben. Gliederung und Schwerpunktsetzung ein wenig abweichend aber mindestens genauso zu empfehlen. Gibt es an der UB auch als online-Ressource !]

  • Jurafski, D. & J. Martin (2020): Speech and Language Processing. New Jersey: Prentice Hall.

[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, 75 €, Teilweise sind die Kapitel online zugänglich]

  • Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.

[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik für weniger als 15 € - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“ für ca. 28 € zu beziehen)]

  • Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..

[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage (15 €)]

  • Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.


Links

Veranstaltungsmaterialien

Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/