Plan für den SoSe-Kurs mit Präsenzveranstaltungen

  • Der Kurs findet wöchentlich in dienstags 16-17:30 Uhr in S91 statt. In der Abstimmung im Plenum der Veranstaltung wurde festgesetzt, dass der komplette Stoff im Präsenzunterricht thematisiert und nicht durch neue Videos ersetzt werden soll. Zur Unterstützung werden die Videos aus dem Kurs des SoSe 2021 weiterhin zur Verfügung gestellt und im Seminarplan verlinkt.

  • Literatur zu den jeweiligen Themen wird in den Sitzungen referenziert den Teilnehmern über ILIAS zugänglich gemacht.

  • Studienleistung: Im Kapitel Anwendungen werden verschiedene Referate zur Auswahl gestellt, für die Sie sich melden können (Vergabe in den ersten beiden Sitzungen). Die Referatsgruppen werden aus 2 Personen bestehen, die zusammen ein Referat von 20-30 Minuten Länge vorbereiten und in Präsenz halten werden. Wer bereits im Wintersemester 2021/22 ein Referat im Kurs Computerlinguistik gehalten hat, muss nicht noch eins im Sommersemster 2022 halten, dafür aber eine Zusammenfassung zu vier im Sommersemester gehaltenen Referaten einreichen.

  • Prüfungsleistung: Klausur zu den behandelten Themen, am 14.Juli 10:00-11:30 Uhr, H80 (Das sind Zeitslot und Ort der Vorlesung "Sprachverarbeitung")


Semesterüberblick (Sommersemester)

(Erläuterung: Kurs startet mit E07, die Videos / Präsentationen aus dem WiSe 2021/22 fortgesetzt werden. Verlinkte Videos aus dem SoSe 2021 sind zur Unterstützung verlinkt, es besteht aber keine Garantie, dass diese den kompletten für die Klausur im SoSe 2022 relevanten Stoff thematisieren)

Datum Uhrzeit Ort Thema Video (SoSe 21) Präsentation Material

05.04.2022

16:00

S91

Organisatorisches, Überblick

12.04.2022

16:00

S91

Methoden (Zusammenfassung des WiSe)

CL_ZF_Wise

19.04.2022

16:00

S91

Ressourcen

CLS21E09

CL_P07

26.04.2022

16:00

S91

Anwendungen I

Information Extraction

Text Summarization

Text Classification

03.05.2022

16:00

S91

Parser: Einführung

CLS21E10

CL_P08

Spreadsheet

10.05.2022

16:00

S91

Parser: Charts

CLS21E11

CL_P09

Spreadsheet

17.05.2022

16:00

S91

Parser: Probabilistische

CLS21E12 CL_P10 Spreadsheet

24.05.2022

16:00

S91

Anwendungen II

Opinion Mining

Plagiatserkennung

Question Answering

31.05.2022

16:00

S91

Grammatikformalismen: Unifikation

CLS21E13 CL_P11 Doc

14.06.2022

16:00

S91

Grammatikformalismen: LFG

CLS21E14 CL_P12 Pic

21.06.2022

16:00

S91

(verschoben)

28.06.2022

16:00

S91

Anwendungen III

MÜ Geschichte

MÜ Status quo

Vortrag MÜ

05.07.2022

16:00

S91

Evaluation

CL_P13

12.07.2022

16:00

S91

Ausblick, Fragestunde zur Klausur


Link zum Semesterüberblick des Wintersemesters

Studienleistung – Referate / Protokolle

Referatsthemen standen bereits im ersten (WiSe) Teil zur Verfügung, in diesem zweiten Teil (SoSe) des Seminars folgen weitere. Wenn Sie im WiSe noch kein Referat gehalten haben, müssen Sie eines aus dem Sommersemester übernehmen. Halten Sie im SoSe kein Referat, müssen Sie bis zum 21.07.2022 ein Protokoll mit Aufzeichnungen zu vier verschiedenen Referaten aus dem SoSe über Ilias einreichen. Also: Sie müssen in Sommersemester entweder ein Referat halten, oder ein Protokoll einreichen. Näheres zur Einreichung der Protokolle wird im Laufe des Semesters bekannt gegeben.

Ein Konzept des Referats, zu der auch eine erste Gliederung vorzulegen ist, muss spätestens in der Sprechstunde in der Woche vor dem Referatstermin erfolgen (ausgenommen sind die beiden ersten Referate, s.u.).

In Referaten (die in der Regel von zwei Studierenden gehalten werden) soll ein vorgegebenes Thema von den Studierenden an ihre Kommilitonen in etwa 20-25 Minuten vermittelt werden. Wichtig ist hierbei die Berücksichtigung des Adressaten: Referate werden nicht für Dozenten (die wissen im Regelfall um das Thema), sondern für die anderen Studierenden gehalten. Versuchen Sie also, das vorgegebene Thema so zu präsentieren, wie Sie es auch gerne präsentiert haben wollen. Verzichten Sie dabei auf Detailfülle und geben Sie stattdessen einen verständlichen Überblick mit anschaulichen Beispielen. Referate geben die Gelegenheit, relativ freies Reden und Präsentationstechniken einzuüben. Machen Sie von beidem Gebrauch!

Themen:

  • Erster Teil (Vergabe am 19.10.2021):
    • Spracherkennung – 09.11.2021 (Einreichung Konzept bis 02.11. – A. Lawal, A. Budancamanak)
    • Sprachsynthese – 09.11.2021 (Einreichung Konzept bis 02.11., F. Feldmann, F. Dallmann)
    • Lemmatisierer – 22.11.2021 (Einreichung Konzept bis 15.11. – C. Maffeis, A. Sivianes Blanco)
    • PoS-Tagger – 22.11.2021 (Einreichung Konzept bis 15.11. – L. Markic, J. Neumann)
    • Grammatikprüfung – 07.12.2021 (Einreichung Konzept bis 29.11. – D. Kramer, J. Jackowski)
    • Textgenerierung – 07.12.2021 (Einreichung Konzept bis 29.11. – D. Liebezeit, A. Sabbaghi Asi)
    • Wortsinndisambiguierung – 11.01.2022 (Einreichung Konzept bis 20.12. – S. Schatohin-Edstein, L. Mocka)
    • Information Retrieval – 11.01.2022 (Einreichung Konzept bis 20.12. – J. Cremer, N. Henning)
  • Zweiter Teil (werden zum Sommersemester vergeben):
    • Information Extraction – 26.4.2022 (Einreichung Konzept 18.4. – S. Jorns, S. Herding)
    • Textzusammenfassung – 26.4.2022 (Einreichung Konzept 18.4. – A. Reiner, L. Rauh)
    • Textklassifikation – 26.4.2022 (Einreichung Konzept 18.4. – J. Kenner, S Dickson Igwe)
    • Opinion Mining – 24.5.2022 (Einreichung Konzept 16.5. – J. Albrecht, C. Lauffer)
    • Plagiatserkennung – 24.5.2022 (Einreichung Konzept 16.5. – M. Müller, D. Müller)
    • Question Answering – 24.5.2022 (Einreichung Konzept 16.5. – F. Stupp, S. Rodrigues Ricardo)
    • Maschinelle Übersetzung (Geschichte und symbolische Ansätze) – 28.6.2022 (Einreichung Konzept 20.6. – S. Sahintürk, F. Bollen)
    • Maschinelle Übersetzung (Statistische und Neurale Ansätze) – 28.6.2022 (Einreichung Konzept 20.6. – H. Saritzolou, A. Lüser, Ü. Binici)

Prüfungsleistung - Klausur

Für Studierende der Informationsverarbeitung:

Zum Ende des ersten Teils des Proseminars wurde eine Online-Klausur angeboten. Diese bezog sich auf den Stoff des ersten Proseminars aus dem Modul Computerlinguistik. Die in dieser Klausur erreichten Punkte können auf die Modulprüfung im Sommersemester angerechnet werden, so dass dort nur noch Fragen zu den beiden anderen Veranstaltungen (SoSe-Seminar, Vorlesung) des Moduls beantwortet werden müssen. In diesem Fall haben Sie 60 Minuten Bearbbeitungszeit. Haben Sie die Online-Klausur nicht mitgeschrieben bzw. sind Sie mit der Punkteausbeute nicht zufrieden, können Sie in der Modulabschlussprüfung auch alle drei Teile noch einmal bearbeiten und haben dafür 90 Minuten Bearbeitungszeit.

Für eine erfolgreiche Modulprüfung ist es notwendig, in der Abschlussklausur mindestens die Note 4,0 zu erreichen.

Für Studierende, die Linguistik & Phonetik, aber nicht Informationsverarbeitung studieren:

Zum Ende des Proseminars findet die Klausur statt. Diese hat eine Bearbeitugszeit von 60 Minuten und bezieht sich auf den Stoff des ersten Proseminars sowie auf die Vorlesung aus dem Modul Computerlinguistik.

Für eine erfolgreiche Modulprüfung ist es notwendig, in der Abschlussklausur mindestens die Note 4,0 zu erreichen.

Für Erasmus-Studierende:

Als Erasmus-Studierende|r können Sie sowohl das einsemestrige (WiSe oder SoSe, 6 CP), als auch das zweisemestrige Modul (WiSe und SoSe, 12 CP) belegen. Wenn Sie das Modul für 6 CP belegen, gilt für Sie das Gleiche wie für Studierende, die nicht Informationsverabeitung studieren. Wenn Sie das Modul für 12 CP belegen, gilt für Sie das Gleiche wie für Studierende der Informationsverarbeitung.

Termine:

Modulabschlussprüfung: 14.07. 10:00-11:30 Uhr, H80 (Das sind Zeitslot und Ort der Vorlesung "Sprachverarbeitung")

Wiederholung Modulabschlussprüfung: Ende September 2022


Literatur

Die Pflichtliteratur für den Kurs findet sich als Kopiervorlage unter dem ILIAS-Ordner zum Kurs. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Bücher (in der größten Stückzahl die ersten beiden Sammelbände) sind inzwischen in mehrfacher Ausführung in der Lehrbuchsammlung vorhanden.

  • Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Auflage). Heidelberg, Berlin: Spektrum.

[Relativ aktuelles und umfassendes Werk, das begleitend zum Kurs und darüber hinaus gelesen werden kann. 55 €, Gibt es an der UB auch als online-Ressource !]

  • Mitkov, R. (2014): The Oxford Handbook of Computational Linguistics 2. Auflage). Oxford, New York: Oxford University Press.

[Das englische Pendant zu dem Buch oben. Gliederung und Schwerpunktsetzung ein wenig abweichend aber mindestens genauso zu empfehlen. Gibt es an der UB auch als online-Ressource !]

  • Jurafski, D. & J. Martin (2020): Speech and Language Processing. New Jersey: Prentice Hall.

[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, 75 €, Zum überwiegenden Teil sind die neu aktualisierten Kapitel online zugänglich]

  • Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.

[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik für weniger als 15 € - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“ für ca. 28 € zu beziehen)]

  • Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..

[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage (15 €)]

  • Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.

[Sprachwissenschaftliches Nachschlagewerk (35 €)]


Links

(in der Reihenfolge, in der sie im Seminar thematisiert wurden)

Veranstaltungsmaterialien

Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/