Plan für den SoSe-Kurs mit Präsenzveranstaltungen
-
Der Kurs findet wöchentlich in dienstags 16-17:30 Uhr in S91 statt. In der Abstimmung im Plenum der Veranstaltung wurde festgesetzt, dass der komplette Stoff im Präsenzunterricht thematisiert und nicht durch neue Videos ersetzt werden soll. Zur Unterstützung werden die Videos aus dem Kurs des SoSe 2021 weiterhin zur Verfügung gestellt und im Seminarplan verlinkt.
-
Literatur zu den jeweiligen Themen wird in den Sitzungen referenziert den Teilnehmern über ILIAS zugänglich gemacht.
-
Studienleistung: Im Kapitel Anwendungen werden verschiedene Referate zur Auswahl gestellt, für die Sie sich melden können (Vergabe in den ersten beiden Sitzungen). Die Referatsgruppen werden aus 2 Personen bestehen, die zusammen ein Referat von 20-30 Minuten Länge vorbereiten und in Präsenz halten werden. Wer bereits im Wintersemester 2021/22 ein Referat im Kurs Computerlinguistik gehalten hat, muss nicht noch eins im Sommersemster 2022 halten, dafür aber eine Zusammenfassung zu vier im Sommersemester gehaltenen Referaten einreichen.
-
Prüfungsleistung: Klausur zu den behandelten Themen, am 14.Juli 10:00-11:30 Uhr, H80 (Das sind Zeitslot und Ort der Vorlesung "Sprachverarbeitung")
Semesterüberblick (Sommersemester)
(Erläuterung: Kurs startet mit E07, die Videos / Präsentationen aus dem WiSe 2021/22 fortgesetzt werden. Verlinkte Videos aus dem SoSe 2021 sind zur Unterstützung verlinkt, es besteht aber keine Garantie, dass diese den kompletten für die Klausur im SoSe 2022 relevanten Stoff thematisieren)
Datum | Uhrzeit | Ort | Thema | Video (SoSe 21) | Präsentation | Material |
05.04.2022 |
16:00 |
S91 |
Organisatorisches, Überblick |
|||
12.04.2022 |
16:00 |
S91 |
Methoden (Zusammenfassung des WiSe) |
|||
19.04.2022 |
16:00 |
S91 |
Ressourcen |
|||
26.04.2022 |
16:00 |
S91 |
Anwendungen I |
|||
03.05.2022 |
16:00 |
S91 |
Parser: Einführung |
|||
10.05.2022 |
16:00 |
S91 |
Parser: Charts |
Spreadsheet | ||
17.05.2022 |
16:00 |
S91 |
Parser: Probabilistische |
CLS21E12 | CL_P10 | Spreadsheet |
24.05.2022 |
16:00 |
S91 |
Anwendungen II |
|||
31.05.2022 |
16:00 |
S91 |
Grammatikformalismen: Unifikation |
CLS21E13 | CL_P11 | Doc |
14.06.2022 |
16:00 |
S91 |
Grammatikformalismen: LFG |
CLS21E14 | CL_P12 | Pic |
21.06.2022 |
16:00 |
S91 |
(verschoben) |
|||
28.06.2022 |
16:00 |
S91 |
Anwendungen III |
MÜ Geschichte |
Vortrag MÜ | |
05.07.2022 |
16:00 |
S91 |
Evaluation |
CL_P13 | ||
12.07.2022 |
16:00 |
S91 |
Ausblick, Fragestunde zur Klausur |
Link zum Semesterüberblick des Wintersemesters
Studienleistung – Referate / Protokolle
Referatsthemen standen bereits im ersten (WiSe) Teil zur Verfügung, in diesem zweiten Teil (SoSe) des Seminars folgen weitere. Wenn Sie im WiSe noch kein Referat gehalten haben, müssen Sie eines aus dem Sommersemester übernehmen. Halten Sie im SoSe kein Referat, müssen Sie bis zum 21.07.2022 ein Protokoll mit Aufzeichnungen zu vier verschiedenen Referaten aus dem SoSe über Ilias einreichen. Also: Sie müssen in Sommersemester entweder ein Referat halten, oder ein Protokoll einreichen. Näheres zur Einreichung der Protokolle wird im Laufe des Semesters bekannt gegeben.
Ein Konzept des Referats, zu der auch eine erste Gliederung vorzulegen ist, muss spätestens in der Sprechstunde in der Woche vor dem Referatstermin erfolgen (ausgenommen sind die beiden ersten Referate, s.u.).
In Referaten (die in der Regel von zwei Studierenden gehalten werden) soll ein vorgegebenes Thema von den Studierenden an ihre Kommilitonen in etwa 20-25 Minuten vermittelt werden. Wichtig ist hierbei die Berücksichtigung des Adressaten: Referate werden nicht für Dozenten (die wissen im Regelfall um das Thema), sondern für die anderen Studierenden gehalten. Versuchen Sie also, das vorgegebene Thema so zu präsentieren, wie Sie es auch gerne präsentiert haben wollen. Verzichten Sie dabei auf Detailfülle und geben Sie stattdessen einen verständlichen Überblick mit anschaulichen Beispielen. Referate geben die Gelegenheit, relativ freies Reden und Präsentationstechniken einzuüben. Machen Sie von beidem Gebrauch!
Themen:
- Erster Teil (Vergabe am 19.10.2021):
- Spracherkennung – 09.11.2021 (Einreichung Konzept bis 02.11. – A. Lawal, A. Budancamanak)
- Sprachsynthese – 09.11.2021 (Einreichung Konzept bis 02.11., F. Feldmann, F. Dallmann)
- Lemmatisierer – 22.11.2021 (Einreichung Konzept bis 15.11. – C. Maffeis, A. Sivianes Blanco)
- PoS-Tagger – 22.11.2021 (Einreichung Konzept bis 15.11. – L. Markic, J. Neumann)
- Grammatikprüfung – 07.12.2021 (Einreichung Konzept bis 29.11. – D. Kramer, J. Jackowski)
- Textgenerierung – 07.12.2021 (Einreichung Konzept bis 29.11. – D. Liebezeit, A. Sabbaghi Asi)
- Wortsinndisambiguierung – 11.01.2022 (Einreichung Konzept bis 20.12. – S. Schatohin-Edstein, L. Mocka)
- Information Retrieval – 11.01.2022 (Einreichung Konzept bis 20.12. – J. Cremer, N. Henning)
- Zweiter Teil (werden zum Sommersemester vergeben):
- Information Extraction – 26.4.2022 (Einreichung Konzept 18.4. – S. Jorns, S. Herding)
- Textzusammenfassung – 26.4.2022 (Einreichung Konzept 18.4. – A. Reiner, L. Rauh)
- Textklassifikation – 26.4.2022 (Einreichung Konzept 18.4. – J. Kenner, S Dickson Igwe)
- Opinion Mining – 24.5.2022 (Einreichung Konzept 16.5. – J. Albrecht, C. Lauffer)
- Plagiatserkennung – 24.5.2022 (Einreichung Konzept 16.5. – M. Müller, D. Müller)
- Question Answering – 24.5.2022 (Einreichung Konzept 16.5. – F. Stupp, S. Rodrigues Ricardo)
- Maschinelle Übersetzung (Geschichte und symbolische Ansätze) – 28.6.2022 (Einreichung Konzept 20.6. – S. Sahintürk, F. Bollen)
- Maschinelle Übersetzung (Statistische und Neurale Ansätze) – 28.6.2022 (Einreichung Konzept 20.6. – H. Saritzolou, A. Lüser, Ü. Binici)
Prüfungsleistung - Klausur
Für Studierende der Informationsverarbeitung:
Zum Ende des ersten Teils des Proseminars wurde eine Online-Klausur angeboten. Diese bezog sich auf den Stoff des ersten Proseminars aus dem Modul Computerlinguistik. Die in dieser Klausur erreichten Punkte können auf die Modulprüfung im Sommersemester angerechnet werden, so dass dort nur noch Fragen zu den beiden anderen Veranstaltungen (SoSe-Seminar, Vorlesung) des Moduls beantwortet werden müssen. In diesem Fall haben Sie 60 Minuten Bearbbeitungszeit. Haben Sie die Online-Klausur nicht mitgeschrieben bzw. sind Sie mit der Punkteausbeute nicht zufrieden, können Sie in der Modulabschlussprüfung auch alle drei Teile noch einmal bearbeiten und haben dafür 90 Minuten Bearbeitungszeit.
Für eine erfolgreiche Modulprüfung ist es notwendig, in der Abschlussklausur mindestens die Note 4,0 zu erreichen.
Für Studierende, die Linguistik & Phonetik, aber nicht Informationsverarbeitung studieren:
Zum Ende des Proseminars findet die Klausur statt. Diese hat eine Bearbeitugszeit von 60 Minuten und bezieht sich auf den Stoff des ersten Proseminars sowie auf die Vorlesung aus dem Modul Computerlinguistik.
Für eine erfolgreiche Modulprüfung ist es notwendig, in der Abschlussklausur mindestens die Note 4,0 zu erreichen.
Für Erasmus-Studierende:
Als Erasmus-Studierende|r können Sie sowohl das einsemestrige (WiSe oder SoSe, 6 CP), als auch das zweisemestrige Modul (WiSe und SoSe, 12 CP) belegen. Wenn Sie das Modul für 6 CP belegen, gilt für Sie das Gleiche wie für Studierende, die nicht Informationsverabeitung studieren. Wenn Sie das Modul für 12 CP belegen, gilt für Sie das Gleiche wie für Studierende der Informationsverarbeitung.
Termine:
Modulabschlussprüfung: 14.07. 10:00-11:30 Uhr, H80 (Das sind Zeitslot und Ort der Vorlesung "Sprachverarbeitung")
Wiederholung Modulabschlussprüfung: Ende September 2022
Literatur
Die Pflichtliteratur für den Kurs findet sich als Kopiervorlage unter dem ILIAS-Ordner zum Kurs. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Bücher (in der größten Stückzahl die ersten beiden Sammelbände) sind inzwischen in mehrfacher Ausführung in der Lehrbuchsammlung vorhanden.
-
Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Auflage). Heidelberg, Berlin: Spektrum.
[Relativ aktuelles und umfassendes Werk, das begleitend zum Kurs und darüber hinaus gelesen werden kann. 55 €, Gibt es an der UB auch als online-Ressource !]
-
Mitkov, R. (2014): The Oxford Handbook of Computational Linguistics 2. Auflage). Oxford, New York: Oxford University Press.
[Das englische Pendant zu dem Buch oben. Gliederung und Schwerpunktsetzung ein wenig abweichend aber mindestens genauso zu empfehlen. Gibt es an der UB auch als online-Ressource !]
-
Jurafski, D. & J. Martin (2020): Speech and Language Processing. New Jersey: Prentice Hall.
[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, 75 €, Zum überwiegenden Teil sind die neu aktualisierten Kapitel online zugänglich]
-
Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.
[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik für weniger als 15 € - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“ für ca. 28 € zu beziehen)]
-
Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..
[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage (15 €)]
-
Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.
[Sprachwissenschaftliches Nachschlagewerk (35 €)]
Links
(in der Reihenfolge, in der sie im Seminar thematisiert wurden)
- Lehren aus dem Digitalsemester (Vol. 1) (Online-Videos haben zur Verbesserung der Klausurergebnisse geführt, Referenziert in E01)
- Blogpost 101 – Schlüssel zu einem erfolgreichen Studium? (Blogpost zur Korrelation von Anwesenheit und Klausurergebnissen, TEXperimenTales)
- Computerlinguistik: Was ist das eigentlich (Info-Seite zum Studiengang, IMS Stuttgart)
- Über Sprache und Tierkommunikation (Blogpost zu menschlicher und tierischer Kommunikation, TEXperimenTales)
- Google NGram-Viewer (Referenziert in E02)
- Phasenstruktur-Baumgenerator (Referenziert in E06)
- Dependenzparser ParZu (Referenziert in E06)
- Originalvideo von Noah Bubenhofer mit allen erwähnten Links (Referenziert in E08)
- Spreadsheet mit Beispielen zum Kapitel Parser (Referenziert E10-E12)
- Webservice zum Zeichnen von Syntaxbäumen (Wurde genutzt für die Syntaxbäume der Präsentationen E10-E12)
- Speech and Language Processing (3rd ed. draft, 2019) (Referenziert in E12)
- Vortrag zu Machine Learning & Text Mining (Referenziert in der Anwendungssession 8.6.)
- Video zu IBM Watson (Referenziert in der Anwendungssession 8.6.)
- Beispiel zum PATRII-Parsing (Referenziert in E13)
- Börjars, Nordlinger, Sadler: LFG - An Introduction (Referenziert in E14)
- Anwendung des Satz von Bayes: Gesichtserkennung (Blogpost, referenziert in E15)
Veranstaltungsmaterialien
Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/