Plan für den SoSe-Kurs ohne Präsenzveranstaltungen
-
Zu einem Teil der Kurstermine werden vom Kursleiter Online-Videos veröffentlicht und den Kursteilnehmern zur Verfügung gestellt. In den Wochen, in denen es Videos gibt, treffen wir uns dienstags um 17:00 Uhr im Chat für Rückfragen und Diskussion. In Wochen, in denen Referate gehalten werden, treffen wir uns dienstags um 16:00 Uhr bei Zoom (Termine siehe Übersichtstabelle, in den einzelnen Wochen werden Sie jeweils montags eine Infomail bekommen).
-
Literatur zu den jeweiligen Themen wird in den Videos referenziert den Teilnehmern über ILIAS zugänglich gemacht.
-
Studienleistung: Im Kapitel Anwendungen werden verschiedene Referate zur Auswahl gestellt, für die Sie sich eintragen können. Die Referatsgruppen werden aus 2 Personen bestehen, die zusammen ein Referat von 20-30 Minuten Länge vorbereiten und über Zoom halten werden. Wer bereits im Wintersemester 2020/21 ein Referat im Kurs Computerlinguistik gehalten hat, muss nicht noch eins im Sommersemster 2021 halten.
-
Prüfungsleistung: Klausur zu den behandelten Themen, am 22.Juli 10:00-11:30 Uhr, Ort wird noch bekannt gegeben
Semesterüberblick (Sommersemester)
Datum | Uhrzeit | Ort | Thema | Video | Präsentationen | Material |
13.04.2021 |
16:00 |
Zoom |
Organisatorisches, Überblick |
|||
20.04.2021 |
17:00 |
Riot |
Ressorcen: Korpora |
|||
27.04.2021 |
17:00 |
Riot |
Ressourcen: Lexika |
|||
04.05.2021 |
16:00 |
Zoom |
Anwendungen I |
|||
11.05.2021 |
17:00 |
Riot |
Parser: Einführung |
|||
18.05.2021 |
16:00 |
Riot |
Parser: Charts |
|||
01.06.2021 |
17:00 |
Riot |
Parser: Probabilistische |
|||
08.06.2021 |
16:00 |
Zoom |
Anwendungen II |
|||
15.06.2021 |
17:00 |
Riot |
Grammatikformalismen: Unifikation |
|||
22.06.2021 |
17:00 |
Riot |
Grammatikformalismen: LFG |
|||
29.06.2021 |
16:00 |
Zoom |
Anwendungen III |
|||
06.07.2021 |
16:00 |
Zoom |
Evaluation |
|||
13.07.2021 |
16:00 |
Zoom |
Zusammenfassung, Ausblick |
|||
20.07.2021 |
16:00 |
Zoom |
Fragestunde (Klausur am 22.07. 10:00 Uhr) |
Semesterüberblick (Wintersemester)
Datum | Uhrzeit | Ort | Thema | Video | Präsentationen | Material |
03.11.2020 |
17:00 |
Riot |
Organisatorisches |
|||
10.11.2020 |
17:00 |
Riot |
Einführung: Computerlinguistik |
|||
17.11.2020 |
17:00 |
Riot |
Einführung: Sprachwissenschaft |
|||
24.11.2020 |
17:00 |
Riot |
Methoden: Phonetik & Phonologie |
|||
01.12.2020 |
16:00 |
Zoom |
Anwendungen: Phonetik |
|||
08.12.2020 |
17:00 |
Riot |
Methoden: Morphologie |
|||
15.12.2020 |
16:00 |
Zoom |
Anwendungen: Morphologie |
|||
12.01.2021 |
17:00 |
Riot |
Methoden: Syntax |
|||
19.01.2021 |
16:00 |
Zoom |
Anwendungen: Syntax |
|||
26.01.2021 |
17:00 |
Riot |
Methoden: Semantik |
|||
02.02.2021 |
16:00 |
Zoom |
Anwendungen: Semantik |
|||
09.02.2021 |
16:00 |
Zoom |
Online-Klausur |
Studienleistung - Referate
In Referaten (die in der Regel von zwei-drei Studierenden gehalten werden) soll ein vorgegebenes Thema von den Studierenden an ihre Kommilitonen in etwa 20-30 Minuten vermittelt werden. Wichtig ist hierbei die Berücksichtigung des Adressaten: Referate werden nicht für Dozenten (die wissen im Regelfall um das Thema), sondern für die anderen Studierenden gehalten. Versuchen Sie also, das vorgegebene Thema so zu präsentieren, wie Sie es auch gerne präsentiert haben wollen. Verzichten Sie dabei auf Detailfülle und geben Sie stattdessen einen verständlichen Überblick mit anschaulichen Beispielen. Referate geben die Gelegenheit, relativ freies Reden und Präsentationstechniken einzuüben. Machen Sie von beidem Gebrauch!
Referatsthemen stehen sowohl im ersten, wie auch im zweiten Teil zur Verfügung. Eine Vorbesprechung des Referats, zu der auch eine erste Gliederung vorzulegen ist, muss spätestens in der Sprechstunde in der Woche vor dem Referatstermin erfolgen.
Themen:
- Erster Teil (Vergabe am 03.11.2020):
- Spracherkennung - 01.12.2020 (Einreichung Konzept bis 25.11.) - Alessandro Marini, Cindy Hartmann
- Sprachsynthese - 01.12.2020 (Einreichung Konzept bis 25.11.) - André Schucht, Jasmin Druyen
- Lemmatisierer - 15.12.2020 (Einreichung Konzept bis 7.12.) - Jonas Reinhardt, Max Wieck
- PoS-Tagger - 15.12.2020 (Einreichung Konzept bis 7.12.) - Elke Smith, Nilay Karagözuglu
- Grammatikprüfung - 19.01.2021 (Einreichung Konzept bis 11.01.) - Célia Descharreaux, Camille Braud, Léana Hhusset
- Information Retrieval - 02.02.2021 (Einreichung Konzept bis 25.01.) - Claudia Biniossek, Ben Musolff
- Zweiter Teil (Vergabe am 13.4.):
- Anwendungen I (4.5.2021, Einreichung Konzept bis 30.4.2021)
- Textklassifikation - Ariana Halimi, Alexander Lürwer
- Sentiment Analysis / Opinion Mining - Johannes Höch, Till Pussel
- Anwendungen II (8.6.2021, Einreichung Konzept bis 31.05.2021)
- Question Answering - JH
- Information Extraction - JH
- Plagiatserkennung - Marc Benscheid, Jana Zündel
- Anwendungen III (29.6.2021, Einreichung Konzept bis 21.06.2021)
- Maschinelle Übersetzung - Regelbasierte Ansätze - Milo Reinmöller, Caspar Thilo
- Maschinelle Übersetzung - Statistische / Deep Learning Ansätze - Marius Klossek, Philipp Heitmann
- Anwendungen I (4.5.2021, Einreichung Konzept bis 30.4.2021)
Prüfungsleistung - Klausur
Für Studierende der Informationsverarbeitung:
Zum Ende des Semesters findet eine Präsenzklausur statt. Diese dauert 90 min. und bezieht sich auf den Stoff der beiden Proseminare und der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Wenn Sie im ersten Teil bereits die Online-Klausur geschrieben haben, können Sie die dort erreichten Punkte anrechnen lassen, so dass Sie in der Präsenzklausur nur noch Fragen zu den beiden anderen Veranstaltungen (SoSe-Seminar, Vorlesung) des Moduls beantworten müssen.
Für eine erfolgreiche Modulprüfung ist es notwendig, in der Abschlussklausur mindestens die Note 4,0 zu erreichen.
Für Studierende, die Linguistik & Phonetik, aber nicht Informationsverarbeitung studieren:
Zum Ende des Semesters findet eine Präsenzklausur statt. Diese dauert 60 min. und bezieht sich auf den Stoff des Proseminar-Teils, den Sie besucht haben und der Vorlesung "Sprachverarbeitung" aus dem Modul Computerlinguistik. Wenn Sie im ersten Teil bereits die Online-Klausur geschrieben haben, können Sie die dort erreichten Punkte anrechnen lassen, so dass Sie in der Präsenzklausur nur noch Fragen zur Vorlesung beantworten müssen.
Für eine erfolgreiche Modulprüfung ist es notwendig, in der Abschlussklausur mindestens die Note 4,0 zu erreichen.
Für Erasmus-Studierende:
Als Erasmus-Studierende|r können Sie sowohl das einsemestrige (WiSe oder SoSe, 6 CP), als auch das zweisemestrige Modul (WiSe und SoSe, 12 CP) belegen. Wenn Sie das Modul für 6 CP belegen, gilt für Sie das Gleiche wie für Studierende, die nicht Informationsverabeitung studieren. Wenn Sie das Modul für 12 CP belegen, gilt für Sie das Gleiche wie für Studierende der Informationsverarbeitung.
Termine:
Modulabschlussprüfung: 22.Juli 10:00-11:30 Uhr, Ort wird noch bekannt gegeben
Wiederholung Modulabschlussprüfung: Ende September 2021
Literatur
Die Pflichtliteratur für den Kurs findet sich als Kopiervorlage unter dem ILIAS-Ordner zum Kurs. Folgende Bücher müssen also nicht angeschafft werden, verboten ist es selbstredend nicht. Die meisten aufgeführten Bücher (in der größten Stückzahl die ersten beiden Sammelbände) sind inzwischen in mehrfacher Ausführung in der Lehrbuchsammlung vorhanden.
-
Carstensen, K.U., Ebert, C., Endriss, C., Jekat, S., Klabunde, R., Langer, H. (2010): Computerlinguistik und Sprachtechnologie. Eine Einführung (3. Auflage). Heidelberg, Berlin: Spektrum.
[Relativ aktuelles und umfassendes Werk, das begleitend zum Kurs und darüber hinaus gelesen werden kann. 55 €, Gibt es an der UB auch als online-Ressource !]
-
Mitkov, R. (2014): The Oxford Handbook of Computational Linguistics 2. Auflage). Oxford, New York: Oxford University Press.
[Das englische Pendant zu dem Buch oben. Gliederung und Schwerpunktsetzung ein wenig abweichend aber mindestens genauso zu empfehlen. Gibt es an der UB auch als online-Ressource !]
-
Jurafski, D. & J. Martin (2020): Speech and Language Processing. New Jersey: Prentice Hall.
[Einführendes Werk mit Augenmerk auf aktuelle statistische Verfahren der Sprachverarbeitung, 75 €, Teilweise sind die Kapitel online zugänglich]
-
Crystal, D. (1993): Die Cambridge Enzyklopädie der Sprache. Köln: Parkland.
[Phantastisches Buch zum Stöbern. Behandelt so gut wie jedes Gebiet der Linguistik für weniger als 15 € - Auf deutsch sind immer mal wieder einzelne Exemplare zu haben, dafür in der englischen Ausgabe („The Cambridge Encyclopedia of Language“ für ca. 28 € zu beziehen)]
-
Vater, H. (2002): Einführung in die Sprachwissenschaft. München: Fink..
[Gut zu lesender, kompakter Überblick über die Einzeldisziplinen der Sprachwissenschaft, 2. Auflage (15 €)]
-
Bußmann, H. (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.
Links
- Lehren aus dem Digitalsemester (Vol. 1) (Online-Videos haben zur Verbesserung der Klausurergebnisse geführt, Referenziert in E01)
- Blogpost 101 – Schlüssel zu einem erfolgreichen Studium? (Blogpost zur Korrelation von Anwesenheit und Klausurergebnissen, TEXperimenTales)
- Computerlinguistik: Was ist das eigentlich (Info-Seite zum Studiengang, IMS Stuttgart)
- Über Sprache und Tierkommunikation (Blogpost zu menschlicher und tierischer Kommunikation, TEXperimenTales)
- Google NGram-Viewer (Referenziert in E02)
- Phasenstruktur-Baumgenerator (Referenziert in E06)
- Dependenzparser ParZu (Referenziert in E06)
- Originalvideo von Noah Bubenhofer mit allen erwähnten Links (Referenziert in E08)
- Spreadsheet mit Beispielen zum Kapitel Parser (Referenziert E10-E12)
- Webservice zum Zeichnen von Syntaxbäumen (Wurde genutzt für die Syntaxbäume der Präsentationen E10-E12)
- Speech and Language Processing (3rd ed. draft, 2019) (Referenziert in E12)
- Vortrag zu Machine Learning & Text Mining (Referenziert in der Anwendungssession 8.6.)
- Video zu IBM Watson (Referenziert in der Anwendungssession 8.6.)
- Beispiel zum PATRII-Parsing (Referenziert in E13)
- Börjars, Nordlinger, Sadler: LFG - An Introduction (Referenziert in E14)
- Anwendung des Satz von Bayes: Gesichtserkennung (Blogpost, referenziert in E15)
Veranstaltungsmaterialien
Kursmaterial finden Sie im ILIAS-Ordner zum Kurs (dafür müssen Sie in Klips zum Kurs gemeldet sein) - https://www.ilias.uni-koeln.de/