Forschungsdatenmanagement ist ein stark wachsender Bereich in Forschung, Bibliotheken und kulturbewahrenden Einrichtungen. Es entsteht ein neuer Arbeitsbereich und ein neues Beschäftigungsprofil, für das sich Informationswissenschaftler, Digital Humanists und Studierende der Informationsverarbeitung qualifizieren können. Forschungsdatenmanagement umfasst die Methoden und Verfahren zur Speicherung, Erschließung und Sicherung der langfristigen Nutzbarkeit von Daten, die im Zuge wissenschaftlicher Vorhaben entstehen. An der Universität zu Köln gibt es seit 2013 ein Forschungsdatenzentrum für die Geisteswissenschaften (DCH) und seit 2018 ein zentrales Kompetenzzentrum (C3RDM). Die Übung führt in die grundlegenden Konzepte, Richtlinien und Standards ein und zeigt gleichberechtigt die Perspektive der Forschungspraxis sowie der Datenkuration und des Datenmanagements. Ein besonderes Augenmerk liegt auf der Vielfalt der Methoden und die spezifischen Anforderungen des Forschungsdatenmanagements in den Geisteswissenschaften. Zu verschiedenen Themen werden praktische Anwendungsaufgaben gestellt. Programmierkenntnisse sind dabei vorteilhaft aber keine Voraussetzung.
Hausaufgabe zur Sitzung am 25.06.2019:
1. Setzt die rudimentäre Modellierung mit RDF von der heutigen Sitzung mittels schema.org um (https://schema.org/Person), oder optional in JASON-LD oder RDFa-Syntax (Validierungsmöglichkeit: https://search.google.com/structured-data/testing-tool/u/0/)
2. Lest Euch in das Beschreibungsmodell von schema.org ein und überlegt an Hand von 12 Properties:
- Welche Beschreibungen können im Kontext von Forschungsdaten sinnvoll sein
- Was für Probleme können formale Beschreibungsmuster mitbringen
- Worin könnten Probleme in Bezug auf die Idee des Semantic Web liegen
Beschreibt den Prozess (1) und die Probleme, auf die Ihr gestoßen seid und skizziert Eure Gedanken zu (2) auf 3 - 5 Folien.
Abgabe bis zur kommenden Sitzung, 25.06.2019 per Mail an die bekannte Adresse.
für die kommende Sitzung am 18.06. (Pfingstwoche ist Vorlesungsfrei) haben wir eine praktische Aufgabe zum Thema Softwarekuratierung gestellt:
In Anlehnung an die von Philip Schildkamp und Claes Neuefeind in der letzten Sitzung vorgestellten Modellierung von Software-Topographien im Projekt SustainLife, sollt ihr euch selbst an einer kleinen Modellierung versuchen.
Auf den Slides zur 10. Session (-> Ilias) seht ihr auf Slide 17 wie das z.B. in der Modellierungsumgebung von OpenTosca aussieht. So professionell muss das natürlich nicht aussehen.
1. Bitte wählt eine Anwendung aus, an der ihr nach Möglichkeit selbst (mit-)programmiert habt, oder mit der ihr aus anderen Gründen gut vertraut seid.
Ein privates Projekt, Arbeit oder etwas aus dem Studium - ganz egal.
2. Analysiert welche Software-Komponenten (für Frontend, Backend, Server, Datenbanken, Laufzeitumgebungen, ...) dabei zum Einsatz kommen und wie sie zusammenspielen.
3. Visualisiert die Komponenten und erklärt den Kontext auf ein paar Slides (ca. 2-3) und schickt uns diese bis zur nächsten Sitzung an fdm-lehre@uni-koeln.de.
Wer gar keine Idee für ein eigenes Fallbeispiel hat, soll sich bitte bald melden, damit wir etwas bereitstellen können.
Lesestoff für die Sitzung am 28.05.:
Apel, Jochen, Fabian Gebhart, Leonhard Maylein, und Martin Wlotzka. „Offene Forschungsdaten an der Universität Heidelberg: von generischen institutionellen Repositorien zu fach- und projektspezifischen Diensten“. o-bib. Das offene Bibliotheksjournal / Herausgeber VDB 5, Nr. 2 (13. Juli 2018): 61–71. https://doi.org/10.5282/o-bib/2018H2S61-71.
Sahle, Patrick, und Simone Kronenwett. „Jenseits der Daten: Überlegungen zu Datenzentren für die Geisteswissenschaften am Beispiel des Kölner ‚Data Center for the Humanities‘“. LIBREAS. Library Ideas 23 (2013). http://libreas.eu/ausgabe23/09sahle/.
Wuttke, Ulrike, Claudia Engelhardt, und Stefan Buddenbohm. „Angebotsgenese für ein geisteswissenschaftliches Forschungsdatenzentrum“. Zeitschrift für digitale Geisteswissenschaften, 2016. https://doi.org/10.17175/2016_003.
Hausaufgabe bis zum 04.06. per Mail einzureichen:
Es sind zwei Beispielprojekte gegeben
Projekt 1
Lernverhalten von Schüler*innen einer Gesamtschule (10. Klasse) bei der Nutzung von einer Lern-App (DFG, 3 Jahre)
- Daten
- Videoaufnahmen der gesamten Klasse
- Audio-Interviews und Transkription mit fünf Schüler*innen, den Eltern der befragten Schüler*innen und zwei Lehrer*innen
- Screen-Capturing und Eye-Tracking der gesamten Klasse
- Ziele
- Publikation von drei Aufsätzen in verschiedenen Fachmagazinen
- Archivierung des gesamten Materials in einem passenden Repositorium
- Veröffentlichung/Nachnutzbarkeit der Daten, soweit möglich
Projekt 2
Sprachdokumentation des Kurukh in Jharkhand, Indien (DFG, 3 Jahre)
- Feldforschung zweimal 6 Monate
- Daten
- Elizitationen (Wortlisten, grammatische Beispiele)
- Monologe (traditionelle Geschichten, Lieder, andere Erzählungen)
- Audio- und Video-Aufnahmen, Transkriptionen, Übersetzungen, grammatikalische Annotationen
- Ziele
- Publikation einer grammatischen Beschreibung des Kurukh
- Publikation von zwei Aufsätzen zu Intonation und anderen prosodischen Phänomenen im Kurukh
- Archivierung des gesamten Materials in einem Spracharchiv
Bitte erstellt für EINES der beiden Beispielprojekte einen Datenmanagementplan nach der Vorlage der UzK (https://fdm.uni-koeln.de/data-management-plans.html). Dabei geht es insbesondere darum, das Gelernte der vergangenen Wochen anzuwenden und gegebenenfalls noch einmal etwas Recherche zu betreiben, um Fragen zu beantworten. Da es sich um Beispiele handelt, werden natürlich nicht alle Fragen wirklich richtig beantwortet werden können.
Allerdings "Ich verwende (irgend)ein Metadatenformat zur Beschreibung meiner Daten" ist keine adäquate Antwort. Die Suche nach einem vermutlich geeigneten generischen/fachspezifischen Metadatenstandard und seine Nennung im DMP hingegen schon.
Literatur für die Sitzung am 07. Mai
Open Data
http://opendatahandbook.org/guide/en/what-is-open-data/
Probleme mit Open Data
Sabine Imeri (2017): "Open Data? Zum Umgang mit Forschungsdaten in den ethnologischen Fächern", in: Kratzke, Jonas und Heuveline, Vincent (Hrsg.): E-Science-Tage 2017: Forschungsdaten managen, Heidelberg: heiBOOKS, 2017. http://doi.org/10.11588/heibooks.285.377
Eine indigene Sicht auf das Ganze
Das Gedicht "I am not your Data" (siehe Mail)
Hausaufgabe für die Sitzung am 07. Mai
Dokumentiert die Urheberrechtsproblematik, die ihr bereits in Eurer Gruppe in der vergangenen Stunde besprochen habt und findet ein positives oder negeatives Beispiel, das Ihr entsprechend auf 3 - 5 Folien problematisiert. Dabei geht es weniger um ein endgültiges Ergebnis, sondern um die Darlegung eines Problembewusstseins (wir sind schließlich keine Juristen). Die Folien sind per Mail bis zur kommenden Sitzung einzureichen.
Literatur für die Sitzung am 23. April
Kapitel 4: Das Referenzmodell OAIS - Open Archival Information System in Neuroth, Heike; Oßwald, Achim; Scheffel, Regine; Strathmann, Stefan; Huth, Karten (Hrsg.): Eine kleine Enzyklopädie der digitalen Langzeitarchivierung - Version 2.3, 2010.
https://univerlag.uni-goettingen.de/handle/3/nestor_handbuch
reinschauen:
OAIS Version 2012: CCSDS Magenta Book: Reference Model for an Open Archival Information System (OAIS)
http://public.ccsds.org/publications/archive/650x0m2.pdf
Literatur für die Sitzung am 09. April
Pempe, Wolfgang: Geisteswissenschaften. In: Neuroth, Heike; Strathmann, Stefan; Oßwald, Achim u.a.: Langzeitarchivierung von Forschungsdaten. Eine Bestandsaufnahme. Verlag Werner Hülsbach, Boizenburg, 2012. S. 137 - 161. Online: https://nestor.sub.uni-goettingen.de/bestandsaufnahme/nestor_lza_forschungsdaten_bestandsaufnahme.pdf
Helling, Patrick; Moeller, Katrin; Mathiak, Brigitte (2018): Forschungsdatenmanagement in den Geisteswissenschaften - der Dienstekatalog der AG-Datenzentren des Verbands "Digital Humanities im deutschsprachigen Raum" (DHd). ABI Technik, Band 38, Heft 3, Seiten 251 - 262, ISSN (Online) 2191-4664, ISSN (Print) 0720-6763, https://doi.org/10.1515/abitech-2018-3006
Hausaufgabe für die Sitzung am 16. April
- Bitte sucht selbst nach Daten (ca. 20 Min. Aufwand)
- Dokumentiert Eure Suche auf ungefähr 3 Folien und schickt diese per E-Mail (ca. 10 Min. Aufwand), achtet auf interessante Details, was war schwierig, gäbe es auch andere passende Datensätze, ...
Zeitplan
02.04.2019 |
Data Life Cycle in Action P |
09.04.2019 |
Grundlagen: FDM - Wieso, Weshalb, Warum? L |
16.04.2019 |
FAIR Prinzipien P (Festlegung Prüfungsleistung) |
23.04.2019 |
Repositorien und Langzeitarchivierung L |
30.04.2019 |
Recht und Policies P |
07.05.2019 |
Open Data und Persönlichkeitsrechte L |
14.05.2019 |
Metadaten und Standards L |
21.04.2019 |
Datenmanagementpläne P |
28.05.2019 |
Jenseits der Daten L |
04.06.2019 |
SustainLife – Softwarekuratierung P |
11.06.2019 |
Feiertag |
18.06.2019 |
Semantic Web P |
25.06.2019 |
Daten- und Metadatenkuration, Qualitätssicherung P |
02.07.2019 |
Digitales Publizieren/Digitale Sammlungen |
09.07.2019 |
Fällt aus |