08.11.2018 – Auf der Suche nach Jack the Ripper und Elena Ferrante

Literatur

Andrea Nini; An authorship analysis of the Jack the Ripper letters, Digital Scholarship in the Humanities, Volume 33, Issue 3, 1 September 2018, Pages 621–636, https://doi.org/10.1093/llc/fqx065

Arjuna Tuzzi, Michele A Cortelazzo; What is Elena Ferrante? A comparative analysis of a secretive bestselling Italian writer, Digital Scholarship in the Humanities, Volume 33, Issue 3, 1 September 2018, Pages 685–702, https://doi.org/10.1093/llc/fqx066

Besprochene Inhalte

  • Jaccard-Koeffizient, Ähnlichkeitsbestimmung
  • OCR: Optical Character Recognition
  • Computer Vision
  • Datenhaltung: Textdatei, XML-Datei (z.B. TEI), doc vs. docx, xlsx, pptx, pdf, rtf, MySQL-DB (relationale Datenbank)
  • Bilddaten
    • verlustfrei
    • verlustbehaftet
  • Frage nach Langzeitverfügbarkeit bzw. Langzeitarchivierung, Migration, Emulation
  • Distant Reading (Moretti) vs. Close Reading
  • SISO: Shit In, Shit Out
  • Authorship Attribution
  • Qualitative vs. (?) quantitative Verfahren