Forschungsdatenmanagement und Provenance-Management im Projektumfeld des Instituts für Ostseeforschung Warnemünde

Interessenten an diesen Themen bewerben sich bis zum Ende der Vorlesungszeit im vorangehenden Semester mit einer Liste bisher absolvierter Module (inklusive Noten). Die Bewerberliste wird dann nach Ende der Vorlesungsperiode des vorangehenden Semesters mit den betreffenden Arbeitsgruppen des IOW abgestimmt.

Betreuer / Ansprechpartner

  • Tanja Auge

  • Andreas Heuer

Charakter

  • Arbeiten mit hohem Praxisbezug und Praxisanteil
  • bestimmte Themen, wie Provenance-Anfragen mit erhöhtem Theorieanteil

Vorkenntnisse

  • Datenbanken

  • imperative und objektorientierte Programmierung

Beschreibung

Das Leibniz-Institut für Ostseeforschung Warnemünde erhebt in verschiedenen Arbeitsgruppen eine Vielzahl an heterogenen Daten über biologische, chemische und physikalische Umweltbedingungen in der Ostsee. Die Daten aus diesen Experimenten werden am IOW gespeichert und verwaltet. Beispiele für solche Daten sind BenthosDB - eine Datensammlung zu Lebewesen die auf oder im Meeresgrund leben - oder Godess - eine in der Ostsee verankerte Sensorplattform für chemische und physikalische Messgrößen. Bei der Verwaltung dieser Daten ist das IOW an performanten, sicheren und rückverfolgbaren Verfahren interessiert. Fragestellungen sind u.a.:

- Wie können bestehende Daten importiert, transformiert, homogenisiert und bereinigt werden?

- Wie kann eine Datenverwaltung auf Basis „schemaloser“ Speicherung gewährleistet werden?

- Wie können die Veränderungen in Schemata und Daten über die Jahrzehnte der Datenerfassung im IOW mit Schemaevolutions-Operatoren beschrieben werden?

- Wie können Matlab-Analysen einfach auf eine relationale oder NoSQL-Speicherung möglichst automatisch umgeschrieben werden?

- Wie sieht der Scientific Workflow und die Workflow Provenance in den IOW-Anwendungen aus?

- Wie sehen Why, Where, How-Provenance-Anfragen bei IOW-typischen Datensätzen aus und wie kann man diese mit den gegebenen Werkzeugen umsetzen?

Ein konkretes Thema wird dann mit dem IOW nach aktuellen Gegebenheiten gemeinsam entwickelt!

Arbeitsschritte

  • Einarbeitung in das Gebiet
  • Literaturrecherche
  • Vergleich bestehender Ansätze
  • Entwicklung eines Konzepts
  • Prototypische Implementierung des wichtigsten Aspekts des Lösungskonzepts
  • Testszenarios und Tests

Technologien

  • WebCMS
  • PHP, Java
  • SQL (i.d.R. MySQL oder PostgreSQL)

Literatur

  • Informationen zum Leibniz-Institut für Ostseeforschung Warnemünde: http://www.io-warnemuende.de
  • Peter Buneman, Sanjeev Khanna and Wang-Chiew Tan; Data Provenance:  Some Basic Issues,
    In: Proceedings of the FST TCS 2000: Foundations of Software Technology and Theoretical Computer Science, Springer, 2000
  • Andreas Heuer; METIS in PArADISE: Provenance Management bei der Auswertung von Sensordatenmengen für die Entwicklung von Assistenzsystemen,
    In: Proceedings der BTW 2015 Konferenz, Springer, 2015
  • Stephan Büttner, Hans-Christoph Hobohm, Lars Müller; Handbuch Forschungsdatenmanagement,
    BOCK+HERCHEN Verlag, 2011.
  • Ilvio Bruder, Meike Klettke, Mark Lukas Möller, Frank Meyer, Andreas Heuer, Susanne Jürgensmann, Susanne Feistel; Daten wie Sand am Meer - Datenerhebung, -strukturierung, -management und Data Provenance für die Ostseeforschung. Datenbank-Spektrum 17(2): 183-196 (2017)
  • Ilvio Bruder, Andreas Heuer, Sebastian Schick, Sascha Spors; Konzepte für das Forschungsdatenmanagement an der Universität Rostock.
    LWDA 2017: 165-175 (2017)
  • James Cheney, Laura Chiticariu, Wang-Chiew Tan: Provenance in Databases: Why, How, and Where.
    Foundations and Trends in Databases, 1(4), S.379-474 (2009)
  • Boris Glavic: A Primer on Database Provenance.
    Technischer Bericht, Illinois Institute of Technology (2014)
  • Frank Meyer: Temporale Aspekte und Provenance-Anfragen im Umfeld des Forschungsdatenmanagements,
    Masterarbeit, Universität Rostock, Institut für Informatik, 2016
  • Mark Lukas Möller: Aufbau einer Forschungsdatenverwaltung für chemische und physikalische In-Situ-Daten aus der Ostsee,
    Bachelorarbeit, Universität Rostock, Institut für Informatik (2016)