Abschlussarbeiten

Abschlussarbeiten werden immer mit Bezug zu den aktuellen Forschungsthemen des Lehrstuhls DBIS vergeben. Die genaue Aufgabenstellung entsteht im Dialog mit dem betreuenden Mitarbeiter, basierend auf den Interessen und Vorkenntnissen des Studierenden. Ihr könnt natürlich auch mit eigenen Themenvorstellungen an uns herantreten.

Bei Bachelor- und Masterarbeiten sind üblicherweise ein erfolgreicher Abschluss der Vorlesungen Datenbanken I und Datenbanken II Grundvoraussetzung für die Aufnahme einer Arbeit bei uns. Hilfreich wäre noch die Vorlesung Datenbank-Anwendungsprogrammierung.

Bei Masterarbeiten sind Vorlesungen aus der Vertiefung Informationssysteme Voraussetzung, etwa Datenbanken III oder Theorie relationaler Datenbanken, in bestimmten Projekten (Hydra) auch die Vorlesung Digitale Bibliotheken.

Abschlussarbeiten, die aktuell angeboten werden:

Themen von Meike Klettke

Im Themenbereich NoSQL-Daten, Schema-Management, Schema-Evolution sind jederzeit Abschlussarbeiten zu vergeben. Bitte vereinbaren Sie einen Termin (meike.klettke(at)uni-rostock(dot)de).

NoSQL-Benchmark für die Performancebewertung von Integritätsbedingungsableitung

Im Mittelpunkt dieser Abschlussarbeit steht die Entwicklung eines Benchmarks, der Verfahren zur Ableitung von Integritätsbedingungen (Schlüssel, funktionale Abhängigkeiten, Inklusionsabhängigkeiten, Fremdschlüssel) bezüglich ihrer Laufzeit bewerten kann.

Dieser Benchmark soll anhand der vorhandenen Implementierungen getestet werden.

Motivation des Themas:
Die Verfahren zur Ableitung der Integritätsbedingungen sind Reverse-Engineering Verfahren. In NoSQL-Datenbanken werden diese im Gegensatz zu relationalen Datenbanken nicht während des Entwurfsprozesses definiert und beim Einfügen und Verändern und Löschen von Datensätzen kontrolliert. Dennoch gelten solche Integritätsbedingungen häufig in den Daten, da viele NoSQL-Daten aus anderen Anwendungen heraus generiert werden und dabei bestimmten Mustern folgen. Das Ableiten von Integritätsbedingungen aus bereits vorhandenen NoSQL-Datenbanken kann durch Reverse-Engineering-Ansätze erfolgen. Hierfür liegen bereits Java-Implementierungen vor, die auch schon durch erste Beispiele getestet sind. Eine wichtige Frage ist die Effizienz dieser Verfahren, da sie auf großen Datenbeständen skalierbar ausgeführt werden sollen. Dafür soll ein Benchmark entwickelt werden, der geeignet ist, die Ableitung von Integritätsbedingungen aus NoSQL-Datenbanken zu testen und deren Performance zu bewerten.

Aufgabe:

Im Rahmen dieser Bachelorarbeit soll dafür folgende Aufgabe gelöst werden. 

  1. Einarbeitung in das Thema Anforderungen an Benchmarks und Testumgebungen
  2. Analyse von Benchmarks verwandter Gebiete (Benchmarks für relationale Datenbanken und NoSQL-Datenbank Benchmark für )
  3. Definition der Anforderungen an den Benchmark
  4. Erstellung des Benchmarks und Generierung von Beispieldaten
  5. Test des Benchmarks mit den vorhandenen Varianten der Java-Implementierungen

Literatur:

  • Professionalle Performance-tests
  • Benchmarks (rel)
  • YCSB-Benchmark

Projekt:

Die Bachelorarbeit ordnet sich in die Arbeiten zum DFG-Projekt Darwin ein, in dem das Thema „Schema-Management für NoSQL-Datenbanken“ im Mittelpunkt steht. Die Forschungsarbeiten werden zusammen mit der Hochschule Darmstadt und der OTH Regensburg durchgeführt.

Visualisierung von Schema-Versionen, NoSQL-Daten und Schema-Evolutionsoperationen

Visualisierung von Schema-Versionen, NoSQL-Daten und Schema-Evolutionsoperationen

Motivation des Themas:

Die schemalose Speicherung in NoSQL-Datenbanken bewirkt, dass in diesen häufig heterogene Datensätze gespeichert sind. Bei jeder Art der Verwendung oder Auswertung dieser Daten ist der erste Schritt „Understanding of the NoSQL Data“. Für diesen Schritt soll eine Visualisierung konzipiert und entwickelt werden. Bereits vorhanden sind Programme, die zu einer gegebenen NoSQL-Datenbank die Schemaversionen über die Zeit ableiten, diese stehen als JSON Schema bereit. Weiterhin sind bereits die Evolutions-operationen vorhanden, die die Änderungen von einer Version zu der Nachfolgerversion beschreiben. Diese Evolutionssprache enthält die Operationen add, delete, rename, copy und move. In einigen Fällen werden aus den Daten mehrere Varianten der Evolutionsoperationen abgeleitet, hier wird eine Benutzerentscheidung benötigt, welche ausgewählt werden soll. Visualisiert werden sollen die JSON-Schemata als relativ kompakte Graphen sowie die Evolutionsoperationen zwischen diesen. Optional können dazu ebenfalls beschriebene Merkmale zu den NoSQL-Daten und Beispiele aus diesen Daten dargestellt werden. Durch geeignete Techniken soll eine interaktive Exploration ermöglicht werden.

Aufgabe:

Im Rahmen dieser Bachelorarbeit soll dafür folgende Aufgabe gelöst werden.

  1. Einarbeitung in NoSQL (JSON) und JSON-Schema
  2. Literaturüberblick zur Visualisierung zeitveränderlicher Graphen
  3. Erstellung eines Anforderungskataloges für die interaktive Visualisierung
  4. Auswahl eines Visualisierungsverfahrens und prototypische Umsetzung
  5. Abfassung der schriftlichen Arbeit und Präsentation der Ergebnisse

Umsetzung:

  • Mongodb
  • Java oder JavaScript

Betreuer:

  • PD Dr.-Ing. habil. Christian Tominski
  • PD Dr.-Ing. habil. Meike Klettke

    Literatur:

    • JSON Schema, json-schema.org
    • Meike Klettke, Uta Störl, Stefanie Scherzinger: Schema Extraction and Structural Outlier Detection for NoSQL Data Stores. BTW 2015
    • Meike Klettke, Stefanie Scherzinger, Uta Störl: Datenbanken ohne Schema? - Herausforderungen und Lösungs-Strategien in der agilen Anwendungsentwicklung mit schema-flexiblen NoSQL-Datenbanksystemen. Datenbank-Spektrum 14(2): 119-129
    • Aigner et al.: Visualization of Time-Oriented Data, Springer, 2011
    • Tominski et al.: CGV – An Interactive Graph Visualization System, Computers & Graphics 33(6), 2009
    • Hadlak et al.: A Survey of Multi-faceted Graph Visualization, EuroVis State-of-the-art-report, 2015

    Die Arbeit ordnet sich in die Arbeiten zu „Schema-Management für NoSQL-Datenbanken“ ein, die seit 2013 zusammen mit der Hochschule Darmstadt und der OTH Regensburg durchgeführt werden.