Benchmarking von Graph-Datenbanken

Masterarbeit, gegebenenfalls auch als BA

Betreuer / Ansprechpartner

  • Holger Meyer,
  • Alf-Christian Schering

    Charakter

      • Darstellung State of the Art,
      • Konzeption,
      • prototypische Implementierung

      Vorkenntnisse

      • Datenbanken I
      • Datenbanken II und III wünschenswert

      Beschreibung

      Die Leistungsbewertung von Datenbanksystemen ist nicht nur für die Auswahl eines  geeigneten Systems in der Anwendungsentwicklung wichtig. Vielmehr bieten Benchmarks eine gute Basis zur Evaluierung von neu entwickelten Anfrageoperatoren oder Optimierungstechniken.

      Für Graph-Datenbanken ist eine Übersicht zu existierenden Benchmarks zu schaffen und deren Nutzung zur Bewertung eines Hypergraph-DBMS zu untersuchen. Ziel soll die Entwicklung eines eigenständigen Benchmarks für k-Nachbarschafts-, k-Shortest-Path- und Synopisis-Operatoren im WossiDiA-System sein.

      Das WossiDiA-System benutzt semi-strukturierte Daten (XML) und Hypergraphstrukturen zur Darstellung der komplexe Vernetzung der Inhalte. Mit dem System steht ein Hypergraph mit mehreren Millionen Knoten und Hyperkanten als Testkorpus bereit, der entsprechend aufzubereiten wäre.

      Arbeitsschritte

      • Recherche, Aufbereitung und Klassifikation existierender Ansätze zum Benchmarking von Graphalgorithmen und Graphdatenbankn im speziellen; Darstellung des State-of-the-Art
      • Kritische Bewertung existierender Benchmarking-Ansätze zur Analyse des WossiDiA-Systems
      • Erstellung eines Benchmarks zur Performance-Messung typischer Graphoperationen auf dem WossiDiA-Hypergraphen
      • Die prototypische Umsetzung soll im Rahmen des WossiDiA-Systems erfolgen

      Technologien

      • Graph-Mining-Framrworks: Apache Spark/GraphX, Flink, Gradoop
      • NoSQL/Graphdatenbanken und Hypergraphen

      Literatur

      1. Dominguez-Sal, David, et al. "Survey of graph database performance on the hpc scalable graph analysis benchmark." Web-Age Information Management. Springer Berlin Heidelberg, 2010. 37-48.
      2. Jouili, Salim, and Valentin Vansteenberghe. "An empirical comparison of graph databases." Social Computing (SocialCom), 2013 International Conference on. IEEE, 2013.
      3. De Santo, Massimo, et al. "A large database of graphs and its use for benchmarking graph isomorphism algorithms." Pattern Recognition Letters 24.8 (2003): 1067-1079.
      4. Holger Meyer, Alf-Christian Schering and Christoph Schmitt, WossiDiA --- The Digital Wossidlo Archive, in: Holger Meyer, Christoph Schmitt, Thomas Jansen and Alf-Christian Schering (Hrsg.), Corpora ethnographica online --- Strategien der Digitalisierung kultureller Archive und ihrer Präsentation im Internet, Volume 5 of Rostocker Beiträge zur Volkskunde und Kulturgeschichte, Waxmann, 2014, 61--84.