Datenbankintegration durch inverse Schemaabbildungen: Erweiterung der Rostocker GaLVE-Technik

(als Masterarbeit)

Betreuer / Ansprechpartner

  • Andreas Heuer
  • Tanja Auge

Charakter

  • Theoretische Grundlagen
  • Verfahrensentwicklung
  • evtl. prototypische Implementierung

Vorkenntnisse

  • DB I
  • DB II
  • DB III
  • TRDB

Beschreibung

Datenbankintegrationsverfahren bilden üblicherweise k lokale Datenbankschemata in euin integriertes, globales Datenbankschema ab. An diese (eventuell nur virtuell als Sicht vorhandene) globale Datenbank werden dann alle Anfragen gestellt, die auf die k gemeinsamen Datenbestände zugreifen sollen. In Rostock wurde dagegen eine Technik entwickelt, die die globale Datenbank als Erweiterung der k lokalen Datenbanken auffassen kann, so dass die k bisherigen Benutzergruppen in ihrer alten Struktur verbleiben und auch globale Anfragen an die alten Datenbanken (oder ihre Erweiterungen) gestellt werden können. Diese Technik wurde als Global-as-Local-View-Extension (GaLVE) eingeführt.

Leider hat die bisherige Integrationstechnik aus anwendungstechnischen Gründen (Medizin) bisher ein globales Datenbankmodel als Mediator verwendet, das sehr flexibel, aber ausdrucksschwach war (das schemaarme EAV-Modell: Entity-Attribute-Value). In dieser Masterarbeit soll das Integrationsverfahren auf das klassische Relationenmodell umgestellt werden. Auch die k lokalen Datenbankschemata sollen ausschließlich im relationalen Datenbankmodell dargestellt werden. In der Bachelor- oder Masterarbeit sollen zur Umsetzung die Grundlagen inverser Schemaabbildungen verwendet werden. Eine Grundtechnik zur Berechnung dieser ist der CHASE, der in Datenbanken II kurz als Erweiterung der Tableautechnik eingeführt wurde (dort zur Anfrageoptimierung), im Masterstudium im Rahmen der TRDB-Vorlesung ausführlich erläutert wurde.

Arbeitsschritte

  • Einarbeitung in das Gebiet: Grundlagen der Datenintegration, insbesondere Schemaabbildungen
  • Analyse der bisherigen GaLVE-Technik (Masterarbeit von Georgi Straube)
  • Literaturrecherche:
    • Techniken zur Berechnung inverser Schemaabbildungen
    • Anwendung des CHASE-Verfahrens, um als Ziel der inversen Abbildung eine Überdeckung der bisherigen Datenbank zu erreichen
  • Verfahrensentwicklung: Anwendung der inversen Schemaabbildungen und des CHASE auf GaLVE
  • Evtl. Prototypische Implementierung für einfache Teilfälle, als Demonstrator

Technologien

  • für evtl. prototypische Umsetzung passende Werkzeuge und Programmiersprachen

Literatur

  • Georgi Straube, Datenintegration für die "Global-as-local-view-extension"-Technik, Masterarbeit, Universität Rostock, 2013
  • Georgi Straube, Ilvio Bruder, Dortje Löper, Andreas Heuer: Data Integration in a Clinical Environment Using the Global-as-Local-View-Extension Technique, In: HIS-Konferenz 2014, Lecture Notes in Computer Science, Band 8423, Seiten 148—159, Springer, 2014
  • Fagin, R.; Kolaitis, P.G.; Popa, L.; Tan, W.C.: Schema mapping evolution through composition and inversion. In: Bellahsene, Z.; Bonifati, A.; Rahm, E. (Hrsg.): Schema Matching and Mapping, S. 191--222. Springer, 2011
  • Deutsch, A.; Hull, R.: Provenance-Directed Chase and Backchase. In: In Search of Elegance in the Theory and Practice of Computation, Band 8000, Lecture Notes in Computer Science, Seiten 227-236,  Springer-Verlag, Berlin Heidelberg, 2013
  • AnHai Doan, Alon Y. Halevy, Zachary G. Ives: Principles of Data Integration, Morgan Kaufmann, 2012 (Lehrbuch)