Datenbanken III (DB III) (SS, ILV 4 SWS, 6 Leistungspunkte)

Aktuelles zur Veranstaltung im StudIP

Die Vorlesung "Datenbanken III" vertieft die Vorlesung "Datenbanken II" aus dem Bachelor-Studium.  Mit wechselnden, auf neue Entwicklungen hin angepassten Inhalten werden insbesondere folgende Teilthemen vertieft:

  • Verteilte und parallele Datenbanken: hier werden bisher zentral gespeicherte Datenbestände auf verschiedene Rechnerknoten horizontal und vertikal verteilt. Die Auswirkungen auf Entwurfsprinzipien, Transaktionsverfahren, Sperrprotokolle und Anfrageoptimierung werden erläutert.
  • Informationsintegration: statt eine Datenbank zentral und homogen zu planen, wird hier das Problem der Integration autonom und heterogen entstandener Datenbanken erläutert. Dabei wird zwischen materialisierter Integration und virtueller Föderation von Datenbanken unterschieden.
  • Stromdatenverarbeitung: Bei der Verarbeitung von Sensordaten im Internet der Dinge oder in wissenschaftlichen Großversuchen werden sekündlich neue Daten erzeugt, die verarbeitet werden müssen. Herkömmliche Datenbanktechniken sind hier überfordert. In der Vorlesung werden Konzepte des Stromdatenmanagements diskutiert, das solche Datenströme filtern, verdichten und analysieren kann.

Inhalt im Sommersemester 2017

1. Datenintegration und -föderation

  • Verteilung, Autonomie, Heterogenität, Transparenz
  • Integration, Föderation, Migration, FusionDatenmodelle und Anfragesprachen
  • Architekturen
  • Schemaintegration, Schema Mapping, Schema Matching
  • Föderierte Anfragen: LaV, GaV, ...
  • Semantische Integration: Ontologien, Semantic Web
  • Datenintegration: Cleaning, Duplikaterkennung, ..

2. Verteilte und parallele Datenbanken

  • Verteilter Entwurf
  • Verteilte Anfragen
  • Verteilte Transaktionen
  • NoSQL: Sharding
  • MapReduce: Anwendungen aus Big Data Analytics?
  • Systeme: NoSQL, Hadoop, Spark
  • Replikation / Konsistenz

3. Cloud-Datenbanken und Stromdatenbanken

  • Cloud-Datenbanken
  • Stromdatenverarbeitung

Literatur

  • Ulf Leser, Felix Naumann: Informationsintegration. dpunkt, 2006.
  • Erhard Rahm, Gunter Saake, Kai-Uwe Sattler: Verteiltes und Paralleles Datenmanagement – Von verteilten Datenbanken zu Big Data und Cloud. Springer Vieweg, 2015.
  • M. Tamer Ozsu, Patrick Valduriez: Principles of Distributed Database Systems, Third Edition, Springer, 2011.

Allgemeine Angaben

Modulbezeichnung Datenbanken III
Modulnummer 23539
Modulverantwortlich Professur Datenbank- und Informationssysteme
Sprache Das Modul wird in deutscher Sprache angeboten.
Präsenzlehre Vorlesung 3 SWS
Übung 1 SWS
Leistungspunkte Nach bestandener Modulprüfung werden 6 Leistungspunkte vergeben.