Data Science (Informationssysteme und -dienste)

(WS, ILV 4 SWS, 6 Leistungspunkte)

In der Veranstaltung werden Techniken behandelt, die relationale Datenbanksysteme ergänzen oder ersetzen, um anwendungsorientierte Informationssysteme aufzubauen. Diese Informationssysteme sollen

  • strukturierte bis unstrukturierte Daten
  • homogenisieren und integrieren
  • mit verschiedensten Methoden analysieren
  • und die Ergebnisse sowohl rechtlich absichern, nachvollziehbar machen als auch interpretieren.

Die Vorlesung besteht aus folgenden Kapiteln:

  • Vorspann:
    • Kapitel 0: Einleitung, Historie, Anwendungsszenarien
  • Teil A: Daten
    • Kapitel 1: Daten: strukturiert bis semistrukturiert; Bsp.: XML / JSON
    • Kapitel 2: Daten: unstrukturiert; Bsp.: Text / Graphen
  • Teil B: Vorbereitung
    • Kapitel 3: Datenvorbereitung; Datenintegration, Homogenisierung; Strukturerkennung, Cleaning
  • Teil C: Analyse
    • Kapitel 4: Analytical Processing; Aggregate, Mehrdimensionalität, dynamische Fenster; Weitere statistische Datenanalyse, Matrixoperationen
    • Kapitel 5: Mining; Kategorisierung, Klassifizierung, Clustering; Assoziationen; Vorhersage; Maschinelles Lernen; Neuronale Netze, Deep Learning
    • Kapitel 6: Big Data Analytics; Prinzip Map / Reduce; Prinzip parallele Datenflussprogrammierung; Prinzip parallele Datenbanken; Beispiele: Big Matrix, Big Graph
  • Teil D: Nachbereitung und Rahmenbedingungen
    • Kapitel 7: Nachbereitung und Rahmenbedingungen; Privacy und Provenance
  • Teil E: Data Engineering
    • Kapitel 8: Data Engineering; Tools Datenverwaltung, Datenauswertung, Datenanalyse; Hardwareumgebung: Cluster, SIMD, Sensornetzwerke; Verteilung und Parallelisierung

Die Veranstaltung wird mit Übungen und Rechnerübungen für jedes Kapitel (von 1 bis 7) ergänzt. Die Rechnerübungen finden in zwei verschiedenen Versionen statt: eine Übungsgruppe besteht aus den IEF-Studenten (Informatik, Wirtschaftsinformatik, IT/TI), eine zweite Gruppe aus Nicht-IEF-Studenten (etwa Wirtschaftspädagogik, Dienstleistungsmanagement, Umweltingenieurwesen, ...).