Data Science (Informationssysteme und -dienste)
(WS, ILV 4 SWS, 6 Leistungspunkte)
In der Veranstaltung werden Techniken behandelt, die relationale Datenbanksysteme ergänzen oder ersetzen, um anwendungsorientierte Informationssysteme aufzubauen. Diese Informationssysteme sollen
- strukturierte bis unstrukturierte Daten
- homogenisieren und integrieren
- mit verschiedensten Methoden analysieren
- und die Ergebnisse sowohl rechtlich absichern, nachvollziehbar machen als auch interpretieren.
Die Vorlesung besteht aus folgenden Kapiteln:
- Vorspann:
- Kapitel 0: Einleitung, Historie, Anwendungsszenarien
- Teil A: Daten
- Kapitel 1: Daten: strukturiert bis semistrukturiert; Bsp.: XML / JSON
- Kapitel 2: Daten: unstrukturiert; Bsp.: Text / Graphen
- Teil B: Vorbereitung
- Kapitel 3: Datenvorbereitung; Datenintegration, Homogenisierung; Strukturerkennung, Cleaning
- Teil C: Analyse
- Kapitel 4: Analytical Processing; Aggregate, Mehrdimensionalität, dynamische Fenster; Weitere statistische Datenanalyse, Matrixoperationen
- Kapitel 5: Mining; Kategorisierung, Klassifizierung, Clustering; Assoziationen; Vorhersage; Maschinelles Lernen; Neuronale Netze, Deep Learning
- Kapitel 6: Big Data Analytics; Prinzip Map / Reduce; Prinzip parallele Datenflussprogrammierung; Prinzip parallele Datenbanken; Beispiele: Big Matrix, Big Graph
- Teil D: Nachbereitung und Rahmenbedingungen
- Kapitel 7: Nachbereitung und Rahmenbedingungen; Privacy und Provenance
- Teil E: Data Engineering
- Kapitel 8: Data Engineering; Tools Datenverwaltung, Datenauswertung, Datenanalyse; Hardwareumgebung: Cluster, SIMD, Sensornetzwerke; Verteilung und Parallelisierung
Die Veranstaltung wird mit Übungen und Rechnerübungen für jedes Kapitel (von 1 bis 7) ergänzt. Die Rechnerübungen finden in zwei verschiedenen Versionen statt: eine Übungsgruppe besteht aus den IEF-Studenten (Informatik, Wirtschaftsinformatik, IT/TI), eine zweite Gruppe aus Nicht-IEF-Studenten (etwa Wirtschaftspädagogik, Dienstleistungsmanagement, Umweltingenieurwesen, ...).