Effiziente Datenvorbereitung für Analysen in Automotive-Anwendungen

Efficient Data Preparation for Automotive Data Analytics

Student

  • Adrian Lutsch

Gutachter

  • Andreas Heuer 
  • Holger Meyer 

Betreuer / Ansprechpartner

  • Holger Meyer
  • Dennis Marten

Typ der Arbeit

  • Bachelorarbeit

Charakter der Arbeit

  • Erarbeitung State-of-the-Art
  • Konzeption
  • Prototypische Implementierung

Vorkenntnisse

  • Datenbanken
  • Parallelisierungstechniken und Algorithmen

Beschreibung

Die Entwicklung von Algorithmen zur Motorsteuerung erfordert umfangreiche Auswertungen vorgenommener Experimente, Beprobungen, Testläufe und bereits vorhandener Verfahren.   Dabei kommen heute Analyseumgebungen zum Einsatz wie Apache Zeppelin und Jupyter-Notebooks die Programmiersprachen wie Python, R oder Matlab mit Dokumentation der Algorithmen und Visualisierungen der Auswertungen kombinieren.

Im Rahmen eines Drittmittelprojektes mit einem Automotive-Dienstleister

soll auf Basis Jupyter, der Programmiersprache Python und evtl. dem Apache Zeppelin-Framework eine Anwendungsentwicklung unterstützt werden, die es erlaubt die Machine Learning und Parallelisierungsumgebung Apache Spark mit verschiedenen darunter liegenden Plattformen für die Datenverwaltung zu nutzen oder direkt Zugriff auf die Datenverwaltung für "typische" Auswertungen zu nutzen.

Neben der Konzipierung und Konfiguration eines geeigneten Software-Stacks sollen Ergebnisse aus der Performance-Bewertung verschiedene Datenhaltungssysteme einfliessen, da Apache Spark prinzipiell in der Lage ist Daten aus verschiedenen Subsystemen bereitgestellt zu bekommen.  Eine Systemauswahl (HDFS, HBase, Cassandra, PostgresXL, VectorH) wird im Rahmen der Arbeit vorgenommen. Um spätere Arbeiten zur Provenance zu ermöglichen sind Überlegungen zur geeigneten Ablage von Auswertungen (Notebooks) und Zwischenergebnissen in die Konzeption mit einzubeziehen.

Arbeitsschritte

  • Anforderungsanalyse typischer Vorgehensweisen bei der Entwicklung von Algorithmen  für Motorsteuerung
  • Recherche, Aufbereitung und Klassifikation existierender Analyse-Plattformen und deren Parallelisierungtechniken; Darstellung des State-of-the-Art
  • Kritische Bewertung der existierenden Frameworks und einer Plattform für den Einsatz auf dem vorhandenen RMDRF-Cluster im Rahmen des IAV-Projektes
  • Demonstration der Tauglichkeit anhand ausgewählter Fragestellungen auf dem IAV-Beispiel-Datensatz

Literatur

  • Guo, Hong, et al. "Automotive signal diagnostics using wavelets and machine learning." IEEE transactions on vehicular technology 49.5 (2000): 1650-1662.
  • Langley, Pat. "Machine learning for adaptive user interfaces." Annual Conference on Artificial Intelligence. Springer, Berlin, Heidelberg, 1997.
  • Kousidis, Spyridon, Thies Pfeiffer, and David Schlangen. "Mint. tools: Tools and adaptors supporting acquisition, annotation and analysis of multimodal corpora." Proceedings of Interspeech 2013 (2013).
  • Luckow, Andre, et al. "Deep learning in the automotive industry: Applications and tools." Big data (Big Data), 2016 IEEE international conference on. IEEE, 2016.