Der Verein Info.Ro hat auch in diesem Jahr wieder eine herausragende Bachelor- sowie eine Masterarbeit gekührt. Jakob Zimmer überzeugt in der Kategorie "Beste Masterarbeit 2020/21". Er hat sich mit dem Thema "Datenintegration durch inverse Schemaabbildungen: Erweiterung der Rostocker GaLVE-Technik" beschäftigt. Herzlichen Glückwunsch an Jakob!
Für alle Neugierigen hier ein Ausschnitt aus Jakobs Arbeit: Bei einer herkömmlichen Datenintegration stehen global nur die Daten zur Verfügung, die man auch ins globale Schema abgebildet hat. Ebenso nachteilig ist, dass man für Anfragen an die globale Datenbank das neue globale Schema nutzen muss. So müssen nicht nur neue Anfragen an das neue Schema gestellt werden, sondern auch Legacy-Anwendungen umgeschrieben werden, wenn diese auch auf die Integra- tionsdaten in der globalen Datenbank zugreifen sollen. Diese Nachteile können mit einer Erweiterung der Quelldatenbanken der Datenintegration behoben werden. Mit dem in dieser Arbeit vorgestellten Konzept entwickeln wir ein GaLVE-Verfahren, das mit Hilfe von inversen Schemaabbildungen eine Datenintegration als Erweiterung lokaler relationaler Datenbanken umsetzt. Indem wir beliebige durch S-T TGDs formulierte Schemaabbildungen invertieren, erweitern und nachbereiten, erhalten wir eine um neue Tupel und interessante Attribute der globalen Datenbank erweiterte Quellinstanz unter einem erweiterten Quellschema. Bestehende Anfragen an dieses erweiterte Quellschema können wie gewohnt angewendet werden und haben direkten Zugriff auf die neuen Tupel. Neue Anfragen können weiterhin auf dem bekannten Quellschema entwickelt werden und dann bei Bedarf die neuen Attribute in der Erweiterung des Quellschemas nutzen. Besonders interessant an unserem GaLVE-Verfahren ist der auf der bisher erfolgten Forschung zur Invertierung von Schemaabbildungen aufbauende, einfache Invertierungsalgorithmus, der mit den Disjunktiven-Mengen eine abgewandelte Darstellung der disjunktiven TGDs liefert, welche gute Weiterverarbeitungsmöglichkeiten bieten. Für die Erweiterung der Quelldatenbanken und dessen Nachbereitung stellen wir mit den bEGDs eine ebenso interessante Möglichkeit der Bereinigung von inkonsistenten Integrationsdaten vor.
Die Arbeit selbst ist hier zu finden.