Dokument- und Anfragetransformation in föderierten Informationssystemen

Teilprojekt im DFG-Projekt MEFIS - Metadatengestützte föderierte Informationssysteme

Ziele

Ziel dieses Teilprojektes ist es, gemeinsame Anfragen auf unstrukturierte und semistrukturierte Daten auszuführen. Dazu bedarf es einerseits einer Anfrageveränderung und andererseits einer Transformation von Daten in Daten, angereichert um Metadaten, die in diesem Projektteil durch Structure Mining erzeugt werden. Die Arbeit wurde in drei Arbeitspakete gegliedert:

  • Gewinnung von Metadaten:

    Die Analyse von unstrukturierten und semistrukturierten Daten ist die Voraussetzung dafür, daß Anfragen an diese Daten gestellt werden können. Dies soll ein Structure Mining realisieren, das zwar nicht generalisiert aber für ausgewählte Anwendungsszenarios entwickelt wird. Im Falle semistrukturierter Daten wie XML-Daten gibt es zwar bereits 'tags' zur Fassung von Bedeutung, sie müssen jedoch für ihre Nutzung mit Ontologien und Quantifizierern, ID's usw. verknüpft werden, da sie nicht selbstbeschreibend sind.

  • Evolution von semistrukturierten Daten:

    Gleiche Informationen können im WWW in stark voneinander verschiedenen Formen vorliegen. Eine Abbildung in andere Formate ist daher unvermeidlich. Diese Transformation, für die eine Sprache entwickelt werden soll, bildet Dokumentendefinitionen vorhandener DTD's ineinander ab. Der Nutzer soll bei der Festlegung der Transformationsregeln unterstützt werden.

  • Anfragebearbeitung:

    Der zeitlich umfangreichste Teil beschäftigt sich mit der in diesem Umfeld notwendigen Anfragebearbeitung. Klassische föderierte Ansätze mit Schemaintegration und Konfliktlösung berücksichtigen die Eigenheiten der lokalen Anwendung nicht. Eine Anfragen sollen sowohl lokal als auch global gestellt werden. Dies erfordert eine Umsetzung in die Sprache der Föderationsschicht und daraufhin in die lokale Anfragesprache des angefragten Datenbestandes und zurück. Das Problem der unterschiedlich "starken" Anfragemechanismen soll mittels zusätzlicher auch gewonnener Metadaten günstig beeinflusst werden. Ebenso sind über die üblichen hinausgehende Metadaten nützlich, um Konflikte zwischen Schemata zu lösen und die Qualität der angefragten Daten in die Anfragestellung einzubeziehen.