Digitale Bibliotheken und Multimedia-Information-Retrieval (DigBib/MMIR) (WS, ILV 4 SWS, 6 Leistungspunkte)

Aktuelles zur Veranstaltung im StudIP

DigBib/MMIR ist eine Veranstaltung im Informatik-Master, die für jedes Informatik-Modul im Bereich "Praktische Informatik" oder in der Vertiefung "Informationssysteme" gewählt werden kann. Die Veranstaltung ist auch als Wahlmodul in einigen Nicht-Informatik-Studiengängen der MNF, AUF und WSF wählbar. Der Teil „Digitale Bibliotheken“ betrifft die Verwaltung elektronischer Dokumente, der Teil „Multimedia-Information-Retrieval“ die inhaltsbasierte Suche nach Texten, Bildern, Video-Dateien und Audio-Dateien. Organisatorisch besteht die Veranstaltung aus 3 Stunden Vorlesung und 1 Stunde Übung. Man erreicht mit der Veranstaltung 6 Leistungspunkte.

Wir behandeln inhaltlich die Weiterentwicklung relationaler Datenbanksysteme zu Systemen, die komplexere Dokumente statt einfacher Tabellen langfristig verwalten können. Im ersten Teil der Vorlesung wird es insbesondere um die Verwaltung von Text-Dokumenten und ihre Beschreibung mit Metadaten gehen. Wir werden neben den Standards für digitale, wissenschaftliche Bibliotheken auch auf Anforderungen für die Verwaltung von Consumer-Bibliotheken wie elektronischen Zeitschriften und elektronischen Büchern eingehen. Die behandelten Teilprobleme reichen bis zur Integration von Forschungsdaten (Messdaten) in die Dokumente, in die Langzeitarchivierung und in rechtliche Probleme bei der Speicherung und Verbreitung von fremden Dokumenten oder selbst erstellten Fotos (Urheberrecht, Recht auf Privatkopie, Recht am eigenen Bild).  Daneben werden wir uns im Rahmen von Web-Dokumenten um die Suche nach Texten kümmern, etwa im Rahmen von Information-Retrieval-Werkzeugen wie Lucene / Solr und Suchmaschinen wie Google.

Im zweiten Teil der Vorlesung werden wir uns um Multimedia-Dokumente kümmern, d.h. um Bilder, Audio (etwa Musik), Video oder Geo-Informationen (räumliche Daten wie Landkarten). Ausgehend von relationalen Datenbanksystemen werden bereits im SQL:1999-Standard Konzepte eingeführt, um solche Multimedia-Objekte zu modellieren, zu komprimieren und nach ihnen suchen zu können. An Beispielen wie Musik und räumlichen Daten werden diese Konzepte erläutert.  Grundlegend werden dazu Konzepte der inhaltsbasierten Suche wie Ähnlichkeitsmasse, Abstandsfunktionen, Eigenschaften metrischer Räume behandelt. Neben der Effektivität der Suche spielt auch die Effizienz eine Rolle.  Dazu werden ausgewählte Suchstrukturen und -verfahren für  nieder- und hochdimensionalen Suchräumen behandelt.

Das Modul hat 6 Punkte, die Punkte erhält man nach einer mündlichen 20-Minuten-Prüfung. Voraussetzung ist Datenbanken I (relationale Datenbanken) oder alternativ Datenbanken für Anwender. Wer ISID (Informationssysteme und -dienste) im Bachelor besucht hat, hat die Einleitungen zu Digitalen Bibliotheken und Textsuche bereits gehört (die ISID-Anteile werden aber in DigBib/MMIR in einer Crash-Woche nachgeholt, ISID ist also zwar empfohlen, aber nicht unbedingte nicht Voraussetzung für DigBib/MMIR).

In den Übungen werden konkret Suchwerkzeuge und Systeme für Digitale Bibliotheken erklärt, demonstriert und benutzt. Weiterhin wird es für Informatiker Übungen für das Multimedia-Information-Retrieval geben, für Nicht-Informatiker auch Übungsaufgaben zur Beurteilung und zum Vergleich von Consumer-Bibliotheken.