Multimediaserver der Universitätsbibliothek Potsdam
Informationsqualität
Prof. Dr Felix Naumann 2007-04-26
Title
Informationsqualität
Subject
Informationssystem / Qualität
Description
"Sowohl in kommerziellen als auch in wissenschaftlichen Datenbanken sind Daten von
niedriger Qualität allgegenwärtig. Das kann zu erheblichen wirtschaftlichen Problemen
führen", erläutert der 35-jährige Informatik-Professor und verweist zum Beispiel auf
Duplikate. Diese können entstehen, wenn in Unternehmen verschiedene Kundendatenbestände
zusammengefügt werden, aber die Integration mehrere Datensätze des gleichen Kunden
hinterlässt. "Solche doppelten Einträge zu finden, ist aus zwei Gründen schwierig: Zum
einen ist die Menge der Daten oft sehr groß, zum anderen können sich Einträge über die
gleiche Person leicht unterscheiden", beschreibt Prof. Naumann häufig auftretende
Probleme. In seiner Antrittsvorlesung will er zwei Lösungswege vorstellen: Erstens die
Definition geeigneter Ähnlichkeitsmaße und zweitens die Nutzung von Algorithmen, die es
vermeiden, jeden Datensatz mit jedem anderen zu vergleichen. Außerdem soll es um
grundlegende Aspekte der Verständlichkeit, Objektivität, Vollständigkeit und
Fehlerhaftigkeit von Daten gehen.