Der DQ-Navigator dient als Arbeitshilfe zum Umgang mit und zur Verbesserung von Datenqualität (DQ) für Anwendungen der Künstlichen Intelligenz (KI). Die eigenständige Beantwortung von und Auseinandersetzung mit ausgewählten, wissenschaftlich fundierten Fragen ermöglicht es den Nutzer:innen, die Qualität einzelner Datensätze für sich zu hinterfragen, zu diskutieren und Verbesserungspotentiale selbstständig herauszuarbeiten.
Der Inhalt des Fragenkatalogs basiert auf einer Metaanalyse verschiedener anerkannter wissenschaftlicher Publikationen, welche die Anforderungen an Daten(sätze) aus verschiedenen Perspektiven behandeln. Im Zuge der Metaanalyse wurden zudem DQ-Dimensionen (bspw. Diversität, Glaubwürdigkeit, Repräsentativität, Sicherheit und Transparenz) herausgearbeitet, die unterschiedliche Blickwinkel auf die Qualität von Daten ermöglichen. Jede Frage lässt sich bestimmten datensatzrelevanten Dimensionen zuordnen. Der DQ-Navigator bietet die Möglichkeit, durch die Auseinandersetzung mit dem Fragenkatalog Rückschlüsse auf die Qualität eines bestimmtes Datensatzes ziehen zu können oder DQ im Allgemeinen zu untersuchen.
Der Kern des DQ-Navigators ist ein Katalog von 126 Fragen zur selbständigen Bewertung von Datenqualität (DQ). Die Fragen sind als Anregung zu verstehen, bestimmte Qualitätsaspekt des eigenen Datensatzes zu hinterfragen. Der “Dimensionen”-Tab erklärt den für den Fragenkatalog wichtigen Begriff der Dimensionen und stellt die durch das Forschungsprojekt herausgearbeiteten DQ-relevanten Dimensionen vor. Jede Frage des Katalogs lässt sich einer oder mehreren datensatzrelevanten Dimensionen zuordnen und kann nach diesen Dimensionen gefiltert werden. Die Dimensionen des Fragenkatalogs werden darüber hinaus in Haupt- und Nebendimensionen unterteilt. Sofern die Dimensionen oder wortgleiche Begriffe bereits in Gesetzen aufgegriffen wurden, wird ein entsprechender Hinweis gegeben.
Um einen Überblick darüber zu erhalten, wie viele Fragen insgesamt und wie viele zu bestimmten Dimensionen behandelt wurden, steht im Tab “Fortschritt” eine Statistik zur Verfügung.
Angesichts der Komplexität der Thematik können durch die selbständige Nutzung des DQ-Navigators keine abschließenden Bewertungen einzelner Datensätze und somit keine konkreten Arbeitsergebnisse erzielt werden. Der Fragenkatalog ist nicht erschöpfend und beinhaltet lediglich die vom Forschungskonsortium im Rahmen der Metaanalyse verwendeten Quellen. Eine Erweiterung des Katalogs um weitere, datenqualitätsrelevante Fragen ist grundsätzlich möglich. Eine externe Bewertung der eigenen Einschätzung erfolgt nicht. Die Verwendung des DQ-Navigators lässt keinen sicheren Schluss auf die Einhaltung rechtlicher Vorschriften zu.