Dipl.-Finanzwirt (FH) Nikolaus Zöllner
Um eine Bewertung der Datenqualität mit der äußerst subjektiven Frage "wie schätzen Sie die Datenqualität auf einer Skala von 1 bis 10 ein?" zu vermeiden, ist ein zuverlässiges Messsystem für den Zustand und die Entwicklung der Datenqualität erforderlich. Ohne ein solches System ist ein regelmäßiges "Data Monitoring" (Datenüberwachung) nicht sinnvoll. Die Herausforderungen, die Datenqualität und die Zielerreichung von Optimierungsmaßnahmen über Kennzahlen zu erfassen, sind weitaus höher als z. B. bei der klassischen Bilanzanalyse.
Verhältnis- oder Prozentwerte sind Klassiker unter den Kennzahlen. Dabei werden bestimmte zählbare Werte in Relation zu einer Gesamtheit von diesen Werten gesetzt. Kennzahlen können aber auch ohne Relationen auskommen, indem z. B. lediglich ein absoluter Wert einer definierten Ausprägung betrachtet wird. Gilt es, einen Sollzustand zu definieren, können ebenfalls absolute oder relative Werte verwendet werden. Basis kann in diesem Fall der (durchschnittliche oder beste) Ist-Zustand eines vorgegebenen Zeitraums (Vormonatswert, Halbjahreswert, Vorjahreswert) sein. Dabei muss nicht zwangsläufig der originäre Datenbestand verwendet werden, auch externe Datenquellen können für Kennzahlen zur Messung der Datenqualität herangezogen werden.
Externe Quellen für Messgrößen zur Datenqualität
Die IT-Abteilung eines Unternehmens betreibt ein Ticketsystem zur Erfassung, Bearbeitung und Dokumentation von Supportanfragen. Dabei werden bestimmte Kategorien der User-Anfragen für statistische Zwecke erfasst. Mit der Einführung eines unternehmensweiten Datenqualitätsprojektes wurde die Kategorie "Mangelhafte Datenqualität" eingeführt und erfasst. Durch die Auswertung der Anzahl von Supportfällen, die dieser Kategorie zugeordnet werden konnten, erhält das Unternehmen eine von mehreren Kennzahlen zur Messung der Datenqualität.
4.1 Kennzahlen-Kategorien
Kennzahlen für die Datenqualität lassen sich grundsätzlich in drei Kategorien einteilen.
4.1.1 Formal-technische Kennzahlen
Die Berechnung von formal-technischen Kennzahlen erfolgt i. d. R. systemseitig durch einfache Datenabfragen unterschiedlicher Datenbereiche.
Anzahl fehlerhafter Anrede-Felder
In den Debitorenstammdaten ist ein Anrede-Feld als Freitextfeld für die Ansprache im Rahmen der Korrespondenz zu befüllen. Für die Eingabe der zulässigen Werte in dieses Feld wurden intern Vorgaben gemacht. Die Anzahl der Stammdaten mit nicht konformen Einträgen wird als Kennzahl geführt.
4.1.2 Inhaltliche Kennzahlen
Inhaltliche Kennzahlen analysieren komplexere Regelwerke und unterstützen durch die tiefergehenden Resultate vornehmlich die Fachabteilungen. Die Definition der anzuwendenden Regelwerke – als Grundlage für die inhaltlichen Kennzahlen – sollte daher in enger Zusammenarbeit mit den Fachabteilungen erfolgen.
Häufigkeit von Datumswerten
In den Stammdaten sind verschiedene Datumseingaben erforderlich, unter anderem Geburtstagsdaten. Die Häufigkeit der Ausprägungen dieser Geburtstagsdaten wird als Kennzahl ausgegeben. Ungewöhnlich hohe Werte können somit ein Hinweis auf fehlerhafte Eingaben sein. Ist z. B. der 01.01.1900 häufig vertreten, liegt der Verdacht nahe, dass mehrfach ein tatsächliches Geburtsdatum bei der Dateneingabe nicht vorlag und vom Sachbearbeiter ein fiktives, ihm geläufiges Datum eingegeben wurde.
4.1.3 Qualitative Kennzahlen
Da nicht alle Ausprägungen von Datenqualitätskriterien quantitativ erfassbar sind, müssen bestimmte Kennzahlen durch qualitative Verfahren, wie z. B. die Befragung von Anwendern, ermittelt werden. Sofern die Einschätzung der Befragten nachvollziehbar und begründbar ist, kann als Ergebnis eine kennzahlentechnische Einstufung des Kriteriums erfolgen.
Begründung in Freitextfeld
Bei der Dateneingabe kann die Eingabe eines bestimmten Wertes unterbleiben, wenn der Sachbearbeiter in einem Freitextfeld eine individuelle Begründung eingibt. Ob die Begründungen nachvollziehbar und ausreichend sind, kann durch ein automatisiertes Auswertungssystem nicht zuverlässig festgestellt werden. Mitarbeiter der Fachabteilungen müssen die Fälle mit Eingaben in das Freitextfeld manuell prüfen und bewerten; ausgenommen sind erkennbare, sinnlose Eingaben wie "abc", "–" oder Leerzeichen.
4.2 Kennzahlen-Dokumentation
Sobald ein Unternehmen die für die individuellen Datenqualitätskriterien relevanten Kennzahlen erarbeitet hat – ggf. in Abstimmung und Zusammenarbeit mit den Fachabteilungen – empfiehlt es sich, diese genau zu dokumentieren. Damit wird sichergestellt, dass auch dezentral verwendete Kennzahlen einheitlich betrachtet werden und vergleichbare Ergebnisse liefern. Im Folgenden ist eine beispielhafte Dokumentation einer Datenqualitätskennzahl dargestellt. Diese kann bei Bedarf an unternehmensspezifische Besonderheiten angepasst werden.
Angabe |
Beschreibung |
Beispiel |
Datum |
Datum der Kennzahlen-Definition |
24.09.2020 |
Kennzahlen-Name |
unterscheidbare und eindeutige Angabe eines Namens für die Kennzahl |
Anrede |
Kurzbeschreibung |
kurze aber prägnante Beschreibung der Kennzahl |
absoluter Wert der fehlerhaften Eingaben im Datensatzfeld "Anrede" in den... |