Dipl.-Finanzwirt (FH) Nikolaus Zöllner
Die Ergebnisse des ersten Data Profilings führen zu Berichtigungen in den Quelldaten durch Mitglieder des Projektteams. Grundlage hierfür sind die Analyseergebnisse des Controllings; insbesondere die einzelnen, markierten Datensätze, die als fehlerhaft identifiziert wurden. Die Bereinigung erfolgt unter Einbezug der jeweiligen Sachbearbeiter, um bereits in diesem Stadium das Bewusstsein für korrekte Datenbestände zu erhöhen.
Vor den Änderungen an den Quelldaten ist eine vollständige Sicherung der Daten zu erstellen. Dadurch kann jederzeit der Zustand vor Bereinigung der Daten im Notfall wiederhergestellt werden. Zudem werden alle Änderungen zur späteren Nachvollziehbarkeit dokumentiert.
Die Bereinigung erfolgt systematisch und orientiert sich an den eingeteilten Fehlerkategorien. In einem ersten Schritt werden fehlerhafte Datensätze gelöscht, die nicht mehr korrigiert werden können. In einem zweiten Schritt werden Duplikate eliminiert. Im Anschluss erfolgen die Korrekturen, die ein Herleiten der fehlenden oder falschen Werte aus Referenzdatenbeständen erfordern. Da die Herleitung in zahlreichen Fällen zum Einsatz kommt, bedient sich das Projektteam für das maschinelle Nachschlagen der korrekten Werte in den Referenzdatenbeständen der Tabellenkalkulationsformel "XVERWEIS".
Tabellenkalkulationsformel XVERWEIS
Die Formel "XVERWEIS" findet Anwendung, wenn Elemente anhand eines (übereinstimmenden) Suchkriteriums in einer vorhandenen Tabelle gesucht werden. Sofern in einer Liste lediglich Debitorennummern vorhanden sind, können mittels XVERWEIS anhand des Suchkriteriums Debitorennummer in einer Kundentabelle, die ebenfalls Debitorennummern aufweist, andere Spaltenwerte (z. B. Debitorenname oder Anschriftsdaten) automatisiert herausgelesen werden. Diese Funktion automatisiert das mühsame manuelle Suchen in anderen Tabellen.
Im Rahmen der Datenbereinigung erfolgt zum Abschluss die Betrachtung der markierten Datensätze, die einer manuellen Verifizierung bedürfen.
Manuelle Verifizierung der Telefonnummer +49 (5412) 231
Die Analyse durch das Controlling hat die Telefonnummer eines Lieferanten als fehlerhaft markiert, da sie zwar im korrekten Format vorhanden war, die Anschlussnummer jedoch nur aus drei Stellen bestand. Eine manuelle Überprüfung hat ergeben, dass die Telefonnummer entgegen der Schlussfolgerung aus der ursprünglichen Analyse korrekt ist. Es handelte sich um einen langjährigen Telefonanschluss aus Zeiten, in denen noch dreistellige Telefonnummern in dem betroffenen Anschlussbereich vergeben wurden. Da der Anschluss über einen langen Zeitraum nicht gekündigt wurde, blieb die dreistellige Telefonnummer erhalten, obwohl zwischenzeitlich in dieser Region mindestens fünfstellige Telefonnummern üblich sind.
Sofern die Korrektheit der Telefonnummern nicht durch einen Abgleich mit verifizierten Datenbeständen erfolgen kann, ist im Einzelfall auch eine herkömmliche, traditionelle Überprüfung wirksam: Anrufen und nachfragen!