Dipl.-Finanzwirt (FH) Nikolaus Zöllner
Bei der Ziffern-Gleichverteilung wird davon ausgegangen, dass alle Ziffern (0 bis 9) in einem niederwertigen Zahlenbereich eines nicht manipulierten Datenbestands mit der gleichen Wahrscheinlichkeit von ca. 10 % auftreten. Für eine Verprobung im Rahmen der Ziffern-Gleichverteilung ist es wichtig, alle Werte an der gleichen Stelle auszuwerten – beispielsweise die Stellen vor und nach dem Komma einer Dezimalzahl. Abweichungen von der Referenzgröße 10 % können Hinweise auf Manipulationen oder anderweitige Fehler in den Datenbeständen sein.
Ziffern-Gleichverteilung der Kassenbuchungen
Der Buchhalter der Equal Number GmbH & Co. KG, ein im Einzelhandel tätiges Unternehmen, möchte die gesamten Kassenbuchungen des Jahres 01 verproben. In einem ersten Schritt werden die Ziffern hinter der Kommastelle auf Gleichverteilung überprüft. Folgende Ergebnisse wurden ermittelt:
Ziffer |
Häufigkeit |
Anteil in % |
0 |
483 |
9,0 % |
1 |
487 |
9,1 % |
2 |
512 |
9,5 % |
3 |
499 |
9,3 % |
4 |
543 |
10,1 % |
5 |
492 |
9,2 % |
6 |
765 |
14,3 % =>auffällig hoher Anteil |
7 |
477 |
8,9 % |
8 |
502 |
9,4 % |
9 |
604 |
11,3 % |
Der Anteil der Ziffer "6" in der Gleichverteilung ist auffällig höher und sollte daher Anlass für weitere, detailliertere Prüfungen sein.
Nicht alle Datensätze sind für eine sinnvolle Auswertung nach der Ziffern-Gleichverteilung geeignet. Sind automatisierte Rundungen angewendet worden oder greift die Auswertung auf Summen (z. B. Tagesumsätze eines Kassensystems), deren Einzelwerte Regelmäßigkeiten (z. B. Preise enden einheitlich auf 0 oder 5) aufweisen, wird die natürliche Gleichverteilung beeinflusst.
Für eine Auswertung einer Zahlenkolonne nach der Ziffern-Gleichverteilung ist keine Spezialsoftware nötig; eine Tabellenkalkulationssoftware leistet hier auch gute Dienste. Für die Extraktion der ersten Ziffer nach dem Komma sind i. d. R. zwei Tabellenkalkulationsformeln zu kombinieren; die Namen der Formeln können je nach Softwareanbieter variieren:
Formel "Suchen"
Mit der Formel "Suchen" kann ein bestimmtes Zeichen in einer vorgegebenen Zeichenkette gesucht und deren Stelle ausgeben werden. Der Formelaufbau lautet: =Suchen (zu suchendes Zeichen; zu durchsuchende Zeichenkette; Position für den Beginn der Suche).
Steht beispielsweise in einer Zelle der Wert "123,4567", dann kann mit der Formel "Suchen" die Stelle des Kommas ermittelt werden, indem das zu suchende Zeichen "," (Komma) lautet, die zu durchsuchende Zeichenkette "123,4567" ist und ab der ersten Stelle gesucht werden soll. Unter der Annahme, dass der Wert "123,4567" in der Zelle "A1"" steht, heißt dies in der Formelsprache:
=Suchen (","; A1;1)
Formel "Teil"
Die Formel "Teil" gibt aus einer Zeichenfolge eine bestimmte Anzahl an Zeichen ab einer vorgegebenen Stelle zurück. Der Formelaufbau lautet: =Teil (Zeichenfolge; Stelle des ersten auszulesenden Zeichens; Anzahl der auszulesenden Zeichen).
Steht beispielsweise in einer Zelle der Wert "123,4567", dann kann mit der Formel "Teil" die Ziffer "4" extrahiert werden, indem exakt ein Zeichen nach der Position des Kommas (4. Stelle + 1) ausgelesen wird. Unter der Annahme, dass der Wert "123,4567" in der Zelle "A1" steht, heißt dies in der Formelsprache:
=Teil (A1;5;1)
Kombination beider Formeln
Wenn nun bei einer Vielzahl von unterschiedlichen Werten jeweils eine fest definierte Stelle nach dem Komma ausgelesen werden soll, können die beiden Formeln "Suchen" und "Teil" kombiniert werden. Mit "Suchen" wird die Stelle des Kommas eines beliebigen Werts ausgelesen, mit "Teil" ein Teil eines Werts ab einer bestimmten Position (Stelle des Kommas + 1, also der Stelle nach dem Komma) und Länge (1 Stelle) ausgegeben. In der Formelsprache heißt dies:
=Teil (A1; Suchen (","; A1;1)+1;1)