Tagesumsätze einer Filiale
Der Ausgangspunkt jeglicher Untersuchungen bildet der Test, ob eine gegebene Zahlenmenge tatsächlich eine Benford-Menge darstellt, denn nur in diesem Fall sind die nachfolgend vorgestellten Methoden anwendbar. Um die Arbeit möglichst praxisnah zu gestalten, soll das weitere Vorgehen an einem Fallbeispiel illustriert werden:
Die Filialen eines Unternehmens übermitteln täglich ihre jeweiligen Tagesumsätze in die Firmenzentrale. In der Zentrale wird vermutet, dass in der Filiale in Seehausen die Tagesumsätze regelmäßig manipuliert werden. Insgesamt besteht die Gesamtmenge der zu untersuchenden Tagesumsätze aller Filialen aus 1.400 Zahlen, wovon aus der Filiale Seehausen genau 250 Tagesumsätze zur Verfügung stehen. Es soll nun der mathematische Nachweis geführt werden, dass die Tagesumsätze der Filiale tatsächlich manipuliert worden sind.
Fallbeispiel mit MS-Excel
Die hier zugehörigen Zahlen sind in den zwei Excel-Dateien „ZA_Gesamt” und „ZA_Filiale” auf der beiliegenden CD hinterlegt. Beide Dateien sind gleich aufgebaut, sodass alle Erläuterungen in diesem Abschnitt nur am Beispiel der Excel-Datei „ZA_Gesamt” durchgeführt werden. Für die Datei „ZA_Filiale” gelten alle Aussagen analog.
Als Anfangspunkt für die Untersuchungen der Menge der Tagesumsätze bietet sich eine grafische Auswertung der Anfangsziffern an. Hierbei ist zunächst jeweils eine Auszählung der ersten Ziffern sowie der ersten beiden Ziffern in der Menge der Tagesumsätze notwendig. Die beobachteten absoluten Häufigkeiten für jede Ziffer bzw. für jede mögliche Ziffernkombination können anschließend durch die Anzahl der Tagesumsätze geteilt werden, was zu den beobachteten relativen Häufigkeiten führt, die mit den zu erwarteten Benford-Profilen, d.h. den theoretischen Häufigkeiten, verglichen werden. Bereits die grafische Analyse der Anfangsziffern führt häufig zu ersten tieferen Erkenntnissen und Ansatzpunkten für weitere Analysen.
Arbeitsblatt „Rohdaten”
Die Ausgangsdaten, d.h. in unserem Beispiel die gesamten Tagesumsätze, stehen in den Zellen A1 – A1400 in einem eigenen Arbeitsblatt mit der Bezeichnung „Rohdaten”. Da eine gemeinsame Excel-Datei für mehrere Benford-Tests gleichzeitig entwickelt wurde, speziell für einen Anpassungstest und den Test über den Distorsion-Faktor, müssen zunächst die Rohdaten von Zahlen bereinigt werden, die kleiner als 10 sind, d.h. diejenigen Daten, die nicht mindestens zwei Vorkommastellen besitzen. In unserem Beispiel ist dies bereits geschehen.
Arbeitsblatt „Zwischenrechnung”
Ausgehend von diesen bereinigten Rohdaten werden Tagesumsätze nochmals in die Spalte A des Arbeitsblatts „Zwischenrechnung” kopiert, indem in das Feld A1 des Arbeitsblatts „Zwischenrechnung” der Eintrag = Rohdaten!A1 vorgenommen wird. Nach einem Doppelklicken auf das schwarze Rechteck am rechten unteren Rand des Feldes A1 werden die gesamten 1.400 Werte der Tagesumsätze in das Arbeitsblatt „Zwischenrechnung” übertragen.
Berechnung Anfangsziffern
In der Spalte B „Zwischenrechnung” wird dann die Kommastelle hinter die zweite Stelle jeder Zahl aus der Spalte A verschoben, indem in das Feld B1 die Formel:
= GANZZAHL(ABS(A1)/10^(GANZZAHL(LOG(ABS(A1)))-1)) |
eingetragen wird. Anschließend wird wieder die gesamte Spalte B durch Doppelklicken auf das rechte untere Rechteck in B1 ausfüllt. Nun erscheinen in der Spalte B nur noch die anfänglichen Ziffernkombinationen 10, 11, ... , 99 der Zahlen der Spalte A. Die Spalte C wird zur Berechnung der Anfangsziffer der Tagesumsätze der Spalte A verwendet, indem man in das Feld C1 die Formel = GANZZAHL(B1/10) einträgt und diese in bekannter Weise in die gesamte Spalte C kopiert. Nun erscheinen die entsprechenden Anfangsziffern 1, 2, ... , 9 der Zahlen der Spalte A in dieser Spalte.
Histogramme
Die Auszählung der absoluten Häufigkeiten der Anfangsziffern erfolgt in Form von Histogrammen in zwei weiteren Arbeitsblättern, die die Bezeichnungen Histo_12Z für die Auszählung der Anfangszahlen 10 bis 99 und Histo_1Z für die Auszählung der Anfangsziffern 1 bis 9 tragen. Beide Histogrammblätter bestehen nur aus jeweils drei Spalten, die mit Klasse, Häufigkeit und Benford überschrieben sind. In der Spalte A mit dem Namen „Klasse” werden in Histo_12Z die Anfangszahlen 10 bis 99 und in Histo_1Z die Anfangsziffern 1 bis 9 eingetragen. In der Spalte B unter der Überschrift „Häufigkeit” werden die jeweiligen beobachteten absoluten Häufigkeiten mit der Excel-Funktion ZÄHLENWENN berechnet, indem man jeweils in die Zelle A2 die Formel
= ZÄHLENWENN(Zwischenrechnung!B:B;A2) |
im Arbeitsblatt Histo_12Z einschreibt bzw. die Formel
= ZÄHLENWENN(Zwischenrechnung!C:C;A2) |
im Arbeitsblatt Histo_1Z einträgt und diese Formeln wie üblich in alle Felder der Spalte B kopiert, für die in der Spalte A eine Anfangszahl vorhanden ist. So erkennt man in unserem Beispiel etwa, dass 34 Zahlen mit der Anfangszahl 17 beginnen, während es genau 244 Zahlen gibt, die mit der Anfangsziffer 2 beginnen.
Erwartete Häufigkeiten
Zur Vorbereitung der ...