Dipl.-Finanzwirt (FH) Nikolaus Zöllner
Der Chi-Quadrat-Test ist eine Methode aus der mathematischen Statistik und untersucht die Verteilungseigenschaft einer vorgegebenen Datenmenge. Hinsichtlich der Häufigkeit von Ziffern an bestimmten Stellen entsprechen die Annahmen grundsätzlich denen der Gleichverteilung. Sofern 1.000 Datensätze betrachtet werden, kommt jede Ziffer von 0 bis 9 an einer einheitlichen Stelle, beispielsweise der Position vor oder nach dem Komma, statistisch betrachtet 100 Mal vor. Voraussetzung ist auch hier, dass jede Zahl die Chance hat, in gleicher Häufigkeit vorzukommen; es dürfen also auch hier keine Systematiken bestehen, die zu Verzerrungen führen.
Die im Rahmen einer Analyse erfassten tatsächlichen Häufigkeiten werden von der erwarteten Häufigkeit subtrahiert. Die Differenz wird anschließend quadriert, um zu verhindern, dass sich positive und negative Abweichungen aufheben. Abschließend wird die Summe der quadrierten Differenzen durch die erwartete Häufigkeit dividiert; der sich hieraus ergebende Chi-Wert gibt Anhaltspunkte, ob das Zahlenmaterial als zuverlässig angesehen werden kann oder Hinweise auf Abweichungen oder Manipulationen enthält.
Auch dieser Test ist im Repertoire der steuerlichen Betriebsprüfer und kann für interne Verprobungen herangezogen werden.
Analyse der Fahrtenbuch-Eintragungen mit dem Chi-Quadrat-Test
Die Car Chronicle Control AG möchte die Eintragungen der Betriebsfahrzeug-Fahrer in den digitalen Fahrtenbüchern mithilfe des Chi-Quadrat-Tests verproben. Hierfür werden alle Eintragungen an der letzten Stelle vor dem Komma ausgewertet. Dabei ergab sich für 1.000 Datensätze folgendes Ergebnis:
Ziffer |
erwartete Häufigkeit |
tatsächl. Häufigkeit |
Differenz |
quadrierte Differenz |
0 |
100 |
84 |
-16 |
256 |
1 |
100 |
132 |
32 |
1024 |
2 |
100 |
121 |
21 |
441 |
3 |
100 |
93 |
-7 |
49 |
4 |
100 |
105 |
5 |
25 |
5 |
100 |
81 |
-19 |
361 |
6 |
100 |
116 |
16 |
256 |
7 |
100 |
76 |
-24 |
576 |
8 |
100 |
112 |
12 |
144 |
9 |
100 |
110 |
10 |
100 |
|
|
|
|
|
Summen |
1.000 |
|
|
3.232 |
|
|
Chi-Wert (3.232 : 100) |
|
32,32 |
Je höher der ermittelte Chi-Wert ist, desto größer ist die Wahrscheinlichkeit, dass die ermittelten Differenzen zwischen der tatsächlichen und der erwarteten Häufigkeit nicht auf Zufall, sondern auf Manipulationen beruhen. Bei einem Chi-Wert von 21 bis 30 liegt eine hohe Wahrscheinlichkeit hierfür vor, bei Werten über 30 kann schon fast mit Sicherheit davon ausgegangen werden, dass es bei der Zahlenauswahl nicht mit rechten Dingen zugegangen ist.
Für die Auswertung der Eintragungen der Fahrer der Betriebsfahrzeuge in den digitalen Fahrtenbüchern mit einem Chi-Wert von 32,32 bedeutet dies, dass hier (fast) mit Sicherheit mit manipulierten Datenbeständen gerechnet werden kann und detailliertere Auswertung folgen sollten.