Dipl.-Finw. (FH) Paul Eichmann
2.1.1 Was bei diesem statistischen Testverfahren überprüft wird
Der Chi-Quadrat-Test ist eine Methode der mathematischen Statistik. Durch seine Anwendung wird geprüft, ob eine beobachtete Verteilung von Rechengrößen (z. B. Kassendaten) einer statistisch zu erwartenden Verteilung entspricht.
Sofern von Zahlen einer bestimmten Zahlenfolge jede einzelne Zahl die Chance hat, in gleicher Häufigkeit vorzukommen, dann besteht die Wahrscheinlichkeit, dass die Zahlen mengenmäßig gleich verteilt sind. Kann z. B. erwartet werden, dass die Ziffern 0 bis 9 in Zahlenkolonnen in gleicher Häufigkeit vorkommen, besteht die Wahrscheinlichkeit, dass der Anteil jeder dieser Ziffern an der Gesamtmenge 10 % beträgt.
Voraussichtliches Vorkommen einer bestimmten Ziffer an der 1. Stelle vor dem Komma
Bei 2.000 zufälligen Zahlen kommen nach den Erkenntnissen der mathematischen Statistik die Ziffern 0 bis 9 an der 1. Stelle vor dem Komma mit gleicher Häufigkeit vor. Jede dieser Ziffern kommt daher wahrscheinlich zu 10 % vor. Aus diesem Grund kann erwartet werden, dass jede der Ziffern 0 bis 9 an dieser Stelle 200-mal vorkommt. Ein deutliches Abweichen von dieser Erwartung beruht nicht auf Zufall sondern für gewöhnlich auf manueller Einwirkung – sprich Manipulation. Aber auch hier gibt es die berühmte Ausnahme, welche die Regel bestätigen kann.
2.1.2 Chi-Quadrat-Test: Ein Beispiel aus der Praxis
Auswertung der Tageseinnahmen in Kassenberichten eines Gastwirts
Bei einer Betriebsprüfung werden für das Geschäftsjahr 01 die in den Kassenberichten ausgewiesenen Tageseinnahmen der Gastwirtschaft des W durch den Chi-Quadrat-Test ausgewertet. Im Jahr 01 hatte die Gastwirtschaft einen Ruhetag pro Woche; geschlossen war sie an 13 Tagen. Von den 365 Tagen des Jahres hatte die Wirtschaft daher an insgesamt 52 Tagen und zusätzlich an den 13 Tagen geschlossen und war somit an 300 Tagen geöffnet. Der Prüfer wertete 300 Kassenberichte für das Jahr 01 aus.
Überprüft hat er die in diesen Kassenberichten ausgewiesenen Tageseinnahmen. Hierbei ist er bei jeder Tageseinnahme von der letzten Ziffer vor dem Komma ausgegangen. Wenn die Zahlen zufällig waren, hatte jede dieser Ziffern die Chance, in gleicher Anzahl vorzukommen. Jede der Ziffern 0 bis 9 hätte also zu 10 % von 300, somit 30-mal vorkommen müssen. Jede sich ergebende Differenz zwischen der erwarteten Häufigkeit der Ziffer zu ihrem tatsächlichen Vorkommen in den ausgewerteten Kassenberichten wird zum Quadrat genommen.
Es ergab sich folgendes Bild:
Ziffer |
erwartet |
tatsächlich |
Differenz |
Differenz2 |
0 |
30 |
14 |
– 16 |
256 |
1 |
30 |
32 |
+ 2 |
4 |
2 |
30 |
38 |
+ 8 |
64 |
3 |
30 |
25 |
– 5 |
25 |
4 |
30 |
34 |
+ 4 |
16 |
5 |
30 |
12 |
–18 |
324 |
6 |
30 |
45 |
+ 15 |
225 |
7 |
30 |
18 |
– 12 |
144 |
8 |
30 |
43 |
+ 13 |
169 |
9 |
30 |
39 |
+ 9 |
81 |
|
300 |
|
|
1.308 1.308/30 = 43,6 |
Die Summe der so gewonnenen Zahlen wird durch die erwartete Anzahl dividiert. Das Ergebnis ist der Chi-Wert, hier 43,6.
Zur Auswertung des gewonnenen Chi-Wertes werden die auf den Erfahrungen der mathematischen Statistik, der Wahrscheinlichkeitsrechnung beruhenden Tabellen zugrunde gelegt. Hierin wird für die nach der vorstehend mitgeteilten Methode gefundenen Chi-Werte gezeigt, zu wie viel Prozent Wahrscheinlichkeit das Ergebnis auf Zufall oder auf besonderen Ursachen (Manipulation) beruht. Für die Auswertung kommt folgender Auszug der Tabelle zur Auswertung der Chi-Quadrat-Tests infrage:
Tabelle zur Auswertung des Chi-Quadrat-Tests |
Gefundener Chi-Wert |
Wahrscheinlichkeit für Zufall in % |
Wahrscheinlichkeit für eine besondere Ursache (Manipulation) in % |
18 |
3,5 |
96,5 |
20 |
1,8 |
98,2 |
22 |
0,9 |
99,1 |
26 |
0,2 |
99,8 |
30 |
(fast) 0,0 |
(fast) 100,0 |
Liegt ein gefundener Chi-Wert zwischen 21 und 30, besteht nach der Tabelle eine hohe Wahrscheinlichkeit dafür, dass die gefundenen Differenzen nicht auf Zufall beruhen, sondern besondere Ursachen haben können. Bei Chi-Werten von 30 und mehr kann mit an Sicherheit grenzender Wahrscheinlichkeit angenommen werden, dass die Abweichungen nicht mehr auf Zufall beruhen. Werden daher bei der Überprüfung der in Kassenberichten ausgewiesenen Tageseinnahmen Chi-Werte von 30 und höher ermittelt, spricht vieles dafür, dass die Aufzeichnungen der Tageseinnahmen manipuliert worden sind.
Erhöhter Chi-Wert als Anzeichen für Manipulationen
Ist der Chi-Wert wie im vorstehenden Beispiel 30 oder höher, kann davon ausgegangen werden, dass die Kassenführung sachliche und möglicherweise formelle Unrichtigkeiten beinhaltet.
Voraussetzung für die Annahme einer sachlichen und ggf. auch formellen Unrichtigkeit durch den Chi-Wert ist, dass die allgemeinen mathematischen Grundsätze der Statistik beachtet worden sind. Bei jeder Statistik ist das Gesetz der großen Zahl zu beachten. Aus diesem Grund muss dem für die Beanstandung maßgebenden Chi-Wert auch eine ausreichende Anzahl von Werten zugrunde liegen.
2.1.3 Voraussetzung: Repräsentative Datenmenge
Die Chi-Quadrat-Methode erfordert eine hohe Anzahl von Werten. Man spricht hierbei von einer Anzahl um 3.000. Als Mindestmenge werden landläufig jedoch 500 Datensätze angesehen – wobei die Rechtsprechung in einem Fall auch 365 Datensätze akzeptiert hatte.
In einem Urteilsfall des FG Münster hatte die Steuerfahndung ...