Abweichung von der Gleichverteilung
Berechnet man mit dem Gesetz von Benford die Wahrscheinlichkeiten für das Auftreten der Ziffern an den ersten 5 Stellen einer beliebigen Zahl einer Benford-Menge, so gelangt man zu der Beobachtung, dass das Abweichen von der Gleichverteilung der Ziffern im Wesentlichen auf die ersten drei Ziffern beschränkt ist (Tab. 1).
Ziffer |
Z1 |
Z2 |
Z3 |
Z4 |
Z5 |
0 |
- |
0,120 |
0,102 |
0,100 |
0,100 |
1 |
0,301 |
0,114 |
0,101 |
0,100 |
0,100 |
2 |
0,176 |
0,109 |
0,101 |
0,100 |
0,100 |
3 |
0,125 |
0,104 |
0,101 |
0,100 |
0,100 |
4 |
0,097 |
0,100 |
0,100 |
0,100 |
0,100 |
5 |
0,079 |
0,097 |
0,100 |
0,100 |
0,100 |
6 |
0,067 |
0,093 |
0,099 |
0,100 |
0,100 |
7 |
0,058 |
0,090 |
0,099 |
0,100 |
0,100 |
8 |
0,051 |
0,088 |
0,099 |
0,100 |
0,100 |
9 |
0,046 |
0,085 |
0,098 |
0,100 |
0,100 |
Tab. 1: Verteilung von einer bis fünf Ziffern
Wie die Tabelle 1 deutlich hervorhebt, liegt in einer Benford-Menge ab der vierten Ziffer bereits annähernd eine Gleichverteilung der Ziffern vor, wobei die Abweichungen von der Gleichverteilung in der dritten Ziffer so gering sind, dass man von einer echten Abweichung nur in den ersten beiden Ziffern sprechen kann, sodass sich auch die Mehrzahl der Ergebnisse zum Gesetz von Benford auf die ersten beiden Ziffern bezieht.
Ziffernstrukturen
Hieraus lassen sich Strukturaussagen über Zahlen in Benford-Mengen ableiten, die für Tests eine wichtige Rolle spielen. Betrachtet man etwa eine Beispielmenge von Zahlen, die einer Benford-Menge entstammen mögen, so kann man folgende Überlegungen ableiten:
1,23 |
1 2,34 |
1 2 3,45 |
1 2 3 4,56 |
1 2 3 45,67 |
1 2 3 456,78 |
1 2 3 4567,89 |
... |
- Die ersten Ziffern sowie die ersten beiden Ziffern der Zahlenfolge, d.h. die Menge der Z1 ebenso wie die Menge der Z1 Z2, unterliegen einer logarithmischen Verteilung, die von der Gleichverteilung abweicht.
- Bei allen Zahlen, die mindestens 4 Stellen besitzen, liegen die Ziffern ab der vierten Stelle in Form einer annähernden Gleichverteilung vor.
Da die dritten Ziffern einer Benford-Menge nur unwesentlich von einer Gleichverteilung abweichen, kann man die angestellten Überlegungen wie folgt zusammenfassen:
Die Zahlen einer Benford-Menge setzen sich annähernd aus zwei Teilen zusammen, nämlich den anfänglichen beiden Ziffern, die einer logarithmischen Verteilung unterliegen, sowie den Ziffern ab der dritten Stelle, die allesamt annähernd einer Gleichverteilung folgen.
Bedingte Wahrscheinlichkeiten
Da die ersten beiden Ziffern in der Praxis bei der Analyse von Benford-Mengen eine herausragende Rolle spielen, arbeitet man bei der Untersuchung dieser ersten beiden Ziffern auch häufig mit dem Test über bedingte Wahrscheinlichkeiten. Dies trifft eine Aussage darüber, mit welcher Wahrscheinlichkeit ein Auftreten einer bestimmten zweiten Ziffer zu erwarten ist, wenn die erste Ziffer bereits bekannt ist:
Z2 | Z1 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
0 |
0,1375 |
0,1203 |
0,1140 |
0,1107 |
0,1086 |
0,1072 |
0,1062 |
0,1055 |
0,1049 |
1 |
0,1255 |
0,1147 |
0,1104 |
0,1080 |
0,1065 |
0,1055 |
0,1047 |
0,1042 |
0,1037 |
2 |
0,1155 |
0,1096 |
0,1070 |
0,1055 |
0,1045 |
0,1038 |
0,1033 |
0,1029 |
0,1026 |
3 |
0,1069 |
0,1050 |
0,1038 |
0,1030 |
0,1025 |
0,1022 |
0,1019 |
0,1017 |
0,1015 |
4 |
0,0995 |
0,1007 |
0,1008 |
0,1007 |
0,1006 |
0,1006 |
0,1005 |
0,1005 |
0,1004 |
5 |
0,0931 |
0,0967 |
0,0979 |
0,0985 |
0,0988 |
0,0990 |
0,0992 |
0,0993 |
0,0994 |
6 |
0,0875 |
0,0931 |
0,0952 |
0,0964 |
0,0971 |
0,0976 |
0,0979 |
0,0982 |
0,0984 |
7 |
0,0825 |
0,0897 |
0,0927 |
0,0943 |
0,0954 |
0,0961 |
0,0966 |
0,0970 |
0,0973 |
8 |
0,0780 |
0,0865 |
0,0903 |
0,0924 |
0,0938 |
0,0947 |
0,0954 |
0,0959 |
0,0964 |
9 |
0,0740 |
0,0836 |
0,0880 |
0,0905 |
0,0922 |
0,0933 |
0,0942 |
0,0949 |
0,0954 |
Tab. 2: Tabelle der bedingten Wahrscheinlichkeiten
So ist etwa für eine Zahl in einer Benford-Menge die Wahrscheinlichkeit dafür, dass als zweite Ziffer eine 3 auftritt, wenn als erste Ziffer bereits eine 2 vorliegt, genau 0,1050, wobei die Berechnung der bedingten Wahrscheinlichkeit nach folgender Formel erfolgt:
p (Z2 | Z1 ) = p (1 + 1/ Z1 Z2) / p (1 + 1/ Z1), |
sodass sich für das Beispiel der Wert ergibt:
p (Z2 = 3 | Z1 = 2) = p (1 + 1/ 23) / p (1 + 1/ 2) = 0,1050. |
Beide Tabellen, sowohl die Tabelle für die Auftretenswahrscheinlichkeit von Ziffern in Zahlen (Tab. 1) ebenso wie die Tabelle der bedingten Wahrscheinlichkeiten (Tab. 2), spielen bei der Untersuchung von Benford-Mengen eine wichtige Rolle.