Hypothesen und Signifikanz
In der Praxis hat man es häufig nicht nur mit Parameterschätzungen zu tun, sondern man möchte mit Hilfe von Stichproben den Wahrheitsgehalt von Annahmen und Vermutungen über eine unbekannte Grundgesamtheit überprüfen. Eine zu prüfende Vermutung über die Grundgesamtheit nennt man eine Hypothese, d. h. begründete theoretische Annahmen über die Entstehung, Ursache oder Wirkung eines in der materiellen und sozialen Realität beobachteten Sachverhaltes oder eines Zusammenhanges von Sachverhalten (Resultaten). Der zugehörige statistische Test wird Signifikanztest genannt.
Falsifikationsprinzip
Hypothesen können sich als Resultate von Untersuchungen oder durch Erfahrung begründeter Vermutungen über Ausprägungen von Variablen, über Unterschiede der Ausprägungen mehrerer Variablen oder über die Beziehung zwischen Variablen ergeben. Eine Hypothese sollte stets allgemein gültig, widerspruchsfrei, realitätsbezogen und neu sein und sie sollte in der Realität überprüft werden können. Dabei werden Hypothesen i.a. so formuliert, dass sie gemachten Annahmen widersprechen (Falsifikationsprinzip), d. h., dass sie gleiches Verhalten oder nicht vorhandene Wirkungen und Unterschiede verschiedener Wirkungen unterstellen. In der Praxis unterscheidet man zwischen
- Hypothesen über unbekannte Parameter einer Grundgesamtheit (Parameterhypothese), die mit Parametertests überprüft werden, und
- Hypothesen über die unbekannte Verteilungsform einer Grundgesamtheit (Verteilungshypothesen), die mit so genannten Verteilungstests überprüft werden.
Nullhypothese
Startpunkt eines Hypothesentests ist stets die Formulierung der zu widerlegenden Nullhypothese H0. Der Nullhypothese stellt man eine komplementäre Alternativhypothese Ha gegenüber, die mit einer vorgegebenen Fehlerwahrscheinlichkeit α (Signifikanzniveau) bestätigt oder widerlegt wird.
Konfidenzintervalle
Liegt ein Parametertest über normalverteilte Größen wie den Mittelwert vor, dann lässt sich das Vorgehen bei einem Signifikanztest gut demonstrieren. Aus den Eigenschaften der Normalverteilung ist nämlich bekannt, dass innerhalb bestimmter Intervalle um den Mittelwert herum zu verschiedenen statistischen Sicherheiten Parameterschätzungen vorgenommen werden können. Die Länge dieser Konfidenzintervalle zu einer vorgegebenen Sicherheit bestimmt sich über den Multiplikator t vor der Standardabweichung, d. h. zu jeder statistischen Sicherheit gehört ein eindeutig bestimmtes t, sodass das zugehörige Konfidenzintervall mit den Eckpunkten µ ± t ˙ σ genau die geforderte statistische Sicherheit besitzt:
Abb. 1:Wahrscheinlichkeit bei Normalverteilung
Statistische Sicherheit
Wie aus dem Diagramm (in Abb. 1) ersichtlich ist, liegen in einem Intervall mit dem Mittelpunkt µ und den Intervallgrenzen µ ± 1 ˙ σ, d. h. für t = 1, genau 68,3 % aller Werte einer normalverteilten Variablen. Angewandt auf den empirischen Mittelwert x¯ bedeutet dies, dass mit 68,3%iger Sicherheit der empirische Mittelwert x¯ einer Stichprobe in dem Konfidenzintervall [µ – 1 ˙ σ, µ + 1 ˙ σ] zu finden sein wird. Bei einer Verdoppelung des Konfidenzintervalls auf µ ± 2 ˙ σ kann sogar angenommen werden, dass 95,5 % aller Werte in dem Konfidenzintervall [µ – 2 ˙ σ, µ + 2 ˙ σ] liegen. Bezogen auf den empirischen Mittelwert χx¯ heißt das, dass mit 95,5%iger Sicherheit der empirische Mittelwert x¯ einer Stichprobe dem Konfidenzintervall angehören wird. Die Vergrößerung der statistischen Sicherheit ist also verbunden mit einer Vergrößerung des Konfidenzintervalls.
Signifikanzniveau
Den Multiplikator t nennt man auch das Signifikanzniveau und wird meist über die Irrtumswahrscheinlichkeit festgelegt. Obwohl in der Praxis bereits eine Irrtumswahrscheinlichkeit von 10 % und kleiner als signifikant gilt, sollen in Tabelle 1 wichtige Signifikanzniveaus mit ihren zugehörigen Sicherheiten und Irrtumswahrscheinlichkeiten vorgestellt werden:
Signifikanzniveau |
Sicherheitswahrscheinlichkeit |
Irrtumswahrscheinlichkeit |
1,00 |
68,3 % |
31,7 % |
1,64 |
90,0 % |
10,0 % |
1,96 |
95,0 % |
5,0 % |
2,00 |
95,5 % |
4,5 % |
2,58 |
99,0 % |
1,0 % |
Tab. 1:Signifikanzniveaus aus Wahrscheinlichkeiten
Mittelwertschätzung
Legt man den empirischen Mittelwert in den Mittelwert der Normalverteilung und wählt man die zugehörige empirische Standardabweichung der Stichprobe als Standardabweichung der Normalverteilung, so können unter der Voraussetzung, dass die Stichprobe mindestens 30 Elemente umfasst, Konfidenzintervalle für die Schätzung des wahren Mittelwerts mit vorgegebenen statistischen Sicherheiten durchgeführt werden. So ist etwa in einem Intervall mit dem Mittelpunkt x¯ und den Intervallgrenzen x¯ ± s / √ n mit 68,3 % Sicherheit der wahre Mittelwert zu finden. Verdoppelt man das Intervall auf x¯ ± 2s / √ n, so weiß man, dass im Konfidenzintervall x¯ ± 2s / √ n mit 95,5%iger Sicherheit der wahre Mittelwert liegen muss.