Im Bereich der Signifikanztests soll im Folgenden eine in der Praxis besonders wichtige Klasse von statistischen Tests vorgestellt werden, nämlich die Chi²-Tests. Die Chi²-Verteilung beschreibt das Verhalten einer Summe von Quadraten von k unabhängigen, N(0,1)-normalverteilten Variablen Xi :
Freiheitsgrad
Die Anzahl der betrachteten Variablen fließt in Gestalt des Freiheitsgrades in die Werte der Chi-Verteilung ein, wobei der Freiheitsgrad (degree of freedom: df) bei k betrachteten Variablen die Gleichung df = k erfüllt. Der Freiheitsgrad lässt sich weiterhin im Erwartungswert und in der Varianz der Chi²-Verteilung wiederfinden, denn es gilt E(χ²) = df und Var(χ²) = 2 ˙ df. Für Stichprobengrößen n ≥ 100 kann die Chi²-Verteilung durch die Normalverteilung, genauer durch eine N(df, 2 ˙ df)-Verteilung, approximiert werden.
Chi²-Anpassungstest
Verteilungshypothese
Häufig hat man es in der Praxis mit Fragestellungen zu tun, die Annahmen über unbekannte Verteilungen von Grundgesamtheiten betreffen. In seiner ersten Ausprägung, dem Chi²-Anpassungstest, wird die Chi²-Verteilung zur Prüfung von Verteilungshypothesen eingesetzt, bei denen man untersucht, ob die in einer Stichprobe beobachtete Verteilung mit der aufgrund der Verteilungsannahme erwarteten Verteilung der Grundgesamtheit in Widerspruch steht oder nicht.
Abb. 2:Chi2-Testvergleich mit kritischem Bereich
Ablehnung der Nullhypothese
Die Nullhypothese H0 lautet in diesem Fall, dass die beobachtete und die theoretische Verteilung übereinstimmen. Die Nullhypothese ist abzulehnen, wenn die vorliegenden Daten signifikant gegen H0 sprechen. In diesem Fall kann man die Gegenhypothese als bestätigt ansehen, d. h., die Daten unterliegen also nicht der vermuteten Verteilung. Anderenfalls sprechen die Daten nicht signifikant gegen die Nullhypothese H0, d. h., es gibt keinen Grund, diese abzulehnen. Dabei beachte man die Sprechweise der Statistik, wonach nie eine Hypothese bestätigt wird, denn diese könnte, auch wenn sie durch die Rechenergebnisse nicht abzulehnen ist, trotzdem falsch sein.
Goodness-of-Fit-Test
Dabei entscheidet man anhand der Unterschiede zwischen der in der Stichprobe beobachteten und der aufgrund der Verteilungsannahme in der Stichprobe erwarteten Verteilung, ob diese Unterschiede noch dem Zufall zugeschrieben werden können oder nicht. Da beim Anpassungstest die Güte der Anpassung einer theoretischen Verteilung an eine empirische Verteilung überprüft wird, spricht man auch von einem Goodness-of-Fit-Test.
Chi²-Unabhängigkeitstest
Unabhängigkeit von Variablen
Die zweite in der Praxis weit verbreitete Variante des Chi²-Tests stellt der Chi²-Unabhängigkeitstest dar, bei dem eine Überprüfung der Unabhängigkeit beliebig skalierter Merkmale durch Vergleich der empirischen (beobachteten) Werte mit theoretischen (erwarteten) Werten erfolgt. In Abhängigkeit vom Signifikanzniveau und vom Freiheitsgrad lässt sich damit die Frage überprüfen, ob zwei nominale Variablen voneinander stochastisch unabhängig sind oder nicht. Das Vorgehen beim Chi²-Unabhängigkeitstest ist demjenigen beim Chi²-Homogenitätstest sehr ähnlich, wobei beim Homogenitätstest nicht die Überprüfung der Unabhängigkeit von Zufallsvariablen erfolgt, sondern vielmehr die Frage geklärt wird, ob mehrere Stichproben derselben Verteilung einer Grundgesamtheit gehorchen.
Verwendung von Excel
Die drei Chi²-Tests können mit Hilfe von MS-Excel in der Praxis sehr viel einfacher durchgeführt werden, als dies theoretisch erklärbar ist, denn der Vergleich von Prüfgrößen mit einem Vergleichswert, der sich aus der statistischen Sicherheit und der Größe der Zahlenmenge bestimmt, entfällt hier. Der Excel-Funktion CHITEST liefert direkt aus den beobachteten und den theoretischen absoluten Häufigkeiten die statistische Sicherheit für die Übereinstimmung der empirischen mit der theoretischen Verteilung, was in den folgenden Abschnitten an einem praktischen Beispiel verdeutlicht werden soll.