Stärke des Zusammenhanges
Bislang spielte bei den Untersuchungen die Prüfgröße χ² (Chi²-Wert) keine Rolle, da dieser Wert bei der Arbeit mit MS-Excel für die Lösung keinen Beitrag lieferte. Dies ist in der klassischen Statistik anders, denn die Prüfgröße liefert hier im Vergleich mit einem kritischen Wert die Entscheidung über die Ablehnung der Nullhypothese. Kommt man mit dem Chi²-Unabhängigkeitstest dann zu dem Ergebnis, dass ein Zusammenhang zwischen den beiden Merkmalen vorliegt, so ist es jedoch nicht möglich, aus der Höhe der Irrtumswahrscheinlichkeit oder aus dem Chi²-Wert selbst auf die Stärke des Zusammenhangs zu schließen. Dies ist schon deshalb nicht möglich, weil sich bei gegebenem Zusammenhang zwischen den Merkmalen in der Grundgesamtheit mit steigender Stichprobengröße auch ein größerer Chi²-Wert und damit eine geringere Signifikanz ergibt.
Berechnung des Chi2-Werts
Zur Berechnung des Chi²-Wertes gibt es unterschiedliche Möglichkeiten. Einerseits kann man die Summationsformel
verwenden, was sich jedoch schnell als umständlich herausstellt, oder aber man stützt sich auf Excel, indem man den bereits vorliegenden p-Wert nutzt und unter Verwendung des Freiheitsgrades und der Excel-Funktion CHIINV den zugehörigen Chi²-Wert indirekt berechnet durch die Formel:
χ² = CHIINV(CHITEST(...); df)
In unserer Beispieldatei wurde so der entsprechende Chi²-Wert in der Tabelle "Unabhängigkeit" berechnet:
χ² = CHIINV(D17;D19)
wobei in Zelle D17 der p-Wert zu finden ist und in der Zelle D19 der Freiheitsgrad hinterlegt wurde. Als Ergebnis der Berechnung erhält man für das Beispiel den Wert χ² = 5,22.
Nun kann wie bereits erwähnt der Chi²-Wert selbst nicht als Maß für die Stärke des Zusammenhanges zwischen den beiden Merkmalen verwendet werden, aber es existieren abgeleitete Zusammenhangsmaße, die als Kontingenzkoeffizienten bezeichnet werden.
Kontingenzkoeffizienten
Die beiden für die Praxis wichtigsten Koeffizienten sollen hier kurz vorgestellt werden, wobei erwähnt werden muss, dass beide Maßzahlen den Nachteil besitzen, dass sie nicht linear über das Intervall [0,1] verlaufen.
Kontingenzkoeffizient nach Pearson
Dieser Koeffizient wurde von Pearson entwickelt und ist so normiert, dass er stets zwischen den Werten 0 und 1 liegt, wobei der maximal erreichbare Wert innerhalb des Bereichs zwischen 0 und 1 in Abhängigkeit von der Felderzahl der Kreuztabelle variiert.
Der Wert berechnet sich als
und
Dabei bezeichnet m die Anzahl der in der Kontingenztabelle betrachteten Objekte. Bei einem eindeutigen Zusammenhang zwischen den Merkmalen nimmt C den Wert Cmax an, während sich bei Unabhängigkeit der beiden Variablen ein Wert bei 0 ergibt. Da der maximal erreichbare Wert von C von der Felderzahl der Kreuztabelle abhängt, sind die Werte für Tabellen mit unterschiedlicher Felderzahl nur bedingt miteinander vergleichbar.
Kontingenzkoeffizient nach Cramer
Dieser Koeffizient von Cramer, auch Cramers V genannt, liegt ebenfalls zwischen 0 und 1, wobei der Maximalwert 1 bei allen Tabellen unabhängig von ihrer Größe erreicht werden kann. Der Wert berechnet sich nach der Formel:
Für Kontingenztabellen, bei denen k den Wert 2 annimmt, also zum Beispiel bei 2 × 3-Tabellen, sind Cramers V und der in der Literatur häufig zitierte Phi-Koeffizient φ identisch. Der Phi-Koeffizient ist nur für 2 x 2-Kreuztabellen definiert und daher in der Praxis nur äußerst beschränkt einsetzbar.
Auswertung der Koeffizienten
Sowohl Pearsons Kontingenzkoeffizient als auch Cramers V sind für die in unserem Rechnungsbeispiel betrachtete Tabelle fast identisch. Da beide Zusammenhangsmaße mit einem Wert von ca. 0,19 deutlich unterhalb von 1 liegen, scheint der Zusammenhang zwischen den beiden betrachteten Variablen nicht sehr stark ausgeprägt zu sein, obwohl der Chi²-Unabhängigkeitstest mit rund 92%iger Sicherheit eine Abhängigkeit zwischen den Merkmalen "Branche" und "Land" aufzeigt.
Allerdings ist zu beachten, dass ein Wert in der Nähe von 1 nur sehr selten erreicht wird. Eine präzise Aussage über die Stärke des Zusammenhangs ist anhand der Zusammenhangsmaße nicht möglich. Diese Maße sind vor allem dazu geeignet, eine Einschätzung von der Stärke des Zusammenhangs auf der Basis von Erfahrungswerten über ähnliche Sachverhalte sowie durch den direkten Vergleich mit inhaltlich verwandten Tabellen vorzunehmen.