Chi-Quadrat-Test

Der Chi-Quadrat-Test ist ein statistischer Test, der verwendet wird, um zu überprüfen, ob eine beobachtete Häufigkeitsverteilung von einer theoretischen Verteilung abweicht. Er wird häufig verwendet, um die Unabhängigkeit von zwei kategorialen Variablen zu testen.

Hypothesen des Chi-Quadrat-Tests

Wie bei allen Hypothesentests formulieren wir zwei Hypothesen:

  • Nullhypothese (H0): Es besteht kein Unterschied zwischen den beobachteten und den erwarteten Häufigkeiten. Die Variablen sind unabhängig.
  • Alternativhypothese (Ha): Es besteht ein Unterschied zwischen den beobachteten und den erwarteten Häufigkeiten. Die Variablen sind nicht unabhängig.

Berechnung des Chi-Quadrat-Wertes

Der Chi-Quadrat-Wert wird mit der folgenden Formel berechnet:

χ² = Σ ((Oi - Ei)² / Ei)

Dabei ist Oi die beobachtete Häufigkeit und Ei die erwartete Häufigkeit.

Beispiel

Angenommen, wir möchten testen, ob das Geschlecht (männlich, weiblich) und die Präferenz für eine bestimmte Fernsehsendung (A, B) unabhängig voneinander sind. Wir haben folgende Daten gesammelt:

Geschlecht Sendung A Sendung B Gesamt
Männlich 20 30 50
Weiblich 30 20 50
Gesamt 50 50 100

Um die erwarteten Häufigkeiten zu berechnen, verwenden wir die Formel:

Eij = (Gesamtzahl der Zeile i * Gesamtzahl der Spalte j) / Gesamtzahl

Die erwarteten Häufigkeiten sind:

Geschlecht Sendung A Sendung B
Männlich 25 25
Weiblich 25 25

Nun berechnen wir den Chi-Quadrat-Wert:

χ² = (20-25)²/25 + (30-25)²/25 + (30-25)²/25 + (20-25)²/25 = 2 + 1 + 1 + 2 = 6

Vergleich mit dem kritischen Wert

Der kritische Wert des Chi-Quadrat-Tests für 1 Freiheitsgrad (df) und einem Signifikanzniveau von 0.05 ist 3.841. Da 6 > 3.841, lehnen wir die Nullhypothese ab.

Schlussfolgerung

Da der berechnete Chi-Quadrat-Wert größer ist als der kritische Wert, gibt es genügend Beweise, um die Nullhypothese abzulehnen. Wir schließen daher, dass das Geschlecht und die Präferenz für die Fernsehsendung nicht unabhängig voneinander sind.