Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier...

Hypothesen testen: Grundidee

• Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen.

• Bei zwei nominalskalierten Variablen: Χ²• Bei einer zweistufigen nominalskalierten und

einer intervallskalierten Variable: T-Test• Bei einer mehrstufigen nominalskalierten und

einer intervallskalierten Variable: Varianzanalyse (F-Test)

• Bei zwei intervallskalierten Variablen: Korrelation oder Regression

• Eigentlich will man aber wissen, ob beide Variablen in der Grundgesamtheit zusammenhängen oder nicht.

• Hypothesen sind Behauptungen über die Grundgesamtheit.

• Man formuliert zwei entsprechende Hypothesen:• Die Variablen hängen in der Grundgesamtheit nicht

zusammen (Nullhypothese H0).• Die Variablen hängen in der Grundgesamtheit

zusammen (Alternativhypothese HA oder H1), die eigentlich interessierende Annahme!!

• Geprüft wird immer die Nullhypothese.

• Grund: Die Nullhypothese ist genau spezifiziert (Zusammenhang ist Null), Alternativhypothese nicht (Zusammenhang ist vorhanden, ohne dass klar ist, wie hoch).

• Man prüft, wie wahrscheinlich das Stichprobenergebnis ist, wenn die Nullhypothese zutrifft. Ist diese gering, wird die Nullhypothese abgelehnt. Diese Entscheidung ist entweder richtig oder falsch.

α ist die Irrtumswahrscheinlichkeit bei der Ablehnung von H0, dafür wird vorher ein Grenzwert festgelegt: das Signifikanzniveau

Hypothesen testen: Vorgehen

• Null- und Alternativhypothese formulieren• Festlegung der Irrtumswahrscheinlichkeit

(Signifikanzniveau)• Festlegung einer geeigneten Prüfgröße und

Bestimmung ihrer Verteilung• Berechnung des kritischen Werts, ab wann H0 als

abgelehnt gelten soll• Berechnung des empirischen Werts mit den Daten der

Stichprobe• Entscheidung über Annahme oder Ablehnung von H0

und Interpretation

Null- und Alternativhypothese formulieren

• H0: Geschlecht und Wahlabsicht hängen nicht zusammen

• H1: Geschlecht und Wahlabsicht hängen zusammen.

Festlegung der Irrtumswahrscheinlichkeit (Signifikanzniveau)

• Wir lehnen H0 ab, wenn die Wahrscheinlichkeit, dass wir uns dabei irren, kleiner ist als 5% (manchmal auch 1%).

• Das ist dann der Fall, wenn die Wahrscheinlichkeit, das Stichprobenergebnis, das wir erhalten haben, zu erhalten, kleiner ist als 5% (bzw. 1%).

• Wir testen also auf dem 5%-Signifikanzniveau (bzw. 1%).

• Notation: α = 5%

Festlegung einer geeigneten Prüfgröße und Bestimmung ihrer Verteilung

• Da Geschlecht und Wahlabsicht nominalskaliert sind, bietet sich Χ² als Prüfgröße an.

• Diese Größe ist annähernd Χ² - verteilt, wenn keine der erwarteten Häufigkeiten kleiner ist als 5.

Berechnung des kritischen Werts, ab wann H0 als abgelehnt gelten soll

• Man schaut in der Chi²-Tabelle nach, wie hoch der Chi²-Wert ist, der die unteren 95% von der oberen 5% trennt.

• Dabei muss man die Zeile mit den entsprechenden Freiheitsgraden auswählen.

• Freiheitsgrade sind hier (r-1) * (c-1)

• (Anzahl der Zeilen minus 1) mal (Anzahl der Spalten minus 1)

Berechnung des empirischen Werts mit den Daten der Stichprobe

Χ2 = e

eb

f

ff 2)(

Entscheidung über Annahme oder Ablehnung von H0 und Interpretation

• Ist der in der Stichprobe gefundene Wert für die Prüfgröße größer als der kritische Wert, wird die Nullhypothese abgelehnt.

• Ist die Prüfgröße kleiner oder gleich dem kritischen Wert, wird die Nullhypothese beibehalten.

• Wird H0 abgelehnt, heißt das bei einem Signifikanzniveau von 5%: Mit 95%iger Wahrscheinlichkeit besteht in der Grundgesamtheit ein Zusammenhang zwischen den beiden Variablen.

• H0 ablehnen: Der Zusammenhang ist signifikant.

Achtung

• Statistische Signifikanz ist nicht gleichbedeutend mit praktischer Bedeutsamkeit, daher hier noch Cramers V berechnen, da dieser immer zwischen 0 und 1 liegt und leichter interpretierbar ist.

Beispiel aus Gehring und Weins

Alle erwarteten Häufigkeiten sind größer als 5, daher kann man Χ²-Verteilung verwenden.

Prüfgröße ist kleiner als der kritische Wert von 3.84, daher H0 annehmen

Ausblick für Computerauswertungen

• SPSS gibt p-Werte aus.

• Das ist die genaue Wahrscheinlichkeit, mit der das Stichproben-Ergebnis zustande kommen kann, wenn in der Grundgesamtheit die Nullhypothese gilt.

• Wenn p kleiner ist als das Signifikanzniveau α, wird die Nullhypothese abgelehnt.

• Ist p < .05: signifikant auf dem 5%-Niveau

• Ist p < .01: signifikant auf dem 1%-Niveau

Ausblick für weitere Tests

• Da Χ² immer positiv ist, haben wir die Richtung des Zusammenhangs noch vernachlässigt.

• Eigentlich gehört zur Interpretation noch die Aussage, in welcher Richtung das Ergebnis auftritt (z.B. Frauen wählen eher die Grünen als Männer). Bei anderen Tests ist das auch statistisch ein Unterschied bei der Berechnung.

• Daher führen wir die Unterscheidung zwischen einseitigen und zweiseitigen Alternativhypothesen ein.

Einseitige und zweiseitige Alternativhypothesen

• Bei nominalskalierten Variablen (Chi²)

• H0: Frauen und Männer sind gleich oft Vorgesetzte.

• Zweiseitig: Frauen und Männer sind unterschiedlich oft Vorgesetzte.

• Einseitig: Frauen sind seltener Vorgesetzte als Männer (setzt Theorie oder Vorwissen voraus).

Einseitige und zweiseitige Alternativhypothesen

• Bei einer nominalskalierten und einer intervallskalierten Variablen (T-Test)

• H0: Frauen und Männer sind gleich gut im Sprachtest.

• Zweiseitig: Frauen und Männer sind unterschiedlich gut im Sprachtest.

• Einseitig: Frauen sind besser im Sprachtest als Männer. D.h. hier wird die H0 auch angenommen, wenn die Männer viel besser als die Frauen sind.

Tipp

• Für SPSS: Bei einseitigen Fragestellungen p halbieren!

Lage des Ablehnungsbereichs

• Hypothese: Frauen sind besser als Männer.

• im Zähler der Formel: xquer Männer – xquer Frauen

• Prüfgröße wird einen negativen Wert annehmen – Ablehnungsbereich muss links sein, d.h. man sucht in der Tabelle die Fläche links von α (=0.05).

• Postuliert die Alternativhypothese dagegen positive Werte der Prüfgröße, liegt der Ablehnungsbereich rechts: Φ = 1 - α

Tipp

• Am besten nennt man immer die Gruppe, von denen man höhere Werte erwartet als erste und schreibt sie auch als erste in die Formel. Dann erwartet man immer positive Werte der Prüfgröße, und der Ablehnungsbereich ist immer rechts.

• H0: μ1 ≤ μ2

• H1: μ1 > μ2

Tests für Mittelwertunterschiede

• Ziel: prüfen, ob der Unterschied zweier voneinander unabhängiger Substichproben (z.B. Männer, Frauen) in dem Mittelwert einer intervallskalierten Variable (z.B. Sprachtest) signifikant ist.

• Es geht also um den Zusammenhang zwischen einer nominalskalierten 2-stufigen Variable und einer intervallskalierten Variable.

• Die intervallskalierte Variable ist die abhängige Variable.

Versionen

• Die Standardabweichungen σ1 und σ2 der beiden Teil-Grundgesamtheiten können gleich oder ungleich sein (wir behandeln nur den Fall, dass sie gleich sind, ungleiche σ nur mit SPSS).

• Die Standardabweichungen σ1 und σ2 können bekannt oder unbekannt sein. Wenn sie bekannt sind, wird die z-Verteilung verwendet, wenn sie unbekannt sind, die T-Verteilung.

• Gehring und Weins verwenden aus didaktischen Gründen zunächst auch bei unbekannten σ die z-Verteilung, da sich T an z annähert, wenn beide Substichproben größer als N=30 sind.

Parameter der Prüfgröße

• Höhe des Mittelwertunterschieds im Vergleich zum Mittelwertunterschied bei Gültigkeit der Nullhypothese (meist 0)

• Standardabweichungen der beiden Teilstichproben

• Anzahl der Untersuchungseinheiten in beiden Teilstichproben

z-Test

Da μ1 – μ2 = 0, vereinfacht sich die Formel zu:

T-Test

• wird verwendet, wenn σ1 und σ2 unbekannt sind

• diese werden durch s1 und s2 der Stichprobe geschätzt

• wegen dieser Ungenauigkeit wird die T-Tabelle verwendet

• Freiheitsgrade: n1 + n2 – 2

• s1 und s2 werden in Hinblick auf die Größen der beiden Teilstichproben gewichtet

Vorgehen:

• Null- und Alternativhypothese formulieren• Festlegung der Irrtumswahrscheinlichkeit

(Signifikanzniveau)• Festlegung einer geeigneten Prüfgröße und

Bestimmung ihrer Verteilung• Berechnung des kritischen Werts, ab wann H0 als

abgelehnt gelten soll• Berechnung des empirischen Werts mit den Daten der

Stichprobe• Entscheidung über Annahme oder Ablehnung von H0

und Interpretation

Beispiel

• 100 Frauen und 100 Männer machen einen Sprachtest, wobei die Frauen im Mittel 25 und die Männer 20 Punkte erreichen (s1=s2=10).

• H0: Frauen und Männer unterscheiden sich nicht im Test oder Männer sind besser.

• H1: Frauen sind im Test besser als Männer.• Irrtumswahrscheinlichkeit 5%• T-Test ist das geeignete Verfahren.• Kritischer Wert: Φ = 1-α = 1.653

(bei 200 df, da 198 nicht tabelliert ist)• Empirischer Wert T = 3.55• Ablehnung der Nullhypothese

SPSS

• SPSS berechnet, ob beide Varianzen statistisch gleich oder verschieden sind:

• F = s²1 / s²2

• und gibt für beide Möglichkeiten unterschiedliche T-Werte an. Diese unterscheiden sich nur in der Berechnung der Freiheitsgrade.

Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier...

Documents

Transcript of Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier...