Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier...

38
Hypothesen testen: Grundidee • Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. • Bei zwei nominalskalierten Variablen: Χ² • Bei einer zweistufigen nominalskalierten und einer intervallskalierten Variable: T-Test • Bei einer mehrstufigen nominalskalierten und einer intervallskalierten Variable: Varianzanalyse (F-Test) • Bei zwei intervallskalierten Variablen: Korrelation oder Regression

Transcript of Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier...

Page 1: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Hypothesen testen: Grundidee

• Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen.

• Bei zwei nominalskalierten Variablen: Χ²• Bei einer zweistufigen nominalskalierten und

einer intervallskalierten Variable: T-Test• Bei einer mehrstufigen nominalskalierten und

einer intervallskalierten Variable: Varianzanalyse (F-Test)

• Bei zwei intervallskalierten Variablen: Korrelation oder Regression

Page 2: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

• Eigentlich will man aber wissen, ob beide Variablen in der Grundgesamtheit zusammenhängen oder nicht.

• Hypothesen sind Behauptungen über die Grundgesamtheit.

• Man formuliert zwei entsprechende Hypothesen:• Die Variablen hängen in der Grundgesamtheit nicht

zusammen (Nullhypothese H0).• Die Variablen hängen in der Grundgesamtheit

zusammen (Alternativhypothese HA oder H1), die eigentlich interessierende Annahme!!

Page 3: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

• Geprüft wird immer die Nullhypothese.

• Grund: Die Nullhypothese ist genau spezifiziert (Zusammenhang ist Null), Alternativhypothese nicht (Zusammenhang ist vorhanden, ohne dass klar ist, wie hoch).

• Man prüft, wie wahrscheinlich das Stichprobenergebnis ist, wenn die Nullhypothese zutrifft. Ist diese gering, wird die Nullhypothese abgelehnt. Diese Entscheidung ist entweder richtig oder falsch.

Page 4: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

α ist die Irrtumswahrscheinlichkeit bei der Ablehnung von H0, dafür wird vorher ein Grenzwert festgelegt: das Signifikanzniveau

Page 5: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Hypothesen testen: Vorgehen

• Null- und Alternativhypothese formulieren• Festlegung der Irrtumswahrscheinlichkeit

(Signifikanzniveau)• Festlegung einer geeigneten Prüfgröße und

Bestimmung ihrer Verteilung• Berechnung des kritischen Werts, ab wann H0 als

abgelehnt gelten soll• Berechnung des empirischen Werts mit den Daten der

Stichprobe• Entscheidung über Annahme oder Ablehnung von H0

und Interpretation

Page 6: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Null- und Alternativhypothese formulieren

• H0: Geschlecht und Wahlabsicht hängen nicht zusammen

• H1: Geschlecht und Wahlabsicht hängen zusammen.

Page 7: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Festlegung der Irrtumswahrscheinlichkeit (Signifikanzniveau)

• Wir lehnen H0 ab, wenn die Wahrscheinlichkeit, dass wir uns dabei irren, kleiner ist als 5% (manchmal auch 1%).

• Das ist dann der Fall, wenn die Wahrscheinlichkeit, das Stichprobenergebnis, das wir erhalten haben, zu erhalten, kleiner ist als 5% (bzw. 1%).

• Wir testen also auf dem 5%-Signifikanzniveau (bzw. 1%).

• Notation: α = 5%

Page 8: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Festlegung einer geeigneten Prüfgröße und Bestimmung ihrer Verteilung

• Da Geschlecht und Wahlabsicht nominalskaliert sind, bietet sich Χ² als Prüfgröße an.

• Diese Größe ist annähernd Χ² - verteilt, wenn keine der erwarteten Häufigkeiten kleiner ist als 5.

Page 9: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Berechnung des kritischen Werts, ab wann H0 als abgelehnt gelten soll

• Man schaut in der Chi²-Tabelle nach, wie hoch der Chi²-Wert ist, der die unteren 95% von der oberen 5% trennt.

• Dabei muss man die Zeile mit den entsprechenden Freiheitsgraden auswählen.

• Freiheitsgrade sind hier (r-1) * (c-1)

• (Anzahl der Zeilen minus 1) mal (Anzahl der Spalten minus 1)

Page 10: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.
Page 11: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.
Page 12: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Berechnung des empirischen Werts mit den Daten der Stichprobe

Χ2 = e

eb

f

ff 2)(

Page 13: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Entscheidung über Annahme oder Ablehnung von H0 und Interpretation

• Ist der in der Stichprobe gefundene Wert für die Prüfgröße größer als der kritische Wert, wird die Nullhypothese abgelehnt.

• Ist die Prüfgröße kleiner oder gleich dem kritischen Wert, wird die Nullhypothese beibehalten.

• Wird H0 abgelehnt, heißt das bei einem Signifikanzniveau von 5%: Mit 95%iger Wahrscheinlichkeit besteht in der Grundgesamtheit ein Zusammenhang zwischen den beiden Variablen.

• H0 ablehnen: Der Zusammenhang ist signifikant.

Page 14: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Achtung

• Statistische Signifikanz ist nicht gleichbedeutend mit praktischer Bedeutsamkeit, daher hier noch Cramers V berechnen, da dieser immer zwischen 0 und 1 liegt und leichter interpretierbar ist.

Page 15: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Beispiel aus Gehring und Weins

Page 16: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Alle erwarteten Häufigkeiten sind größer als 5, daher kann man Χ²-Verteilung verwenden.

Page 17: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Prüfgröße ist kleiner als der kritische Wert von 3.84, daher H0 annehmen

Page 18: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Ausblick für Computerauswertungen

• SPSS gibt p-Werte aus.

• Das ist die genaue Wahrscheinlichkeit, mit der das Stichproben-Ergebnis zustande kommen kann, wenn in der Grundgesamtheit die Nullhypothese gilt.

• Wenn p kleiner ist als das Signifikanzniveau α, wird die Nullhypothese abgelehnt.

• Ist p < .05: signifikant auf dem 5%-Niveau

• Ist p < .01: signifikant auf dem 1%-Niveau

Page 19: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Ausblick für weitere Tests

• Da Χ² immer positiv ist, haben wir die Richtung des Zusammenhangs noch vernachlässigt.

• Eigentlich gehört zur Interpretation noch die Aussage, in welcher Richtung das Ergebnis auftritt (z.B. Frauen wählen eher die Grünen als Männer). Bei anderen Tests ist das auch statistisch ein Unterschied bei der Berechnung.

• Daher führen wir die Unterscheidung zwischen einseitigen und zweiseitigen Alternativhypothesen ein.

Page 20: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Einseitige und zweiseitige Alternativhypothesen

• Bei nominalskalierten Variablen (Chi²)

• H0: Frauen und Männer sind gleich oft Vorgesetzte.

• Zweiseitig: Frauen und Männer sind unterschiedlich oft Vorgesetzte.

• Einseitig: Frauen sind seltener Vorgesetzte als Männer (setzt Theorie oder Vorwissen voraus).

Page 21: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Einseitige und zweiseitige Alternativhypothesen

• Bei einer nominalskalierten und einer intervallskalierten Variablen (T-Test)

• H0: Frauen und Männer sind gleich gut im Sprachtest.

• Zweiseitig: Frauen und Männer sind unterschiedlich gut im Sprachtest.

• Einseitig: Frauen sind besser im Sprachtest als Männer. D.h. hier wird die H0 auch angenommen, wenn die Männer viel besser als die Frauen sind.

Page 22: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Tipp

• Für SPSS: Bei einseitigen Fragestellungen p halbieren!

Page 23: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.
Page 24: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.
Page 25: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Lage des Ablehnungsbereichs

• Hypothese: Frauen sind besser als Männer.

• im Zähler der Formel: xquer Männer – xquer Frauen

• Prüfgröße wird einen negativen Wert annehmen – Ablehnungsbereich muss links sein, d.h. man sucht in der Tabelle die Fläche links von α (=0.05).

• Postuliert die Alternativhypothese dagegen positive Werte der Prüfgröße, liegt der Ablehnungsbereich rechts: Φ = 1 - α

Page 26: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Tipp

• Am besten nennt man immer die Gruppe, von denen man höhere Werte erwartet als erste und schreibt sie auch als erste in die Formel. Dann erwartet man immer positive Werte der Prüfgröße, und der Ablehnungsbereich ist immer rechts.

• H0: μ1 ≤ μ2

• H1: μ1 > μ2

Page 27: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.
Page 28: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Tests für Mittelwertunterschiede

• Ziel: prüfen, ob der Unterschied zweier voneinander unabhängiger Substichproben (z.B. Männer, Frauen) in dem Mittelwert einer intervallskalierten Variable (z.B. Sprachtest) signifikant ist.

• Es geht also um den Zusammenhang zwischen einer nominalskalierten 2-stufigen Variable und einer intervallskalierten Variable.

• Die intervallskalierte Variable ist die abhängige Variable.

Page 29: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Versionen

• Die Standardabweichungen σ1 und σ2 der beiden Teil-Grundgesamtheiten können gleich oder ungleich sein (wir behandeln nur den Fall, dass sie gleich sind, ungleiche σ nur mit SPSS).

• Die Standardabweichungen σ1 und σ2 können bekannt oder unbekannt sein. Wenn sie bekannt sind, wird die z-Verteilung verwendet, wenn sie unbekannt sind, die T-Verteilung.

• Gehring und Weins verwenden aus didaktischen Gründen zunächst auch bei unbekannten σ die z-Verteilung, da sich T an z annähert, wenn beide Substichproben größer als N=30 sind.

Page 30: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Parameter der Prüfgröße

• Höhe des Mittelwertunterschieds im Vergleich zum Mittelwertunterschied bei Gültigkeit der Nullhypothese (meist 0)

• Standardabweichungen der beiden Teilstichproben

• Anzahl der Untersuchungseinheiten in beiden Teilstichproben

Page 31: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

z-Test

Page 32: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Da μ1 – μ2 = 0, vereinfacht sich die Formel zu:

Page 33: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

T-Test

• wird verwendet, wenn σ1 und σ2 unbekannt sind

• diese werden durch s1 und s2 der Stichprobe geschätzt

• wegen dieser Ungenauigkeit wird die T-Tabelle verwendet

• Freiheitsgrade: n1 + n2 – 2

• s1 und s2 werden in Hinblick auf die Größen der beiden Teilstichproben gewichtet

Page 34: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.
Page 35: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.
Page 36: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Vorgehen:

• Null- und Alternativhypothese formulieren• Festlegung der Irrtumswahrscheinlichkeit

(Signifikanzniveau)• Festlegung einer geeigneten Prüfgröße und

Bestimmung ihrer Verteilung• Berechnung des kritischen Werts, ab wann H0 als

abgelehnt gelten soll• Berechnung des empirischen Werts mit den Daten der

Stichprobe• Entscheidung über Annahme oder Ablehnung von H0

und Interpretation

Page 37: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

Beispiel

• 100 Frauen und 100 Männer machen einen Sprachtest, wobei die Frauen im Mittel 25 und die Männer 20 Punkte erreichen (s1=s2=10).

• H0: Frauen und Männer unterscheiden sich nicht im Test oder Männer sind besser.

• H1: Frauen sind im Test besser als Männer.• Irrtumswahrscheinlichkeit 5%• T-Test ist das geeignete Verfahren.• Kritischer Wert: Φ = 1-α = 1.653

(bei 200 df, da 198 nicht tabelliert ist)• Empirischer Wert T = 3.55• Ablehnung der Nullhypothese

Page 38: Hypothesen testen: Grundidee Man erhält in einer Stichprobe ein Maß für den Zusammenhang zweier Variablen. Bei zwei nominalskalierten Variablen: Χ² Bei.

SPSS

• SPSS berechnet, ob beide Varianzen statistisch gleich oder verschieden sind:

• F = s²1 / s²2

• und gibt für beide Möglichkeiten unterschiedliche T-Werte an. Diese unterscheiden sich nur in der Berechnung der Freiheitsgrade.