Formuleblad Statistiek - Departement Filosofie en...

3
Formuleblad Statistiek Populatie en steekproef Gegeven een populatie met scores X 1 ,...,X N en gemiddelde μ, zijn variantie σ 2 en standaardafwijking σ van de populatie gedefinieerd als σ 2 = N i=1 (X i - μ) 2 N σ = σ 2 . Gegeven een steekproef met scores X 1 ,...,X n en gemiddelde X zijn variantie s 2 en standaardafwijking s van de steekproef gedefinieerd als s 2 = n i=1 (X i - X) 2 n - 1 s = s 2 . Als de standaardafwijking van de populatie bekend en gelijk aan σ is, dan is de standaardafwijking van de verdeling van het steekproefgemiddelde: σ X = σ n , waarbij n de grootte van de steekproef is. Als de standaardafwijking van de populatie onbekend is, dan wordt voor de standaardafwijking van de verdeling van het steekproefgemiddelde genomen: s X = s n . Twee populaties en twee steekproeven Bij twee steekproeven X 1 en X 2 , waarbij X 11 ,...,X 1n 1 de scores van X 1 en X 21 ,...,X 2n 2 de scores van steekproef X 2 zijn, dan geldt voor de verdeling van het verschil tussen de twee steekproefgemiddeldes het volgende. Als de standaardafwijkingen van de bijbehorende populaties bekend en gelijk aan σ zijn, dan is de standaardafwijking vande verdeling van het verschil van de twee steekproefgemiddeldes: σ X1- X2 = r σ 2 ( 1 n 1 + 1 n 2 ), waarbij n 1 de grootte van steekproef X 1 en n 2 die van X 2 is. Als de stan- daardafwijkingen van de populaties gelijk maar onbekend zijn en s 1 is de stan- daardafwijking van steekproef X 1 en s 2 die van X 2 , dan wordt voor de stan- daardafwijking van de verdeling van het verschil tussen de twee steekproefgemid- deldes genomen: s X1- X2 = r s 2 ( 1 n 1 + 1 n 2 ), waarbij s 2 is: s 2 = n1 i=1 (X 1i - X 1 ) 2 + n2 j=1 (X 2j - X 2 ) 2 n 1 + n 2 - 2 = s 2 1 (n 1 - 1) + s 2 2 (n 2 - 1) n 1 + n 2 - 2 . 1

Transcript of Formuleblad Statistiek - Departement Filosofie en...

Page 1: Formuleblad Statistiek - Departement Filosofie en ...phil.uu.nl/statistiek/jaar/2011-2012/formulebladstat2.pdfFormuleblad Statistiek Populatie en steekproef Gegeven een populatie met

Formuleblad Statistiek

Populatie en steekproef

Gegeven een populatie met scores X1, . . . , XN en gemiddelde µ, zijn variantieσ2 en standaardafwijking σ van de populatie gedefinieerd als

σ2 =∑Ni=1(Xi − µ)2

Nσ =√σ2.

Gegeven een steekproef met scores X1, . . . , Xn en gemiddelde X zijn varianties2 en standaardafwijking s van de steekproef gedefinieerd als

s2 =∑ni=1(Xi −X)2

n− 1s =√s2.

Als de standaardafwijking van de populatie bekend en gelijk aan σ is, dan is destandaardafwijking van de verdeling van het steekproefgemiddelde:

σX =σ√n,

waarbij n de grootte van de steekproef is. Als de standaardafwijking van depopulatie onbekend is, dan wordt voor de standaardafwijking van de verdelingvan het steekproefgemiddelde genomen:

sX =s√n.

Twee populaties en twee steekproeven

Bij twee steekproeven X1 en X2, waarbij X11 , . . . , X1n1de scores van X1 en

X21 , . . . , X2n2de scores van steekproef X2 zijn, dan geldt voor de verdeling

van het verschil tussen de twee steekproefgemiddeldes het volgende. Als destandaardafwijkingen van de bijbehorende populaties bekend en gelijk aan σzijn, dan is de standaardafwijking van de verdeling van het verschil van de tweesteekproefgemiddeldes:

σX1−X2=

√σ2(

1n1

+1n2

),

waarbij n1 de grootte van steekproef X1 en n2 die van X2 is. Als de stan-daardafwijkingen van de populaties gelijk maar onbekend zijn en s1 is de stan-daardafwijking van steekproef X1 en s2 die van X2, dan wordt voor de stan-daardafwijking van de verdeling van het verschil tussen de twee steekproefgemid-deldes genomen:

sX1−X2=

√s2(

1n1

+1n2

),

waarbij s2 is:

s2 =

∑n1i=1(X1i

−X1)2 +∑n2j=1(X2j

−X2)2

n1 + n2 − 2=s21(n1 − 1) + s22(n2 − 1)

n1 + n2 − 2.

1

Page 2: Formuleblad Statistiek - Departement Filosofie en ...phil.uu.nl/statistiek/jaar/2011-2012/formulebladstat2.pdfFormuleblad Statistiek Populatie en steekproef Gegeven een populatie met

Power

Bij significantieniveau α, grootte van het effect ES en variantie σ2, is voor eentoets met power (1− β) een steekproefgrootte

n =σ2(zβ − zα)2

(ES)2

nodig. Hierbij is zα de standaard kritische waarde bij significantieniveau α, enzβ de corresponderende standaard kritische waarde in de verdeling van Ha bijde gegeven grootte van het effect.Indien de variantie van de populatie onbekend is wordt die van de steekproefgebruikt:

n =s2(zβ − zα)2

(ES)2

Correlatie en regressie

Gegeven twee stochasten X en Y , waarbij (Xi, Yi) de score van element i is ineen steekproef ter grootte n, is de Pearson correlatiecoefficient:

r =∑zXzYn− 1

=∑ni=1 zXi

zYi

n− 1.

Waarbij zXi, zYi

de standaarscores van Xi, Yi t.o.v. de steekproef zijn:

zXi=Xi −XsX

zYi=Yi − YsY

.

Gebruikmakend van de notatie x = X −X:

r =∑xy√∑x2

∑y2

=∑ni=1 xiyi√∑n

i=1 x2i

∑ni=1 y

2i

.

Ook geldt

r =n

∑XY −

∑X

∑Y√

(n∑X2 − (

∑X)2)(n

∑Y 2 − (

∑Y )2)

.

In de regressielijn Y = bX + a is de regressiecoefficient b is gedefinieerd als:

b = rsYsX

.

waarbij sX en sY de standaardafwijking van respectievelijk X en Y zijn. Deregressieconstante a is gedefinieerd als:

a = Y − bX.

Wanneer zY de standaardscores van Y en zX van X aanduiden, dan geldt dat

zY = rzX .

2

Page 3: Formuleblad Statistiek - Departement Filosofie en ...phil.uu.nl/statistiek/jaar/2011-2012/formulebladstat2.pdfFormuleblad Statistiek Populatie en steekproef Gegeven een populatie met

De standaardfout van de schatting, sY ·X , is gedefinieerd als de standaardafwijkingvan de stochast (Y − Y ) bij n− 1 scores. D.w.z., voor Z = (Y − Y ):

sY ·X =

√∑(Z − Z)2

n− 2= sY

√1− r2

√(n− 1)/(n− 2).

Integreren

In het volgende is c een constante ongelijk 0, n een geheel getal ongelijk 0 enongelijk -1, en x een variabele.

functie primitievec 0

xn xn+1

n+1

cx c ln(x)

ecx ecx

c

Verder geldt dat als F (x) en G(x) de primitieven van respectievelijk f(x) eng(x) zijn, dan is cF (x) de primitieve van cf(x) en F (x) +G(x) is de primitievevan f(x) + g(x).

3