Curs11 econometrie ipoteze_dv
-
Upload
suciu-bogdan -
Category
Documents
-
view
964 -
download
1
Transcript of Curs11 econometrie ipoteze_dv
ECONOMETRIEECONOMETRIE - - Curs 1Curs 11-1-
TematicTematică C1ă C111
Ipoteze statisticeIpoteze statistice Ipoteza de normalitateIpoteza de normalitate Ipoteza de necorelare sau de Ipoteza de necorelare sau de independenţă a erorilorindependenţă a erorilor
Ipoteza de nIpoteza de normalitateormalitate a erorilora erorilor
1. 1. Formularea problemeiFormularea problemei- erorile erorile εε urmează o lege normală de medie urmează o lege normală de medie
0 şi varianţă 0 şi varianţă σσ22::
2.2. Efectele încălcării acestei ipotezeEfectele încălcării acestei ipoteze- iipoteza de normalitate a erorilor este poteza de normalitate a erorilor este
importantă pentru stabilirea proprietăţilor importantă pentru stabilirea proprietăţilor estimatorilor parametrilor modelului de estimatorilor parametrilor modelului de
regresie.regresie.
),0(N~ 2i
ddacacă , atunci estimatorii parametrilor ă , atunci estimatorii parametrilor modelului de regresie urmează, de modelului de regresie urmează, de asemenea, o lege normală:asemenea, o lege normală:
dacă ipoteza de normalitate este încălcată, dacă ipoteza de normalitate este încălcată, proprietăţile estimatorilor construiţi pe baza proprietăţile estimatorilor construiţi pe baza metodei celor mai mici pătrate au doar metodei celor mai mici pătrate au doar proprietăţi asimptotice, adică necesită proprietăţi asimptotice, adică necesită eşantioane sau seturi mari de date.eşantioane sau seturi mari de date.
),0(N~ 2i
),(~ˆ 2ˆi
ii N
33. Verificarea normalităţii erorilor. Verificarea normalităţii erorilor
- legea normală este definită de funcţia de legea normală este definită de funcţia de densitate de probabilitate care este densitate de probabilitate care este reprezentată grafic prin curba densităţii de reprezentată grafic prin curba densităţii de probabilitate, curbă cu alură de clopot.probabilitate, curbă cu alură de clopot.
33.1. .1. Procedee graficeProcedee grafice - Histograma (curba frecvenHistograma (curba frecvenţei);ţei);- Box-PlotBox-Plot..
a.a. Reprezentarea histogramei şi a curbei Reprezentarea histogramei şi a curbei frecvenţelorfrecvenţelor
- se reprezintă curba frecvenţei sau se reprezintă curba frecvenţei sau histograma reziduurilor şi se observă dacă histograma reziduurilor şi se observă dacă forma distribuţiei acestora are alură de forma distribuţiei acestora are alură de clopot.clopot.
Exemplu: Exemplu:
Histograma şi curba frecvenţelorHistograma şi curba frecvenţelor
210-1-2
Regression Standardized Residual
3,0
2,5
2,0
1,5
1,0
0,5
0,0
Fre
quen
cy
Mean = -1,85E-15Std. Dev. = 0,943N = 10
Dependent Variable: greut
Histogram
b. b. BoxBox--plotplot
33.2. .2. Procedee numericeProcedee numerice
a.a. Testul Kolmogorov-Smirnov-Lilliefors (KSL)Testul Kolmogorov-Smirnov-Lilliefors (KSL)
- presupune compararea frecvenţelor cumulate presupune compararea frecvenţelor cumulate (calculate) cu frecvenţele teoretice cumulate (calculate) cu frecvenţele teoretice cumulate extrase din tabelul Gauss.extrase din tabelul Gauss.
Ipoteze statisticeIpoteze statistice::HH00: ipoteza de normalitate: ipoteza de normalitateHH11: distribuţia erorilor nu urmează o lege normală: distribuţia erorilor nu urmează o lege normală
Regula de decizieRegula de decizie::
valoarea probabilităţii asociate statisticii test valoarea probabilităţii asociate statisticii test calculate (Sig.) se compară cu calculate (Sig.) se compară cu ((0,050,05)): dacă Sig.<0,05, atunci se respinge : dacă Sig.<0,05, atunci se respinge ipoteza de normalitate a erorilor.ipoteza de normalitate a erorilor.
Exemplu:Exemplu:
One-Sample Kolmogorov-Smirnov Test
10
58,5000
7,83511
,276
,161
-,276
,873
,432
N
Mean
Std. Deviation
Normal Parameters a,b
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
greut
Test distribution is Normal.a.
Calculated from data.b.
b. Testul Jarque-Berab. Testul Jarque-Bera
- se bazează pe verificarea simultană a se bazează pe verificarea simultană a proprietăţilor de asimetrie şi boltire ale seriei proprietăţilor de asimetrie şi boltire ale seriei reziduurilor. Pentru o distribuţie normală, reziduurilor. Pentru o distribuţie normală, valoarea coeficientului de asimetrievaloarea coeficientului de asimetrie Fisher Fisher ( (ssww)) este zero, iar valoarea coeficientului de boltireeste zero, iar valoarea coeficientului de boltire FisherFisher ( (kk) este zero.) este zero.
Ipoteze statisticeIpoteze statistice
HH00: ipoteza de normalitate: ipoteza de normalitate
HH11: distribuţia erorilor nu urmează o lege normală: distribuţia erorilor nu urmează o lege normală
Calculul statisticii test:Calculul statisticii test:
statistica test JB se calculează după relaţia:statistica test JB se calculează după relaţia:
unde:unde: ssw w este coeficientul de asimetrie este coeficientul de asimetrie ((SkewnessSkewness): ):
kk este coeficientul de boltire ( este coeficientul de boltire (KurtosisKurtosis):):
46
22 k
swn
JB
33
sw
322
4
k
Regula de decizieRegula de decizie::
Statistica JB urmează o lege .Statistica JB urmează o lege .
- dacă valoarea calculată a statisticii test dacă valoarea calculată a statisticii test JBJBcalccalc>> , , atunci se respinge ipoteza atunci se respinge ipoteza HoHo..
22,
22;
ExempluExemplu
38.24
4
752.0468.0
6
406 22
calcJB
991.522,
02
2, : HrespingeseJBcalc
46
22 k
swn
JB
d. d. Ipoteza de necorelare sau de Ipoteza de necorelare sau de independenţă a erorilor: covindependenţă a erorilor: cov((εεi, i, εεii)=0)=0..
1.1. NoţiuniNoţiuni
a. Autocorelarea. Autocorelareaa sau corelaţia serială : sau corelaţia serială :- presupune existenţa unei autocorelări între presupune existenţa unei autocorelări între
erorile erorile εε, altfel spus: cov(, altfel spus: cov(εεii, , εεjj) ) # # 0 sau M(0 sau M(εεii * *
εεj j ) ) ## 0. 0.
b. Coeficientul de autocorelaţieb. Coeficientul de autocorelaţie
- - coeficientul de autocorelaţie între erorile coeficientul de autocorelaţie între erorile εεii şi şi εεi-1i-1 ale unui model de regresie se calculează ale unui model de regresie se calculează dupădupă
relaţia:relaţia:
- acest coeficient este un coeficient de acest coeficient este un coeficient de autocorelaţie de ordinul 1.autocorelaţie de ordinul 1.
- coeficientul de autocorelaţie de ordinul coeficientul de autocorelaţie de ordinul kk este coeficientul de corelaţie calculat între este coeficientul de corelaţie calculat între termenii termenii εεii şi şi εεi-ki-k , după relaţia:, după relaţia:
21ii
1ii
1ii ),cov(),cov(
2
),cov(),cov(
kii
kii
kii
c.c. Funcţia de autocorelaţieFuncţia de autocorelaţie
este definită de valorile coeficienţilor de este definită de valorile coeficienţilor de autocorelare de ordinul k.autocorelare de ordinul k.
2. Sursa autocorelării erorilor2. Sursa autocorelării erorilor- neincluderea în modelul de regresie a uneia neincluderea în modelul de regresie a uneia
sau mai multor variabile explicative sau mai multor variabile explicative importante;importante;
- modelul de regresie nu este corect specificat.modelul de regresie nu este corect specificat.
3. Testarea autocorelării erorilor3. Testarea autocorelării erorilor
3.1. Runs Test3.1. Runs Test
- se bazează pe ideea că valorile variabilei se bazează pe ideea că valorile variabilei reziduale se constituie în secvenţe sau seturi reziduale se constituie în secvenţe sau seturi de valori pozitive sau negative numite de valori pozitive sau negative numite runsruns, , care se succed într-o anumită ordine sau care se succed într-o anumită ordine sau aleator. aleator.
- ipoteza de bază a acestui test este aceea că ipoteza de bază a acestui test este aceea că în cazul lipsei autocorelării erorilor în cazul lipsei autocorelării erorilor succesiunea succesiunea acestor seturi (acestor seturi (runsruns, notate , notate kk)) este aleatoare sau numărul acestora este este aleatoare sau numărul acestora este distribuit normal.distribuit normal.
Ipoteze statisticeIpoteze statistice
HH00: k este distribuit normal (nu există autocorelare a : k este distribuit normal (nu există autocorelare a erorilor)erorilor)
HH11: k nu este distribuit normal (ipoteza este : k nu este distribuit normal (ipoteza este încălcată)încălcată)
Calculul statisticii testCalculul statisticii test- se foloseşte statistica t Student, calculată după se foloseşte statistica t Student, calculată după
relaţia: relaţia:
unde: unde: kk este numărul de este numărul de runs runs caracterizat prin:caracterizat prin:
kcalc s
kMkt
)(
1nn
nn2)k(M
21
21
)1()(
22
212
21
212121
2
nnnn
nnnnnnsk
nn11 este numărul de valori pozitive ale este numărul de valori pozitive ale erorilorerorilor eeii ;; nn22 este numărul de valori negative ale este numărul de valori negative ale erorilorerorilor eeii,, cu cu nn11 + n + n22 = n . = n . ss22
kk este o valoare calculată la nivelul este o valoare calculată la nivelul eşantionului a estimatorului eşantionului a estimatorului
Regula de decizie:Regula de decizie:- dacă dacă ||ttcalccalc| | ttaa/2,n-2 /2,n-2 sausau , , atunci se atunci se accacceptă ipoteza Heptă ipoteza H00..
kskMk 96,1)(
2ˆ k
Exemplu:Exemplu:
Pentru două variabile,Pentru două variabile, X X şi şi YY, se cunosc , se cunosc următoarele valori xurmătoarele valori xii, y, yii şi e şi eii (erori estimate (erori estimate ale modelului de regresie liniară simplă):ale modelului de regresie liniară simplă):
Nr.crt. xi yi ei
1 1 20 -3,07508-3,07508
2 2 21 -3,05303-3,05303
3 3 22 -3,03099-3,03099
4 4 24 -2,00894-2,00894
5 5 25 -1,98689-1,98689
6 7 27 -1,94280-1,94280
7 8 29 -,92075-,92075
8 9 30 -,89871-,89871
9 10 32 ,12334,12334
10 12 35 1,167431,16743
11 13 37 2,189482,18948
12 15 39 2,233572,23357
13 17 40 1,277661,27766
14 19 43 2,321762,32176
15 20 45 3,343803,34380
16 22 47 3,387903,38790
17 23 48 3,409943,40994
18 25 49 2,454032,45403
19 27 50 1,498131,49813
20 29 52 1,542221,54222
21 30 54 2,564272,56427
22 32 55 1,608361,60836
23 35 57 ,67450,67450
24 37 58 -,28141-,28141
25 39 59 -1,23732-1,23732
26 40 61 -,21527-,21527
27 43 62 -2,14913-2,14913
28 45 63 -3,10504-3,10504
29 47 66 -2,06094-2,06094
30 50 70 -,99481-,99481
31 52 71 -1,95071-1,95071
32 55 75 -,88457-,88457
Să se testeze ipoteza de autocorelare a erorilor, Să se testeze ipoteza de autocorelare a erorilor, folosind testul Runs.folosind testul Runs.
Rezolvare:Rezolvare:
- În funcţie de semnul valorilor erorilor În funcţie de semnul valorilor erorilor eeii se se pot identifica următoarele seturi sau pot identifica următoarele seturi sau runsruns::
(----(----……-----)(-----)(+++…+++)(+++…+++)((----(----……-----)-----)
(primele 8 valori ale erorilor (primele 8 valori ale erorilor eeii sunt negative, sunt negative, următoarele 15 valori sunt pozitive iar următoarele 15 valori sunt pozitive iar ultimele ultimele 99 valori sunt negative). valori sunt negative).
Astfel, numărul total de valori pozitive ale Astfel, numărul total de valori pozitive ale erorilor erorilor eeii este neste n11=15 iar numărul total de =15 iar numărul total de valori negative este nvalori negative este n22=1=177..
NumNumărărul de seturi ul de seturi de valori sau de valori sau runsruns formate formate este keste k=3.=3.
Pentru testarea statistică se parcurg Pentru testarea statistică se parcurg următoarele etape:următoarele etape:
Ipoteze statisticeIpoteze statistice
HH00: erorile nu sunt autocorelate: erorile nu sunt autocorelate
HH11: erorile sunt autocorelate: erorile sunt autocorelate
Calculul statisticii test:Calculul statisticii test:
unde:unde:
kcalc s
kMkt
)(
12)(21
21
nn
nnkM
Calculul valorilor M(k) şi s(k):Calculul valorilor M(k) şi s(k):
94,1611715
1715212)(
21
21
nn
nnkM
6796,7)11715()1715(
17151715217152
)1()(
22
221
221
212121
2
nnnn
nnnnnnsk
7712,26796,7 ks
Calculul statisticii test:Calculul statisticii test:
Regula de decizie:Regula de decizie:
||ttcalccalc ||==44,,8585>t>ttabtab==11,,9696 : se respinge ipoteza H : se respinge ipoteza Hoo, , deci erorile sunt autocorelate între ele.deci erorile sunt autocorelate între ele.
SAUSAU
Numărul de seturi de valori k=3 nu este acoperit Numărul de seturi de valori k=3 nu este acoperit de intervalul de încredere, ceea ce arată că se de intervalul de încredere, ceea ce arată că se respinge ipoteza Ho.respinge ipoteza Ho.
85,4)(
kcalc s
kMkt
)37,22;51,11()7712,296,194,16(
Testul Runs în SPSSTestul Runs în SPSS
Runs Test 2
,0000000
17
15
32
3
-4,849
,000
Test Valuea
Cases < Test Value
Cases >= Test Value
Total Cases
Number of Runs
Z
Asymp. Sig. (2-tailed)
Unstandardized Residual
Meana.
3.2. Testul Durbin-Watson3.2. Testul Durbin-Watson
Ipoteze statistice:Ipoteze statistice:
HH00: erorile nu sunt autocorelate : erorile nu sunt autocorelate (( = 0) = 0) HH11: erorile sunt autocorelate : erorile sunt autocorelate (( 0 ) 0 )
Calculul statisticii test:Calculul statisticii test:
1
2
21
2
ˆ
)ˆˆ(
ii
ii
i
dDW
Întrucât Întrucât statistica statistica DWDW se mai poate se mai poate scrie astfel: scrie astfel:
Deoarece Deoarece , valorile statisticii , valorile statisticii DW DW sunt sunt date de intervalul:date de intervalul:
i1ii u
)ˆ1(2ˆ
ˆˆ
12ˆ
ˆˆˆ
2ˆ
ˆˆˆ2ˆ
d
i
2i
1ii
i
i
2i
1ii
ii
2i
i
2i
i
21i1i
ii
i
2i
1ˆ1
4d0
Interpretare:Interpretare:
Dacă Dacă , atunci există autocorelare , atunci există autocorelare pozitivă maximă a erorilor;pozitivă maximă a erorilor;
Dacă Dacă , atunci , atunci existexistă autocorelare ă autocorelare negativă maximă a erorilor;negativă maximă a erorilor;
Dacă Dacă , atunci nu există autocorelare. , atunci nu există autocorelare.
01ˆ d
41ˆ d
2d0ˆ
Regula de decizie:Regula de decizie:
Valorile teoretice ale statisticii DW sunt Valorile teoretice ale statisticii DW sunt calculate şi tabelate în funcţie de pragul de calculate şi tabelate în funcţie de pragul de semnificaţie, de volumul eşantionului şi de semnificaţie, de volumul eşantionului şi de numărul de numărul de parametri ai modeluluiparametri ai modelului. .
În tabele se determină două valori critice, În tabele se determină două valori critice, notate cu dnotate cu dLL (limita inferioară) şi d (limita inferioară) şi dUU (limita (limita superioară).superioară).
În funcţie de aceste valori critice se În funcţie de aceste valori critice se determină următoarele intervale, care determină următoarele intervale, care permit luarea deciziei de respingere sau permit luarea deciziei de respingere sau acceptare a ipotezei nule:acceptare a ipotezei nule:
a.a. (0<(0<ddcalccalc<d<dLL) se respinge ipoteza H) se respinge ipoteza Hoo, erorile , erorile înregistrează o autocorelare pozitivă;înregistrează o autocorelare pozitivă;
b. (db. (dLL<<ddcalccalc<d<dUU) şi (4-d) şi (4-duu<<ddcalccalc< 4-d< 4-dLL) sunt regiuni ) sunt regiuni de nedeterminare, nu se poate decide de nedeterminare, nu se poate decide asupra existenţei autocorelării erorilor;asupra existenţei autocorelării erorilor;
c. (dc. (duu < <ddcalccalc< 4- d< 4- duu) se acceptă ipoteza H) se acceptă ipoteza Hoo, , erorile nu sunt autocorelate; erorile nu sunt autocorelate;
d. (4-dd. (4-dLL < <ddcalccalc< 4) se respinge ipoteza H< 4) se respinge ipoteza Hoo, erorile , erorile înregistrează o autocorelare negativă.înregistrează o autocorelare negativă.
Exemplu:Exemplu:1. 1. În studiul legăturii dintre două variabile, X şi În studiul legăturii dintre două variabile, X şi
Y, observate pentru un eşantion format din Y, observate pentru un eşantion format din 25 unităţi statistice, s-a obţinut o valoare 25 unităţi statistice, s-a obţinut o valoare calculată a statisticiicalculată a statisticii
ddcalccalc =0,189. Să se testeze ipoteza de =0,189. Să se testeze ipoteza de autocorelare a erorilor, considerând un risc de autocorelare a erorilor, considerând un risc de 0,05.0,05.
Rezolvare:Rezolvare:Din tabelul Durbin Watson, se citesc valorile:Din tabelul Durbin Watson, se citesc valorile:
ddLL=1,288; d=1,288; dUU=1,454. =1,454.
0<(0<(ddcalccalc=0,189)<(d=0,189)<(dLL=1,288), ceea ce arată că se =1,288), ceea ce arată că se respinge ipoteza Hrespinge ipoteza Hoo, deci erorile sunt , deci erorile sunt autocorelate pozitiv între ele.autocorelate pozitiv între ele.
2. Pentru un esantion de 5 unitati, pentru 2. Pentru un esantion de 5 unitati, pentru studiul legaturii liniare dintre doustudiul legaturii liniare dintre două variabile, ă variabile, XX şi şi YY, se cunosc , se cunosc dateledatele::
Model Summaryb
,985a ,970 ,960 2,41523 1,429Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Durbin-Watson
Predictors: (Constant), Xa.
Dependent Variable: Yb.
Calculul statisticii test:Calculul statisticii test:
InterpretareInterpretare::
Din tabelul Durbin Watson se citesc Din tabelul Durbin Watson se citesc valorile: dvalorile: dLL=0,610; d=0,610; dUU=1,400.=1,400.
În exemplul dat:În exemplul dat:
(d(duu=1,400)<(=1,400)<(ddcalccalc=1,=1,4429)<(4-1,4), ceea 29)<(4-1,4), ceea ce arată că se acceptă ipoteza Hce arată că se acceptă ipoteza Hoo, , erorile nu sunt autocorelate.erorile nu sunt autocorelate.