Curs11 econometrie ipoteze_dv

40
ECONOMETRIE ECONOMETRIE - - Curs 1 Curs 1 1- 1-

Transcript of Curs11 econometrie ipoteze_dv

Page 1: Curs11 econometrie ipoteze_dv

ECONOMETRIEECONOMETRIE - - Curs 1Curs 11-1-

Page 2: Curs11 econometrie ipoteze_dv

TematicTematică C1ă C111

Ipoteze statisticeIpoteze statistice Ipoteza de normalitateIpoteza de normalitate Ipoteza de necorelare sau de Ipoteza de necorelare sau de independenţă a erorilorindependenţă a erorilor

Page 3: Curs11 econometrie ipoteze_dv

Ipoteza de nIpoteza de normalitateormalitate a erorilora erorilor

1. 1. Formularea problemeiFormularea problemei- erorile erorile εε urmează o lege normală de medie urmează o lege normală de medie

0 şi varianţă 0 şi varianţă σσ22::

2.2. Efectele încălcării acestei ipotezeEfectele încălcării acestei ipoteze- iipoteza de normalitate a erorilor este poteza de normalitate a erorilor este

importantă pentru stabilirea proprietăţilor importantă pentru stabilirea proprietăţilor estimatorilor parametrilor modelului de estimatorilor parametrilor modelului de

regresie.regresie.

),0(N~ 2i

Page 4: Curs11 econometrie ipoteze_dv

ddacacă , atunci estimatorii parametrilor ă , atunci estimatorii parametrilor modelului de regresie urmează, de modelului de regresie urmează, de asemenea, o lege normală:asemenea, o lege normală:

dacă ipoteza de normalitate este încălcată, dacă ipoteza de normalitate este încălcată, proprietăţile estimatorilor construiţi pe baza proprietăţile estimatorilor construiţi pe baza metodei celor mai mici pătrate au doar metodei celor mai mici pătrate au doar proprietăţi asimptotice, adică necesită proprietăţi asimptotice, adică necesită eşantioane sau seturi mari de date.eşantioane sau seturi mari de date.

),0(N~ 2i

),(~ˆ 2ˆi

ii N

Page 5: Curs11 econometrie ipoteze_dv

33. Verificarea normalităţii erorilor. Verificarea normalităţii erorilor

- legea normală este definită de funcţia de legea normală este definită de funcţia de densitate de probabilitate care este densitate de probabilitate care este reprezentată grafic prin curba densităţii de reprezentată grafic prin curba densităţii de probabilitate, curbă cu alură de clopot.probabilitate, curbă cu alură de clopot.

33.1. .1. Procedee graficeProcedee grafice - Histograma (curba frecvenHistograma (curba frecvenţei);ţei);- Box-PlotBox-Plot..

Page 6: Curs11 econometrie ipoteze_dv

a.a. Reprezentarea histogramei şi a curbei Reprezentarea histogramei şi a curbei frecvenţelorfrecvenţelor

- se reprezintă curba frecvenţei sau se reprezintă curba frecvenţei sau histograma reziduurilor şi se observă dacă histograma reziduurilor şi se observă dacă forma distribuţiei acestora are alură de forma distribuţiei acestora are alură de clopot.clopot.

Exemplu: Exemplu:

Page 7: Curs11 econometrie ipoteze_dv

Histograma şi curba frecvenţelorHistograma şi curba frecvenţelor

210-1-2

Regression Standardized Residual

3,0

2,5

2,0

1,5

1,0

0,5

0,0

Fre

quen

cy

Mean = -1,85E-15Std. Dev. = 0,943N = 10

Dependent Variable: greut

Histogram

Page 8: Curs11 econometrie ipoteze_dv

b. b. BoxBox--plotplot

Page 9: Curs11 econometrie ipoteze_dv

33.2. .2. Procedee numericeProcedee numerice

a.a. Testul Kolmogorov-Smirnov-Lilliefors (KSL)Testul Kolmogorov-Smirnov-Lilliefors (KSL)

- presupune compararea frecvenţelor cumulate presupune compararea frecvenţelor cumulate (calculate) cu frecvenţele teoretice cumulate (calculate) cu frecvenţele teoretice cumulate extrase din tabelul Gauss.extrase din tabelul Gauss.

Ipoteze statisticeIpoteze statistice::HH00: ipoteza de normalitate: ipoteza de normalitateHH11: distribuţia erorilor nu urmează o lege normală: distribuţia erorilor nu urmează o lege normală

Regula de decizieRegula de decizie::

Page 10: Curs11 econometrie ipoteze_dv

valoarea probabilităţii asociate statisticii test valoarea probabilităţii asociate statisticii test calculate (Sig.) se compară cu calculate (Sig.) se compară cu ((0,050,05)): dacă Sig.<0,05, atunci se respinge : dacă Sig.<0,05, atunci se respinge ipoteza de normalitate a erorilor.ipoteza de normalitate a erorilor.

Exemplu:Exemplu:

Page 11: Curs11 econometrie ipoteze_dv

One-Sample Kolmogorov-Smirnov Test

10

58,5000

7,83511

,276

,161

-,276

,873

,432

N

Mean

Std. Deviation

Normal Parameters a,b

Absolute

Positive

Negative

Most ExtremeDifferences

Kolmogorov-Smirnov Z

Asymp. Sig. (2-tailed)

greut

Test distribution is Normal.a.

Calculated from data.b.

Page 12: Curs11 econometrie ipoteze_dv

b. Testul Jarque-Berab. Testul Jarque-Bera

- se bazează pe verificarea simultană a se bazează pe verificarea simultană a proprietăţilor de asimetrie şi boltire ale seriei proprietăţilor de asimetrie şi boltire ale seriei reziduurilor. Pentru o distribuţie normală, reziduurilor. Pentru o distribuţie normală, valoarea coeficientului de asimetrievaloarea coeficientului de asimetrie Fisher Fisher ( (ssww)) este zero, iar valoarea coeficientului de boltireeste zero, iar valoarea coeficientului de boltire FisherFisher ( (kk) este zero.) este zero.

Ipoteze statisticeIpoteze statistice

HH00: ipoteza de normalitate: ipoteza de normalitate

HH11: distribuţia erorilor nu urmează o lege normală: distribuţia erorilor nu urmează o lege normală

Page 13: Curs11 econometrie ipoteze_dv

Calculul statisticii test:Calculul statisticii test:

statistica test JB se calculează după relaţia:statistica test JB se calculează după relaţia:

unde:unde: ssw w este coeficientul de asimetrie este coeficientul de asimetrie ((SkewnessSkewness): ):

kk este coeficientul de boltire ( este coeficientul de boltire (KurtosisKurtosis):):

46

22 k

swn

JB

33

sw

322

4

k

Page 14: Curs11 econometrie ipoteze_dv

Regula de decizieRegula de decizie::

Statistica JB urmează o lege .Statistica JB urmează o lege .

- dacă valoarea calculată a statisticii test dacă valoarea calculată a statisticii test JBJBcalccalc>> , , atunci se respinge ipoteza atunci se respinge ipoteza HoHo..

22,

22;

Page 15: Curs11 econometrie ipoteze_dv

ExempluExemplu

38.24

4

752.0468.0

6

406 22

calcJB

991.522,

02

2, : HrespingeseJBcalc

46

22 k

swn

JB

Page 16: Curs11 econometrie ipoteze_dv

d. d. Ipoteza de necorelare sau de Ipoteza de necorelare sau de independenţă a erorilor: covindependenţă a erorilor: cov((εεi, i, εεii)=0)=0..

1.1. NoţiuniNoţiuni

a. Autocorelarea. Autocorelareaa sau corelaţia serială : sau corelaţia serială :- presupune existenţa unei autocorelări între presupune existenţa unei autocorelări între

erorile erorile εε, altfel spus: cov(, altfel spus: cov(εεii, , εεjj) ) # # 0 sau M(0 sau M(εεii * *

εεj j ) ) ## 0. 0.

b. Coeficientul de autocorelaţieb. Coeficientul de autocorelaţie

- - coeficientul de autocorelaţie între erorile coeficientul de autocorelaţie între erorile εεii şi şi εεi-1i-1 ale unui model de regresie se calculează ale unui model de regresie se calculează dupădupă

Page 17: Curs11 econometrie ipoteze_dv

relaţia:relaţia:

- acest coeficient este un coeficient de acest coeficient este un coeficient de autocorelaţie de ordinul 1.autocorelaţie de ordinul 1.

- coeficientul de autocorelaţie de ordinul coeficientul de autocorelaţie de ordinul kk este coeficientul de corelaţie calculat între este coeficientul de corelaţie calculat între termenii termenii εεii şi şi εεi-ki-k , după relaţia:, după relaţia:

21ii

1ii

1ii ),cov(),cov(

2

),cov(),cov(

kii

kii

kii

Page 18: Curs11 econometrie ipoteze_dv

c.c. Funcţia de autocorelaţieFuncţia de autocorelaţie

este definită de valorile coeficienţilor de este definită de valorile coeficienţilor de autocorelare de ordinul k.autocorelare de ordinul k.

2. Sursa autocorelării erorilor2. Sursa autocorelării erorilor- neincluderea în modelul de regresie a uneia neincluderea în modelul de regresie a uneia

sau mai multor variabile explicative sau mai multor variabile explicative importante;importante;

- modelul de regresie nu este corect specificat.modelul de regresie nu este corect specificat.

3. Testarea autocorelării erorilor3. Testarea autocorelării erorilor

Page 19: Curs11 econometrie ipoteze_dv

3.1. Runs Test3.1. Runs Test

- se bazează pe ideea că valorile variabilei se bazează pe ideea că valorile variabilei reziduale se constituie în secvenţe sau seturi reziduale se constituie în secvenţe sau seturi de valori pozitive sau negative numite de valori pozitive sau negative numite runsruns, , care se succed într-o anumită ordine sau care se succed într-o anumită ordine sau aleator. aleator.

- ipoteza de bază a acestui test este aceea că ipoteza de bază a acestui test este aceea că în cazul lipsei autocorelării erorilor în cazul lipsei autocorelării erorilor succesiunea succesiunea acestor seturi (acestor seturi (runsruns, notate , notate kk)) este aleatoare sau numărul acestora este este aleatoare sau numărul acestora este distribuit normal.distribuit normal.

Page 20: Curs11 econometrie ipoteze_dv

Ipoteze statisticeIpoteze statistice

HH00: k este distribuit normal (nu există autocorelare a : k este distribuit normal (nu există autocorelare a erorilor)erorilor)

HH11: k nu este distribuit normal (ipoteza este : k nu este distribuit normal (ipoteza este încălcată)încălcată)

Calculul statisticii testCalculul statisticii test- se foloseşte statistica t Student, calculată după se foloseşte statistica t Student, calculată după

relaţia: relaţia:

unde: unde: kk este numărul de este numărul de runs runs caracterizat prin:caracterizat prin:

kcalc s

kMkt

)(

Page 21: Curs11 econometrie ipoteze_dv

1nn

nn2)k(M

21

21

)1()(

22

212

21

212121

2

nnnn

nnnnnnsk

Page 22: Curs11 econometrie ipoteze_dv

nn11 este numărul de valori pozitive ale este numărul de valori pozitive ale erorilorerorilor eeii ;; nn22 este numărul de valori negative ale este numărul de valori negative ale erorilorerorilor eeii,, cu cu nn11 + n + n22 = n . = n . ss22

kk este o valoare calculată la nivelul este o valoare calculată la nivelul eşantionului a estimatorului eşantionului a estimatorului

Regula de decizie:Regula de decizie:- dacă dacă ||ttcalccalc| | ttaa/2,n-2 /2,n-2 sausau , , atunci se atunci se accacceptă ipoteza Heptă ipoteza H00..

kskMk 96,1)(

2ˆ k

Page 23: Curs11 econometrie ipoteze_dv

Exemplu:Exemplu:

Pentru două variabile,Pentru două variabile, X X şi şi YY, se cunosc , se cunosc următoarele valori xurmătoarele valori xii, y, yii şi e şi eii (erori estimate (erori estimate ale modelului de regresie liniară simplă):ale modelului de regresie liniară simplă):

Page 24: Curs11 econometrie ipoteze_dv

Nr.crt. xi yi ei

1 1 20 -3,07508-3,07508

2 2 21 -3,05303-3,05303

3 3 22 -3,03099-3,03099

4 4 24 -2,00894-2,00894

5 5 25 -1,98689-1,98689

6 7 27 -1,94280-1,94280

7 8 29 -,92075-,92075

8 9 30 -,89871-,89871

9 10 32 ,12334,12334

10 12 35 1,167431,16743

11 13 37 2,189482,18948

12 15 39 2,233572,23357

13 17 40 1,277661,27766

14 19 43 2,321762,32176

15 20 45 3,343803,34380

Page 25: Curs11 econometrie ipoteze_dv

16 22 47 3,387903,38790

17 23 48 3,409943,40994

18 25 49 2,454032,45403

19 27 50 1,498131,49813

20 29 52 1,542221,54222

21 30 54 2,564272,56427

22 32 55 1,608361,60836

23 35 57 ,67450,67450

24 37 58 -,28141-,28141

25 39 59 -1,23732-1,23732

26 40 61 -,21527-,21527

27 43 62 -2,14913-2,14913

28 45 63 -3,10504-3,10504

29 47 66 -2,06094-2,06094

30 50 70 -,99481-,99481

31 52 71 -1,95071-1,95071

32 55 75 -,88457-,88457

Page 26: Curs11 econometrie ipoteze_dv

Să se testeze ipoteza de autocorelare a erorilor, Să se testeze ipoteza de autocorelare a erorilor, folosind testul Runs.folosind testul Runs.

Rezolvare:Rezolvare:

- În funcţie de semnul valorilor erorilor În funcţie de semnul valorilor erorilor eeii se se pot identifica următoarele seturi sau pot identifica următoarele seturi sau runsruns::

(----(----……-----)(-----)(+++…+++)(+++…+++)((----(----……-----)-----)

(primele 8 valori ale erorilor (primele 8 valori ale erorilor eeii sunt negative, sunt negative, următoarele 15 valori sunt pozitive iar următoarele 15 valori sunt pozitive iar ultimele ultimele 99 valori sunt negative). valori sunt negative).

Page 27: Curs11 econometrie ipoteze_dv

Astfel, numărul total de valori pozitive ale Astfel, numărul total de valori pozitive ale erorilor erorilor eeii este neste n11=15 iar numărul total de =15 iar numărul total de valori negative este nvalori negative este n22=1=177..

NumNumărărul de seturi ul de seturi de valori sau de valori sau runsruns formate formate este keste k=3.=3.

Pentru testarea statistică se parcurg Pentru testarea statistică se parcurg următoarele etape:următoarele etape:

Page 28: Curs11 econometrie ipoteze_dv

Ipoteze statisticeIpoteze statistice

HH00: erorile nu sunt autocorelate: erorile nu sunt autocorelate

HH11: erorile sunt autocorelate: erorile sunt autocorelate

Calculul statisticii test:Calculul statisticii test:

unde:unde:

kcalc s

kMkt

)(

12)(21

21

nn

nnkM

Page 29: Curs11 econometrie ipoteze_dv

Calculul valorilor M(k) şi s(k):Calculul valorilor M(k) şi s(k):

94,1611715

1715212)(

21

21

nn

nnkM

6796,7)11715()1715(

17151715217152

)1()(

22

221

221

212121

2

nnnn

nnnnnnsk

7712,26796,7 ks

Page 30: Curs11 econometrie ipoteze_dv

Calculul statisticii test:Calculul statisticii test:

Regula de decizie:Regula de decizie:

||ttcalccalc ||==44,,8585>t>ttabtab==11,,9696 : se respinge ipoteza H : se respinge ipoteza Hoo, , deci erorile sunt autocorelate între ele.deci erorile sunt autocorelate între ele.

SAUSAU

Numărul de seturi de valori k=3 nu este acoperit Numărul de seturi de valori k=3 nu este acoperit de intervalul de încredere, ceea ce arată că se de intervalul de încredere, ceea ce arată că se respinge ipoteza Ho.respinge ipoteza Ho.

85,4)(

kcalc s

kMkt

)37,22;51,11()7712,296,194,16(

Page 31: Curs11 econometrie ipoteze_dv

Testul Runs în SPSSTestul Runs în SPSS

Runs Test 2

,0000000

17

15

32

3

-4,849

,000

Test Valuea

Cases < Test Value

Cases >= Test Value

Total Cases

Number of Runs

Z

Asymp. Sig. (2-tailed)

Unstandardized Residual

Meana.

Page 32: Curs11 econometrie ipoteze_dv

3.2. Testul Durbin-Watson3.2. Testul Durbin-Watson

Ipoteze statistice:Ipoteze statistice:

HH00: erorile nu sunt autocorelate : erorile nu sunt autocorelate (( = 0) = 0) HH11: erorile sunt autocorelate : erorile sunt autocorelate (( 0 ) 0 )

Calculul statisticii test:Calculul statisticii test:

1

2

21

2

ˆ

)ˆˆ(

ii

ii

i

dDW

Page 33: Curs11 econometrie ipoteze_dv

Întrucât Întrucât statistica statistica DWDW se mai poate se mai poate scrie astfel: scrie astfel:

Deoarece Deoarece , valorile statisticii , valorile statisticii DW DW sunt sunt date de intervalul:date de intervalul:

i1ii u

)ˆ1(2ˆ

ˆˆ

12ˆ

ˆˆˆ

ˆˆˆ2ˆ

d

i

2i

1ii

i

i

2i

1ii

ii

2i

i

2i

i

21i1i

ii

i

2i

1ˆ1

4d0

Page 34: Curs11 econometrie ipoteze_dv

Interpretare:Interpretare:

Dacă Dacă , atunci există autocorelare , atunci există autocorelare pozitivă maximă a erorilor;pozitivă maximă a erorilor;

Dacă Dacă , atunci , atunci existexistă autocorelare ă autocorelare negativă maximă a erorilor;negativă maximă a erorilor;

Dacă Dacă , atunci nu există autocorelare. , atunci nu există autocorelare.

01ˆ d

41ˆ d

2d0ˆ

Page 35: Curs11 econometrie ipoteze_dv

Regula de decizie:Regula de decizie:

Valorile teoretice ale statisticii DW sunt Valorile teoretice ale statisticii DW sunt calculate şi tabelate în funcţie de pragul de calculate şi tabelate în funcţie de pragul de semnificaţie, de volumul eşantionului şi de semnificaţie, de volumul eşantionului şi de numărul de numărul de parametri ai modeluluiparametri ai modelului. .

În tabele se determină două valori critice, În tabele se determină două valori critice, notate cu dnotate cu dLL (limita inferioară) şi d (limita inferioară) şi dUU (limita (limita superioară).superioară).

Page 36: Curs11 econometrie ipoteze_dv

În funcţie de aceste valori critice se În funcţie de aceste valori critice se determină următoarele intervale, care determină următoarele intervale, care permit luarea deciziei de respingere sau permit luarea deciziei de respingere sau acceptare a ipotezei nule:acceptare a ipotezei nule:

a.a. (0<(0<ddcalccalc<d<dLL) se respinge ipoteza H) se respinge ipoteza Hoo, erorile , erorile înregistrează o autocorelare pozitivă;înregistrează o autocorelare pozitivă;

b. (db. (dLL<<ddcalccalc<d<dUU) şi (4-d) şi (4-duu<<ddcalccalc< 4-d< 4-dLL) sunt regiuni ) sunt regiuni de nedeterminare, nu se poate decide de nedeterminare, nu se poate decide asupra existenţei autocorelării erorilor;asupra existenţei autocorelării erorilor;

Page 37: Curs11 econometrie ipoteze_dv

c. (dc. (duu < <ddcalccalc< 4- d< 4- duu) se acceptă ipoteza H) se acceptă ipoteza Hoo, , erorile nu sunt autocorelate; erorile nu sunt autocorelate;

d. (4-dd. (4-dLL < <ddcalccalc< 4) se respinge ipoteza H< 4) se respinge ipoteza Hoo, erorile , erorile înregistrează o autocorelare negativă.înregistrează o autocorelare negativă.

Exemplu:Exemplu:1. 1. În studiul legăturii dintre două variabile, X şi În studiul legăturii dintre două variabile, X şi

Y, observate pentru un eşantion format din Y, observate pentru un eşantion format din 25 unităţi statistice, s-a obţinut o valoare 25 unităţi statistice, s-a obţinut o valoare calculată a statisticiicalculată a statisticii

Page 38: Curs11 econometrie ipoteze_dv

ddcalccalc =0,189. Să se testeze ipoteza de =0,189. Să se testeze ipoteza de autocorelare a erorilor, considerând un risc de autocorelare a erorilor, considerând un risc de 0,05.0,05.

Rezolvare:Rezolvare:Din tabelul Durbin Watson, se citesc valorile:Din tabelul Durbin Watson, se citesc valorile:

ddLL=1,288; d=1,288; dUU=1,454. =1,454.

0<(0<(ddcalccalc=0,189)<(d=0,189)<(dLL=1,288), ceea ce arată că se =1,288), ceea ce arată că se respinge ipoteza Hrespinge ipoteza Hoo, deci erorile sunt , deci erorile sunt autocorelate pozitiv între ele.autocorelate pozitiv între ele.

Page 39: Curs11 econometrie ipoteze_dv

2. Pentru un esantion de 5 unitati, pentru 2. Pentru un esantion de 5 unitati, pentru studiul legaturii liniare dintre doustudiul legaturii liniare dintre două variabile, ă variabile, XX şi şi YY, se cunosc , se cunosc dateledatele::

Model Summaryb

,985a ,970 ,960 2,41523 1,429Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Durbin-Watson

Predictors: (Constant), Xa.

Dependent Variable: Yb.

Page 40: Curs11 econometrie ipoteze_dv

Calculul statisticii test:Calculul statisticii test:

InterpretareInterpretare::

Din tabelul Durbin Watson se citesc Din tabelul Durbin Watson se citesc valorile: dvalorile: dLL=0,610; d=0,610; dUU=1,400.=1,400.

În exemplul dat:În exemplul dat:

(d(duu=1,400)<(=1,400)<(ddcalccalc=1,=1,4429)<(4-1,4), ceea 29)<(4-1,4), ceea ce arată că se acceptă ipoteza Hce arată că se acceptă ipoteza Hoo, , erorile nu sunt autocorelate.erorile nu sunt autocorelate.