2.1 Fixed effects Schätzung · 2019-04-10 · unab-hängig und identisch normalverteilt mit...

1

2. Statische lineare Panelmodelle

2.1 Fixed effects Schätzung

→ Eine gegenüber der first-differenced OLS-Schätzung oft vorteilhaftere Vor-

gehensweise zur Beseitigung der fixen Effekte αi in linearen fixed effects

Modellen ergibt sich durch eine fixed effects Transformation

Ausgangspunkt ist dabei folgendes lineares Panelmodell mit unbeobachteter

Heterogenität:

Für jede Querschnittseinheit i wird bei diesen Gleichungen das arithmetische

Mittel über die Zeit gebildet:

Dabei gilt:

Da der fixe Effekt αi zeitinvariant ist, erscheint er in beiden Gleichungen.

it 1 it1 2 it2 k itk i ity = β x + β x + + β x + α + v für i = 1,..., n; t = 1,..., T

i 1 i1 2 i2 k ik i iy = β x + β x + + β x + α + v

T T

i it i1 it1

t=1 t=1

1 1y = y ; x = x usw.

T T

2

Im Folgenden wird für alle t = 1,…, T die obige Gleichung subtrahiert:

Mit y it = yit - y i, x it1 = xit1 - x i1,…, x itk = xitk - x ik sowie v it = vit - v i ergibt sich:

Diese fixed effects Transformation wird auch als within Transformation bezeich-

net. Da der unbeobachtete Effekt (ebenso wie eine Konstante) nun beseitigt ist,

kann hier eine gepoolte OLS-Schätzung durchgeführt werden (üblicherweise

wird dabei von ökonometrischen Programmpaketen wie z.B. STATA auch eine

geschätzte „Konstante“ ausgewiesen, siehe unten). Dieser Schätzer wird als

fixed effects oder within Schätzer bezeichnet. Diese Bezeichnung basiert da-

rauf, dass sich die OLS-Schätzung auf die zeitliche Variation aller Variablen in-

nerhalb (within) jeder Querschnittseinheit bezieht.

→ Einen entsprechenden between Schätzer erhält man durch eine OLS-Schät-

zung allein mit den arithmetischen Mitteln der abhängigen und erklärenden

Variablen über die Zeit, wobei zusätzlich noch eine Konstante einbezogen

wird. Dabei handelt es sich letztlich um eine Querschnittsgleichung, die wie

ein lineares Regressionsmodell mit Querschnittsdaten behandelt werden

kann. Allerdings wird dieser Schätzer nicht sehr häufig angewendet, da er

die wichtige Information, wie sich die Variablen über die Zeit verändern, ig-

noriert und da er verzerrt ist, falls αi mit den arithmetischen Mitteln der erklä-

renden Variablen korreliert ist.

it i 1 it1 i1 2 it2 i2 k itk ik it iy - y = β (x - x ) + β (x - x ) + + β (x - x ) + v - v

it 1 it1 2 it2 k itk ity = β x + β x + + β x + v

3

Der fixed effects Schätzer erlaubt ebenso wie der first-differenced Schätzer in

linearen Panelmodellen mit unbeobachteter Heterogenität in jeder Zeitperiode

beliebige Korrelationen zwischen αi und den erklärenden Variablen. Allerdings

müssen beim within Schätzer für dessen Erwartungstreue dieselben Annah-

men vorliegen wie bei der Erwartungstreue von first-differenced Schätzern:

• Annahme D1: Lineares fixed effects Modell

yit = β1xit1 +…+ βkxitk + αi + vit

• Annahme D2: Zufallsstichprobe

Es liegt im Querschnitt eine Stichprobe vom Umfang n aus der Grundge-

samtheit vor

• Annahme D3: Keine perfekte Kollinearität und Zeitvarianz

Jede erklärende Variable muss für einige i über die Zeit variieren (es können

also erneut Variablen wie z.B. Geschlecht nicht einbezogen werden) und es

besteht keine exakte lineare Beziehung zwischen den erklärenden Variablen

• Annahme D4: Bedingter Erwartungswert von vit ist null

Für alle t ist der bedingte Erwartungswert des idiosynkratischen Fehlers, ge-

geben die erklärenden Variablen in allen Perioden sowie der unbeobachtete

Effekt, null, d.h. E(vit|xi, αi) = 0. Diese Unkorreliertheit von vit und xi impliziert

wiederum die strikte Exogenität der erklärenden Variablen.

Mit diesen vier Annahmen D1 bis D4 sind auch die within Schätzer der Regres-

sionsparameter erwartungstreu und für festes T mit n → ∞ konsistent.

4

Weitere Annahmen:

• Annahme D5: Homoskedastizität

Var(vit|xi, αi) = σ2 (für alle t = 1,…, T)

• Annahme D6: Keine Autokorrelation

Für alle Perioden t ≠ s sind die idiosynkratischen Fehler unter der Bedin-

gung von xi und αi) unkorreliert, d.h. Cov(vit, vis|xi, αi) = 0

Mit diesen sechs Annahmen D1 bis D6 sind die fixed effects Schätzer der Re-

gressionsparameter die besten linearen unverzerrten Schätzer. Da der first-dif-

ferenced Schätzer auch linear und unverzerrt ist, besitzt der within Schätzer

notwendigerweise eine geringere Varianz. Diese Überlegenheit des within

Schätzers basiert auf Annahme D6, die keine Autokorrelation in den idiosynkra-

tischen Fehlern impliziert (und sich deshalb von Annahme C6 unterscheidet).

Zusätzliche Annahme D7: Normalverteilung

Unter der Bedingung von xi und αi sind die idiosynkratischen Fehler vit unab-

hängig und identisch normalverteilt mit Erwartungswert null und Varianz σv2

Annahme D7 impliziert die Annahmen D4 bis D6, ist aber aufgrund der Annah-

me der Normalverteilung restriktiver. Mit den sieben Annahmen D1 bis D7 fol-

gen die t- und F-Statistiken bei fixed effects Schätzern exakt den t- und F-Ver-

teilungen. Ohne die Annahme D7 können jedoch (bei großen n und kleinen T)

asymptotische Approximationen abgeleitet werden.

5

Bemerkungen:

• Bei der fixed effects Schätzung der Parameter der k erklärenden Variablen

(Konstanten werden durch die within Transformation eliminiert) können ins-

gesamt N = nT Beobachtungen verwendet werden. Dies könnte bei der Ab-

leitung von Teststatistiken zu einer Betrachtung von nT-k Freiheitsgraden

verleiten. Allerdings geht für jede Querschnittseinheit i bei der within Trans-

formation ein Freiheitsgrad verloren, so dass die korrekte Anzahl an Frei-

heitsgraden nT-n-k = n(T-1)-k lautet. Diese Korrektur muss bei einer eigenen

within Schätzung durchgeführt werden, wird aber bei der Verwendung von

Programmpaketen (z.B. STATA) üblicherweise beachtet.

• Obwohl zeitinvariante erklärende Variablen bei fixed effects Schätzungen

nicht verwendet werden können, ist die Einbeziehung von Interaktionster-

men von zeitinvarianten und zeitvarianten Variablen (einschließlich Dummy-

Variablen für Zeitperioden) möglich. Zur Erklärung von individuellen Löhnen

kann z.B. Bildung nicht einbezogen werden, wenn diese für alle betrachte-

ten Personen über die Zeit konstant ist. Jedoch kann zur Überprüfung, ob

der Effekt von Bildung sich über die Zeit ändert, Bildung mit allen Dummy-

Variablen für Zeitperioden (außer für die Basisperiode) interagiert werden.

• Die Einbeziehung der maximal möglichen Anzahl an Dummy-Variablen für

die Perioden (oder eines linearen Zeittrends) schließt die Identifikation des

Effektes erklärender Variablen aus, die sich bei allen Querschnittseinheiten i

mit dem gleichen Betrag über die Zeit verändern (z.B. Alter)

6

---------------------------------------------------------------------------------------------------------

Beispiel 1: Weiterbildungsprogramme und Ausschussraten (I)

Für die Analyse des Effektes von Beihilfen im Rahmen eines Weiterbildungs-

programms in Michigan auf den Logarithmus der Ausschussraten (logscrap) in

54 Unternehmen liegen Paneldaten für die Jahre 1987, 1988 und 1989 vor. Vor

1988 hat kein Unternehmen eine entsprechende Beihilfe erhalten. In 1988 ha-

ben 19 Unternehmen und in 1989 haben 10 andere Unternehmen eine Weiter-

bildungsbeihilfe bekommen.

Als erklärende Variablen werden folgende Faktoren betrachtet:

• Beihilfe in einem Jahr t (grant)

• Um ein Jahr verzögerte Beihilfe (grantlagged) zur Überprüfung, ob eine

Beihilfe in 1988 einen Effekt auf die Ausschussraten 1989 hat

• Dummy-Variablen für 1988 (d88) und für 1989 (d89)

Bei der fixed effects Schätzung zeigen sich mit STATA folgende Ergebnisse:

---------------------------------------------------------------------------------------------------------

7

---------------------------------------------------------------------------------------------------------

Beispiel 1: Weiterbildungsprogramme und Ausschussraten (II)

xtreg logscrap grant grantlagged d88 d89, fe

Fixed-effects (within) regression Number of obs = 162

Group variable: fcode Number of groups = 54

R-sq: within = 0.2010 Obs per group: min = 3

between = 0.0079 avg = 3.0

overall = 0.0068 max = 3

F(4,104) = 6.54

corr(u_i, Xb) = -0.0714 Prob > F = 0.0001

------------------------------------------------------------------------------

logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

grant | -.2523149 .150629 -1.68 0.097 -.5510178 .046388

grantlagged | -.4215895 .2102 -2.01 0.047 -.8384239 -.0047551

d88 | -.0802157 .1094751 -0.73 0.465 -.2973089 .1368776

d89 | -.2472028 .1332183 -1.86 0.066 -.5113797 .016974

_cons | .597434 .0677344 8.82 0.000 .4631142 .7317539

-------------+----------------------------------------------------------------

sigma_u | 1.438982

sigma_e | .4977442

rho | .89313867 (fraction of variance due to u_i)

------------------------------------------------------------------------------

F test that all u_i=0: F(53, 104) = 24.66 Prob > F = 0.0000

---------------------------------------------------------------------------------------------------------

8

---------------------------------------------------------------------------------------------------------

Beispiel 1: Weiterbildungsprogramme und Ausschussraten (III)

Interpretation der Ergebnisse:

• Die Interpretation der Schätzergebnisse bezieht sich meist auf das zugrun-

deliegende lineare fixed effects Modell und nicht auf die Gleichung mit Dif-

ferenzenbildung

• Der geschätzte Effekt der um ein Jahr verzögerten Beihilfe ist stärker als der

kontemporäre Effekt und impliziert näherungsweise einen durchschnittlichen

Rückgang der Ausschussrate von 42,2%. Zudem ist der geschätzte Para-

meter für die verzögerte Beihilfe im Vergleich zum geschätzten Parameter

für die kontemporäre Beihilfe bei einem geringeren Signifikanzniveau von

5% von null verschieden.

• Falls die verzögerte Beihilfe nicht als erklärende Variable einbezogen wird,

ergibt sich für die kontemporäre Beihilfe ein geschätzter Parameterwert von

-0,082 bei einem t-Wert von -0,65

• Der geschätzte Parameter für d89 impliziert, dass die Ausschussraten unab-

hängig von den Weiterbildungsbeihilfen im Jahr 1989 geringer waren als im

Jahr 1987.

---------------------------------------------------------------------------------------------------------

9

---------------------------------------------------------------------------------------------------------

Beispiel 1: Weiterbildungsprogramme und Ausschussraten (IV)

Falls diese beiden Dummy-Variablen nicht einbezogen werden, schlägt sich

der zeitliche Rückgang der Ausschussraten im Effekt der Beihilfe nieder:

xtreg logscrap grant grantlagged, fe




between = 0.0076 avg = 3.0


F(2,106) = 11.12

corr(u_i, Xb) = -0.1298 Prob > F = 0.0000

------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

grant | -.3848519 .1247204 -3.09 0.003 -.6321223 -.1375816

grantlagged | -.694953 .1540848 -4.51 0.000 -1.000441 -.3894649

_cons | .5440814 .0519996 10.46 0.000 .4409871 .6471758

-------------+----------------------------------------------------------------

sigma_u | 1.4496731

sigma_e | .50147332


------------------------------------------------------------------------------


---------------------------------------------------------------------------------------------------------

10

---------------------------------------------------------------------------------------------------------

Beispiel 1: Weiterbildungsprogramme und Ausschussraten (V)

Zum Vergleich zeigen sich in einem linearen gepoolten Regressionsmodell un-

ter Einbeziehung der beiden Dummy-Variablen für 1988 und 1989 mit STATA

folgende OLS-Schätzergebnisse:

reg logscrap grant grantlagged d88 d89

Source | SS df MS Number of obs = 162

-------------+------------------------------ F( 4, 157) = 0.69

Model | 6.15830795 4 1.53957699 Prob > F = 0.5989

Residual | 349.586765 157 2.22666729 R-squared = 0.0173

-------------+------------------------------ Adj R-squared = -0.0077

Total | 355.745073 161 2.20959673 Root MSE = 1.4922

------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

grant | .2000196 .3382846 0.59 0.555 -.4681564 .8681957

grantlagged | .0489357 .4360663 0.11 0.911 -.8123777 .9102492

d88 | -.2393704 .3108639 -0.77 0.442 -.8533854 .3746446

d89 | -.4965237 .3379281 -1.47 0.144 -1.163996 .1709483

_cons | .597434 .203063 2.94 0.004 .1963462 .9985218

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

11

---------------------------------------------------------------------------------------------------------

Beispiel 1: Weiterbildungsprogramme und Ausschussraten (VI)

Darüber hinaus zeigen sich in einem linearen first-differenced Modell unter Ein-

beziehung der Dummy-Variablen für 1989 (und damit der maximal möglichen

Anzahl an Dummy-Variablen für die drei Jahre 1987, 1988, 1989) mit STATA

folgende OLS-Schätzergebnisse:

reg d.(logscrap grant grantlagged) d89


-------------+------------------------------ F( 3, 104) = 1.31

Model | 1.31104171 3 .437013902 Prob > F = 0.2739

Residual | 34.5904836 104 .332600804 R-squared = 0.0365

-------------+------------------------------ Adj R-squared = 0.0087

Total | 35.9015253 107 .335528274 Root MSE = .57672

------------------------------------------------------------------------------

D.logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

grant |

D1. | -.2227811 .1307423 -1.70 0.091 -.482048 .0364859

|

grantlagged |

D1. | -.3512459 .2350848 -1.49 0.138 -.817428 .1149361

|

d89 | -.0962082 .1254469 -0.77 0.445 -.3449741 .1525577

_cons | -.0906072 .0909695 -1.00 0.322 -.2710031 .0897888

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

12

---------------------------------------------------------------------------------------------------------

Beispiel 2: Erklärung von Löhnen (I)

Bei der Analyse der Determinanten des Logarithmus von Löhnen (logwage) lie-

gen Paneldaten für 545 dauerhaft berufstätige Männer für die Jahre von 1980

bis 1987 vor. Einige Variablen im Datensatz variieren dabei über die Zeit, wäh-

rend andere zeitinvariant sind. Für within Schätzer (oder auch first-differenced

Schätzer) kann z.B. Hautfarbe nicht alleine, aber als Interaktionsterm mit Dum-

my-Variablen für die Jahre 1981 bis 1987 einbezogen werden.

Als erklärende Variablen werden deshalb jetzt folgende Faktoren betrachtet:

• Familienstand (married)

• Gewerkschaftszugehörigkeit (union)

• Dummy-Variablen für die Jahre 1981 (d81) bis 1987 (d87)

• Interaktionsterme des Bildungsstands mit den Dummy-Variablen d81 bis

d87 (d81educ,…, d87educ)

Bei der entsprechenden fixed effects Schätzung ergeben sich für alle Interak-

tionsterme positive Schätzwerte. Der größte Schätzwert von 0,030 zeigt sich

beim Interaktionsterm von Bildungsstand und der Dummy-Variable für 1987 bei

einem t-Wert von 2,48. Dies impliziert einen um drei Prozentpunkte (!) höheren

(partiellen) Effekt (!) des Bildungsstandes in 1987 im Vergleich zu 1980. Es zei-

gen sich mit STATA folgende Schätzergebnisse:

---------------------------------------------------------------------------------------------------------

13

---------------------------------------------------------------------------------------------------------

Beispiel 2: Erklärung von Löhnen (II)

xtreg logwage married union d81 d82 d83 d84 d85 d86 d87 d81educ d82educ d83educ d84educ

d85educ d86educ d87educ, fe


Group variable: nr Number of groups = 545


between = 0.1900 avg = 8.0


F(16,3799) = 48.91

corr(u_i, Xb) = 0.0991 Prob > F = 0.0000

------------------------------------------------------------------------------

logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

married | .0548205 .0184126 2.98 0.003 .018721 .09092

union | .0829785 .0194461 4.27 0.000 .0448527 .1211042

d81 | -.0224159 .1458885 -0.15 0.878 -.3084432 .2636114

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .0904447 .1458505 0.62 0.535 -.1955082 .3763976

d81educ | .0115854 .0122625 0.94 0.345 -.0124562 .0356271

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87educ | .0304332 .0122723 2.48 0.013 .0063722 .0544942

_cons | 1.362459 .0162385 83.90 0.000 1.330622 1.394296

-------------+----------------------------------------------------------------

sigma_u | .37264192

sigma_e | .35335714


------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

14

---------------------------------------------------------------------------------------------------------

Beispiel 2: Erklärung von Löhnen (III)

Die Hypothese, dass alle sieben Parameter der Interaktionsterme gemeinsam

den Wert null aufweisen, kann bei üblichen Signifikanzniveaus nicht verworfen

werden. Dabei lautet die Anzahl der Freiheitsgrade für diesen F-Test 7 und

n(T-1)-k = 545∙7-16 = 3799. Mit STATA zeigen sich folgende Testergebnisse:

test d81educ d82educ d83educ d84educ d85educ d86educ d87educ

( 1) d81educ = 0

( 2) d82educ = 0

( 3) d83educ = 0

( 4) d84educ = 0

( 5) d85educ = 0

( 6) d86educ = 0

( 7) d87educ = 0

F( 7, 3799) = 1.24

Prob > F = 0.2787

Dagegen sind die Parameter von married und union gemeinsam hochsignifi-

kant von null verschieden. Mit STATA zeigen sich folgende Ergebnisse des

entsprechenden F-Tests:

test married union

( 1) married = 0

( 2) union = 0

F( 2, 3799) = 13.91

Prob > F = 0.0000

---------------------------------------------------------------------------------------------------------

15

---------------------------------------------------------------------------------------------------------

Beispiel 2: Erklärung von Löhnen (IV)

Obwohl die Parameter von d81 und d81educ jeweils nicht signifikant von null

verschieden sind, sind sie gemeinsam (ebenso wie die anderen Paare der

Dummy-Variablen für die einzelnen Jahre und der jeweiligen Interaktionsterme)

hochsignifikant von null verschieden. Mit STATA zeigen sich z.B. folgende Er-

gebnisse von entsprechenden F-Tests:

test d81 d81educ

( 1) d81 = 0

( 2) d81educ = 0

F( 2, 3799) = 14.50

Prob > F = 0.0000

test d87 d87educ

( 1) d87 = 0

( 2) d87educ = 0

F( 2, 3799) = 195.58

Prob > F = 0.0000

Diese Testergebnisse weisen auf stark unterschiedliche Löhne über die Zeit (im

Vergleich zu 1980) hin. Der signifikante Anstieg lässt sich durch eine fixed ef-

fects Schätzung ohne Einbeziehung der Interaktionsterme erkennen. Dabei

zeigen sich mit STATA folgende Schätzergebnisse:

---------------------------------------------------------------------------------------------------------

16

---------------------------------------------------------------------------------------------------------

Beispiel 2: Erklärung von Löhnen (V)

xtreg logwage married union d81 d82 d83 d84 d85 d86 d87, fe




between = 0.0789 avg = 8.0


F(9,3806) = 85.95

corr(u_i, Xb) = 0.0455 Prob > F = 0.0000

------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

married | .0583372 .0183688 3.18 0.002 .0223235 .0943509

union | .0833697 .0194393 4.29 0.000 .0452572 .1214821

d81 | .1135489 .0214936 5.28 0.000 .0714089 .1556889

d82 | .1676694 .0216434 7.75 0.000 .1252356 .2101031

d83 | .2109386 .0219471 9.61 0.000 .1679093 .2539678

d84 | .2784071 .0221814 12.55 0.000 .2349186 .3218956

d85 | .327462 .0223974 14.62 0.000 .2835498 .3713741

d86 | .3868075 .0226027 17.11 0.000 .3424929 .431122

d87 | .447037 .0228157 19.59 0.000 .4023047 .4917692

_cons | 1.361709 .0162395 83.85 0.000 1.32987 1.393548

-------------+----------------------------------------------------------------

sigma_u | .38216008

sigma_e | .35343397


------------------------------------------------------------------------------


---------------------------------------------------------------------------------------------------------

17

---------------------------------------------------------------------------------------------------------

Beispiel 2: Erklärung von Löhnen (VI)

Die alternative Einbeziehung einer linearen Zeittrendvariablen (year) ist auch

möglich. Es zeigen sich mit STATA folgende Schätzergebnisse:

xtreg logwage married union year, fe




between = 0.0791 avg = 8.0


F(3,3812) = 255.03

corr(u_i, Xb) = 0.0462 Prob > F = 0.0000

------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

married | .0610384 .0182929 3.34 0.001 .0251737 .0969032

union | .083791 .019414 4.32 0.000 .045728 .1218539

year | .0598672 .0025835 23.17 0.000 .054802 .0649325

_cons | -117.1447 5.121172 -22.87 0.000 -127.1852 -107.1042

-------------+----------------------------------------------------------------

sigma_u | .38200026

sigma_e | .35352815


------------------------------------------------------------------------------


---------------------------------------------------------------------------------------------------------

18

---------------------------------------------------------------------------------------------------------

Beispiel 2: Erklärung von Löhnen (VII)

Zum Vergleich zeigen sich in einem linearen first-differenced Modell unter Ein-

beziehung der Dummy-Variablen d82 bis d87 mit STATA folgende OLS-Schätz-

ergebnisse:

reg d.(logwage married union) d82 d83 d84 d85 d86 d87


-------------+------------------------------ F( 8, 3806) = 2.19

Model | 3.44529371 8 .430661714 Prob > F = 0.0252


-------------+------------------------------ Adj R-squared = 0.0025

Total | 751.193923 3814 .19695698 Root MSE = .44324

------------------------------------------------------------------------------

D.logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

married |

D1. | .040342 .0229417 1.76 0.079 -.0046372 .0853212

union |

D1. | .041871 .0197059 2.12 0.034 .0032359 .0805062

d82 | -.059642 .0268623 -2.22 0.026 -.1123079 -.0069761

d83 | -.0708915 .0268532 -2.64 0.008 -.1235396 -.0182435

d84 | -.0466673 .0268754 -1.74 0.083 -.099359 .0060244

d85 | -.0666827 .0268937 -2.48 0.013 -.1194102 -.0139551

d86 | -.055882 .0268969 -2.08 0.038 -.1086158 -.0031482

d87 | -.0522669 .0269121 -1.94 0.052 -.1050303 .0004966

_cons | .1153218 .0191323 6.03 0.000 .0778112 .1528324

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

19

---------------------------------------------------------------------------------------------------------

Beispiel 2: Erklärung von Löhnen (VIII)

Mit der Einbeziehung einer linearen Zeittrendvariablen (year) anstatt d82 bis

d87 zeigen sich mit STATA folgende Schätzergebnisse:

reg d.(logwage married union) year


-------------+------------------------------ F( 3, 3811) = 3.43

Model | 2.02553487 3 .675178289 Prob > F = 0.0162


-------------+------------------------------ Adj R-squared = 0.0019

Total | 751.193923 3814 .19695698 Root MSE = .44337

------------------------------------------------------------------------------

D.logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

married |

D1. | .040783 .0229342 1.78 0.075 -.0041815 .0857475

|

union |

D1. | .0429849 .019676 2.18 0.029 .0044085 .0815613

|

year | -.0051803 .003599 -1.44 0.150 -.0122364 .0018758

_cons | 10.34272 7.140508 1.45 0.148 -3.656861 24.34231

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

20

Dummy-Variablen Schätzung in linearen Panelmodellen mit unbeobachteter

Heterogenität:

• Bei einer traditionellen Sichtweise der fixed effects Schätzung wird der un-

beobachtete Effekt αi für Querschnittseinheit i, also z.B. für eine Person, ei-

nen Haushalt, ein Unternehmen oder eine Region zusammen mit den Re-

gressionsparametern geschätzt. Das heißt, für alle n-1 Querschnittseinhei-

ten (eine Einheit stellt die Basisgruppe dar) wird eine Konstante geschätzt.

• Hierzu werden neben der Betrachtung einer generellen Konstanten zusätz-

lich für n-1 Querschnittseinheiten Dummy-Variablen konstruiert, deren Para-

meter zusammen mit den anderen Regressionsparametern mit OLS ge-

schätzt werden. Ein solches Vorgehen wird als Dummy-Variablen Schätzung

bezeichnet, die bei einer Querschnittsanalyse nicht möglich ist, da bei n Be-

obachtungen nicht n+k Parameter geschätzt werden können.

• Somit müssen bei Dummy-Variablen Schätzungen mindestens zwei Perio-

den vorliegen, wenngleich auch bei einer moderaten Anzahl n die Anzahl

der erklärenden Variablen und damit der zu schätzenden Regressionspara-

meter oft zu hoch ist. Dies schränkt die Praktikabilität der Anwendung dieser

Schätzmethode ein.

• Ein wichtiges Kennzeichen von Dummy-Variablen Schätzungen ist, dass die

geschätzten Regressionsparameter sowie geschätzten Standardabweichun-

gen der Schätzwerte und Teststatistiken identisch sind mit den entsprechen-

den Ergebnissen bei der fixed effects Schätzung

21

• Ein Vorzug von Dummy-Variablen Schätzungen ist, dass die korrekte Anzahl

an Freiheitsgraden automatisch berechnet wird, wenngleich die korrekte An-

zahl bei fixed effects Schätzungen mittlerweile meist auch von Programmpa-

keten (z.B. STATA) ausgewiesen wird

• Bei Dummy-Variablen Schätzungen ergeben sich durch die hohe Anzahl

einbezogener Dummy-Variablen üblicherweise hohe Werte für R2

• Mit Hilfe von F-Tests kann überprüft werden, ob alle n-1 Dummy-Variablen

den Wert null annehmen. Sehr häufig wird diese Nullhypothese bei geringen

Signifikanzniveaus verworfen.

• In seltenen Fällen können die geschätzten Konstanten α i von Interesse sein,

z.B. zur Überprüfung, ob diese für ein spezifisches i vom durchschnittlichen

Wert für die anderen Querschnittseinheiten abweicht. Diese Schätzwerte

können aber auch sehr einfach auf Basis von fixed effects Schätzungen mit

entsprechenden Durchschnittswerten über die Zeit berechnet werden:

• Viele ökonometrische Programmpakete (wie z.B. STATA) weisen bei fixed

effects Schätzungen eine geschätzte „Konstante“ aus, die meist den Durch-

schnitt der α i über alle Querschnittseinheiten i darstellt

• In den meisten Fällen stehen aber die geschätzten Regressionsparameter

der erklärenden Variablen im Blickpunkt, so dass die unbeobachteten Effek-

te üblicherweise als vernachlässigbare Variablen angesehen werden, für die

bei within Schätzungen kontrolliert wird

i i 1 i1 k ikˆ ˆα̂ = y - β x - - β x

22

---------------------------------------------------------------------------------------------------------

Beispiel: Weiterbildungsprogramme und Ausschussraten (I)

Wie zuvor wird wieder mit Paneldaten für die Jahre 1987, 1988 und 1989 der

Effekt von Beihilfen im Rahmen eines Weiterbildungsprogramms in Michigan

auf den Logarithmus der Ausschussraten (logscrap) in 54 Unternehmen unter-

sucht. Als erklärende Variablen werden erneut die Beihilfe in einem Jahr t

(grant), die um ein Jahr verzögerte Beihilfe (grantlagged) sowie Dummy-Vari-

ablen für 1988 (d88) und für 1989 (d89) betrachtet. Allerdings wird jetzt keine

traditionelle fixed effects Schätzung betrachtet:

• Stattdessen sollen für die n Querschnittseinheiten (also hier 54 Unterneh-

men) n-1 (also hier 53) Dummy-Variablen einbezogen werden

• Dazu muss die Variable betrachtet werden, die die unterschiedlichen Quer-

schnittseinheiten (also hier Unternehmen) identifiziert

• Durch das Voranstellen von „i.“ wird STATA klargemacht, dass die zugrunde-

liegende stetige Variable als diskrete Variable mit der maximalen Anzahl an

Dummy-Variablen betrachtet werden soll

• In diesem Fall wird somit i.fcode als zusätzliche erklärende Variable in das

lineare Panelmodell mit unbeobachteter Heterogenität einbezogen

Bei der entsprechenden OLS-Schätzung zeigen sich mit STATA folgende Er-

gebnisse:

---------------------------------------------------------------------------------------------------------

23

---------------------------------------------------------------------------------------------------------

Beispiel: Weiterbildungsprogramme und Ausschussraten (II)

reg logscrap grant grantlagged d88 d89 i.fcode


-------------+------------------------------ F( 57, 104) = 23.37

Model | 329.979148 57 5.78910785 Prob > F = 0.0000


-------------+------------------------------ Adj R-squared = 0.8879

Total | 355.745073 161 2.20959673 Root MSE = .49774

------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

grant | -.2523149 .150629 -1.68 0.097 -.5510178 .046388

grantlagged | -.4215895 .2102 -2.01 0.047 -.8384239 -.0047551

d88 | -.0802157 .1094751 -0.73 0.465 -.2973089 .1368776

d89 | -.2472028 .1332183 -1.86 0.066 -.5113797 .016974

|

fcode |

410538 | 3.905259 .4064064 9.61 0.000 3.09934 4.711178

410563 | 4.717327 .4064064 11.61 0.000 3.911408 5.523247

410565 | 4.443668 .4064064 10.93 0.000 3.637748 5.249587

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 419459 | 3.449106 .4064064 8.49 0.000 2.643187 4.255025

419482 | 3.926468 .4064064 9.66 0.000 3.120549 4.732387

419483 | 6.140227 .4064064 15.11 0.000 5.334307 6.946146

|

_cons | -2.825819 .2961843 -9.54 0.000 -3.413164 -2.238474

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

24

Die unbekannten Regressionsparameter in linearen Panelmodellen mit unbeo-

bachteter Heterogenität können (neben der Betrachtung einer konventionellen

gepoolten OLS-Schätzung) über within oder first-differenced Transformationen

geschätzt werden, so dass sich die Frage stellt, welcher Ansatz gewählt wer-

den sollte:

• Für den Fall von T = 2 stimmen fixed effects und first-differenced Schätzun-

gen sowie alle darauf bezogenen Teststatistiken in identisch spezifizierten

Modellen völlig überein, so dass es egal ist, welcher der beiden Ansätze ge-

wählt wird

• Entsprechend Abschnitt 1.2 wird bei der Gleichung erster Differenzen übli-

cherweise eine Konstante einbezogen, die den Parameter der Dummy-Vari-

able für die zweite Periode darstellt (die Konstante für die Gleichungen in

den beiden Jahren wird herausdifferenziert)

• Deshalb muss in diesem Fall bei der within Schätzung im Hinblick auf die

Identität der linearen Panelmodelle mit unbeobachteter Heterogenität eine

Dummy-Variable für die zweite Zeitperiode einbezogen werden.

• Für diesen Fall von T = 2 hat die first-differenced Schätzung den Vorteil,

dass diese sehr einfach mit ökonometrischen Programmpaketen selbst im-

plementiert werden kann

25

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Kriminalitätsraten (I)

Mit Paneldaten für n = 46 Städte in den USA für die beiden Jahre 1982 und

1987 wird der Effekt von Arbeitslosenraten (unem) und der Bevölkerungsdichte

(popden) auf die Anzahl der Straftaten auf 1000 Personen (crmrte) untersucht.

Bei der OLS-Schätzung in den ersten Differenzen zeigen sich mit STATA fol-

gende Ergebnisse:

reg d.(crmrte unem popden)


-------------+------------------------------ F( 2, 43) = 4.21

Model | 3319.56638 2 1659.78319 Prob > F = 0.0213

Residual | 16936.4068 43 393.869925 R-squared = 0.1639

-------------+------------------------------ Adj R-squared = 0.1250

Total | 20255.9732 45 450.132737 Root MSE = 19.846

------------------------------------------------------------------------------

D.crmrte | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

unem |

D1. | 2.575551 .906563 2.84 0.007 .747293 4.40381

|

popden |

D1. | -.010234 .0074009 -1.38 0.174 -.0251593 .0046914

|

_cons | 17.23914 4.839995 3.56 0.001 7.478356 26.99992

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

26

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Kriminalitätsraten (II)

Bei der fixed effects Schätzung zeigen sich mit STATA folgende Ergebnisse:

xtreg crmrte unem popden d87, fe


Group variable: area Number of groups = 46


between = 0.0004 avg = 2.0


F(3,43) = 4.29

corr(u_i, Xb) = -0.7492 Prob > F = 0.0098

------------------------------------------------------------------------------

crmrte | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

unem | 2.575551 .906563 2.84 0.007 .747293 4.40381

popden | -.010234 .0074009 -1.38 0.174 -.0251593 .0046914

d87 | 17.23914 4.839995 3.56 0.001 7.478356 26.99992

_cons | 122.6508 35.32421 3.47 0.001 51.41275 193.8889

-------------+----------------------------------------------------------------

sigma_u | 42.872147

sigma_e | 14.033352


------------------------------------------------------------------------------


---------------------------------------------------------------------------------------------------------

27

Für T ≥ 3 sind die fixed effects und first-differenced Schätzungen in linearen

Panelmodellen mit unbeobachteter Heterogenität nicht mehr identisch:

• Da beide Schätzer mit den Annahmen D1 bis D4 sowohl erwartungstreu als

auch konsistent (für festes T mit n → ∞) sind, ergibt sich hieraus kein Krite-

rium für die Vorteilhaftigkeit eines der beiden Schätzer

• Für große n und kleine T ergeben sich bei beiden Schätzern jedoch Effi-

zienzunterschiede, die durch Autokorrelationen in den idiosynkratischen

Fehlern vit bestimmt werden (unter der Annahme der Homoskedastizität in

vit, da nur in diesem Fall Effizienzunterschiede analysiert werden können)

• Falls die vit nicht autokorreliert sind (falls unbeobachtete Heterogenität vor-

liegt, ist der gesamte Störterm αi + vit definitionsgemäß immer autokorre-

liert), ist der fixed effects Schätzer effizienter als der first-differenced Schät-

zer. Da nun bei linearen Panelmodellen mit unbeobachteter Heterogenität

oft unterstellt wird, dass die idiosynkratischen Fehler nicht autokorreliert

sind, werden bei empirischen Studien fixed effects Schätzungen grundsätz-

lich häufiger angewendet.

• Häufig liegt allerdings eine entsprechende Autokorrelation vor. Falls die vit

einem random walk folgen (und damit eine sehr starke positive Autokorrela-

tion vorliegt), sind die ersten Differenzen ∆vit nicht autokorreliert, so dass

dann first-differenced Schätzungen vorteilhafter sind.

• Allerdings liegen in vielen Fällen schwache positive Autokorrelationen in vit

vor, wodurch die Effizienz der beiden Schätzer nicht einfach abzuleiten ist

28

• Generell ist nach einer fixed effects Schätzung die Überprüfung der Hypo-

these, dass keine Autokorrelation in vit vorliegt, (genauso wie die Überprü-

fung von Homoskedastizität) nicht einfach, da lediglich Schätzungen für v it nicht aber für vit abgeleitet werden können. Dagegen kann diese Hypothese

in Bezug auf ∆vit nach einer first-differenced Schätzung mit einem t-Test

einfach untersucht werden.

• Für den Fall, dass es dabei keinen Hinweis auf eine entsprechende Auto-

korrelation in ∆vit gibt, ist es oft sinnvoll, first-differenced Schätzungen

durchzuführen. Wenn dagegen eine negative Autokorrelation in ∆vit nachge-

wiesen wird, bietet sich eher eine fixed effects Schätzung an.

• Falls alle erklärenden Variablen xith zwar mit den vit unkorreliert sind, gegen

die Annahme der strikten Exogenität aber verstoßen wird (z.B. bei verzöger-

ten abhängigen Variablen), weisen fixed effects Schätzungen für große T

meistens geringere Verzerrungen auf. Andererseits ist der first-differenced

Schätzer bereits bei schwacher Exogenität der erklärenden Variablen mit

E(vit| xi1,…, xit, αi) = 0 konsistent.

• Insgesamt ist die Wahl zwischen beiden Schätzungen nicht einfach, so dass

grundsätzlich, vor allem aber bei stark unterschiedlichen Ergebnissen, beide

ausgewiesen werden sollten. Bei sehr ähnlichen Schätzergebnissen ist da-

gegen deren Robustheit umso größer.

29

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen

Wie zuvor werden wieder mit Paneldaten für 545 dauerhaft berufstätige Män-

ner für die Jahre von 1980 bis 1987 die Determinanten des Logarithmus von

Löhnen (logwage) untersucht. Als erklärende Variablen werden erneut lediglich

der Familienstand (married) und die Gewerkschaftszugehörigkeit (union) be-

trachtet. Auf Basis der zuvor betrachteten OLS-Schätzung im linearen first-dif-

ferenced Modell zeigen sich beim t-Test auf AR(1) Autokorrelation in Bezug auf

∆vit folgende Ergebnisse (alternativ können auch Konstante und erklärende Va-

riablen in den t-Test einbezogen werden mit ähnlichen Ergebnissen):

reg d.(logwage married union) d82 d83 d84 d85 d86 d87

predict u, resid

reg u l.u, noconstant


-------------+------------------------------ F( 1, 3269) = 724.84

Model | 103.819255 1 103.819255 Prob > F = 0.0000


-------------+------------------------------ Adj R-squared = 0.1812

Total | 572.039751 3270 .174935704 Root MSE = .37846

------------------------------------------------------------------------------

u | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

u |

L1. | -.3948887 .0146674 -26.92 0.000 -.423647 -.3661305

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

30

Cluster-robuste Konfidenzintervalle und t- und F-Tests:

• Fixed effects und first-differenced Schätzungen in linearen Panelmodellen

mit unbeobachteter Heterogenität sind (unter den Annahmen D1 bis D4 so-

wie C1 bis C4) auch bei Heteroskedastizität und Autokorrelation in den idio-

synkratischen Fehlern vit erwartungstreu und konsistent

• Allerdings erfordert die korrekte Konstruktion von Konfidenzintervallen sowie

t- und F-Werten, dass Homoskedastizität und keine Autokorrelation vorliegt

• Für den Fall, dass n deutlich größer als T ist, können die geschätzten Stan-

dardabweichungen der geschätzten Parameter über ein clustering für jegli-

che Formen von Heteroskedastizität und Autokorrelation korrigiert werden

• Die Idee dabei ist, dass jede Querschnittseinheit i als ein Cluster von Beob-

achtungen über die Zeit definiert ist und für jedes Cluster beliebige Varian-

zen und Autokorrelationen in den Störtermen über die Zeit erlaubt sind

• Die cluster-robuste Schätzung der Standardabweichungen der geschätzten

Parameter für die Ableitung von cluster-robusten Konfidenzintervallen und t-

und F-Tests bezieht sich aufgrund der unterschiedlichen Ansätze bei fixed

effects und first-differenced Schätzungen auf unterschiedliche Gleichungen

• Die cluster-robuste Schätzung mit STATA erfolgt durch die zusätzliche An-

weisung „cluster(id)“, wobei „id“ sich auf die Variable bezieht, die die Quer-

schnittseinheiten identifiziert (bei fixed und auch random effects Schätzern,

siehe später, nicht aber bei first-differenced Schätzern ergeben sich durch

die Anweisungen „robust“ oder „vce(robust)“ dieselben Resultate)

31

---------------------------------------------------------------------------------------------------------






(grant) und die um ein Jahr verzögerte Beihilfe (grantlagged) betrachtet. Es

zeigen sich in einem linearen first-differenced Modell unter Einbeziehung der

Dummy-Variablen für 1989 mit STATA folgende OLS-Schätzergebnisse:

reg d.(logscrap grant grantlagged) d89, cluster(fcode)

Linear regression Number of obs = 108

F( 3, 53) = 1.98

Prob > F = 0.1284

R-squared = 0.0365

Root MSE = .57672

(Std. Err. adjusted for 54 clusters in fcode)

------------------------------------------------------------------------------

| Robust


-------------+----------------------------------------------------------------

grant |

D1. | -.2227811 .1316461 -1.69 0.096 -.4868298 .0412676

grantlagged |

D1. | -.3512459 .2709732 -1.30 0.201 -.8947493 .1922575

d89 | -.0962082 .1136492 -0.85 0.401 -.3241597 .1317433

_cons | -.0906072 .0901821 -1.00 0.320 -.2714895 .0902751

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

32

---------------------------------------------------------------------------------------------------------


Bei der entsprechenden fixed effects Schätzung zeigen sich unter Einbezie-

hung der Dummy-Variablen für 1988 und 1989 mit STATA folgende Ergebnisse:

xtreg logscrap grant grantlagged d88 d89, fe cluster(fcode)




between = 0.0079 avg = 3.0


F(4,53) = 7.07

corr(u_i, Xb) = -0.0714 Prob > F = 0.0001

(Std. Err. adjusted for 54 clusters in fcode)

------------------------------------------------------------------------------

| Robust


-------------+----------------------------------------------------------------

grant | -.2523149 .1434399 -1.76 0.084 -.5400188 .035389

grantlagged | -.4215895 .2824604 -1.49 0.141 -.9881333 .1449543

d88 | -.0802157 .0978408 -0.82 0.416 -.2764594 .1160281

d89 | -.2472028 .1967819 -1.26 0.215 -.6418974 .1474917

_cons | .597434 .0638746 9.35 0.000 .4693177 .7255503

-------------+----------------------------------------------------------------

sigma_u | 1.438982

sigma_e | .4977442


------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

33

Fixed effects Schätzung mit unbalanced panels:

• Zumindest implizit wurden bisher balanced panels betrachtet, bei denen für

jede Untersuchungseinheit i Daten für alle T Zeitperioden vorliegen. Aller-

dings fehlen bei vielen empirischen Anwendungen für einige i Daten für ein-

zelne Perioden, so dass ein unbalanced panel gegeben ist.

• Auch mit unbalanced panels können grundsätzlich fixed effects Schätzun-

gen durchgeführt werden. Wenn Ti die Anzahl der Perioden darstellt, für die

bei einer Querschnittseinheit i Daten vorliegen, beträgt hier die Anzahl der

Beobachtungen N = T1 + T2 +⋯+ Tn. Durch die within Transformation blei-

ben diejenigen Querschnittseinheiten unberücksichtigt, bei denen nur für ei-

ne Periode Daten vorliegen. Zudem geht hier erneut bei jedem i ein Frei-

heitsgrad verloren.

• Allerdings kann der Verlust von Beobachtungen in einzelnen Perioden prob-

lematisch sein. Lediglich wenn der Grund für die fehlenden Daten („attrition“)

nicht mit den idiosynkratischen Fehlern vit korreliert ist, ergeben sich bei der

fixed effects Schätzung keinerlei Probleme. Wenn allerdings dieser Grund

mit den vit korreliert ist, ergeben sich durch die entstehenden Selektionspro-

bleme („sample selection problems“) verzerrte fixed effects Schätzer.

• Demgegenüber erlauben fixed effects Schätzungen, dass attrition mit den

unbeobachteten Effekten αi korreliert ist. Attrition Probleme sind eine wich-

tige Fragestellung in der Paneldatenanalyse.

34

---------------------------------------------------------------------------------------------------------






(grant), die um ein Jahr verzögerte Beihilfe (grantlagged) sowie Dummy-Vari-

ablen für 1988 (d88) und für 1989 (d89) betrachtet. Allerdings werden jetzt zwei

zusätzliche erklärende Variablen einbezogen:

• Logarithmus der Umsätze (logsales)

• Logarithmus der Anzahl der Beschäftigten (logemploy)

Dadurch fallen jetzt aber drei der 54 Unternehmen aufgrund fehlender Daten

zu Umsätzen oder der Anzahl an Beschäftigten völlig heraus. Zudem gehen

fünf weitere Beobachtungen wegen fehlender Daten für einzelne Jahre verlo-

ren. Damit reduziert sich die Gesamtzahl der Beobachtungen auf N = 148. Die

Ergebnisse für den Effekt der kontemporären und der um ein Jahr verzögerten

Weiterbildungsbeihilfe bleiben aber auf Basis der fixed effects Schätzung mit

diesem unbalanced panel qualitativ sehr ähnlich. Es zeigen sich mit STATA fol-

gende Schätzergebnisse:

---------------------------------------------------------------------------------------------------------

35

---------------------------------------------------------------------------------------------------------


xtreg logscrap grant grantlagged logsales logemploy d88 d89, fe




between = 0.0341 avg = 2.9


F(6,91) = 4.11

corr(u_i, Xb) = -0.2258 Prob > F = 0.0011

------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

grant | -.2967544 .157086 -1.89 0.062 -.6087866 .0152777

grantlagged | -.5355783 .224206 -2.39 0.019 -.9809359 -.0902207

logsales | -.0868607 .2596993 -0.33 0.739 -.6027214 .4290001

logemploy | -.0763642 .3502912 -0.22 0.828 -.7721747 .6194462

d88 | -.0039605 .1195487 -0.03 0.974 -.2414293 .2335083

d89 | -.1321925 .1536863 -0.86 0.392 -.4374715 .1730865

_cons | 2.115513 3.108438 0.68 0.498 -4.059017 8.290043

-------------+----------------------------------------------------------------

sigma_u | 1.4415147

sigma_e | .49149052


------------------------------------------------------------------------------


---------------------------------------------------------------------------------------------------------

36

---------------------------------------------------------------------------------------------------------

Beispiel: Weiterbildungsprogramme und Ausschussraten (III)

Zum Vergleich zeigen sich im entsprechenden linearen first-differenced Modell

mit STATA folgende OLS-Schätzergebnisse:

reg d.(logscrap grant grantlagged logsales logemploy) d89


-------------+------------------------------ F( 5, 91) = 0.87

Model | 1.57948125 5 .31589625 Prob > F = 0.5055


-------------+------------------------------ Adj R-squared = -0.0069

Total | 34.6757538 96 .361205769 Root MSE = .60307

------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

grant |

D1. | -.2045045 .144308 -1.42 0.160 -.4911548 .0821457

|

grantlagged |

D1. | -.3841248 .2614544 -1.47 0.145 -.9034719 .1352222

|

logsales |

D1. | -.1774384 .2713138 -0.65 0.515 -.71637 .3614932

|

logemploy |

D1. | -.0230417 .3773629 -0.06 0.951 -.7726268 .7265434

|

d89 | -.0946461 .1381578 -0.69 0.495 -.3690796 .1797874

_cons | -.0653994 .1062023 -0.62 0.540 -.2763573 .1455585

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

37

2.2 Random effects Schätzung

Ausgangspunkt ist erneut ein lineares Panelmodell mit unbeobachteter Hetero-

genität, bei dem jetzt explizit eine Konstante einbezogen wird, wodurch (ohne

Beschränkung der Allgemeinheit) die Annahme getroffen werden kann, dass αi

im Durchschnitt null ist:

Dabei werden üblicherweise wiederum Dummy-Variablen für Zeitperioden ein-

bezogen. Falls αi mit einer oder mehreren erklärenden Variablen korreliert ist,

besteht das wesentliche Ziel zunächst darin, diesen unbeobachteten Effekt

durch within Transformationen oder die Bildung erster Differenzen zu beseiti-

gen. Allerdings stellt sich die Frage, ob diese Transformationen auch sinnvoll

sind, wenn αi mit allen erklärenden Variablen unkorreliert ist:

In diesem Fall könnten die Regressionsparameter grundsätzlich in einer Quer-

schnittsanalyse für eine Zeitperiode (also ohne eine Paneldatenanalyse) oder

in einem gepoolten linearen Regressionsmodell mit OLS konsistent geschätzt

werden. Bei einer Querschnittsanalyse würden allerdings nützliche Informatio-

nen aus den anderen Zeitperioden unberücksichtigt bleiben. Bei einem gepool-

ten linearen Regressionsmodell würde zudem eine wichtige Modelleigenschaft

ignoriert werden. Mit εit = αi + vit ergibt sich:

it 0 1 it1 2 it2 k itk i ity = β + β x + β x + + β x + α + v für i = 1,..., n; t = 1,..., T

ith iCov(x , α ) = 0 für t = 1,2,..., T; h = 1, 2,..., k

38

Da die αi in εit in jeder Zeitperiode enthalten sind, ergibt sich notwendigerweise,

dass die εit eine positive Autokorrelation aufweisen. Mit den Annahmen, dass

die αi und die vit unkorreliert sind sowie in den vit keine Autokorrelation vorliegt,

ergibt sich mit σα2 = Var(αi) = Cov(εit, εis) = Cov(αi+vit, αi+vis) (für t ≠ s) sowie

σv2 = Var(vit):

Auf Grund dieser Autokorrelation sind die konventionellen Schätzer der Stan-

dardabweichungen (bei Vernachlässigung der Autokorrelation) der mit OLS ge-

schätzten Steigungsparameter verzerrt, so dass auch die Konfidenzintervalle

nicht mehr korrekt sowie die t- und F-Statistiken nicht einmal asymptotisch t-

und F-verteilt sind. Allerdings kann hier eine Schätzung mit der Verallgemeiner-

ten Methode der kleinsten Quadrate (GLS) durchgeführt werden, bei der zu-

nächst folgende Transformation betrachtet wird:

it 0 1 it1 2 it2 k itk ity = β + β x + β x + + β x + ε für i = 1,..., n; t = 1,..., T

2

it is αit is

it is i it i is

2 2

α α

2 22 2 2 2α vα v α v

Cov(ε , ε ) σCorr(ε , ε ) = =

Var(ε )Var(ε ) Var(α +v )Var(α +v )

σ σ = = für t s

σ +σ(σ +σ )(σ +σ )

it i 0 1 it1 i1 k itk ik it iy - λy = β (1 - λ) + β (x - λx ) + + β (x - λx ) + ε - λε

39

Dabei bedeuten die Überstriche für jede Querschnittseinheit i erneut das arith-

metische Mittel über die Zeit und für 0 ≤ λ ≤ 1 gilt:

Es kann gezeigt werden, dass die Störterme (εit-λ𝜀 i) in diesem Ansatz keine Au-

tokorrelation aufweisen. Im Gegensatz zur within Transformation wird hier le-

diglich ein Teil der arithmetischen Mittel über die Zeit subtrahiert, der von den

beiden Varianzen σα2 und σv

2 sowie von der Anzahl der Perioden abhängt. Die-

se Transformation erlaubt deshalb im Gegensatz zur within Transformation

oder der Bildung erster Differenzen auch die Einbeziehung von erklärenden

Variablen, die über die Zeit konstant sind (z.B. Geschlecht).

Ein GLS-Schätzer ergibt sich nun durch eine gepoolte OLS-Schätzung in obi-

ger Gleichung. Dazu würde man den Wert des Parameters λ benötigen, der al-

lerdings in der Praxis nicht bekannt ist. Er kann jedoch immer mit Hilfe konsis-

tenter Schätzer von σα2 und σv

2 geschätzt werden. Diese geschätzten Varian-

zen können mit Hilfe von Residuen bei OLS-Schätzungen in gepoolten linearen

Regressionsmodellen oder bei fixed effects Schätzungen abgeleitet werden.

Mit den Residuen ε it der gepoolten OLS-Schätzung ergibt sich eine Möglichkeit

der Schätzung von σα2:

2

v

2 2

v α

σλ = 1 -

σ +Tσ

40

Da σε2 = σα

2 + σv2 kann auf dieser Basis die Varianz σv

2 mit dem Schätzer σ ε2

der Varianz des Fehlerterms εit bei der gepoolten OLS-Schätzung mit Hilfe von

σ v2 = σ ε

2 - σ α2 geschätzt werden. Damit kann dann λ folgendermaßen ge-

schätzt werden:

Eine durchführbare („feasible“) GLS-Schätzung, bei der λ anstatt λ einbezogen

ist, wird als random effects Schätzung bezeichnet.

Der random effects Schätzer ist nicht erwartungstreu. Im Hinblick auf die Kon-

sistenz und asymptotische Normalverteilung von Funktionen des Schätzers lie-

gen idealerweise die zuvor diskutierten Annahmen D1 bis D4 beim within

Schätzer vor. Da die random effects Transformation die Einbeziehung von er-

klärenden Variablen erlaubt, die über die Zeit konstant sind, kann Annahme D3

durch die schwächere Annahme E3 ersetzt werden.

n T-1 T2

α it is

i=1 t=1 s=t+1

1ˆ ˆσ̂ = ε ε

nT(T-1) - (k+1)

2

2

v

22 2

αv α2

v

σ̂ 1λ̂ = 1 - = 1 -

ˆˆ ˆ σσ +Tσ1+T

σ̂

41

Gleichzeitig muss aber zusätzlich zu D4 die Annahme getroffen werden, dass

der unbeobachtete Effekt αi und die erklärenden Variablen unkorreliert sind. Es

ergibt sich:

• Annahme E3: Keine perfekte Kollinearität

• Annahme E4: Bedingter Erwartungswert von αi ist konstant

Zusätzlich zu D4 gilt, dass der bedingte Erwartungswert von αi, gegeben die

erklärenden Variablen, konstant ist und bei der Einbeziehung einer Konstan-

te deren Wert aufweist, d.h. E(αi|xi) = β0. Diese Annahme ist der Hauptunter-

schied zwischen fixed effects und random effects Schätzungen.

Mit den Annahmen D1, D2, E3 und E4 sind die random effects Schätzer der

Regressionsparameter für festes T mit n → ∞ konsistent und Funktionen des

Schätzers asymptotisch normalverteilt.

Für die Ableitung weiterer Eigenschaften der random effects Schätzer sowie

von Konfidenzintervallen und t- und F-Statistiken muss neben Annahme D6

zum Fehlen von Autokorrelation in vit bei fixed effects Schätzern zusätzlich fol-

gende Annahme gelten:

• Annahme E5: Homoskedastizität

Zusätzlich zu Annahme D5 gilt, dass die bedingte Varianz von αi, gegeben

alle erklärenden Variablen, konstant ist, d.h. Var(αi|xi) = σα2

42

Mit den Annahmen D1, D2, E3, E4, E5 und D6 sind die üblich geschätzten

Standardabweichungen der random effects Schätzungen korrekt und damit die

t- und F-Statistiken asymptotisch t- und F-verteilt. Vor allem aber sind die ran-

dom effects Schätzer asymptotisch effizient.

Folgerungen:

• Random effects Schätzer weisen damit in diesem Fall bei großen n geringe-

re Varianzen auf als übliche gepoolte OLS-Schätzer (wenn bei den gepool-

ten OLS-Schätzern korrekterweise cluster-robuste Standardabweichungen

der geschätzten Parameter geschätzt werden)

• Bei zeitvarianten erklärenden Variablen sind in diesem Fall die random ef-

fects Schätzer insbesondere effizienter als fixed effects Schätzer (zeitinvari-

ante erklärende Variablen können ja ohnehin nicht in fixed effects Schätzun-

gen einbezogen werden)

• Allerdings ist nicht die Effizienzeigenschaft, sondern die Robustheit bei Kor-

relationen zwischen dem unbeobachteten Effekt αi und den erklärenden Va-

riablen bei fixed effects Schätzungen die eigentliche Stoßrichtung

• Insofern muss bei der Wahl zwischen fixed und random effects Schätzungen

(siehe später) häufig eine Abwägung zwischen Robustheit und Effizienz vor-

genommen werden

43

Zusammenhang zwischen verschiedenen Schätzungen in linearen Panelmo-

dellen mit unbeobachteter Heterogenität:

• Falls λ = 0, ergibt sich eine gepoolte OLS-Schätzung und falls λ = 1, ergibt

sich eine fixed effects Schätzung. Allerdings zeigt sich für den Schätzwert λ niemals der Wert null oder der Wert eins.

• Falls λ klein ist, liegt der random effects Schätzer nahe beim gepoolten

OLS-Schätzer. In diesem Fall ist der unbeobachtete Effekt αi (aufgrund der

relativ geringen Varianz σα2 im Vergleich zu σv

2) relativ unbedeutend.

• Dagegen nimmt λ mit hohem T sowie falls σα2 im Vergleich zu σv

2 groß ist,

hohe Werte an. In diesem Fall nähern sich die random effects und fixed ef-

fects Schätzer an.

• Falls αi mit einer erklärenden Variablen korreliert ist, ergibt sich ein inkonsis-

tenter random effects Schätzer. Die entsprechende asymptotische Verzer-

rung wird durch den Faktor 1 - λ bestimmt, so dass diese für große λ, d.h.

für λ → 1, immer kleiner wird.

• In empirischen Anwendungen ist es häufig sinnvoll, auch die üblichen ge-

poolten OLS-Schätzungen auszuweisen. Dabei ist zu beachten, dass die

Teststatistiken selbst für den Fall der Unkorreliertheit der αi mit den erklären-

den Variablen wegen der Autokorrelation in den Fehlertermen nicht gültig

sind. Allerdings können natürlich cluster-robuste Schätzungen der Standard-

abweichungen der geschätzten Parameter betrachtet werden.

44

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (I)

Für die Analyse der Determinanten des Logarithmus von Löhnen (logwage)

werden erneut die Paneldaten für 545 dauerhaft berufstätige Männer für die

Jahre von 1980 bis 1987 betrachtet. Dabei werden jetzt neben den fixed effects

Schätzungen zusätzlich auch gepoolte OLS-Schätzungen sowie random ef-

fects Schätzungen untersucht. In den beiden letzteren Ansätzen (nicht aber im

fixed effects Ansatz) können nun die zeitinvarianten Variablen für Bildungs-

stand (educ) und schwarze Hautfarbe (black) einbezogen werden. Als zeitvari-

ante erklärende Variablen werden Erfahrung (exper), quadrierte Erfahrung

(expersq), Familienstand (married) und Gewerkschaftszugehörigkeit (union)

betrachtet. Zusätzlich wird die maximale Anzahl von Dummy-Variablen für die

Jahre 1981 bis 1987 einbezogen. Dadurch kann der Effekt von exper in der

fixed effects Schätzung nicht identifiziert werden, da sich der Wert dieser Vari-

able bei allen untersuchten Personen jeweils um ein Jahr über die Zeit erhöht.

Dagegen kann die quadrierte Erfahrung auch im fixed effects Ansatz einbezo-

gen werden. Dabei haben sich mit STATA bei den drei (cluster-robusten)

Schätzungen folgende Ergebnisse gezeigt (cluster-robuste Schätzungen der

Standardabweichungen der geschätzten Parameter sind somit auch bei der

random effects Schätzung möglich):

---------------------------------------------------------------------------------------------------------

45

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (II)

reg logwage educ black exper expersq married union d81 d82 d83 d84 d85 d86 d87,

cluster(nr)

Linear regression Number of obs = 4360

F( 13, 544) = 49.98

Prob > F = 0.0000

R-squared = 0.1892

Root MSE = .48031

(Std. Err. adjusted for 545 clusters in nr)

------------------------------------------------------------------------------

| Robust


-------------+----------------------------------------------------------------

educ | .0907146 .0108457 8.36 0.000 .0694101 .1120191

black | -.1423222 .0497384 -2.86 0.004 -.240025 -.0446194

exper | .0669274 .0195469 3.42 0.001 .0285307 .105324

expersq | -.0023875 .0010244 -2.33 0.020 -.0043998 -.0003752

married | .108094 .0260188 4.15 0.000 .0569845 .1592036

union | .1831315 .0275341 6.65 0.000 .1290453 .2372177

d81 | .0584744 .0281803 2.08 0.038 .0031189 .1138299

d82 | .0630235 .0369094 1.71 0.088 -.0094789 .1355259

d83 | .0623225 .0461705 1.35 0.178 -.0283717 .1530167

d84 | .0907742 .0578867 1.57 0.117 -.0229345 .204483

d85 | .1095213 .0667783 1.64 0.102 -.0216535 .2406962

d86 | .1421435 .076196 1.87 0.063 -.0075309 .2918178

d87 | .1738353 .0851938 2.04 0.042 .0064861 .3411844

_cons | .1028863 .1562062 0.66 0.510 -.203955 .4097276

------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

46

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (III)

xtreg logwage educ black exper expersq married union d81 d82 d83 d84 d85 d86 d87, re

cluster(nr)

Random-effects GLS regression Number of obs = 4360



between = 0.1857 avg = 8.0


Wald chi2(13) = 606.11

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000


------------------------------------------------------------------------------

| Robust

logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

educ | .0909923 .0109139 8.34 0.000 .0696015 .1123831

black | -.1434596 .0501434 -2.86 0.004 -.2417389 -.0451802

exper | .1057427 .0163721 6.46 0.000 .073654 .1378315

expersq | -.0047179 .0007915 -5.96 0.000 -.0062692 -.0031666

married | .0639586 .0189583 3.37 0.001 .0268009 .1011162

union | .106401 .0208371 5.11 0.000 .065561 .147241

d81 | .0404346 .0275602 1.47 0.142 -.0135825 .0944517

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .1344691 .0849487 1.58 0.113 -.0320272 .3009654

_cons | .0377516 .1557827 0.24 0.809 -.2675769 .3430801

-------------+----------------------------------------------------------------

sigma_u | .32426153

sigma_e | .35099001


------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

47

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (IV)

xtreg logwage expersq married union d81 d82 d83 d84 d85 d86 d87, fe cluster(nr)




between = 0.0286 avg = 8.0


F(10,544) = 46.59

corr(u_i, Xb) = -0.1222 Prob > F = 0.0000


------------------------------------------------------------------------------

| Robust


-------------+----------------------------------------------------------------

expersq | -.0051855 .0008102 -6.40 0.000 -.0067771 -.0035939

married | .0466804 .0210038 2.22 0.027 .0054218 .0879389

union | .0800019 .0227431 3.52 0.000 .0353268 .1246769

d81 | .1511912 .0255648 5.91 0.000 .1009733 .2014091

d82 | .2529709 .0286624 8.83 0.000 .1966684 .3092734

d83 | .3544437 .0348608 10.17 0.000 .2859655 .422922

d84 | .4901148 .0454581 10.78 0.000 .4008199 .5794097

d85 | .6174822 .0568088 10.87 0.000 .5058908 .7290737

d86 | .7654965 .071244 10.74 0.000 .6255495 .9054436

d87 | .9250249 .0840563 11.00 0.000 .7599103 1.09014

_cons | 1.426019 .0209824 67.96 0.000 1.384802 1.467235

-------------+----------------------------------------------------------------

sigma_u | .39176195

sigma_e | .35099001


------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

48

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (V)

Interpretation:

• Die Parameterschätzwerte für educ und black sind bei den gepoolten OLS-

und random effects Schätzungen sehr ähnlich

• Der signifikant positive Effekt von married und union ist bei der gepoolten

OLS-Schätzung am stärksten und bei der fixed effects Schätzung (also bei

der Beseitigung der unbeobachteten Effekte αi) am schwächsten. Dieser

Rückgang könnte dadurch erklärt werden, dass Männer mit höheren Fähig-

keiten (ausgedrückt durch höhere αi) häufiger verheiratet sind, wodurch sich

bei der gepoolten OLS-Schätzung eine Überschätzung ergibt.

• Bei der fixed effects Schätzung verbleibt eine geschätzte Prämie für Verhei-

ratete von 4,7%. Mögliche Erklärungen hierfür sind, dass verheiratete Män-

ner produktiver sind mit entsprechend höheren Löhnen oder dass Arbeitge-

ber verheirateten Männern mehr zahlen, da die Ehe von ihnen als ein Signal

für Stabilität angesehen wird.

• Der Schätzer λ für λ beträgt :

1 - [0,3512/(0,3512 +8∙0,3242)]1/2 = 1 - [1/(1+8(0,3242/0,3512))]1/2 = 0,642.

Dieser hohe Wert führt offensichtlich dazu, dass die random effects Schätzer

näher an den fixed effects Schätzern als an den gepoolten OLS-Schätzern

liegen. Dieser Wert kann mit STATA auch direkt geschätzt werden:

---------------------------------------------------------------------------------------------------------

49

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (VI)


theta




between = 0.1857 avg = 8.0


Wald chi2(13) = 957.68


theta = .64258271

------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

educ | .0909923 .0105088 8.66 0.000 .0703955 .1115891

black | -.1434596 .0470052 -3.05 0.002 -.235588 -.0513311

exper | .1057427 .0153596 6.88 0.000 .0756384 .135847

expersq | -.0047179 .0006894 -6.84 0.000 -.0060691 -.0033667

married | .0639586 .0167719 3.81 0.000 .0310862 .0968309

union | .106401 .0178465 5.96 0.000 .0714225 .1413795

d81 | .0404346 .0246907 1.64 0.101 -.0079583 .0888275

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .1344691 .0812426 1.66 0.098 -.0247634 .2937017

_cons | .0377516 .147968 0.26 0.799 -.2522605 .3277636

-------------+----------------------------------------------------------------

sigma_u | .32426153

sigma_e | .35099001


------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

50

Fixed effects versus random effects Schätzungen in linearen Panelmodellen

mit unbeobachteter Heterogenität:

• Der wesentliche Vorteil von fixed effects Schätzungen ist, dass diese belie-

bige Korrelationen zwischen dem unbeobachteten Effekt αi und den erklä-

renden Variablen erlaubt

• Ein Vorteil von random effects Schätzungen (ebenso wie von ineffizienteren

gepoolten OLS-Schätzungen) ist die mögliche Einbeziehung von zeitinvari-

anten erklärenden Variablen. Falls man dagegen lediglich am Effekt zeitvari-

anter erklärender Variablen interessiert ist, ist oft die Betrachtung von fixed

effects Schätzungen vorteilhafter.

• Zur Auswahl zwischen fixed effects und random effects Schätzungen wird

häufig der Spezifikationstest nach Hausman betrachtet (siehe später)

• Zu beachten ist, dass aufgrund des mikroökonometrischen Fokus mit einer

Zufallsstichprobe aus einer großen Grundgesamtheit αi generell als Zufalls-

variable betrachtet wird. Dagegen werden die αi bei anderen (älteren) Stu-

dien lediglich bei random effects Schätzungen als Zufallsvariablen, bei fixed

effects Schätzungen jedoch als zu schätzende Parameter angesehen.

• In manchen Fällen ist aber die Annahme einer Zufallsstichprobe aus einer

großen Grundgesamtheit nicht sinnvoll (z.B. bei der Betrachtung von Regio-

nen oder Branchen), so dass hier die Betrachtung der αi als zu schätzende

Konstanten im Rahmen einer fixed effects Schätzung mehr Sinn macht

51

2.3 Testverfahren

F-Test zur Überprüfung der Nullhypothese, dass keine unbeobachtete Hetero-

genität bei fixed effects Schätzungen vorliegt:

• Ausgangspunkt ist folgendes lineares Panelmodell mit unbeobachteter He-

terogenität:

• Überprüft wird die Nullhypothese, dass die αi der unbeobachteten Effekte für

alle n Querschnittseinheiten identisch sind bzw. dass die αi von n-1 Quer-

schnittseinheiten (eine Einheit stellt die Basisgruppe dar) gemeinsam den

Wert null annehmen, so dass in diesem Fall keine unbeobachtete Heteroge-

nität vorliegt:

• Bei Gültigkeit der Alternativhypothese, dass die αi unterschiedlich sind, liegt

dagegen unbeobachtete Heterogenität vor

• Zur Überprüfung dieser Nullhypothese wird ein entsprechender F-Test

durchgeführt. Die Prüfgröße lautet:

it 1 it1 k itk i ity = β x + + β x + α + v für i = 1,..., n; t = 1,..., T

0 2 3 nH : α = α = = α = 0

2 2

LSDV pooled2 2

LSDV pooled

2 2

LSDV LSDV

R -RR -R n(T-1)-kn-1F = =

1-R 1-R n-1

nT-n-k

52

• Hier gilt n-1 = q. Zudem entsprechen die Bestimmtheitsmaße R2LSDV

und

R2pooled bei der Dummy-Variablen Schätzung und bei der gepoolten OLS-

Schätzung den entsprechenden Bestimmtheitsmaßen R2ur und R2

r in unres-

tringierten und restringierten linearen Panelmodellen.

• Bei Gültigkeit der Nullhypothese ist diese Prüfgröße F-verteilt mit n-1 und

n(T-1)-k Freiheitsgrade, so dass H0: α2 =⋯= αn = 0 bei einem Signifikanzni-

veau von α zugunsten der entsprechenden Alternativhypothese verworfen

wird, falls F > Fn-1;n(T-1)-k;1-α

LM-Test nach Breusch und Pagan zur Überprüfung der Nullhypothese, dass

keine unbeobachtete Heterogenität bei random effects Schätzungen vorliegt:

• Ausgangspunkt ist folgendes lineares Panelmodell mit unbeobachteter He-

terogenität:

• Überprüft wird die Nullhypothese, dass die Varianz von αi den Wert null an-

nimmt, so dass in diesem Fall keine unbeobachtete Heterogenität vorliegt:

• Bei Gültigkeit der Alternativhypothese H1: σ2

α ≠ 0 liegt dagegen unbeobach-

tete Heterogenität vor

it 0 1 it1 k itk i ity = β + β x + + β x + α + v für i = 1,..., n; t = 1,..., T

2

0 αH : σ = 0

53

• Zur Überprüfung der Nullhypothese betrachten Breusch und Pagan einen

LM-Test (Lagrange Multiplikatoren Test). LM-Tests basieren nicht allgemein

auf einer GLS-Schätzung, sondern auf einer Maximum Likelihood Schät-

zung (siehe später) und somit auf der impliziten Annahme, dass die Fehler-

terme normalverteilt sind. Bei der Prüfgröße werden die entsprechenden

Residuen v it einbezogen:

• Bei Gültigkeit der Nullhypothese ist die Prüfgröße LM asymptotisch χ2-ver-

teilt mit einem Freiheitsgrad, so dass H0: σ2

α = 0 bei einem Signifikanzniveau

von α zugunsten der entsprechenden Alternativhypothese H1: σ2

α ≠ 0 ver-

worfen wird, falls LM > χ21;1-α

→ Während die Ergebnisse des F-Tests zur Überprüfung von unbeobachteter

Heterogenität bei der fixed effects Schätzung (unter Einbeziehung von kon-

ventionellen Schätzern der Standardabweichungen der geschätzten Para-

meter, also keinen cluster-robusten Schätzern) mit Programmpaketen (z.B.

STATA) üblicherweise ausgewiesen werden, müssen zur Durchführung des

Breusch/Pagan LM-Tests meist zusätzliche Anweisungen gegeben werden

2n T

it

i=1 t=1

n T2

it

i=1 t=1

v̂nT

LM = - 12(T-1)

v̂

54

Spezifikationstest nach Hausman zur Überprüfung der Nullhypothese, dass in

linearen Panelmodellen mit unbeobachteter Heterogenität die Annahmen der

random effects Schätzung vorliegen gegen die Alternativhypothese, dass die

Annahmen der fixed effects Schätzung vorliegen:

• Hausman Tests basieren generell auf dem Vergleich eines Schätzvektors β a

mit einem anderen Schätzvektor β b. Bei Gültigkeit der Nullhypothese sind

dabei beide Schätzer konsistent, aber β b ist effizient. Dagegen ist zwar β a

bei Gültigkeit der Alternativhypothese konsistent, β b dagegen nicht.

• Diese Herangehensweise kann auf den Vergleich zwischen fixed effects

Schätzer β f und random effects Schätzer β r bezogen werden. Unter der Null-

hypothese, dass αi mit allen erklärenden Variablen unkorreliert ist, sind so-

wohl β f als auch β r konsistent, wobei der random effects Schätzer β r effizient

ist. Unter der Alternativhypothese, dass αi mit einer erklärenden Variablen

korreliert ist, ist dagegen zwar β f konsistent, β r aber inkonsistent.

• Somit sollten sich die beiden Schätzer unter der Nullhypothese nicht syste-

matisch unterscheiden. Falls allerdings statistisch eine Abweichung zwi-

schen beiden Schätzern nachgewiesen werden kann, spricht dies dafür,

dass die wesentliche Annahme für die Anwendung einer random effects

Schätzung nicht getroffen werden kann.

• Zu beachten ist dabei, dass nur die in beiden Ansätzen geschätzten Regres-

sionsparameter herangezogen werden können, nicht also z.B. die geschätz-

ten Parameter von zeitinvarianten erklärenden Variablen (z.B. Geschlecht)

55

• Neben der Differenz zwischen den beiden Schätzern β f und β r wird in die

Prüfgröße des Hausman Tests auch die geschätzte Varianz-Kovarianzmatrix

dieser Differenz einbezogen:

• Bei Gültigkeit der Nullhypothese ist die Prüfgröße H asymptotisch χ2-verteilt

mit der Anzahl q der in beiden Ansätzen geschätzten Regressionsparame-

ter. Damit wird die Nullhypothese, dass αi mit allen erklärenden Variablen

unkorreliert ist, bei einem Signifikanzniveau von α zugunsten der Alternativ-

hypothese von entsprechenden Korrelationen verworfen, falls H > χ2q;1-α.

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (I)

Im vorherigen Beispiel der Analyse der Determinanten des Logarithmus von

Löhnen (logwage) mit Paneldaten für 545 dauerhaft berufstätige Männer für die

Jahre von 1980 bis 1987 (erklärende Variablen: educ, black, exper, expersq,

married, union, Dummy-Variablen für die Jahre 1981 bis 1987) haben sich mit

STATA folgende konventionelle (also nicht cluster-robuste) fixed und random

effects Schätzergebnisse sowie F-, Breusch/Pagan LM- und Hausman Tester-

gebnisse gezeigt (bei cluster-robusten fixed effects Schätzungen wird der F-

Test nicht ausgewiesen, siehe oben):

---------------------------------------------------------------------------------------------------------

-1'

f r f r f rˆ ˆ ˆ ˆ ˆ ˆˆH = β -β Cov β -β β -β

56

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (II)

xtreg logwage expersq married union d81 d82 d83 d84 d85 d86 d87, fe




between = 0.0286 avg = 8.0


F(10,3805) = 83.85

corr(u_i, Xb) = -0.1222 Prob > F = 0.0000

------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

expersq | -.0051855 .0007044 -7.36 0.000 -.0065666 -.0038044

married | .0466804 .0183104 2.55 0.011 .0107812 .0825796

union | .0800019 .0193103 4.14 0.000 .0421423 .1178614

d81 | .1511912 .0219489 6.89 0.000 .1081584 .194224

d82 | .2529709 .0244185 10.36 0.000 .2050963 .3008454

d83 | .3544437 .0292419 12.12 0.000 .2971125 .411775

d84 | .4901148 .0362266 13.53 0.000 .4190893 .5611402

d85 | .6174822 .0452435 13.65 0.000 .5287784 .7061861

d86 | .7654965 .0561277 13.64 0.000 .6554532 .8755399

d87 | .9250249 .0687731 13.45 0.000 .7901892 1.059861

_cons | 1.426019 .0183415 77.75 0.000 1.390058 1.461979

-------------+----------------------------------------------------------------

sigma_u | .39176195

sigma_e | .35099001


------------------------------------------------------------------------------


---------------------------------------------------------------------------------------------------------

57

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (III)





between = 0.1857 avg = 8.0


Wald chi2(13) = 957.68


------------------------------------------------------------------------------


-------------+----------------------------------------------------------------

educ | .0909923 .0105088 8.66 0.000 .0703955 .1115891

black | -.1434596 .0470052 -3.05 0.002 -.235588 -.0513311

exper | .1057427 .0153596 6.88 0.000 .0756384 .135847

expersq | -.0047179 .0006894 -6.84 0.000 -.0060691 -.0033667

married | .0639586 .0167719 3.81 0.000 .0310862 .0968309

union | .106401 .0178465 5.96 0.000 .0714225 .1413795

d81 | .0404346 .0246907 1.64 0.101 -.0079583 .0888275

⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .1344691 .0812426 1.66 0.098 -.0247634 .2937017

_cons | .0377516 .147968 0.26 0.799 -.2522605 .3277636

-------------+----------------------------------------------------------------

sigma_u | .32426153

sigma_e | .35099001


------------------------------------------------------------------------------

---------------------------------------------------------------------------------------------------------

58

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (IV)

Testanweisung und Testergebnisse für den Breusch/Pagan LM-Test mit STATA

(nur direkt nach der konventionellen oder auch cluster-robusten random effects

Schätzung möglich):

xttest0

Breusch and Pagan Lagrangian multiplier test for random effects

logwage[nr,t] = Xb + u[nr] + e[nr,t]

Estimated results:

| Var sd = sqrt(Var)

---------+-----------------------------

logwage | .2836728 .5326094

e | .123194 .35099

u | .1051455 .3242615

Test: Var(u) = 0

chi2(1) = 3203.58

Prob > chi2 = 0.0000

Für die Anwendung des Hausman Tests mit STATA muss zunächst die unter

der Null- und Alternativhypothese konsistente Schätzung (hier also die fixed

effects Schätzung) durchgeführt werden. Im Anschluss daran ist die Anweisung

„estimates store fixed“ notwendig (die Wahl des Namens „fixed“ ist willkürlich).

Danach muss die ausschließlich unter der Nullhypothese konsistente Schät-

zung (hier also die random effects Schätzung) durchgeführt werden.

---------------------------------------------------------------------------------------------------------

59

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (V)

Schließlich erfolgt dann folgende Testanweisung mit STATA:

hausman fixed

---- Coefficients ----

| (b) (B) (b-B) sqrt(diag(V_b-V_B))

| fixed . Difference S.E.

-------------+----------------------------------------------------------------

expersq | -.0051855 -.0047179 -.0004676 .0001447

married | .0466804 .0639586 -.0172782 .0073468

union | .0800019 .106401 -.0263992 .007375

d81 | .1511912 .0404346 .1107566 .

d82 | .2529709 .030851 .2221199 .

d83 | .3544437 .020161 .3342827 .

d84 | .4901148 .0429321 .4471827 .

d85 | .6174822 .0575582 .559924 .

d86 | .7654965 .0916036 .6738929 .

d87 | .9250249 .1344691 .7905558 .

------------------------------------------------------------------------------

b = consistent under Ho and Ha; obtained from xtreg

B = inconsistent under Ha, efficient under Ho; obtained from xtreg

Test: Ho: difference in coefficients not systematic

chi2(10) = (b-B)'[(V_b-V_B)^(-1)](b-B)

= 26.64

Prob>chi2 = 0.0030

(V_b-V_B is not positive definite)

---------------------------------------------------------------------------------------------------------

60

---------------------------------------------------------------------------------------------------------

Beispiel: Erklärung von Löhnen (VI)

Interpretation:

• Die Nullhypothesen, dass sowohl bei der fixed effects Schätzung als auch

bei der random effects Schätzung in linearen Panelmodellen keine unbeo-

bachtete Heterogenität vorliegt, können mit den entsprechenden F- und

Breusch/Pagan LM-Tests bei allen denkbaren Signifikanzniveaus verworfen

werden

• Damit kann (wie in den meisten Fällen) von einer unbeobachteten Heteroge-

nität in diesen linearen Panelmodellen ausgegangen werden

• Die Nullhypothese, dass in linearen Panelmodellen mit unbeobachteter He-

terogenität αi mit allen erklärenden Variablen unkorreliert ist, kann mit dem

Hausman Test bei einem 1%-Signifikanzniveau abgelehnt werden

• Damit weist der Hausman Test auf entsprechende Korrelationen hin, so

dass auch eine fixed effects Schätzung einer random effects Schätzung vor-

zuziehen ist

---------------------------------------------------------------------------------------------------------

2.1 Fixed effects Schätzung · 2019-04-10 · unab-hängig und identisch normalverteilt mit...

Documents

Transcript of 2.1 Fixed effects Schätzung · 2019-04-10 · unab-hängig und identisch normalverteilt mit...