2.1 Fixed effects Schätzung · 2019-04-10 · unab-hängig und identisch normalverteilt mit...
Transcript of 2.1 Fixed effects Schätzung · 2019-04-10 · unab-hängig und identisch normalverteilt mit...
1
2. Statische lineare Panelmodelle
2.1 Fixed effects Schätzung
→ Eine gegenüber der first-differenced OLS-Schätzung oft vorteilhaftere Vor-
gehensweise zur Beseitigung der fixen Effekte αi in linearen fixed effects
Modellen ergibt sich durch eine fixed effects Transformation
Ausgangspunkt ist dabei folgendes lineares Panelmodell mit unbeobachteter
Heterogenität:
Für jede Querschnittseinheit i wird bei diesen Gleichungen das arithmetische
Mittel über die Zeit gebildet:
Dabei gilt:
Da der fixe Effekt αi zeitinvariant ist, erscheint er in beiden Gleichungen.
it 1 it1 2 it2 k itk i ity = β x + β x + + β x + α + v für i = 1,..., n; t = 1,..., T
i 1 i1 2 i2 k ik i iy = β x + β x + + β x + α + v
T T
i it i1 it1
t=1 t=1
1 1y = y ; x = x usw.
T T
2
Im Folgenden wird für alle t = 1,…, T die obige Gleichung subtrahiert:
Mit y it = yit - y i, x it1 = xit1 - x i1,…, x itk = xitk - x ik sowie v it = vit - v i ergibt sich:
Diese fixed effects Transformation wird auch als within Transformation bezeich-
net. Da der unbeobachtete Effekt (ebenso wie eine Konstante) nun beseitigt ist,
kann hier eine gepoolte OLS-Schätzung durchgeführt werden (üblicherweise
wird dabei von ökonometrischen Programmpaketen wie z.B. STATA auch eine
geschätzte „Konstante“ ausgewiesen, siehe unten). Dieser Schätzer wird als
fixed effects oder within Schätzer bezeichnet. Diese Bezeichnung basiert da-
rauf, dass sich die OLS-Schätzung auf die zeitliche Variation aller Variablen in-
nerhalb (within) jeder Querschnittseinheit bezieht.
→ Einen entsprechenden between Schätzer erhält man durch eine OLS-Schät-
zung allein mit den arithmetischen Mitteln der abhängigen und erklärenden
Variablen über die Zeit, wobei zusätzlich noch eine Konstante einbezogen
wird. Dabei handelt es sich letztlich um eine Querschnittsgleichung, die wie
ein lineares Regressionsmodell mit Querschnittsdaten behandelt werden
kann. Allerdings wird dieser Schätzer nicht sehr häufig angewendet, da er
die wichtige Information, wie sich die Variablen über die Zeit verändern, ig-
noriert und da er verzerrt ist, falls αi mit den arithmetischen Mitteln der erklä-
renden Variablen korreliert ist.
it i 1 it1 i1 2 it2 i2 k itk ik it iy - y = β (x - x ) + β (x - x ) + + β (x - x ) + v - v
it 1 it1 2 it2 k itk ity = β x + β x + + β x + v
3
Der fixed effects Schätzer erlaubt ebenso wie der first-differenced Schätzer in
linearen Panelmodellen mit unbeobachteter Heterogenität in jeder Zeitperiode
beliebige Korrelationen zwischen αi und den erklärenden Variablen. Allerdings
müssen beim within Schätzer für dessen Erwartungstreue dieselben Annah-
men vorliegen wie bei der Erwartungstreue von first-differenced Schätzern:
• Annahme D1: Lineares fixed effects Modell
yit = β1xit1 +…+ βkxitk + αi + vit
• Annahme D2: Zufallsstichprobe
Es liegt im Querschnitt eine Stichprobe vom Umfang n aus der Grundge-
samtheit vor
• Annahme D3: Keine perfekte Kollinearität und Zeitvarianz
Jede erklärende Variable muss für einige i über die Zeit variieren (es können
also erneut Variablen wie z.B. Geschlecht nicht einbezogen werden) und es
besteht keine exakte lineare Beziehung zwischen den erklärenden Variablen
• Annahme D4: Bedingter Erwartungswert von vit ist null
Für alle t ist der bedingte Erwartungswert des idiosynkratischen Fehlers, ge-
geben die erklärenden Variablen in allen Perioden sowie der unbeobachtete
Effekt, null, d.h. E(vit|xi, αi) = 0. Diese Unkorreliertheit von vit und xi impliziert
wiederum die strikte Exogenität der erklärenden Variablen.
Mit diesen vier Annahmen D1 bis D4 sind auch die within Schätzer der Regres-
sionsparameter erwartungstreu und für festes T mit n → ∞ konsistent.
4
Weitere Annahmen:
• Annahme D5: Homoskedastizität
Var(vit|xi, αi) = σ2 (für alle t = 1,…, T)
• Annahme D6: Keine Autokorrelation
Für alle Perioden t ≠ s sind die idiosynkratischen Fehler unter der Bedin-
gung von xi und αi) unkorreliert, d.h. Cov(vit, vis|xi, αi) = 0
Mit diesen sechs Annahmen D1 bis D6 sind die fixed effects Schätzer der Re-
gressionsparameter die besten linearen unverzerrten Schätzer. Da der first-dif-
ferenced Schätzer auch linear und unverzerrt ist, besitzt der within Schätzer
notwendigerweise eine geringere Varianz. Diese Überlegenheit des within
Schätzers basiert auf Annahme D6, die keine Autokorrelation in den idiosynkra-
tischen Fehlern impliziert (und sich deshalb von Annahme C6 unterscheidet).
Zusätzliche Annahme D7: Normalverteilung
Unter der Bedingung von xi und αi sind die idiosynkratischen Fehler vit unab-
hängig und identisch normalverteilt mit Erwartungswert null und Varianz σv2
Annahme D7 impliziert die Annahmen D4 bis D6, ist aber aufgrund der Annah-
me der Normalverteilung restriktiver. Mit den sieben Annahmen D1 bis D7 fol-
gen die t- und F-Statistiken bei fixed effects Schätzern exakt den t- und F-Ver-
teilungen. Ohne die Annahme D7 können jedoch (bei großen n und kleinen T)
asymptotische Approximationen abgeleitet werden.
5
Bemerkungen:
• Bei der fixed effects Schätzung der Parameter der k erklärenden Variablen
(Konstanten werden durch die within Transformation eliminiert) können ins-
gesamt N = nT Beobachtungen verwendet werden. Dies könnte bei der Ab-
leitung von Teststatistiken zu einer Betrachtung von nT-k Freiheitsgraden
verleiten. Allerdings geht für jede Querschnittseinheit i bei der within Trans-
formation ein Freiheitsgrad verloren, so dass die korrekte Anzahl an Frei-
heitsgraden nT-n-k = n(T-1)-k lautet. Diese Korrektur muss bei einer eigenen
within Schätzung durchgeführt werden, wird aber bei der Verwendung von
Programmpaketen (z.B. STATA) üblicherweise beachtet.
• Obwohl zeitinvariante erklärende Variablen bei fixed effects Schätzungen
nicht verwendet werden können, ist die Einbeziehung von Interaktionster-
men von zeitinvarianten und zeitvarianten Variablen (einschließlich Dummy-
Variablen für Zeitperioden) möglich. Zur Erklärung von individuellen Löhnen
kann z.B. Bildung nicht einbezogen werden, wenn diese für alle betrachte-
ten Personen über die Zeit konstant ist. Jedoch kann zur Überprüfung, ob
der Effekt von Bildung sich über die Zeit ändert, Bildung mit allen Dummy-
Variablen für Zeitperioden (außer für die Basisperiode) interagiert werden.
• Die Einbeziehung der maximal möglichen Anzahl an Dummy-Variablen für
die Perioden (oder eines linearen Zeittrends) schließt die Identifikation des
Effektes erklärender Variablen aus, die sich bei allen Querschnittseinheiten i
mit dem gleichen Betrag über die Zeit verändern (z.B. Alter)
6
---------------------------------------------------------------------------------------------------------
Beispiel 1: Weiterbildungsprogramme und Ausschussraten (I)
Für die Analyse des Effektes von Beihilfen im Rahmen eines Weiterbildungs-
programms in Michigan auf den Logarithmus der Ausschussraten (logscrap) in
54 Unternehmen liegen Paneldaten für die Jahre 1987, 1988 und 1989 vor. Vor
1988 hat kein Unternehmen eine entsprechende Beihilfe erhalten. In 1988 ha-
ben 19 Unternehmen und in 1989 haben 10 andere Unternehmen eine Weiter-
bildungsbeihilfe bekommen.
Als erklärende Variablen werden folgende Faktoren betrachtet:
• Beihilfe in einem Jahr t (grant)
• Um ein Jahr verzögerte Beihilfe (grantlagged) zur Überprüfung, ob eine
Beihilfe in 1988 einen Effekt auf die Ausschussraten 1989 hat
• Dummy-Variablen für 1988 (d88) und für 1989 (d89)
Bei der fixed effects Schätzung zeigen sich mit STATA folgende Ergebnisse:
---------------------------------------------------------------------------------------------------------
7
---------------------------------------------------------------------------------------------------------
Beispiel 1: Weiterbildungsprogramme und Ausschussraten (II)
xtreg logscrap grant grantlagged d88 d89, fe
Fixed-effects (within) regression Number of obs = 162
Group variable: fcode Number of groups = 54
R-sq: within = 0.2010 Obs per group: min = 3
between = 0.0079 avg = 3.0
overall = 0.0068 max = 3
F(4,104) = 6.54
corr(u_i, Xb) = -0.0714 Prob > F = 0.0001
------------------------------------------------------------------------------
logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grant | -.2523149 .150629 -1.68 0.097 -.5510178 .046388
grantlagged | -.4215895 .2102 -2.01 0.047 -.8384239 -.0047551
d88 | -.0802157 .1094751 -0.73 0.465 -.2973089 .1368776
d89 | -.2472028 .1332183 -1.86 0.066 -.5113797 .016974
_cons | .597434 .0677344 8.82 0.000 .4631142 .7317539
-------------+----------------------------------------------------------------
sigma_u | 1.438982
sigma_e | .4977442
rho | .89313867 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(53, 104) = 24.66 Prob > F = 0.0000
---------------------------------------------------------------------------------------------------------
8
---------------------------------------------------------------------------------------------------------
Beispiel 1: Weiterbildungsprogramme und Ausschussraten (III)
Interpretation der Ergebnisse:
• Die Interpretation der Schätzergebnisse bezieht sich meist auf das zugrun-
deliegende lineare fixed effects Modell und nicht auf die Gleichung mit Dif-
ferenzenbildung
• Der geschätzte Effekt der um ein Jahr verzögerten Beihilfe ist stärker als der
kontemporäre Effekt und impliziert näherungsweise einen durchschnittlichen
Rückgang der Ausschussrate von 42,2%. Zudem ist der geschätzte Para-
meter für die verzögerte Beihilfe im Vergleich zum geschätzten Parameter
für die kontemporäre Beihilfe bei einem geringeren Signifikanzniveau von
5% von null verschieden.
• Falls die verzögerte Beihilfe nicht als erklärende Variable einbezogen wird,
ergibt sich für die kontemporäre Beihilfe ein geschätzter Parameterwert von
-0,082 bei einem t-Wert von -0,65
• Der geschätzte Parameter für d89 impliziert, dass die Ausschussraten unab-
hängig von den Weiterbildungsbeihilfen im Jahr 1989 geringer waren als im
Jahr 1987.
---------------------------------------------------------------------------------------------------------
9
---------------------------------------------------------------------------------------------------------
Beispiel 1: Weiterbildungsprogramme und Ausschussraten (IV)
Falls diese beiden Dummy-Variablen nicht einbezogen werden, schlägt sich
der zeitliche Rückgang der Ausschussraten im Effekt der Beihilfe nieder:
xtreg logscrap grant grantlagged, fe
Fixed-effects (within) regression Number of obs = 162
Group variable: fcode Number of groups = 54
R-sq: within = 0.1734 Obs per group: min = 3
between = 0.0076 avg = 3.0
overall = 0.0016 max = 3
F(2,106) = 11.12
corr(u_i, Xb) = -0.1298 Prob > F = 0.0000
------------------------------------------------------------------------------
logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grant | -.3848519 .1247204 -3.09 0.003 -.6321223 -.1375816
grantlagged | -.694953 .1540848 -4.51 0.000 -1.000441 -.3894649
_cons | .5440814 .0519996 10.46 0.000 .4409871 .6471758
-------------+----------------------------------------------------------------
sigma_u | 1.4496731
sigma_e | .50147332
rho | .89312684 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(53, 106) = 24.59 Prob > F = 0.0000
---------------------------------------------------------------------------------------------------------
10
---------------------------------------------------------------------------------------------------------
Beispiel 1: Weiterbildungsprogramme und Ausschussraten (V)
Zum Vergleich zeigen sich in einem linearen gepoolten Regressionsmodell un-
ter Einbeziehung der beiden Dummy-Variablen für 1988 und 1989 mit STATA
folgende OLS-Schätzergebnisse:
reg logscrap grant grantlagged d88 d89
Source | SS df MS Number of obs = 162
-------------+------------------------------ F( 4, 157) = 0.69
Model | 6.15830795 4 1.53957699 Prob > F = 0.5989
Residual | 349.586765 157 2.22666729 R-squared = 0.0173
-------------+------------------------------ Adj R-squared = -0.0077
Total | 355.745073 161 2.20959673 Root MSE = 1.4922
------------------------------------------------------------------------------
logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grant | .2000196 .3382846 0.59 0.555 -.4681564 .8681957
grantlagged | .0489357 .4360663 0.11 0.911 -.8123777 .9102492
d88 | -.2393704 .3108639 -0.77 0.442 -.8533854 .3746446
d89 | -.4965237 .3379281 -1.47 0.144 -1.163996 .1709483
_cons | .597434 .203063 2.94 0.004 .1963462 .9985218
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
11
---------------------------------------------------------------------------------------------------------
Beispiel 1: Weiterbildungsprogramme und Ausschussraten (VI)
Darüber hinaus zeigen sich in einem linearen first-differenced Modell unter Ein-
beziehung der Dummy-Variablen für 1989 (und damit der maximal möglichen
Anzahl an Dummy-Variablen für die drei Jahre 1987, 1988, 1989) mit STATA
folgende OLS-Schätzergebnisse:
reg d.(logscrap grant grantlagged) d89
Source | SS df MS Number of obs = 108
-------------+------------------------------ F( 3, 104) = 1.31
Model | 1.31104171 3 .437013902 Prob > F = 0.2739
Residual | 34.5904836 104 .332600804 R-squared = 0.0365
-------------+------------------------------ Adj R-squared = 0.0087
Total | 35.9015253 107 .335528274 Root MSE = .57672
------------------------------------------------------------------------------
D.logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grant |
D1. | -.2227811 .1307423 -1.70 0.091 -.482048 .0364859
|
grantlagged |
D1. | -.3512459 .2350848 -1.49 0.138 -.817428 .1149361
|
d89 | -.0962082 .1254469 -0.77 0.445 -.3449741 .1525577
_cons | -.0906072 .0909695 -1.00 0.322 -.2710031 .0897888
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
12
---------------------------------------------------------------------------------------------------------
Beispiel 2: Erklärung von Löhnen (I)
Bei der Analyse der Determinanten des Logarithmus von Löhnen (logwage) lie-
gen Paneldaten für 545 dauerhaft berufstätige Männer für die Jahre von 1980
bis 1987 vor. Einige Variablen im Datensatz variieren dabei über die Zeit, wäh-
rend andere zeitinvariant sind. Für within Schätzer (oder auch first-differenced
Schätzer) kann z.B. Hautfarbe nicht alleine, aber als Interaktionsterm mit Dum-
my-Variablen für die Jahre 1981 bis 1987 einbezogen werden.
Als erklärende Variablen werden deshalb jetzt folgende Faktoren betrachtet:
• Familienstand (married)
• Gewerkschaftszugehörigkeit (union)
• Dummy-Variablen für die Jahre 1981 (d81) bis 1987 (d87)
• Interaktionsterme des Bildungsstands mit den Dummy-Variablen d81 bis
d87 (d81educ,…, d87educ)
Bei der entsprechenden fixed effects Schätzung ergeben sich für alle Interak-
tionsterme positive Schätzwerte. Der größte Schätzwert von 0,030 zeigt sich
beim Interaktionsterm von Bildungsstand und der Dummy-Variable für 1987 bei
einem t-Wert von 2,48. Dies impliziert einen um drei Prozentpunkte (!) höheren
(partiellen) Effekt (!) des Bildungsstandes in 1987 im Vergleich zu 1980. Es zei-
gen sich mit STATA folgende Schätzergebnisse:
---------------------------------------------------------------------------------------------------------
13
---------------------------------------------------------------------------------------------------------
Beispiel 2: Erklärung von Löhnen (II)
xtreg logwage married union d81 d82 d83 d84 d85 d86 d87 d81educ d82educ d83educ d84educ
d85educ d86educ d87educ, fe
Fixed-effects (within) regression Number of obs = 4360
Group variable: nr Number of groups = 545
R-sq: within = 0.1708 Obs per group: min = 8
between = 0.1900 avg = 8.0
overall = 0.1325 max = 8
F(16,3799) = 48.91
corr(u_i, Xb) = 0.0991 Prob > F = 0.0000
------------------------------------------------------------------------------
logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
married | .0548205 .0184126 2.98 0.003 .018721 .09092
union | .0829785 .0194461 4.27 0.000 .0448527 .1211042
d81 | -.0224159 .1458885 -0.15 0.878 -.3084432 .2636114
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .0904447 .1458505 0.62 0.535 -.1955082 .3763976
d81educ | .0115854 .0122625 0.94 0.345 -.0124562 .0356271
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87educ | .0304332 .0122723 2.48 0.013 .0063722 .0544942
_cons | 1.362459 .0162385 83.90 0.000 1.330622 1.394296
-------------+----------------------------------------------------------------
sigma_u | .37264192
sigma_e | .35335714
rho | .52654437 (fraction of variance due to u_i)
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
14
---------------------------------------------------------------------------------------------------------
Beispiel 2: Erklärung von Löhnen (III)
Die Hypothese, dass alle sieben Parameter der Interaktionsterme gemeinsam
den Wert null aufweisen, kann bei üblichen Signifikanzniveaus nicht verworfen
werden. Dabei lautet die Anzahl der Freiheitsgrade für diesen F-Test 7 und
n(T-1)-k = 545∙7-16 = 3799. Mit STATA zeigen sich folgende Testergebnisse:
test d81educ d82educ d83educ d84educ d85educ d86educ d87educ
( 1) d81educ = 0
( 2) d82educ = 0
( 3) d83educ = 0
( 4) d84educ = 0
( 5) d85educ = 0
( 6) d86educ = 0
( 7) d87educ = 0
F( 7, 3799) = 1.24
Prob > F = 0.2787
Dagegen sind die Parameter von married und union gemeinsam hochsignifi-
kant von null verschieden. Mit STATA zeigen sich folgende Ergebnisse des
entsprechenden F-Tests:
test married union
( 1) married = 0
( 2) union = 0
F( 2, 3799) = 13.91
Prob > F = 0.0000
---------------------------------------------------------------------------------------------------------
15
---------------------------------------------------------------------------------------------------------
Beispiel 2: Erklärung von Löhnen (IV)
Obwohl die Parameter von d81 und d81educ jeweils nicht signifikant von null
verschieden sind, sind sie gemeinsam (ebenso wie die anderen Paare der
Dummy-Variablen für die einzelnen Jahre und der jeweiligen Interaktionsterme)
hochsignifikant von null verschieden. Mit STATA zeigen sich z.B. folgende Er-
gebnisse von entsprechenden F-Tests:
test d81 d81educ
( 1) d81 = 0
( 2) d81educ = 0
F( 2, 3799) = 14.50
Prob > F = 0.0000
test d87 d87educ
( 1) d87 = 0
( 2) d87educ = 0
F( 2, 3799) = 195.58
Prob > F = 0.0000
Diese Testergebnisse weisen auf stark unterschiedliche Löhne über die Zeit (im
Vergleich zu 1980) hin. Der signifikante Anstieg lässt sich durch eine fixed ef-
fects Schätzung ohne Einbeziehung der Interaktionsterme erkennen. Dabei
zeigen sich mit STATA folgende Schätzergebnisse:
---------------------------------------------------------------------------------------------------------
16
---------------------------------------------------------------------------------------------------------
Beispiel 2: Erklärung von Löhnen (V)
xtreg logwage married union d81 d82 d83 d84 d85 d86 d87, fe
Fixed-effects (within) regression Number of obs = 4360
Group variable: nr Number of groups = 545
R-sq: within = 0.1689 Obs per group: min = 8
between = 0.0789 avg = 8.0
overall = 0.1026 max = 8
F(9,3806) = 85.95
corr(u_i, Xb) = 0.0455 Prob > F = 0.0000
------------------------------------------------------------------------------
logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
married | .0583372 .0183688 3.18 0.002 .0223235 .0943509
union | .0833697 .0194393 4.29 0.000 .0452572 .1214821
d81 | .1135489 .0214936 5.28 0.000 .0714089 .1556889
d82 | .1676694 .0216434 7.75 0.000 .1252356 .2101031
d83 | .2109386 .0219471 9.61 0.000 .1679093 .2539678
d84 | .2784071 .0221814 12.55 0.000 .2349186 .3218956
d85 | .327462 .0223974 14.62 0.000 .2835498 .3713741
d86 | .3868075 .0226027 17.11 0.000 .3424929 .431122
d87 | .447037 .0228157 19.59 0.000 .4023047 .4917692
_cons | 1.361709 .0162395 83.85 0.000 1.32987 1.393548
-------------+----------------------------------------------------------------
sigma_u | .38216008
sigma_e | .35343397
rho | .53899211 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(544, 3806) = 9.14 Prob > F = 0.0000
---------------------------------------------------------------------------------------------------------
17
---------------------------------------------------------------------------------------------------------
Beispiel 2: Erklärung von Löhnen (VI)
Die alternative Einbeziehung einer linearen Zeittrendvariablen (year) ist auch
möglich. Es zeigen sich mit STATA folgende Schätzergebnisse:
xtreg logwage married union year, fe
Fixed-effects (within) regression Number of obs = 4360
Group variable: nr Number of groups = 545
R-sq: within = 0.1672 Obs per group: min = 8
between = 0.0791 avg = 8.0
overall = 0.1022 max = 8
F(3,3812) = 255.03
corr(u_i, Xb) = 0.0462 Prob > F = 0.0000
------------------------------------------------------------------------------
logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
married | .0610384 .0182929 3.34 0.001 .0251737 .0969032
union | .083791 .019414 4.32 0.000 .045728 .1218539
year | .0598672 .0025835 23.17 0.000 .054802 .0649325
_cons | -117.1447 5.121172 -22.87 0.000 -127.1852 -107.1042
-------------+----------------------------------------------------------------
sigma_u | .38200026
sigma_e | .35352815
rho | .53865182 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(544, 3812) = 10.08 Prob > F = 0.0000
---------------------------------------------------------------------------------------------------------
18
---------------------------------------------------------------------------------------------------------
Beispiel 2: Erklärung von Löhnen (VII)
Zum Vergleich zeigen sich in einem linearen first-differenced Modell unter Ein-
beziehung der Dummy-Variablen d82 bis d87 mit STATA folgende OLS-Schätz-
ergebnisse:
reg d.(logwage married union) d82 d83 d84 d85 d86 d87
Source | SS df MS Number of obs = 3815
-------------+------------------------------ F( 8, 3806) = 2.19
Model | 3.44529371 8 .430661714 Prob > F = 0.0252
Residual | 747.74863 3806 .196465746 R-squared = 0.0046
-------------+------------------------------ Adj R-squared = 0.0025
Total | 751.193923 3814 .19695698 Root MSE = .44324
------------------------------------------------------------------------------
D.logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
married |
D1. | .040342 .0229417 1.76 0.079 -.0046372 .0853212
union |
D1. | .041871 .0197059 2.12 0.034 .0032359 .0805062
d82 | -.059642 .0268623 -2.22 0.026 -.1123079 -.0069761
d83 | -.0708915 .0268532 -2.64 0.008 -.1235396 -.0182435
d84 | -.0466673 .0268754 -1.74 0.083 -.099359 .0060244
d85 | -.0666827 .0268937 -2.48 0.013 -.1194102 -.0139551
d86 | -.055882 .0268969 -2.08 0.038 -.1086158 -.0031482
d87 | -.0522669 .0269121 -1.94 0.052 -.1050303 .0004966
_cons | .1153218 .0191323 6.03 0.000 .0778112 .1528324
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
19
---------------------------------------------------------------------------------------------------------
Beispiel 2: Erklärung von Löhnen (VIII)
Mit der Einbeziehung einer linearen Zeittrendvariablen (year) anstatt d82 bis
d87 zeigen sich mit STATA folgende Schätzergebnisse:
reg d.(logwage married union) year
Source | SS df MS Number of obs = 3815
-------------+------------------------------ F( 3, 3811) = 3.43
Model | 2.02553487 3 .675178289 Prob > F = 0.0162
Residual | 749.168388 3811 .196580527 R-squared = 0.0027
-------------+------------------------------ Adj R-squared = 0.0019
Total | 751.193923 3814 .19695698 Root MSE = .44337
------------------------------------------------------------------------------
D.logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
married |
D1. | .040783 .0229342 1.78 0.075 -.0041815 .0857475
|
union |
D1. | .0429849 .019676 2.18 0.029 .0044085 .0815613
|
year | -.0051803 .003599 -1.44 0.150 -.0122364 .0018758
_cons | 10.34272 7.140508 1.45 0.148 -3.656861 24.34231
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
20
Dummy-Variablen Schätzung in linearen Panelmodellen mit unbeobachteter
Heterogenität:
• Bei einer traditionellen Sichtweise der fixed effects Schätzung wird der un-
beobachtete Effekt αi für Querschnittseinheit i, also z.B. für eine Person, ei-
nen Haushalt, ein Unternehmen oder eine Region zusammen mit den Re-
gressionsparametern geschätzt. Das heißt, für alle n-1 Querschnittseinhei-
ten (eine Einheit stellt die Basisgruppe dar) wird eine Konstante geschätzt.
• Hierzu werden neben der Betrachtung einer generellen Konstanten zusätz-
lich für n-1 Querschnittseinheiten Dummy-Variablen konstruiert, deren Para-
meter zusammen mit den anderen Regressionsparametern mit OLS ge-
schätzt werden. Ein solches Vorgehen wird als Dummy-Variablen Schätzung
bezeichnet, die bei einer Querschnittsanalyse nicht möglich ist, da bei n Be-
obachtungen nicht n+k Parameter geschätzt werden können.
• Somit müssen bei Dummy-Variablen Schätzungen mindestens zwei Perio-
den vorliegen, wenngleich auch bei einer moderaten Anzahl n die Anzahl
der erklärenden Variablen und damit der zu schätzenden Regressionspara-
meter oft zu hoch ist. Dies schränkt die Praktikabilität der Anwendung dieser
Schätzmethode ein.
• Ein wichtiges Kennzeichen von Dummy-Variablen Schätzungen ist, dass die
geschätzten Regressionsparameter sowie geschätzten Standardabweichun-
gen der Schätzwerte und Teststatistiken identisch sind mit den entsprechen-
den Ergebnissen bei der fixed effects Schätzung
21
• Ein Vorzug von Dummy-Variablen Schätzungen ist, dass die korrekte Anzahl
an Freiheitsgraden automatisch berechnet wird, wenngleich die korrekte An-
zahl bei fixed effects Schätzungen mittlerweile meist auch von Programmpa-
keten (z.B. STATA) ausgewiesen wird
• Bei Dummy-Variablen Schätzungen ergeben sich durch die hohe Anzahl
einbezogener Dummy-Variablen üblicherweise hohe Werte für R2
• Mit Hilfe von F-Tests kann überprüft werden, ob alle n-1 Dummy-Variablen
den Wert null annehmen. Sehr häufig wird diese Nullhypothese bei geringen
Signifikanzniveaus verworfen.
• In seltenen Fällen können die geschätzten Konstanten α i von Interesse sein,
z.B. zur Überprüfung, ob diese für ein spezifisches i vom durchschnittlichen
Wert für die anderen Querschnittseinheiten abweicht. Diese Schätzwerte
können aber auch sehr einfach auf Basis von fixed effects Schätzungen mit
entsprechenden Durchschnittswerten über die Zeit berechnet werden:
• Viele ökonometrische Programmpakete (wie z.B. STATA) weisen bei fixed
effects Schätzungen eine geschätzte „Konstante“ aus, die meist den Durch-
schnitt der α i über alle Querschnittseinheiten i darstellt
• In den meisten Fällen stehen aber die geschätzten Regressionsparameter
der erklärenden Variablen im Blickpunkt, so dass die unbeobachteten Effek-
te üblicherweise als vernachlässigbare Variablen angesehen werden, für die
bei within Schätzungen kontrolliert wird
i i 1 i1 k ikˆ ˆα̂ = y - β x - - β x
22
---------------------------------------------------------------------------------------------------------
Beispiel: Weiterbildungsprogramme und Ausschussraten (I)
Wie zuvor wird wieder mit Paneldaten für die Jahre 1987, 1988 und 1989 der
Effekt von Beihilfen im Rahmen eines Weiterbildungsprogramms in Michigan
auf den Logarithmus der Ausschussraten (logscrap) in 54 Unternehmen unter-
sucht. Als erklärende Variablen werden erneut die Beihilfe in einem Jahr t
(grant), die um ein Jahr verzögerte Beihilfe (grantlagged) sowie Dummy-Vari-
ablen für 1988 (d88) und für 1989 (d89) betrachtet. Allerdings wird jetzt keine
traditionelle fixed effects Schätzung betrachtet:
• Stattdessen sollen für die n Querschnittseinheiten (also hier 54 Unterneh-
men) n-1 (also hier 53) Dummy-Variablen einbezogen werden
• Dazu muss die Variable betrachtet werden, die die unterschiedlichen Quer-
schnittseinheiten (also hier Unternehmen) identifiziert
• Durch das Voranstellen von „i.“ wird STATA klargemacht, dass die zugrunde-
liegende stetige Variable als diskrete Variable mit der maximalen Anzahl an
Dummy-Variablen betrachtet werden soll
• In diesem Fall wird somit i.fcode als zusätzliche erklärende Variable in das
lineare Panelmodell mit unbeobachteter Heterogenität einbezogen
Bei der entsprechenden OLS-Schätzung zeigen sich mit STATA folgende Er-
gebnisse:
---------------------------------------------------------------------------------------------------------
23
---------------------------------------------------------------------------------------------------------
Beispiel: Weiterbildungsprogramme und Ausschussraten (II)
reg logscrap grant grantlagged d88 d89 i.fcode
Source | SS df MS Number of obs = 162
-------------+------------------------------ F( 57, 104) = 23.37
Model | 329.979148 57 5.78910785 Prob > F = 0.0000
Residual | 25.7659257 104 .247749286 R-squared = 0.9276
-------------+------------------------------ Adj R-squared = 0.8879
Total | 355.745073 161 2.20959673 Root MSE = .49774
------------------------------------------------------------------------------
logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grant | -.2523149 .150629 -1.68 0.097 -.5510178 .046388
grantlagged | -.4215895 .2102 -2.01 0.047 -.8384239 -.0047551
d88 | -.0802157 .1094751 -0.73 0.465 -.2973089 .1368776
d89 | -.2472028 .1332183 -1.86 0.066 -.5113797 .016974
|
fcode |
410538 | 3.905259 .4064064 9.61 0.000 3.09934 4.711178
410563 | 4.717327 .4064064 11.61 0.000 3.911408 5.523247
410565 | 4.443668 .4064064 10.93 0.000 3.637748 5.249587
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 419459 | 3.449106 .4064064 8.49 0.000 2.643187 4.255025
419482 | 3.926468 .4064064 9.66 0.000 3.120549 4.732387
419483 | 6.140227 .4064064 15.11 0.000 5.334307 6.946146
|
_cons | -2.825819 .2961843 -9.54 0.000 -3.413164 -2.238474
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
24
Die unbekannten Regressionsparameter in linearen Panelmodellen mit unbeo-
bachteter Heterogenität können (neben der Betrachtung einer konventionellen
gepoolten OLS-Schätzung) über within oder first-differenced Transformationen
geschätzt werden, so dass sich die Frage stellt, welcher Ansatz gewählt wer-
den sollte:
• Für den Fall von T = 2 stimmen fixed effects und first-differenced Schätzun-
gen sowie alle darauf bezogenen Teststatistiken in identisch spezifizierten
Modellen völlig überein, so dass es egal ist, welcher der beiden Ansätze ge-
wählt wird
• Entsprechend Abschnitt 1.2 wird bei der Gleichung erster Differenzen übli-
cherweise eine Konstante einbezogen, die den Parameter der Dummy-Vari-
able für die zweite Periode darstellt (die Konstante für die Gleichungen in
den beiden Jahren wird herausdifferenziert)
• Deshalb muss in diesem Fall bei der within Schätzung im Hinblick auf die
Identität der linearen Panelmodelle mit unbeobachteter Heterogenität eine
Dummy-Variable für die zweite Zeitperiode einbezogen werden.
• Für diesen Fall von T = 2 hat die first-differenced Schätzung den Vorteil,
dass diese sehr einfach mit ökonometrischen Programmpaketen selbst im-
plementiert werden kann
25
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Kriminalitätsraten (I)
Mit Paneldaten für n = 46 Städte in den USA für die beiden Jahre 1982 und
1987 wird der Effekt von Arbeitslosenraten (unem) und der Bevölkerungsdichte
(popden) auf die Anzahl der Straftaten auf 1000 Personen (crmrte) untersucht.
Bei der OLS-Schätzung in den ersten Differenzen zeigen sich mit STATA fol-
gende Ergebnisse:
reg d.(crmrte unem popden)
Source | SS df MS Number of obs = 46
-------------+------------------------------ F( 2, 43) = 4.21
Model | 3319.56638 2 1659.78319 Prob > F = 0.0213
Residual | 16936.4068 43 393.869925 R-squared = 0.1639
-------------+------------------------------ Adj R-squared = 0.1250
Total | 20255.9732 45 450.132737 Root MSE = 19.846
------------------------------------------------------------------------------
D.crmrte | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
unem |
D1. | 2.575551 .906563 2.84 0.007 .747293 4.40381
|
popden |
D1. | -.010234 .0074009 -1.38 0.174 -.0251593 .0046914
|
_cons | 17.23914 4.839995 3.56 0.001 7.478356 26.99992
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
26
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Kriminalitätsraten (II)
Bei der fixed effects Schätzung zeigen sich mit STATA folgende Ergebnisse:
xtreg crmrte unem popden d87, fe
Fixed-effects (within) regression Number of obs = 92
Group variable: area Number of groups = 46
R-sq: within = 0.2303 Obs per group: min = 2
between = 0.0004 avg = 2.0
overall = 0.0001 max = 2
F(3,43) = 4.29
corr(u_i, Xb) = -0.7492 Prob > F = 0.0098
------------------------------------------------------------------------------
crmrte | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
unem | 2.575551 .906563 2.84 0.007 .747293 4.40381
popden | -.010234 .0074009 -1.38 0.174 -.0251593 .0046914
d87 | 17.23914 4.839995 3.56 0.001 7.478356 26.99992
_cons | 122.6508 35.32421 3.47 0.001 51.41275 193.8889
-------------+----------------------------------------------------------------
sigma_u | 42.872147
sigma_e | 14.033352
rho | .90322397 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(45, 43) = 8.18 Prob > F = 0.0000
---------------------------------------------------------------------------------------------------------
27
Für T ≥ 3 sind die fixed effects und first-differenced Schätzungen in linearen
Panelmodellen mit unbeobachteter Heterogenität nicht mehr identisch:
• Da beide Schätzer mit den Annahmen D1 bis D4 sowohl erwartungstreu als
auch konsistent (für festes T mit n → ∞) sind, ergibt sich hieraus kein Krite-
rium für die Vorteilhaftigkeit eines der beiden Schätzer
• Für große n und kleine T ergeben sich bei beiden Schätzern jedoch Effi-
zienzunterschiede, die durch Autokorrelationen in den idiosynkratischen
Fehlern vit bestimmt werden (unter der Annahme der Homoskedastizität in
vit, da nur in diesem Fall Effizienzunterschiede analysiert werden können)
• Falls die vit nicht autokorreliert sind (falls unbeobachtete Heterogenität vor-
liegt, ist der gesamte Störterm αi + vit definitionsgemäß immer autokorre-
liert), ist der fixed effects Schätzer effizienter als der first-differenced Schät-
zer. Da nun bei linearen Panelmodellen mit unbeobachteter Heterogenität
oft unterstellt wird, dass die idiosynkratischen Fehler nicht autokorreliert
sind, werden bei empirischen Studien fixed effects Schätzungen grundsätz-
lich häufiger angewendet.
• Häufig liegt allerdings eine entsprechende Autokorrelation vor. Falls die vit
einem random walk folgen (und damit eine sehr starke positive Autokorrela-
tion vorliegt), sind die ersten Differenzen ∆vit nicht autokorreliert, so dass
dann first-differenced Schätzungen vorteilhafter sind.
• Allerdings liegen in vielen Fällen schwache positive Autokorrelationen in vit
vor, wodurch die Effizienz der beiden Schätzer nicht einfach abzuleiten ist
28
• Generell ist nach einer fixed effects Schätzung die Überprüfung der Hypo-
these, dass keine Autokorrelation in vit vorliegt, (genauso wie die Überprü-
fung von Homoskedastizität) nicht einfach, da lediglich Schätzungen für v it nicht aber für vit abgeleitet werden können. Dagegen kann diese Hypothese
in Bezug auf ∆vit nach einer first-differenced Schätzung mit einem t-Test
einfach untersucht werden.
• Für den Fall, dass es dabei keinen Hinweis auf eine entsprechende Auto-
korrelation in ∆vit gibt, ist es oft sinnvoll, first-differenced Schätzungen
durchzuführen. Wenn dagegen eine negative Autokorrelation in ∆vit nachge-
wiesen wird, bietet sich eher eine fixed effects Schätzung an.
• Falls alle erklärenden Variablen xith zwar mit den vit unkorreliert sind, gegen
die Annahme der strikten Exogenität aber verstoßen wird (z.B. bei verzöger-
ten abhängigen Variablen), weisen fixed effects Schätzungen für große T
meistens geringere Verzerrungen auf. Andererseits ist der first-differenced
Schätzer bereits bei schwacher Exogenität der erklärenden Variablen mit
E(vit| xi1,…, xit, αi) = 0 konsistent.
• Insgesamt ist die Wahl zwischen beiden Schätzungen nicht einfach, so dass
grundsätzlich, vor allem aber bei stark unterschiedlichen Ergebnissen, beide
ausgewiesen werden sollten. Bei sehr ähnlichen Schätzergebnissen ist da-
gegen deren Robustheit umso größer.
29
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen
Wie zuvor werden wieder mit Paneldaten für 545 dauerhaft berufstätige Män-
ner für die Jahre von 1980 bis 1987 die Determinanten des Logarithmus von
Löhnen (logwage) untersucht. Als erklärende Variablen werden erneut lediglich
der Familienstand (married) und die Gewerkschaftszugehörigkeit (union) be-
trachtet. Auf Basis der zuvor betrachteten OLS-Schätzung im linearen first-dif-
ferenced Modell zeigen sich beim t-Test auf AR(1) Autokorrelation in Bezug auf
∆vit folgende Ergebnisse (alternativ können auch Konstante und erklärende Va-
riablen in den t-Test einbezogen werden mit ähnlichen Ergebnissen):
reg d.(logwage married union) d82 d83 d84 d85 d86 d87
predict u, resid
reg u l.u, noconstant
Source | SS df MS Number of obs = 3270
-------------+------------------------------ F( 1, 3269) = 724.84
Model | 103.819255 1 103.819255 Prob > F = 0.0000
Residual | 468.220496 3269 .143230497 R-squared = 0.1815
-------------+------------------------------ Adj R-squared = 0.1812
Total | 572.039751 3270 .174935704 Root MSE = .37846
------------------------------------------------------------------------------
u | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
u |
L1. | -.3948887 .0146674 -26.92 0.000 -.423647 -.3661305
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
30
Cluster-robuste Konfidenzintervalle und t- und F-Tests:
• Fixed effects und first-differenced Schätzungen in linearen Panelmodellen
mit unbeobachteter Heterogenität sind (unter den Annahmen D1 bis D4 so-
wie C1 bis C4) auch bei Heteroskedastizität und Autokorrelation in den idio-
synkratischen Fehlern vit erwartungstreu und konsistent
• Allerdings erfordert die korrekte Konstruktion von Konfidenzintervallen sowie
t- und F-Werten, dass Homoskedastizität und keine Autokorrelation vorliegt
• Für den Fall, dass n deutlich größer als T ist, können die geschätzten Stan-
dardabweichungen der geschätzten Parameter über ein clustering für jegli-
che Formen von Heteroskedastizität und Autokorrelation korrigiert werden
• Die Idee dabei ist, dass jede Querschnittseinheit i als ein Cluster von Beob-
achtungen über die Zeit definiert ist und für jedes Cluster beliebige Varian-
zen und Autokorrelationen in den Störtermen über die Zeit erlaubt sind
• Die cluster-robuste Schätzung der Standardabweichungen der geschätzten
Parameter für die Ableitung von cluster-robusten Konfidenzintervallen und t-
und F-Tests bezieht sich aufgrund der unterschiedlichen Ansätze bei fixed
effects und first-differenced Schätzungen auf unterschiedliche Gleichungen
• Die cluster-robuste Schätzung mit STATA erfolgt durch die zusätzliche An-
weisung „cluster(id)“, wobei „id“ sich auf die Variable bezieht, die die Quer-
schnittseinheiten identifiziert (bei fixed und auch random effects Schätzern,
siehe später, nicht aber bei first-differenced Schätzern ergeben sich durch
die Anweisungen „robust“ oder „vce(robust)“ dieselben Resultate)
31
---------------------------------------------------------------------------------------------------------
Beispiel: Weiterbildungsprogramme und Ausschussraten (I)
Wie zuvor wird wieder mit Paneldaten für die Jahre 1987, 1988 und 1989 der
Effekt von Beihilfen im Rahmen eines Weiterbildungsprogramms in Michigan
auf den Logarithmus der Ausschussraten (logscrap) in 54 Unternehmen unter-
sucht. Als erklärende Variablen werden erneut die Beihilfe in einem Jahr t
(grant) und die um ein Jahr verzögerte Beihilfe (grantlagged) betrachtet. Es
zeigen sich in einem linearen first-differenced Modell unter Einbeziehung der
Dummy-Variablen für 1989 mit STATA folgende OLS-Schätzergebnisse:
reg d.(logscrap grant grantlagged) d89, cluster(fcode)
Linear regression Number of obs = 108
F( 3, 53) = 1.98
Prob > F = 0.1284
R-squared = 0.0365
Root MSE = .57672
(Std. Err. adjusted for 54 clusters in fcode)
------------------------------------------------------------------------------
| Robust
D.logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grant |
D1. | -.2227811 .1316461 -1.69 0.096 -.4868298 .0412676
grantlagged |
D1. | -.3512459 .2709732 -1.30 0.201 -.8947493 .1922575
d89 | -.0962082 .1136492 -0.85 0.401 -.3241597 .1317433
_cons | -.0906072 .0901821 -1.00 0.320 -.2714895 .0902751
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
32
---------------------------------------------------------------------------------------------------------
Beispiel: Weiterbildungsprogramme und Ausschussraten (II)
Bei der entsprechenden fixed effects Schätzung zeigen sich unter Einbezie-
hung der Dummy-Variablen für 1988 und 1989 mit STATA folgende Ergebnisse:
xtreg logscrap grant grantlagged d88 d89, fe cluster(fcode)
Fixed-effects (within) regression Number of obs = 162
Group variable: fcode Number of groups = 54
R-sq: within = 0.2010 Obs per group: min = 3
between = 0.0079 avg = 3.0
overall = 0.0068 max = 3
F(4,53) = 7.07
corr(u_i, Xb) = -0.0714 Prob > F = 0.0001
(Std. Err. adjusted for 54 clusters in fcode)
------------------------------------------------------------------------------
| Robust
logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grant | -.2523149 .1434399 -1.76 0.084 -.5400188 .035389
grantlagged | -.4215895 .2824604 -1.49 0.141 -.9881333 .1449543
d88 | -.0802157 .0978408 -0.82 0.416 -.2764594 .1160281
d89 | -.2472028 .1967819 -1.26 0.215 -.6418974 .1474917
_cons | .597434 .0638746 9.35 0.000 .4693177 .7255503
-------------+----------------------------------------------------------------
sigma_u | 1.438982
sigma_e | .4977442
rho | .89313867 (fraction of variance due to u_i)
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
33
Fixed effects Schätzung mit unbalanced panels:
• Zumindest implizit wurden bisher balanced panels betrachtet, bei denen für
jede Untersuchungseinheit i Daten für alle T Zeitperioden vorliegen. Aller-
dings fehlen bei vielen empirischen Anwendungen für einige i Daten für ein-
zelne Perioden, so dass ein unbalanced panel gegeben ist.
• Auch mit unbalanced panels können grundsätzlich fixed effects Schätzun-
gen durchgeführt werden. Wenn Ti die Anzahl der Perioden darstellt, für die
bei einer Querschnittseinheit i Daten vorliegen, beträgt hier die Anzahl der
Beobachtungen N = T1 + T2 +⋯+ Tn. Durch die within Transformation blei-
ben diejenigen Querschnittseinheiten unberücksichtigt, bei denen nur für ei-
ne Periode Daten vorliegen. Zudem geht hier erneut bei jedem i ein Frei-
heitsgrad verloren.
• Allerdings kann der Verlust von Beobachtungen in einzelnen Perioden prob-
lematisch sein. Lediglich wenn der Grund für die fehlenden Daten („attrition“)
nicht mit den idiosynkratischen Fehlern vit korreliert ist, ergeben sich bei der
fixed effects Schätzung keinerlei Probleme. Wenn allerdings dieser Grund
mit den vit korreliert ist, ergeben sich durch die entstehenden Selektionspro-
bleme („sample selection problems“) verzerrte fixed effects Schätzer.
• Demgegenüber erlauben fixed effects Schätzungen, dass attrition mit den
unbeobachteten Effekten αi korreliert ist. Attrition Probleme sind eine wich-
tige Fragestellung in der Paneldatenanalyse.
34
---------------------------------------------------------------------------------------------------------
Beispiel: Weiterbildungsprogramme und Ausschussraten (I)
Wie zuvor wird wieder mit Paneldaten für die Jahre 1987, 1988 und 1989 der
Effekt von Beihilfen im Rahmen eines Weiterbildungsprogramms in Michigan
auf den Logarithmus der Ausschussraten (logscrap) in 54 Unternehmen unter-
sucht. Als erklärende Variablen werden erneut die Beihilfe in einem Jahr t
(grant), die um ein Jahr verzögerte Beihilfe (grantlagged) sowie Dummy-Vari-
ablen für 1988 (d88) und für 1989 (d89) betrachtet. Allerdings werden jetzt zwei
zusätzliche erklärende Variablen einbezogen:
• Logarithmus der Umsätze (logsales)
• Logarithmus der Anzahl der Beschäftigten (logemploy)
Dadurch fallen jetzt aber drei der 54 Unternehmen aufgrund fehlender Daten
zu Umsätzen oder der Anzahl an Beschäftigten völlig heraus. Zudem gehen
fünf weitere Beobachtungen wegen fehlender Daten für einzelne Jahre verlo-
ren. Damit reduziert sich die Gesamtzahl der Beobachtungen auf N = 148. Die
Ergebnisse für den Effekt der kontemporären und der um ein Jahr verzögerten
Weiterbildungsbeihilfe bleiben aber auf Basis der fixed effects Schätzung mit
diesem unbalanced panel qualitativ sehr ähnlich. Es zeigen sich mit STATA fol-
gende Schätzergebnisse:
---------------------------------------------------------------------------------------------------------
35
---------------------------------------------------------------------------------------------------------
Beispiel: Weiterbildungsprogramme und Ausschussraten (II)
xtreg logscrap grant grantlagged logsales logemploy d88 d89, fe
Fixed-effects (within) regression Number of obs = 148
Group variable: fcode Number of groups = 51
R-sq: within = 0.2131 Obs per group: min = 1
between = 0.0341 avg = 2.9
overall = 0.0004 max = 3
F(6,91) = 4.11
corr(u_i, Xb) = -0.2258 Prob > F = 0.0011
------------------------------------------------------------------------------
logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grant | -.2967544 .157086 -1.89 0.062 -.6087866 .0152777
grantlagged | -.5355783 .224206 -2.39 0.019 -.9809359 -.0902207
logsales | -.0868607 .2596993 -0.33 0.739 -.6027214 .4290001
logemploy | -.0763642 .3502912 -0.22 0.828 -.7721747 .6194462
d88 | -.0039605 .1195487 -0.03 0.974 -.2414293 .2335083
d89 | -.1321925 .1536863 -0.86 0.392 -.4374715 .1730865
_cons | 2.115513 3.108438 0.68 0.498 -4.059017 8.290043
-------------+----------------------------------------------------------------
sigma_u | 1.4415147
sigma_e | .49149052
rho | .89585684 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(50, 91) = 20.75 Prob > F = 0.0000
---------------------------------------------------------------------------------------------------------
36
---------------------------------------------------------------------------------------------------------
Beispiel: Weiterbildungsprogramme und Ausschussraten (III)
Zum Vergleich zeigen sich im entsprechenden linearen first-differenced Modell
mit STATA folgende OLS-Schätzergebnisse:
reg d.(logscrap grant grantlagged logsales logemploy) d89
Source | SS df MS Number of obs = 97
-------------+------------------------------ F( 5, 91) = 0.87
Model | 1.57948125 5 .31589625 Prob > F = 0.5055
Residual | 33.0962726 91 .363695303 R-squared = 0.0456
-------------+------------------------------ Adj R-squared = -0.0069
Total | 34.6757538 96 .361205769 Root MSE = .60307
------------------------------------------------------------------------------
D.logscrap | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
grant |
D1. | -.2045045 .144308 -1.42 0.160 -.4911548 .0821457
|
grantlagged |
D1. | -.3841248 .2614544 -1.47 0.145 -.9034719 .1352222
|
logsales |
D1. | -.1774384 .2713138 -0.65 0.515 -.71637 .3614932
|
logemploy |
D1. | -.0230417 .3773629 -0.06 0.951 -.7726268 .7265434
|
d89 | -.0946461 .1381578 -0.69 0.495 -.3690796 .1797874
_cons | -.0653994 .1062023 -0.62 0.540 -.2763573 .1455585
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
37
2.2 Random effects Schätzung
Ausgangspunkt ist erneut ein lineares Panelmodell mit unbeobachteter Hetero-
genität, bei dem jetzt explizit eine Konstante einbezogen wird, wodurch (ohne
Beschränkung der Allgemeinheit) die Annahme getroffen werden kann, dass αi
im Durchschnitt null ist:
Dabei werden üblicherweise wiederum Dummy-Variablen für Zeitperioden ein-
bezogen. Falls αi mit einer oder mehreren erklärenden Variablen korreliert ist,
besteht das wesentliche Ziel zunächst darin, diesen unbeobachteten Effekt
durch within Transformationen oder die Bildung erster Differenzen zu beseiti-
gen. Allerdings stellt sich die Frage, ob diese Transformationen auch sinnvoll
sind, wenn αi mit allen erklärenden Variablen unkorreliert ist:
In diesem Fall könnten die Regressionsparameter grundsätzlich in einer Quer-
schnittsanalyse für eine Zeitperiode (also ohne eine Paneldatenanalyse) oder
in einem gepoolten linearen Regressionsmodell mit OLS konsistent geschätzt
werden. Bei einer Querschnittsanalyse würden allerdings nützliche Informatio-
nen aus den anderen Zeitperioden unberücksichtigt bleiben. Bei einem gepool-
ten linearen Regressionsmodell würde zudem eine wichtige Modelleigenschaft
ignoriert werden. Mit εit = αi + vit ergibt sich:
it 0 1 it1 2 it2 k itk i ity = β + β x + β x + + β x + α + v für i = 1,..., n; t = 1,..., T
ith iCov(x , α ) = 0 für t = 1,2,..., T; h = 1, 2,..., k
38
Da die αi in εit in jeder Zeitperiode enthalten sind, ergibt sich notwendigerweise,
dass die εit eine positive Autokorrelation aufweisen. Mit den Annahmen, dass
die αi und die vit unkorreliert sind sowie in den vit keine Autokorrelation vorliegt,
ergibt sich mit σα2 = Var(αi) = Cov(εit, εis) = Cov(αi+vit, αi+vis) (für t ≠ s) sowie
σv2 = Var(vit):
Auf Grund dieser Autokorrelation sind die konventionellen Schätzer der Stan-
dardabweichungen (bei Vernachlässigung der Autokorrelation) der mit OLS ge-
schätzten Steigungsparameter verzerrt, so dass auch die Konfidenzintervalle
nicht mehr korrekt sowie die t- und F-Statistiken nicht einmal asymptotisch t-
und F-verteilt sind. Allerdings kann hier eine Schätzung mit der Verallgemeiner-
ten Methode der kleinsten Quadrate (GLS) durchgeführt werden, bei der zu-
nächst folgende Transformation betrachtet wird:
it 0 1 it1 2 it2 k itk ity = β + β x + β x + + β x + ε für i = 1,..., n; t = 1,..., T
2
it is αit is
it is i it i is
2 2
α α
2 22 2 2 2α vα v α v
Cov(ε , ε ) σCorr(ε , ε ) = =
Var(ε )Var(ε ) Var(α +v )Var(α +v )
σ σ = = für t s
σ +σ(σ +σ )(σ +σ )
it i 0 1 it1 i1 k itk ik it iy - λy = β (1 - λ) + β (x - λx ) + + β (x - λx ) + ε - λε
39
Dabei bedeuten die Überstriche für jede Querschnittseinheit i erneut das arith-
metische Mittel über die Zeit und für 0 ≤ λ ≤ 1 gilt:
Es kann gezeigt werden, dass die Störterme (εit-λ𝜀 i) in diesem Ansatz keine Au-
tokorrelation aufweisen. Im Gegensatz zur within Transformation wird hier le-
diglich ein Teil der arithmetischen Mittel über die Zeit subtrahiert, der von den
beiden Varianzen σα2 und σv
2 sowie von der Anzahl der Perioden abhängt. Die-
se Transformation erlaubt deshalb im Gegensatz zur within Transformation
oder der Bildung erster Differenzen auch die Einbeziehung von erklärenden
Variablen, die über die Zeit konstant sind (z.B. Geschlecht).
Ein GLS-Schätzer ergibt sich nun durch eine gepoolte OLS-Schätzung in obi-
ger Gleichung. Dazu würde man den Wert des Parameters λ benötigen, der al-
lerdings in der Praxis nicht bekannt ist. Er kann jedoch immer mit Hilfe konsis-
tenter Schätzer von σα2 und σv
2 geschätzt werden. Diese geschätzten Varian-
zen können mit Hilfe von Residuen bei OLS-Schätzungen in gepoolten linearen
Regressionsmodellen oder bei fixed effects Schätzungen abgeleitet werden.
Mit den Residuen ε it der gepoolten OLS-Schätzung ergibt sich eine Möglichkeit
der Schätzung von σα2:
2
v
2 2
v α
σλ = 1 -
σ +Tσ
40
Da σε2 = σα
2 + σv2 kann auf dieser Basis die Varianz σv
2 mit dem Schätzer σ ε2
der Varianz des Fehlerterms εit bei der gepoolten OLS-Schätzung mit Hilfe von
σ v2 = σ ε
2 - σ α2 geschätzt werden. Damit kann dann λ folgendermaßen ge-
schätzt werden:
Eine durchführbare („feasible“) GLS-Schätzung, bei der λ anstatt λ einbezogen
ist, wird als random effects Schätzung bezeichnet.
Der random effects Schätzer ist nicht erwartungstreu. Im Hinblick auf die Kon-
sistenz und asymptotische Normalverteilung von Funktionen des Schätzers lie-
gen idealerweise die zuvor diskutierten Annahmen D1 bis D4 beim within
Schätzer vor. Da die random effects Transformation die Einbeziehung von er-
klärenden Variablen erlaubt, die über die Zeit konstant sind, kann Annahme D3
durch die schwächere Annahme E3 ersetzt werden.
n T-1 T2
α it is
i=1 t=1 s=t+1
1ˆ ˆσ̂ = ε ε
nT(T-1) - (k+1)
2
2
v
22 2
αv α2
v
σ̂ 1λ̂ = 1 - = 1 -
ˆˆ ˆ σσ +Tσ1+T
σ̂
41
Gleichzeitig muss aber zusätzlich zu D4 die Annahme getroffen werden, dass
der unbeobachtete Effekt αi und die erklärenden Variablen unkorreliert sind. Es
ergibt sich:
• Annahme E3: Keine perfekte Kollinearität
• Annahme E4: Bedingter Erwartungswert von αi ist konstant
Zusätzlich zu D4 gilt, dass der bedingte Erwartungswert von αi, gegeben die
erklärenden Variablen, konstant ist und bei der Einbeziehung einer Konstan-
te deren Wert aufweist, d.h. E(αi|xi) = β0. Diese Annahme ist der Hauptunter-
schied zwischen fixed effects und random effects Schätzungen.
Mit den Annahmen D1, D2, E3 und E4 sind die random effects Schätzer der
Regressionsparameter für festes T mit n → ∞ konsistent und Funktionen des
Schätzers asymptotisch normalverteilt.
Für die Ableitung weiterer Eigenschaften der random effects Schätzer sowie
von Konfidenzintervallen und t- und F-Statistiken muss neben Annahme D6
zum Fehlen von Autokorrelation in vit bei fixed effects Schätzern zusätzlich fol-
gende Annahme gelten:
• Annahme E5: Homoskedastizität
Zusätzlich zu Annahme D5 gilt, dass die bedingte Varianz von αi, gegeben
alle erklärenden Variablen, konstant ist, d.h. Var(αi|xi) = σα2
42
Mit den Annahmen D1, D2, E3, E4, E5 und D6 sind die üblich geschätzten
Standardabweichungen der random effects Schätzungen korrekt und damit die
t- und F-Statistiken asymptotisch t- und F-verteilt. Vor allem aber sind die ran-
dom effects Schätzer asymptotisch effizient.
Folgerungen:
• Random effects Schätzer weisen damit in diesem Fall bei großen n geringe-
re Varianzen auf als übliche gepoolte OLS-Schätzer (wenn bei den gepool-
ten OLS-Schätzern korrekterweise cluster-robuste Standardabweichungen
der geschätzten Parameter geschätzt werden)
• Bei zeitvarianten erklärenden Variablen sind in diesem Fall die random ef-
fects Schätzer insbesondere effizienter als fixed effects Schätzer (zeitinvari-
ante erklärende Variablen können ja ohnehin nicht in fixed effects Schätzun-
gen einbezogen werden)
• Allerdings ist nicht die Effizienzeigenschaft, sondern die Robustheit bei Kor-
relationen zwischen dem unbeobachteten Effekt αi und den erklärenden Va-
riablen bei fixed effects Schätzungen die eigentliche Stoßrichtung
• Insofern muss bei der Wahl zwischen fixed und random effects Schätzungen
(siehe später) häufig eine Abwägung zwischen Robustheit und Effizienz vor-
genommen werden
43
Zusammenhang zwischen verschiedenen Schätzungen in linearen Panelmo-
dellen mit unbeobachteter Heterogenität:
• Falls λ = 0, ergibt sich eine gepoolte OLS-Schätzung und falls λ = 1, ergibt
sich eine fixed effects Schätzung. Allerdings zeigt sich für den Schätzwert λ niemals der Wert null oder der Wert eins.
• Falls λ klein ist, liegt der random effects Schätzer nahe beim gepoolten
OLS-Schätzer. In diesem Fall ist der unbeobachtete Effekt αi (aufgrund der
relativ geringen Varianz σα2 im Vergleich zu σv
2) relativ unbedeutend.
• Dagegen nimmt λ mit hohem T sowie falls σα2 im Vergleich zu σv
2 groß ist,
hohe Werte an. In diesem Fall nähern sich die random effects und fixed ef-
fects Schätzer an.
• Falls αi mit einer erklärenden Variablen korreliert ist, ergibt sich ein inkonsis-
tenter random effects Schätzer. Die entsprechende asymptotische Verzer-
rung wird durch den Faktor 1 - λ bestimmt, so dass diese für große λ, d.h.
für λ → 1, immer kleiner wird.
• In empirischen Anwendungen ist es häufig sinnvoll, auch die üblichen ge-
poolten OLS-Schätzungen auszuweisen. Dabei ist zu beachten, dass die
Teststatistiken selbst für den Fall der Unkorreliertheit der αi mit den erklären-
den Variablen wegen der Autokorrelation in den Fehlertermen nicht gültig
sind. Allerdings können natürlich cluster-robuste Schätzungen der Standard-
abweichungen der geschätzten Parameter betrachtet werden.
44
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (I)
Für die Analyse der Determinanten des Logarithmus von Löhnen (logwage)
werden erneut die Paneldaten für 545 dauerhaft berufstätige Männer für die
Jahre von 1980 bis 1987 betrachtet. Dabei werden jetzt neben den fixed effects
Schätzungen zusätzlich auch gepoolte OLS-Schätzungen sowie random ef-
fects Schätzungen untersucht. In den beiden letzteren Ansätzen (nicht aber im
fixed effects Ansatz) können nun die zeitinvarianten Variablen für Bildungs-
stand (educ) und schwarze Hautfarbe (black) einbezogen werden. Als zeitvari-
ante erklärende Variablen werden Erfahrung (exper), quadrierte Erfahrung
(expersq), Familienstand (married) und Gewerkschaftszugehörigkeit (union)
betrachtet. Zusätzlich wird die maximale Anzahl von Dummy-Variablen für die
Jahre 1981 bis 1987 einbezogen. Dadurch kann der Effekt von exper in der
fixed effects Schätzung nicht identifiziert werden, da sich der Wert dieser Vari-
able bei allen untersuchten Personen jeweils um ein Jahr über die Zeit erhöht.
Dagegen kann die quadrierte Erfahrung auch im fixed effects Ansatz einbezo-
gen werden. Dabei haben sich mit STATA bei den drei (cluster-robusten)
Schätzungen folgende Ergebnisse gezeigt (cluster-robuste Schätzungen der
Standardabweichungen der geschätzten Parameter sind somit auch bei der
random effects Schätzung möglich):
---------------------------------------------------------------------------------------------------------
45
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (II)
reg logwage educ black exper expersq married union d81 d82 d83 d84 d85 d86 d87,
cluster(nr)
Linear regression Number of obs = 4360
F( 13, 544) = 49.98
Prob > F = 0.0000
R-squared = 0.1892
Root MSE = .48031
(Std. Err. adjusted for 545 clusters in nr)
------------------------------------------------------------------------------
| Robust
logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0907146 .0108457 8.36 0.000 .0694101 .1120191
black | -.1423222 .0497384 -2.86 0.004 -.240025 -.0446194
exper | .0669274 .0195469 3.42 0.001 .0285307 .105324
expersq | -.0023875 .0010244 -2.33 0.020 -.0043998 -.0003752
married | .108094 .0260188 4.15 0.000 .0569845 .1592036
union | .1831315 .0275341 6.65 0.000 .1290453 .2372177
d81 | .0584744 .0281803 2.08 0.038 .0031189 .1138299
d82 | .0630235 .0369094 1.71 0.088 -.0094789 .1355259
d83 | .0623225 .0461705 1.35 0.178 -.0283717 .1530167
d84 | .0907742 .0578867 1.57 0.117 -.0229345 .204483
d85 | .1095213 .0667783 1.64 0.102 -.0216535 .2406962
d86 | .1421435 .076196 1.87 0.063 -.0075309 .2918178
d87 | .1738353 .0851938 2.04 0.042 .0064861 .3411844
_cons | .1028863 .1562062 0.66 0.510 -.203955 .4097276
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
46
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (III)
xtreg logwage educ black exper expersq married union d81 d82 d83 d84 d85 d86 d87, re
cluster(nr)
Random-effects GLS regression Number of obs = 4360
Group variable: nr Number of groups = 545
R-sq: within = 0.1799 Obs per group: min = 8
between = 0.1857 avg = 8.0
overall = 0.1828 max = 8
Wald chi2(13) = 606.11
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
(Std. Err. adjusted for 545 clusters in nr)
------------------------------------------------------------------------------
| Robust
logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0909923 .0109139 8.34 0.000 .0696015 .1123831
black | -.1434596 .0501434 -2.86 0.004 -.2417389 -.0451802
exper | .1057427 .0163721 6.46 0.000 .073654 .1378315
expersq | -.0047179 .0007915 -5.96 0.000 -.0062692 -.0031666
married | .0639586 .0189583 3.37 0.001 .0268009 .1011162
union | .106401 .0208371 5.11 0.000 .065561 .147241
d81 | .0404346 .0275602 1.47 0.142 -.0135825 .0944517
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .1344691 .0849487 1.58 0.113 -.0320272 .3009654
_cons | .0377516 .1557827 0.24 0.809 -.2675769 .3430801
-------------+----------------------------------------------------------------
sigma_u | .32426153
sigma_e | .35099001
rho | .46047891 (fraction of variance due to u_i)
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
47
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (IV)
xtreg logwage expersq married union d81 d82 d83 d84 d85 d86 d87, fe cluster(nr)
Fixed-effects (within) regression Number of obs = 4360
Group variable: nr Number of groups = 545
R-sq: within = 0.1806 Obs per group: min = 8
between = 0.0286 avg = 8.0
overall = 0.0888 max = 8
F(10,544) = 46.59
corr(u_i, Xb) = -0.1222 Prob > F = 0.0000
(Std. Err. adjusted for 545 clusters in nr)
------------------------------------------------------------------------------
| Robust
logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
expersq | -.0051855 .0008102 -6.40 0.000 -.0067771 -.0035939
married | .0466804 .0210038 2.22 0.027 .0054218 .0879389
union | .0800019 .0227431 3.52 0.000 .0353268 .1246769
d81 | .1511912 .0255648 5.91 0.000 .1009733 .2014091
d82 | .2529709 .0286624 8.83 0.000 .1966684 .3092734
d83 | .3544437 .0348608 10.17 0.000 .2859655 .422922
d84 | .4901148 .0454581 10.78 0.000 .4008199 .5794097
d85 | .6174822 .0568088 10.87 0.000 .5058908 .7290737
d86 | .7654965 .071244 10.74 0.000 .6255495 .9054436
d87 | .9250249 .0840563 11.00 0.000 .7599103 1.09014
_cons | 1.426019 .0209824 67.96 0.000 1.384802 1.467235
-------------+----------------------------------------------------------------
sigma_u | .39176195
sigma_e | .35099001
rho | .55472816 (fraction of variance due to u_i)
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
48
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (V)
Interpretation:
• Die Parameterschätzwerte für educ und black sind bei den gepoolten OLS-
und random effects Schätzungen sehr ähnlich
• Der signifikant positive Effekt von married und union ist bei der gepoolten
OLS-Schätzung am stärksten und bei der fixed effects Schätzung (also bei
der Beseitigung der unbeobachteten Effekte αi) am schwächsten. Dieser
Rückgang könnte dadurch erklärt werden, dass Männer mit höheren Fähig-
keiten (ausgedrückt durch höhere αi) häufiger verheiratet sind, wodurch sich
bei der gepoolten OLS-Schätzung eine Überschätzung ergibt.
• Bei der fixed effects Schätzung verbleibt eine geschätzte Prämie für Verhei-
ratete von 4,7%. Mögliche Erklärungen hierfür sind, dass verheiratete Män-
ner produktiver sind mit entsprechend höheren Löhnen oder dass Arbeitge-
ber verheirateten Männern mehr zahlen, da die Ehe von ihnen als ein Signal
für Stabilität angesehen wird.
• Der Schätzer λ für λ beträgt :
1 - [0,3512/(0,3512 +8∙0,3242)]1/2 = 1 - [1/(1+8(0,3242/0,3512))]1/2 = 0,642.
Dieser hohe Wert führt offensichtlich dazu, dass die random effects Schätzer
näher an den fixed effects Schätzern als an den gepoolten OLS-Schätzern
liegen. Dieser Wert kann mit STATA auch direkt geschätzt werden:
---------------------------------------------------------------------------------------------------------
49
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (VI)
xtreg logwage educ black exper expersq married union d81 d82 d83 d84 d85 d86 d87, re
theta
Random-effects GLS regression Number of obs = 4360
Group variable: nr Number of groups = 545
R-sq: within = 0.1799 Obs per group: min = 8
between = 0.1857 avg = 8.0
overall = 0.1828 max = 8
Wald chi2(13) = 957.68
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
theta = .64258271
------------------------------------------------------------------------------
logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0909923 .0105088 8.66 0.000 .0703955 .1115891
black | -.1434596 .0470052 -3.05 0.002 -.235588 -.0513311
exper | .1057427 .0153596 6.88 0.000 .0756384 .135847
expersq | -.0047179 .0006894 -6.84 0.000 -.0060691 -.0033667
married | .0639586 .0167719 3.81 0.000 .0310862 .0968309
union | .106401 .0178465 5.96 0.000 .0714225 .1413795
d81 | .0404346 .0246907 1.64 0.101 -.0079583 .0888275
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .1344691 .0812426 1.66 0.098 -.0247634 .2937017
_cons | .0377516 .147968 0.26 0.799 -.2522605 .3277636
-------------+----------------------------------------------------------------
sigma_u | .32426153
sigma_e | .35099001
rho | .46047891 (fraction of variance due to u_i)
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
50
Fixed effects versus random effects Schätzungen in linearen Panelmodellen
mit unbeobachteter Heterogenität:
• Der wesentliche Vorteil von fixed effects Schätzungen ist, dass diese belie-
bige Korrelationen zwischen dem unbeobachteten Effekt αi und den erklä-
renden Variablen erlaubt
• Ein Vorteil von random effects Schätzungen (ebenso wie von ineffizienteren
gepoolten OLS-Schätzungen) ist die mögliche Einbeziehung von zeitinvari-
anten erklärenden Variablen. Falls man dagegen lediglich am Effekt zeitvari-
anter erklärender Variablen interessiert ist, ist oft die Betrachtung von fixed
effects Schätzungen vorteilhafter.
• Zur Auswahl zwischen fixed effects und random effects Schätzungen wird
häufig der Spezifikationstest nach Hausman betrachtet (siehe später)
• Zu beachten ist, dass aufgrund des mikroökonometrischen Fokus mit einer
Zufallsstichprobe aus einer großen Grundgesamtheit αi generell als Zufalls-
variable betrachtet wird. Dagegen werden die αi bei anderen (älteren) Stu-
dien lediglich bei random effects Schätzungen als Zufallsvariablen, bei fixed
effects Schätzungen jedoch als zu schätzende Parameter angesehen.
• In manchen Fällen ist aber die Annahme einer Zufallsstichprobe aus einer
großen Grundgesamtheit nicht sinnvoll (z.B. bei der Betrachtung von Regio-
nen oder Branchen), so dass hier die Betrachtung der αi als zu schätzende
Konstanten im Rahmen einer fixed effects Schätzung mehr Sinn macht
51
2.3 Testverfahren
F-Test zur Überprüfung der Nullhypothese, dass keine unbeobachtete Hetero-
genität bei fixed effects Schätzungen vorliegt:
• Ausgangspunkt ist folgendes lineares Panelmodell mit unbeobachteter He-
terogenität:
• Überprüft wird die Nullhypothese, dass die αi der unbeobachteten Effekte für
alle n Querschnittseinheiten identisch sind bzw. dass die αi von n-1 Quer-
schnittseinheiten (eine Einheit stellt die Basisgruppe dar) gemeinsam den
Wert null annehmen, so dass in diesem Fall keine unbeobachtete Heteroge-
nität vorliegt:
• Bei Gültigkeit der Alternativhypothese, dass die αi unterschiedlich sind, liegt
dagegen unbeobachtete Heterogenität vor
• Zur Überprüfung dieser Nullhypothese wird ein entsprechender F-Test
durchgeführt. Die Prüfgröße lautet:
it 1 it1 k itk i ity = β x + + β x + α + v für i = 1,..., n; t = 1,..., T
0 2 3 nH : α = α = = α = 0
2 2
LSDV pooled2 2
LSDV pooled
2 2
LSDV LSDV
R -RR -R n(T-1)-kn-1F = =
1-R 1-R n-1
nT-n-k
52
• Hier gilt n-1 = q. Zudem entsprechen die Bestimmtheitsmaße R2LSDV
und
R2pooled bei der Dummy-Variablen Schätzung und bei der gepoolten OLS-
Schätzung den entsprechenden Bestimmtheitsmaßen R2ur und R2
r in unres-
tringierten und restringierten linearen Panelmodellen.
• Bei Gültigkeit der Nullhypothese ist diese Prüfgröße F-verteilt mit n-1 und
n(T-1)-k Freiheitsgrade, so dass H0: α2 =⋯= αn = 0 bei einem Signifikanzni-
veau von α zugunsten der entsprechenden Alternativhypothese verworfen
wird, falls F > Fn-1;n(T-1)-k;1-α
LM-Test nach Breusch und Pagan zur Überprüfung der Nullhypothese, dass
keine unbeobachtete Heterogenität bei random effects Schätzungen vorliegt:
• Ausgangspunkt ist folgendes lineares Panelmodell mit unbeobachteter He-
terogenität:
• Überprüft wird die Nullhypothese, dass die Varianz von αi den Wert null an-
nimmt, so dass in diesem Fall keine unbeobachtete Heterogenität vorliegt:
• Bei Gültigkeit der Alternativhypothese H1: σ2
α ≠ 0 liegt dagegen unbeobach-
tete Heterogenität vor
it 0 1 it1 k itk i ity = β + β x + + β x + α + v für i = 1,..., n; t = 1,..., T
2
0 αH : σ = 0
53
• Zur Überprüfung der Nullhypothese betrachten Breusch und Pagan einen
LM-Test (Lagrange Multiplikatoren Test). LM-Tests basieren nicht allgemein
auf einer GLS-Schätzung, sondern auf einer Maximum Likelihood Schät-
zung (siehe später) und somit auf der impliziten Annahme, dass die Fehler-
terme normalverteilt sind. Bei der Prüfgröße werden die entsprechenden
Residuen v it einbezogen:
• Bei Gültigkeit der Nullhypothese ist die Prüfgröße LM asymptotisch χ2-ver-
teilt mit einem Freiheitsgrad, so dass H0: σ2
α = 0 bei einem Signifikanzniveau
von α zugunsten der entsprechenden Alternativhypothese H1: σ2
α ≠ 0 ver-
worfen wird, falls LM > χ21;1-α
→ Während die Ergebnisse des F-Tests zur Überprüfung von unbeobachteter
Heterogenität bei der fixed effects Schätzung (unter Einbeziehung von kon-
ventionellen Schätzern der Standardabweichungen der geschätzten Para-
meter, also keinen cluster-robusten Schätzern) mit Programmpaketen (z.B.
STATA) üblicherweise ausgewiesen werden, müssen zur Durchführung des
Breusch/Pagan LM-Tests meist zusätzliche Anweisungen gegeben werden
2n T
it
i=1 t=1
n T2
it
i=1 t=1
v̂nT
LM = - 12(T-1)
v̂
54
Spezifikationstest nach Hausman zur Überprüfung der Nullhypothese, dass in
linearen Panelmodellen mit unbeobachteter Heterogenität die Annahmen der
random effects Schätzung vorliegen gegen die Alternativhypothese, dass die
Annahmen der fixed effects Schätzung vorliegen:
• Hausman Tests basieren generell auf dem Vergleich eines Schätzvektors β a
mit einem anderen Schätzvektor β b. Bei Gültigkeit der Nullhypothese sind
dabei beide Schätzer konsistent, aber β b ist effizient. Dagegen ist zwar β a
bei Gültigkeit der Alternativhypothese konsistent, β b dagegen nicht.
• Diese Herangehensweise kann auf den Vergleich zwischen fixed effects
Schätzer β f und random effects Schätzer β r bezogen werden. Unter der Null-
hypothese, dass αi mit allen erklärenden Variablen unkorreliert ist, sind so-
wohl β f als auch β r konsistent, wobei der random effects Schätzer β r effizient
ist. Unter der Alternativhypothese, dass αi mit einer erklärenden Variablen
korreliert ist, ist dagegen zwar β f konsistent, β r aber inkonsistent.
• Somit sollten sich die beiden Schätzer unter der Nullhypothese nicht syste-
matisch unterscheiden. Falls allerdings statistisch eine Abweichung zwi-
schen beiden Schätzern nachgewiesen werden kann, spricht dies dafür,
dass die wesentliche Annahme für die Anwendung einer random effects
Schätzung nicht getroffen werden kann.
• Zu beachten ist dabei, dass nur die in beiden Ansätzen geschätzten Regres-
sionsparameter herangezogen werden können, nicht also z.B. die geschätz-
ten Parameter von zeitinvarianten erklärenden Variablen (z.B. Geschlecht)
55
• Neben der Differenz zwischen den beiden Schätzern β f und β r wird in die
Prüfgröße des Hausman Tests auch die geschätzte Varianz-Kovarianzmatrix
dieser Differenz einbezogen:
• Bei Gültigkeit der Nullhypothese ist die Prüfgröße H asymptotisch χ2-verteilt
mit der Anzahl q der in beiden Ansätzen geschätzten Regressionsparame-
ter. Damit wird die Nullhypothese, dass αi mit allen erklärenden Variablen
unkorreliert ist, bei einem Signifikanzniveau von α zugunsten der Alternativ-
hypothese von entsprechenden Korrelationen verworfen, falls H > χ2q;1-α.
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (I)
Im vorherigen Beispiel der Analyse der Determinanten des Logarithmus von
Löhnen (logwage) mit Paneldaten für 545 dauerhaft berufstätige Männer für die
Jahre von 1980 bis 1987 (erklärende Variablen: educ, black, exper, expersq,
married, union, Dummy-Variablen für die Jahre 1981 bis 1987) haben sich mit
STATA folgende konventionelle (also nicht cluster-robuste) fixed und random
effects Schätzergebnisse sowie F-, Breusch/Pagan LM- und Hausman Tester-
gebnisse gezeigt (bei cluster-robusten fixed effects Schätzungen wird der F-
Test nicht ausgewiesen, siehe oben):
---------------------------------------------------------------------------------------------------------
-1'
f r f r f rˆ ˆ ˆ ˆ ˆ ˆˆH = β -β Cov β -β β -β
56
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (II)
xtreg logwage expersq married union d81 d82 d83 d84 d85 d86 d87, fe
Fixed-effects (within) regression Number of obs = 4360
Group variable: nr Number of groups = 545
R-sq: within = 0.1806 Obs per group: min = 8
between = 0.0286 avg = 8.0
overall = 0.0888 max = 8
F(10,3805) = 83.85
corr(u_i, Xb) = -0.1222 Prob > F = 0.0000
------------------------------------------------------------------------------
logwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
expersq | -.0051855 .0007044 -7.36 0.000 -.0065666 -.0038044
married | .0466804 .0183104 2.55 0.011 .0107812 .0825796
union | .0800019 .0193103 4.14 0.000 .0421423 .1178614
d81 | .1511912 .0219489 6.89 0.000 .1081584 .194224
d82 | .2529709 .0244185 10.36 0.000 .2050963 .3008454
d83 | .3544437 .0292419 12.12 0.000 .2971125 .411775
d84 | .4901148 .0362266 13.53 0.000 .4190893 .5611402
d85 | .6174822 .0452435 13.65 0.000 .5287784 .7061861
d86 | .7654965 .0561277 13.64 0.000 .6554532 .8755399
d87 | .9250249 .0687731 13.45 0.000 .7901892 1.059861
_cons | 1.426019 .0183415 77.75 0.000 1.390058 1.461979
-------------+----------------------------------------------------------------
sigma_u | .39176195
sigma_e | .35099001
rho | .55472816 (fraction of variance due to u_i)
------------------------------------------------------------------------------
F test that all u_i=0: F(544, 3805) = 9.16 Prob > F = 0.0000
---------------------------------------------------------------------------------------------------------
57
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (III)
xtreg logwage educ black exper expersq married union d81 d82 d83 d84 d85 d86 d87, re
Random-effects GLS regression Number of obs = 4360
Group variable: nr Number of groups = 545
R-sq: within = 0.1799 Obs per group: min = 8
between = 0.1857 avg = 8.0
overall = 0.1828 max = 8
Wald chi2(13) = 957.68
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
------------------------------------------------------------------------------
logwage | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0909923 .0105088 8.66 0.000 .0703955 .1115891
black | -.1434596 .0470052 -3.05 0.002 -.235588 -.0513311
exper | .1057427 .0153596 6.88 0.000 .0756384 .135847
expersq | -.0047179 .0006894 -6.84 0.000 -.0060691 -.0033667
married | .0639586 .0167719 3.81 0.000 .0310862 .0968309
union | .106401 .0178465 5.96 0.000 .0714225 .1413795
d81 | .0404346 .0246907 1.64 0.101 -.0079583 .0888275
⋮ | ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ d87 | .1344691 .0812426 1.66 0.098 -.0247634 .2937017
_cons | .0377516 .147968 0.26 0.799 -.2522605 .3277636
-------------+----------------------------------------------------------------
sigma_u | .32426153
sigma_e | .35099001
rho | .46047891 (fraction of variance due to u_i)
------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------
58
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (IV)
Testanweisung und Testergebnisse für den Breusch/Pagan LM-Test mit STATA
(nur direkt nach der konventionellen oder auch cluster-robusten random effects
Schätzung möglich):
xttest0
Breusch and Pagan Lagrangian multiplier test for random effects
logwage[nr,t] = Xb + u[nr] + e[nr,t]
Estimated results:
| Var sd = sqrt(Var)
---------+-----------------------------
logwage | .2836728 .5326094
e | .123194 .35099
u | .1051455 .3242615
Test: Var(u) = 0
chi2(1) = 3203.58
Prob > chi2 = 0.0000
Für die Anwendung des Hausman Tests mit STATA muss zunächst die unter
der Null- und Alternativhypothese konsistente Schätzung (hier also die fixed
effects Schätzung) durchgeführt werden. Im Anschluss daran ist die Anweisung
„estimates store fixed“ notwendig (die Wahl des Namens „fixed“ ist willkürlich).
Danach muss die ausschließlich unter der Nullhypothese konsistente Schät-
zung (hier also die random effects Schätzung) durchgeführt werden.
---------------------------------------------------------------------------------------------------------
59
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (V)
Schließlich erfolgt dann folgende Testanweisung mit STATA:
hausman fixed
---- Coefficients ----
| (b) (B) (b-B) sqrt(diag(V_b-V_B))
| fixed . Difference S.E.
-------------+----------------------------------------------------------------
expersq | -.0051855 -.0047179 -.0004676 .0001447
married | .0466804 .0639586 -.0172782 .0073468
union | .0800019 .106401 -.0263992 .007375
d81 | .1511912 .0404346 .1107566 .
d82 | .2529709 .030851 .2221199 .
d83 | .3544437 .020161 .3342827 .
d84 | .4901148 .0429321 .4471827 .
d85 | .6174822 .0575582 .559924 .
d86 | .7654965 .0916036 .6738929 .
d87 | .9250249 .1344691 .7905558 .
------------------------------------------------------------------------------
b = consistent under Ho and Ha; obtained from xtreg
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
Test: Ho: difference in coefficients not systematic
chi2(10) = (b-B)'[(V_b-V_B)^(-1)](b-B)
= 26.64
Prob>chi2 = 0.0030
(V_b-V_B is not positive definite)
---------------------------------------------------------------------------------------------------------
60
---------------------------------------------------------------------------------------------------------
Beispiel: Erklärung von Löhnen (VI)
Interpretation:
• Die Nullhypothesen, dass sowohl bei der fixed effects Schätzung als auch
bei der random effects Schätzung in linearen Panelmodellen keine unbeo-
bachtete Heterogenität vorliegt, können mit den entsprechenden F- und
Breusch/Pagan LM-Tests bei allen denkbaren Signifikanzniveaus verworfen
werden
• Damit kann (wie in den meisten Fällen) von einer unbeobachteten Heteroge-
nität in diesen linearen Panelmodellen ausgegangen werden
• Die Nullhypothese, dass in linearen Panelmodellen mit unbeobachteter He-
terogenität αi mit allen erklärenden Variablen unkorreliert ist, kann mit dem
Hausman Test bei einem 1%-Signifikanzniveau abgelehnt werden
• Damit weist der Hausman Test auf entsprechende Korrelationen hin, so
dass auch eine fixed effects Schätzung einer random effects Schätzung vor-
zuziehen ist
---------------------------------------------------------------------------------------------------------