Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1....

21
Extra ¨ ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet: E(y)= α · x β or det faktiska v¨ ardena p˚ a y tillkommer slumpm¨ assiga avvikelser, vilket orklarar att sambandet inte kan beskrivas exakt. Man har samlat in oljande data p˚ a y och x: y 10.0 12.5 7.0 14.5 22.5 8.5 13.0 10.0 9.0 20.0 x 3.0 3.5 2.5 4.0 6.0 2.0 3.5 3.5 2.0 6.5 a) St¨ all upp en l¨ amplig modell d¨ ar y orklaras av x. b) Skatta parametrarna α och β m h a regressionsanalys p˚ a l¨ ampligt s¨ att. c) Testa p˚ a 1% niv˚ a om parametern β ¨ ar noll. d) Ber¨ akna p˚ a l¨ ampligt s¨ att ett 95% prognosintervall f¨ or y a x =5.0. Kan man vara ¨ overtygad om att s¨ akerheten blir 95%? Fundera! 2. Antag att man har registrerat f¨ ors¨ aljningen av en viss produkt under 8 ˚ ar och d˚ a noterat dels hur m˚ anga enheter som s˚ alts, vilket pris produkten haft, samt v¨ ardet p˚ a konsumentprisindex under dessa ˚ ar: ˚ Ar 1 2 3 4 5 6 7 8 Antal s˚ alda enheter 542 549 472 595 470 440 432 483 Pris 45 45 47 50 51 55 55 56 KPI 355 357 365 368 375 380 384 392 a) St¨ all upp en l¨ ampligt modell f¨ or hur efterfr˚ agad volym kan antas bero av priset. ank p˚ a att prisvariabeln normalt skall anges som rela- tivpris. b) Anv¨ and regressionsanalys f¨ or att skatta produktens priselasticitet. c) Testa p˚ a 5% niv˚ a om produkten ¨ ar normalt prisk¨ anslig, dvs har prise- lasticiteten -1. d) Anv¨ and din skattade modell f¨ or att ge en prognos av f¨ or¨ andringen i efterfr˚ agan d˚ a relativpriset ¨ okar med c:a 2%. 3. Man vill skatta parametrarna γ och θ i modellen y = γ · x θ · δ , d¨ ar y, och x ¨ ar tv˚ a variabler, som anses ha detta samband och δ ¨ ar en slumpvariabel s˚ adan att log 10 (δ ar N (0)–f¨ ordelad. I ett datamaterial om 12 observationer p˚ a x och y har gett f¨ oljande sammanst¨ allning: vgv

Transcript of Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1....

Page 1: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

Extra ovningsuppgifter

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annanvariabel, x, enligt sambandet:

E(y) = α · xβ

For det faktiska vardena pa y tillkommer slumpmassiga avvikelser, vilketforklarar att sambandet inte kan beskrivas exakt. Man har samlat infoljande data pa y och x:

y 10.0 12.5 7.0 14.5 22.5 8.5 13.0 10.0 9.0 20.0x 3.0 3.5 2.5 4.0 6.0 2.0 3.5 3.5 2.0 6.5

a) Stall upp en lamplig modell dar y forklaras av x.

b) Skatta parametrarna α och β m h a regressionsanalys pa lampligt satt.

c) Testa pa 1% niva om parametern β ar noll.

d) Berakna pa lampligt satt ett 95% prognosintervall for y da x = 5.0.Kan man vara overtygad om att sakerheten blir 95%? Fundera!

2. Antag att man har registrerat forsaljningen av en viss produkt under 8 aroch da noterat dels hur manga enheter som salts, vilket pris produkten haft,samt vardet pa konsumentprisindex under dessa ar:

Ar 1 2 3 4 5 6 7 8Antal salda enheter 542 549 472 595 470 440 432 483Pris 45 45 47 50 51 55 55 56KPI 355 357 365 368 375 380 384 392

a) Stall upp en lampligt modell for hur efterfragad volym kan antas beroav priset. Tank pa att prisvariabeln normalt skall anges som rela-tivpris.

b) Anvand regressionsanalys for att skatta produktens priselasticitet.

c) Testa pa 5% niva om produkten ar normalt priskanslig, dvs har prise-lasticiteten −1.

d) Anvand din skattade modell for att ge en prognos av forandringen iefterfragan da relativpriset okar med c:a 2%.

3. Man vill skatta parametrarna γ och θ i modellen y = γ ·xθ ·δ, dar y, och x artva variabler, som anses ha detta samband och δ ar en slumpvariabel sadanatt log10(δ) ar N(0, σ)–fordelad. I ett datamaterial om 12 observationer pax och y har gett foljande sammanstallning:

v g v

Page 2: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

x1 · x2 · . . . · x12=21322.1y1 · y2 · . . . · y12=395583∑12i=1(log10(xi))

2=1.77402∑12i=1(log10(yi))

2=2.90207∑12i=1(log10(xi)) · (log10(yi)=2.24964

a) Skatta parametrarna γ och θ pa lampligt satt.

b) Berakna ett 95% konfidensintervall for parametern θ.

c) Gor en prognos for y da x = 3.0 och berakna ett 99% prognosintervall.

Foljande text och data skall anvandas i uppgifterna 4 och 5:

Nedan redovisas data over sald arskvantitet (Volym) av en viss vara mellan 1980och 1997, samt uppgifter om relativprisindex (RPI) for varan, totalinkomsterikronor, befolkningstal, konsumentprisindex och utraknad disponibel realinkomstper capita (INK) i kronor. Vardena har avrundats for att fa plats i utskriften.

Volym log10(Volym) RPI log10(RPI) Inkomst Befolkn. KPI INK log10(INK)340067 5.53 100.0 2.000 284172 8310476 100.0 34194.4 4.53327608 5.52 94.6 1.976 310369 8320488 112.1 33275.4 4.52386113 5.59 92.3 1.965 335610 8325260 121.7 33124.3 4.52333817 5.52 89.8 1.953 367074 8329031 132.6 33236.5 4.52408825 5.61 88.2 1.945 412659 8336599 143.2 34566.8 4.54379316 5.58 87.0 1.940 455591 8350382 153.8 35474.2 4.55369825 5.57 88.5 1.947 494915 8369829 160.3 36887.6 4.57353666 5.55 90.0 1.954 522988 8397802 167.0 37291.5 4.57388988 5.59 90.2 1.955 557361 8436488 176.7 37388.5 4.57373017 5.57 89.8 1.953 603187 8492963 188.1 37757.6 4.58358825 5.55 86.2 1.935 688857 8558835 207.8 38731.9 4.59411217 5.61 83.6 1.922 796308 8617377 227.2 40672.2 4.61384850 5.59 86.6 1.937 842313 8668067 232.4 41813.4 4.62373763 5.57 87.7 1.943 868219 8718562 243.2 40946.9 4.61380005 5.58 91.0 1.959 906706 8780748 248.5 41553.6 4.62369507 5.57 94.1 1.973 921548 8826940 254.8 40974.0 4.61345480 5.54 99.2 1.997 926123 8840999 256.0 40919.2 4.61358805 5.55 104.7 2.020 930240 8846063 257.3 40870.1 4.61

v g v

Page 3: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

Nedanstaende utskrift ar hamtad fran tva Minitab-analyser av data:

Regression Analysis: Volym versus RPI, INK

The regression equation isVolym = 510141 - 2356 RPI + 1.96 INK

Predictor Coef SE Coef T PConstant 510141 99696 5.12 0.000RPI -2355.8 884.8 -2.66 0.018INK 1.961 1.511 1.30 0.214

S = 19804 R-Sq = 37.2% R-Sq(adj) = 28.8%

Analysis of Variance

Source DF SS MS F PRegression 2 3480362799 1740181399 4.44 0.031Residual Error 15 5882737507 392182500Total 17 9363100306

Source DF Seq SSRPI 1 2820539024INK 1 659823775

Regression Analysis: log(Volym) versus log(RPI), log(INK)

The regression equation islog(Volym) = 5.80 - 0.600 log(RPI) + 0.206 log(INK)

Predictor Coef SE Coef T PConstant 5.7990 0.8361 6.94 0.000log(RPI) -0.5996 0.2237 -2.68 0.017log(INK) 0.2059 0.1523 1.35 0.196

S = 0.02320 R-Sq = 38.2% R-Sq(adj) = 30.0%

Analysis of Variance

Source DF SS MS F PRegression 2 0.0049931 0.0024966 4.64 0.027Residual Error 15 0.0080735 0.0005382Total 17 0.0130667

Source DF Seq SSlog(RPI) 1 0.0040085log(INK) 1 0.0009846

v g v

Page 4: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

4. a) Vilka modeller ligger till grund for de tva analyser som har gjorts?

b) Skatta priselasticiteten for varan genom att utnyttja en av analyserna(endast en av dem fungerar).

c) Ar varan inkomstelastisk? Besvara fragan genom att gora ett lampligttest pa 5% niva med hjalp av en av analyserna (endast en av demfungerar).

5. Ytterligare tva Minitab-analyser ar foljande:

Regression Analysis: log(Volym) versus log(RPI)

The regression equation islog(Volym) = 6.76 - 0.610 log(RPI)

Predictor Coef SE Coef T PConstant 6.7621 0.4494 15.05 0.000log(RPI) -0.6102 0.2293 -2.66 0.017

S = 0.02379 R-Sq = 30.7% R-Sq(adj) = 26.3%

Analysis of Variance

Source DF SS MS F PRegression 1 0.0040085 0.0040085 7.08 0.017Residual Error 16 0.0090582 0.0005661Total 17 0.0130667

Regression Analysis: log(Volym) versus log(INK)

The regression equation islog(Volym) = 4.56 + 0.220 log(INK)

Predictor Coef SE Coef T PConstant 4.5585 0.8198 5.56 0.000log(INK) 0.2203 0.1792 1.23 0.237

S = 0.02732 R-Sq = 8.6% R-Sq(adj) = 2.9%

Analysis of Variance

Source DF SS MS F PRegression 1 0.0011278 0.0011278 1.51 0.237Residual Error 16 0.0119389 0.0007462Total 17 0.0130667

v g v

Page 5: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

a) Antag att man vill forsoka bygga en modell for efterfragad volym medpris och inkomst (i lampliga former) som forklarande variabler. Vadblir resultatet av en stegvist byggd modell? Anvand 5% signifikansnivai de test du behover gora.

b) Kan man saga att denna vara ar priskanslig? Utred pa lamplig sattmed hjalp av de gjorda analyserna och genomfor ev. test pa 5% niva.

c) Anvand en av analyserna for att skissa en kurva for efterfragad varamot pris, nar disponibel realinkomst per capita ar 40000 kronor.

6. Foljande tidsserie bestar av halvarsdata ( i kkr) over forsaljningen av cyklari en cykelaffar:

262.9, 448.3, 315.0, 487.6, 339.4, 468.1, 374.4,508.3, 375.8, 585.4, 438.5, 663.1

Antag additiv modell och sasongrensa serien. Du har hjalp av nedanstaendeMinitab-utskrift:

Time Series Decomposition

Data FrsljnLength 12.0000NMissing 0

Trend Line Equation

Yt = 301.155 + 21.1916*t

Seasonal Indices

Period Index

1 -78.07502 78.0750

Page 6: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

7. Forsaljningen av gasolgrillar antas ha haft en sa kraftig uppgang under pe-rioden 91–94 att man kan tala om en exponentiellt okande trend. Det finnsdock en kraftig sasongsvariation over aret. Under tre ar har sasongkomponenternaskattats till 37% over trend-nivan under andra och tredje kvartalet, ochc:a 37% under trend-nivan under forsta och fjarde kvartalet. Originaldataforutsatts vara fria fran konjunkturvariation och presenteras nedan. Skattatillvaxtfaktorn i forsaljningsutvecklingen pa lampligt satt.

Tidsper. Forsaljn.(kkr)apr 91–sep 91 9759.7okt 91–mar 92 7861.5apr 92–sep 92 12452.4okt 92–mar 93 7056.9apr 93–sep 93 17874.2okt 93–mar 94 12421.6

8. Nedanstaende siffror beskriver kvartalsvis antal uthyrda timmar vid ettsolarium. Plotta data i tidsordning och gor en bedomning av vilken modell,som ar tillampbar. Anvand sedan nagon av de foljande Minitab-analysernafor att skatta och tolka sasongkomponenterna enligt den valda modellen.

Ar Kvartal Antal uthyrda soltr1990 1 2033

2 16803 9384 1522

1991 1 20122 16513 9434 1519

1992 1 19892 16633 9444 1480

1993 1 20312 15693 9194 1456

v g v

Page 7: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

Data TimmarLength 16.0000NMissing 0

Trend Line Equation

Yt = 1667.5 - 17.1397*t

Seasonal Indices

Period Index

1 1.313312 1.079773 0.6170054 0.989909

Accuracy of Model

MAPE: 3.53MAD: 53.63MSD: 4337.52

Data TimmarLength 16.0000NMissing 0

Trend Line Equation

Yt = 1667.5 - 17.1397*t

Seasonal Indices

Period Index

1 480.0632 118.8123 -585.9384 -12.9375

Accuracy of Model

MAPE: 3.90MAD: 53.85MSD: 3969.89

v g v

Page 8: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

9. Nedan visas resultatet av en klassisk komponentuppdelning med Minitabav data for privat konsumtion av livsmedel, drycker och tobak i lopandepriser fran 1980, kvartal 1 till 1998, kvartal 4. Data har hamtats franSCB’s hemsida.

v g v

Page 9: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

Time Series Decomposition

Data Livsmedel...Length 76,0000NMissing 0

Trend Line Equation

Yt = 17663,6 + 357,157*t

Seasonal Indices

Period Index

1 0,9619772 1,038233 0,9828224 1,01697

a) Vilken typ av klassisk modell verkar ha anvants? Motivera ditt svar.

b) Berakna en prognos for konsumtionen forsta kvartalet 1999.

v g v

Page 10: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

Nedan visas resultatet fran en MINITAB-analys av data med Winter’smetod.

Winters’ multiplicative model

Data Livsmedel...Length 76,0000NMissing 0

Smoothing ConstantsAlpha (level): 0,2Gamma (trend): 0,2Delta (seasonal): 0,2

Accuracy MeasuresMAPE: 2MAD: 613MSD: 789489

Row Period FORE2 LOWE2 UPPE2

1 77 38505,3 37004,4 40006,2

c) Jamfor de prognoser du beraknade i b)-uppgiften med de, som Win-ter’s metod ger. Vilket metod verkar fungera bast? Finns det nagonrimlig orsak till detta? Motivera kortfattat.

Page 11: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

10. Ett foretag har specialiserat sig pa glassforsaljning till hushall via sarskildaglassbilar. Foretagets forsaljningsvolym pa indexform under nagra ar re-dovisas i nedanstaende tabell:

Ar Kvartal Volymindex1998 1 100

2 1123 1194 88

1999 1 932 1173 1254 99

2000 1 1012 1203 1284 104

2001 1 1012 1193 1304 106

En analys med Minitab gav foljande resultat:

v g v

Page 12: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

Time Series Decomposition

Data C1Length 16,0000NMissing 0

Trend Line Equation

Yt = 103,125 + 0,823529*t

Seasonal Indices

Period Index

1 0,8938472 1,068173 1,143634 0,894351

Accuracy of Model

MAPE: 2,23069MAD: 2,28908MSD: 9,49078

v g v

Page 13: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

a) Vilken klassisk modell verkar ha anvants i analysen? Motivera dittsvar och stall upp modellen.

b) Tolka de skattade sasongkomponenterna.

c) Anvand den skattade modellen for att gora prognoser av volymindexfor kvartalen 1 och 2 ar 2002. (Nagon cyklisk komponent skall ej inga.)

Man har ocksa gjort prognoser med Winters metod och fatt foljande resul-tat:

Data C1Length 16,0000NMissing 0

Smoothing ConstantsAlpha (level): 0,2Gamma (trend): 0,2Delta (seasonal): 0,2

Accuracy MeasuresMAPE: 5,8447MAD: 6,4535MSD: 65,8912

Row Period Forecast Lower Upper

1 17 103,488 87,677 119,2992 18 123,591 107,450 139,732

v g v

Page 14: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

d) Jamfor prognoserna med Winters metod med de du beraknade i b)–uppgiften. Vilka tror/tycker du ar bast? Motivera ditt svar.

11. I en studie undersoks husprisers beroende av storleken pa den kommunhusen ligger i. For 10 slumpmassigt valda objekt av jamforbar typ erhallsfoljande resultat:

Objekt (i) Pris (yi) [i miljoner kronor] Kommunens befolkning (x1i) [i tusental invanare]1 0.99 452 1.32 1213 0.76 664 1.10 965 0.56 516 1.79 2137 0.89 888 2.65 7809 1.35 9110 1.02 103

Foljande har beraknats:∑

x1i = 1654,∑

yi = 12.43,∑

x21i = 713242,∑

y2i = 18.705,

∑x1iyi = 3143.09

a) Illustrera grafiskt sambandet mellan huspris och befolkning.

b) Formulera en (standardmassig) enkel linjar regressionsmodell for data.Ange tydligt vad varje komponent star for.

c) Skatta parametrarna i den regressionsmodell du formulerat.

d) Berakna forklaringsgraden i den skattade regressionsmodellen.

e) Testa pa 5% niva nollhypotesen att det inte finns nagot (linjart) sam-band mellan huspris och befolkning.

f) Oavsett resultatet i foregaende uppgift, anvand din skattade regres-sionsmodell for att berakna ett 95% prognosintervall for priset pa ettobjekt av ovanstaende typ da kommunens befolkning ar 100000 per-soner.

Page 15: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

12. I undersokningen i foregaende uppgift har man ocksa noterat hurvida kom-munen har borgerlig majoritet i kommunfullmaktige. En varibel x2 infors,som ar = 1 vid borgerlig majoritet och 0 f.o. Analyser gors i Minitab medfoljande resultat:

Analys 1:

Regression Analysis: y versus x1; x2

The regression equation isy = 0,853 + 0,00245 x1 - 0,037 x2

Predictor Coef SE CoefConstant 0,8531 0,1521x1 0,0024460 0,0004505x2 -0,0366 0,1928

S = 0,2838 R-Sq = 82,7% R-Sq(adj) = 77,7%

Analysis of Variance

Source DF SS MSRegression 2 2,6911 1,3456Residual Error 7 0,5637 0,0805Total 9 3,2548

Analys 2:

MTB > regr c3 3 c5 c6 c7

Regression Analysis: y versus x1; x2; x1*x2

The regression equation isy = 0,856 + 0,00243 x1 - 1,03 x2 + 0,0116 x1*x2

Predictor Coef SE CoefConstant 0,8564 0,1536x1 0,0024306 0,0004551x2 -1,030 1,085x1*x2 0,01163 0,01249

S = 0,2865 R-Sq = 84,9% R-Sq(adj) = 77,3%

Analysis of Variance

Source DF SS MSRegression 3 2,76225 0,92075Residual Error 6 0,49256 0,08209Total 9 3,25481

v g v

Page 16: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

a) Tolka de skattade koefficienterna i Analys 2 pa lampligt satt. Tips:Arbeta med variabeln x2 sa att den definierar tva regressionslinjer.

b) Har den politiska majoriteten nagon inverkan i sig sjalv? Testa pa 5%niva. Anvand Analys 2.

c) Finns det nagot samspel mellan befolkning och politisk majoritet nardet galler huspriser? Testa pa 5% niva.

d) Anvand ett lampligt test for att avgora om inforandet av x2 och desssamspel med x1 ger en battre modell an modellen med enbart x1.

13. Nedanstaende data innhaller uppgifter om Begynnelselon (Salary), Utbild-ning (Educat), Erfarenhet (Exper), Anstallningstid (Months) och Kon (Gen-der) hos 93 anstallda vid Harris Bank i Chicago. Utbildning anges i antalutbildningsar, Erfarenhet anges i antal manader med liknande arbete innananstallning och Anstallningstid anges i antal mander i anstallning efter den1 januari 1969. Variabeln Kon ar kodad sa att 0 betyder kvinna och 1betyder man.

Person Salary (dollar) Educat Exper Months Gender1 3900 12 0.0 1 02 4020 10 44.0 7 03 4290 12 5.0 30 04 4380 8 6.2 7 05 4380 8 7.5 6 0...

......

.........

92 6900 15 132.0 24 193 8100 16 54.5 33 1

I en studie vill man forklara begynnelselonen med hjalp av regression mot eneller flera av de andra variablerna. Ett antal analyser med hjalp av Minitabgors. En korrelationsmatris mellan variablerna beraknas till foljande:

Correlations (Pearson)

Salary Educat Exper MonthsEducat 0.412

0.000

Exper 0.167 -0.1020.110 0.333

Months 0.286 -0.060 0.0770.005 0.569 0.465

Gender 0.551 0.327 0.016 -0.0980.000 0.001 0.878 0.351

v g v

Page 17: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

a) Om man vill gora en multipel regressionsanalys med fler an en forklaringsvariabel,finns da nagon uppenbar risk for multikolinjaritetsproblem? Motiveraditt svar.

Vidare har en regressionsanalys med forklaringsvariablerna utbildning ochkon gjorts enligt nedanstaende utskrift:

Regression Analysis

The regression equation isSalary = 4173 + 80.7 Educat + 692 Gender

Predictor Coef StDev TConstant 4173.1 339.2 12.30Educat 80.70 27.67 2.92Gender 691.8 132.2 5.23

S = 572.4

Analysis of Variance

Source DF SS MSRegression 2 16831744 8415872Residual Error 90 29491546 327684Total 92 46323290

Regressionsmodellen formuleras har som

yi = β0 + β1 · x1i + β2 · x2i + εi, dar x1 =Educat och x2 =Gender.

b) Tolka de skattade koefficienterna i modellen.

c) Testa pa 5% niva

H0 : β1 = β2 = 0H1 : Minst en βj 6= 0

d) Berakna ett 95% konfidensintervall for β1.

v g v

Page 18: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

Nedan visas utskriften fran en stegvis regression enligt framatvalsprincipen.Stepwise Regression

F-to-Enter: 4.00 F-to-Remove: 4.00

Response is Salary on 4 predictors, with N = 93

Step 1 2 3 4Constant 5139 4725 3709 3526

Gender 818 868 737 722T-Value 6.29 7.24 6.14 6.13

Months 23.7 24.3 23.4T-Value 4.25 4.58 4.50

Educat 84 90T-Value 3.36 3.65

Exper 1.27T-Value 2.16

S 596 547 518 507R-Sq 30.32 41.97 48.50 51.09

e) Beskriv de steg som utforts i den stegvisa regressionen. Varfor harvariabeln kon (Gender) tagits med forst?

14. Foretaget Meddicorp saljer medicinsk utrustning till sjukhus och andra for-mer av kliniker i USA. Marknaden delas in i regionerna South, West ochMidwest och inom dessa i mindre omraden. Nedan finns data for dessaomraden ar 1994 over forsaljning i 1000-tals dollar (sales), reklamkostnaderi 100-tals dollar (adv), bonusutbetalningar i 100-talsdollar (bonus), mark-nadsandelar i procent (mktshr), forsaljning hos den storsta konkurrenten i1000-tals dollar (compet) samt region (reg). Den sistnamnda ar kodad med1 for region South, 2 for region West och 3 for region Midwest.

sales adv bonus mktshr compet region963.50 374.270 230.980 33 202.220 1893.00 408.500 236.280 29 252.770 11057.25 414.310 271.570 34 293.220 11183.25 448.420 291.200 24 202.220 21419.50 517.880 282.170 32 303.330 31547.75 637.600 321.160 29 353.880 31580.00 635.720 294.320 28 374.110 31071.50 446.860 305.690 31 404.440 11078.25 489.590 238.410 20 394.330 11122.50 500.560 271.380 30 303.330 21304.75 484.180 332.640 25 333.660 31552.25 618.070 261.800 34 353.880 3

v g v

Page 19: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

1040.00 453.390 235.630 42 262.880 11045.25 440.860 249.680 28 333.660 21102.25 487.790 232.990 28 232.550 21225.25 537.670 272.200 30 273.000 21508.00 612.210 266.640 29 323.550 31564.25 601.460 277.440 32 404.440 31634.75 585.100 312.350 36 283.110 31159.25 524.560 292.870 34 222.440 11202.75 535.170 268.270 31 283.110 21294.25 486.030 309.850 32 242.660 21467.50 540.170 291.030 28 333.660 31583.75 583.850 289.290 27 313.440 31124.75 499.150 272.550 26 374.110 2

Fran variabeln region konstrueras tre nya variabler:

south=1 om regionen ar South och 0 annarswest=1 om regionen ar West och 0 annarsmidwest=1 om regionen ar Midwest och 0 annars

Man provar forst en regressionsmodell dar variabeln sales forklaras av vari-aberna adv och bonus. Modellen blir

y = β0 + β1 · x1 + β2 · x2 + ε

dar x1 =adv och x2 =bonus. Resultatet ses nedan:

Regression Analysis

The regression equation issales = - 516 + 2,47 adv + 1,86 bonus

Predictor Coef StDevConstant -516,4 189,9adv 2,4732 0,2753bonus 1,8562 0,7157

S = 90,75

Analysis of Variance

Source DF SS MSRegression 2 1067797 533899Residual Error 22 181176 8235Total 24 1248974

v g v

Page 20: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

a) Testa pa 5% niva

H0 : β1 = β2 = 0H1 : Minst en βj 6= 0

b) Ar bagge koefficienterna β1 och β2 skilda fran 0? Besvara fragan vialampliga test eller konfidensintervall.

c) Nedan foljer nagra residualplottar. Tyder dessa pa nagra brister hosmodellen? Motivera dina svar.

Man skattar ocksa en modell dar variabeln sales forklaras av alla variablerutom de tva variablerna region och midwest med foljande resultat:

Regression Analysis

The regression equation issales = 385 + 1,41 adv + 1,01 bonus + 3,15 mktshr - 0,235 compet - 268 south

- 214 west

Predictor Coef StDev T P VIFConstant 385,0 219,5 1,75 0,097adv 1,4092 0,2687 5,24 0,000 3,1bonus 1,0123 0,4641 2,18 0,043 1,4mktshr 3,155 2,980 1,06 0,304 1,3compet -0,2354 0,2338 -1,01 0,328 1,6south -267,96 47,56 -5,63 0,000 3,7west -214,33 36,79 -5,83 0,000 2,4

S = 55,57 R-Sq = 95,6% R-Sq(adj) = 94,1%

v g v

Page 21: Extra ovningsuppgifter - ida.liu.seannha92/kurser/732G01/RTuppgifter_LH.pdfExtra ovningsuppgifter 1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel,

Analysis of Variance

Source DF SS MS F PRegression 6 1193398 198900 64,42 0,000Residual Error 18 55575 3088Total 24 1248974

d) I modellen ingar inte variablerna region och midwest. Anda havdarnagon att modellen omfattar de variabler som finns. Stammer detta?Motivera ditt svar.

e) Finns det nagra problem med multikolinjaritet i den skattade mod-ellen? Motivera ditt svar.

Man skattar vidare en modell dar sales forklaras av adv, bonus, south ochwest med foljande resultat:

Regression Analysis

The regression equation issales = 435 + 1,37 adv + 0,975 bonus - 258 south - 210 west

Predictor Coef StDevConstant 435,1 206,2adv 1,3678 0,2622bonus 0,9752 0,4808south -257,89 48,41west -209,75 37,42

S = 57,63

Analysis of Variance

Source DF SS MSRegression 4 1182560 295640Residual Error 20 66414 3321Total 24 1248974

f) Man vill jamfora denna modell med den, som skattades forst (dvs denmed adv och bonus som forklaringsvariabler). Avgor med ett lampligttest pa 5% niva om den har senare modellen ar battre.