Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨...

9
Intro Info Kursplan Sannolikhetsteori Beroende Matematisk statistik f ¨ or D, I, Π och Fysiker orel ¨ asning 1 Johan Lindstr ¨ om 4 september 2018 Johan Lindstr¨ om - [email protected] FMSF45/MASB03 F1 2/29 Intro Info Kursplan Sannolikhetsteori Beroende Till¨ ampningar Arbetsmarknad Exjobb Matematisk statistik – slumpens matematik Sannolikhetsteori: Hur beskriver man slumpen? Statistikteori: Vilka slutsatser kan man dra av ett datamaterial? Johan Lindstr¨ om - [email protected] FMSF45/MASB03 F1 3/29 Intro Info Kursplan Sannolikhetsteori Beroende Till¨ ampningar Arbetsmarknad Exjobb Till¨ ampningar f¨ or matematisk statistik www.etc.se/inrikes/stopp-forsakringar-i-klimatkansliga-omraden Johan Lindstr¨ om - [email protected] FMSF45/MASB03 F1 4/29

Transcript of Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨...

Page 1: Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨ ardighetstest (2 i LP2, 1 i LP3).¨ I 4 Godk anda dator¨ ovningar (2 i LP1, 2 i LP2).¨

Intro Info Kursplan Sannolikhetsteori Beroende

Matematisk statistik forD, I, Π och Fysiker

Forelasning 1

Johan Lindstrom

4 september 2018

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 2/29

Intro Info Kursplan Sannolikhetsteori Beroende Tillampningar Arbetsmarknad Exjobb

Matematisk statistik – slumpens matematik

Sannolikhetsteori: Hur beskriver man slumpen?

Statistikteori: Vilka slutsatser kan man dra av ettdatamaterial?

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 3/29

Intro Info Kursplan Sannolikhetsteori Beroende Tillampningar Arbetsmarknad Exjobb

Tillampningar for matematisk statistik

www.etc.se/inrikes/stopp-forsakringar-i-klimatkansliga-omraden

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 4/29

Page 2: Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨ ardighetstest (2 i LP2, 1 i LP3).¨ I 4 Godk anda dator¨ ovningar (2 i LP1, 2 i LP2).¨

Intro Info Kursplan Sannolikhetsteori Beroende Tillampningar Arbetsmarknad Exjobb

Kostnad stormskador

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 5/29

Intro Info Kursplan Sannolikhetsteori Beroende Tillampningar Arbetsmarknad Exjobb

Oversvamningar — Sodra Nederlanderna 1953

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 6/29

Intro Info Kursplan Sannolikhetsteori Beroende Tillampningar Arbetsmarknad Exjobb

OMXS30 aktieindex

1993 1995 1997 1999 2001 2003 2005 2007 2009

200

400

600

800

1000

1200

1400

OMXS30

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 7/29

Page 3: Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨ ardighetstest (2 i LP2, 1 i LP3).¨ I 4 Godk anda dator¨ ovningar (2 i LP1, 2 i LP2).¨

Intro Info Kursplan Sannolikhetsteori Beroende Tillampningar Arbetsmarknad Exjobb

EKG och R-R variation

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 8/29

Intro Info Kursplan Sannolikhetsteori Beroende Tillampningar Arbetsmarknad Exjobb

Careercast — The Best Jobs of 2017 & 2018

20171. Statistician

2. Medical Services Manager

3. Operations Research Analyst

5. Data Scientist

7. Mathematician

20181. Genetic Counselor

2. Mathematician

3. University Professor

5. Statistician

7. Data Scientist

9. Operations Research Analyst

10. Actuary

Mathematicians and Data Scientists both can find lucrativeopportunities in the tech space parsing and analyzing collecteddata.

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 9/29

Intro Info Kursplan Sannolikhetsteori Beroende Tillampningar Arbetsmarknad Exjobb

Exjobb — LUP Student Papers VT-18 (ett urval)

Machine Learning:I Artificial Neural Network Modelling of Intensive Care

MortalityI Evaluation of Data Augmentation of MR Images for Deep

Learning

Finans & risk:I Pricing fixed price electricity contracts in the Nordic regionI Modelling Probability of Default in the Nordics

Signalbehandling:I Classification of bird syllables in noisy environments using

multitapersI Efficient Estimation of Decaying Sinusoids with Application

in NMR Spectroscopy

Modellering:I Road modelling using LiDAR-dataI Spatio-Temporal Modelling of Air Pollution in Malta

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 10/29

Page 4: Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨ ardighetstest (2 i LP2, 1 i LP3).¨ I 4 Godk anda dator¨ ovningar (2 i LP1, 2 i LP2).¨

Intro Info Kursplan Sannolikhetsteori Beroende Fardighetstest

Praktiska detaljer

I Kursen gar over 2 lasperioderI 1+ forelasning i veckan (2 i vecka 2 & 5).I 1 rakneovning i veckanI Mycket sjalvstudietid (>10 h per vecka).I Examination:

I 3 Godkanda fardighetstest (2 i LP2, 1 i LP3).I 4 Godkanda datorovningar (2 i LP1, 2 i LP2).I Tentamin 2019-01-17

I Kurshemsida:www.maths.lth.se/matstat/kurser/fms012/pie/

I Forelasare: Johan Lindstrom, MH319

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 12/29

Intro Info Kursplan Sannolikhetsteori Beroende Fardighetstest

Forkunskapskrav

For att fa lasa kursen maste man ha klarat 12 hogskolepoanginom:

I Linjar algebra (FMA420, FMAA20I Endimensionell analys (FMAA01, FMAA05)I Flerdimensionell analys (FMA430, FMA435)

innan kursen startar.

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 13/29

Intro Info Kursplan Sannolikhetsteori Beroende Fardighetstest

Fardighetstest & Datorovningar

I Fardighetstest i Mozquiztohttp://quizms.maths.lth.se/

I Logga in med StiL-identitetI Testen skall klaras (6 av 10) senast:

I 2018-09-24, Mandag lv 4I 2018-10-15, Mandag lv 7I 2018-12-10, Mandag lv 6

I Handledning pa ovningarna och i datorsal.I Redovisningen sker i Mozquizto senast

I 2018-10-03, Onsdag lv 5I 2018-10-24, Onsdag lv 8I 2018-12-05, Onsdag lv 5I 2018-12-19, Onsdag lv 7

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 14/29

Page 5: Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨ ardighetstest (2 i LP2, 1 i LP3).¨ I 4 Godk anda dator¨ ovningar (2 i LP1, 2 i LP2).¨

Intro Info Kursplan Sannolikhetsteori Beroende

Kursinnehall — En oversikt

Lasperiod 1 — SannolikhetsteoriI Grundlaggande begreppI Modeller for slumpmassiga handelserI Rakneregler for slumpmassiga handelser

Lasperiod 2 — StatistikI Hur anpassar vi modeller till data?I Hur bra ar anpassningen?I Vad kan vi dra for slutsatser fran data?I Finns det samband mellan olika datamaterial?

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 15/29

Intro Info Kursplan Sannolikhetsteori Beroende Ex Kolmogorov Frekvens

Grundlaggande begrepp (Kap. 2.2)

I Utfall – resultatet av ett slumpmassigt forsok.Bet. ω1,ω2, . . .

I Handelse – en samling av ett eller flera utfall.Bet. A,B, . . .

I Utfallsrum – mangden av mojliga utfall.Bet Ω

Exempel: TarningskastUtfallsrum Ω {1:a,2:a,3:a,4:a,5:a,6:a}Utfall ω1 1:aHandelse A ”Minst 4:a” = {4:a,5:a,6:a}

Utfallsrum vid kast av tva tarningar?

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 16/29

Intro Info Kursplan Sannolikhetsteori Beroende Ex Kolmogorov Frekvens

Exempel

Kasta en tarning och definera handelsernaI A : ”Minst 4:a” = {4:a,5:a,6:a}I B : ”Hogst 5:a” = {1:a,2:a,3:a,4:a,5:a}I C : ”3:a” = {3:a}

Vad ar:

1. A ∩ B?

2. A ∪ B?

3. A ∩ C?

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 17/29

Page 6: Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨ ardighetstest (2 i LP2, 1 i LP3).¨ I 4 Godk anda dator¨ ovningar (2 i LP1, 2 i LP2).¨

Intro Info Kursplan Sannolikhetsteori Beroende Ex Kolmogorov Frekvens

Sannolikhet — Bet. P(A)

Kolmogorovs axiomsystem (Kap. 2.3)

0 ≤ P(A) ≤ 1En sannolikhet ar ett tal mellan 0 och 1

P(Ω) = 1Sannolikheten att nagot skall handa ar 1

P(A ∪ B) = P(A)+ P(B)Om och endast om A och B ar oforenliga

Komplementsatsen: P(A∗) = 1− P(A).

Additionssatsen: P(A ∪ B) = P(A)+ P(B)− P(A ∩ B)

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 18/29

Intro Info Kursplan Sannolikhetsteori Beroende Ex Kolmogorov Frekvens

Klassiska sannolikhetsdefinitionen (Kap. 2.4)

Om alla utfall ar lika sannolika (likformigt sannolikhetsmatt)ar sannolikheten for en handelse A kvoten mellan antaletgynsamma fall, g, och antalet mojliga fall, m:

P(A) =gm

(=‖A‖‖Ω‖

)

Exempel:Dra tva kort ur en kortlek. Vad ar sannolikheten att bada arhjarter?

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 19/29

Intro Info Kursplan Sannolikhetsteori Beroende Ex Kolmogorov Frekvens

Frekvenstolkning av sannolikhet (Kap. 2.4)

Upprepa ett slumpmassigt forsok n ganger

Antal ggr A intraffarn

→ P(A), da n→∞

100

101

102

103

104

105

0

0.2

0.4

0.6

0.8

1Relativa frekvensen av antal treor

Antal tärningskast

Rel

ativ

frek

vens

1/6?

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 20/29

Page 7: Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨ ardighetstest (2 i LP2, 1 i LP3).¨ I 4 Godk anda dator¨ ovningar (2 i LP1, 2 i LP2).¨

Intro Info Kursplan Sannolikhetsteori Beroende Bayes Oberoende Flera handelser

Betingad sannolikhet (Def. 2.6)

Sannolikheten att B intraffar givet att vi observerat A ar

P(B | A) =P(A ∩ B)

P(A)

Exempel:Sannolikheten att en slumpmassigt vald

I student ar langre an 185 cm?I manlig student ar langre an 185 cm?

Exempel:Dra tva kort ur en kortlek. Vad ar sannolikheten att bada arhjarter?

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 21/29

Intro Info Kursplan Sannolikhetsteori Beroende Bayes Oberoende Flera handelser

Satsen om total sannolikhet (Sats 2.9)Om vi har n st handelser H1, . . . ,Hn som ar

I Parvis oforenliga, Hi ∩ Hj = ∅, i 6= j

I Tillsammans tacker utfallsrummet,n⋃

i=1

Hi = Ω

galler for varje handelse A att

P(A) =n∑

i=1

P(A | Hi)P(Hi)

Bayes sats (Sats 2.10)

P(Hi | A) =P(Hi ∩ A)

P(A)=

P(A | Hi)P(Hi)∑ni=1 P(A | Hi)P(Hi)

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 22/29

Intro Info Kursplan Sannolikhetsteori Beroende Bayes Oberoende Flera handelser

Exemple: Bayes sats

Om vi traffar en kvinnlig teknolog i arskurs 2, vilken sektionar det mest troligt att hon tillhor?

SektionFEMVKDWI

P(Sek | kvinna)

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 23/29

Page 8: Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨ ardighetstest (2 i LP2, 1 i LP3).¨ I 4 Godk anda dator¨ ovningar (2 i LP1, 2 i LP2).¨

Intro Info Kursplan Sannolikhetsteori Beroende Bayes Oberoende Flera handelser

Data fran LTHs antagningssystem

Sektion P(kvinna | Sek) StudenterF 24.3 181E 38.2 123M 30.5 158V 42.6 155K 58.0 112D 23.7 156W 64.4 59I 36.0 100tot 1044

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 24/29

Intro Info Kursplan Sannolikhetsteori Beroende Bayes Oberoende Flera handelser

Lagen om total sannolikhet

Sektion P(kvinna | Sek) P(Sek)F 24.3 17.3E 38.2 11.8M 30.5 15.1V 42.6 14.8K 58.0 10.7D 23.7 14.9W 64.4 5.7I 36.0 9.6tot 36.5

P(kvinna) =∑

i

P(kvinna | Seki) · P(Seki)

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 25/29

Intro Info Kursplan Sannolikhetsteori Beroende Bayes Oberoende Flera handelser

Sektion P(♀ | Sek) P(Sek) P(Sek | ♀) P(Sek | ♂)

F 24.3 17.3 11.5 20.7E 38.2 11.8 12.3 11.5M 30.5 15.1 12.6 16.6V 42.6 14.8 17.3 13.4K 58.0 10.7 17.0 7.1D 23.7 14.9 9.7 18.0W 64.4 5.7 10.0 3.2I 36.0 9.6 9.4 9.7tot 36.5

P(Sek | ♀) = P(♀ | Sek) · P(Sek)P(♀)

Klassificering — Exjobb:E. Persson (2018), Aspect-Based Opinion Mining fromSwedish Digital Book Reviews

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 26/29

Page 9: Matematisk statistik f or¨ D, I, P och Fysiker - Lu · 2018. 9. 4. · I 3 Godk anda f¨ ardighetstest (2 i LP2, 1 i LP3).¨ I 4 Godk anda dator¨ ovningar (2 i LP1, 2 i LP2).¨

Intro Info Kursplan Sannolikhetsteori Beroende Bayes Oberoende Flera handelser

Oberoende handelser (Kap. 2.7)

Handelserna A och B ar oberoende av varandra⇐⇒

P(A ∩ B) = P(A)P(B)

For oberoende handelser galler att P(A | B) = P(A).

Obs: Skilj mellan oberoende och oforenliga.

Kan tva oberoende handelser vara oforenliga?

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 27/29

Intro Info Kursplan Sannolikhetsteori Beroende Bayes Oberoende Flera handelser

Alla, ingen och nagon (Kap. 2.7)

Om vi har n st oberoende handelser A1, . . . ,An fas foljandesannolikheter for

Alla: P(A1 ∩ · · · ∩ An) =n∏

i=1

P(Ai)

Ingen: P(A∗1 ∩ · · · ∩ A∗

n) =n∏

i=1

(1− P(Ai))

Minst en: P(A1 ∪ · · · ∪ An) = 1−n∏

i=1

(1− P(Ai))

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 28/29

Intro Info Kursplan Sannolikhetsteori Beroende Bayes Oberoende Flera handelser

Exempel — Alla, ingen och nagon

Kasta 4 tarningar vad ar sannolikheten att fa:

1. Alla (4 stycken) 3:or?

2. Inga 5:or?

3. Minst ett udda (1:a, 3:a, 5:a) nummer?

Johan Lindstrom - [email protected] FMSF45/MASB03 F1 29/29