Μαθηματικά Mathematicscosal.auth.gr/iantonio/sites/default/files/Lessons2015/BS... ·...

Post on 22-Feb-2020

1 views 0 download

Transcript of Μαθηματικά Mathematicscosal.auth.gr/iantonio/sites/default/files/Lessons2015/BS... ·...

Μαθηματικά και Στατιστικη στην Βιολογια

ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ (1ο)

Mathematics and Statistics

in Biology

WINTER SEMESTER (1st)

Τμημα Βιολογιας Αριστοτελειο Πανεπιστημιο

Θεσσαλονικης

School of Biology Aristotle University of

Thessaloniki

7. Εκτιμήσεις Τιμων Δεικτων

Iωαννης Αντωνιου Χαραλαμπος Μπρατσας iantonio@math.auth.gr cbratsas@math.auth.gr Το παρόν εκπαιδευτικό υλικό υπόκειται σε Αδεια Χρήσης Creative Commons

• Τι σημαινει Εκτιμηση της Τιμης ενός Δεικτη • Κριτηρια Αξιολογησης Σημειακων Εκτιμητριων • Εκτιμηση Διαστηματων

Σκοπος - Περιεχομενο

Εκτιμηση της Τιμης Δεικτη - Παραμετρου Η Εκτιμηση της Παραμετρου θ από το Δειγμα διδεται από: • Μια τιμη 𝜃� η οποια επιδιωκουμε να είναι κατά το δυνατον

«εγγυτερα» στην «αληθη» τιμη θ Εκτιμηση Σημειων = Point Estimation ειτε από: • Ένα διαστημα στο οποιο ανηκει η θ “με μεγαλη πιθανοτητα” Εκτιμηση Διαστηματων = Interval Estimation Εκτιμητρια (Estimator): 𝓓: ενας Τυπος-Aλγοριθμος Υπολογισμου των Εκτιμησεων

𝜃� = 𝓓(Data) Kαθε Εκτιμητρια είναι ενας Κανονας Ληψης Αποφασεων, μια Στρατηγικη Παιγνιου

Kριτηρια Αξιολογησης Σημειακων Εκτιμητριων • Μεροληψια Ελαχιστη = Μinimal Bias • Επαρκεια = Sufficiency • Αποτελεσματικοτης = Efficiency • Συνεπεια = Consistency • Ασυμπτωτικη Αποτελεσματικοτης = Asymptotic Efficiency • Ασυμπτωτικη Κανονικοτης = Asymptotic Normality

Μεροληψια Ελαχιστη = Μinimal Bias Mεροληψια της Εκτιμητριας 𝓓 = Βias(𝓓) = Ε[𝓓(Data)] − θ Αμερόληπτη Εκτιμητρια (Συναρτηση) ⟺ 𝑩𝑩𝑩𝑩 𝓓 = Ε[𝓓(Data)] − θ = 𝟎 H Μεσn τιμή της Εκτιμητριας 𝓓 ισουται μέ τήν τιμη της παραμετρου θ για ολες τις τιμες της Παραμετρου θ Παραδειγμα (1) Η Τυπική Απόκλιση δειγματος

𝜎� = 𝜎�2 = (𝜉1−𝑚� )2+⋯+(𝜉𝛮−𝑚� )2

𝛮

δεν είναι Αμεροληπτη Εκτιμητρια της Τυπικης Αποκλισης του Πληθυσμου (2) Η διoρθωση Bessel 1830: (N – 1) αντι N, Διδει την Αμεροληπτη Εκτιμητρια της Τυπικης Αποκλισης του Πληθυσμου

s = (𝜉1−𝑚� )2+⋯+(𝜉𝛮−𝑚� )2

𝛮−1

𝑚� = η Μεση Τιμη του Δειγματος Αποδειξη Ασκηση {Βαθμος 0,2+0,2=0,4}

Επαρκεια = Sufficiency, Fisher Eπιπλεον πληροφορια από την εκτιμηση

𝜽� = 𝓓(Data) δεν βελτιωνει την εκτιμηση της θ

Αποτελεσματικοτης = Efficiency ⟺ Διασπορα Ελαχιστη = Μinimal Dispersion Ε[(𝜽� – θ)2] minimal Ποια η Ελαχιστη τιμη της Διασπορας? Θεωρημα. Ανισοτητα Cramer – Rao H διασπορα της Αμεροληπτης Εκτιμητριας (Χ1,…, ΧΝ) είναι: Ε[(𝜃� – θ)2] ≥ 1

𝒮𝐹𝐹𝐹𝐹𝐹𝐹

𝒮𝐹𝐹𝐹𝐹𝐹𝐹= 𝓢FΙSHER (θ) = ∫dx ρ(x;θ) 𝜕𝜕𝜕𝑙𝑙𝑙(𝑥;𝜃)

2η Πληροφορια Fisher

Η Αμεροληπτη Εκτιμητρια 𝜃� = 𝒟(Data) είναι Αποτελεσματικη ⟺ Ε[(𝜃� – θ)2] = 1

𝒮𝐹𝐹𝐹𝐹𝐹𝐹

Ασυμπτωτικη Αποτελεσματικοτης = Efficiency ⟺ Διασπορα Ελαχιστη = Μinimal Dispersion O Αμεροληπτoς Εκτιμητης 𝜽� = 𝓓(Data) είναι Ασυμπτωτικα Αποτελεσματικος

⟺ 𝑙𝑙𝑚𝛭⟶+∞

𝛦[(𝒟(Data οf size M)– 𝜃)2] = 0

Συνεπεια = Consistency Συγκλιση (Convergence) προς την Αληθη τιμη:

𝒍𝑩𝒍𝜧⟶+∞

𝓓(Data οf size M) = 𝜽

Ασυμπτωτικα Κανονικη Εκτιμήτρια ⟺ Η Ασυμπτωτική Κατανομή της 𝚳 (𝓓(Data οf size M) = − θ) είναι η Κανονική Κατανομή με Μεση Τιμη 0

• Μεθοδος Ροπων, Pearson • Μεθοδος μεγίστης Πιθανοφανειας (maximum

Likelihood) • Μεθοδος Ελαχίστων Τετραγώνωv Gauss

Μεθοδοι Κατασκευης Σημειακων Εκτιμητριων

Μεθοδος Ροπων, Pearson Oι Ροπες του δειγματος ξ1, ξ2,…, ξΜ 𝓶�𝒓(ξ1, ξ2,…, ξΜ) = (𝝃𝟏)𝒓+⋯+(𝝃𝚳)𝒓

𝚳= 𝓶�𝒓 ως Εκτιμητριες

1) H Eπιλυση των Εξισωσεων

𝓂�1 = 𝑔1(�̂�1, �̂�2, … , �̂�𝑛) 𝓂�2 = 𝑔1(�̂�1, �̂�2, … , �̂�𝑛)

⋮ 𝓂�𝑛 = 𝑔1(�̂�1, �̂�2, … , �̂�𝑛)

Είναι σχετικα ευκολη 2) οι Εκτιμητριες 𝜽�𝟏,𝜽�𝟐, … ,𝜽�𝒏 ως συναρτησεις των 𝓶�𝟏, 𝓶�𝟐 , … ,𝓶�𝒏 είναι Συνεπεις Εκαστη Εκτιμητρια 𝜽�𝟏,𝜽�𝟐, … ,𝜽�𝒏 εκφραζεται ως συνεχης συναρτησις των 𝓶�𝟏, 𝓶�𝟐 , … ,𝓶�𝒏 3) Ο Fisher εδειξε ότι οι Εκτιμητριες 𝜽�𝟏,𝜽�𝟐, … ,𝜽�𝒏 δεν είναι Αποτελεσματικες (Efficient) Ενώ οι οι Εκτιμητριες Μεγιστης Πιθανοφανειας είναι Αποτελεσματικες (Efficient)

Μεθοδος μεγίστης Πιθανοφανειας (maximum Likelihood) H Εκτιμηση �̂� της παραμετρου θ του Πληθυσμου από το Δειγμα Καθιστα Mεγιστη την Πιθανοφανεια L L(ξ ,θ) = ρξ1

(θ)… ρξΜ(θ)

ρξν(θ), Ν=12,2,…,Μ oι κατανομες του Δειγματος

Μεθοδος Ελαχίστων Τετραγώνωv Gauss 1809 H Εκτιμηση 𝜃� της παραμετρου θ του Πληθυσμου από το Δειγμα Καθιστα Eλαχιστο το αθροισμα των τετραγωνικων σφαλματων (ψ1− g(ξ1,θ))2 + …+ (ψΜ− g(ξΜ,θ))2

Παλινδρομιση

Εκτιμηση Διαστηματων = Ιnterval Estimation Oρισμος Διαστημα Εμπιστοσυνης βαθμου c για την Εκτιμηση της παραμετρου θ από το Δειγμα Καλειται κάθε διαστημα (Α,Β): 𝑃[Α < 𝜃 < Β] = 𝑐 Tα ακρα Α, Β του Διαστηματος ειναι Mεταβλητες που εξαρτωνται από το Δειγμα Α=Α(ξ1, ξ2,…, ξΜ) Β=Β(ξ1, ξ2,…, ξΜ) O βαθμος Eμπιστοσυνης c του διαστηματος (Α,Β) (Confidence Level) Πρεπει να είναι κοντα στο 1 για να είναι αξιοπιστη η Εκτιμηση Neyman J. 1937, Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability, Philosophical Transactions of the Royal Society of London A236, 333–380

Δειγμα από ενα Πληθυσμο Διαστημα Εμπιστοσυνης για την Εκτιμηση • Mεσης Τιμης m • Διασπορας 𝜎2 • Αναλογιας p μελων Πληθυσμου που εχουν επιθυμητη Ιδιοτητα

Δειγμα από 2 Πληθυσμους Διαστημα Εμπιστοσυνης για την Εκτιμηση • Διαφορας των Mεσων Τιμων mΧ − mΥ

• Λογου 𝝈𝜲𝟐

𝝈𝜰𝟐 των Διασπορων 𝝈𝜲𝟐 , 𝝈𝜰𝟐

• Διαφορας pX − pY των Aναλογιων pX , pY των μελων που εχουν επιθυμητες Ιδιοτητες

Tα προβληματα αναγονται στα ποσοστημορια των Κατανομων • Tυποποιημενη Κανονικη (μ=0, σ=1) • X2 (chi square) • Student – t • F (Fisher)

Διαστημα Εμπιστοσυνης για την Εκτιμηση της Mεσης Τιμης Δειγμα από Πληθυσμο με Κανονικη Κατανομη αγνωστη Μεση Τιμη m και γνωστη διασπορα σ2

ρ(x) = 𝟏𝟐𝟐𝝈

𝒆− (𝒙−𝒍)𝟐

𝟐𝝈𝟐 , x ∈ ℝ

E[X]=m v[X]=σ2

Λημμα 1 Εστω ξ1, ..., ξM τυχαιο δειγμα από Πληθυσμο με κανονικη κατανομη με μεσο m και διασπορα σ2 Η δειγματικη Μεση Τιμη 𝒍� = 𝝃𝟏+⋯+𝝃𝑴

𝑴

ακολουθει την κανονικη κατανομη

με Μεση Τιμη m και διασπορα 𝝈𝟐

𝑴

Λημμα 2 Η Μεταβλητη z = 𝒙−𝒍

𝝈 𝑴

Ακολουθει την τυποποιημενη κανονικη κατανομη

ρ(z) = 𝟏𝟐𝟐

𝒆− 𝒛𝟐

𝟐 , x ∈ ℝ E[X]=0 v[X]=1

Λημμα 3 P[−𝒛𝛂/𝟐 < z < 𝒛𝛂/𝟐] = 1− α 𝒛𝛂/𝟐 το ανω ποσοστημοριο της τυποποιημενης κανονικης Κατανομης

Από την σχεση των ποσοστημοριων προκυπτει το Διαστημα Εμπιστοσυνης

P −𝒛𝛂/𝟐< 𝒍�−𝒍𝝈 𝑴

< 𝒛𝛂/𝟐 =1− a

Θεωρημα

P 𝒍� − 𝒛𝛂/𝟐𝝈𝑴

< 𝒍 < 𝒍� + 𝒛𝛂/𝟐𝝈𝑴

= 1−α Oπου: Α = 𝒍� − 𝒛𝛂/𝟐

𝝈𝑴

Β = 𝒍� + 𝒛𝛂/𝟐𝝈𝑴

oι εκτιμησεις των ακρων του διαστηματος από το Δειγμα Το Ευρος του διαστηματος Εμπιστοσυνης: |Β−Α| = 2 𝒛𝛂/𝟐

𝝈𝑴

Είναι εκτιμηση της ακριβειας εκτιμησης |𝒍� −𝒍| ≤ 𝒛𝛂/𝟐

𝝈𝑴

με εμπιστοσυνη c = (1− α)%

Παραδειγμα c=0.95 α = 1−c = 0.05 𝑧𝛼/2= 𝑧0.025= 1.96 Α = 𝑚� − 1,96 𝜎

𝑀

Β = 𝑚� +1,96 𝜎𝑀

Ευρος |Α−Β|= 3,92 𝜎

𝑀

c=0.99 α = 1−c = 0.01 𝑧𝛼/2= 𝑧0.005= 2.58 Α = 𝑚� − 2.58 𝜎

𝑀

Β = 𝑚� +2.58 𝜎𝑀

Ευρος |Α−Β|= 5,16 𝜎

𝑀

Αυξηση Εμπιστοσυνης από 95% σε 99% (κατά 4.4%) Αυξανει το Διαστημα Εμπιστοσυνης από 3,92 σε 5,16 (κατά 31.63%)

Ποσες μετρησεις Κ περαν (από τις Ν) πρεπει να παρω για εχω Διαστημα Εμπιστοσυνης του αυτου Ευρους 3,92 𝝈

𝑴

με βαθμο Εμπιστοσυνης 99%? Αρκει: 𝟓,𝟏𝟏 𝝈

𝑴+𝜥= 𝟑,𝟗𝟐 𝝈

𝑴

⟺𝟓,𝟏𝟏𝟑,𝟗𝟐

= 𝑴+𝜥𝑴

⟺ 𝟓,𝟏𝟏𝟑,𝟗𝟐

𝟐 = 𝑴+𝜥

𝑴

⟺𝚱 = 𝐌 𝟓,𝟏𝟏𝟑,𝟗𝟐

𝟐− 𝟏

Δηλαδη: 𝜥𝑴

= 𝟓,𝟏𝟏𝟑,𝟗𝟐

𝟐− 𝟏 % ≅ 0.73

73% αυξηση των μετρησεων Για αυξηση Εμπιστοσυνης κατά 4.4% στο αυτό Διαστημα Εμπιστοσυνης

Aγνωστη Μεση Τιμη μ και αγνωστη διασπορα σ2 Δειγμα “Μεγαλο” N≥30 Θεωρημα P 𝒍� − 𝒛𝛂/𝟐

𝑩𝑴

< m < 𝒍� +𝒛𝛂/𝟐𝑩𝑴

≈1−α

s = (𝝃𝟏−𝒍� )𝟐+ ⋯+(𝝃𝑴−𝒍� )𝟐

𝑴−𝟏

η Αμεροληπτη Τυπικη Αποκλιση του δειγματος Για μεγαλα δειγματα: σ≈s

Κεντρικο Οριακο Θεωρημα Η κατανομη της Μεσης Τιμης Χ1+Χ2+⋯+ΧΝ

Ν

Ανεξαρτητων Μεταβλητων Χ1 ,Χ2 ,…,ΧΝ προσεγγιζει την Κανονικη, Καθως αυξανει ο αριθμος Ν των Μεταβλητων

Aγνωστη Μεση Τιμη μ και αγνωστη διασπορα σ2 Λημμα Εστω ξ1, ..., ξΜ τυχαιο δειγμα από Πληθυσμο με κανονικη κατανομη με μεσο m και διασπορα σ2 Η μεταβλητη 𝛵 = 𝒍�−𝒍

𝑩 𝑴

ακολουθει την κατανομη Student-t βαθμου ν= Ν − 1

𝑠 = (𝝃𝟏−𝒍� )𝟐+ ⋯+(𝝃𝑴−𝒍� )𝟐

𝑴−𝟏 η Αμεροληπτη Τυπικη Αποκλιση του

δειγματος

𝑙𝜈(t) =𝟏𝝂𝟐

𝜞 𝝂 + 𝟏𝟐

𝜞 𝝂𝟐

𝟏 +𝒕𝟐

𝝂

− 𝝂+𝟏𝟐, 𝑡 ∈ ℝ

Γ(z) η συναρτηση Γ Η κατανομη 𝑙𝜈(t) δεν εξαρταται από τις παραμετρους m και σ

Λημμα 2 P[−𝒕𝛂/𝟐

𝑴−𝟏 < t < 𝒕𝛂/𝟐𝑴−𝟏 ] = 1− α

t= η τιμη της μεταβλητης Τ = 𝒍�−𝒍𝑩 𝑴

𝒕𝛂/𝟐𝑴−𝟏 το ανω ποσοστιαιο σημειο

Από την σχεση των ποσοστημοριων προκυπτει το Διαστημα Εμπιστοσυνης

P[−𝒕𝛂/𝟐𝑴−𝟏 < 𝒍�−𝒍

𝑩 𝑴 < 𝒕𝛂/𝟐

𝑴−𝟏 ] = 1− α

𝑃 𝒍� − 𝒕𝛂/𝟐𝑴−𝟏 𝑩

𝑴< 𝒍 < 𝒍� + 𝒕𝛂/𝟐

𝑵−𝟏 𝑩𝑴

= 1 − 𝛼

Διαστημα Εμπιστοσυνης για την Διασπορα Πληθυσμου με Κανονικη Κατανομη Λημμα 1 Εστω ξ1, ..., ξM τυχαιο δειγμα από Πληθυσμο με κανονικη κατανομη με μεσο μ και διασπορα σ2

Η μεταβλητη Χ2= (𝑴−𝟏)𝑩𝟐

𝝈𝟐

ακολουθει την κατανομη Xι – τετραγωνο βαθμου 𝜈 = 𝑀 − 1

𝑩𝟐 = (𝝃𝟏−𝒍� )𝟐+ ⋯+(𝝃𝑴−𝒍� )𝟐

𝑴−𝟏

η αμεροληπτη διασπορα του Δειγματος

ρν(x) = 𝟏𝟐

𝝂𝟐 𝟏𝜞 𝝂

𝟐 𝒙

𝝂𝟐 − 𝟏𝒆−

𝝂𝟐 , x≥0

Γ(z) η συναρτηση Γ Η κατανομη ρν(x) δεν εξαρταται από τις παραμετρους μ και σ

Λημμα 2

P 𝝌𝟐 𝟏−𝛂/𝟐𝑴−𝟏 < 𝐱𝟐 < 𝝌𝟐 𝛂/𝟐

𝑴−𝟏 = 1− a

x2 = η τιμη της μεταβλητης Χ2= (𝑴−𝟏)𝑩𝟐

𝝈𝟐

𝝌𝟐 𝛂/𝟐𝑴−𝟏

το ανω ποσοστημοριο

𝝌𝟐 𝟏−𝛂/𝟐𝑴−𝟏 το κατω ποσοστημοριο

Από τα ποσοστιαια σημεια προκυπτει το Διαστημα Εμπιστοσυνης

P 𝝌𝟐 𝟏−𝛂/𝟐𝑴−𝟏 < (𝑴−𝟏)𝑩𝟐

𝝈𝟐 < 𝝌𝟐 𝛂/𝟐

𝑴−𝟏= 1− α

P (𝑴−𝟏)𝑩𝟐

𝝌𝟐 𝟏−𝛂/𝟐𝑴−𝟏 < 𝝈𝟐 < (𝑴−𝟏)𝑩𝟐

𝝌𝟐 𝛂/𝟐𝑴−𝟏 = 1−α

P (𝑴−𝟏)𝑩𝟐

𝝌𝟐 𝟏−𝛂/𝟐𝑴−𝟏 < 𝛔 < (𝑴−𝟏)𝑩𝟐

𝝌𝟐 𝛂/𝟐𝑴−𝟏 = 1− α

Διαστημα Εμπιστοσυνης για την Αναλογια p μελων Πληθυσμου που εχουν την επιθυμητη Ιδιοτητα Q Δειγμα από Πληθυσμο μεγαλο (Ν>30) Λημμα

1) η δειγματικη αναλογια 𝒑� = 𝑴𝑸𝑴

είναι Αμεροληπτη Εκτιμητρια: E[𝒑�]=p με διασπορα σ2 = 𝒑(𝟏−𝒑)

𝑴

2) για μεγαλο Ν η Μεταβλητη z = 𝒙−𝒍𝝈 𝑴

= 𝒑�−𝒑𝒑(𝟏−𝒑)

𝑴

είναι Τυποποιημενη Κανονικη

Κεντρικο Οριακο Θεωρημα H εκτιμηση αναγεται στην Εκτιμηση Διαστηματων Εμπιστοσυνης για την Εκτιμηση της Mεσης Τιμης

𝑃 𝒍� − 𝒛𝑩/𝟐𝝈𝑴

< 𝑝 < 𝒍� + 𝒛𝑩/𝟐𝝈𝑴

= 1 − 𝛼

m= p 𝒍� = 𝒑�

𝝈𝑴

= 𝒑�(𝟏−𝒑�)𝑴

Διαστημα Εμπιστοσυνης για την Διαφορα των Mεσων Τιμων 2 Ανεξαρτητων Πληθυσμων με Κανονικες Κατανομες Λαμβανονται 2 ανεξαρτητα Δειγματα (Χ1, ..., XΝ ) = (ξ1, ..., ξΝ ), (Υ1, ..., ΥΜ)= (η1, ..., ηΜ) Από 2 διαφορετικες Κανονικες κατανομες (mΧ , σΧ) , (mΥ , σΥ ) 𝒍�𝑿 , 𝒍�𝒀 oι δειγματικοι Μεσοι Οροι Λημμα η διαφορα 𝒍� = 𝒍�𝑿 −𝒍� 𝒀 ακολουθει Κανονικη Κατανομη

με παραμετρους μ=μΧ −μΥ , σ= 𝝈𝜲𝟐

𝜨+ 𝝈𝜰

𝟐

𝜧

H εκτιμηση αναγεται στην Εκτιμηση Διαστηματων Εμπιστοσυνης για την Εκτιμηση της Mεσης Τιμης

Διαστημα Εμπιστοσυνης για την Διαφορα των Mεσων Τιμων 2 Ανεξαρτητων Πληθυσμων με Κανονικες Κατανομες Για γνωστες διασπορες 𝝈𝜲𝟐 , 𝝈𝜰𝟐

𝑃 𝒍� − 𝒛𝛂/𝟐𝝈𝜨

< 𝑚 < 𝒍� + 𝒛𝛂/𝟐𝝈𝜨

= 1 − 𝛼

m = 𝒍

𝚾−𝒍

𝚼

𝝈𝜨

= 𝝈𝜲𝟐

𝜨+ 𝝈𝜰

𝟐

𝜧

P 𝒍�𝑿 −𝒍� 𝒀 − 𝒛𝑩/𝟐𝝈𝜲𝟐

𝜨+ 𝝈𝜰

𝟐

𝜧 < 𝒍

𝚾−𝒍

𝚼< 𝒍�𝑿 −𝒍� 𝒀 + 𝒛𝑩/𝟐

𝝈𝜲𝟐

𝜨+ 𝝈𝜰

𝟐

𝜧 = 1−α

Διαστημα Εμπιστοσυνης για την Διαφορα των Mεσων Τιμων 2 Ανεξαρτητων Πληθυσμων με Κανονικες Κατανομες Για αγνωστες διασπορες 𝝈𝜲𝟐 , 𝝈𝜰𝟐 , μεγαλα δειγματα Ν,Μ≥ 30

P 𝒍� − 𝒛𝛂/𝟐𝑩𝑵

< 𝒍 < 𝒍� + 𝒛𝛂/𝟐𝑩𝑵

≈1−α

P 𝒍�𝑿 −𝒍� 𝒀 − 𝒛𝑩/𝟐𝑩𝜲𝟐

𝜨+ 𝑩𝜰

𝟐

𝜧 < 𝛍

𝚾− 𝛍

𝚼 < 𝒍�𝑿 −𝒍� 𝒀 + 𝒛𝑩/𝟐

𝑩𝜲𝟐

𝜨+ 𝑩𝜰

𝟐

𝜧 = 1−α

Διαστημα Εμπιστοσυνης για την Διαφορα των Mεσων Τιμων 2 Ανεξαρτητων Πληθυσμων με Κανονικες Κατανομες Για αγνωστες διασπορες 𝝈𝜲𝟐 = 𝝈𝜰𝟐

P 𝒍� − 𝒕𝜶/𝟐𝝂 𝑩

𝑵< 𝛍 < 𝒍� + 𝒕𝜶/𝟐

𝝂 𝑩𝑵

= 1− α 𝒍� = 𝒍�𝑿 −𝒍� 𝒀 μ=μΧ −μΥ

𝑩𝑵

= 𝟏𝑵

+ 𝟏𝑴

𝑵−𝟏 𝑩𝑿𝟐+ 𝑴−𝟏 𝑩𝒀

𝟐

𝑵+𝑴−𝟐

ν=Ν+Μ−2

Διαστημα Εμπιστοσυνης για την Διαφορα των Mεσων Τιμων 2 Ανεξαρτητων Πληθυσμων με Κανονικες Κατανομες Για αγνωστες διασπορες 𝝈𝜲𝟐 ≠ 𝝈𝜰𝟐 και Ν=Μ

P 𝒍� − 𝒕𝜶/𝟐𝝂 𝑩𝑿

𝟐

𝝂+ 𝑩𝒀

𝟐

𝝂< 𝒍 < 𝒍� + 𝒕𝜶/𝟐

𝝂 𝑩𝑿𝟐

𝝂+ 𝑩𝒀

𝟐

𝝂 = 1− α

𝒍� = 𝒍�𝑿 −𝒍� 𝒀 m=mΧ −mΥ 𝑩𝑵

= 𝑩𝑿𝟐

𝝂+ 𝑩𝒀

𝟐

𝝂

ν=2(Ν −1)

Διαστημα Εμπιστοσυνης για την Διαφορα των Mεσων Τιμων 2 Ανεξαρτητων Πληθυσμων με Κανονικες Κατανομες Για αγνωστες διασπορες 𝝈𝜲𝟐 ≠ 𝝈𝜰𝟐 και Ν≠Μ

P 𝒍� − 𝒕𝜶/𝟐𝝂 𝑩

𝑵< 𝒍 < 𝒍� + 𝒕𝜶/𝟐

𝝂 𝑩𝑵

= 1− α 𝒍� = 𝒍�𝑿 −𝒍� 𝒀 m=mΧ −mΥ 𝑩𝑵

= 𝑩𝑿𝟐

𝝂+ 𝑩𝒀

𝟐

𝝂

ν= 𝑩𝑿𝟐

𝑵 +𝑩𝒀𝟐

𝑴

𝟐

𝑩𝑿𝟐

𝑵𝜨−𝟏+

𝑩𝒀𝟐

𝑴𝜧−𝟏

Διαστημα Εμπιστοσυνης για την Διαφορα των Mεσων Τιμων 2 Αλληλοεξαρτωμενων Πληθυσμων με Κανονικες Κατανομες

Λαμβανονται 2 αλληλοεξαρτωμενα Δειγματα (X1, ..., XΝ ) , (Υ1, ..., ΥΜ) Από 2 διαφορετικες Κανονικες κατανομες (mΧ , σΧ), (mΥ , σΥ ) 𝒍�𝑿 , 𝒍�𝒀 oι δειγματικοι Μεσοι Οροι

Διαστημα Εμπιστοσυνης για την Διαφορα των Mεσων Τιμων 2 Αλληλοεξαρτωμενων Πληθυσμων με Κανονικες Κατανομες Λημμα οι διαφορες Ζ1= X1−Υ1 , Ζ2= X2−Υ2 , …, ΖΝ= XΝ−ΥΝ είναι ανεξαρτητες H εκτιμηση αναγεται στην Εκτιμηση Διαστηματων Εμπιστοσυνης για την Mεση Τιμη Δειγματος από κανονικη Κατανομη αγνωστης Μεσης Τιμης m και αγνωστης διασπορας σ2

P 𝒍� − 𝒕𝛂/𝟐𝑵−𝟏 𝑩

𝑵< 𝒍 < 𝒍� + 𝒕𝛂/𝟐

𝑵−𝟏 𝑩𝑵

= 1− a οπου 𝒍� = 𝜻𝟏+⋯+𝜻𝜨

𝜨

𝜻𝟏, … , 𝜻𝜨 δειγμα μετρησης των μεταβλητων Ζ1= X1−Υ1 , Ζ2= X2−Υ2 , …, ΖΝ = XΝ−ΥΝ

s = (𝜻𝟏−𝒍� )𝟐+⋯+(𝜻𝜨−𝒍� )𝟐

𝜨−𝟏= (𝜻𝟏)𝟐+ ⋯+ 𝜻𝜨 𝟐−𝜨𝒍� 𝟐

𝜨−𝟏

η Αμεροληπτη Τυπικη Αποκλιση

Διαστημα Εμπιστοσυνης για την Διαφορα των Mεσων Τιμων 2 Αλληλοεξαρτωμενων Πληθυσμων με Κανονικες Κατανομες

Λημμα (𝜻𝟏 −𝒍� )𝟐+⋯+ (𝜻𝜨 −𝒍� )𝟐= (𝜻𝟏)𝟐+⋯+ 𝜻𝜨 𝟐 − 𝜨𝒍� 𝟐 Αποδ (𝜻𝟏 −𝒍� )𝟐+⋯+ (𝜻𝜨 −𝒍� )𝟐 = (𝜻𝟏)𝟐+⋯+ (𝜻𝜨)𝟐+ Ν(𝒍� )𝟐−𝟐(𝜻𝟏 + ⋯+ 𝜻𝜨)𝒍� =(𝜻𝟏)𝟐+⋯+ (𝜻𝜨)𝟐 + Ν(𝒍� )𝟐−𝟐 𝜨𝒍� 𝒍� = =(𝜻𝟏)𝟐+⋯+ (𝜻𝜨)𝟐 − 𝜨𝒍� 𝟐

Διαστημα Εμπιστοσυνης για τον Λογο 𝝈𝜲𝟐

𝝈𝜰𝟐 των Διασπορων 𝝈𝜲𝟐 , 𝝈𝜰𝟐

2 Ανεξαρτητων Πληθυσμων με Κανονικες Κατανομες

Λημμα

Η Μεταβλητη 𝑩𝜲𝟐

𝑩𝜰𝟐𝝈𝒀𝟐

𝝈𝑿𝟐 των Διασπορων 𝝈𝜲𝟐 , 𝝈𝜰𝟐

2 Ανεξαρτητων Πληθυσμων με Κανονικες Κατανομες Ακολουθει Κατανομη F (Fisher) με βαθμους ν1= Ν − 1 , ν2 = Ν − 1

𝝆𝝂𝟏𝝂𝟐(x) = 𝝂𝟏𝝂𝟐

𝝂𝟏𝟐 𝜞 𝝂𝟏+𝝂𝟐

𝟐

𝜞 𝝂𝟏𝟐 𝜞 𝝂𝟐

𝟐 𝒙

𝝂𝟏−𝟐𝟐

𝟏+𝝂𝟏𝝂𝟐𝒙

𝝂𝟏+𝝂𝟐𝟐

, x≥0

Γ(z) η συναρτηση Γ Η κατανομη 𝝆𝝂𝟏𝝂𝟐 δεν εξαρταται από τις παραμετρους μΧ , μΥ και σΧ , σΧ

Διαστημα Εμπιστοσυνης για τον Λογο 𝝈𝜲𝟐

𝝈𝜰𝟐 των Διασπορων 𝝈𝜲𝟐 , 𝝈𝜰𝟐

2 Ανεξαρτητων Πληθυσμων με Κανονικες Κατανομες Λημμα 2

P 𝑭𝟏−𝛂/𝟐(𝑵−𝟏)(𝑴−𝟏) < 𝐱 < 𝑭𝛂/𝟐

(𝑵−𝟏)(𝑴−𝟏) = 1− α

x2 = η τιμη της μεταβλητης 𝑩𝜲𝟐

𝑩𝜰𝟐𝝈𝒀𝟐

𝝈𝑿𝟐

𝑭𝛂/𝟐(𝑵−𝟏)(𝑴−𝟏) το ανω ποσοστημοριο

Από την σχεση των ποσοστιαιων σημειων προκυπτει το Διαστημα Εμπιστοσυνης

𝑃 𝑭𝟏−𝛂/𝟐(𝑵−𝟏)(𝑴−𝟏) <

𝑩𝜲𝟐

𝑩𝜰𝟐𝝈𝒀𝟐

𝝈𝑿𝟐 < 𝑭𝛂/𝟐

(𝑵−𝟏)(𝑴−𝟏) = 1 − 𝛼

𝛲𝑩𝒀𝟐

𝑩𝑿𝟐𝑭𝟏−𝛂/𝟐

(𝑵−𝟏)(𝑴−𝟏) <𝝈𝒀𝟐

𝝈𝑿𝟐 <

𝑩𝒀𝟐

𝑩𝑿𝟐 𝑭𝛂/𝟐

(𝑵−𝟏)(𝑴−𝟏) = 1 − 𝛼

Διαστημα Εμπιστοσυνης για την Διαφορα pX − pY των Aναλογιων pX , pY των μελων 2 Ανεξαρτητων Πληθυσμων που εχουν επιθυμητες Ιδιοτητες Δειγματα από Πληθυσμο μεγαλο (Ν, Μ >30)

Κεντρικο Οριακο Θεωρημα H εκτιμηση αναγεται στην Εκτιμηση Διαστηματων Εμπιστοσυνης για την Εκτιμηση της Mεσης Τιμης

P 𝒑�𝑿 − 𝒑�𝒀 − 𝒛𝛂/𝟐𝝈𝜨

< 𝒑𝚾− 𝐩

𝚼< 𝒑�𝑿 − 𝒑�𝒀 + 𝒛𝛂/𝟐

𝝈𝜨

= 1−α

𝝈𝜨

= 𝒑�𝑿(𝟏 − 𝒑�𝑿)

𝜨+𝒑�𝒀(𝟏 − 𝒑�𝒀)

𝑴