Κεφάλαιο 13 -Γ

48
13.1 Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc. Κεφάλαιο 13-Γ Συμπερασματολογία για την Σύγκριση Δύο Πληθυσμών

description

Κεφάλαιο 13 -Γ. Συμπερασματολογία για την Σύγκριση Δύο Πληθυσμών. Σύγκριση Δύο Πληθυσμών …. Προηγμένως είδαμε τεχνικές για να εκτιμήσουμε και να ελέγξουμε παραμέτρους για έναν πληθυσμό: Μέση τιμή του Πληθυσμού μ , και Διακύμανση του Πληθυσμού σ 2 , και Αναλογία του Πληθυσμού ρ - PowerPoint PPT Presentation

Transcript of Κεφάλαιο 13 -Γ

Page 1: Κεφάλαιο  13 -Γ

13.1Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Κεφάλαιο 13-Γ

Συμπερασματολογία για την Σύγκριση Δύο Πληθυσμών

Page 2: Κεφάλαιο  13 -Γ

13.2Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Σύγκριση Δύο Πληθυσμών …

Προηγμένως είδαμε τεχνικές για να εκτιμήσουμε και να ελέγξουμε παραμέτρους για έναν πληθυσμό:

Μέση τιμή του Πληθυσμού μ, και Διακύμανση του Πληθυσμού σ2, και Αναλογία του Πληθυσμού ρ

Θα μελετήσουμε αυτές τις παραμέτρους όταν εξετάζουμε δύο πληθυσμούς, ωστόσο το ενδιαφέρον μας εστιάζεται τώρα:

Η διαφορά μεταξύ δύο μέσων τιμών.

Η αναλογία δύο διακυμάνσεων.

Η διαφορά μεταξύ δύο αναλογιών.

Page 3: Κεφάλαιο  13 -Γ

13.3Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Σύγκριση Δύο Πληθυσμών …Για να ελέγξουμε και να εκτιμήσουμε την διαφορά ανάμεσα σε δύο μέσες τιμές του πληθυσμού, επιλέγουμε τυχαία δείγματα και από τους δύο τους πληθυσμούς. Αρχικά, θα θεωρήσουμε ανεξάρτητα δείγματα, δηλαδή, δείγματα τα οποία είναι πλήρως ασυσχέτιστα το ένα από το άλλο.

(Όμοια, θεωρούμε, για τον Πληθυσμό 2)

Χρησιμοποιούμε το στατιστικό στοιχείο

Δείγμα, μέγεθος: n1

Πληθυσμός 1

Παράμετροι:Στατιστικά

Στοιχεία:

1 2x x

Page 4: Κεφάλαιο  13 -Γ

13.4Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Δειγματοληπτική Κατανομή της

1. Είναι κανονικά κατανεμημένο εάν οι αρχικοί πληθυσμοί είναι κανονικοί –ή– προσεγγιστικά κανονικοί όταν οι πληθυσμοί είναι μη κανονικοί και τα μεγέθη των δειγμάτων είναι μεγάλα (n1, n2 > 30)

2. Η αναμενόμενη τιμή της είναι μ1-μ2

3. Η διακύμανση της είναι και το τυπικό σφάλμα είναι:

Το στατιστικό στοιχείο z ακολουθεί τυπική κανονική (ή προσεγγιστικά κανονική). Μπορούμε να το χρησιμοποιήσουμε για να κατασκευάσουμε στατιστικά στοιχεία ή διαστήματα εμπιστοσύνης για μ1-μ2 …

Page 5: Κεφάλαιο  13 -Γ

13.5Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Βγάζοντας Συμπεράσματα για μ1-μ2

…μόνο που, στην πράξη, το z στατιστικό στοιχείο σπάνια χρησιμοποιείται αφού οι διακυμάνσεις του πληθυσμού είναι άγνωστες.

Στην θέση του χρησιμοποιούμε το t-στατιστικό. Θεωρούμε δύο περιπτώσεις για τις άγνωστες διακυμάνσεις του πληθυσμού: όταν πιστεύουμε ότι είναι ίσες και αντίστροφα όταν είναι άνισες.

??

Page 6: Κεφάλαιο  13 -Γ

13.6Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Πότε οι Διακυμάνσεις είναι ίσες;

Πως ανακαλύπτουμε πότε οι διακυμάνσεις του πληθυσμού είναι ίσες;

Αφού οι διακυμάνσεις του πληθυσμού είναι άγνωστες, δεν είμαστε σίγουροι εάν είναι ίσοι, αλλά μπορούμε να εξετάσουμε τις δειγματοληπτικές διακυμάνσεις και ανεπίσημα να κρίνουμε τις σχετικές τιμές τους και να καθορίσουμε αν μπορούμε να υποθέσουμε ότι οι διακυμάνσεις του πληθυσμού είναι ίσες ή όχι;

Page 7: Κεφάλαιο  13 -Γ

13.7Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Τεστ Στατιστική για μ1-μ2 (ίσες διακυμάνσεις) 1) Υπολογίστε – την συγχωνευμένη εκτιμήτρια

διακύμανσης καθώς …

2) …και χρησιμοποιήστε την εδώ:

Βαθμοί ελευθερίας

Page 8: Κεφάλαιο  13 -Γ

13.8Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Εκτιμήτρια Δ.Ε. για μ1-μ2 (ίσες

διακυμάνσεις) Η εκτιμήτρια του διαστήματος εμπιστοσύνης για μ1-μ2 όταν

οι διακυμάνσεις του πληθυσμού είναι ίσες δίνεται από:

Βαθμοί ελευθερίαςΣυγχωνευμένη εκτιμήτρια διακύμανσης

Page 9: Κεφάλαιο  13 -Γ

13.9Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Τεστ Στατιστική για μ1-μ2 (άνισες διακυμάνσεις)

Η τεστ στατιστική για μ1-μ2 όταν οι διακυμάνσεις του πληθυσμού είναι άνισες δίνεται από:

Ομοίως, εκτιμήτρια του διαστήματος εμπιστοσύνης είναι:

Βαθμοί ελευθερίας

Page 10: Κεφάλαιο  13 -Γ

13.10Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Ποια περίπτωση να χρησιμοποιήσουμε; Ποια περίπτωση να χρησιμοποιήσουμε; Ίσες ή άνισες διακυμάνσεις;

Όταν δεν υπάρχει επαρκή μαρτυρία ότι οι διακυμάνσεις είναι άνισες, είναι προτιμότερο να εκτελούμε το

t-τεστ με ίσες διακυμάνσεις.

Προτιμάμε έτσι αφού για οποιαδήποτε δύο δοθέντα δείγματα:

Ο αριθμός των βαθμών ελευθερίας για την περίπτωση με άνισες διακυμάνσεις

Ο αριθμός των βαθμών ελευθερίας για την περίπτωση με ίσες διακυμάνσεις

Μεγάλοι αριθμοί βαθμών ελευθερίας έχουν την ίδια

επίδραση όπως έχουν και τα μεγέθη των μεγάλων

δειγμάτων

Page 11: Κεφάλαιο  13 -Γ

13.11Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…Οι άνθρωποι που τρώνε ισχυρά δημητριακά (corn flakes) για πρωινό καταναλώνουν, κατά μέσο όρο, λιγότερες θερμίδες στο γεύμα από αυτούς που δεν τρώνε ισχυρά δημητριακά για πρωινό;

Τι προσπαθούμε να δείξουμε; Ποια είναι η ερευνητική υπόθεση;

Η μέση τιμή θερμίδων αυτών που καταναλώνουν δημητριακά για πρωινό (μ1) είναι μικρότερη από την μέση τιμή αυτών που δεν καταναλώνουν δημητριακά για πρωινό (μ2), δηλαδή είναι

Έτσι, Η1: . Εκ τούτου η μηδενική υπόθεση είναι:

Η0:

ΑΝΑΓΝΩΡΙΣΤΕ

Page 12: Κεφάλαιο  13 -Γ

13.12Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…Ένα δείγμα από 150 ανθρώπων τυχαία επιλέχθηκε. Κάθε άτομο ταξινομείται ως καταναλωτής η μη- καταναλωτής ισχυρών δημητριακών για πρωινό. Για κάθε άτομο ο αριθμός των θερμίδων που καταναλώνεται για γεύμα καταγράφεται. Τα δεδομένα: Ανεξάρτητοι

ΠληθυσμοίΚάποιος τρώει ή δεν

τρώνε δημητριακά

n1+n2=150

Υπάρχει κάποιος λόγος γιανα πιστεύουμε ότι οι διακυμάνσεις των πληθυσμώνείναι άνισες…

Ανακαλέστε H1:

Πληθυσμός 1

Καταναλωτές δημητριακών

Πληθυσμός 2

Μη-Καταναλωτές δημητριακών

Μέγεθος Δείγματος

n1=43 n2=107

Δειγματοληπτική Μέση Τιμή

Δειγματοληπτική Διακύμανση

1 2

2 21 1

604.02 633.23

4.103 10.670

x x

s s

Page 13: Κεφάλαιο  13 -Γ

13.13Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…

Έτσι, το στατιστικό τεστ είναι:

Ο αριθμός των βαθμών ελευθεριών είναι:

΄Έτσι η περιοχή απόρριψης είναι …

ΥΠΟΛΟΓΙΣΤΕ

Page 14: Κεφάλαιο  13 -Γ

13.14Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…Η περιοχή απόρριψης είναι:

Το στατιστικό τεστ:

Αφού το στατιστικό τεστ (-2.09) είναι μικρότερο από την κριτική τιμή t (-1.658), απορρίπτουμε την H0 για την εύνοια της H1 — δηλαδή, υπάρχει επαρκή μαρτυρία για να υποστηρίξουμε το αίτημα ότι αυτοί που τρων δημητριακά για πρωινό καταναλώνουν λιγότερες θερμίδες στο γεύμα.

ΥΠΟΛΟΓΙΣΤΕ

Συγκρίνεται

Page 15: Κεφάλαιο  13 -Γ

13.15Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…

Για αυτό το τεστ μπορούμε να χρησιμοποιήσουμε Excel για να κάνουμε τους υπολογισμούς…

ΥΠΟΛΟΓΙΣΤΕ

Ανακαλέστε ότι H0:

Page 16: Κεφάλαιο  13 -Γ

13.16Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…

…ωστόσο, ακόμα απαιτείται να ερμηνεύσουμε τα αποτελέσματα:

ΕΡΜΗΝΕΥΣΤΕ

Συγκρίνεται…

Προσέξτε! Το Excel δίνει την κριτική τιμή της δεξιάς ουράς!δηλαδή 1.6573 και –1.6573 (της αριστερής ουράς) !!

…η κοιτάξτε την π-τιμή

Page 17: Κεφάλαιο  13 -Γ

13.17Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Διάστημα Εμπιστοσύνης…Υποθέστε ότι θέλουμε να υπολογίσουμε ένα 95% διάστημα εμπιστοσύνης για την διαφορά μεταξύ της μέσης τιμής θερμίδων για καταναλωτές και μη- καταναλωτές ισχυρών δημητριακών …

Δηλαδή, εκτιμούμε ότι αυτοί που δεν καταναλώνουν δημητριακά τρων μεταξύ 1.56 και 56.86 περισσότερες θερμίδες από αυτούς που καταναλώνουν δημητριακά για πρωινά.

Page 18: Κεφάλαιο  13 -Γ

13.18Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Διάστημα Εμπιστοσύνης…Εναλλακτικά, μπορούμε να χρησιμοποιήσουμε εκτιμήτριες σε φύλλο του EXCEL…

values in bold face are calculated for you…

Page 19: Κεφάλαιο  13 -Γ

13.19Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…

Δύο μέθοδοι ελέγχονται για καρέκλες γραφείου. Χρόνοι συναρμολόγησης καταγράφονται (25 φορές για κάθε μέθοδος). Με 5% επίπεδο σημαντικότητας, διαφέρουν οι χρόνοι συναρμολόγησης των δύο μεθόδων;

Δηλαδή, H1:

Άρα, η μηδενική υπόθεση γίνεται: H0:

Υπενθύμιση: αφού η μηδενική υπόθεση περιέχει «όχι ίσον», τότε είναι ένα δίπλευρο τεστ.

ΑΝΑΓΝΩΡΙΣΤΕ

Page 20: Κεφάλαιο  13 -Γ

13.20Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…Οι χρόνοι συναρμολόγησης για κάθε μία από τις δύο μεθόδους καταγράφόνται και αρχικά δεδομένα συλλέγονται …

Πληθυσμός 1

Καταναλωτές δημητριακών

Πληθυσμός 2

Μη-Καταναλωτές δημητριακών

Μέγεθος Δείγματος n1=25 n2=25

Δειγματοληπτική Μέση Τιμή

Δειγματοληπτική Διακύμανση

ΥΠΟΛΟΓΙΣΤΕ

Οι δειγματοληπτικές διακυμάνσεις είναι κοντά και άρα υποθέτουμε ότι οι διακυμάνσεις του πληθυσμού είναι ίσες …

1 2

2 21 1

6.47 6.17

1.30 1.36

x x

s s

Page 21: Κεφάλαιο  13 -Γ

13.21Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…

Ανακαλέστε, εκτελούμε ένα δίπλευρο τεστ και επομένως η περιοχή απόρριψης θα είναι:

Ο αριθμός των βαθμών ελευθεριών είναι:

Επομένως οι κριτικές τιμές του t (και η περιοχή απόρριψης) γίνεται:

ΥΠΟΛΟΓΙΣΤΕ

Page 22: Κεφάλαιο  13 -Γ

13.22Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…Με στόχο να υπολογίσουμε την t-στατιστική, χρειαζόμαστε πρώτα να υπολογίσουμε την εκτιμήτρια της συγχωνευμένης διακύμανσης, και ύστερα την t-στατιστική …

ΥΠΟΛΟΓΙΣΤΕ

Page 23: Κεφάλαιο  13 -Γ

13.23Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…

Αφού η υπολογισμένη t-στατιστική δεν πέφτει στην περιοχή απόρριψης, δεν μπορούμε την μηδενική H0 για την εύνοια της H1, δηλαδή, δεν υπάρχει επαρκή μαρτυρία να συμπεράνουμε ότι η μέση τιμή συναρμολόγησης διαφέρει.

ΕΡΜΗΝΕΥΣΤΕ

Απορρίπτουμε την Η0 Απορρίπτουμε την Η0ΈλεγχοςΥποθέσεων

Page 24: Κεφάλαιο  13 -Γ

13.24Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.6…Επίσης Το Excel, φυσικά μας παρέχει αυτή την πληροφορία …

ΕΡΜΗΝΕΨΤΕ

Συγκρίνεται…

…ή δείτε την π-τιμή

Page 25: Κεφάλαιο  13 -Γ

13.25Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Διάστημα Εμπιστοσύνης … Μπορούμε να υπολογίσουμε ένα 95% διάστημα εμπιστοσύνης για την διαφορά των δύο μέσων τιμών των χρόνων συναρμολόγησης ως εξής:

Δηλαδή, εκτιμούμε την διαφορά των μέσων τιμών ανάμεσα στις δύο μεθόδους συναρμολόγησης μεταξύ –.36 και .96 λεπτών. Σημειώστε: το μηδέν συμπεριλαμβάνεται στο διάστημα εμπιστοσύνης …

Page 26: Κεφάλαιο  13 -Γ

13.26Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Ορολογία …Εάν όλες οι παρατηρήσεις από ένα δείγμα εμφανίζεται σε μία στήλη και όλες οι παρατηρήσεις του δεύτερου δείγματος εμφανίζονται σε μία άλλη στήλη, τα δεδομένα δεν είναι στοιβαγμένα (unstacked).

Εάν όλα τα δεδομένα και από τα δύο δείγματα είναι στην ίδια στήλη, τα δεδομένα καλούνται στοιβαγμένα (stacked).

Στοιβαγμένα

Page 27: Κεφάλαιο  13 -Γ

13.27Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Πείραμα με Ζεύγη …

Προηγμένως όταν συγκρίναμε δύο πληθυσμούς, εξετάζαμε ανεξάρτητα δείγματα.

Εάν ωστόσο, μία παρατήρηση από το ένα δείγμα ζευγαρώνεται με μία παρατήρηση από το άλλο δείγμα, τότε το πείραμα καλείται πείραμα με ζεύγη.

Για να κατανοήσουμε αυτή την έννοια, ας θεωρήσουμε το παράδειγμα 13.7.

Page 28: Κεφάλαιο  13 -Γ

13.28Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.7… Εάν υπάρχει διαφορά ανάμεσα σε αρχικούς μισθούς που προσφέρονται σε πτυχιούχους MBA με κατευθύνσεις Χρηματοοικονομικών έναντι Marketing; Πιο ακριβέστερα, προσφέρονται υψηλότεροι μισθοί στους πτυχιούχους με κατεύθυνση στα Χρηματοοικονομικά από ότι στους πτυχιούχους με κατεύθυνση στο Marketing;

Σε αυτό το πείραμα, οι πτυχιούχοι MBA ομαδοποιούνται σύμφωνα με τον βαθμό πτυχίου τους σε 25 ομάδες. Οι απόφοιτοι από την ίδια ομάδα (αλλά με διαφορετικές κατευθύνσεις) επιλέγονται και οι υψηλότερες προσφορές μισθών καταγράφονται.

Τα δεδομένα φαίνονται ως …

Page 29: Κεφάλαιο  13 -Γ

13.29Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.7…

Οι μαύροι αριθμοί είναι οι αρχικοί μισθοί, δηλαδή τα δεδομένα μας, και οι μπλε αριθμοί υπολογίζονται.

Παρόλο που ένας απόφοιτος είναι στα χρηματοοικονομικά ή στο marketing (ανεξαρτήτως), τα δεδομένα ομαδοποιούνται με τέτοιο τρόπο ώστε να έχουμε πείραμα με ζεύγη (δηλαδή οι δύο φοιτητές από την ομάδα #1 «ζευγαρώνονται» σύμφωνα με τον βαθμπο αποφοίτησης τους

η διαφορά των μέσων τιμών είναι ίση με την μέση τιμή των διαφορών, και επομένως θα θεωρήσουμε την «μέση τιμή των διαφορών των ζευγών» ως την παράμετρο που μας ενδιαφέρει:

Page 30: Κεφάλαιο  13 -Γ

13.30Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.7…

Έχουν οι απόφοιτοι με κατεύθυνση Χρηματοοικονομικά υψηλότερους μισθούς από αυτούς με κατεύθυνση Marketing;

Αφού:

Θέλουμε να ερευνήσουμε την υπόθεση: H1: μD>0

(και η μηδενική μας υπόθεση γίνεται H0: μD=0 )

ΑΝΑΓΝΩΡΙΣΤΕ

Page 31: Κεφάλαιο  13 -Γ

13.31Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Τεστ Στατιστική για μD H τεστ στατιστική για τις διαφορές των δύο μέσων τιμών των πληθυσμών (μD) είναι:

Το οποίο ακολουθεί την t κατανομή με nD–1 βαθμούς ελευθερίας, υποθέτοντας ότι οι διαφορές κατανέμονται κανονικά.

Έτσι η περιοχή απόρριψης γίνεται:

Page 32: Κεφάλαιο  13 -Γ

13.32Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.7…Από τα δεδομένα, υπολογίζουμε …

…τα οποία τα χρησιμοποιούμε

για την t-στατιστική…

…με την οποία συγκρίνουμε την κριτική τιμή της t:

ΥΠΟΛΟΓΙΣΤΕ

Πληθυσμός Διαφορών

Μέγεθος Δείγματος

nD=25

Δειγματοληπτική Μέση Τιμή

Δειγματοληπτική Τυπική Απόκλιση

sD=6,647

5,065Dx

Page 33: Κεφάλαιο  13 -Γ

13.33Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.7…Αφού η υπολογισμένη τιμή της t (3.81) είναι μεγαλύτερη από την κριτική τιμή της t (1.711), πέφτει στην περιοχή απόρριψης, και έτσι απορρίπτουμε την H0 για την εύνοια της H1; Δηλαδή, υπάρχει υπερβολική μαρτυρία (αφού η

π-τιμή=.0004) ότι η κατεύθυνση των Χρηματοοικονομικών παρέχει υψηλότερους αρχικούς μισθούς από τους αντίστοιχους στο Marketing.

ΕΡΜΗΝΕΥΣΤΕ

Συγκρίνεται…

Page 34: Κεφάλαιο  13 -Γ

13.34Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Διάστημα Εμπιστοσύνης για μD…

Μπορούμε να εξάγουμε ένα διάστημα εμπιστοσύνης αλγεβρικά ως:

Στο προηγούμενο παράδειγμα, ποιο είναι το 95% διάστημα εμπιστοσύνης της μέσης τιμής των διαφορών των μισθών μεταξύ των δύο κατευθύνσεων του ΜΒΑ;

Δηλαδή, η μέση τιμή των διαφορών του πληθυσμού είναι μεταξύ LCL=2,321 και UCL=7,809 δολάρια.

Page 35: Κεφάλαιο  13 -Γ

13.35Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Διαφορά μεταξύ Δύο Πληθυσμιακών ΑναλογιώνΤώρα θα μελετήσουμε διαδικασίες για να εξάγουμε συμπεράσματα σχετικά με την διαφορά μεταξύ πληθυσμών των οποίων τα δεδομένα είναι ονομαστικά (δηλαδή κατηγορικά).

Όπως αναφέρθηκε πριν, με ονομαστικά δεδομένα, υπολογίζουμε αναλογίες συμβάντων για κάθε τύπο αποτελεσμάτων. Έτσι, η παράμετρος προς έλεγχο και προς εκτίμηση σε αυτή την ενότητα είναι η διαφορά μεταξύ δύο πληθυσμιακών αναλογιών: p1–p2.

Page 36: Κεφάλαιο  13 -Γ

13.36Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Στατιστικό Στοιχείο και Δειγματοληπτική

Κατανομή … Για να εξάγουμε συμπεράσματα σχετικά με την παράμετρο p1–p2, παίρνουμε δείγματα από τον πληθυσμό, υπολογίζουμε τις δειγματοληπτικές αναλογίες και εξετάζουμε την διαφορά του.

είναι μία αμερόληπτος εκτιμήτρια για p1–p2.

x1 επιτυχίες σε ένα δείγμα

μεγέθους n1 από τον πληθυσμό 1

Page 37: Κεφάλαιο  13 -Γ

13.37Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Δειγματοληπτική Κατανομή Το στατιστικό στοιχείο είναι προσεγγιστικά κανονικά κατανεμημένο εάν τα μεγέθη των δειγμάτων είναι αρκετά μεγάλα έτσι ώστε:

Αφού έχουμε «προσεγγιστικά κανονική κατανομή» μπορούμε να περιγράψουμε την κατανομή με την μέση τιμή και την διακύμανση …

…άρα αυτή η z-μεταβλητή θα είναι προσεγγιστικά τυπικά κατανεμημένη:

Page 38: Κεφάλαιο  13 -Γ

13.38Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Έλεγχος και Εκτίμηση για p1–p2…

Αφού οι αναλογίες του πληθυσμού (p1 & p2) είναι άγνωστες, το τυπικό σφάλμα:

Είναι άγνωστο. Έτσι, έχουμε δύο διαφορετικές εκτιμήτριες για το τυπικό σφάλμα της , το οποίο βασίζεται πάνω στην μηδενική υπόθεση. Θα εξετάσουμε αυτές τις περιπτώσεις στο επόμενο σλάιντ …

Page 39: Κεφάλαιο  13 -Γ

13.39Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Στατιστικό Τεστ για p1–p2…Υπάρχουν δύο περιπτώσεις να θεωρήσουμε …

Περίπτωση 1:

0 1 2

1 2

1 2

1 2

1 2

Εάν η μηδενική μας υπόθεση είναι:

: ( - )=0

στατιστικό τεστ είναι ...

ˆ ˆ=

1 1ˆ ˆ(1 )( )

όπου το καπελάκι είναι η

συγχωνευμένη εκτιμήτρια

που υπολογίζεται ως

ˆ

H p p

p pz

p pn n

x xp

n n

Περίπτωση 2:

0 1 2

1 2

1 1 2 2

1 2

Εάν η μηδενική μας υπόθεση είναι:

: ( - )= ( 0)

στατιστικό τεστ είναι ...

ˆ ˆ=

ˆ ˆ ˆ ˆ(1 ) (1 )

H p p D D

p p Dz

p p p p

n n

Page 40: Κεφάλαιο  13 -Γ

13.40Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.8…Μία εταιρία που πακετάρει αγαθά μελετάει δύο διαφορετικούς τρόπους πακεταρίσματος για σαπούνια. Ο πρώτος τρόπος ( με έντονα χρώματα) δοκιμάζεται σε ένα μεγάλο κατάστημα, ενώ ο δεύτερος τρόπος (με απλά χρώματα) σε κάποιο άλλο μεγάλο κατάστημα. Αφού ο πρώτος είναι πιο ακριβός, αναμένεται να υπερέχει από τον άλλο σχεδιασμό, δηλαδή το μερίδιο του στην αγορά, p1, αναμένεται να είναι μεγαλύτερο από το άλλο σχέδιο πακεταρίσματος, δηλαδή p2.

Δηλαδή, θέλουμε να ελέγξουμε, ισχύει p1 > p2; ή, χρησιμοποιώντας την στατιστική γλώσσα:

H1: (p1–p2) > 0

Επομένως η μηδενική υπόθεση θα είναι:

H0: (p1–p2) = 0 [Περίπτωση 1]

ΑΝΑΓΝΩΡΙΣΤΕ

Page 41: Κεφάλαιο  13 -Γ

13.41Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.8…Η περιγραφική στατιστική των δεδομένων …

Η μηδενική υπόθεση είναι H0: (p1–p2) = 0, δηλαδή είναι η «περίπτωση 1» που είδαμε, και επομένως χρειάζεται να υπολογίσουμε την συγχωνευμένη αναλογία:

ΑΝΑΓΝΩΡΙΣΤΕ

Πληθυσμός 1

Έντονα χρώματα

Πληθυσμός 2

Απλά χρώματα

Επιτυχίες x1=180 x2=155

Μέγεθος Δείγματος n1=904 n2=1,038

Δειγματοληπτική Αναλογίες1 2

180 155ˆ ˆ0.1991 0.1493

904 1,038p p

Page 42: Κεφάλαιο  13 -Γ

13.42Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.8…

Με 5% επίπεδο σημαντικότητας, η περιοχή απόρριψης είναι:

Η τιμή της z-στατιστικής είναι …

Αφού 2.90 > 1.645, απορρίπτουμε την H0 για την εύνοια της H1, δηλαδή, υπάρχει αρκετή μαρτυρία να συμπεράνουμε ότι το σχέδιο με τα έντονα χρώματα είναι πιο δημοφιλές από το άλλο σχέδιο.

ΥΠΟΛΟΓΙΣΤΕ

Συγκρίνουμε…

Page 43: Κεφάλαιο  13 -Γ

13.43Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.8…

Στο Excel, μπορούμε να χρησιμοποιήσουμε το

Z-Test: 2 Proportions tool in the Data Analysis Plus package

ΥΠΟΛΟΓΙΣΤΕ

Συγκρίνεται…

Π-τιμή…

Page 44: Κεφάλαιο  13 -Γ

13.44Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.9…

Υποθέστε στον έλεγχο του marketing με τα σχέδια πακεταρίσματος του σαπουνιού ότι αντί να εξετάσουμε την διαφορά μεταξύ των δύο τύπων πακέτων, το σχέδιο με τα έντονα χρώματα πρέπει να ξεπερνάει το απλό σχέδιο κατά τουλάχιστον 3%

Η ερευνητική υπόθεση γίνεται:

H1: (p1–p2) > .03

και έτσι η μηδενική υπόθεση είναι: H0: (p1–p2) = .03

ΑΝΑΓΝΩΡΙΣΤΕ

Αφού η σταθερά στην H0

δεν είναι μηδέν, είναι ή «περίπτωση 2» που είδαμε

Page 45: Κεφάλαιο  13 -Γ

13.45Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.9…Η ίδια περιγραφική στατιστική των δεδομένων όπως πριν …

Αφού αυτή είναι η «περίπτωση 2» που είδαμε, δεν χρειάζεται να υπολογίσουμε την συγχωνευμένη αναλογία, μπορούμε να υπολογίσουμε κατευθείαν το z:

ΥΠΟΛΟΓΙΣΤΕ

Πληθυσμός 1

Έντονα χρώματα

Πληθυσμός 2

Απλά χρώματα

Επιτυχίες x1=180 x2=155

Μέγεθος Δείγματος n1=904 n2=1,038

Δειγματοληπτική Αναλογίες1 2

180 155ˆ ˆ0.1991 0.1493

904 1,038p p

Page 46: Κεφάλαιο  13 -Γ

13.46Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.9…

Αφού η υπολογισμένη z-στατιστική (1.15) δεν πέφτει στην περιοχή απόρριψης ,

δεν υπάρχει μαρτυρία να συμπεράνουμε ότι το σχέδιο με τα έντονα τα χρώματα υπερέχει το άλλο το σχέδιο κατά 3% ή περισσότερο.

ΕΡΜΗΝΕΥΣΤΕ

Page 47: Κεφάλαιο  13 -Γ

13.47Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Διαστήματα Εμπιστοσύνης …

Η εκτιμήτρια του διαστήματος εμπιστοσύνης για p1–p2 δίνεται από:

Και όπως υποπτεύεστε ενδεχομένως, είναι έγκυρό όταν …

Page 48: Κεφάλαιο  13 -Γ

13.48Copyright © 2005 Brooks/Cole, a division of Thomson Learning, Inc.

Παράδειγμα 13.10…

Δημιουργήστε ένα 95% διάστημα εμπιστοσύνης για την διαφορά μεταξύ των δύο αναλογιών των πωλήσεων των πακεταρισμάτων σαπουνιού από το Παράδειγμα 13.8:

ΥΠΟΛΟΓΙΣΤΕ

δηλαδή είναι: Κάτω φράγμα = 0.0159 καιΆνω φράγμα = 0.0837