Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks...

24
Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2 1. Μη Παραμετρικοί Έλεγχοι Παραμετρικοί είναι οι κλασικοί έλεγχοι υποθέσεων της Στατιστικής οι οποίοι διεξάγονται κάτω από κάποιες προϋποθέσεις για τις παραμέτρους του πληθυσμού από τους οποίους λαμβάνονται τα δεδομένα, π.χ. Κανονικότητα, ισότητα διασπορών κ.α. Οι παραμετρικοί έλεγχοι δεν μπορούν να εφαρμοστούν όταν τα δεδομένα μας είναι διατακτικά (π.χ. χρήση κλίμακας Likert) ή όταν είναι ποσοτικά αλλά έχουμε παραβίαση των βασικών υποθέσεων ή πολύ μικρά δείγματα. Σε αυτές τις περιπτώσεις χρησιμοποιούμε τους ονομαζόμενους μή παραμετρικούς ελέγχους. Στην πραγματικότητα, αυτό που ελέγχουν οι μη παραμετρικές μέθοδοι είναι εάν οι κατανομές των πληθυσμών από τις οποίες προέρχονται τα δεδομένα είναι ίδιες. Για παράδειγμα, στην περίπτωση 2 πληθυσμών, οι υποθέσεις μας είναι οι εξής: : : Οι κατανομές των δύο πληθυσμών ΔΕΝ ΕΙΝΑΙ ΔΙΑΦΟΡΕΤΙΚΕΣ Οι κατανομές των δύο πληθυσμών είναι διαφορετικές 0 1 Ίδιες κατανομές όμως, σημαίνει ίδιο σχήμα, ίδιο κέντρο και ίδια έκταση. Ως κεντρική θέση στα διατακτικά δεδομένα χρησιμοποιείται η διάμεσος, ενώ για τα ποσοτικά δεδομένα μπορεί να είναι η διάμεσος ή η μέση τιμή. Έτσι, η μη απόρριψη της παραπάνω μηδενικής υπόθεσης οδηγεί και στη μη απόρριψη της μηδενικής υπόθεσης για τον αμφίπλευρο έλεγχο : : Οι κεντρικές θέσεις των δύο πληθυσμών ΔΕΝ ΕΙΝΑΙ ΔΙΑΦΟΡΕΤΙΚΕΣ Οι κεντρικές θέσεις των δύο πληθυσμών είναι διαφορετικές 0 1 Στην περίπτωση που η μηδενική υπόθεση απορρίπτεται, γνωρίζουμε ότι οι πληθυσμοί δεν έχουν την ίδια κατανομή, αλλά δεν γνωρίζουμε κάτι για τη θέση των κέντρων τους, καθώς είναι δυνατόν πληθυσμοί με διαφορετική κατανομή να έχουν την ίδια κεντρική θέση. Όμως, εάν από τις γραφικές παραστάσεις προκύπτει ότι οι κατανομές έχουν το ίδιο σχήμα, τότε οι μη παραμετρικοί έλεγχοι για τη σύγκριση των κατανομών μπορούν να χρησιμοποιηθούν και ως έλεγχοι για τη σύγκριση των κεντρικών τους θέσεων (διαμέσου ή μέσης τιμής). Οι έλεγχοι μπορεί να είναι αμφίπλευροι, όπως ο παραπάνω, ή μονόπλευροι. : Η κεντρική θέση του πληθυσμού 1 είναι μικρότερη της κεντρικής θέσης του πληθυσμού 2 1 ή : Η κεντρική θέση του πληθυσμού 1 είναι μεγαλύτερη κεντρικής θέσης του πληθυσμού 2 1

Transcript of Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks...

Page 1: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μη Παραμετρικοί Έλεγχοι &

Η Δοκιμασία Χ2

1. Μη Παραμετρικοί Έλεγχοι

Παραμετρικοί είναι οι κλασικοί έλεγχοι υποθέσεων της Στατιστικής οι οποίοι διεξάγονται

κάτω από κάποιες προϋποθέσεις για τις παραμέτρους του πληθυσμού από τους οποίους

λαμβάνονται τα δεδομένα, π.χ. Κανονικότητα, ισότητα διασπορών κ.α.

Οι παραμετρικοί έλεγχοι δεν μπορούν να εφαρμοστούν όταν τα δεδομένα μας είναι

διατακτικά (π.χ. χρήση κλίμακας Likert) ή όταν είναι ποσοτικά αλλά έχουμε παραβίαση των

βασικών υποθέσεων ή πολύ μικρά δείγματα.

Σε αυτές τις περιπτώσεις χρησιμοποιούμε τους ονομαζόμενους μή παραμετρικούς

ελέγχους.

Στην πραγματικότητα, αυτό που ελέγχουν οι μη παραμετρικές μέθοδοι είναι εάν οι

κατανομές των πληθυσμών από τις οποίες προέρχονται τα δεδομένα είναι ίδιες.

Για παράδειγμα, στην περίπτωση 2 πληθυσμών, οι υποθέσεις μας είναι οι εξής:

:

:

Οι κατανομές των δύο πληθυσμών ΔΕΝ ΕΙΝΑΙ ΔΙΑΦΟΡΕΤΙΚΕΣ

Οι κατανομές των δύο πληθυσμών είναι διαφορετικές

0

1

Ίδιες κατανομές όμως, σημαίνει ίδιο σχήμα, ίδιο κέντρο και ίδια έκταση. Ως κεντρική θέση

στα διατακτικά δεδομένα χρησιμοποιείται η διάμεσος, ενώ για τα ποσοτικά δεδομένα

μπορεί να είναι η διάμεσος ή η μέση τιμή. Έτσι, η μη απόρριψη της παραπάνω μηδενικής

υπόθεσης οδηγεί και στη μη απόρριψη της μηδενικής υπόθεσης για τον αμφίπλευρο έλεγχο

:

:

Οι κεντρικές θέσεις των δύο πληθυσμών ΔΕΝ ΕΙΝΑΙ ΔΙΑΦΟΡΕΤΙΚΕΣ

Οι κεντρικές θέσεις των δύο πληθυσμών είναι διαφορετικές

0

1

Στην περίπτωση που η μηδενική υπόθεση απορρίπτεται, γνωρίζουμε ότι οι πληθυσμοί

δεν έχουν την ίδια κατανομή, αλλά δεν γνωρίζουμε κάτι για τη θέση των κέντρων τους,

καθώς είναι δυνατόν πληθυσμοί με διαφορετική κατανομή να έχουν την ίδια κεντρική

θέση.

Όμως, εάν από τις γραφικές παραστάσεις προκύπτει ότι οι κατανομές έχουν το ίδιο σχήμα,

τότε οι μη παραμετρικοί έλεγχοι για τη σύγκριση των κατανομών μπορούν να

χρησιμοποιηθούν και ως έλεγχοι για τη σύγκριση των κεντρικών τους θέσεων (διαμέσου ή

μέσης τιμής). Οι έλεγχοι μπορεί να είναι αμφίπλευροι, όπως ο παραπάνω, ή μονόπλευροι.

: Η κεντρική θέση του πληθυσμού 1 είναι μικρότερη της κεντρικής θέσης του πληθυσμού 21

ή

: Η κεντρική θέση του πληθυσμού 1 είναι μεγαλύτερη κεντρικής θέσης του πληθυσμού 21

Page 2: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

2

1.1 Έλεγχος U των Mann – Whitney (Αθροίσματα Βαθμίδων)

Είναι ο αντίστοιχος μή παραμετρικός έλεγχος του t – test για ανεξάρτητα δείγματα.

Ο έλεγχος Mann – Whitney δεν διεξάγεται πάνω στις αρχικές τιμές των δεδομένων μας,

αλλά πάνω στις βαθμίδες τους. Δηλαδή στην τάξη που λαμβάνουν οι παρατηρήσεις όταν

όλες διαταχθούν σε μία αύξουσα σειρά.

Ένας αναλυτής μέτρησε την καθυστέρηση (σε min) των πτήσεων μιας αεροπορικής

εταιρείας από την Αθήνα προς τη Θεσσαλονίκη, και από την Αθήνα προς τη Ρόδο,

και πήρε τα παρακάτω αποτελέσματα.

Προς Θεσσαλονίκη

6,5 7,1 8,9 9,7 12,5

Προς Ρόδο 1,7 2,5 7,2 10,5 10,7 11,2

Για την απόδοση των βαθμίδων, όλα τα δεδομένα διατάσσονται σε αύξουσα σειρά και κάθε

μια λαμβάνει την τάξη της.

Προς

Θεσσαλονίκη Προς Ρόδο Βαθμίδες

1,7 1

2,5 2

6,5 3

7,1 4

7,2 5

8,9 6

9,7 7

10,5 8

10,7 9

11,2 10

12,5 11

Πλήθος

Βαθμίδων Άθροισμα Βαθμίδων Μέσο Άθροισμα

Θεσσαλονίκη 5 w 1 1 2 5 8 9 10 31 .

316 2

5

Ρόδος 6 w 2 3 4 6 7 11 35 .

355 83

6

Το στατιστικό U των Mann – Whitney είναι ένα μέτρο της διαφοράς για το μέσο άθροισμα

των βαθμίδων και όχι για την διαφορά των μέσων τιμών των πληθυσμών.

Page 3: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 3

Σημειώσεις Στατιστικής

Στο παραπάνω πίνακα παρατηρούμε ότι το μέσο άθροισμα των βαθμίδων για το

αεροδρόμιο της Θεσσαλονίκης είναι μεγαλύτερο από το μέσο άθροισμα των βαθμίδων για

το αεροδρόμιο της Ρόδου. Με τη χρήση του Mann – Whitney test θα ελέγξουμε εάν αυτή η

διαφορά είναι στατιστικά σημαντική.

Αποτελέσματα με το SPSS και ερμηνεία

:

:

Οι κατανομές των δύο πληθυσμών δεν είναι διαφορετικές

Οι κατανομές των δύο πληθυσμών είναι διαφορετικές

0

1

Mann-Whitney Test

Ranks

AIRPORT N Mean Rank Sum of Ranks

TIME

1 (ΘΕΣΣΑΛΟΝΙΚΗ) 5 6,20 31,00

2 (ΡΟΔΟΣ) 6 5,83 35,00

Total 11

Test Statisticsc

TIMEΣ

Mann-Whitney U 14,000

Wilcoxon W 35,000

Z -,183

Asymp. Sig. (2-tailed) ,855

Exact Sig. [2*(1-tailed Sig.)] ,931a

Monte Carlo Sig.

(2-tailed)

Sig. ,930b

99% Confidence Interval Lower Bound ,924

Upper Bound ,937

Monte Carlo Sig. (1-tailed) Sig. ,465b

99% Confidence Interval Lower Bound ,452

Upper Bound ,478

a. Not corrected for ties.

b. Based on 10000 sampled tables with starting seed 2000000.

c. Grouping Variable: AIRPORT

Η τιμή του Στατιστικού Mann – Whitney U, είναι 14,000

Page 4: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

4

Για το επίπεδο σημαντικότητας, κοιτάζουμε τα Asymp. Sig. (2-tailed) = 0,855 και

Monte Carlo Sig. (2-tailed) = 0,930.

Και στις δύο περιπτώσεις, Sig. > 0.05 και συνεπώς, η μηδενική υπόθεση δεν απορρίπτεται.

Επομένως, δεχόμαστε ότι οι κατανομές των πληθυσμών από τις οποίες προέρχονται τα

δείγματα είναι ίδιες.

Τότε, γνωρίζουμε επίσης ότι δεν υπάρχει στατιστικά σημαντική διαφορά ανάμεσα στους

μέσους χρόνους καθυστέρησης προς τους δύο προορισμούς.

Παράδειγμα 1

Μία διαφημιστική εταιρεία θέλει να ελέγξει αν η αποδοχή μιας διαφήμισης που ετοιμάζει

για ένα προϊόν έχει ή όχι ίδια απήχηση στους άνδρες και στις γυναίκες. Για το σκοπό αυτό

επέλεξε τυχαία 10 άνδρες και 10 γυναίκες και τους ζήτησε να χαρακτηρίσουν το

δοκιμαστικό.

Τα αποτελέσματα που πήρε είναι τα παρακάτω

Γυναίκες 1 1 2 1 3 2 3 4 1 2

Άνδρες 2 3 1 4 3 4 2 3 4 1

1 – Κακή, 2 – Μέτρια, 3 – Καλή, 4 – Πολύ Καλή

Η εξαρτημένη μεταβλητή είναι : ΒαθμολογίαY , και είναι μία διατακτική μεταβλητή.

Θα την ονομάσουμε GRADE.

Η ανεξάρτητη μεταβλητή είναι :ΦύλοX , και είναι μία ονομαστική μεταβλητή με 2

επίπεδα.

Θα την ονομάσουμε GENDER

Αποτελέσματα με το SPSS και ερμηνεία

:

:

Η απήχηση της διαφήμισης δεν είναι διαφορετική ανάμεσα στους άνδρες και στις γυναίκες

Η απήχηση της διαφήμισης είναι διαφορετική, ανάμεσα στους άνδρες και στις γυναίκες

0

1

Mann-Whitney Test

Ranks

GENDER N Mean Rank Sum of Ranks

GRADE

Γυναίκα 10 8,00 80,00

Άνδρας 10 13,00 130,00

Total 20

Page 5: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 5

Σημειώσεις Στατιστικής

Test Statisticsc

GRADE

Mann-Whitney U 25,000

Wilcoxon W 80,000

Z -1,965

Asymp. Sig. (2-tailed) ,049

Exact Sig. [2*(1-tailed Sig.)] ,043a

Monte Carlo Sig. (2-tailed) Sig. ,065b

99% Confidence Interval Lower Bound ,059

Upper Bound ,072

Monte Carlo Sig. (1-tailed) Sig. ,035b

99% Confidence Interval Lower Bound ,030

Upper Bound ,039

a. Not corrected for ties.

b. Based on 10000 sampled tables with starting seed 299883525.

c. Grouping Variable: GENDER

Στον πίνακα Ranks, παρατηρούμε ότι το μέσο άθροισμα των βαθμίδων στις γυναίκες είναι

μικρότερο από το μέσο άθροισμα των βαθμίδων στους άνδρες.

Η τιμή του στατιστικού Mann – Whitney U, είναι 25

Asymp. Sig. (2-tailed) = 0,049 < 0.05 και συνεπώς, η μηδενική υπόθεση απορρίπτεται.

Επομένως, η αποδοχή της διαφήμισης φαίνεται να είναι διαφορετική ανάμεσα στους

άνδρες και τις γυναίκες.

Page 6: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

6

1.2 Έλεγχος Wilcoxon (Προσημικός)

Είναι ο αντίστοιχος μή παραμετρικός έλεγχος του t – test για εξαρτημένα δείγματα.

Για την εφαρμογή του ελέγχου Wilcoxon, θα πρέπει η εξαρτημένη μεταβλητή να διατακτική

(για παράδειγμα κλίμακας Likert) ή συνεχής. Η ανεξάρτητη μεταβλητή θα πρέπει να

αποτελείται από δύο σχετιζόμενες ομάδες ή ζεύγη. Τέλος, η κατανομή μεταξύ των

διαφορών ανάμεσα στις τιμές των δύο ομάδων θα πρέπει να είναι συμμετρική.

Παράδειγμα 2

Ένας οινοπαραγωγός ζήτησε από 5 ειδικούς να δοκιμάσουν και να βαθμολογήσουν δύο νέα

κρασιά που παρήγαγε.

Τα αποτελέσματα της δοκιμασίας ήταν τα εξής:

Ειδικοί 1ος

2ος

3ος

4ος

5ος

Κρασί 1 4 6 6 7 7,5

Κρασί 2 4,5 6,5 8 6 9,5

Η εξαρτημένη μεταβλητή είναι :Βαθμολογία ειδικούY , και είναι μία συνεχής

μεταβλητή.

Η ανεξάρτητη μεταβλητή είναι :Είδος κρασιούX , και είναι ονομαστική με δύο επίπεδα .

Θα την ονομάσουμε WINE.

Αποτελέσματα με το SPSS και ερμηνεία

:

:

Οι κατανομές των δύο πληθυσμών δεν είναι διαφορετικές

Οι κατανομές των δύο πληθυσμών είναι διαφορετικές

0

1

Wilcoxon Signed Ranks Test

Ranks

N Mean Rank Sum of Ranks

Wine2 - Wine1

Negative Ranks 1a 3,00 3,00

Positive Ranks 4b 3,00 12,00

Ties 0c

Total 5

a. Wine2 < Wine1

b. Wine2 > Wine1

c. Wine2 = Wine1

Στον πίνακα Ranks παρατηρούμε ότι το μέσο άθροισμα των βαθμίδων με αρνητικό

πρόσημο (περιπτώσεις όπου το 1ο κρασί υπερτερεί του 2ου) είναι ίσο με το μέσο άθροισμα

των βαθμίδων με θετικό πρόσημο (περιπτώσεις όπου το 2ο κρασί υπερτερεί του 1ου)

Page 7: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 7

Σημειώσεις Στατιστικής

Επομένως δεν περιμένουμε διαφορά , για την ποιότητα των 2 κρασιών.

Test Statisticsb,c

Wine2 - Wine1

Z -1,214a

Asymp. Sig. (2-tailed) ,225

Monte Carlo Sig. (2-tailed) Sig. ,317

99% Confidence Interval Lower Bound ,305

Upper Bound ,329

Monte Carlo Sig. (1-tailed) Sig. ,152

99% Confidence Interval Lower Bound ,143

Upper Bound ,161

a. Based on negative ranks.

b. Wilcoxon Signed Ranks Test

c. Based on 10000 sampled tables with starting seed 1314643744.

Πράγματι, στον πίνακα Statistics βλέπουμε

Asymp. Sig. (2-tailed) = 0,225 > 0,05 και Monte Carlo Sig. (2-tailed) = 0,317 > 0,05, και η

μηδενική υπόθεση δεν απορρίπτεται.

Επομένως, δεν υπάρχει διαφορά στην κρίση των ειδικών για τα δύο κρασιά.

Page 8: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

8

1.3 Έλεγχος Kruskal - Wallis

Είναι ο αντίστοιχος μη παραμετρικός έλεγχος της Ανάλυσης Διασποράς (ANOVA).

Χρησιμοποιείται όταν τα δεδομένα είναι διατακτικά ή ποσοτικά για τα οποία παραβιάζεται

η υπόθεση της Κανονικότητας, ή όταν το πλήθος των παρατηρήσεων είναι πολύ μικρό.

Στόχος του ελέγχου είναι να διαπιστωθεί εάν υπάρχουν στατιστικά σημαντικές διαφορές

ανάμεσα σε δύο ή περισσότερες ομάδες μιας ανεξάρτητης μεταβλητής, για μία συνεχή ή

διατακτική εξαρτημένη μεταβλητή.

Παράδειγμα 3

Ένας αναλυτής στη βιομηχανία εκδόσεων θέλει να διερευνήσει εάν το κόστος διαφήμισης

σε εφημερίδα ενός δεδομένου μεγέθους είναι περίπου το ίδιο σε τέσσερις μεγάλες ομάδες

εφημερίδων. Έχουν επιλεγεί τυχαία δείγματα επτά εφημερίδων από κάθε ομάδα και έχει

καταγραφεί το κόστος διαφήμισης. Τα δεδομένα δίνονται παρακάτω (σε δολάρια).

Πιστεύετε ότι υπάρχουν διαφορές στην τιμή μιας διαφήμισης μεταξύ των τεσσάρων

ομάδων;

Ομάδα Α 57 65 50 45 70 62 48

Ομάδα Β 72 81 64 55 90 38 75

Ομάδα C 35 42 58 59 46 60 61

Ομάδα D 73 85 92 68 82 94 66

(Amir Aczel, Jayavel Sounderpandian, Στατιστική σκέψη στον κόσμο των επιχειρήσεων,

Broken Hill Publishers LTD, 2013.)

Λύση

Η εξαρτημένη μεταβλητή μας είναι : Κόστος διαφήμισης (σε $) , και είναι μία

ποσοτική συνεχής μεταβλητή.

Η ανεξάρτητη μεταβλητή είναι : Μέγεθος εφημερίδαςX και είναι μία ονομαστική

μεταβλητή, με τέσσερα επίπεδα (Α, Β, C, D)

Θέλουμε να ελέγξουμε, εάν οι τιμές της εξαρτημένης μεταβλητής διαφοροποιούνται στα 4

επίπεδα της ανεξάρτητης μεταβλητής ή, με άλλα λόγια, εάν ο παράγοντας μέγεθος

εφημερίδας επιδρά πάνω στο κόστος της διαφήμισης.

COST: Κόστος διαφήμισης

GROUP: Μέγεθος εφημερίδας (Α = 1, Β = 2, C = 3, D = 4) ΠΡΟΧΩΡΗΣΤΕ ΣΤΗ ΣΕΛΙΔΑ 11

Page 9: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 9

Σημειώσεις Στατιστικής

ΠΑΡΑΤΗΡΗΣΗ: Γραφικές Παραστάσεις – Στατιστικά – Κανονικότητα

Tests of Normality

GROUP

Kolmogorov-Smirnova Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

COST

1 ,191 7 ,200* ,946 7 ,694

2 ,166 7 ,200* ,971 7 ,903

3 ,302 7 ,052 ,844 7 ,108

4 ,162 7 ,200* ,920 7 ,472

a. Lilliefors Significance Correction

*. This is a lower bound of the true significance.

Page 10: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

10

Η μηδενική υπόθεση για την Κανονικότητα των Πληθυσμών, δεν απορρίπτεται σε κανένα

από τα επίπεδα της ανεξάρτητης μεταβλητής COST. Θα μπορούσαμε στην περίπτωση αυτή

να προχωρήσουμε και σε ανάλυση της διακύμανσης (ANOVA).

Κοιτάζοντας όμως τα ιστογράμματα των συχνοτήτων παρατηρούμε ότι η προσαρμογή τους

στην Κανονική καμπύλη δεν είναι ιδιαίτερα ικανοποιητική, με εξαίρεση την περίπτωση

Group B.

Την ίδια εικόνα παρουσιάζουν και τα θηκογράμματα, ενώ στον πίνακα των στατιστικών

παρατηρούμε ασυμμετρία σε όλες τις περιπτώσεις, και επίσης παρατηρούνται διαφορές

στις τυπικές αποκλίσεις (και συνεπώς στις διασπορές)

Descriptives Group A Group B Group C Group D

Mean 56,7143 67,8571 51,5714 80,0000

Median 57,0000 68,2857 58,0000 82,0000

St. Dev 9,41124 17,33425 10,43803 11,23981

Skewness 0,137 -0,683 -0,716 -0,35

Kurtosis -1,636 0,262 -1,372 -1,852

Στις περιπτώσεις που τα μεγέθη των δειγμάτων είναι μικρά, όπως εδώ, είναι ίσως

προτιμότερο να προχωράμε σε μη παραμετρικούς ελέγχους.

Page 11: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 11

Σημειώσεις Στατιστικής

:

:

Οι κατανομές των τεσσάρων πληθυσμών είναι ίδιες

Οι κατανομές των τεσσάρων πληθυσμών ΔΕΝ είναι όλες ίδιες μεταξύ τους

0

1

Καθώς, η εξαρτημένη μεταβλητή μας είναι ποσοτική οι παραπάνω υποθέσεις μπορούν να

διατυπωθούν και ως

:

:

Δεν υπάρχει διαφορά μεταξύ των τεσσάρων μεγεθών εφημερίφας, ως προς το κόστος διαφήμισης

Υπάρχει διαφορά σε τουλάχιστον ένα ζεύγος μεγεθών εφημερίδας, ως προς το κόστος διαφήμισης

0

1

Kruskal-Wallis Test

Ranks

GROUP N Mean Rank

COST

1 7 10,71

2 7 16,57

3 7 7,86

4 7 22,86

Total 28

Στον πίνακα Ranks παρατηρούμε ότι το μεγαλύτερο μέσο όρο βαθμίδων έχουν οι

εφημερίδες της ομάδας D(= 4), και ακολουθούν οι εφημερίδες της ομάδας Β (=2), της

ομάδας Α(=1) και τέλος της ομάδας C(=3)

Test Statisticsb,c

COST

Chi-Square 13,716

df 3

Asymp. Sig. ,003

Monte Carlo Sig. Sig. ,001a

99% Confidence Interval Lower Bound ,000

Upper Bound ,001

a. Based on 10000 sampled tables with starting seed 2000000.

b. Kruskal Wallis Test

c. Grouping Variable: GROUP

Page 12: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

12

Επειδή Asymp. Sig. = 0.003 < 0.05, η μηδενική υπόθεση απορρίπτεται και γίνεται δεκτή η

εναλλακτική.

Επομένως, υπάρχει διαφορά στο κόστος διαφήμισης μεταξύ των τεσσάρων μεγεθών,

δηλαδή ο παράγοντας μέγεθος φαίνεται να επηρεάζει το κόστος της διαφήμισης.

Στο ίδιο συμπέρασμα καταλήγουμε και στην περίπτωση που χρησιμοποιήσουμε τη μέθοδο

Monte Carlo, καθώς Monte Carlo Sig. = 0.001 < 0.005

Παράδειγμα 4

Μία διαφημιστική εταιρεία θέλει να ελέγξει αν η αποδοχή μιας διαφήμισης που ετοιμάζει

για ένα προϊόν έχει ή όχι ίδια σε διαφορετικές ηλικιακές ομάδες. Για το σκοπό αυτό επέλεξε

τυχαία 5 άτομα από κάθε ηλικιακή ομάδα και τους ζήτησε να χαρακτηρίσουν το

δοκιμαστικό.

Τα αποτελέσματα που πήρε είναι τα παρακάτω

Ηλικία

15 - 24 1 1 2 1 1

25 - 34 3 4 2 1 3

35 - 44 4 3 2 3 2

1 – Κακή, 2 – Μέτρια, 3 – Καλή, 4 – Πολύ Καλή

Η εξαρτημένη μεταβλητή είναι : ΒαθμολογίαY , και είναι μία διατακτική μεταβλητή.

Θα την ονομάσουμε GRADE.

Η ανεξάρτητη μεταβλητή είναι :ΗλικίαX , και είναι μία ονομαστική μεταβλητή με 3

επίπεδα.

Θα την ονομάσουμε AGE (1:15 - 24, 2:25 – 34, 3:35 – 44)

Αποτελέσματα με το SPSS και ερμηνεία

:

:

Η απήχηση της διαφήμισης είναι ίδια σε όλες τις ομάδες

Η απήχηση της διαφήμισης ΔΕΝ είναι ίδια σε όλες τις ομάδες

0

1

Kruskal-Wallis Test

Ranks

AGE N Mean Rank

GRAGE

1 5 3,90

2 5 9,60

3 5 10,50

Total 15

Page 13: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 13

Σημειώσεις Στατιστικής

Στον πίνακα Ranks παρατηρούμε ότι το μεγαλύτερο μέσο όρο βαθμίδων έχουμε στην 3η

ηλικιακή ομάδα (35 – 44), ακολουθεί η 2η ηλικιακή ομάδα (25 – 34) και τέλος η 1η ηλικιακή

ομάδα (15 – 24).

Test Statisticsb,c

GRAGE

Chi-Square 6,911

df 2

Asymp. Sig. ,032

Monte Carlo Sig. Sig. ,030a

99% Confidence Interval Lower Bound ,025

Upper Bound ,034

a. Based on 10000 sampled tables with starting seed 624387341.

b. Kruskal Wallis Test

c. Grouping Variable: AGE

Επειδή Asymp. Sig. = 0.032 < 0.05, η μηδενική υπόθεση απορρίπτεται και γίνεται δεκτή η

εναλλακτική.

Επομένως, υπάρχει διαφορά ανάμεσα στις ηλικιακές ομάδες, δηλαδή, ο παράγοντας ηλικία

φαίνεται να είναι καθοριστικός για την αποδοχή μιας διαφήμισης.

Στο ίδιο συμπέρασμα καταλήγουμε και στην περίπτωση που χρησιμοποιήσουμε τη μέθοδο

Monte Carlo, καθώς Monte Carlo Sig. = 0.030 < 0.005

Παράδειγμα 5

Σύμφωνα με το Mediaweek υπάρχουν τρεις μέθοδοι διαφήμισης στον Παγκόσμιο Ιστό.

Η μέθοδος 1 είναι η προβολή διαφημίσεων στους χρήστες που έκαναν κλικ σε ένα εικονίδιο

για τη διαφήμιση. Η μέθοδος 2 είναι η προβολή διαφημίσεων μέσω των επισκέψεων στη

σελίδα της εταιρίας. Η μέθοδος 3 χρησιμοποιεί για τη διαφήμιση ιστοσελίδες με ειδικά

στοχευμένο περιεχόμενο.

Για κάθε μέθοδο μετρήθηκε η ανταπόκριση των καταναλωτών, δηλαδή το πλήθος των

ατόμων που ανταποκρίθηκαν σε κάθε μέθοδο και έκανα τελικά μια αγορά, λαμβάνοντας

ένα τυχαίο δείγμα 9 ημερών για κάθε μέθοδο.

Ο στόχος της μελέτης ήταν να ελεγχθεί εάν ο παράγοντας μέθοδος διαφήμισης επιδρά

στην ανταπόκριση των καταναλωτών.

Page 14: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

14

Αποτελέσματα με το SPSS και ερμηνεία

Kruskal-Wallis Test

Ranks

ΜΕΘΟΔΟΣ N Mean Rank

ΑΝΤΑΠΟΚΡΙΣΗ ΚΑΤΑΝΑΛΩΤΩΝ

1 9 13,89

2 9 6,22

3 9 21,89

Total 27

Η εξαρτημένη μεταβλητή είναι : Ανταπόκριση καταναλωτώνY , και είναι μία ποσοτική

μεταβλητή.

Ονομάζεται ΑΝΤΑΠΟΚΡΙΣΗ ΚΑΤΑΝΑΛΩΤΩΝ.

Η ανεξάρτητη μεταβλητή είναι :ΜέθοδοςX , και είναι μία ονομαστική μεταβλητή με 3

επίπεδα.

1: Προβολή διαφημίσεων στους χρήστες που έκαναν κλικ σε ένα εικονίδιο για τη

διαφήμιση

2: Προβολή διαφημίσεων μέσω των επισκέψεων στη σελίδα της εταιρίας.

3: Διαφήμιση με ιστοσελίδες ειδικά στοχευόμενου περιεχομένου.

Στον πίνακα Ranks, παρατηρούμε ότι το μεγαλύτερο μέσο όρο βαθμίδων εμφανίζει

μέθοδος 3, ακολουθεί η μέθοδος 1 και τέλος η μέθοδος 2.

Test Statisticsb,c

ΑΝΤΑΠΟΚΡΙΣΗ ΚΑΤΑΝΑΛΩΤΩΝ

Chi-Square 17,534

df 2

Asymp. Sig. ,000

Monte Carlo Sig. Sig. ,000a

99% Confidence Interval Lower Bound ,000

Upper Bound ,000

a. Based on 10000 sampled tables with starting seed 2000000.

b. Kruskal Wallis Test

c. Grouping Variable: ΜΕΘΟΔΟΣ ΚΑΤΑΝΑΛΩΤΩΝ

:

:

Η ανταπόκριση των καταναλωτών είναι ίδια για τις τρεις μεθόδους διαφήμισης

Η ανταπόκριση των καταναλωτών ΔΕΝ είναι ίδια για τις τρεις μεθόδους διαφήμισης

0

1

Page 15: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 15

Σημειώσεις Στατιστικής

Επειδή Asymp. Sig. = 0.000 < 0.05, η μηδενική υπόθεση απορρίπτεται και γίνεται δεκτή η

εναλλακτική.

Επομένως, υπάρχει διαφορά μεταξύ των μεθόδων, δηλαδή, η μέθοδος διαφήμισης

φαίνεται να επηρεάζει την ανταπόκριση των καταναλωτών.

Στο ίδιο συμπέρασμα καταλήγουμε και στην περίπτωση που χρησιμοποιήσουμε τη μέθοδο

Monte Carlo, καθώς Monte Carlo Sig. = 0.000 < 0.005

Page 16: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

16

2. Η Δοκιμασία Χ2

2.1 Πίνακες Συνάφειας

Ένας πίνακας συνάφειας περιγράφει τη σχέση ανάμεσα σε δύο κατηγορικές μεταβλητές X

και Y που έχουν k και l επίπεδα, αντίστοιχα.

Για παράδειγμα, στον παρακάτω πίνακα συνάφειας οι μεταβλητές μας είναι:

: Ηλικιακή ΟμάδαX και

έχει k 3 επίπεδα , , 35 35 50 50

: Προτιμώμενο Μέσο Μαζικής ΕνημέρωσηςY και

έχει l 5 επίπεδα (Τοπικό κανάλι, Εθνικό κανάλι, Ραδιόφωνο, Εφημερίδα, Internet )

Ηλικιακή Ομάδα

ΜΜΕ <35 35 - 50 >50

Τοπικό κανάλι 3 6 10 19

Εθνικό κανάλι 12 13 18 43

Ραδιόφωνο 8 14 9 31

Εφημερίδα 5 7 10 22

Internet 20 12 3 35

48 52 50 150

Προέκυψε από μία έρευνα στην οποία 150 τυχαία επιλεγμένα άτομα απάντησαν στην

ερώτηση «ποιό ΜΜΕ προτιμάτε συνήθως για την ενημέρωσή σας;»

Στον πίνακα συνάφειας οι απαντήσεις εισάγονται κατά ηλικιακή ομάδα και κατά ΜΜΕ.

Τα δεδομένα μιας γραμμής, μας δείχνουν πώς κατανέμονται στις ηλικιακές ομάδες τα

άτομα που απάντησαν ότι προτιμούν για την ενημέρωσή τους ένα συγκεκριμένο ΜΜΕ. Στο

περιθώριο της γραμμής σημειώνεται το άθροισμα που μας δείχνει τον συνολικό αριθμό των

ατόμων που δήλωσαν ότι προτιμούν το συγκεκριμένο ΜΜΕ.

Έτσι, στη 2η δεύτερη γραμμή, βλέπουμε ότι:

43 από τα 150 άτομα που ρωτήθηκαν, απάντησαν ότι προτιμούν για την ενημέρωσή τους

Εθνικό κανάλι.

Από τα 43 άτομα που απάντησαν ότι προτιμούν για την ενημέρωσή τους το Εθνικό κανάλι,

τα 12 ανήκουν στην ηλικιακή ομάδα κάτω των 35, τα 13 στην ηλικιακή ομάδα 35 – 52 και

τέλος 18 ανήκουν στην ηλικιακή ομάδα άνω των 50.

Page 17: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 17

Σημειώσεις Στατιστικής

Αντίστοιχα, τα δεδομένα μιας στήλης, μας δείχνουν πώς κατανέμονται τα άτομα μιας

ηλικιακής ομάδας, ως προς την προτίμησή τους στα ΜΜΕ. Το άθροισμα στο περιθώριο της

στήλης, μας δείχνει πόσα από τα άτομα που ερωτήθηκαν ανήκουν στη συγκεκριμένη

ηλικιακή ομάδα.

Έτσι, στη 2η στήλη, βλέπουμε ότι:

52 από τα 150 άτομα που ρωτήθηκαν, ανήκαν στην ηλικιακή ομάδα 35 – 50.

Από τα 52 άτομα που ανήκουν στη ηλικιακή ομάδα 35 – 50, τα 6 απάντησαν ότι προτιμούν

για την ενημέρωσή τους τοπικό κανάλι, τα 13 ότι προτιμούν εθνικό κανάλι, τα 14 προτιμούν

ραδιοφωνικό σταθμό, 7 εφημερίδα και, τέλος 12 απάντησαν ότι για την ενημέρωσή τους

προτιμούν το Internet.

Τέλος, στη διασταύρωση της 2ης στήλης και της 2η γραμμής, βλέπουμε το πλήθος των

ατόμων που ανήκουν στην ηλικιακή ομάδα 35 – 50 και προτιμούν για την ενημέρωσή τους

Εθνικό κανάλι (δηλαδή 13 από τα 150).

2.2 Η δοκιμασία Χ2 ως έλεγχος ανεξαρτησίας

Στόχος της έρευνας είναι να διαπιστώσουμε εάν υπάρχει σχέση ανάμεσα στην ηλικιακή

ομάδα και την προτίμηση του ΜΜΕ. Ή, με άλλα λόγια, εάν η μεταβλητή (παράγοντας)

ηλικιακή ομάδα επηρεάζει την προτίμηση για την επιλογή ΜΜΕ.

Ο στατιστικός έλεγχος που χρησιμοποιούμε για να δούμε αν υπάρχει σχέση ανάμεσα σε

δύο κατηγορικές μεταβλητές (χαρακτηριστικά) ενός πληθυσμού είναι η δοκιμασία X 2 για

τον έλεγχο ανεξαρτησίας.

Οι υποθέσεις έχουν την εξής μορφή:

:

:

Οι κατηγορικές μεταβλητές είναι ανεξάρτητες

Οι κατηγορικές μεαβλητές δεν είναι ανεξάρτητες

0

1

Απόρριψη της μηδενικής υπόθεσης σημαίνει ότι υπάρχουν σημαντικές ενδείξεις ότι οι δύο

μεταβλητές σχετίζονται μεταξύ τους. Η μη απόρριψη της μηδενικής σημαίνει ότι δεν

υπάρχουν σημαντικές ενδείξεις για τη σχέση των δύο μεταβλητών. Έτσι, οι υποθέσεις μας

μπορούν να διατυπωθούν και ως:

:

:

Δεν υπάρχει σχέση ανάμεσα στις δύο κατηγορικές μεταβλητές

Υπάρχει σχέση ανάμεσα στις κατηγορικές μεταβλητές

0

1

Page 18: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

18

Αποτελέσματα με το SPSS και ερμηνεία

Οι μεταβλητές μας είναι:

MME για το προτιμώμενο Μέσο Μαζικής Ενημέρωσης

(1: Τοπικό κανάλι, 2 : Εθνικό κανάλι, 3: Ραδιόφωνο, 4: Εφημερίδα, 5 : Internet)

HLIKIA για την Ηλικιακή Ομάδα

(1 : <35, 2 :35 – 50, 3: >50)

COUNT για τις παρατηρούμενες συχνότητες

:

:

Οι μεταβλητές "Ηλικιακή ομάδα" και "Προτίμηση ΜΜΕ" είναι ανεξάρτητες

Οι μεταβλητές "Ηλικιακή ομάδα" και "Προτίμηση ΜΜΕ" δεν είναι ανεξάρτητες

0

1

MME * HLIKIA Crosstabulation

HLIKIA Total

1 2 3

MME

1

Count 3 6 10 19

Expected Count 6,1 6,6 6,3 19,0

% within MME 15,8% 31,6% 52,6% 100,0%

2

Count 12 13 18 43

Expected Count 13,8 14,9 14,3 43,0

% within MME 27,9% 30,2% 41,9% 100,0%

3

Count 8 14 9 31

Expected Count 9,9 10,7 10,3 31,0

% within MME 25,8% 45,2% 29,0% 100,0%

4

Count 5 7 10 22

Expected Count 7,0 7,6 7,3 22,0

% within MME 22,7% 31,8% 45,5% 100,0%

5

Count 20 12 3 35

Expected Count 11,2 12,1 11,7 35,0

% within MME 57,1% 34,3% 8,6% 100,0%

Total

Count 48 52 50 150

Expected Count 48,0 52,0 50,0 150,0

% within MME 32,0% 34,7% 33,3% 100,0%

Page 19: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 19

Σημειώσεις Στατιστικής

Πίνακας MME * HLIKIA Crosstabulation

Στα κελιά των γραμμών Count αναγράφονται οι παρατηρούμενες συχνότητες. Είναι,

δηλαδή, τα στοιχεία του πίνακα συνάφειας.

Στα κελιά των γραμμών Expected Count αναγράφονται οι αναμενόμενες συχνότητες.

Αυτές είναι οι συχνότητες που θα έπρεπε να υπάρχουν στον πίνακα συνάφειας για να

χαρακτηριστούν οι μεταβλητές Ηλικιακή Ομάδα και Προτιμώμενο ΜΜΕ ως ανεξάρτητες.

Η διαδικασία Χ2 βασίζεται στη σύγκριση ανάμεσα στις παρατηρούμενες και τις

αναμενόμενες συχνότητες. Προφανώς, εάν δεν υπάρχει σημαντική διαφορά ανάμεσά τους

οι μεταβλητές θα χαρακτηριστούν ως ανεξάρτητες, διαφορετικά θα δεχτούμε ότι είναι

εξαρτημένες. Παρατηρούμε ότι σε αρκετές περιπτώσεις η αποστάσεις ανάμεσα στις

παρατηρούμενες και τις αναμενόμενες συχνότητες είναι αρκετά μεγάλες.

Στα κελιά των γραμμών % within MME εμφανίζονται τα ποσοστά των ατόμων που ανήκουν

σε μια ηλικιακή ομάδα, με την προϋπόθεση ότι αυτά δείχνουν προτίμηση στο

συγκεκριμένο ΜΜΕ. Είναι, με άλλα λόγια, η ερμηνεία του πίνακα συνάφειας κατά

γραμμές.

Για παράδειγμα, από τα άτομα που προτιμούν για την ενημέρωσή τους Εθνικό κανάλι το

52,6% είναι ηλικίας άνω των 50 ετών.

Πίνακας Chi-Square Tests

Chi-Square Tests

Value df Asymp. Sig. (2-sided)

Pearson Chi-Square 21,637a 8 ,006

Likelihood Ratio 22,971 8 ,003

Linear-by-Linear Association

13,110 1 ,000

N of Valid Cases 150

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 6,08.

ΣΗΜΑΝΤΙΚΗ ΠΑΡΑΤΗΡΗΣΗ: Για να είναι έγκυρο το αποτέλεσμα της διαδικασίας Χ2, πρέπει:

(α) Το μέγεθος του δείγματος να είναι τετραπλάσιο των κελιών που δημιουργούνται

στον Πίνακα Συνάφειας.

(β) Το ποσοστό των κελιών με αναμενόμενες συχνότητες κάτω του 5, να είναι μικρότερο

από 20%.

(γ) Οι αναμενόμενες συχνότητες να μην είναι μικρότερες του 1.

Page 20: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

20

Στην εφαρμογή μας έχουμε:

(α) Στον Πίνακα Συνάφειας 15 κελιά: 5 3 15 Κατηγορίες Μ.Μ.Ε Ηλικιακές Ομάδες

Το μέγεθος του δείγματος είναι: 150Total , επομένως μεγαλύτερο από 4 15 60

και μας επιτρέπει να προχωρήσουμε στη διαδικασία του ελέγχου.

Η σημείωση

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 6,08.

που βρίσκεται κάτω από τον πίνακα Chi-Square Tests, μας πληροφορεί ότι:

(β) Το ποσοστό των κελιών με αναμενόμενη συχνότητα μικρότερη του 5, είναι 0% (άρα

μικρότερο του 20%).

(γ) Η μικρότερη αναμενόμενη συχνότητα (και συνεπώς όλες οι υπόλοιπες συχνότητες)

είναι 6,08 (άρα μεγαλύτερες του 1)

Επομένως, το συμπέρασμα του ελέγχου για την ανεξαρτησία των μεταβλητών θα είναι

έγκυρο.

Η τιμή του στατιστικού Pearson Chi-Square είναι 21,637, ενώ για το επίπεδο

σημαντικότητας έχουμε Asymp. Sig. (2-sided) = 0,006 < 0,05 και η μηδενική υπόθεση

απορρίπτεται.

Συνεπώς, υπάρχουν σημαντικές στατιστικές ενδείξεις ότι οι μεταβλητές «Ηλικιακή Ομάδα»

και «Προτιμώμενο ΜΜΕ» δεν είναι ανεξάρτητες και, συνεπώς, ο παράγοντας ηλικία

φαίνεται να επηρεάζει την προτίμηση για την επιλογή ΜΜΕ.

Παράδειγμα 6

Μια μεγάλη εταιρεία ενδιαφέρεται να διαπιστώσει εάν υπάρχει σχέση ανάμεσα στο χρόνο

μετακίνησης των εργαζομένων της και στα προβλήματα που αυτοί εμφανίζουν στη δουλειά

και συνδέονται με τα επίπεδα άγχους. Από μία μελέτη σε 116 υπαλλήλους πήρε τα

παρακάτω αποτελέσματα.

Χρόνος μετακίνησης

Επίπεδο

Άγχους Κάτω από 15 min 15 min – 45 min Πάνω από 45 min

Υψηλό 9 17 18 44

Μέτριο 5 8 6 19

Χαμηλό 18 28 7 53

32 53 31 116

Page 21: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 21

Σημειώσεις Στατιστικής

Οι μεταβλητές μας είναι:

TIME για το χρόνο μετακίνησης

(1: κάτω από 15min, 2 : 15 min – 45 min, 3: πάνω από 45 min)

STRESS για το επίπεδο άγχους

(1 : Υψηλό, 2 :Μέτριο, 3: Πάνω από 45)

COUNT για τις παρατηρούμενες συχνότητες

Υποθέσεις

:

:

Οι μεταβλητές "Χρόνος μετακίνησης" και "Επίπεδο άγχους" είναι ανεξάρτητες

Οι μεταβλητές "Χρόνος μετακίνησης" και "Επίπεδο άγχους" δεν είναι ανεξάρτητες

0

1

STRESS * TIME Crosstabulation

TIME Total

1 2 3

STRESS

1

Count 9 17 18 44

Expected Count 12,1 20,1 11,8 44,0

% within STRESS 20,5% 38,6% 40,9% 100,0%

2

Count 5 8 6 19

Expected Count 5,2 8,7 5,1 19,0

% within STRESS 26,3% 42,1% 31,6% 100,0%

3

Count 18 28 7 53

Expected Count 14,6 24,2 14,2 53,0

% within STRESS 34,0% 52,8% 13,2% 100,0%

Total

Count 32 53 31 116 Expected Count 32,0 53,0 31,0 116,0

% within STRESS 27,6% 45,7% 26,7% 100,0%

Από τους υπαλλήλους που εμφανίζουν υψηλό επίπεδο άγχους, το 20,5% αποτελούν αυτοί

που έχουν χρόνο μετακίνησης μικρότερο από 15 min, το 38,6% αποτελούν αυτοί που έχουν

χρόνο μετακίνησης 15min – 45 min και τέλος το 40,9% αποτελούν αυτοί που έχουν χρόνο

μετακίνησης μεγαλύτερο από 45 min.

Από τους υπαλλήλους που εμφανίζουν μέτριο επίπεδο άγχους, το 26,3% αποτελούν αυτοί

που έχουν χρόνο μετακίνησης μικρότερο από 15 min, το 42,1% αποτελούν αυτοί που έχουν

χρόνο μετακίνησης 15min – 45 min και τέλος το 31,6% αποτελούν αυτοί που έχουν χρόνο

μετακίνησης μεγαλύτερο από 45 min

Από τους υπαλλήλους που εμφανίζουν χαμηλό επίπεδο άγχους, το 34% αποτελούν αυτοί

που έχουν χρόνο μετακίνησης μικρότερο από 15 min, το 52,8% αποτελούν αυτοί που έχουν

Page 22: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

22

χρόνο μετακίνησης 15min – 45 min και τέλος το 13,2% αποτελούν αυτοί που έχουν χρόνο

μετακίνησης μεγαλύτερο από 45 min.

(α) Στον Πίνακα Συνάφειας έχουμε 9 κελιά: 3 3 9 επίπεδα Stress κατηγορίες χρόνου

Το μέγεθος του δείγματος είναι: 116Total , επομένως μεγαλύτερο από 4 9 36

και μας επιτρέπει να προχωρήσουμε στη διαδικασία του ελέγχου.

Chi-Square Tests

Value df Asymp. Sig. (2-sided)

Pearson Chi-Square 9,831a 4 ,043

Likelihood Ratio 10,218 4 ,037

Linear-by-Linear

Association 7,524 1 ,006

N of Valid Cases 116

a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 5,08.

(β) Το ποσοστό των κελιών με αναμενόμενη συχνότητα μικρότερη του 5, είναι 0% (άρα

μικρότερο του 20%).

(γ) Η μικρότερη αναμενόμενη συχνότητα (και συνεπώς όλες οι υπόλοιπες συχνότητες)

είναι 5,08 (άρα μεγαλύτερες του 1)

Επομένως, το συμπέρασμα του ελέγχου για την ανεξαρτησία των μεταβλητών θα είναι

έγκυρο.

Η τιμή του στατιστικού Pearson Chi-Square είναι 9.831, ενώ για το επίπεδο σημαντικότητας

έχουμε Asymp. Sig. (2-sided) = 0,043 < 0,05 και η μηδενική υπόθεση απορρίπτεται.

Επομένως, υπάρχουν σημαντικές στατιστικές ενδείξεις ότι οι μεταβλητές «Χρόνος

μετακίνησης» και «Επίπεδο άγχους» δεν είναι ανεξάρτητες και, συνεπώς, ο παράγοντας

χρόνος μετακίνησης φαίνεται να επηρεάζει το επίπεδο του άγχους.

Page 23: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ 2 23

Σημειώσεις Στατιστικής

6ο Θέμα (α – 5 μονάδες, β – 5 μονάδες)

Ένα άρθρο αναφέρει ότι οι μικρότερες επιχειρήσεις φαίνεται να προσλαμβάνουν

περισσότερους και να απολύουν λιγότερους υπαλλήλους από ότι οι μεγαλύτερες σε

μέγεθος επιχειρήσεις, καθώς η οικονομία ανακάμπτει. Οι παρακάτω πίνακας καταγράφει

τους εργαζόμενους που προσλήφθηκαν και απολύθηκαν, από ένα δείγμα 1032

εργαζομένων, σύμφωνα με το μέγεθος της επιχείρησης, καθώς και τα αποτελέσματα του

ελέγχου.

ΜΕΓΕΘΟΣ_ΕΠΙΧΕΙΡΗΣΗΣ * ΕΡΓΑΣΙΑ Crosstabulation

ΠΡΟΣΦΟΡΑ ΕΡΓΑΣΙΑΣ

Total ΠΡΟΣΛΗΨΕΙΣ ΑΠΟΛΥΣΕΙΣ

ΜΕΓΕΘΟΣ ΕΠΙΧΕΙΡΗΣΗΣ

ΜΙΚΡΗ

Count 210 32 242

Expected Count 193,5 48,5 242,0

% within ΜΕΓΕΘΟΣ_ΕΠΙΧΕΙΡΗΣΗΣ

86,8% 13,2% 100,0%

ΜΕΣΑΙΑ

Count 290 95 385

Expected Count 307,8 77,2 385,0

% within ΜΕΓΕΘΟΣ_ΕΠΙΧΕΙΡΗΣΗΣ

75,3% 24,7% 100,0%

ΜΕΓΑΛΗ

Count 325 80 405

Expected Count 323,8 81,2 405,0

% within ΜΕΓΕΘΟΣ_ΕΠΙΧΕΙΡΗΣΗΣ

80,2% 19,8% 100,0%

Total

Count 825 207 1032

Expected Count 825,0 207,0 1032,0

% within ΜΕΓΕΘΟΣ_ΕΠΙΧΕΙΡΗΣΗΣ

79,9% 20,1% 100,0%

( α ) Σε ποιό από τα τρία μεγέθη επιχειρήσεων καταγράφεται το μεγαλύτερο ποσοστό

προσλήψεων και σε ποιο των απολύσεων;

( β ) Υπάρχει ένδειξη ότι οι πρακτικές προσφοράς εργασίας εξαρτώνται από το μέγεθος

της επιχείρησης;

Chi-Square Tests

Value df Asymp. Sig. (2-sided)

Pearson Chi-Square 12,193a 2 ,002

Likelihood Ratio 12,671 2 ,002

Linear-by-Linear Association 2,349 1 ,125

N of Valid Cases 1032

a. 0 cells (,0%) have expected count less than 5. The minimum expected count

is 48,54.

Page 24: Η οκιμασία Χ2 - ΑΡΧΙΚΗ · Wine2 - Wine1 Negative Ranks 1a 3,00 3,00 Positive Ranks b4 3,00 12,00 Ties 0c Total 5 a. Wine2 < Wine1 b. Wine2 > Wine1 c. Wine2 =

Μή Παραμετρικοί Έλεγχοι & Δοκιμασία Χ2

Μαρίνα Σύρπη

24

2.3 Η δοκιμασία Χ2 ως έλεγχος ομοιογένειας

Η δοκιμασία 2X μπορεί να χρησιμοποιηθεί και ως έλεγχος για την ομοιογένεια των

πληθυσμών. Στην περίπτωση αυτή η υποθέσεις έχουν την εξής μορφή

:

:

Οι πληθυσμοί είναι ομοιογενείς

Οι πληθυσμοί δεν είναι ομοιογενείς

0

1

Έτσι, για την περίπτωση του 1ου παραδείγματος, οι υποθέσεις θα εξειδικεύονταν ως εξής:

:

:

Οι ηλικιακοί πληθυσμοί είναι ομοιογενείς, ως προς την προτίμησή τους στην επιλογή ΜΜΕ

Οι πληθυσμοί δεν είναι ομοιογενείς, ως προς την προτίμησή τους στην επιλογή ΜΜΕ

0

1

Η διαδικασία είναι η ίδια με την περίπτωση της δοκιμασίας για την ανεξαρτησία, και η

απόρριψη της μηδενικής υπόθεσης μας οδηγεί στο εξής συμπέρασμα:

Επομένως, υπάρχουν σημαντικές στατιστικές ενδείξεις ότι οι «Ηλικιακές Ομάδες» δεν είναι

ομοιογενείς ως προς την επιλογή ΜΜΕ, και, συνεπώς, ο παράγοντας ηλικία φαίνεται να

επηρεάζει την προτίμηση για την επιλογή ΜΜΕ.