Kefalaia Statistikis Gia Telikes Eksetaseis

138
1. ΒΑΣΙΚΕΣ ΑΡΧΕΣ ΤΗΣ ΕΠΑΓΩΓΙΚΗΣ ΣΤΑΤΙΣΤΙΚΗΣ Στο παρών κεφάλαιο θα συζητηθούν δύο γενικές έννοιες που σκοπό έχουν να διευκολύνουν την κατανόηση των στατιστικών εννοιών που ακολουθούν μιας και αποτελούν προαπαιτούμενη γνώση. Αυτές είναι: (α) η κανονική κατανομή, και, (β) η στατιστική σημαντικότητα. 1.1. Η Κανονική κατανομή (Gauss) Η κανονική κατανομή αποτελεί κεντρική ιδέα στο χώρο της περιγραφικής και επαγωγικής στατιστικής αφού εκφράζει πληθυσμούς και κάνει δυνατή την αξιολόγηση αυτών ειδικά όταν αξιολογούνται οι μέσοι όροι τους. Η κανονική κατανομή δημιουργήθηκε από τον Gauss και εκφράζεται με το παρακάτω διάγραμμα συχνοτήτων. Σχήμα 1.1. Κανονική κατανομή (Gauss) Σύμφωνα με την κατανομή αυτή, το μεγαλύτερο μέρος του πληθυσμού (στο Χ χαρακτηριστικό, π.χ., ευφυΐα) βρίσκεται στο μέσο όρο ενώ όσο πιο πολύ απομακρυνόμαστε από το μέσο όρο τόσο μικρότερη

Transcript of Kefalaia Statistikis Gia Telikes Eksetaseis

Page 1: Kefalaia Statistikis Gia Telikes Eksetaseis

1. ΒΑΣΙΚΕΣ ΑΡΧΕΣ ΤΗΣ ΕΠΑΓΩΓΙΚΗΣ ΣΤΑΤΙΣΤΙΚΗΣΣτο παρών κεφάλαιο θα συζητηθούν δύο γενικές έννοιες που σκοπό έχουν να διευκολύνουν την κατανόηση των στατιστικών εννοιών που ακολουθούν μιας και αποτελούν προαπαιτούμενη γνώση. Αυτές είναι: (α) η κανονική κατανομή, και, (β) η στατιστική σημαντικότητα.

1.1. Η Κανονική κατανομή (Gauss)Η κανονική κατανομή αποτελεί κεντρική ιδέα στο χώρο της περιγραφικής και επαγωγικής στατιστικής αφού εκφράζει πληθυσμούς και κάνει δυνατή την αξιολόγηση αυτών ειδικά όταν αξιολογούνται οι μέσοι όροι τους. Η κανονική κατανομή δημιουργήθηκε από τον Gauss και εκφράζεται με το παρακάτω διάγραμμα συχνοτήτων.

Σχήμα 1.1. Κανονική κατανομή (Gauss)Σύμφωνα με την κατανομή αυτή, το μεγαλύτερο μέρος του πληθυσμού (στο Χ χαρακτηριστικό, π.χ., ευφυΐα) βρίσκεται στο μέσο όρο ενώ όσο πιο πολύ απομακρυνόμαστε από το μέσο όρο τόσο μικρότερη γίνεται αυτή η συχνότητα1. Για αυτό και στον μέσο όρο, η κατανομή έχει το μεγαλύτερο ύψος της. Το σχήμα 1.1 απεικονίζει μια κανονική κατανομή η οποία, όπως

1Με άλλα λόγια το μεγαλύτερο μέρος του πληθυσμού αποτελείται από συνηθισμένους ανθρώπους και όσο μεγαλύτερη είναι η απόκλιση τόσο μικραίνει και αυτός ο αριθμός (αντιστρόφως ανάλογη σχέση).

Page 2: Kefalaia Statistikis Gia Telikes Eksetaseis

φαίνεται, έχει κωδωνοειδή μορφή και εύρος μεταξύ +- 3 τυπικών αποκλίσεων (οι οποίες θα συζητηθούν παρακάτω). Ο τύπος ο οποίος εκφράζει το διάγραμμα συχνοτήτων της κανονικής κατανομής είναι ο παρακάτω (τον οποίο ποτέ δεν θα χρειαστεί να χρησιμοποιήσετε), εντούτοις τον παραθέτω με το «μ» να εκφράζει το μέσο όρο και το «σ» την τυπική απόκλιση.

Όπως φαίνεται και από τον παραπάνω τύπο, η κανονική κατανομή δεν είναι τίποτε παραπάνω από ένα διάγραμμα συχνοτήτων. Το ύψος δε της κατανομής σε κάθε σημείο του χαρακτηριστικού (θέση στον οριζόντιο άξονα) εκφράζει το πλήθος των παρατηρήσεων που έχει αυτή την τιμή. Μάλιστα επειδή η κανονική κατανομή εκφράζει κατά βάση τα περισσότερα φαινόμενα στις κοινωνικές επιστήμες και άρα χαρακτηριστικά στον πληθυσμό γίνεται φανερό ότι η αξιολόγησή της με δείγματα προϋποθέτει την ύπαρξη αρκετά μεγάλων μεγεθών.

Σχήμα 1.2. Σχήματα κατανομών για διαφορετικό αριθμό ατόμων όταν το υπό-μελέτη φαινόμενο κατανέμεται κανονικά

Page 3: Kefalaia Statistikis Gia Telikes Eksetaseis

Για παράδειγμα το παραπάνω σχήμα εκφράζει τη σχέση του σχήματος της κατανομής και μεγέθους του δείγματος (για φαινόμενα που κατανέμονται κανονικά). Όπως φαίνεται στο σχήμα 1.2. όσο μεγαλύτερο είναι το μέγεθος του δείγματος τόσο μικρότερο είναι το «πλάτος» της κατανομής ενώ σε μικρά δείγματα το σχήμα δεν προσομοιάζει την κανονική κατανομή2 (πέρα από την πιθανότητα ύπαρξης στρεβλώσεων και κυρτώσεων).

Ενδιαφέρον επίσης είναι το γεγονός ότι με βάση την κανονική κατανομή μπορούμε να υπολογίσουμε τη θέση κάθε ατόμου στον πληθυσμό που ανήκει (ποσοστιαία τιμή). Αυτό γίνεται γιατί γνωρίζουμε ότι μεταξύ 3 και πλέον τυπικών αποκλίσεων από τον μέσο όρο (είτε προς τα πάνω είτε προς τα κάτω) περιλαμβάνονται οι περισσότερες παρατηρήσεις (δηλαδή το 99,7% του πληθυσμού). Ας δούμε όμως την έννοια της τυπικής απόκλισης. Η τυπική απόκλιση (Τ.Α.) εκφράζει την απόσταση των παρατηρήσεων (ατόμων) ενός πληθυσμού από το μέσο όρο τους σε σταθμισμένες μονάδες όπως φαίνεται στο παρακάτω σχήμα (σχήμα 1.3).

Σχήμα 1.3. Η έννοια της τυπικής απόκλισης στην κατανομή Gauss

2 Δηλαδή δεν έχει την σχετική κωδωνοειδή μορφή.

Page 4: Kefalaia Statistikis Gia Telikes Eksetaseis

Έτσι για παράδειγμα αν ένα άτομο απέχει +1 τυπική απόκλιση από το μέσο όρο έχει προφανώς μεγαλύτερη τιμή στο εν λόγω χαρακτηριστικό από ένα άτομο που έχει τυπική απόκλιση ίση με το μηδέν (δηλαδή βρίσκεται ακριβώς στο μέσο όρο). Επίσης, ως περιγραφικός δείκτης ενός πληθυσμού, η τυπική απόκλιση μας ενημερώνει για το «πλάτος» της κατανομής. Έτσι για παράδειγμα αν μια κατανομή έχει τυπική απόκλιση ίση με 5 μονάδες και κάποια ίση με 15 μονάδες είναι φανερό ότι η δεύτερη έχει μεγαλύτερο «πλάτος» ή με άλλα λόγια περιλαμβάνει παρατηρήσεις που είναι πιο «ανομοιογενείς» σε σχέση με την πρώτη κατανομή. Παραδείγματα κατανομών με ίδιο μέσο όρο αλλά διαφορετικές τυπικές αποκλίσεις ( και άρα «πλάτη» των κατανομών) απεικονίζονται στο σχήμα 1.4.

Σχήμα 1.4. Κανονικές κατανομές με τον ίδιο μέσο όρο και διαφορετικές τυπικές αποκλίσεις δείχνοντας τη σχέση τυπικής απόκλισης και σχήματος της κατανομής

Αν και το μέγεθος της τυπικής απόκλισης δεν φαίνεται να δημιουργεί κάποιο άμεσο πρόβλημα εντούτοις το «πλάτος» της κατανομής δημιουργεί προβλήματα σε σχετικούς στατιστικούς ελέγχους (αυτά τα ζητήματα θα συζητηθούν παρακάτω). Ο τύπος για τον υπολογισμό της τυπικής απόκλισης έχει ως εξής:

Page 5: Kefalaia Statistikis Gia Telikes Eksetaseis

Όπου το Σ εκφράζει το άθροισμα3, το Χ την τιμή ενός ατόμου, το Μ τον μέσο όρο του δείγματος στο χαρακτηριστικό που μελετάται, και το Ν το μέγεθος του δείγματος. Με άλλα λόγια η τυπική απόκλιση εκφράζει το κατά πόσο απέχουν οι παρατηρήσεις από το μέσο όρο του δείγματος (αφού οι μελέτες πραγματοποιούνται με δείγματα και όχι πληθυσμούς). Αποτελεί δε, την σταθμισμένη εκδοχή του δείκτη της διακύμανσης4, η οποία διακύμανση εκφράζεται με το τετράγωνο της τυπικής απόκλισης, όπως φαίνεται παρακάτω:

Όπως ειπώθηκε παραπάνω, ο δείκτης της διακύμανσης δεν χρησιμοποιείται με τον ίδιο επεξηγηματικό τρόπο που χρησιμοποιείται η τυπική απόκλιση γιατί οι τιμές που μπορεί να πάρει εκφράζουν το υπό-μελέτη χαρακτηριστικό (είναι αστάθμιστες) και άρα δεν είναι εύκολα αξιολογήσιμες. Εντούτοις, σε όλη την επαγωγική στατιστική μιλάμε για την έννοια της διακύμανσης (σε οποιαδήποτε μορφή της, σταθμισμένη και μη), αφού συνήθως αποτελεί το χαρακτηριστικό που κυρίως διερευνάται και προσπαθεί να εξηγηθεί/προβλεφθεί. Παρακάτω απεικονίζεται η κανονική κατανομή και η σχέση του διαγράμματος συχνοτήτων της κατανομής αυτής με την έννοια της τυπικής απόκλισης.

3 Δηλαδή αθροίστε ότι ακολουθεί μετά τα σύμβολο «Σ».4 Είναι ενδιαφέρον ότι αναφερόμαστε στη διακύμανση περισσότερο από ότι στην τυπική απόκλιση αφού η κατανόησή της είναι το ζητούμενο στην επαγωγική στατιστική. Οι μοναδικές περιπτώσεις που η συζήτηση περιστρέφεται γύρω από την τυπική απόκλιση είναι όταν πρέπει να γίνει κατανοητό το μέγεθος αυτής της διακύμανσης (δηλαδή απαιτείται ο λόγος της σε τυπικούς βαθμούς).

Page 6: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 1.5. Κανονική κατανομή και εύρος των τυπικών αποκλίσεων

Το σχήμα 1.5. απεικονίζει την κανονική κατανομή και τις ποσοστώσεις που καλύπτει το εύρος τους. Έτσι, για παράδειγμα, οι παρατηρήσεις του πληθυσμού που «περικλείονται μεταξύ μιας τυπικής απόκλισης είναι P(μ-s<x<μ+s) = 68,3% αυτών του δείγματος (όπου «μ» ο μέσος όρος της κατανομής στον πληθυσμό). Το αντίστοιχο ποσοστό των παρατηρήσεων που συμπεριλαμβάνονται εντός 2 τυπικών αποκλίσεων είναι 95% ενώ μεταξύ +- τριών τυπικών αποκλίσεων βρίσκεται το 99,7% των παρατηρήσεων ενός πληθυσμού (εφόσον το υπό-μελέτη φαινόμενο κατανέμεται κανονικά5). Μια άλλη απεικόνιση της σχέσης των τυπικών αποκλίσεων με την κανονική κατανομή

5 Τίποτε από τα παραπάνω δεν ισχύει αν το φαινόμενο δεν κατανέμεται κανονικά μιας και απουσία της συμμετρίας της κατανομής δεν θα έχουν νόημα οι τυπικές τιμές, οι αντίστοιχες ποσοστώσεις, κλπ.

Page 7: Kefalaia Statistikis Gia Telikes Eksetaseis

απεικονίζεται στο σχήμα 1.6 ενώ τα συγκεκριμένα ποσοστά κάθε περιοχής τυπικής απόκλισης απεικονίζονται στο σχήμα 1.7. Έτσι όπως απεικονίζεται στο σχήμα 1.7, μεταξύ μιας και δύο τυπικών αποκλίσεων υπάρχει το 13,6% του πληθυσμού (είτε προς τα πάνω είτε προς τα κάτω), ενώ μεταξύ δύο και τριών αποκλίσεων βρίσκεται μόνο το 2,1% του πληθυσμού. Πάνω δε, από τρεις τυπικές αποκλίσεις υπάρχει λιγότερο από 1/1000 του πληθυσμού και άρα αυτές οι τυπικές τιμές εκφράζουν κάτι εξαιρετικά σπάνιο (ανάλογα πάντα με το επίπεδο σπανιότητας).

Σχήμα 1.6. Τυπικές αποκλίσεις και ποσοστό των παρατηρήσεων στην κανονική κατανομή

Page 8: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 1.7. Ποσοστό του πληθυσμού που βρίσκεται σε διαφορετικές τιμές τυπικής απόκλισης με άθροισμα το 100%.

Η ύπαρξη της κανονικότητας αποτελεί προϋπόθεση για την πραγματοποίηση των περισσοτέρων στατιστικών ελέγχων (παραμετρικών μόνο). Εντούτοις, αυτό δεν σημαίνει ότι όλα τα φαινόμενα κατανέμονται κανονικά στον πληθυσμό. Πιθανός να υπάρχουν και χαρακτηριστικά τα οποία δεν παρουσιάζουν την κωδωνοειδή μορφή της κανονικής κατανομής (π.χ., η κατανομή των βαθμών στο δημοτικό σχολείο παλαιότερα που από το πιθανό εύρος των 10 μονάδων όλοι οι μαθητές-τριες βαθμολογούνταν με 9-10 και σε σπάνιες περιπτώσεις με το 8). Για την απόκλιση από την κανονικότητα υπάρχουν δύο σημαντικοί στατιστικοί δείκτες οι οποίοι πρέπει να αξιολογούνται επαγωγικά. Ο ένας αφορά στην στρέβλωση (skewness) της κατανομής, όπως φαίνεται στο παρακάτω σχήμα με το επίθετο «θετική» ή «αρνητική» στρέβλωση να εκφράζει την κατεύθυνση από την οποία απουσιάζουν οι παρατηρήσεις:

Σχήμα 1.8. Κατανομές με αρνητική και θετική στρέβλωση, αντίστοιχα

Ο δεύτερος δείκτης που εκφράζει την απόκλιση από την κανονική κατανομή αναφέρεται στην κύρτωση6 (ή κυρτότητα) όπως φαίνεται παρακάτω με την λεπτόκυρτη κατανομή να έχει ασυνήθιστα υψηλή

6 Άλλες παραλλαγές της λεπτόκυρτης κατανομής μπορεί να εκφράζονται με την ύπαρξη δύο κορυφών.

Page 9: Kefalaia Statistikis Gia Telikes Eksetaseis

κορυφή, την μεσόκυρτη να έχει μεγαλύτερο εύρος από την κανονική κατανομή (αλλά να προσομοιάζει σημαντικά αυτήν) και την πλατύκυρτη σχεδόν να μην έχει κορυφή:

Σχήμα 1.9. Ύπαρξη διαφορετικών μορφών κύρτωσης στα δεδομένα

Τυπικές Τιμές. Οι τυπικές τιμές είναι εξαιρετικά σημαντικές στην περιγραφική αλλά και επαγωγική στατιστική αφού μας διευκολύνουν να καταλάβουμε τα χαρακτηριστικά ενός πληθυσμού (ή των ατόμων μεταξύ τους) σε λόγο που είναι σταθμισμένος και άρα κατανοητός. Με άλλα λόγια είναι εξαιρετικά πιο κατανοητό να καταλάβουμε τη θέση ενός ατόμου στην ευφυΐα αν γνωρίζουμε ότι η επίδοσή του είναι μια τυπική απόκλιση πάνω από το μέσο όρο (και άρα βρίσκεται στην 84,1% ποσοστιαία θέση όπως φαίνεται στο σχήμα 1.10) σε σχέση με το να πούμε ότι ο δείκτης ευφυΐας του είναι 115 μονάδες (όταν δεν γνωρίζουμε τον μέσο όρο και την τυπική απόκλιση στον πληθυσμό). Για να εξάγει κάποιος το ίδιο συμπέρασμα αναφορικά με την ποσοστιαία θέση του ατόμου θα πρέπει να γνωρίζει τον μέσο όρο της ευφυΐας και την τυπική απόκλιση (που είναι 100 και 15 μονάδες, αντίστοιχα) κάτι που συνήθως δεν γνωρίζουμε7

για όλα τα χαρακτηριστικά που μελετάμε. Μερικές από 7 Στην ευφυΐα είναι εύκολο να εξάγουμε το συμπέρασμα ότι το άτομο με δείκτη 115 μονάδες βρίσκεται πάνω από το μέσο όρο γιατί είναι ένας δείκτης με τον οποίο ο περισσότερος κόσμος είναι εξοικειωμένος. Για άλλα χαρακτηριστικά όμως είναι φανερό ότι οι «ωμές» (αστάθμιστες τιμές) δεν θα έχουν κανένα νόημα.

Page 10: Kefalaia Statistikis Gia Telikes Eksetaseis

τις πιο συνηθισμένες τυπικές τιμές απεικονίζονται στο σχήμα 1.10. Οι πιο συνηθισμένες είναι οι τιμές Ζ και οι τιμές Τ για τις οποίες οι μαθηματικοί τύποι έχουν ως εξής:

και,

Έτσι για παράδειγμα αν ο μέσος όρος της ευφυΐας στον πληθυσμό είναι 100 μονάδες και η τυπική απόκλιση ίση με 15 μονάδες, η τιμή Ζ ενός ατόμου με δείκτη ευφυΐας ίσο με 97 μονάδες θα είναι ίση με -0,2 (που σημαίνει ότι βρίσκεται λίγο κάτω από το μέσο όρο).

Η ίδια επίδοση ως τιμή Τ θα έχει ως εξής:μονάδες Τ.

Που επίσης δηλώνει ότι το άτομο αυτό βρίσκεται λίγο κάτω από το μέσο όρο αφού ο μέσος όρος της κατανομής Τ είναι ίσος με 50 μονάδες.

Σχήμα 1.10. Κανονική κατανομή και τυπικές τιμές

Page 11: Kefalaia Statistikis Gia Telikes Eksetaseis

Ας δοκιμάσουμε να απαντήσουμε στο ερώτημα πόσα άτομα βρίσκονται μεταξύ δύο συγκεκριμένων τιμών της κανονικής κατανομής, π.χ., μεταξύ 110 και 118 μονάδων. Αρχικά θα πρέπει να υπολογίσουμε τις αντίστοιχες τιμές Ζ οι οποίες έχουν ως εξής:Για Χ = 110

Ζ=χ-μ/σ = (110-100)/15 = 0,67

και για Χ = 118

Ζ=χ-μ/σ = (118-100)/15 = 1,2

Συνεπώς θα πρέπει να υπολογίσουμε το μέγεθος της περιοχής της κατανομής (σε ποσοστό επί τοις εκατό) το οποίο βρίσκεται ανάμεσα στις τιμές Ζ = 0,67 και Ζ = 1,2. Για το σκοπό αυτό πρέπει να ανατρέξουμε στο Παράρτημα Α όπου παρατηρούμε ότι η ποσοστιαία τιμή για Ζ = 0,67 είναι ίση με 74,8% ενώ για Ζ = 1,2 είναι ίση με 88,4%. Συνεπώς 88,4-74,8=13,6% του πληθυσμού βρίσκεται μεταξύ των τιμών 110 και 118.

1.2. Παράδειγμα Αξιολόγησης της Κανονικότητας της Κατανομής στο χαρακτηριστικό του άγχουςΑς υποθέσουμε ότι θέλουμε να αξιολογήσουμε το κατά πόσο το άγχος των μαθητών στο δημοτικό σχολείο κατανέμεται κανονικά. Η κατανομή αυτών των δεδομένων παρουσιάζεται παρακάτω. Οι περισσότεροι αναλυτές θα θεωρούσαν την παρακάτω κατανομή «κανονική» (σχήμα 1.11) και θα προχωρούσαν στην πραγματοποίηση παραμετρικών στατιστικών ελέγχων. Εντούτοις το σχήμα 1.12 αναδεικνύει κάποια ζητήματα που προκύπτουν από την κατανομή των δεδομένων. Για παράδειγμα, στα αριστερά της κατανομή απουσιάζουν ικανοποιητικές συχνότητες χαμηλών τιμών. Επίσης, στο μέσο περίπου της κατανομής φαίνεται να υπάρχει ένας μεγαλύτερος (από τον προσδοκώμενο) αριθμός παρατηρήσεων, γεγονός που προτείνει την ύπαρξη κύρτωσης στην κατανομή. Επίσης, φαίνεται να υπάρχει μικρή στρέβλωση σε μεγαλύτερες τιμές από το μέσο όρο

Page 12: Kefalaia Statistikis Gia Telikes Eksetaseis

αφού οι συχνότητες αυτών των τιμών ήταν αρκετά μεγάλες (σε τιμές εύρους 75-80).

Σχήμα 1.11. Κατανομή της μεταβλητής άγχους για μαθητές δημοτικού

Page 13: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 1.12. Κατανομή του άγχους με σχετική ανάλυση για το φαινόμενο της κανονικότητας

Σχήμα 1.13. Διάγραμμα Q-Q για την αξιολόγηση της ύπαρξης κανονικής κατανομής στο άγχος

Page 14: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 1.14. Αποδομημένο Q-Q σχήμα της κατανομής του άγχους

Στο παραπάνω (σχήμα 1.13) εμφανίζεται το διάγραμμα Q-Q το οποίο εκφράζει την κανονική κατανομή όταν τα δεδομένα είναι πάνω στη διαγώνιο. Από την οπτική ανάλυση του παρακάτω σχήματος φαίνεται ότι στα άκρα (δηλαδή σε τιμές άγχους που είναι πολύ μικρές ή πολύ μεγάλες) υπάρχει σχετική8 απόκλιση από την κανονική κατανομή. Οι ενδείξεις λοιπόν από την ανάλυση του παραπάνω σχήματος επιβεβαιώνονται από το σχήμα Q-Q. Επίσης, το αποδομήμενο σχήμα Q-Q (Detrended Q-Q Plot) δείχνει για μια ακόμη φορά ότι τα δεδομένα αποκλίνουν από την κανονικότητα. Σύμφωνα με το αποδομημένο σχήμα, οι τιμές θα πρέπει να βρίσκονται γύρω από την οριζόντια γραμμή (δηλαδή το μηδέν) και μάλιστα με τυχαίο τρόπο (δηλαδή χωρίς να εμφανίζεται κάτι συστηματικό στο σχήμα). Αντίθετα,

8 Σχετική στο βαθμό που αυτή η διαπίστωση εκφράζεται από την οπτική ανάλυση του σχήματος και μόνο. Είναι προφανές ότι η στατιστική ως επιστήμη χρησιμοποιεί αντικειμενικά κριτήρια για αυτή την απόφαση.

Page 15: Kefalaia Statistikis Gia Telikes Eksetaseis

στο σχήμα 1.14 φαίνεται ότι στα άκρα της κατανομή υπάρχουν οπτικά μεγάλες αποκλίσεις.

Σχήμα 1.15. Σχήμα Box για την αξιολόγηση της κατανομής των δεδομένων του άγχους

Τέλος από την ανάλυση του σχήματος Box (σχήμα 1.15) φαίνεται για μια ακόμη φορά ότι το πρόβλημα εντοπίζεται9 κυρίως στο κάτω μέρος της κατανομής (στις μικρές τιμές) στις οποίες υπάρχουν και δύο αποκλίνουσες παρατηρήσεις (σε αποστάσεις μεγαλύτερες των τριών τυπικών αποκλίσεων.

1.3. Η έννοια της στατιστικής σημαντικότηταςΥπάρχουν διαφορετικοί τρόποι για να οριστεί η στατιστική σημαντικότητα. Παρακάτω αναφέρονται κάποιοι από αυτούς ώστε να γίνει ως έννοια κατανοητή:

Η στατιστική σημαντικότητα εκφράζει την σπανιότητα του ευρήματος. Δηλαδή το κατά πόσο τα αποτελέσματα 9 Παρόλη τη μεγάλη συζήτηση στο παράδειγμα αυτό ο σχετικός στατιστικός έλεγχος έδειξε ότι η παρατηρήσιμη κατανομή δεν απέκλινε σημαντικά από την κανονική κατανομή (με τον έλεγχο Kolmogorov-Smirnov).

Page 16: Kefalaia Statistikis Gia Telikes Eksetaseis

της έρευνας συνάδουν με την υιοθέτηση της εναλλακτικής υπόθεσης, σε σχέση πάντα με τη μηδενική. Η ύπαρξη ενός στατιστικά σημαντικού ευρήματος σημαίνει ότι υπάρχει κάτι αξιόλογο που πρέπει να ειπωθεί, το οποίο ξεφεύγει από τα όρια του συνηθισμένου (και άρα τυχαίου) ευρήματος. Το στατιστικά σημαντικό εύρημα είναι τόσο σπάνιο ώστε να παρατηρείται μόνο 5 στις 100 φορές (όσο είναι και το επίπεδο στατιστικής σημαντικότητας). Επομένως αποτελεί ένα εξαιρετικά σπάνιο εύρημα που είναι άξιο λόγου.

Το επίπεδο της στατιστικής σημαντικότητας, πάνω στο οποίο βασίζεται όλο το οικοδόμημα της επαγωγικής στατιστικής, έχει οριστεί στις κοινωνικές επιστήμες στο επίπεδο 5%. Αυτό το επίπεδο, εντούτοις, είναι αυθαίρετο και στην διακριτική ευχέρεια του ερευνητή-τριας να το μεταβάλει. Έτσι θα το δούμε σε διαφορετικά πεδία έρευνας να μεταβάλλεται με πιθανές τιμές τις 1%, 1/1000, ή 10%. Αποκλίσεις από αυτές τις τιμές πιθανώς να δημιουργούσαν απορίες10. Η δε αυθαιρεσία του επιπέδου σημαντικότητας αποτελεί πόλο προβληματισμού στην επιστήμη της στατιστικής αφού, όπως γίνεται κατανοητό, το επίπεδο σημαντικότητας 5% σημαίνει ότι ένα εύρημα το οποίο εκφράζεται με μια πιθανότητα ίση με 4,9% είναι σπάνιο, άξιο λόγου, και υιοθετεί ο ερευνητής-τρια την εναλλακτική υπόθεση, ενώ μια πιθανότητα ίση με 5%11 εκφράζει ένα τυχαίο εύρημα, ανάξιο λόγου, και τη υιοθέτηση της μηδενικής υπόθεσης.

10 Απορίες αναφορικά με το ερώτημα μήπως η επιλογή του επιπέδου έχει να κάνει με τα ουσιαστικά ευρήματα μιας μελέτης. Για παράδειγμα αν επιλεχθεί το 6,5% και όλα τα ευρήματα είναι σημαντικά σε αυτό το επίπεδο αλλά όχι στο συνηθισμένο 5%, δημιουργούνται εύλογα ερωτηματικά σχετικά με την σκοπιμότητα του νέου επιπέδου.11 Το 5% παύει να είναι σημαντικό αφού το επίπεδο σημαντικότητας προϋποθέτει ότι α < 5% για να υιοθετηθεί η εναλλακτική υπόθεση. Συνεπώς μόνο πιθανότητες μικρότερες του 5% θεωρούνται ότι εκφράζουν στατιστικά σημαντικά ευρήματα.

Page 17: Kefalaia Statistikis Gia Telikes Eksetaseis

Σφάλματα Τύπου-Ι και Τύπου-ΙΙ. Η ύπαρξη οποιασδήποτε μορφής σφάλματος (λάθους γενικότερα) είναι καταστροφική στην στατιστική αφού ο ερευνητής-τρια θα καταλήξει σε λάθος συμπεράσματα. Δύο από τα λάθη τα οποία σχετίζονται με την χρήση στατιστικών ελέγχων είναι τα Τύπου-Ι και Τύπου-ΙΙ. Ο παρακάτω πίνακας περιγράφει τα πιθανά ενδεχόμενα για την πραγματοποίησή τους.

Πίνακας 1.1. Πραγματοποίηση σφαλμάτων Τύπου-Ι και Τύπου-ΙΙ.

Σύμφωνα με τον πίνακα 1.1, όταν στην πραγματικότητα η παρέμβαση Χ είναι αποτελεσματική, και ο στατιστικός έλεγχος ξεπερνά επίπεδα στατιστικής σημαντικότητας (πρώτο κελί αριστερά) τότε δεν έχουμε πραγματοποιήσει κάποιο σφάλμα (επιβεβαιώνεται αληθώς η εναλλακτική υπόθεση). Όταν όμως η παρέμβαση δεν έχει σημαντική επίδραση και ο ερευνητής-τρια αποφασίζει ότι έχει επίδραση τότε πραγματοποιεί σφάλμα Τύπου-Ι (κελί πάνω δεξιά). Με άλλα λόγια επαληθεύει, λανθασμένα, την εναλλακτική υπόθεση (ή όπως θα μπορούσαμε να πούμε βρίσκει «περισσότερα» από αυτά που υπάρχουν). Στην περίπτωση που η παρέμβαση έχει στην πραγματικότητα θετική επίδραση και ο ερευνητής-τρια επιβεβαιώνει την μηδενική υπόθεση, τότε πραγματοποιεί σφάλμα Τύπου-ΙΙ (δηλαδή αποτυχαίνει να επιβεβαιώσει την εναλλακτική υπόθεση όταν αυτή είναι αληθινή). Τέλος, στην περίπτωση που η παρέμβαση δεν έχει στην πραγματικότητα σημαντική επίδραση και ο ερευνητής-τρια επιβεβαιώσει αυτό το φαινόμενο, τότε δεν πραγματοποιείται κάποιο σφάλμα (κελί κάτω δεξιά).

Page 18: Kefalaia Statistikis Gia Telikes Eksetaseis

Παρόλο που δεν θα ήθελα να μπω σε διαδικασία σύγκρισης μεταξύ των δύο σφαλμάτων και ποιο από τα δύο είναι πιο σοβαρό, υπάρχουν ερευνητές-τριες που θεωρούν το σφάλμα Τύπου-ΙΙ ως λιγότερο σοβαρό, ειδικά σε πειραματικά ερευνητικά σχέδια, με την έννοια ότι παρεμβάσεις που στην ουσία είναι σημαντικές, δεν θα αξιολογηθούν ως σημαντικές και οι σχετικοί ερευνητές-τριες θα συνεχίσουν τις προσπάθειές τους προκειμένου να τις βελτιώσουν ώστε να αναδειχθεί η σημαντικότητά τους στο μέλλον. Αντίθετα στο σφάλμα Τύπου-Ι, μια παρέμβαση η οποία δεν έχει ουσιαστική συνεισφορά θα ερμηνευθεί ότι έχει, και αυτό μπορεί να αποβεί μοιραίο για τον σχετικό πληθυσμό (ο οποίος δεν θα δεχτεί ποτέ τις ευεργετικές ιδιότητες της παρέμβασης που περιμένει12).

1.4. Η σχέση της στατιστικής σημαντικότητας με την κανονική κατανομήΑς δούμε τώρα την έννοια της στατιστικής σημαντικότητας στο πλαίσιο της κανονικής κατανομής με μονάδα ανάλυσης το άτομο13. Σύμφωνα με την στατιστική σημαντικότητα υιοθετείται η εναλλακτική υπόθεση όταν ένα φαινόμενο παρατηρείται λιγότερες από 5 στις 100 φορές (α = 5%). Στο πλαίσιο του ατόμου αυτό σημαίνει ότι π.χ., ο Γιάννης έχει μέσο όρο ευφυΐας (εξαρτημένη μεταβλητή) ίσο με το 5% και λιγότερο μέρος του πληθυσμού, είτε προς τα πάνω είτε προς τα κάτω.

12Με εξαίρεση την επίδραση εξαιτίας του φαινομένου του placebo.13Σε επίπεδο ομάδων θα οριστούν οι αντίστοιχες έννοιες στις σχετικές ενότητες σύγκρισης μέσων όρων (π.χ., Τ-Τεστ για ένα δείγμα).

Page 19: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 1.16. Το 5% στην κανονική κατανομή για μονόπλευρο τεστ

Σχήμα 1.17. Το 5% στην κανονική κατανομή σε επίπεδο δίπλευρου τεστ

Το επίπεδο της στατιστικής σημαντικότητας 5% μπορεί να αξιολογηθεί στη μία πλευρά μόνο της κατανομής (είτε μόνο προς τα πάνω είτε μόνο προς τα κάτω) εφόσον η ερευνητική υπόθεση δείχνει κατεύθυνση. Στην περίπτωση του Γιάννη αυτό θα μπορούσε να διατυπωθεί με την διερεύνηση της υπόθεσης ότι ο δείκτης ευφυΐας του είναι σημαντικά χαμηλότερος από το μέσο όρο (και άρα στο αν ο Γιάννης έχει νοητική υστέρηση). Στην περίπτωση αυτή, αφού αξιολογούμε μόνο την μια πλευρά

Page 20: Kefalaia Statistikis Gia Telikes Eksetaseis

(ουρά) της κατανομής μιλάμε για τη χρήση του μονόπλευρου τεστ (σε σχέση με το δίπλευρο) (βλέπε σχήμα 1.16). Επομένως, στην περίπτωση του μονόπλευρου τεστ θα διατυπώναμε τις εξής υποθέσεις:

Η0: Ο μέσος όρος του Γιάννη δεν είναι σημαντικά μικρότερος από αυτόν του γενικού πληθυσμού (δηλαδή δεν έχει νοητική υστέρηση).Ηε: Ο μέσος όρος του Γιάννη είναι σημαντικά μικρότερος από τον μέσο όρο του πληθυσμού (επομένως ο Γιάννης έχει νοητική υστέρηση).

Επειδή πολλοί ερευνητές-τριες θα θεωρούσαν την παραπάνω υπόθεση «προκατειλημμένη» με την έννοια ότι δεν δίνουν στον Γιάννη καμία πιθανότητα να είναι καλύτερος από το μέσο όρο, η χρήση του μονόπλευρου τεστ (δηλαδή της υπόθεσης με κατεύθυνση) δεν είναι ιδιαίτερα διαδεδομένη. Αντίθετα γίνεται συνήθως χρήση του δίπλευρου τεστ (σχήμα 1.17) όπου δίνεται ίση πιθανότητα να προκύψει εύρημα είτε στο κάτω άκρο της κατανομής είτε στο πάνω. Για το λόγο αυτό, το επίπεδο στατιστικής σημαντικότητας 5% μοιράζεται στις δύο πλευρές της κατανομής προκειμένου να διερευνηθούν τα δύο ενδεχόμενα. Συνεπώς, η περιοχή απόρριψης στο δίπλευρο τεστ αποτελείται από 2,5% στο κάτω μέρος της κατανομής και 2,5% στο πάνω μέρος. Στην περίπτωση λοιπόν του δίπλευρου τεστ, θα διατυπώναμε τις παρακάτω υποθέσεις:

Η0: Ο μέσος όρος του Γιάννη δεν είναι σημαντικά διαφορετικός από αυτόν του γενικού πληθυσμού (δηλαδή ο Γιάννης είναι ένα παιδί που είτε δεν έχει νοητική υστέρηση είτε είναι ιδιαίτερα ευφυής-δηλαδή δεν συμβαίνει τίποτε από τα δύο).Ηε: Ο μέσος όρος του Γιάννη είναι σημαντικά διαφορετικός από τον μέσο όρο του πληθυσμού (επομένως ο Γιάννης είτε έχει νοητική υστέρηση είτε είναι εξαιρετικά έξυπνος).

Στην πραγματικότητα, η διαφορά του μονόπλευρου τεστ από το δίπλευρο είναι ότι στο πρώτο έχουμε διπλάσια

Page 21: Kefalaia Statistikis Gia Telikes Eksetaseis

πιθανότητα να ανιχνεύσουμε στατιστικά σημαντικά ευρήματα αφού η περιοχή απόρριψης είναι διπλάσια (στο μονόπλευρο τεστ) σε σχέση με το δίπλευρο. Για αυτό το λόγο προτιμάται το δεύτερο, και ενισχύεται η άποψη ότι το πρώτο εκφράζει εν μέρει μια προκατάληψη από μέρους των ερευνητών (αφού αυτόματα ο ερευνητής-τρια διπλασιάζει τις πιθανότητές του να βρει στατιστικά σημαντικά ευρήματα.

Ας δούμε το παράδειγμα του Γιάννη με αριθμούς. Ας υποθέσουμε ότι ο Γιάννης έχει δείκτη ευφυΐας ίσο με 75 μονάδες ενώ ο μέσος όρος της κατανομής στον πληθυσμό είναι ίσος με 100 μονάδες και η τυπική απόκλιση στον πληθυσμό είναι ίση με 15 μονάδες. Αρχικά πρέπει να μετατρέψουμε την παρατηρούμενη τιμή σε τιμή Ζ προκειμένου να βρούμε την θέση του Γιάννη στην πληθυσμιακή κατανομή. Με βάση λοιπόν τον τύπο Ζ = χ-μ/σ, έχουμε Ζ = 75-100/15, και άρα τιμή Ζ για τον Γιάννη ίση με Ζ = -1,67 μονάδες. Ας υποθέσουμε τώρα ότι έχουμε διατυπώσει την πρώτη από τις υποθέσεις και το μονόπλευρο τεστ. Σε αυτή την περίπτωση η κρίσιμη τιμή αφορά το 5% της περιοχής προς τα κάτω14 (περιοχή απόρριψης). Αν δούμε λοιπόν το παρακάτω απόσπασμα από το Παράρτημα Α, θα δούμε ότι η κρίσιμη τιμή για το μονόπλευρο τεστ είναι ίση με 1,65 μονάδες Ζ, αφού το 95% της περιοχής αντιστοιχεί στην τιμή Ζ = +-1,65. Επειδή λοιπόν η παρατηρήσιμη τιμή του Γιάννη Ζ = -1,67, είναι μικρότερη από την κρίσιμη τιμή -1,65 (στα αριστερά της κατανομής), τότε ο Γιάννης θα βρεθεί στην περιοχή απόρριψης της κατανομής και επομένως θα πρέπει να υιοθετήσουμε την εναλλακτική υπόθεση ότι ο Γιάννης έχει νοητική υστέρηση.

14Και όχι το 2,5% που αντιστοιχεί στο δίπλευρο τεστ.

Page 22: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 1.18. Απόσπασμα από το Παράρτημα Α για την μετατροπή των τιμών Ζ σε ποσοστά επί τοις εκατό

Σχήμα 1.19. Η θέση του Γιάννη εντός της περιοχής απόρριψης στο μονόπλευρο τεστ

Στην περίπτωση που υιοθετήσουμε το δεύτερο σετ υποθέσεων (χωρίς κατεύθυνση) και άρα το δίπλευρο τεστ, τότε θα αξιολογούσαμε την τιμή Ζ του Γιάννη αναφορικά με το 2,5% του πάνω μέρους της κατανομής και το 2,5% του κάτω μέρους της κατανομής (σχήμα 1.17). Σύμφωνα με το σχήμα 1.18, η κρίσιμη τιμή για το δίπλευρο τεστ είναι ίση με 1,96 μονάδες. Συνεπώς στην περίπτωση αυτή ο Γιάννης δεν θα βρισκόταν εντός της περιοχής απόρριψης αφού η τιμή του -1,67 βρίσκεται δεξιά από την περιοχή απόρριψης (η οποία οριοθετείται από την τιμή -1,96. Το συμπέρασμα λοιπόν από το δίπλευρο τεστ θα ήταν υπέρ της υιοθέτησης της μηδενικής υπόθεσης ότι ο Γιάννης ανήκει στον τυπικό πληθυσμό (και άρα δεν έχει νοητική υστέρηση). Από το παραπάνω παράδειγμα γίνεται φανερό πως η υιοθέτηση ενός στατιστικού ελέγχου μονής ή διπλής κατεύθυνσης μπορεί να είναι καθοριστική σχετικά με την υιοθέτηση μιας εκ των δύο υποθέσεων. Το σημαντικό είναι ο ερευνητής-τρια να έχει από την αρχή αποφασίσει για την

Page 23: Kefalaia Statistikis Gia Telikes Eksetaseis

χρήση του συγκεκριμένου επιπέδου στατιστικής σημαντικότητας, για την χρήση μονόπλευρου ή δίπλευρου τεστ, κλπ. Δεν επιτρέπεται η αλλαγή αυτών των παραμέτρων ανάλογα με το εκάστοτε στατιστικό εύρημα. 1.5. ΚατακλείδαΗ έννοια της κανονικής κατανομής και της στατιστικής σημαντικότητας αποτελούν κυρίαρχες ιδέες της επαγωγικής στατιστικής. Η κατανόησή τους αποτελεί προαπαιτούμενο για όλες τις έννοιες που ακολουθούν και για αυτό συνίσταται η καλή κατανόησή τους πριν ο-η αναγνώστης-τρια προχωρήσει στις έννοιες των παρακάτω κεφαλαίων.

Page 24: Kefalaia Statistikis Gia Telikes Eksetaseis

2. ΣΥΓΚΡΙΣΗ ΔΥΟ ΜΕΣΩΝ ΟΡΩΝ (Τ-ΤΕΣΤ)Είναι η ευφυΐα των παιδιών μιας τάξης διαφορετική από αυτή του γενικού πληθυσμού; Είναι τα επίπεδα άγχους μια τάξης δημοτικού αστικής περιοχής διαφορετικά από τον μέσο όρο του πληθυσμού αυτής της περιοχής; Σε σύγκριση με άλλες περιοχές της χώρας; Αυτές και πολλές άλλες ερωτήσεις καλείται να απαντήσει το μοντέλο της σύγκρισης δύο μέσων όρων Student’s-T15 το οποίο έχει τη δυνατότητα να παρέχει απαντήσεις για συγκρίσεις (α) του μέσου όρου μιας ομάδας με αυτόν του πληθυσμού (ή όποια άλλη σχετική τιμή-σημείο αναφοράς ενδιαφέρει τον-ην ερευνητή-τρια), (β) μεταξύ των μέσων όρων δύο ανεξάρτητων16 ομάδων (δειγμάτων), και, (γ) μεταξύ των μέσων όρων δύο επαναλαμβανόμενων μετρήσεων που προέρχονται από τα ίδια άτομα (π.χ., test-retest).

2.1.0. Προϋποθέσεις του Μοντέλου (Student’s T)Προκειμένου το μοντέλο Τ17 να παρέχει έγκυρα αποτελέσματα πρέπει να συντρέχουν συγκεκριμένες προϋποθέσεις. Αυτές συζητούνται αναλυτικά παρακάτω:

Προϋπόθεση των ίσων διακυμάνσεων. Σύμφωνα με την προϋπόθεση αυτή θα πρέπει οι ομάδες που θα συγκριθούν να έχουν ίσες διακυμάνσεις (ή τυπικές αποκλίσεις). Το σχήμα 2.1. απεικονίζει διαφορετικά μεγέθη διακυμάνσεων, τα οποία όμως είναι ίδια και για τις δύο συγκρινόμενες ομάδες. Επομένως, σε

15Σκόπιμα παρακάμπτω το Ζ τεστ το οποίο είναι ακριβώς ίδιο με το Τ-Τεστ αλλά χρησιμοποιείται στην περίπτωση που η διακύμανση του πληθυσμού είναι γνωστή. Θεωρώντας ότι αυτή η γνώση απουσιάζει στο μεγαλύτερο μέρος των φαινομένων που μελετώνται επέλεξα να μην παρουσιάσω την διαφορά των δύο τεστ.16Ανεξάρτητες υπό την έννοια ότι μέλος της πρώτης ομάδας δεν μπορεί να αποτελεί και μέλος της δεύτερης ομάδας.17 Να σημειωθεί σε αυτό το σημείο ότι τα μαθηματικά του Τ-τεστ και της ανάλυσης διακύμανσης που συζητείται στο κεφάλαιο 3 είναι ακριβώς τα ίδια στην περίπτωση των δύο δειγμάτων αφού το Τ-τεστ αποτελεί την τετραγωνική ρίζα του F-τεστ.

Page 25: Kefalaia Statistikis Gia Telikes Eksetaseis

οποιοδήποτε από τα σενάρια του σχήματος 2.1. η προϋπόθεση των ίσων διακυμάνσεων διασφαλίζεται18.

Σχήμα 2.1. Διαφορετικά μεγέθη διακυμάνσεων σε συγκρίσεις μέσων όρων.

Η ύπαρξη άνισων διακυμάνσεων αξιολογείται με τον στατιστικό έλεγχο του Levene και δυνητικά μπορεί να προκαλέσει προβλήματα στον στατιστικό έλεγχο Τ. Ο δείκτης Levene αξιολογεί την υπόθεση ότι οι διασπορές δύο δειγμάτων είναι ίσες σε επίπεδο σημαντικότητας που ορίζει ο ερευνητής-τρια και τη χρήση μονόπλευρου ή δίπλευρου τεστ. Ο υπολογισμός του γίνεται ως εξής:

Όπου το W είναι το αποτέλεσμα του δείκτη Levene,K είναι ο αριθμός των διαφορετικών ομάδων,Ν είναι ο συνολικός αριθμός ατόμωνΝi είναι ο αριθμός ατόμων στην ομάδα i,

18Στο βαθμό βέβαια που και το αντίστοιχο στατιστικό κριτήριο (Levene’s test) δεν ξεπερνά επίπεδα στατιστικής σημαντικότητας.

Page 26: Kefalaia Statistikis Gia Telikes Eksetaseis

Yij είναι η τιμή ενός ατόμου του δείγματος j που ανήκει στην ομάδα iΤέλος, το μέγεθος Zij υπολογίζεται ως εξής:

με το να εκφράζει τον μέσο όρο της ομάδας.

Ας δούμε για παράδειγμα αν υπάρχουν διαφορές μεταξύ αγοριών και κοριτσιών δημοτικού σε μια δοκιμασία ευφυΐας. Το παρακάτω σχήμα απεικονίζει τις δύο κατανομές και τη διακύμανση των τιμών σε κάθε επίπεδο της ανεξάρτητης μεταβλητής (Φύλο). Αν και τα διαγράμματα Box δείχνουν την ύπαρξη διαφορετικών διάμεσων τιμών (medians), οι διασπορές εμφανίζονται παρόμοιες. Όταν ελέγχθηκαν οι διακυμάνσεις αναφορικά με το μέγεθός τους τα αποτελέσματα έδειξαν ότι οι τιμές s1 = 440 και s2 = 499 δεν ήταν στατιστικά σημαντικά διαφορετικές μεταξύ τους F-test = 0,883, p = .544.

Σχήμα 2.2. Κατανομές δύο διαφορετικών πληθυσμών (φύλο)

Άνισες Διακυμάνσεις. Όταν οι διακυμάνσεις δεν είναι ίσες, τότε μπορεί να συμβεί το εξής φαινόμενο: Οι μέσοι

Page 27: Kefalaia Statistikis Gia Telikes Eksetaseis

όροι των δύο ομάδων να είναι «πραγματικά» διαφορετικοί αλλά το εύρος της κατανομής της μιας ομάδας να είναι τόσο μεγάλο (μεγάλη διακύμανση) ώστε να «σκεπάζει» την περιοχή απόρριψης της άλλης κατανομής με αποτέλεσμα το στατιστικό τεστ να μην ξεπερνά επίπεδα στατιστικής σημαντικότητας. Το φαινόμενο αυτό απεικονίζεται πολύ γραφικά στο παρακάτω σχήμα όπου μπορούμε να δούμε ότι οι διαφορές μεταξύ των μέσων όρων Μ1 και Μ3 φαίνονται αρκετά μεγάλες αλλά η κατανομή με μέσο όρο Μ3 είναι αρκετά ευρεία (πλατιά) ώστε να υπερκαλύπτει την περιοχή απόρριψης της κατανομής όπου μέσος όρος είναι ο Μ1 (σχήμα 2.3).

Σχήμα 2.3. Κατανομές με διαφορετικούς μέσους όρους και άνισες διακυμάνσεις.

Προϋπόθεση της κανονικότητας. Η εξαρτημένη μεταβλητή πρέπει να κατανέμεται κανονικά σε κάθε επίπεδο της ανεξάρτητης μεταβλητής19. Αν δεν κατανέμεται κανονικά δεν ισχύει η θεωρία των παραμετρικών τεστ και δεν μπορεί να γίνει η σχετική σύγκριση αφού ο μέσος όρος μάλλον δεν θα είναι ο καλύτερος περιγραφικός δείκτης αυτών των κατανομών.

19 Όχι συνολικά! Αυτό είναι ένα συνηθισμένο λάθος που θα πρέπει να αποφεύγεται.

Page 28: Kefalaia Statistikis Gia Telikes Eksetaseis

Ανεξαρτησία των παρατηρήσεων. Η προϋπόθεση αυτή υποδηλώνει ότι οι τιμές των συμμετεχόντων στην εξαρτημένη μεταβλητή δεν «μοιάζουν» μεταξύ τους περισσότερο από όσο συμβαίνει στην πραγματικότητα. Με απλά λόγια αν οι πραγματικές τιμές σε μια δοκιμασία ικανότητας είναι για τον Άκη και τον Γιάννη 90 και 100 αντίστοιχα δεν θα πρέπει οι μετρήσιμες τιμές να είναι πιο κοντά μεταξύ τους (π.χ., 95 και 100)., όπως ίσως θα συνέβαινε αν αντέγραφε ο Άκης από τον Γιάννη. Η καταπάτηση της προϋπόθεσης της ανεξαρτησίας των παρατηρήσεων έχει σοβαρές συνέπειες αναφορικά με την εγκυρότητα των αποτελεσμάτων των στατιστικών δεικτών. Για την ακρίβεια «ακυρώνει» τα αποτελέσματα του παραμετρικού δείκτη Τ-τεστ (όπως και των παραμετρικών ελέγχων που σχετίζονται με το F-test20

αλλά και πολλών άλλων στατιστικών δεικτών). Όπως αναφέρει ο Huitema (1999) όταν τα επίπεδα αυτοσυσχέτισης είναι της τάξης του r = 0,7, τότε ο παραμετρικός δείκτης συσχέτισης «υπερβάλλει» τα αποτελέσματα κατά 265%. Συνεπώς είναι δραματικές οι συνέπειες από την καταπάτηση αυτής της προϋπόθεσης. Ας δούμε ένα παράδειγμα:

Έστω ότι μετράμε σε ένα τυχαίο δείγμα 100 φοιτητών ψυχολογίας τον δείκτη νοημοσύνης (ο οποίος στον πληθυσμό είναι π.χ., ίσος με 102 μονάδες) και τον υπολογίζουμε ότι είναι ίσος με 90 μονάδες. Αυτό το αρχικά παράξενο φαινόμενο θα μπορούσε να εξηγηθεί αν παρατηρούσαμε ότι τα άτομα π.χ., που πήραν τις χαμηλότερες τιμές βρίσκονταν σε μια πτέρυγα κατά την διάρκεια της συμπλήρωσης όπου υπήρχε πολύ έντονη θέρμανση και ηλιακή ακτινοβολία γεγονός που εμπόδισε την αντικειμενική (και άρα έγκυρη) αξιολόγηση της ικανότητάς τους. Αυτό το γεγονός είχε σαν αποτέλεσμα το να «μοιάζουν» οι τιμές κάποιων συμμετεχόντων περισσότερο μεταξύ τους από ότι ορίζει το εν λόγο χαρακτηριστικό. Αυτό το φαινόμενο περιγράφετε ως το φαινόμενο της «αυτοσυσχέτισης» των παρατηρήσεων.

20 Παραδείγματα αυτών είναι η ανάλυση διακύμανσης για δύο ή και περισσότερες ομάδες όπως και η ανάλυση παλινδρόμησης.

Page 29: Kefalaia Statistikis Gia Telikes Eksetaseis

Η λογική της αυτοσυσχέτισης είναι ότι παρατηρήσεις οι οποίες βρίσκονται πιο κοντά σε απόσταση21 μεταξύ τους θα σχετίζονται περισσότερο (δηλαδή θα μοιάζουν πιο πολύ) σε σχέση με παρατηρήσεις που βρίσκονται πιο μακριά μεταξύ τους. Με άλλα λόγια ο υπολογισμός του συντελεστή αυτοσυσχέτισης περιλαμβάνει την συσχέτιση παρατηρήσεων που απέχουν μεταξύ τους κατά μια π.χ., θέση (δηλαδή παρατήρηση παρά παρατήρηση, Lag-1), τη συσχέτιση παρατηρήσεων μεταξύ των οποίων παρεμβάλλονται δύο άτομα (Lag-2) και ο αριθμός των παρεμβαλλομένων παρατηρήσεων (lags) μπορεί να είναι ίσος με Ν-lag. Έτσι είναι εύκολο να κατανοήσουμε τον συντελεστή αυτοσυσχέτισης ως ένα συντελεστή Pearson r μεταξύ των παρατηρήσεων του ίδιου του δείγματος με μοναδική παράμετρος που αξιολογείται να είναι η απόσταση μεταξύ των παρατηρήσεων. Για παράδειγμα αν σε 10 συμμετέχοντες ενδιέφερε η αυτοσυσχέτιση σε απόσταση Lag-2 τότε για τα 10 παρακάτω άτομα:

1, 2, 3, 4, 5, 6, 7, 8, 9, 10

θα συσχετίζαμε τα παρακάτω ζεύγη τιμών (όπως με την χρήση του κλασσικού συντελεστή συσχέτισης) τα οποία σε αριθμό είναι ίσα με Ν-lag22, δηλαδή 10-2=8 ζεύγη τιμών.

(1,3) (2,4) (3,5) (4,6) (5,7) (6,8) (7,9) και, (8,10)

21 Το μοντέλο δηλαδή εξετάζει τη σχέση «κοντινών» σε σχέση με «μακρινών» παρατηρήσεων.22 Ανάλογα με την απόσταση μεταξύ των παρατηρήσεων.

Page 30: Kefalaia Statistikis Gia Telikes Eksetaseis

Ας δούμε ένα παράδειγμα του υπολογισμού του συντελεστή αυτοσυσχέτισης με τα παρακάτω δεδομένα:Πίνακας 2.1. Τυχαία δεδομένα 10 συμμετεχόντων στην επίδοση.Συμμετέχοντες

1 2 3 4 5 6 7 8 9 10

Επίδοση 22

17 25 20

38

31 40 37 54 51

Στο SPSS/PASW 18 ακολουθήστε τις παρακάτω εντολές όπως απεικονίζεται και στο σχήμα 2.4:

Analyze -> Forecasting -> AutocorrelationsΣτη συνέχεια προκύπτουν τα αποτελέσματα (σχήμα 2.5), όπου στην πρώτη στήλη εμφανίζονται οι αποστάσεις μεταξύ των παρατηρήσεων (lags) οι οποίες σε αριθμό μπορούν να είναι Ν-lag. Δηλαδή μπορούν να υπολογιστούν τόσοι συντελεστές αυτοσυσχέτισης όσος είναι και ο αριθμός του δείγματος– τον αριθμό των lag που υπολογίζονται. Στη συνέχεια παρουσιάζεται το μέγεθος του συντελεστή αυτοσυσχέτισης το οποίο ακολουθείται από το στατιστικό του σφάλμα και τέλος παρουσιάζεται το μέγεθος, οι βαθμοί ελευθερίας και η πιθανότητα του στατιστικού ελέγχου Box-Ljung ο οποίος αξιολογεί την πιθανότητα ο συντελεστής αυτοσυσχέτισης να είναι ίσος με το μηδέν.

Page 31: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 2.4. Εντολές για την αξιολόγηση του μεγέθους της αυτοσυσχέτισης

Σχήμα 2.5. Αποτελέσματα του συντελεστή αυτοσυσχέτισης (autocorrelation)23

23 Ονομάζεται και δείκτης «Serial-dependency».

Page 32: Kefalaia Statistikis Gia Telikes Eksetaseis

Όπως φαίνεται στο σχήμα 2.5, η συσχέτιση «γειτονικών» παρατηρήσεων (Lag-1) παρήγαγε ένα συντελεστή αυτοσυσχέτισης ίσο με 0,552, ο οποίος ήταν στατιστικά σημαντικά διαφορετικός από το μηδέν (παρόλο το μικρό μέγεθος του δείγματος). Η προσδοκία του μοντέλου είναι ότι όσο μεγαλύτερη είναι η απόσταση μεταξύ των παρατηρήσεων τόσο μικρότερη θα είναι και η συσχέτισή τους. Για παράδειγμα η αυτοσυσχέτιση στην οποία παρεμβάλλονταν δύο παρατηρήσεις (Lag-2) είχε μέγεθος ίσο με 0,362 ενώ για παρεμβαλλόμενες παρατηρήσεις 3 και 4 σε αριθμό η αυτοσυσχέτιση είναι περίπου μηδέν (δηλαδή συνάρτηση του στατιστικού σφάλματος της μέτρησης). Παραδόξως φαίνεται ότι παρατηρήσεις σε μεγαλύτερες αποστάσεις μεταξύ τους είχαν αρνητική αυτοσυσχέτιση24! Μια πιθανή εξήγηση θα μπορούσε να ήταν ότι σε αυτή την εξέταση/δοκιμασία μεγάλης δυσκολίας υπήρχε κάποιος μαθητής που γνώριζε πολύ καλά τα θέματα. Όσοι λοιπόν βρίσκονταν κοντά του κατάφεραν να αντιγράψουν ενώ αυτοί που ήταν μακριά του είχαν αναλογικά μικρότερη επίδοση (αφού όσο πιο μακριά βρίσκονταν από αυτόν τόσο πιο δύσκολο ήταν να αντιγράψουν).

Υπάρχει η γενικευμένη αντίληψη ότι όταν οι συμμετέχοντες είναι ανεξάρτητοι μεταξύ τους και αποτέλεσμα τυχαίας δειγματοληψίας, η προϋπόθεση της αυτοσυσχέτισης ικανοποιείται. Με άλλα λόγια, όταν οι συμμετέχοντες είναι διαφορετικά άτομα τότε η σειρά τους (στη βάση των δεδομένων ή στην αξιολόγησή τους) δεν έχει νόημα (ή ιδιαίτερη σημασία). Αντίθετα, η αυτοσυσχέτιση θεωρητικά είναι μεγάλο πρόβλημα για τα δεδομένα σε ερευνητικά σχέδια «εντός των ατόμων» δηλαδή σε δεδομένα από χρονοσειρές. Στα δεδομένα αυτά (π.χ., ερευνητικά σχέδια Ν = 1) οι γνωστοί παραμετρικοί έλεγχοι δεν ισχύουν εξαιτίας της καταπάτησης της προϋπόθεσης της αυτοσυσχέτισης. Όπως όμως ειπώθηκε παραπάνω υπάρχουν πιθανώς παράγοντες οι οποίοι μπορούν να αυξήσουν τα επίπεδα

24 Ο συντελεστής αυτοσυσχέτισης επηρεάζει το ίδιο αρνητικά τα δεδομένα άσχετα με το πρόσημό του.

Page 33: Kefalaia Statistikis Gia Telikes Eksetaseis

αυτοσυσχέτισης (π.χ., ζέστη στο χώρο εξέτασης, κούραση, αντιγραφή από άλλους συμμετέχοντες, κλπ.). Συνεπώς είναι σημαντικό ο ερευνητής-τρια να δώσει την πρέπουσα σημασία σε αυτή την προϋπόθεση μιας και έχει τις πιο δραματικές συνέπειες στον στατιστικό έλεγχο.

Σχήμα 2.6. Μέγεθος του συντελεστή αυτοσυσχέτισης για Ν-lag διαφορετικά μεγέθη απόστασης

2.1.1. Επιμερισμός των Στοχαστικών Μερών και των ΣφαλμάτωνΑς δούμε τώρα την λογική της ανάλυσης του στατιστικού ελέγχου Τ η οποία παρουσιάζεται στο σχήμα 2.7. Ας υποθέσουμε ότι συγκρίνουμε δύο ομάδες παιδιών τα οποία προέρχονται από τον ίδιο πληθυσμό. Σε αυτή την περίπτωση δεν περιμένουμε διαφορές μεταξύ 1α και 1β (αφού τα παιδιά προέρχονται από τον ίδιο πληθυσμό). Επίσης δεν περιμένουμε διαφορές στις διακυμάνσεις των δύο ομάδων (2α και 2β) και αν και μπορεί στην επιλογή μας των δύο δειγμάτων να παρατηρήσουμε ατομικές διαφορές (3α και 3β) και μικρό-διαφορές στο σφάλμα της μέτρησης (4α και 4β) συνολικά δεν περιμένουμε να διαφέρουν οι μέσοι όροι μεταξύ τους και άρα δεν θα υπάρχει επίδραση της μεταβλητής «ομάδα.»

Page 34: Kefalaia Statistikis Gia Telikes Eksetaseis

1α. Μέσος Όρος Ομάδα 1

1β. Μέσος Όρος Ομάδα 2

2α. Διακύμανση Ομάδα 1

2β. Διακύμανση Ομάδα 2

3α. Ατομικές Διαφορές 1

3β. Ατομικές Διαφορές 2

4α. Σφάλμα της Μέτρησης 1

4β. Σφάλμα της Μέτρησης 2

  5. Επιδράσεις της μεταβλητής «ομάδα»

Σχήμα 2.7. Ανάλυση του μοντέλου Τ-Τεστ σε επίπεδο διακυμάνσεων

Αν όμως οι δύο ομάδες προέρχονται από διαφορετικούς πληθυσμούς, τότε θα περιμέναμε ότι οι ομάδες (α) θα έχουν ίσες διακυμάνσεις (2α, 2β) γιατί αυτό αποτελεί προϋπόθεση του τεστ, (β) θα έχουν περίπου ίδιες ατομικές διαφορές (3α, 4β) γύρω από το μέσο όρο τους αλλά αυτές θα είναι περίπου ίδιες και για τις δύο ομάδες (εξαιτίας της τυχαιότητας όταν οι συμμετέχοντες επιλέχθηκαν), (γ) θα έχουν περίπου ίδια επίπεδα σφάλματος της μέτρησης (4α, 4β) εξαιτίας πάλι της προϋπόθεσης των διακυμάνσεων και της ισότητας του μεγέθους των δύο δειγμάτων, ενώ περιμένουμε ότι θα έχουν διαφορετικούς μέσους όρους (1α, 1β) εξαιτίας του γεγονότος ότι η μεταβλητή «ομάδα» θα είναι υπεύθυνη για τις διαφορές αυτές (διαφορετικοί πληθυσμοί). Εξισώνοντας λοιπόν όλα τα παραπάνω, ο δείκτης Τ αξιολογεί την ύπαρξη διαφορών στον αριθμητή του κλάσματα (παρακάτω) και αξιολογεί την διαφορά αυτή ως συνάρτηση των διακυμάνσεων των δύο ομάδων. Είναι προφανές ότι αν οι δύο ομάδες προέρχονται από

Page 35: Kefalaia Statistikis Gia Telikes Eksetaseis

τον ίδιο πληθυσμό τότε ο λόγος Τ θα είναι ίσος με την μονάδα.

Σχήμα 2.8. Εξήγηση του υπολογισμού του Τ-Τεστ με βάση τη διαφορά στους μέσους όρους και τις διακυμάνσεις των ομάδων.

Το σχήμα 2.8 παρουσιάζει τη λογική του Τ τεστ με την σύγκριση των δύο μέσον όρων ως συνάρτηση του λόγου των διακυμάνσεών τους. Η λογική αυτής της ανάλυσης θα γίνει περισσότερο κατανοητή στην περιγραφή της ανάλυσης διακύμανσης (κεφάλαιο 3) όπου επιμερίζονται γραφικά οι διακυμάνσεις «εντός» και «μεταξύ» των ατόμων των διαφορετικών ομάδων.

2.2. ΕΝΑ ΔΕΙΓΜΑ: ΣΥΓΚΡΙΣΗ ΤΟΥ ΜΕΣΟΥ ΟΡΟΥ ΜΙΑΣ ΟΜΑΔΑΣ ΜΕ ΤΟΝ ΜΕΣΟ ΟΡΟ ΤΟΥ ΠΛΗΘΥΣΜΟΥ25

Ο στατιστικός αυτός έλεγχος χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον μέσο όρο ενός δείγματος με

25 Ουσιαστικά το σημείο αναφοράς μπορεί να είναι οποιαδήποτε τιμή έχει ενδιαφέρον για τον ερευνητή-τρια.

Page 36: Kefalaia Statistikis Gia Telikes Eksetaseis

μια άλλη τιμή η οποία αποτελεί σημείο αναφοράς – σύγκρισης. Συνήθως το σημείο αναφοράς είναι ο μέσος όρος του πληθυσμού χωρίς όμως αυτό να είναι δεσμευτικό. Ο τύπος για τον στατιστικό αυτό έλεγχο έχει ως εξής:

Όπου η παράμετρος εκφράζει τον μέσο όρο του δείγματος, η παράμετρος «μ» τον μέσο όρο του πληθυσμού ή το σημείο αναφοράς, η παράμετρος «s» εκφράζει την τυπική απόκλιση της κατανομής του δείγματος η οποία έχει μέση τιμή και τέλος η παράμετρος «n» εκφράζει το μέγεθος του δείγματος. Ο παρανομαστής του παραπάνω κλάσματος εκφράζει το σταθμισμένο σφάλμα της μέτρησης (standard error of the mean), μια πολύ σημαντική έννοια στο χώρο της επαγωγικής στατιστικής. Ας διατυπώσουμε τις δύο υποθέσεις για το παράδειγμά στο οποίο υποθέτουμε ότι 10 ιδρυματοποιημένα παιδιά τα οποία μεγάλωσαν σε πολύ στερητικό περιβάλλον έχουν νοητική υστέρηση:

Υποθέσεις (μηδενική και εναλλακτική)Η0: Ο μέσος όρος του δείγματος δεν είναι διαφορετικός από τον πληθυσμό των παιδιών που έχουν νοητική υστέρηση (άρα δεν είναι διαφορετικός από τις 70 μονάδες και τα παιδιά έχουν νοητική υστέρηση).Ηε: Ο μέσος όρος του δείγματος είναι διαφορετικός από το 70 (άρα τα παιδιά δεν έχουν νοητική υστέρηση).Μπορεί να ακούγεται λίγο παράδοξο το γεγονός ότι η μηδενική υπόθεση εκφράζει την ουσία του ενδιαφέροντος του ερευνητή. Επειδή όμως ο ερευνητής-τρια δεν επιβεβαιώνει μηδενικές αλλά εναλλακτικές υποθέσεις, το παράδειγμα αυτό θα μπορούσε να επαναδιατυπωθεί με σημείο αναφοράς τις 100 μονάδες (μέσο όρο του πληθυσμού). Σε αυτή την περίπτωση οι υποθέσεις θα έπρεπε να διατυπωθούν ως εξής:

Υποθέσεις (μηδενική και εναλλακτική)

Page 37: Kefalaia Statistikis Gia Telikes Eksetaseis

Η0: Ο μέσος όρος του δείγματος δεν είναι διαφορετικός από τον μέσο όρο του γενικού πληθυσμού (άρα δεν είναι διαφορετικός από τις 100 μονάδες και τα παιδιά έχουν συνηθισμένα επίπεδα ευφυΐας).Ηε: Ο μέσος όρος του δείγματος είναι διαφορετικός από το 100 (άρα τα παιδιά έχουν νοητική υστέρηση-εφόσον είναι σημαντικά διαφορετικός προς τα κάτω).

Γραφικά οι ερευνητικές υποθέσεις απεικονίζονται παρακάτω:

Σχήμα 2.9. Υποθετική διαφορά μεταξύ μιας ομάδας και του πληθυσμού στην ευφυΐα

Τα δεδομένα του παραδείγματος παρουσιάζονται στον παρακάτω πίνακα:Πίνακας 2.1. Δεδομένα από υποθετική μελέτη για το αν οι συμμετέχοντες αποτελούν μέρος του πληθυσμού παιδιών με νοητική υστέρηση.Συμμετέχοντες

1 2 3 4 5 6 7 8 9 10

Ευφυΐα (IQ) 99

102

103

98

87

102

105

110

109

104

Page 38: Kefalaia Statistikis Gia Telikes Eksetaseis

Στο λογισμικό SPSS/PASW 18 επιλέγουμε τις εντολές:

«Analyze», «Compare Means», και «One-Sample T-Test», όπως φαίνεται παρακάτω:

Σχήμα 2.5. Μενού πραγματοποίησης του στατιστικού ελέγχου Τ,

Στη συνέχεια επιλέγουμε την μεταβλητή της οποίας ο μέσος όρος πρέπει να συγκριθεί και η συγκριτική τιμή ορίζεται στην επιλογή «Test Value». Ακολουθώντας την πρώτη επιλογή υποθέσεων αξιολογούμε λοιπόν αν ο μέσος όρος του δείγματος είναι διαφορετικός από την τιμή αναφορά της νοητικής υστέρησης (70 μονάδες).

Page 39: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 2.6. Μενού πραγματοποίησης του στατιστικού ελέγχου Τ-Τεστ για ένα δείγμα συμμετεχόντων.

Τα αποτελέσματα από την περιγραφική στατιστική απεικονίζονται παρακάτω. Ο μέσος όρος του δείγματος ήταν 101,9 μονάδες και η τιμή αυτή συγκρίνεται με τον υποθετικό μέσο όρο ο οποίος ορίστηκε στις 70 μονάδες ευφυΐας. Η τυπική απόκλιση ήταν ίση με 6,47 μονάδες και ο λόγος της τυπικής απόκλισης προς την τετραγωνική ρίζα του μεγέθους του δείγματος ίσος με 2,046 μονάδες (σταθμισμένο σφάλμα της μέτρησης).

Σχήμα 2.7. Στοιχεία περιγραφικής στατιστικής για το Τ-Τεστ για ένα δείγμα

Τα αποτελέσματα από την επαγωγική στατιστική παρουσιάζονται παρακάτω όπου η τιμή του Τ-Τεστ για 9 βαθμούς ελευθερίας (δηλαδή για Ν-1 παρατηρήσεις) ήταν 15,588 μονάδες και η διαφορά μεταξύ των δύο σημείων (μέσου όρου και σημείου αναφοράς) ήταν 31,9 μονάδες. Η διαφορά αυτή εκφράζεται λοιπόν με 15,588

Page 40: Kefalaia Statistikis Gia Telikes Eksetaseis

μονάδες Τ οι οποίες «μεταφράζονται» και αποτυπώνονται με μια πιθανότητα παρατήρησης τέτοιας διαφοράς της τάξης του 1/1000 (βλ. στήλη sig. 2-tailed η οποία αναφέρεται σε δίπλευρο τεστ26). Με άλλα λόγια η παρατηρούμενη διαφορά των περίπου 32 μονάδων είναι τόσο μεγάλη ώστε η πιθανότητα να παρατηρηθεί είναι μικρότερη από μια στις χίλιες φορές. Επομένως η διαφορά αυτή είναι αξιοσημείωτη και πρέπει να αναφερθεί ως σημαντική και ουσιαστική και έτσι αποδεχόμαστε την εναλλακτική υπόθεση.

Σχήμα 2.8. Αποτελέσματα από το Τ-Τεστ για ένα δείγμα.

Μεταξύ άλλων, ενδιαφέρον αποτέλεσμα είναι και το «παράθυρο εμπιστοσύνης»27 του υπολογισμού της διαφοράς το οποίο εκτείνετε από τις 27,2707 μονάδες έως και τις 36,5293 μονάδες. Αυτό σημαίνει ότι, αν και η παρατηρήσιμη διαφορά είναι της τάξης των 31,9 μονάδων, στον πληθυσμό η διαφορά μπορεί να εκτείνεται στο παραπάνω παράθυρο για επίπεδο αυτοπεποίθησης της τάξης του 95%. Για την περίπτωση που το «παράθυρο» αυτό είναι πολύ ευρύ και δημιουργεί ανασφάλειες στον/την ερευνητή-τρια, μια πρώτη επιλογή θα ήταν η αύξηση του μεγέθους του δείγματος, εφόσον μια κύρια αιτία αυτού του εύρους είναι ο πολύ μικρός αριθμός του δείγματος. Μια δεύτερη αιτία είναι

26Αν για παράδειγμα η παρατηρούμενη πιθανότητα ήταν ίση με 8% και ο ερευνητής-τρια είχε διατυπώσει υπόθεση μονής κατεύθυνσης, τότε θα έπρεπε να διαιρέσει την παρατηρούμενη πιθανότητα 8/2=4% με αποτέλεσμα να έχει στατιστικά σημαντικό εύρημα στο τεστ μιας πλευράς (one-tailed).27 Διάστημα εμπιστοσύνης.

Page 41: Kefalaia Statistikis Gia Telikes Eksetaseis

η ύπαρξη μεγάλης διακύμανσης (41,86 μονάδες28), για την οποία επίσης ευθύνεται το μέγεθος του δείγματος.

2.2.1. Διαστήματα ΕμπιστοσύνηςΟ ορισμός των διαστημάτων εμπιστοσύνης είναι ότι αποτελούν το «παράθυρο» μέσα στο οποίο βρίσκεται η παράμετρος που ενδιαφέρει τον ερευνητή-τρια (π.χ., μέσο όρο) για ένα δεδομένο επίπεδο αυτοπεποίθησης (π.χ., 95%) αν και το 99% δεν είναι απίθανο. Η ιδέα της των διαστημάτων εμπιστοσύνης είναι πολύ ενδιαφέρουσα και πολύ σημαντική. Μπορεί να γίνει κατανοητή αν σκεφτούμε ότι ο μέσος όρος Χ που θα προκύψει από ένα τυχαίο δείγμα θα είναι μάλλον κατά κάτι διαφορετικός από τον μέσο όρο που θα προκύψει από ένα δεύτερο τυχαίο δείγμα. Αυτή είναι και η ιδέα του κεντρικού οριακού θεωρήματος, ότι δηλαδή η επιλογή πολλών δειγμάτων από ένα πληθυσμό θα μας δώσει μέσους όρους οι οποίοι θα τελικά θα κατανέμονται κανονικά (συνεπώς ο μεγαλύτερος αριθμός των δειγμάτων θα δώσει μέσους όρους πολύ κοντά με αυτόν του πληθυσμού). Ο υπολογισμός των διαστημάτων εμπιστοσύνης γίνεται με τον παρακάτω τύπο:

Δ.Ε.95%/99% = Μέσος όρος +- Τκρίσιμο * Σφάλμα της μέτρησης

Με άλλα λόγια, το διάστημα εμπιστοσύνης σε επίπεδο 95% είναι:

Και σε επίπεδο 99% είναι ίσο με:

Συνεπώς αν θέλουμε να υπολογίσουμε το διάστημα εμπιστοσύνης για τον παρατηρούμενο μέσο όρο σε επίπεδο 95% εφαρμόζουμε τον παραπάνω τύπο ως εξής:

28 Εκφράζει την τυπική απόκλιση στο τετράγωνο.

Page 42: Kefalaia Statistikis Gia Telikes Eksetaseis

=>

=>

Δηλαδή το κάτω εύρος του διαστήματος εμπιστοσύνης είναι 97,89 μονάδες και το πάνω ίσο με 105,91 μονάδες. Αν θέλουμε να υπολογίσουμε το διάστημα εμπιστοσύνης με πιθανότητα σφάλματος μόνο το 1% (δηλαδή έχοντας πολύ αυστηρά κριτήρια) τότε έχουμε το παρακάτω «παράθυρο» (σχήμα 2.9):

Σχήμα 2.9. Παρουσίαση των διαστημάτων εμπιστοσύνης για τα παραπάνω δεδομένα σε επίπεδο αυτοπεποίθησης 99%

Σε επίπεδο λοιπόν 99% το διάστημα εμπιστοσύνης εκτείνεται μεταξύ των τιμών 95,25 και 108,55 μονάδων. Μπορεί για κάποιους αυτό να θεωρηθεί ως ένα αρκετά μεγάλο «παράθυρο» ώστε να εμπιστευθούμε την παρατηρούμενη τιμή.

2.3. ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΟΡΩΝ ΓΙΑ ΔΥΟ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑΥπάρχουν διαφορές μεταξύ αγοριών και κοριτσιών στην παιδική κατάθλιψη; Είναι η διδακτική των φυσικών επιστημών με τη χρήση Η/Υ πιο αποτελεσματική συγκριτικά με την παραδοσιακή διδασκαλία; Υπάρχουν διαφορές στα εισοδήματα των πολιτών σε διαφορετικές κυβερνήσεις; Όλα αυτά και πολλά άλλα ερωτήματα που απασχολούν τους ερευνητές καλείται να απαντήσει το Τ-Τεστ για ανεξάρτητα δείγματα αφού η απάντηση αυτών των ερευνητικών ερωτημάτων απαιτεί τη χρήση ενός στατιστικού ελέγχου ο οποίος συγκρίνει μέσους όρους.

Page 43: Kefalaia Statistikis Gia Telikes Eksetaseis

Μεταξύ λοιπόν των διαφορετικών στατιστικών ελέγχων για την απάντηση τέτοιων ερευνητικών ερωτημάτων, ο πιο συνηθισμένος είναι το t-test για δεδομένα που πληρούν παραμετρικές προϋποθέσεις. Στην αντίθετη περίπτωση κάποιος πρέπει να ανατρέξει σε μη-παραμετρικούς δείκτες όπως το τεστ Mann-Whitney για την σύγκριση δύο μέσων όρων ή την ανάλυση διακύμανσης του Friedman για την περίπτωση που συγκρίνονται περισσότεροι από δύο μέσοι όροι όπως φαίνεται και στο παρακάτω σχήμα όπου παρουσιάζονται οι υποθετικές κατανομές αγοριών και κοριτσιών αναφορικά με την εξαρτημένη μεταβλητή «Στόχοι».

Ο τύπος για τον υπολογισμό του Τ-Τεστ έχει ως εξής:

Όπου τα μεγέθη και εκφράζουν τους δύο μέσους όρους, οι παράμετροι και τις διακυμάνσεις των δύο δειγμάτων, και τα , , το μέγεθος κάθε δείγματος.

Page 44: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 2.10. Υποθετικές κατανομές αγοριών και κοριτσιών αναφορικά με τα κίνητρά τους

Ας δούμε πιο συγκεκριμένα την περίπτωση της σύγκρισης 2 μέσων όρων με τη χρήση του t-test. Ακολουθούν οι εξής δύο υποθέσεις:

Υποθέσεις (μηδενική Η0 και εναλλακτική Ηε)Η0: ΔΕΝ υπάρχουν διαφορές μεταξύ αγοριών και κοριτσιών στην ευφυΐα.Ηε: Υπάρχουν διαφορές μεταξύ αγοριών και κοριτσιών στην ευφυΐα.Πριν την αξιολόγηση της αληθότητας των ερευνητικών υποθέσεων είναι σημαντικό να διερευνηθεί η «ύπαρξη» των παραμετρικών προϋποθέσεων. Συγκεκριμένα για το t-test, οι προϋποθέσεις είναι οι εξής:

1. Το υπό-μελέτη φαινόμενο κατανέμεται κανονικά και στα δύο επίπεδα της ανεξάρτητης μεταβλητής (ξεχωριστά για τα αγόρια και ξεχωριστά για τα κορίτσια)

2. Οι διακυμάνσεις και στα δύο επίπεδα της ανεξάρτητης μεταβλητής είναι περίπου ίσες.

3. Οι παρατηρήσεις είναι ανεξάρτητες μεταξύ τους (δεν υπάρχει δηλαδή αυτοσυσχέτιση).

Page 45: Kefalaia Statistikis Gia Telikes Eksetaseis

Πίνακας 2.2. Δεδομένα από υποθετική μελέτη σχετικά με την ύπαρξη διαφορών μεταξύ αγοριών και κοριτσιών στην ευφυΐα.Συμμετέχοντες

1 2 3 4 5 6 7 8 9 10

Φύλο 1 1 1 1 1 2 2 2 2 2IQ 9

9102

103

98

87

102

105

110

109

104

Τα αποτελέσματα, αναφορικά με την κανονικότητα έδειξαν ότι τα δεδομένα κατανέμονταν κανονικά και στα δύο επίπεδα της ανεξάρτητης μεταβλητής φύλο. Οι δείκτες K-S για τα αγόρια και τα κορίτσια παρουσιάζονται στο σχήμα 2.11. Στην περίπτωση των αγοριών ο δείκτης K-S ήταν ίσος με 0,699 και πιθανότητα διαφοροποίησης από το μηδέν p = 0,713. Οι αντίστοιχες τιμές για τα κορίτσια ήταν K-S = 0,483, p = 0,974. Σχετικά με την αυτοσυσχέτιση, ο δείκτης r στο πρώτο lag ήταν ίσος με 0,157 και δεν ήταν στατιστικά σημαντικά διαφορετικός από το μηδέν, επομένως ικανοποιήθηκε και αυτή η προϋπόθεση. Τέλος, για την προϋπόθεση των ίσων διακυμάνσεων τα αποτελέσματα απεικονίζονται στο σχήμα 2.15.

Σχήμα 2.11. Δείκτες K-S για την κανονικότητα των δύο κατανομών

Στο λογισμικό SPSS/PASW επιλέξτε: Analyze -> Compare Means -> Independent Samples T-Test (σχήμα 2.12) και στη συνέχεια ορίστε τις ομάδες σας (σχήμα 2.13).

Page 46: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 2.12. Μενού πραγματοποίησης του Τ-Τεστ για δύο ανεξάρτητα δείγματα

Σχήμα 2.13. Ορισμός ομάδων

Σχήμα 2.14. Περιγραφική στατιστική του Τ-Τεστ για δύο ανεξάρτητα δείγματα

Αρχικά παρουσιάζονται δείκτες περιγραφικής στατιστικής για τα δύο δείγματα (μέσοι όροι, τυπικές αποκλίσεις, και σφάλμα της μέτρησης. Στη συνέχεια παρουσιάζονται τα αποτελέσματα από τον δείκτη Τ (σχήμα 2.15).

Page 47: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 2.15. Αποτελέσματα του Τ-Τεστ για δύο ανεξάρτητα δείγματαΌπως φαίνεται στο σχήμα 2.15, ο δείκτης του Levene δεν ήταν στατιστικά σημαντικά διαφορετικός από το μηδέν, συνεπώς υιοθετούμε την μηδενική υπόθεση, ότι δηλαδή η διακύμανση της μια ομάδας ήταν ίση με την διακύμανση της δεύτερης ομάδας. Για το λόγο αυτό η αξιολόγηση της ερευνητικής υπόθεσης μπορεί να βασιστεί στην πρώτη σειρά των αποτελεσμάτων. Σύμφωνα με αυτήν, ο δείκτης Τ ήταν ίσος με 2,538 μονάδες (το πρόσημο δεν έχει καμία σημασία εκτός του ότι εκφράζει την σειρά με την οποία αφαιρέθηκαν οι μέσοι όροι). Για 8 βαθμούς ελευθερίας (Ν-2) η πιθανότητα να επιβεβαιώσουμε την μηδενική υπόθεση ήταν ίση με 3,5%. Συνεπώς επιβεβαιώνεται η εναλλακτική ερευνητική υπόθεση της ύπαρξης διαφορών μεταξύ αγοριών και κοριτσιών στην ευφυΐα. Για το συγκεκριμένο είδος της διαφοράς ο ερευνητής-τρια πρέπει να ανατρέξει στους μέσους όρους όπου είναι φανερό ότι τα κορίτσια έχουν μεγαλύτερο μέσο όρο από τα αγόρια (από υποθετικά στοιχεία). Στη συνέχεια είναι σημαντικό και πάλι να αξιολογηθεί το διάστημα εμπιστοσύνης της παρατηρούμενης διαφοράς που όπως φαίνεται από το λογισμικό κυμαίνεται μεταξύ -15,65 μονάδες και -0,749. Σε διάστημα εμπιστοσύνης της τάξης του 99% το διάστημα εμπιστοσύνης απεικονίζεται παρακάτω:

Page 48: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 2.16. Διαστήματα εμπιστοσύνης της διαφοράς των δύο ομάδων σε επίπεδο 99%

2.4. ΣΥΓΚΡΙΣΗ ΜΕΣΩΝ ΟΡΩΝ ΓΙΑ ΔΥΟ ΕΞΑΡΤΗΜΕΝΑ ΔΕΙΓΜΑΤΑΣτην περίπτωση που τα δεδομένα προέρχονται από ένα δείγμα συμμετεχόντων το οποίο παρέχει στοιχεία μιας μεταβλητής δύο διαφορετικές χρονικές στιγμές ή συγκρίνει δύο διαφορετικές μεταβλητές, τότε έχουμε την χρήση του Τ-Τεστ για εξαρτημένα δείγματα. Οι διαφοροποιήσεις που παρατηρούνται στην μεθοδολογία αυτής της ανάλυσης είναι φανερό ότι εστιάζονται στους βαθμούς ελευθερίας αφού τα δεδομένα στην περίπτωση αυτή προέρχονται για παράδειγμα από Ν = 20 άτομα ενώ για την ίδια μελέτη με δύο δείγματα θα είχαμε 20 άτομα σε κάθε δείγμα και άρα ένα σύνολο 40 ατόμων. Αναφορικά με τις προϋποθέσεις της ανάλυσης ότι ισχύει στα προηγούμενα μοντέλα ισχύει και τώρα με εστίαση στην κατανομή των δεδομένων (στην παρούσα φάση στην κατανομή της διαφοράς των δύο μετρήσεων) η οποία πρέπει να έχει την κωδωνοειδή μορφή της κατανομής Gauss. Επίσης δεν θα πρέπει να υπάρχει αυτοσυσχέτιση, δηλαδή τα δεδομένα των συμμετεχόντων να μην επηρεάζονται από την σειρά με την οποία είναι ταξινομημένα (περασμένα στο λογισμικό). Ο τύπος για την αξιολόγηση του Τ-Τεστ για εξαρτημένα δείγματα ακολουθεί παρακάτω:

Page 49: Kefalaia Statistikis Gia Telikes Eksetaseis

Με την παράμετρο εκφράζεται ο μέσος όρος της κατανομής της διαφοράς των δύο μετρήσεων ενώ το «μ» ορίζεται συνήθως στο μηδέν αφού αξιολογείται το κατά πόσο η κατανομή της διαφοράς έχει μέσο όρο ίσο ή διαφορετικό από το μηδέν. Τέλος με το «sD» εκφράζεται η τυπική απόκλιση της κατανομής της διαφοράς.

Μια από τις πιο συνηθισμένες χρήσεις του Τ-Τεστ για εξαρτημένα δείγματα αφορά σε αποτελέσματα από πειραματικά σχέδια «Πριν-Μετά» όπου συνήθως αξιολογείται η αποτελεσματικότητα μιας παρέμβασης. Μια άλλη εφαρμογή αφορά την αξιολόγηση της αξιοπιστίας μιας μέτρησης στο χρόνο στην οποία περίπτωση η προσδοκία είναι ότι η κατανομή της διαφοράς θα έχει μέσο όρο ίσο με το μηδέν αφού, ως συνάρτηση του στατιστικού σφάλματος κάποιοι συμμετέχοντες θα έχουν επίδοση λίγο παραπάνω στην δεύτερη μέτρηση, κάποιοι άλλοι λίγο λιγότερο και οι υπόλοιποι θα έχουν αμετάβλητες τιμές. Ας δούμε την περίπτωση του δεύτερου παραδείγματος όπου αξιολογούμε την υπόθεση ότι μια κλίμακα ευφυΐας είναι αξιόπιστη (σταθερή στο χρόνο). Τα δεδομένα ακολουθούν παρακάτω:

Πίνακας 2.3. Δεδομένα από υποθετική μελέτη σχετικά με την διαφορά στην ευφυΐα μεταξύ δύο μετρήσεων στο χρόνο (αξιοπιστία).. Συμμετέχοντες

1 2 3 4 5 6 7 8 9 10

IQ-Πριν 99 102

103

98 87

102

105

110

109

104

IQ-Μετά 103

104

105

100

97

104

106

111

109

105

Υποθέσεις (μηδενική Η0 και εναλλακτική Ηε)Η0: Η κλίμακα ευφυΐας είναι αξιόπιστη στο χρόνο (δηλαδή ΔΕΝ υπάρχουν διαφορές στους μέσους όρους στην «πριν» μέτρηση σε σχέση με την «μετά»).Ηε: Η κλίμακα ευφυΐας δεν είναι αξιόπιστη στο χρόνο (δηλαδή υπάρχουν διαφορές στους μέσους όρους στην μέτρηση της ευφυΐας πριν σε σχέση με το μετά).

Page 50: Kefalaia Statistikis Gia Telikes Eksetaseis

Πριν προχωρήσουμε στην αξιολόγηση της ερευνητικής υπόθεσης, ας δούμε την προϋπόθεση της κανονικότητας η οποία αξιολογείται με το μη-παραμετρικό κριτήριο Kolmogorov-Smirnov. Τα αποτελέσματα παρουσιάζονται παρακάτω για 10 παρατηρήσεις:

Σχήμα 2.17. Αποτελέσματα από την ανάλυση κανονικότητας με τον δείκτη K-S

Τα αποτελέσματα από τον έλεγχο Κ-S προτείνουν ότι η προϋπόθεση της κανονικότητας ικανοποιείται αφού η πιθανότητα απόκλισης από την τυπική-κανονική κατανομή είναι μεγαλύτερη από το 5%. Με άλλα λόγια γίνεται αποδεκτή η μηδενική υπόθεση η οποία προτείνει ότι η παρατηρούμενη κατανομή (της διαφοράς) δεν είναι στατιστικά σημαντικά διαφορετική από την κανονική κατανομή. Σε αυτό το σημείο θα ήθελα να προτείνω στον αναγνώστη-τρια επιφύλαξη στην αξιολόγηση των προϋποθέσεων ενός στατιστικού ελέγχου αλλά και των ερευνητικών υποθέσεων, όταν το μέγεθος του δείγματος είναι τόσο μικρό. Ας προχωρήσουμε τώρα στην αξιολόγηση της ερευνητικής υπόθεσης. Στο SPSS/PASW 18 επιλέγουμε τις παρακάτω εντολές: «Analyze», «Compare Means», και «Paired Samples T-Test».

Page 51: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 2.18. Μενού πραγματοποίησης Τ-Τεστ για δύο εξαρτημένα δείγματα

Όπως φαίνεται παρακάτω οι μέσοι όροι εμφανίζουν μια διαφορά της τάξης των 2,5 μονάδων. Επίσης, διαφορές παρουσιάζουν και οι τυπικές αποκλίσεις, γεγονός που προτείνει μεγαλύτερη ανομοιογένεια των παρατηρήσεων στην πρώτη μέτρηση σε σχέση με την δεύτερη.

Σχήμα 2.19. Περιγραφική στατιστική για το Τ-Τεστ για εξαρτημένα δείγματα

Παρακάτω εμφανίζεται η συσχέτιση μεταξύ των δύο μετρήσεων η οποία είναι εξαιρετικά υψηλή29. Πολλοί ερευνητές-τριες θα μπορούσαν να βασιστούν στον δείκτη αυτό προκειμένου να καταλήξουν ότι η κλίμακα ευφυΐας είναι αξιόπιστη. Εντούτοις, με βάση τους περιορισμούς του συντελεστή συσχέτισης ως δείκτης σταθερότητας των μετρήσεων, προχωρούμε στην 29 Για κάποιον περίεργο λόγο, το λογισμικό επιλέγει την παρουσίαση του συντελεστή συσχέτισης παρόλο που δεν σχετίζεται σε καμία περίπτωση με την λογική του Τ-τεστ ή την σχετική ερευνητική υποθεση.

Page 52: Kefalaia Statistikis Gia Telikes Eksetaseis

αξιολόγηση της αξιοπιστίας στο χρόνο με τη χρήση του Τ-Τεστ.

Σχήμα 2.20. Σχέση μεταξύ των δύο συσχετιζόμενων μετρήσεων

Τέλος, τα αποτελέσματα από το Τ-Τεστ υποστηρίζουν την υιοθέτηση της εναλλακτικής υπόθεσης ότι δηλαδή υπάρχουν στατιστικά σημαντικές διαφορές στους μέσους όρους στην πρώτη μέτρηση σε σχέση με την δεύτερη. Ο δείκτης Τ είχε μέγεθος ίσο με 2,785 μονάδες και η πιθανότητα να παρατηρηθεί τόσο μεγάλη διαφορά (της τάξης των 2,5 μονάδων) ήταν μικρότερη από το επίπεδο σημαντικότητας 5% (ήταν ίση με 2,1%).

Σχήμα 2.21. Αποτελέσματα από το Τ-Τεστ για εξαρτημένα δείγματα

Συμπεραίνουμε λοιπόν ότι η κλίμακα αυτή μέτρησης της ευφυΐας δεν είναι αξιόπιστη στο χρόνο μιας και υπήρχαν διαφορές μεταξύ των δύο χρονικά μετρήσεων σε ένα χαρακτηριστικό το οποίο, τουλάχιστον θεωρητικά, δεν μεταβάλλετε. Το υψηλό μέγεθος του συντελεστή συσχέτισης συνάδει με το συμπέρασμα ότι ο μέσος όρος αυξήθηκε συνολικά για τους περισσότερους συμμετέχοντες, χωρίς να αλλάξει η σειρά (αξιολογική) μεταξύ τους. Έτσι, παρόλο που σύμφωνα με τον ορισμό της αξιοπιστίας το εργαλείο μέτρησης έχει μάλλον μηδενική αξιοπιστία, ο συντελεστής συσχέτισης προτείνει υψηλά επίπεδα αυτής. Παρακάτω

Page 53: Kefalaia Statistikis Gia Telikes Eksetaseis

παρουσιάζεται το διάστημα εμπιστοσύνης της διαφοράς μεταξύ των δύο μετρήσεων.

Σχήμα 2.22. Διαστήματα εμπιστοσύνης για την παρατηρούμενη διαφορά των μέσων όρων

2.5. ΚατακλείδαΤο Τ-τεστ είναι μια από τις πιο χρησιμοποιούμενες αναλύσεις της επαγωγικής στατιστικής στις κοινωνικές επιστήμες. Έχει εφαρμογές για ερευνητικά σχέδια «εντός» και «μεταξύ» των ατόμων και τρεις διαφορετικούς τύπους δεδομένων (ενός δείγματος, δύο ανεξάρτητων, και δύο εξαρτημένων). Επίσης το μοντέλο συμπεριφέρεται πολύ σταθερά ακόμη και όταν καταπατούνται οι προϋποθέσεις της κανονικότητας αλλά και των ίσων διακυμάνσεων.

Page 54: Kefalaia Statistikis Gia Telikes Eksetaseis

5. ΑΝΑΛΥΣΗ ΔΙΜΕΤΑΒΛΗΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Υπάρχει σχέση30 μεταξύ καπνίσματος και προβλημάτων υγείας; Μεταξύ κληρονομικότητας και μελλοντικών ασθενειών; Μεταξύ μορφωτικού επιπέδου των γονέων και επιδόσεων των παιδιών τους; Αυτές, και πολλές άλλες ερευνητικές ερωτήσεις καλείται να απαντήσει ο συντελεστής συσχέτισης και να δώσει πειστικές απαντήσεις. Αποτελεί ένα από τα πιο συνηθισμένα μοντέλα στις κοινωνικές επιστήμες.

5.1. ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ PEARSON RΟ συντελεστής συσχέτισης Pearson r είναι ένας παραμετρικός31 στατιστικός δείκτης ο οποίος αξιολογεί τη συνάφεια μεταξύ 2 μεταβλητών (π.χ., ωρών διαβάσματος και επίδοσης). Μπορεί να αξιολογήσει τη σχέση μόνο ζευγών τιμών. Σχετικά με τις προϋποθέσεις του στατιστικού ελέγχου, ο δείκτης Pearson προϋποθέτει ότι: (α) οι μεταβλητές είναι συνεχείς και κατανέμονται με την γνωστή κωδωνοειδή μορφή της κανονικής κατανομής32, και (β) οι μεταβλητές έχουν γραμμική σχέση33 μεταξύ τους. Οι προϋποθέσεις αυτές γίνονται κατανοητές στη συνέχεια με τη χρήση του

30 Σε αυτό το κείμενο χρησιμοποιώ τους όρους «σχέση» και «συνάφεια» σαν να είναι ταυτόσημοι.31 Με τον όρο παραμετρικός αναφερόμαστε σε μια σειρά στατιστικών δεικτών που πληρούν συγκεκριμένες προϋποθέσεις. Αν αυτές οι προϋποθέσεις «απουσιάζουν» τότε γίνεται χρήση μη-παραμετρικών στατιστικών δεικτών οι οποίοι δεν επηρεάζονται από «καταπάτηση» των προϋποθέσεων.32 Με τον όροι «συνεχείς» απαιτείται οι μετρήσεις να είναι και σε κλίμακα ίσων διαστημάτων. Για παράδειγμα αν κάποιος λύσει 5 μαθηματικά προβλήματα περισσότερα από κάποιον άλλον μαθητή τότε γνωρίζει 5 περισσότερα πράγματα (ισοδιαστημική κλίμακα). Αν όμως ένας μαθητής πάρει στον έλεγχο 5 και ένας άλλος 10, ο δεύτερος δεν σημαίνει ότι γνωρίζει διπλάσια πράγματα από τον πρώτο (επομένως η κλίμακα αυτή δεν είναι ισοδιαστημική).33 Για κάποιους-ες μπορεί να είναι πιο εύκολο να καταλάβουν τον όρο γραμμική σχέση με τον όρο αναλογική σχέση. Αυτό που απαιτείται για την ανίχνευση σχέσεων είναι να υπάρχει αναλογική σχέση μεταξύ των δύο μεταβλητών για όλα τα επίπεδά τους. Δηλαδή όσο μεγαλώνει η μία να μεγαλώνει και η άλλη και το αντίθετο.

Page 55: Kefalaia Statistikis Gia Telikes Eksetaseis

διαγράμματος σκεδασμού και με σχετικές αναλύσεις κανονικότητας.

Το διάγραμμα σκεδασμού είναι ένα πάρα πολύ χρήσιμο διάγραμμα το οποίο απεικονίζει το είδος και το, κατά προσέγγιση, μέγεθος της σχέσης των 2 μεταβλητών που μελετώνται. Μπορεί να χαρακτηρισθεί και ως μια «φωτογραφία» της υπο-μελέτη σχέσης. Στο διάγραμμα αυτό κάθε μια από τις 2 μεταβλητές εκφράζεται σε έναν από τους 2 άξονες (το σε ποιόν άξονα δεν έχει σημασία στην ανάλυση συσχέτισης όσο έχει στην ανάλυση της γραμμικής παλινδρόμησης) και μέσα στο σχήμα κάθε σημείο εκφράζει μια παρατήρηση (ένα άτομο). Η παρατήρηση αυτή είναι συνάρτηση των τιμών που έχει το άτομο στις 2 μεταβλητές (εκεί που τέμνονται αν τραβήξουμε παράλληλες γραμμές από την μια τιμή προς τον ένα άξονα και από την άλλη τιμή προς τον άλλο άξονα). Για παράδειγμα ένας ερευνητής ήθελε να κατασκευάσει δύο παράλληλες μορφές μιας αξιολόγησης λεξιλογίου. Χρησιμοποίησε το διάγραμμα σκεδασμού για να δει «οπτικά» τη σχέση μεταξύ των δύο τεστ (σχήμα 5.1.). Αν τα δύο τεστ έχουν παρόμοια χαρακτηριστικά τότε περιμένουμε να δούμε τις παρατηρήσεις να βρίσκονται πολύ κοντά στην διαγώνιο που εκτείνεται από αριστερά και κάτω προς τα δεξιά και πάνω.

Όπως βλέπουμε στο παρακάτω σχήμα η σχέση είναι πολύ δυνατή και θετική, όπως ήταν και επιθυμητό. Επιπρόσθετες πληροφορίες παρέχουν τα διαγράμματα Box τα οποία όμως παρουσιάζουν μια διαφορετική εικόνα αναφορικά με το επίπεδο δυσκολίας των δύο παράλληλων μορφών. Συγκεκριμένα η διάμεσος για την δοκιμασία «W» είναι περίπου στις 30 μονάδες ενώ η αντίστοιχη διάμεσος για τη συστοιχία «L» είναι στις 50 περίπου μονάδες. Επομένως η δοκιμασία «L» είναι κατά περίπου 20 μονάδες πιο δύσκολη από τη δοκιμασία «W».

Ας δούμε ένα ακόμη παράδειγμα στο οποίο έχουμε δεδομένα από 10 μαθητές αναφορικά με τις ώρες που διαβάζουν και την επίδοσή τους. Διατυπώνουμε τις δύο υποθέσεις:

Page 56: Kefalaia Statistikis Gia Telikes Eksetaseis

Υποθέσεις (μηδενική και εναλλακτική)34:Η0: ΔΕΝ υπάρχει σχέση μεταξύ ωρών διαβάσματος και επίδοσης στο σχολείοΗε: Υπάρχει σχέση μεταξύ ωρών διαβάσματος και επίδοσης στο σχολείοΠίνακας 5.1. Δεδομένα από υποθετική μελέτη για τη σχέση ωρών διαβάσματος και επίδοσης.Συμμετέχοντες

1 2 3 4 5 6 7 8 9 10

Ώρες Διαβάσματος

2 4 6 8 1 0 3 5 7 9

Επίδοση 12

15

16 20 9 6 13 16 18 19

Σχήμα 5.1. Διάγραμμα σκεδασμού με περιγραφικούς δείκτες

34 Η αντίστοιχη ερευνητική ερώτηση από τις παραπάνω υποθέσεις θα μπορούσε να διατυπωθεί ως εξής: «Υπάρχει σχέση μεταξύ ωρών διαβάσματος και επίδοσης;» Η διατύπωση των υποθέσεων όμως είναι πιο χρήσιμη για την κατανόηση στατιστικών εννοιών αφού μας βοηθά να σκεφτόμαστε για τον σκοπό κάθε στατιστικού τεστ (από το να τα χρησιμοποιούμε ανεξέλεγκτα).

Page 57: Kefalaia Statistikis Gia Telikes Eksetaseis

Ας πραγματοποιήσουμε το διάγραμμα σκεδασμού (scatterplot) για να ανιχνεύσουμε (α) την ύπαρξη σχέσης, (β) το είδος της σχέσης, και (γ) το μέγεθος αυτής της σχέσης. Στο λογισμικό SPSS/PASW 18 επιλέξτε το μενού Graphs και μετά Legacy Dialogs και scatter/dot όπως παρακάτω:

Σχήμα 5.2. Επιλογές για τη δημιουργία του διαγράμματος σκεδασμού

Στη συνέχεια, όπως φαίνεται παρακάτω, επιλέξτε το «simple scatter» και την επιλογή «Define» ώστε να ορίσετε το είδος του διαγράμματος.

Σχήμα 5.3. Επιλογές για τον ορισμό του απλού διαγράμματος σκεδασμού.

Page 58: Kefalaia Statistikis Gia Telikes Eksetaseis

Στη συνέχεια επιλέξτε τις μεταβλητές που θα μπούνε στον οριζόντιο και κάθετο άξονα. Τοποθετείστε τις ώρες διαβάσματος (Study) στον οριζόντιο άξονα Χ και την επίδοση (Grades) στον κάθετο άξονα35 Υ, ακολουθώντας τη λογική ότι η εξαρτημένη μεταβλητή εμφανίζεται πάντα στον κάθετο άξονα και η ανεξάρτητη στον οριζόντιο. Τέλος επιλέξτε «ΟΚ» ώστε να πραγματοποιηθεί το διάγραμμα (βλέπε σχήμα 5.4).

Σχήμα 5.4. Επιλογή των μεταβλητών σε άξονες για τη δημιουργία απλού διαγράμματος σκεδασμού.

35 Όπως είπαμε στην περίπτωση της απλής συσχέτισης δεν έχει ιδιαίτερη σημασία το ποια μεταβλητή θα τοποθετηθεί σε ποιόν άξονα αφού η σχέση Α – Β είναι ίδια με την Β – Α. Εντούτοις, στο συγκεκριμένο παράδειγμα είναι φανερό ότι η επίδοση αποτελεί την εξαρτημένη μεταβλητή και προσπαθεί να «εξηγηθεί» από τις ώρες διαβάσματος.

Page 59: Kefalaia Statistikis Gia Telikes Eksetaseis

Το Σχήμα 5.5 δείχνει το διάγραμμα σκεδασμού όπως προκύπτει από το SPSS για τη σχέση μεταξύ ωρών διαβάσματος και επίδοσης. Όπως φαίνεται στο Σχήμα 5.5, όσο περισσότερο διάβασε κάποιος τόσο μεγαλύτερο βαθμό πήρε (με κάποιες διακυμάνσεις-ατομικές διαφορές). Για την ακρίβεια όποτε το διάγραμμα σκεδασμού έχει την κατεύθυνση από αριστερά και κάτω προς τα δεξιά και πάνω, τότε υπάρχει θετική συνάφεια μεταξύ των 2 μεταβλητών. Όταν το σχήμα έχει κατεύθυνση από αριστερά και πάνω προς τα δεξιά και κάτω, τότε έχουμε αρνητική σχέση (βλέπε σχήμα 5.6). Τέλος, όταν δεν φαίνεται οι παρατηρήσεις να έχουν κάποιον στοιχειώδες σχηματισμό (δηλαδή όποτε είναι δύσκολο να δούμε με τα μάτια μας κάποια κατεύθυνση) τότε έχουμε μηδενική σχέση. Στην περίπτωση της μηδενικής σχέσης, όλες οι παρατηρήσεις είναι διάσπαρτες στο χώρο) (σχήμα 5.7). Τέλος το σχήμα 5.8 παρουσιάζει διαφορετικά διαγράμματα σκεδασμού τα οποία απεικονίζουν σχέσεις διαφορετικών μεγεθών.

Page 60: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 5.5. Διάγραμμα σκεδασμού για τη σχέση ωρών διαβάσματος και επίδοσης στο σχολείο.

Σχήμα 5.6. Διάγραμμα σκεδασμού για την ύπαρξη αρνητικής σχέσης μεταξύ δύο μεταβλητών

Page 61: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 5.7. Διάγραμμα σκεδασμού για την απουσία σχέσης μεταξύ δύο μεταβλητών

Σχήμα 5.8. Διαγράμματα σκεδασμού για διαφορετικά είδη και επίπεδα σχέσεων

5.2. Η προϋπόθεση της «γραμμικότητας» της σχέσηςΌπως ανέφερα παραπάνω, προκειμένου να «τρέξει» σωστά το μοντέλο του συντελεστή συσχέτισης, ώστε το αποτέλεσμα να ανταποκρίνεται στην πραγματικότητα, πρέπει να συντρέχει η προϋπόθεση της γραμμικότητας. Με βάση αυτή την προϋπόθεση, θα πρέπει το μοντέλο της ευθείας γραμμής να ταιριάζει καλύτερα στα δεδομένα (θα γίνει αυτό πιο κατανοητό στο μοντέλο της ανάλυσης της παλινδρόμησης). Με άλλα λόγια, αν τραβήξουμε μια ευθεία γραμμή στα δεδομένα του Σχήματος 5.5, θα δούμε ότι τα περισσότερα από αυτά είναι πάνω, ή πολύ κοντά σε μια νοητή διαγώνια γραμμή. Επομένως φαίνεται και με τα μάτια μας ότι υπάρχει αναλογική (γραμμική) σχέση μεταξύ των δύο μεταβλητών. Μια πιθανή περίπτωση απουσίας γραμμικής σχέσης είναι η σχέση μεταξύ περιστασιακού άγχους και

Page 62: Kefalaia Statistikis Gia Telikes Eksetaseis

επίδοσης στον πρωταθλητισμό. Με βάση σχετικές θεωρίες (π.χ., Yerkes & Dowdson 1906) χαμηλά επίπεδα άγχους σχετίζονται με χαμηλές επιδόσεις, μεσαία επίπεδα άγχους μπορεί να σχετίζονται με εξαιρετικές επιδόσεις (επειδή μπορεί να παρέχουν ιδανικά επίπεδα ενεργοποίησης), ενώ πολύ υψηλά επίπεδα άγχους είναι καταστροφικά για την επίδοση (εξαιτίας της ανικανότητας του ατόμου να αυτό-ρυθμίσει τη συμπεριφορά του και τα συναισθήματά του). Αυτό το είδος σχέσης, φαίνεται να εκφράζεται καλύτερα με την ύπαρξη μιας καμπυλόγραμμης σχέσης όπου η σχέση άγχους και επίδοσης είναι γραμμική ως ένα σημείο. Στη συνέχεια, αύξηση των επιπέδων άγχους συνδυάζεται με μια δραματική μείωση της επίδοσης (Βλέπε σχήμα 5.9).

Όπως φαίνεται στο σχήμα 5.9 υπάρχει ένα πλατό κάπου στα μεσαία επίπεδα άγχους που δείχνει ότι υπάρχουν κάποια ιδανικά επίπεδα άγχους στα οποία επιτυγχάνονται οι υψηλότερες επιδόσεις. Αντίθετα όταν ξεπεραστούν αυτά τα επίπεδα, τότε η επίδοση μειώνεται δραματικά. Η απουσία της προϋπόθεσης της γραμμικότητας γίνεται φανερή στο Σχήμα 7 όπου είναι σχεδόν αδύνατο να τραβήξουμε μια ευθεία γραμμή η οποία να ταιριάζει στα περισσότερα δεδομένα. Βλέπουμε ότι η πρώτη γραμμή ταιριάζει στο πρώτο μισό των παρατηρήσεων ενώ η δεύτερη γραμμή στο δεύτερο μισό. Αν λοιπόν εφαρμόζαμε την πρώτη ευθεία γραμμή θα βγάζαμε το συμπέρασμα της θετικής συνάφειας ενώ με τη δεύτερη το συμπέρασμα της αρνητικής. Επειδή λοιπόν η σχέση των δύο μεταβλητών αρχίζει να διαφοροποιείται (από θετική προς αρνητική) μετά από κάποιο επίπεδο της μιας μεταβλητής (μεσαία επίπεδα άγχους) δεν είναι κατάλληλη η εφαρμογή του μοντέλου Pearson r το οποίο απαιτεί την ευθύγραμμη σχέση μεταξύ των 2 μεταβλητών36.

36 Η παραπάνω καμπυλόγραμμη σχέση είναι μόνο μια από τα διαφορετικά είδη καμπυλόγραμμων σχέσεων. Δεν έχει νόημα ή περαιτέρω διερεύνηση μη γραμμικών σχέσεων στην παρούσα παρουσίαση του συντελεστή συσχέτισης. Για όσους-ες ενδιαφέρονται περισσότερο, το SPSS μπορεί πολύ εύκολα να μοντελοποιήσει μια σειρά μη γραμμικών σχέσεων όπως στην δεύτερη και τρίτη δύναμη,

Page 63: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 5.9. Διάγραμμα σκεδασμού που εκφράζει τη σχέση μεταξύ άγχους και επίδοσης.

5.3. Η προϋπόθεση της κανονικότητας της κατανομήςΕπίσης, προκειμένου να είναι έγκυρα τα αποτελέσματα του συντελεστή συσχέτισης θα πρέπει οι παρατηρήσεις (δηλ. τα σκορ των συμμετεχόντων) σε κάθε μια από τις 2 μεταβλητές να κατανέμονται κανονικά. Αν και η έννοια της κανονικής κατανομής είναι προαπαιτούμενη της κατανόησης της συσχέτισης μια μικρή συζήτηση ώστε να γίνει κατανοητή η προϋπόθεση ακολουθεί. Η κανονική κατανομή αποτελεί ένα διάγραμμα συχνοτήτων και θα πρέπει να ακολουθεί ένα σχήμα σαν αυτό της «καμπάνας» του οποίου το περίγραμμα εκφράζει τον αριθμό περιπτώσεων που εμπίπτουν σε

εκθετικές, κλπ. Αυτή την σειρά αναλύσεων θα την βρείτε στο μενού «Regression-curve estimation». Εναλλακτικά, οι σχέσεις αυτές μπορούν να μοντελοποιηθούν απευθείας στο διάγραμμα σκεδασμού (με την εφαρμογή των «fit function»).

Page 64: Kefalaia Statistikis Gia Telikes Eksetaseis

κάθε επίπεδο της μεταβλητής που μελετάμε. Έτσι για παράδειγμα αν θέλουμε να δούμε πως κατανέμεται το φαινόμενο της ευφυΐας θα περίμενε κανείς να δει μια εικόνα, περίπου όπως την παρακάτω, γνωρίζοντας ότι ο μέσος όρος ευφυΐας με τη χρήση σταθμισμένων τεστ είναι 100 και η τυπική απόκλιση περίπου 15:

Σχήμα 5.10. Διάγραμμα συχνοτήτων όπου δείχνει μια υποθετική κανονική κατανομή αναφορικά με την ευφυΐα.

Από το Σχήμα 5.10 φαίνεται ότι οι περισσότερες παρατηρήσεις (δηλ. συμμετέχοντες) έχουν επιδόσεις κοντά στο μέσο όρο (μεταξύ 90-110) και ότι όσο απομακρυνόμαστε από το μέσο όρο τόσο μειώνεται και ο αριθμός των παρατηρήσεων [f(x)]. Δηλαδή υπάρχουν λιγότερα άτομα που είτε είναι πάρα πολύ έξυπνα ή το αντίθετο, ενώ για τους περισσότερους από εμάς περιμένουμε (και ελπίζουμε) ότι θα είμαστε κοντά στο μέσο όρο. Η καταπάτηση αυτής της προϋπόθεσης έχει επίσης σημαντικές αρνητικές επιπτώσεις στον υπολογισμό του συντελεστή συσχέτισης οι οποίες γίνονται φανερές αν μειωθεί πολύ το εύρος κάποιας από τις 2 μεταβλητές που μελετώνται ή και των 237. Για 37 Το εύρος των μεταβλητών και η σημαντικότητά του στον υπολογισμό του συντελεστή συσχέτισης είναι κάτι το οποίο καταπατείται συχνά στην έρευνα στις κοινωνικές επιστήμες.

Page 65: Kefalaia Statistikis Gia Telikes Eksetaseis

παράδειγμα αν φανταστούμε στο Σχήμα 5.10 ότι όλες οι παρατηρήσεις είναι μεταξύ 120 και 130 (επειδή π.χ., κάναμε μετρήσεις IQ στη ΝΑΣΑ) τότε δεν θα υπάρχει αρκετό εύρος τιμών για να μοντελοποιηθεί και να αναδειχθεί η πιθανή σχέση μεταξύ των 2 μεταβλητών. Το ίδιο θα συνέβαινε αν οι περισσότερες παρατηρήσεις είχαν ομαδοποιηθεί σε χαμηλά επίπεδα της διαβάθμισης της ευφυΐας (π.χ., μεταξύ 70-80). Για την αξιολόγηση της ύπαρξης της κανονικότητας κάποιος θα πρέπει να συμβουλευθεί τον στατιστικό δείκτη Kolmogorov-Smirnov που βρίσκεται στο μενού των μη παραμετρικών τεστ στο SPSS/PASW (δείτε περισσότερες πληροφορίες στο παράρτημα Β και στο κεφάλαιο 2). Στην παρούσα φάση, μια απλή αξιολόγηση με τα μάτια πινάκων συχνοτήτων μπορεί να μας δώσει μια σχετικά σαφή ιδέα για το πόσο κανονικά κατανέμεται το φαινόμενο που μετρούμε.

5.4. Τι «σημαίνει» ο συντελεστής συσχέτισης Pearson rΤι πρέπει να γνωρίζουμε για το συντελεστή συσχέτισης Pearson r; Πρώτον ότι ανήκει στην κατηγορία των σταθμισμένων δεικτών, δηλαδή είναι ένας στατιστικός δείκτης που έχει συγκεκριμένο εύρος με αποτέλεσμα να έχει νόημα από μόνος του και χωρίς τη σύνδεση του με επίπεδα σημαντικότητας ή άλλες πληροφορίες. Το εύρος που μπορεί να πάρει ο r είναι από -1 έως και +1. Το πρώτο μέγεθος μας δείχνει μια τέλεια αρνητική σχέση ενώ το δεύτερο μια τέλεια θετική σχέση. Το μηδέν αντιπροσωπεύει μηδενική σχέση μεταξύ 2 μεταβλητών. Είναι φυσικό ότι μια σχέση του τύπου 0.6 είναι Θεωρητικά οι μεταβλητές που θα συσχετιστούν πρέπει να μπορούν να πάρουν τιμές από το – ∞ (άπειρο) έως και τα + ∞ (άπειρο). Τις περισσότερες φορές όμως διαβαθμίσεις τύπου Likert (συμφωνώ-διαφωνώ) όπως συνηθίζεται για τη μέτρηση στάσεων, χαρακτηριστικών προσωπικότητας, κλπ., έχουν εξαιρετικά περιορισμένο εύρος με αποτέλεσμα να επηρεάζεται το μέγεθος του συντελεστή συσχέτισης. Εντούτοις, ο συντελεστής συσχέτισης Pearson r είναι σχετικά ακριβής όταν το εύρος των μεταβλητών είναι μικρό ή όταν οι μεταβλητές δεν κατανέμονται κανονικά (ανάλογα φυσικά με το μέγεθος του εύρους ή της στρέβλωσης). Σημαντικές παραποιήσεις του δείκτη συντελούνται όταν καταπατείται η προϋπόθεση της γραμμικότητας.

Page 66: Kefalaia Statistikis Gia Telikes Eksetaseis

ταυτόσημη σε μέγεθος με μια σχέση -0.6 με τη διαφορά ότι η μια είναι θετική ενώ η άλλη αρνητική. Επίσης η παρουσία σχέσεων μεγαλυτέρων του 1.0 είναι κάτι αδύνατο/άτοπο (και άρα λάθος). Μεταξύ των 2 ορίων (-1 έως +1), έχουν προταθεί διάφορες κατηγοριοποιήσεις που αναφέρονται στην αξιολόγηση του μεγέθους του δείκτη. Μια από αυτές είναι και η παρακάτω η οποία προκύπτει από τον συγγραφέα και είναι ίδια άσχετα με την κατεύθυνση της σχέσης (θετική ή αρνητική):0.0-0.20 Μηδενική σχέση (δεν υπάρχει τίποτε

συστηματικό-στοχαστικό)0.21-0.40 Μικρή-προς-μέτρια σχέση0.41-0.60 Μέτρια-προς-δυνατή σχέση0.61-0.80 Πολύ δυνατή σχέση> 0.81 Εξαιρετικά δυνατή σχέση, έως και προβληματική (βλέπε παρακάτω)

Αν και στην πραγματικότητα σχέσεις της τάξης του .80 είναι δύσκολο να παρατηρηθούν, όταν παρατηρούνται δημιουργούν και έναν θεωρητικό προβληματισμό που εκφράζεται από την ερώτηση: Μήπως αυτές οι δύο μεταβλητές που συσχετίζονται κατά .80 ή και περισσότερο μετρούν το ίδιο θεωρητικά αντικείμενο/φαινόμενο; Επομένως, οι πολύ δυνατές σχέσεις θέλουν προσοχή στην αξιολόγησή τους και στην ερμηνεία τους. Πέρα από τον θεωρητικό προβληματισμό, προβλήματα δημιουργούνται στην ανάλυση μεταβλητών οι οποίες σχετίζονται πολύ υψηλά. Όπως θα συζητηθεί και παρακάτω, το φαινόμενο αυτό (της πολυσυσχετιστικότητας) έχει εξαιρετικά αρνητικές επιπλοκές στην «συμπεριφορά» παραμετρικών στατιστικών δεικτών, όταν η συνεισφορά αυτών των μεταβλητών αξιολογείται ταυτόχρονα.

5.5. Μαθηματικά του συντελεστή συσχέτισης Pearson rΠριν την εποχή των υπολογιστών όλες οι πράξεις γίνονταν με το χέρι με αποτέλεσμα να απαιτείται και η κατανόηση των μαθηματικών μοντέλων. Σήμερα αυτό δεν είναι απαραίτητο αφού η χρήση στατιστικών πακέτων έχει αντικαταστήσει αυτή την ανάγκη.

Page 67: Kefalaia Statistikis Gia Telikes Eksetaseis

Παρουσιάζω τον τύπο του συντελεστή συσχέτισης μόνο και μόνο για να επιδείξω το τι ακριβώς κάνει. Φυσικά στη συνέχεια θα ασχοληθώ με το πώς υπολογίζεται αυτός με τη χρήση του SPSS/PASW. Ο τύπος λοιπόν για τον υπολογισμό του συντελεστή συσχέτισης Pearson r έχει ως εξής:

Όπου οι τιμές X και Y αναφέρονται στις τιμές κάθε συμμετέχοντα ενώ οι τιμές μχ και μy με τους μέσους όρους στις μεταβλητές Χ και Υ. Επομένως η τιμή κάθε συμμετέχοντα στην μεταβλητή Χ αφαιρείται από το μέσο όρο αυτής της μεταβλητής και όλες αυτές οι τιμές προστίθενται. Το ίδιο γίνεται και για τη μεταβλητή Υ. Το γεγονός ότι αυτά τα ζευγάρια τιμών πολλαπλασιάζονται μεταξύ τους εκφράζει τη «συνδιακύμανση» των 2 μεταβλητών. Έτσι, για παράδειγμα αν υπάρχει αρνητική σχέση μεταξύ κατάθλιψης και επίδοσης στο σχολείο τότε ένα άτομο που θα έχει τιμή μεγαλύτερη από το μέσο όρο στην κατάθλιψη, το πιθανότερο είναι ότι θα έχει μικρότερη τιμή από το μέσο όρο στη μεταβλητή επίδοση. Το γινόμενο αυτό θα είναι αρνητικό, και αν αυτό συμβαίνει για τους περισσότερους μαθητές τότε θα έχουμε αρνητική σχέση μεταξύ κατάθλιψης και επίδοσης. Ο παρανομαστής του κλάσματος εκφράζει το γινόμενο των 2 σφαλμάτων το οποίο διορθώνεται για το μέγεθος του δείγματος. Υπάρχουν πολύ πιο εύκολες τυπολογίες για τον υπολογισμό του συντελεστή συσχέτισης με το χέρι, όμως η παραπάνω είναι καλύτερη για την εξήγηση του τι ακριβώς υπολογίζει ο συντελεστής συσχέτισης που δεν είναι τίποτε άλλο από την ύπαρξη της συνδιακύμανσης μεταξύ 2 μεταβλητών.

5.6. Υπολογισμός του παραμετρικού συντελεστή συσχέτισης Pearson r με το SPSS/PASW 18Για τον υπολογισμό το συντελεστή συσχέτισης με το λογισμικό SPSS/PASW επιλέγουμε τις παρακάτω εντολές:

Page 68: Kefalaia Statistikis Gia Telikes Eksetaseis

Analyze Correlate Bivariate

Στο παράθυρο τους Σχήματος 5.11 επιλέγουμε τις μεταβλητές που θέλουμε να συσχετίσουμε. Ο συντελεστής συσχέτισης Pearson r είναι προ-επιλεγμένος, ενώ όπως θα δούμε αργότερα, για την διερεύνηση μη-παραμετρικών σχέσεων μπορούν να επιλεχθούν οι δείκτες των Spearman και Kendall. Επίσης βλέπουμε ότι προ-επιλεγμένο είναι και το είδος τεστ: δίπλευρο38.

38 Το μονόπλευρο τεστ χρησιμοποιείται στην περίπτωση που ο ερευνητής αξιολογεί μια συγκεκριμένη υπόθεση η οποία έχει κατεύθυνση. Για παράδειγμα η υπόθεση: «Υπάρχει σχέση μεταξύ προσκόλλησης και επίδοσης» δεν δηλώνει κάποια κατεύθυνση και ο ερευνητής οφείλει να διερευνήσει το είδος της σχέσης και στις δύο πλευρές της κατανομής (αν δηλ. η σχέση είναι θετική ή αρνητική). Στην διερεύνηση όμως για παράδειγμα της σχέσης άγχους και κατάθλιψης ο ερευνητής είναι σχεδόν σίγουρος ότι η σχέση είναι θετική και αυτό που τον απασχολεί είναι το μέγεθος αυτής της σχέσης. Έτσι, μπορεί να επιλέξει τη χρήση του μονόπλευρου τεστ. Η προσωπική μου άποψη είναι ότι πρέπει πάντα να χρησιμοποιείται το δίπλευρο τεστ αφού το μονόπλευρο εκφράζει κάποια προκατάληψη (από την πλευρά του ερευνητή-τριας) και επίσης δημιουργεί και τις προϋποθέσεις για να ξεπεράσουν τα ευρήματα το επίπεδο της στατιστικής σημαντικότητας.

Page 69: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 5.11. Εντολές για την πραγματοποίηση ανάλυσης συσχέτισης

Page 70: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 5.12. «Παράθυρο» για τον υπολογισμό του συντελεστή συσχέτισης Pearson r στο SPSS.

Σχήμα 5.13. Αποτελέσματα από τη χρήση του συντελεστή συσχέτισης Pearson r στο SPSS.

Από τα παραπάνω φαίνεται πως η σχέση μεταξύ ωρών διαβάσματος και επίδοσης για τους δέκα μαθητές που αξιολογήθηκαν ήταν της τάξης του .964 η οποία είναι στατιστικά σημαντική όπως φαίνεται και από την

Page 71: Kefalaia Statistikis Gia Telikes Eksetaseis

παρατηρούμενη πιθανότητα: p = .000 (sig. 2-tailed). Μιας και πιθανότητα ίση με το μηδέν δεν υφίσταται, η παραπάνω πιθανότητα είναι απλά μικρότερη από 1 τοις 1000 αφού το λογισμικό εμφανίζει μέχρι 3 δεκαδικά ψηφία. Μιας και η πιθανότητα είναι μικρότερη από το «συνηθισμένο» επίπεδο στατιστικής σημαντικότητας α = 5%39, δεχόμαστε την εναλλακτική υπόθεση40 που εκφράζει ότι υπάρχει στατιστικά σημαντική συνάφεια μεταξύ των μεταβλητών «ώρες διαβάσματος» και της «επίδοσης». Η παρατηρούμενη σχέση ήταν αρκετά μεγάλη ώστε να προκύψει παρόλο το μικρό μέγεθος του δείγματος. Η σχέση μεταξύ μεγέθους δείγματος και στατιστικής σημαντικότητας είναι αντιστρόφως ανάλογη41.

5.7. Παρατηρήσεις για τον συντελεστή συσχέτισης Pearson r που συνιστούν προσοχή στην χρήση τουΤι πρέπει να έχετε υπόψη σας/να προσέχετε όταν χρησιμοποιείτε τον συντελεστή συσχέτισης Pearson r:

1. Επηρεάζεται από ακραίες παρατηρήσεις. Αν έχετε άτομα που έχουν πολύ μεγάλες ή πολύ μικρές τιμές είναι πολύ πιθανό αυτές να διαστρεβλώνουν το μέγεθος του συντελεστή συσχέτισης, σε εξαιρετικά μεγάλο βαθμό.

39 Αν έχει επιλέξει αυτό το επίπεδο ο ερευνητής-τρια ο οποίος-α είναι ελεύθερος-η να επιλέξει ότι επίπεδο σημαντικότητας θέλει, αρκεί να το δικαιολογήσει κατάλληλα.40 Σε αυτό το σημείο θέλω να επισημάνω ότι μετά από τον υπολογισμό των στατιστικών δεικτών ο ερευνητής θα πρέπει να γυρίσει πίσω στις ερευνητικές υποθέσεις και να αξιολογήσει ποια από τις δύο ισχύει, μηδενική ή εναλλακτική.41 Τα μικρά δείγματα σχετίζονται με σφάλματα τύπου-ΙΙ (δηλαδή την αδυναμία ανίχνευσης στατιστικά σημαντικών ευρημάτων, ενώ τα πολύ μεγάλα δείγματα με σφάλματα τύπου-Ι (δηλαδή την ύπαρξη στατιστικά σημαντικών ευρημάτων τα οποία έχουν ελάχιστη ουσιαστική και πρακτική σημαντικότητα). Για την σωστή διερεύνηση σχέσεων ο ερευνητής θα πρέπει να επιλέξει και έναν ιδανικό αριθμό συμμετεχόντων προκειμένου να μπορούν να επαληθευτούν εναλλακτικές υποθέσεις που είναι αληθείς. Πληροφορίες και σχετικοί πίνακες μπορούν να αναζητηθούν στις εξαιρετικές δουλειές του Jacob Cohen.

Page 72: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 5.14. Ακραίες παρατηρήσεις και μέγεθος του συντελεστή συσχέτισης

2. Επηρεάζεται από την ύπαρξη υπο-ομάδων εντός του δείγματος. Για παράδειγμα το σχήμα 5.15 δείχνει ότι υπάρχουν δύο διακριτές ομάδες συμμετεχόντων στην έρευνα για τις οποίες η πρόβλεψη μπορεί να μην είναι σημαντικά διαφορετική (σε επίπεδο κλίσης) αλλά υπάρχουν διαφορές στις σταθερές.

Σχήμα 5.15. Διάγραμμα σκεδασμού για την ύπαρξη διαφορετικών σχέσεων σε διαφορετικές ομάδες

3. Επηρεάζεται, όπως και όλα τα τεστ, από το μέγεθος του δείγματος. Μικρά δείγματα είναι δυνατόν να προκαλέσουν σφάλματα Τύπου-ΙΙ ενώ

Page 73: Kefalaia Statistikis Gia Telikes Eksetaseis

πολύ μεγάλα δείγματα σφάλμα Τύπου-Ι. Αυτά τα δύο σφάλματα είναι λίγο πιο πιθανό να εμφανιστούν στον υπολογισμό του συντελεστή συσχέτισης αφού η απουσία μιας απάντησης κάνει το ζεύγος αυτό των τιμών μη υπολογίσιμο (θεωρείται απών το άτομο). Επομένως η απουσία τιμών έχει πιο βαριές συνέπειες για τον υπολογισμό του συντελεστή αυτού σε σχέση με άλλους στατιστικούς δείκτες που δεν απαιτούν ζεύγη τιμών.

4. «Υποφέρει» από την καταπάτηση της προϋπόθεσης της γραμμικότητας οπότε είναι σημαντικό να αξιολογηθεί από το διάγραμμα σκεδασμού η ύπαρξη μη γραμμικών σχέσεων. Το παρακάτω σχήμα απεικονίζει μια αρνητική καμπυλόγραμμη σχέση (μη-γραμμική).

Σχήμα 5.16. Ύπαρξη καμπυλόγραμμης σχέσης

5. Επηρεάζεται, όπως και όλα τα τεστ, από την αξιοπιστία των μετρήσεων. Αν οι μετρήσεις έχουν μεγάλες τιμές σε στατιστικό σφάλμα, το πιθανότερο είναι ότι το σφάλμα αυτό θα «φορτώσει» και στον συντελεστή συσχέτισης, με απρόβλεπτες συνέπειες (να τον επηρεάσει

Page 74: Kefalaia Statistikis Gia Telikes Eksetaseis

δηλαδή και προς τα πάνω, αν και συνήθως θα πρέπει να τον επηρεάζει προς τα κάτω42).

6. Είναι ακατάλληλος όταν οι μεταβλητές δεν είναι συνεχείς αλλά διακριτές (όπως είναι οι κατηγορικές μεταβλητές). Στην δεύτερη περίπτωση συντελεστές όπως ο Φ ή ο point-biserial είναι πιο κατάλληλοι ανάλογα με το αν η μία ή και οι δύο μεταβλητές είναι διακριτές.

Σχήμα 5.17. Διάγραμμα σκεδασμού για κατηγορική μεταβλητή

7. Επηρεάζεται από την ύπαρξη στρεβλών κατανομών, ειδικά όταν αυτές αποκλίνουν κατά πολύ από την κανονικότητα. Αν καταπατείται κάποια από τις προϋποθέσεις εξετάστε43 την

42 Υπάρχουν πολλοί λόγοι που αυξάνουν το σφάλμα της μέτρησης, άλλοι στατιστικοί και άλλοι μεθοδολογικοί. Το πιθανότερο είναι ότι αύξηση στο μέγεθος τυχαίων παραγόντων και αναξιοπιστίας του τεστ θα μειώσουν τον συντελεστή συσχέτισης ενώ αύξηση του μεγέθους συστηματικού σφάλματος (π.χ., όταν οι μαθητές «κλέβουν») μπορεί να αυξήσει τον συντελεστή εξαιτίας της μείωσης των ατομικών διαφορών (τυπικής απόκλισης και διακύμανσης).43 Η καταπάτηση των προϋποθέσεων ενός στατιστικού ελέγχου δεν επιβάλει την χρήση μη-παραμετρικών κριτηρίων. Η απόφαση αυτή θα πρέπει να είναι αποτέλεσμα προσεκτικής σκέψης μιας και η καταπάτηση των προϋποθέσεων μπορεί επίσης να οφείλεται σε σφάλματα Τύπου-Ι ή Τύπου-ΙΙ. Με άλλα λόγια η καταπάτηση κάποιας προϋπόθεσης μπορεί να μην «ακυρώνει» τον παραμετρικό στατιστικό έλεγχο ενώ αντίθετα η επιλογή του συντηρητικού μη-παραμετρικού τεστ μπορεί να οδηγήσει στην υιοθέτηση της μηδενικής υπόθεσης όταν αυτή δεν είναι αληθής.

Page 75: Kefalaia Statistikis Gia Telikes Eksetaseis

χρήση μη παραμετρικών κριτηρίων, τα οποία συζητούνται περιεκτικά παρακάτω. Στο παρακάτω σχήμα είναι φανερό ότι η κατανομή των σκορ σε μεγάλες τιμές της μεταβλητής στον οριζόντιο άξονα έχει μεγαλύτερη διακύμανση (εύρος τιμών) από ότι σε μικρότερες τιμές της ίδιας μεταβλητής.

Σχήμα 5.18. Διάγραμμα σκεδασμού που απεικονίζει την ύπαρξη διαφορετικών διακυμάνσεων σε μεγάλες τιμές της μεταβλητής που βρίσκεται στον οριζόντιο άξονα

8. Δεν μπορεί να χρησιμοποιηθεί για τη διερεύνηση αιτιακών σχέσεων. Αυτό δεν σημαίνει ότι δεν υπάρχουν αιτιακές σχέσεις μεταξύ των μεταβλητών που μελετήθηκαν. Απλά ότι η χρήση του συντελεστή συσχέτισης δεν επιτρέπει αυτό το συμπέρασμα. Το μόνο συμπέρασμα που μπορεί να προκύψει από τη χρήση του συντελεστή συσχέτισης είναι ότι οι 2 μεταβλητές συνδιακυμαίνονται. Μόνο η μελλοντική χρήση πειραματικών σχεδίων μπορεί να επιβεβαιώσει αν οι αρχικές αυτές συνάφειες έχουν αιτιακό χαρακτήρα.

Page 76: Kefalaia Statistikis Gia Telikes Eksetaseis

9. Δεν μπορεί να αξιολογηθεί χωρίς την οπτική ανάλυση του διαγράμματος σκεδασμού όπως φαίνεται και στο παρακάτω σχήμα αφού ο ίδιος συντελεστής συσχέτισης μπορεί να απεικονίζει τελείως διαφορετικές σχέσεις44. Όπως φαίνεται στο παρακάτω σχήμα, το διάγραμμα πάνω και δεξιά εκφράζει μια καμπυλόγραμμη σχέση (και άρα υποτιμά την πραγματική σχέση, το διάγραμμα κάτω και δεξιά εκφράζει μια σχέση που οφείλετε σε μια ακραία παρατήρηση (και είναι τόσο δυνατή), το διάγραμμα κάτω και αριστερά εκφράζει μια σχεδόν απόλυτα γραμμική σχέση η οποία απομακρύνεται από το «τέλειο» εξαιτίας μιας απομακρυσμένης παρατήρησης, και τέλος το διάγραμμα πάνω και αριστερά εκφράζει την πιο επιθυμητή, τοπογραφικά, κατανομή των παρατηρήσεων αφού πολλές από αυτές είναι πάνω στην γραμμή της παλινδρόμησης και οι υπόλοιπες βρίσκονται από πάνω και από κάτω από την προβλεπτική κλίση σε ίσο αριθμό.

44 Αντλήθηκε από τον ιστότοπο: http://en.wikipedia.org/wiki/File:Anscombe%27s_quartet_3.svg

Page 77: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 5.19. Διαφορετικά διαγράμματα σκεδασμού τα οποία απεικονίζουν το ίδιο ακριβώς μέγεθος σχέσης (r = 0,816)

10. Δεν μπορεί να υπολογιστεί με ακρίβεια όταν υπάρχει μικρό εύρος τιμών (π.χ., φαινόμενο οροφής). Η περίπτωση αυτή απεικονίζεται στο παρακάτω σχήμα όπου το μεγαλύτερο εύρος παρατηρήσεων βρίσκεται σε υψηλές τιμές της μεταβλητής Υ (μεταβλητή που βρίσκεται στον κάθετο άξονα) και χαμηλές τιμές της μεταβλητής Χ (μεταβλητή που βρίσκεται στον οριζόντιο άξονα).

Σχήμα 5.20. Διάγραμμα σκεδασμού για την ύπαρξη μικρού εύρους τιμών

5.8. ΜΗ-ΠΑΡΑΜΕΤΡΙΚΟΙ ΣΥΝΤΕΛΕΣΤΕΣ ΣΥΣΧΕΤΙΣΗΣ - SPEARMAN’s RΌταν οι παραμετρικές προϋποθέσεις δεν ικανοποιούνται (δηλ. η κανονικότητα και η γραμμικότητα, το εύρος των παρατηρήσεων και η ύπαρξη ισοδιαστημικής κλίμακας), τότε πρέπει να χρησιμοποιηθούν εναλλακτικοί στατιστικοί δείκτες για την ανίχνευση σχέσεων μεταξύ μεταβλητών. Ένας από αυτούς είναι και ο δείκτης συσχέτισης του Spearman όπου μετατρέπει τα δεδομένα σε «σειρές» με βάση το μέγεθος τους (δηλ. οι αρχικές τιμές μπαίνουν σε αξιολογική σειρά με βάση το μέγεθός

Page 78: Kefalaia Statistikis Gia Telikes Eksetaseis

τους: πρώτος, δεύτερος, τρίτος, κλπ.). Αυτό έχει σαν αποτέλεσμα οι αποστάσεις μεταξύ των παρατηρήσεων να χάνουν τη σημασία τους και να αξιολογείται η σειρά των συμμετεχόντων στην πρώτη μεταβλητή σε σχέση με τί σειρά που οι ίδιοι συμμετέχοντες έχουν στην δεύτερη μεταβλητή. Το μέγεθος της συμφωνίας ή όχι της σειράς στις δύο μεταβλητές εκφράζει και το πρόσημο αλλά και το μέγεθος της σχέσης. Για παράδειγμα αν κάποιος που είναι πρώτος στις επιδόσεις είναι και πρώτος στη δημοτικότητα και ακολουθείται από άτομα μικρότερων επιδόσεων και μικρότερης δημοτικότητας θα αναδείξει μια θετική συνάφεια μεταξύ των μεταβλητών επίδοσης και δημοτικότητας. Η εξίσωση για τον υπολογισμό του συντελεστή συσχέτισης Spearman R έχει ως εξής:

Όπου Ν είναι ο αριθμός των ζευγαριών και D η διαφορά στη σειρά μεταξύ πρώτης και δεύτερης μέτρησης (δηλ. των ζευγών). Στο λογισμικό SPSS/PASW, η χρήση του δείκτη Spearman είναι πολύ απλή αφού το μόνο που χρειάζεται είναι η επιλογή «Spearman» στο μενού «correlatebivariate». Άλλος σχετικός μη παραμετρικός δείκτης είναι ο «T» του Kendall αλλά δεν συζητείται σε αυτό το κείμενο για να παρουσιαστεί το φαινόμενο της συσχέτισης όσο πιο απλά γίνεται. Στο παραπάνω παράδειγμα η εφαρμογή του συντελεστή Spearman έδωσε τα εξής αποτελέσματα:

Σχήμα 5.21. Συσχέτιση μεταξύ ωρών διαβάσματος και επίδοσης με τον δείκτη Spearman r.

Page 79: Kefalaia Statistikis Gia Telikes Eksetaseis

Όπως φαίνεται στο Σχήμα 5.21, η συνάφεια μεταξύ των δύο μεταβλητών ήταν επίσης πολύ δυνατή r = .985 και στατιστικά σημαντική (p < .001). Δεν περιμένουμε να δούμε πολύ μεγάλες διαφοροποιήσεις μεταξύ των 2 δεικτών, ειδικά αν η καταπάτηση των προϋποθέσεων δεν έχει γίνει σε μεγάλο βαθμό. Στην παρούσα περίπτωση ο δείκτης Spearman είναι και λίγο μεγαλύτερος από τον δείκτη Pearson, αν και συνήθως περιμένουμε πιο «συντηρητικά» ευρήματα από τη χρήση μη παραμετρικών δοκιμασιών45.

ΚατακλείδαΤο μοντέλο της ανάλυσης συσχέτισης με τη χρήση παραμετρικών ή μη-παραμετρικών δεικτών είναι από τα πιο «εύκολα» στη κατανόηση και την εφαρμογή μοντέλα στις κοινωνικές επιστήμες. Για αυτό και χρήση τους γίνεται σχεδόν σε όλες τις εμπειρικές μελέτες. Στο παρόν κεφάλαιο έγινε μια αναλυτική παρουσίαση και όλων των περιπτώσεων όπου το μοντέλο της συσχέτισης δεν είναι κατάλληλο. Προτείνεται να γίνεται αξιολογική ανάλυση των χαρακτηριστικών των δεδομένων με τα διαγράμματα σκεδασμού πριν γίνει χρήση του συντελεστή. Σε κάθε περίπτωση ο συντελεστής συσχέτισης αποτελεί ένα από τα πιο χρήσιμα στατιστικά μοντέλα.

45 Συνήθως οι μη-παραμετρικοί δείκτες είναι πιο «αυστηροί» στα αποτελέσματά τους αφού στόχο έχουν να διορθώσουν για πιθανά προβλήματα που προκαλούνται από τις καταπατήσεις των προϋποθέσεων. Αυτό βέβαια δεν συμβαίνει συνέχεια όπως φάνηκε και παραπάνω.

Page 80: Kefalaia Statistikis Gia Telikes Eksetaseis

6. ΑΠΛΗ ΓΡΑΜΜΙΚΗ ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ Μπορούν τα χαρακτηριστικά της προσωπικότητας να προβλέψουν την επιλογή συντρόφου; Μπορεί το οικογενειακό περιβάλλον να προβλέψει την ύπαρξη εγκληματικών τάσεων στο μέλλον; Μπορεί το κάπνισμα να προβλέψει τον καρκίνο; Η απάντηση των παραπάνω ερωτημάτων είναι αυτονόητα πολύ σημαντική για την κοινωνία μας και για αυτό τα προβλεπτικά μοντέλα έχουν τόσο μεγάλη αξία και διάδοση. Το πιο απλό προβλεπτικό μοντέλο της στατιστικής είναι η ανάλυση παλινδρόμησης η οποία αποτελεί συνέχεια του συντελεστή συσχέτισης και για αυτό είναι πολύ εύκολη η κατανόησή της. Ας δούμε μια απλή πρόβλεψη όπου θέλουμε να δούμε αν η χρήση βιταμινών μπορεί να βελτιώσει την προσοχή των παιδιών στο σχολείο. Τα δεδομένα παρουσιάζονται παρακάτω46:

Η0: Η χρήση βιταμινών ΔΕΝ προβλέπει τα επίπεδα προσοχής των μαθητών-τριών στο σχολείοΗε: Η χρήση βιταμινών προβλέπει τα επίπεδα προσοχής των μαθητών-τριών στο σχολείο

Τα δεδομένα είναι από 19 παιδιά και έχουν ως εξής:

Πίνακας 5.1. Δεδομένα από υποθετική μελέτη για τη σχέση βιταμινών και προσοχής.Χώρες 1 2 3 4 5 6 7 8 9 10Βιταμίνες 1

19 9 9 8 8 8 6 6 5

Προσοχή 26

21 24 21 19 13 19 11 23 15

Χώρες 11 12 13 14 15 16 17 18 19

46 Θα πρέπει οι χρήστες στατιστικών αναλύσεων να συνηθίσουν στην ιδέα ότι η στατιστική είναι επικουρική και μόνο της ερευνητικής διαδικασίας και έχει νόημα μόνο για την απάντηση συγκεκριμένων ερευνητικών ερωτήσεων. Επομένως πρώτα θα πρέπει να γίνει η διατύπωση των υποθέσεων και μετά η επιλογή του κατάλληλου στατιστικού δείκτη που θα δώσει απάντηση στη συγκεκριμένη υπόθεση.

Page 81: Kefalaia Statistikis Gia Telikes Eksetaseis

Βιταμίνες 5 5 5 5 4 4 4 3 3Προσοχή 4 18 12 3 11 15 6 13 4Το πρώτο βήμα, όπως και στην ανάλυση συσχέτισης είναι η δημιουργία του διαγράμματος σκεδασμού το οποίο, πέρα από την οπτική ανίχνευση της ύπαρξης σχέσης, θα μας δώσει πληροφορίες και για την ύπαρξη ή όχι γραμμικότητας. Ακολουθώντας τα βήματα που περιγράφηκαν στην ανάλυση συσχέτισης κατά Pearson, δημιουργούμε το παρακάτω διάγραμμα σκεδασμού με μια μικρή διαφοροποίηση. Το παρών σετ υποθέσεων δείχνει κατεύθυνση αναφορικά με το ποια είναι η εξαρτημένη μεταβλητή (αποτέλεσμα) και ποια η ανεξάρτητη47 (προβλεπτικός παράγοντας). Επομένως στη δημιουργία του διαγράμματος σκεδασμού πρέπει να τοποθετήσουμε την εξαρτημένη μεταβλητή στον κάθετο άξονα (Υ) και την ανεξάρτητη στον οριζόντιο (Χ).

Από το Σχήμα 6.1 είναι φανερό ότι υπάρχει θετική συνάφεια μεταξύ των δύο μεταβλητών μιας και αυξήσεις της μιας φαίνεται να σχετίζονται με αυξήσεις της άλλης μεταβλητής. Επομένως η προϋπόθεση της γραμμικότητας φαίνεται να ικανοποιείται. Σχετικά με την προϋπόθεση της κανονικότητας, χρησιμοποιώντας το τεστ Kolmogorov-Smirnov (όπως περιγράφηκε στο Παράρτημα Β), βλέπουμε ότι σε καμία από τις 2 μεταβλητές (προσοχή ή βιταμίνες) δεν καταπατείται αυτή η προϋπόθεση. Ο δείκτης K-Sz για τις βιταμίνες ήταν .941 ενώ για την προσοχή .457 και κανένας από αυτούς δεν ξεπέρασε επίπεδα στατιστικής σημαντικότητας (πιθανότητες .34 και .99, αντίστοιχα). Από τη στιγμή που καμία πιθανότητα δεν ήταν μικρότερη από το 5% τότε αυτόματα δεχόμαστε τη μηδενική υπόθεση που υποστηρίζει ότι οι υπο-εξέταση κατανομές (στις βιταμίνες και στην προσοχή) δεν είναι στατιστικά σημαντικά διαφορετικές από την υποθετική κανονική κατανομή (δηλαδή του Gauss). Επομένως μπορούμε να προχωρήσουμε στην ανάλυση 47 Όπως ειπώθηκε πριν, στην ανάλυση συσχέτισης η συνάφεια Α-Β είναι ίδιας «αξίας» με τη συνάφεια Β-Α μιας και το ενδιαφέρον δεν είναι στο αν η μια μεταβλητή προκαλεί την άλλη αλλά απλά στο αν οι 2 μεταβλητές κινούνται παράλληλα.

Page 82: Kefalaia Statistikis Gia Telikes Eksetaseis

παλινδρόμησης αφού έχουν ικανοποιηθεί και οι 2 προϋποθέσεις. Για την προϋπόθεση της αυτοσυσχέτισης ισχύουν όσα έχουν ειπωθεί και στα προηγούμενα κεφάλαια.

Σχήμα 6.1. Διάγραμμα σκεδασμού για την πρόβλεψη των επιπέδων προσοχής στο σχολείο μετά από χορήγηση βιταμινών.

Το επόμενο βήμα είναι να εφαρμόσουμε το μοντέλο της ευθείας γραμμής με σκοπό να είμαστε σε θέση να προβλέψουμε τα επίπεδα προσοχής από τη χρήση βιταμινών. Το μοντέλο αυτό εκφράζεται με την παρακάτω συνάρτηση:

Όπου Υ είναι η προβλεπτική τιμή της προσοχής η οποία είναι συνάρτηση ενός συντελεστή κλίσης (b) και μιας σταθεράς (α). Τα σημεία «α» και «b» αποτελούν τα δύο αναγκαία σημεία προκειμένου να εκταθεί μια και μοναδική ευθεία γραμμή. Πρέπει να «κατανοήσουμε» την ευθεία αυτή γραμμή σαν τη γραμμή που «περιγράφει» με τον καλύτερο τρόπο τα δεδομένα μας. Δηλαδή, στην καλύτερη περίπτωση θα έπρεπε όλες οι παρατηρήσεις να είναι πάνω στην ευθεία γραμμή, αν όμως αυτό δεν είναι

Page 83: Kefalaia Statistikis Gia Telikes Eksetaseis

δυνατό τότε θα έπρεπε όσο το δυνατόν περισσότερες από αυτές να είναι πάνω στη γραμμή και οι υπόλοιπες να βρίσκονται όσο το δυνατόν πιο κοντά της (προς τα πάνω ή προς τα κάτω). Η παράμετρος «α» της εξίσωσης (ή σταθερά) είναι το σημείο όπου η ευθεία γραμμή της πρόβλεψης τέμνει τον κάθετο άξονα (αναφέρεται δηλαδή στην τιμή του Υ όταν η τιμή του Χ είναι ίση με το μηδέν).

Σχήμα 6.2. Πρόβλεψη της προσοχής από τη χρήση βιταμινών

Όπως φαίνεται στο σχήμα 6.2, τέσσερις περίπου παρατηρήσεις εφάπτονται με τη γραμμή της πρόβλεψης που σημαίνει ότι για αυτά τα άτομα/συμμετέχοντες η πρόβλεψη θα είναι πολύ ακριβής. Όσο μεγαλύτερη είναι η απόσταση κάποιων παρατηρήσεων από την ευθεία γραμμή τόσο πιο πολύ θα «πέσουμε έξω» για αυτές τις παρατηρήσεις αφού η πρόβλεψη βασίζεται στην «επιτυχία» αυτής της ευθείας γραμμής να περιγράψει τα δεδομένα48. Οι αποστάσεις των παρατηρήσεων από την

48 Κάποιος θα μπορούσε πολύ λογικά να ισχυριστεί ότι το πρώτο βήμα πριν την αξιολόγηση της πρόβλεψης είναι να διερευνηθεί αν υπάρχει σχέση μεταξύ των 2 εμπλεκομένων μεταβλητών μιας και η έλλειψη

Page 84: Kefalaia Statistikis Gia Telikes Eksetaseis

ευθεία γραμμή αναφέρονται επίσης ως υπολείμματα ή σφάλματα ή υπόλοιπα (residuals) αφού δεν αποτελούν τίποτε άλλο από την απόκλιση μεταξύ πραγματικών και προβλεπτικών τιμών. Όσο πιο μεγάλες είναι αυτές οι αποστάσεις τόσο πιο μεγάλη και η απόκλιση μεταξύ πραγματικότητας και πρόβλεψης. Με άλλα λόγια οι τιμές αυτές εκφράζουν όλα όσα δεν εξηγούνται από το μοντέλο της γραμμικής παλινδρόμησης. Για παράδειγμα για το άτομο το οποίο έχει τιμή στις βιταμίνες ίση με 5 μονάδες (όπως δείχνει και το διακεκομμένο βέλος), προβλέπουμε ότι θα έχει επίπεδα προσοχής περίπου στις 12 μονάδες (αν υπολογίσουμε τη νοητή ευθεία αυτής της παρατήρησης προς την γραμμή πρόβλεψης και από τη γραμμή πρόβλεψης στον άξονα Υ). Είναι φανερό ότι για αυτό το άτομο η πρόβλεψη θα είναι εξαιρετικά φτωχή.

6.1. Υπολογισμός της γραμμής της παλινδρόμησης με τη χρήση του SPSS/PASW 18Για τον υπολογισμό της ανάλυσης παλινδρόμησης επιλέξτε τις εξής εντολές (σχήμα 6.3):

Analyze Regression Linear

σχέσης δηλώνει και την απουσία πρόβλεψης. Στο συγκεκριμένο παράδειγμα, η σχέση μεταξύ προσοχής και χρήσης βιταμινών με τη χρήση του Pearson r ήταν .739. Το μέγεθος του συντελεστή συσχέτισης είναι αρκετά μεγάλο, και στατιστικά σημαντικό ώστε να μπορεί να υπάρχει και ουσιαστική πρόβλεψη μεταξύ των 2 μεταβλητών.

Page 85: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 6.3. Εντολές για την πραγματοποίηση της ανάλυσης παλινδρόμησης

Στη συνέχεια, στο «παράθυρο» του σχήματος 6.4 επιλέξτε και τοποθετήστε την εξαρτημένη μεταβλητή στην εσοχή με τίτλο: «Dependent» και την ανεξάρτητη μεταβλητή στην εσοχή με τίτλο «Independent(s)». Επιλέξτε το «ΟΚ». Για λόγους απλοποίησης δεν απαιτούνται άλλες επιλογής για την βασική κατανόηση της απλής ανάλυσης παλινδρόμησης.

Page 86: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 6.4. Υπολογισμός της πρόβλεψη της προσοχής από τη χρήση βιταμινών

Σχήμα 6.5. Αποτελέσματα από την ανάλυση παλινδρόμησης με τον δείκτη συσχέτισης και τον δείκτη προσδιορισμό να εκφράζουν τα επίπεδα πρόβλεψης (1ος

Πίνακας)

Όπως φαίνεται στο Σχήμα 6.5, ο πρώτος πίνακας που βλέπουμε περιγράφει κάποια συγκεντρωτικά δεδομένα για την ύπαρξη πρόβλεψης. Αρχικά παρουσιάζεται ο δείκτης συνάφειας των 2 μεταβλητών Pearson r ο οποίος ήταν 0,739 και δείχνει μια δυνατή θετική συνάφεια μεταξύ της χρήσης βιταμινών και της

Page 87: Kefalaia Statistikis Gia Telikes Eksetaseis

προσοχής στο σχολείο. Ο συντελεστής συσχέτισης υψωμένος στη δεύτερη δύναμη (τετράγωνο) ορίζεται και ως «συντελεστής προσδιορισμού» και εκφράζει το ποσοστό της διακύμανσης της εξαρτημένης μεταβλητής που οφείλεται στη ανεξάρτητη μεταβλητή. Το ποσοστό αυτό στο συγκεκριμένο παράδειγμα είναι ίσο με 0,546, δηλαδή περίπου 55%. Με απλά λόγια αυτό το εύρημα υποδηλώνει ότι αν γνωρίζουμε πόσες βιταμίνες παίρνει κάποιος μπορούμε να κατανοήσουμε κατά 55% τα επίπεδα προσοχής του στο σχολείο49. Με πιο απλά λόγια, η χρήση των βιταμινών είναι καθοριστικός παράγοντας της κατανόησης των επιπέδων προσοχής στο σχολείο, με την επιφύλαξη ότι η αιτία της προσοχής δεν είναι η χρήση των βιταμινών (θα μπορούσε να είναι αλλά αυτό δεν μπορούμε να το ισχυριστούμε). Οι βιταμίνες φαίνεται να εξηγούν και να συμβάλουν στην κατανόηση του φαινομένου της προσοχής αλλά εδώ πρέπει να δοθεί προσοχή σε 2 παράγοντες: (α) ότι η διερεύνηση αιτιακών σχέσεων απαιτεί τη χρήση πειραματικών ερευνητικών σχεδίων, και, (β) το ότι μια μεταβλητή εξηγεί το 55% της διακύμανσης μιας άλλης μεταβλητής δεν σημαίνει ότι αποτελεί και την αιτία της αλλαγής της δεύτερης. Στο συγκεκριμένο παράδειγμα πιθανές αιτίες μπορεί να είναι η επίδοση στο σχολείο, τα κίνητρα, το ενδιαφέρον, κλπ. Επομένως, αν διερευνούσαμε την προβλεπτική ικανότητα και άλλων μεταβλητών θα ήταν πιθανό να αξιολογηθεί σε μεγαλύτερο βάθος η σημαντικότητα και η αξία της μεταβλητής «βιταμίνες» ως προβλεπτικός παράγοντας της προσοχής, αφού οι ερευνητές θα μπορούσαν να αξιολογήσουν αυτή τη συνεισφορά σαν συνάρτηση της συνεισφοράς και άλλων μεταβλητών. Για παράδειγμα, η εισαγωγή μιας δεύτερης προβλεπτικής μεταβλητής (π.χ, διατροφή) θα μπορούσε να μειώσει τα επίπεδα πρόβλεψης της μεταβλητής βιταμίνες (π.χ., από 55% σε 35%) αφού ένα 20% της διακύμανσης του φαινομένου της προσοχής θα μπορούσε να οφείλετε στον τρόπο διατροφής των παιδιών.49 Αυτό δεν είναι ισοδύναμο του ότι για το 55% των συμμετεχόντων θα έχουμε ακριβή πρόβλεψη ενώ για τους υπόλοιπους συμμετέχοντες η πρόβλεψη θα είναι κακή. Αυτή είναι μια λαθεμένη κατανόηση της ιδέας της πρόβλεψης.

Page 88: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 6.6. Αποτελέσματα από την ανάλυση παλινδρόμησης: Τεστ σημαντικότητας (2ος Πίνακας).

Το σχήμα 6.6 αξιολογεί το μέγεθος των δεικτών του Μοντέλου για το αν ξεπερνούν ή όχι επίπεδα στατιστικής σημαντικότητας. Με άλλα λόγια αξιολογεί την υπόθεση ότι η πρόβλεψη είναι σημαντική ή τυχαία. Ο τίτλος του Πίνακα «Anova» σημαίνει «ανάλυσης της διακύμανσης» η οποία συμβολίζεται με τον λόγο F50. Αυτό λοιπόν το τεστ αξιολογεί την πιθανότητα ο συντελεστής συσχέτισης r ή ο συντελεστής R2 να είναι στατιστικά σημαντικά διαφορετικοί από το μηδέν. Όπως φαίνεται στο Σχήμα 6.6, το μέγεθος τους τεστ F είναι 20,444 μονάδες το οποίο για 1 και 17 βαθμούς ελευθερίας51 (στον αριθμητή και στον παρανομαστή, αντίστοιχα), σχετίζεται με μια πιθανότητα που είναι μικρότερη από 1 τοις 1000). Γνωρίζοντας ότι ένα στατιστικά σημαντικό εύρημα σημαίνει αυτόματα την υιοθέτηση της εναλλακτικής υπόθεσης, συμπεραίνει κανείς ότι υπάρχει στατιστικά σημαντική συσχέτιση/πρόβλεψη των επιπέδων προσοχής από την χρήση βιταμινών.

50 Το ίδιο τεστ (F) χρησιμοποιείται συνήθως για την ανίχνευση διαφορών 2 ή και περισσοτέρων μέσων όρων. Το ίδιο ουσιαστικά μαθηματικό μοντέλο χρησιμοποιείται και για τον υπολογισμό της πρόβλεψης.51 Σε μια προσπάθεια να κρατήσω τα πράγματα απλά θα πω πως οι βαθμοί ελευθερίας του αριθμητή αντιστοιχούν στον αριθμό των προβλεπτικών μεταβλητών ενώ αυτοί του παρανομαστή περίπου στον αριθμό των παρατηρήσεων (συμμετεχόντων). Φυσικά το παραπάνω αποτελεί υπεραπλούστευση του τι ακριβώς είναι και τι ρόλο παίζουν οι βαθμοί ελευθερίας. Για μια πολύ ενδιαφέρουσα παρουσίαση συμβουλευτείτε το βιβλίο των Ρούσου και Τσαούση από τα Ελληνικά Γράμματα.

Page 89: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 6.7. Αποτελέσματα από την ανάλυση παλινδρόμησης: Συντελεστές και προβλεπτική εξίσωση (3ος Πίνακας).

Με τα αποτελέσματα από τον παραπάνω πίνακα (σχήμα 6.7) μπορούμε να αξιολογήσουμε τους συντελεστές που ορίζουν την εξίσωση της πρόβλεψης και να τους εφαρμόσουμε στην προβλεπτική εξίσωση. Εφαρμόζοντας για διαφορετικές τιμές Χ μπορούμε να προβλέψουμε τα επίπεδα προσοχής διαφορετικών συμμετεχόντων (βλέπε παρακάτω «εφαρμογή της προβλεπτικής εξίσωσης»). Από το σχήμα 6.7 λοιπόν παρατηρούμε 2 στατιστικά τεστ που αναφέρονται στη χρήση του t-test52. Εμείς γνωρίζουμε ήδη από όλα τα παραπάνω ότι όποτε βλέπουμε ένα στατιστικό τεστ θα πρέπει να είμαστε ξεκάθαροι για το ποια υπόθεση αξιολογείται (μηδενική και εναλλακτική). Το πρώτο τεστ λοιπόν αξιολογεί τις παρακάτω υποθέσεις αναλογικά με την παράμετρο της σταθεράς (constant, παράμετρος «α» στην εξίσωση της παλινδρόμησης) η οποία όπως είπαμε παραπάνω αναφέρεται στην πρόβλεψη της τιμής του Υ όταν η τιμή του Χ είναι μηδέν. Οι υποθέσεις λοιπόν που αξιολογούνται είναι οι εξής:

Η0: Η τιμή της σταθεράς είναι ίση με το μηδένΗε: Η τιμή της σταθεράς είναι διαφορετική από το μηδέν

Επί τοις ουσίας λοιπόν αξιολογείται το αν η παρατηρούμενη τιμή 0,938 είναι ίση με το μηδέν. Από την αξιολόγηση της πιθανότητας, η οποία είναι 77,5%, φαίνεται ότι πρέπει να δεχτούμε τη μηδενική υπόθεση

52 Το τ-test, όπως και το F-test ανήκει στα τεστ διαφορών όπου αξιολογείται αν ένας μέσος όρος είναι διαφορετικό από κάποια παράμετρο του πληθυσμού ή αν διαφέρουν μεταξύ τους 2 μέσοι όροι.

Page 90: Kefalaia Statistikis Gia Telikes Eksetaseis

(θα δεχόμασταν την εναλλακτική αν η πιθανότητα ήταν μικρότερη από 5%) η οποία μας λέει ότι η σταθερά δεν είναι στατιστικά σημαντικά διαφορετική από το μηδέν. Ποια είναι η συνεισφορά αυτού του τεστ; Σχεδόν καμία αφού η σταθερά, αν και συνήθως είναι στατιστικά σημαντική, δεν συνεισφέρει ουσιαστικές πληροφορίες για το μέγεθος ή την κατεύθυνση της πρόβλεψης (που είναι και η ουσία του μοντέλου της παλινδρόμησης). Αντίθετα, η κλίση Β μας πληροφορεί για το μέγεθος της πρόβλεψης και το είδος της σχέσης μεταξύ των δύο μεταβλητών. Επομένως η δεύτερη στην σειρά παράμετρος αναφέρεται στις εξής υποθέσεις:

Η0: Η κλίση Β είναι ίση με το μηδένΗε: Η κλίση Β είναι στατιστικά σημαντικά διαφορετική από το μηδέν

Επειδή ο στατιστικός δείκτης t με μέγεθος 4,522 μονάδες σχετίζεται με μια πιθανότητα που είναι μικρότερη από το 5%, δεχόμαστε αυτόματα την εναλλακτική υπόθεση που μας λέει ότι η κλίση είναι στατιστικά σημαντικά διαφορετική από το μηδέν. Σημαντική κλίση σημαίνει φυσικά και σημαντική πρόβλεψη. Επομένως συμπεραίνουμε και από αυτό το τεστ (όπως και από το F-test παραπάνω) ότι υπάρχει στατιστικά σημαντική πρόβλεψη της προσοχής από τη χρήση βιταμινών.

Τι σημαίνει ο δείκτης Β (κλίση); Ο συντελεστής αυτός μας δείχνει πόσο μεταβάλλεται53 το αποτέλεσμα (στο παράδειγμά μας τα επίπεδα προσοχής) για κάθε μια μονάδα αλλαγής της ανεξάρτητης μεταβλητής (δηλαδή της χρήσης βιταμινών). Η τιμή αυτή είναι 2,224 που σημαίνει ότι η αύξηση κατά μιας και μόνο βιταμίνης την ημέρα σχετίζεται με αύξηση των επιπέδων προσοχής κατά 2 περίπου μονάδες (αστάθμιστες μονάδες των οποίων το πιθανό εύρος δεν έχει σημασία για την περιγραφή της παρούσης ανάλυσης).

53 ή καλύτερα συ-μεταβάλλεται.

Page 91: Kefalaia Statistikis Gia Telikes Eksetaseis

6.2. Εφαρμογή της προβλεπτικής εξίσωσης για μια ανεξάρτητη μεταβλητήΗ έννοια της πρόβλεψης έχει αξία αν με πληροφορίες που έχουμε σήμερα μπορούμε να προβλέψουμε, με σχετικά μεγάλη ακρίβεια, ότι κάτι θα συμβεί στο μέλλον. Με τη χρήση λοιπόν της εξίσωσης της πρόβλεψης μπορούμε να προβλέψουμε τα επίπεδα προσοχής στο σχολείο αν ένας μαθητής παίρνει π.χ., 4 βιταμίνες την ημέρα. Με βάση την παρακάτω εξίσωση και εφαρμόζοντάς την για χ = 4, έχουμε:

Υ’ = βχ + α =>Υ’ = 0,938(χ) + 2,224 =>Υ’ = 0,938(4) + 2,224 =>Υ’ = 5,976

Δηλαδή, η προσοχή θα βελτιωθεί κατά περίπου 6 μονάδες αν αυτός ο μαθητής πάρει 4 βιταμίνες την ημέρα. Τα αντίστοιχα επίπεδα προσοχής για ένα μαθητή ο οποίος δεν παίρνει καμία βιταμίνη (δηλ. για χ = 0), είναι 2,224 μονάδες. Εντούτοις, όπως αναφέρθηκε και παραπάνω, η εικόνα σχετικά με την προβλεπτική ικανότητα των βιταμινών μπορεί να αλλάξει δραστικά εάν αξιολογηθούν και άλλες προβλεπτές μεταβλητές, οπότε σε καμιά περίπτωση δεν μπορούμε να βγάλουμε το συμπέρασμα ότι οι βιταμίνες ή η έλλειψή τους είναι υπεύθυνη για τα επίπεδα προσοχής των μαθητών στο σχολείο.

6.3. Ανάλυση των Στατιστικών Σφαλμάτων (Residuals)Η ανάλυση των στατιστικών σφαλμάτων μπορεί να είναι τόσο ενδιαφέρουσα ώστε να αποτελεί ακόμη και τον κύριο στόχο ενός ερευνητή-τριας αν και τις περισσότερες φορές μπορεί αυτό να προκύψει από τα αποτελέσματα. Για περισσότερες πληροφορίες ανατρέξτε στο σχετικό κεφάλαιο.

6.4. Ανάλυση Παλινδρόμησης με Μικρά Δείγματα και Χρήση

Page 92: Kefalaia Statistikis Gia Telikes Eksetaseis

«Robust» ΜεθόδωνΈνα από τα μεγαλύτερα προβλήματα στην εφαρμογή στατιστικών αναλύσεων είναι και το μέγεθος του δείγματος με την περίπτωση των μικρών δειγμάτων να δημιουργούν πολλαπλά προβλήματα. Ο σκοπός αυτής της ενότητας είναι να αναδείξει τον υπολογισμό των παραμέτρων της παλινδρόμησης χρησιμοποιώντας (α) τα δεδομένα του δείγματος, και συγκρίνοντάς τα με, (β) τα προσομοιωμένα δεδομένα τα οποία προκύπτουν από τα δεδομένα του δείγματος (με τη μέθοδο της δειγματοληψίας με αντικατάσταση). Για περισσότερες πληροφορίες ο αναγνώστης μπορεί να μελετήσεις τις εργασίες του Efron και των συνεργατών του. Περισσότερες πληροφορίες επίσης για την ανάλυση αυτή παρουσιάζονται στο κεφάλαιο της προσομοίωσης πληθυσμιακών παραμέτρων με το μοντέλο Bootstrap.

ΠαράδειγμαΠαρακάτω παρουσιάζεται ένα παράδειγμα από την ανάλυση της γραμμικής παλινδρόμησης. Ας προσπαθήσουμε να προβλέψουμε το άγχος (anxiety) από τα αρνητικά συναισθήματα (nna). Τα δεδομένα από την εφαρμογή αυτή παρουσιάζονται παρακάτω:

Page 93: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 6.8. Πίνακας δεδομένων στο λογισμικό S-Plus

Σχήμα 6.9. Σχέση μεταξύ παρατηρήσιμων και προβλεπόμενων τιμών

Page 94: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 6.10. Σχέση μεταξύ προβλεπόμενων τιμών και σφαλμάτων

Τα αποτελέσματα από την απλή ανάλυση γραμμικής παλινδρόμησης προτείνουν ότι τα αρνητικά συναισθήματα προβλέπουν το άγχος κατά 68,73% (όπως αξιολογείται από τον συντελεστή προσδιορισμού R2). Επίσης η κλίση της μεταβλητής αρνητικά συναισθήματα ήταν ίση με (β = 0,9206) η οποία και ήταν στατιστικά σημαντική σε επίπεδο μικρότερο του 1/1000. Το σχήμα 6.9 απεικονίζει τη σχέση μεταξύ παρατηρήσιμων τιμών και προβλεπομένων τιμών, η οποία σχέση είναι γραμμική και πολύ δυνατή (με κάποιες εξαιρέσεις).

Εντούτοις, τα σφάλματα δείχνουν ότι υπάρχουν και παρατηρήσεις οι οποίες δεν ταιριάζουν στο μοντέλο της γραμμικής παλινδρόμησης, όπως οι 13 και 14, αλλά και η 1. Αυτές αποτελούν σίγουρα λόγο ανησυχίας για τον ερευνητή-τρια, ειδικά εφόσον οι παρατηρήσεις αυτές εκφράζουν πραγματικές παρατηρήσεις στον πληθυσμό (και όχι κάποιο λάθος).

Page 95: Kefalaia Statistikis Gia Telikes Eksetaseis

Για το λόγο αυτό θα ήταν ενδιαφέρον να επαναξιολογήσουμε την παραπάνω πρόβλεψη προσομοιώνοντας τα δεδομένα του δείγματος προκειμένου να υπολογίσουμε πληθυσμιακές παραμέτρους. Η ιδέα λοιπόν είναι να επαναληφθεί η ανάλυση Ν φορές (περίπου 1000) με τα 1000 νέα δείγματα να προκύπτουν με τυχαία δειγματοληψία με αντικατάσταση από το αρχικό δείγμα. Η τελική πρόβλεψη δεν είναι τίποτε άλλο από τον μέσο όρο των 100 προβλέψεων. Για περισσότερες πληροφορίες ανατρέξτε στο σχετικό κεφάλαιο όπου προσομοιώνεται ο συντελεστής Pearson r.

Τα αποτελέσματα από αυτή την ανάλυση έδειξαν ότι ο βαθμός πρόβλεψης μειώθηκε από το ποσοστό του 68,73% σε ποσοστό ίσο με 44,5%. Επομένως, τα αποτελέσματα αναφορικά με την σχέση αυτή στον πληθυσμό είναι πολύ πιο συντηρητικά με τα προσομοιωμένα δεδομένα σε σχέση με αυτά του δείγματος. Το παρακάτω σχήμα απεικονίζει τα σφάλματα όπως αυτά υπολογίζονται με τις δύο μεθόδους, των ελαχίστων τετραγώνων και της μεθόδου Robust. Επίσης η νέα κλίση ήταν 0,9318 και στατιστικά σημαντικά διαφορετική από το μηδέν.

Page 96: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 6.10. Παρουσίαση σφαλμάτων από προσομοιωμένα δεδομένα σε σχέση με τα πραγματικά

6.6. Προβληματισμοί αναφορικά με την απλή γραμμική ανάλυση παλινδρόμησηςΠαρόλη την ευρεία χρήση του μοντέλου της γραμμικής παλινδρόμησης υπάρχουν και αρκετές επιφυλάξεις αναφορικά με τη χρήση της. Κάποιες από αυτές τις ανησυχίες παρουσιάζονται παρακάτω:

6.6.1. Επηρεάζεται από ακραίες παρατηρήσεις/τιμέςΌπως όλες οι μέθοδοι ανάλυσης που βασίζονται στο μέσο όρο έτσι και η ανάλυση παλινδρόμησης επηρεάζεται αρνητικά54 από την ύπαρξη ακραίων τιμών. Θα θυμάστε ότι στον αριθμητή του κλάσματος για τον υπολογισμό του συντελεστή συσχέτισης Pearson r οι παρατηρήσεις στο ένα μέγεθος αφαιρούνται από το μέσο όρο της συγκεκριμένης μεταβλητής και το ίδιο γίνεται 54 Αρνητικά αναφορικά με την ακρίβεια της εκτίμησης της πρόβλεψης.

Page 97: Kefalaia Statistikis Gia Telikes Eksetaseis

για την δεύτερη μεταβλητή. Επομένως η ύπαρξη θετικής ή αρνητικής συνδιακύμανσης (αριθμητής του κλάσματος) εξαρτάται από το μέγεθος του μέσου όρου. Είναι φανερό ότι οτιδήποτε επηρεάζει το μέγεθος του μέσου όρου έχει επιπλοκές για το μέγεθος και την κατεύθυνση της σχέσης/πρόβλεψης.

6.6.2. «Παλινδρόμηση» από το μέσο όρο (Regression towards the mean)Ένα φαινόμενο που παρατηρήθηκε από τους Campbell και Kenny (1999) είναι ότι συνεχόμενες μετρήσεις του ιδίου φαινομένου από τους ίδιους συμμετέχοντες σχετίζονται με την ύπαρξη διαφορετικών κατανομών, με τις κατανομές κατά την δεύτερη μέτρηση να είναι πιο «συρρικνωμένες» και τις ακραίες κυρίως παρατηρήσεις να είναι πιο κοντά στο μέσο όρο του πληθυσμού. Η κατεύθυνση αυτού του φαινομένου εξαρτάται από την ποιότητα55 του δείγματος. Για παράδειγμα αν το επιλεγόμενο δείγμα έχει μέσο όρο σημαντικά χαμηλότερο από τον μέσο όρο του πληθυσμού, τότε η επαναλαμβανόμενη μέτρηση προβλέπεται ότι θα δώσει μέσο όρο ο οποίος θα «πλησιάσει αυτόν του πληθυσμού). Το σχήμα 6.11 απεικονίζει το φαινόμενο αυτό.

Όπως γίνεται φανερό στο σχήμα 6.11 όταν ένα επιλεγμένο δείγμα έχει μέσο όρο σημαντικά χαμηλότερο από αυτόν του σχετικού πληθυσμού, είναι πολύ πιθανό στην δεύτερη μέτρηση να έχει μέσο όρο ο οποίος είναι πιο κοντά στον μέσο όρο του πληθυσμού. Το φαινόμενο αυτό μπορεί να παρατηρηθεί όταν ο μέσος όρος του δείγματος βρίσκεται κάτω ή πάνω από τον μέσο όρο του πληθυσμού και εκφράζεται με την γενικότερη «σύγκλιση» των ακραίων τιμών.

Για λύσεις αναφορικά με το φαινόμενο αυτό (π.χ., διορθωτικές κινήσεις) συμβουλευτείτε την εργασία των Lin και Hughes (1997) αλλά και τις αρχικές εργασίες των Campbell, Stanley, Kenny, κ.α.

55 Με άλλα λόγια πόσο «προκατειλημμένο» προέκυψε το δείγμα άσχετα από τον τρόπο επιλογής (τυχαίο ή όχι).

Page 98: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 6.11. Το φαινόμενο της «παλινδρόμησης από το μέσο όρο».

Πιο αναλυτικά, το φαινόμενο της παλινδρόμησης από το μέσο όρο απεικονίζεται στο σχήμα 6.12. Ο γενικός μέσος όρος εκφράζεται με την κόκκινη γραμμή. Στην πρώτη μέτρηση (μπλε οριζόντια γραμμή) είναι φανερό ότι υπάρχει μεγάλο εύρος στις τιμές των ατόμων με πολλές από αυτές να κυμαίνονται αρκετά πιο κάτω από το μέσο όρο του πληθυσμού. Στην δεύτερη μέτρηση γίνεται φανερό ότι οι ακραίες παρατηρήσεις της πρώτης μέτρησης έχουν συγκλίνει σημαντικά με τον μέσο όρο του πληθυσμού. Συνεπώς ο μέσος όρος της δεύτερης

Page 99: Kefalaia Statistikis Gia Telikes Eksetaseis

μέτρησης (μπλε γραμμή) εκφράζει με μεγαλύτερη ακρίβεια το υπό-μελέτη φαινόμενο.

Σχήμα 6.12. Διακύμανση των τιμών προς τον μέσο όρο του πληθυσμού (κάτω) στην δεύτερη μέτρηση.

6.6.3. Πολύ-συσχετιστικότητα μεταξύ προβλεπτών μεταβλητών (Multicolinearity).Όπως αναφέρθηκε και πριν στην περιγραφή του συντελεστή συσχέτισης Pearson r το να συσχετίζονται 2 μεταβλητές κατά 0,8 ή και παραπάνω μπορεί να είναι προβληματικό. Σε επίπεδο σχέσης, οι δύο μεταβλητές φαίνεται να έχουν ως κοινό σημείο αναφοράς το 64%

Page 100: Kefalaia Statistikis Gia Telikes Eksetaseis

των πληροφοριών που «μεταφέρουν». Αν και αυτό δεν ακούγεται αρχικά σαν ένα πολύ μεγάλο μέγεθος, εντούτοις είναι αν αναλογιστούμε τη συνάφεια σε επίπεδο συντελεστών συσχέτισης ή και κλίσεων. Δηλαδή, για παράδειγμα, για μια μονάδα αλλαγής της μιας μεταβλητής η άλλη αλλάζει κατά 0,8 σταθμισμένες μονάδες. Ένα ερώτημα λοιπόν που θα έπρεπε να απασχολήσει είναι το εξής: Είναι η συνάφεια αυτή αρκετά μεγάλη ώστε να υποπτευθούμε ότι οι δύο μεταβλητές μετρούν θεωρητικά, περίπου την ίδια «κατασκευή»; Αν και το παραπάνω αποτελεί θεωρητικό προβληματισμό, εντούτοις θα πρέπει να απασχολήσει τον αναλυτή-τρια εφόσον το φαινόμενο της πολύ-συσχετιστικότητας σχετίζεται με μια σειρά από αρνητικές συνέπειες. Σε επίπεδο λοιπόν ανάλυσης, η πολυσυσχετιστικότητα αποτελεί ένα καταστροφικό γεγονός αφού σχετίζεται με την έλλειψη σταθερότητας των συντελεστών ή γενικά με την παραγωγή δεικτών οι οποίοι, ενδεχομένως, απέχουν από την πραγματικότητα. Το γεγονός αυτό οφείλεται στο ότι 2 μεταβλητές πηγαίνουν ταυτόχρονα και εξηγούν το ίδιο «τοπογραφικά» ποσοστό της διακύμανσης μιας εξαρτημένης μεταβλητής με αποτέλεσμα να μην είναι δυνατή η ακριβής πρόβλεψη και συνεισφορά της κάθε μιας ξεχωριστά.

6.6.4. Επηρεάζεται από την έλλειψη αξιοπιστίας.Γνωρίζουμε ότι όλες οι προβλέψεις είναι συνάρτηση της ποιότητας των μετρήσεων. Με άλλα λόγια αν η αξιοπιστίας μιας μέτρησης είναι ίση με 0,70, τότε ο ερευνητής-τρια μετράει το εν λόγο χαρακτηριστικό κατά 70% και το 30% των υπολειπόμενων πληροφοριών εκφράζει το σφάλμα της μέτρησης. Στην περίπτωση εφαρμογής προβλεπτικών μοντέλων γίνεται φανερό ότι η πρόβλεψη (το ακριβές μέγεθος αυτής) θα εκφράζει και το σφάλμα της μέτρησης το οποίο οφείλεται στην αναξιοπιστία του εργαλείου μέτρησης. Συνεπώς, η παρατηρούμενη πρόβλεψη θα είναι κατά κάτι (όσο μεγάλο είναι και το σφάλμα της μέτρησης) ανακριβής και θα προσδίδει ανασφάλεια το μέγεθος της οποίας θα είναι ανάλογο αυτής της αναξιοπιστίας. Η «λάθος»

Page 101: Kefalaia Statistikis Gia Telikes Eksetaseis

κατεύθυνση της πρόβλεψης δεν μπορεί να προβλεφθεί, αφού το σφάλμα της μέτρησης μπορεί να κατευθύνει το μοντέλο ακόμη και σε «δυνατότερες» προβλέψεις. Ένα παράδειγμα του πως η αναξιοπιστία της μέτρησης επηρεάζει την συσχέτιση-πρόβλεψη απεικονίζεται στο σχήμα 6.13.

Σχήμα 6.13. Σχέση μεγέθους της πρόβλεψης και αξιοπιστίας της μέτρησης

Όπως φαίνεται στο σχήμα 6.13, όταν η αξιοπιστία της μέτρησης είναι της τάξης του 0,500 και για τις δύο μετρήσεις η σχέση μειώνεται από 0,899 σε 0,453. Συνεπώς οι συνέπειες της αναξιοπιστίας στην υπό-διερεύνηση σχέση είναι δραματικές. Αντίστοιχες είναι και οι συνέπειες και στην προβλεπτική κλίση.

ΚατακλείδαΤο μοντέλο της γραμμικής ανάλυσης παλινδρόμησης είναι εξαιρετικά σημαντικό στις κοινωνικές επιστήμες αφού το μεγαλύτερο μέρος των προβλέψεων σε αυτές βασίζεται σε αυτό το μοντέλο. Παρόλη την ευκολία στη χρήση και το εύρος των δυνατοτήτων, εντούτοις, κρύβει και πολλές παγίδες. Κάποιες από αυτές παρουσιάζονται στο παρόν κεφάλαιο.

Page 102: Kefalaia Statistikis Gia Telikes Eksetaseis

24. «ΜΕΤΑ-ΑΝΑΛΥΣΕΙΣ»: ΣΥΝΘΕΣΗ ΕΜΠΕΙΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝΟι «Μετά-Αναλύσεις» αποτελούν, κατά τη γνώμη μου, την πιο σημαντική πηγή γνώσης όταν θέλουμε να ομαδοποιήσουμε την υπάρχουσα γνώση/πληροφορίες σε μια θεματική περιοχή. Δεν είναι λοιπόν υπερβολή να ισχυριστούμε ότι όταν θέλουμε να μάθουμε τα πάντα γύρω από μια θεματική περιοχή (ένα ερευνητικό ερώτημα) πρέπει να πραγματοποιήσουμε «Μετά-Αναλύσεις». Ο λόγος είναι πολύ απλός: είναι η μοναδική αναλυτική μέθοδος η οποία ομαδοποιεί ολόκληρη την υπάρχουσα γνώση (όπως εμφανίζεται σε δημοσιευμένα κείμενα) και παρέχει περιγραφικούς στατιστικούς δείκτες οι οποίοι ενημερώνουν συνολικά για το ερευνητικό ερώτημα που αξιολογείται. Για παράδειγμα αν θέλουμε να δούμε αν η τιμωρία είναι αποτελεσματικός τρόπος «πάταξης» της επιθετικής συμπεριφοράς στο σχολείο και παρατηρήσουμε ένα μέσο όρο μεγέθους επίδρασης της τάξης του 0,500, τότε η τιμωρία θα έχει αποδειχθεί ότι είναι ικανή να μειώσει την επιθετική συμπεριφορά κατά μισή τυπική απόκλιση σε σχέση με την απουσία της (ή όποιο άλλο συγκριτικό σημείο αναφοράς έχει ορίσει ο ερευνητής-τρια). Παρά το γεγονός ότι οι μετά-αναλύσεις ομαδοποιούν την υπάρχουσα γνώση, και άρα από μόνες τους δεν «παράγουν» νέα εμπειρική γνώση (πρωτογενή δηλαδή δεδομένα), εντούτοις έχουν μια αρκετά πολύπλοκη αναλυτική μεθοδολογία. Παρακάτω θα παρουσιάσω την πιο απλή εκδοχή της για δεδομένα από μελέτες «ομάδων» (group designs). Για πιο σύνθετους τρόπους προτείνω στους αναγνώστες να ανατρέξουν στο βιβλίο των Hunter και Schmidt (2004) ενώ για πιο περίπλοκες εφαρμογές τις ερευνητικές εργασίες των Morgan και Sideridis (2008; in press). Ας δούμε πρώτα τις σχετικές στατιστικές έννοιες που πρέπει να γνωρίζουμε ώστε να καταλάβουμε την μεθοδολογία αυτή. Πρώτος και πιο απλός είναι ο υπολογισμός του δείκτη D του Cohen ο οποίος είναι ο γνωστός δείκτης που εκφράζει το μέγεθος της επίδρασης (effect size) σε λόγο τυπικών αποκλίσεων. Ο δείκτης αυτός εκφράζεται από τον εξής τύπο:

Page 103: Kefalaia Statistikis Gia Telikes Eksetaseis

(Εξίσωση 1)Όπου και είναι οι μέσοι όροι της πειραματικής ομάδας και της ομάδας ελέγχου αντίστοιχα και SD είναι ο μέσος όρος των δύο τυπικών αποκλίσεων ο οποίος υπολογίζεται από τον παρακάτω τύπο:

(Εξίσωση 2)

Όπου τα μεγέθη n1 και n2 αναφέρονται στο μέγεθος του δείγματος.

Ο υπολογισμός λοιπόν του δείκτη D μας πληροφορεί για το κατά πόσο η πειραματική συνθήκη (π.χ., τιμωρία) είχε επίδραση στην εξαρτημένη μεταβλητή αλλά και το είδος της επίδρασης. Για παράδειγμα ή απλή ανίχνευση του πρόσημου μας φανερώνει το αν η πειραματική συνθήκη είχε θετική ή αρνητική επίδραση στην εξαρτημένη μεταβλητή/αποτέλεσμα. Το δε μέγεθος μας φανερώνει το μέγεθος της αλλαγής της συμπεριφοράς σε λόγο τυπικών αποκλίσεων. Σε αυτή τη γραμμή έρευνας, τα μεγέθη που προτάθηκαν από τον Jacob Cohen για το τι αποτελεί μικρό, μεσαίο και μεγάλο μέγεθος επίδρασης ακόμη ισχύουν (αν και υπάρχουν πρόσφατες τροποποιήσεις ανάλογα με την θεματική περιοχή). Έτσι θα ακολουθήσω και εγώ τις προτάσεις του Cohen όπου οι τιμές 0,2, 0,5, και 0,8 Τ.Α., θα ορίζουν τις μικρές, μεσαίες, και μεγάλες επιδράσεις αντίστοιχα.

Ένας άλλος στατιστικός δείκτης που θα μας απασχολήσει είναι ο λόγος συμπληρωματικών πιθανοτήτων «log-odds» ο οποίος υπολογίζεται από τον τύπο:

(Εξίσωση 3)

Page 104: Kefalaia Statistikis Gia Telikes Eksetaseis

Αλλά θα περιγραφεί πιο απλά παρακάτω. Ας υποθέσουμε λοιπόν ότι η πειραματική ομάδα δέχεται την «τιμωρία» και η ομάδα ελέγχου την παραδοσιακή μέθοδο (όποια και να είναι αυτή, πλην της τιμωρίας). Τα πιθανά ενδεχόμενα αναφορικά με τα ευρήματα είναι τα εξής:

Συχνότητες fΟμάδα Πιθανότητα Επιτυχίας

Πιθανότητα ΑποτυχίαςΠειραματική α βΕλέγχου γ δ

Ότι δηλαδή ένας «α» αριθμός παιδιών που θα έχουν δεχθεί την τιμωρία θα έχει μειώσει την επιθετική του συμπεριφορά, ένας «β» αριθμός παιδιών δεν θα την έχει μειώσει, αριθμός που εκφράζει την αναποτελεσματικότητα της μεθόδου. Αντίστοιχα για την ομάδα ελέγχου που δεν θα έχει υποβληθεί στην τιμωρία, κάποιος αριθμός «γ» θα έχει δείξει μείωση της επιθετικής συμπεριφοράς, ενώ ένα αριθμός «δ» την απουσία αλλαγής της συμπεριφοράς. Ας υποθέσουμε ότι σε μια μελέτη με Ν = 30 μαθητές σε κάθε ομάδα έχουμε τα εξής αποτελέσματα:

Συχνότητες fΟμάδα Πιθανότητα Επιτυχίας

Πιθανότητα ΑποτυχίαςΠειραματική 20 10Ελέγχου 15 15

Αν χρησιμοποιήσουμε τον παρακάτω τύπο για τον υπολογισμό του λόγου των συμπληρωματικών πιθανοτήτων log odds,

(Εξίσωση 4)Τότε έχουμε:

Που σημαίνει ότι η πιθανότητα να μειωθεί η επιθετική συμπεριφορά εξαιτίας της τιμωρίας είναι 2 φορές

Page 105: Kefalaia Statistikis Gia Telikes Eksetaseis

μεγαλύτερη από την απουσία της τιμωρίας. Με άλλα λόγια η τιμωρία ήταν 2 φορές πιο αποτελεσματική από την παραδοσιακή μέθοδο της διαχείρισης της συμπεριφοράς αναφορικά με την επιθετική συμπεριφορά.

Ας δούμε τώρα ένα παράδειγμα από μια μελέτη όπου στην πειραματική ομάδα συμμετείχαν 8 μαθητές-τριες και στην ομάδα ελέγχου 20. Επίσης, το μέγεθος της επίδρασης ήταν της τάξης του 1,15 (δηλ. το D).

Στη συνέχεια πρέπει, πριν συμπεριληφθεί η μελέτη στην μετά-ανάλυση να γίνουν δύο διορθώσεις. Η μία αφορά την διόρθωση του μεγέθους επίδρασης D για το μέγεθος του δείγματος και υπολογίζεται από τον παρακάτω τύπο:

(Εξίσωση 5)

Με βάση τα στοιχεία της παραπάνω μελέτης η διόρθωση αυτή μας δίνει ένα νέο δείκτη D’ της τάξης του 1,12 όπως φαίνεται παρακάτω:

Στη συνέχεια πρέπει επίσης να υπολογίσουμε την βαρύτητα «W» η οποία θα καθορίσει το πόσο θα συνεισφέρει η μελέτη αυτή στην συγκεκριμένη μετά-ανάλυση. Το «ζύγισμα» αυτό της έρευνας αυτής υπολογίζεται από τον παρακάτω τύπο:

(Εξίσωση 6)

Όπου τα «π» και «ε» ορίζουν τις πειραματική και ελέγχου ομάδες, αντίστοιχα. Τα αποτελέσματα από αυτή την εφαρμογή παρουσιάζονται παρακάτω:

Με τις παραπάνω λοιπόν υποδείξεις θα πρέπει να έχουμε για κάθε μελέτη που θα συμπεριληφθεί στη μετά-ανάλυση ένα διορθωμένο μέγεθος της επίδρασης D’ και

Page 106: Kefalaia Statistikis Gia Telikes Eksetaseis

ένα «βάρος» W το οποίο ορίζει τη συνεισφορά της κάθε μελέτης στη μετά-ανάλυση.

Παράδειγμα 1Ας δούμε λοιπόν ένα υποθετικό παράδειγμα από την υπόθεσή μας ότι η τιμωρία είναι αποτελεσματική για την μείωση της επιθετικής συμπεριφοράς στο σχολείο από πειραματικές μελέτες ομάδων (group designs56). Τα δεδομένα παρουσιάζονται στον παρακάτω πίνακα μαζί με τα μεγέθη επίδρασης και τα βάρη:

Το τελικό μέγεθος της επίδρασης για όλες τις έρευνες υπολογίζεται από τον τύπο:

(Εξίσωση 7)

Και επομένως πρώτα πρέπει να υπολογίσουμε το μέγεθος (w * D’) για κάθε έρευνα όπως φαίνεται παρακάτω:

56 Γίνεται αυτή η διάκριση γιατί το δεύτερο παράδειγμα μετά-ανάλυσης θα αφορά δεδομένα από ερευνητικά σχέδια περίπτωσης.

Page 107: Kefalaia Statistikis Gia Telikes Eksetaseis

Υπολογίζουμε το γινόμενο (w * D’) για όλες τις μελέτες όπως και τα αθροίσματα των W και (w * D’).

και στη συνέχεια εφαρμόζουμε την εξίσωση 7 προκειμένου να αξιολογήσουμε το τελικό αποτέλεσμα του γενικού μέσου όρου επίδρασης της τιμωρίας από την σύνθεση των 10 αυτών μελετών.

=

Συμπεραίνουμε λοιπόν ότι κατά μέσο όρο η τιμωρία ήταν αποτελεσματική σε επίπεδο μείωσης της συμπεριφοράς κατά 0,15 τυπικές αποκλίσεις. Με βάση τις προτάσεις του Cohen το μέγεθος αυτό είναι «μικρό» και έτσι θα συμπεραίνουμε ότι με βάση την υπάρχουσα γνώση δεν φαίνεται η παρέμβαση της τιμωρίας να είναι ο πιο

Page 108: Kefalaia Statistikis Gia Telikes Eksetaseis

αποτελεσματικός τρόπος μείωσης της επιθετικής συμπεριφοράς.

Σε αυτό το σημείο θα ήθελα να προτείνω σε όλους τους μελλοντικούς αναλυτές να μην σταματήσουν σε αυτό το συμπέρασμα αλλά να προχωρήσουν και στον υπολογισμό των διαστημάτων εμπιστοσύνης που περικλείουν το υπολογίσιμο μέγεθος (0,15). Σύμφωνα λοιπόν με τον τύπο για τον υπολογισμό των διαστημάτων εμπιστοσύνης (Δ.Ε.) σε όποιο επίπεδο επιθυμούμε (δηλαδή 95% ή 99%):

(Εξίσωση 8)Πρέπει πρώτα να υπολογίσουμε το στατιστικό σφάλμα του μεγέθους της επίδρασης D’ με τον τύπο:

(Εξίσωση 9)

Του οποίου η εφαρμογή μας δίνει:

Τώρα λοιπόν είμαστε σε θέση να υπολογίσουμε τα διαστήματα εμπιστοσύνης, κατώτερο και ανώτερο σε επίπεδο 95% τα οποία έχουν ως εξής:

και

Επομένως έχουμε αυτοπεποίθηση ίση με 95% ότι η παρατηρήσιμη παράμετρος μεγέθους επίδρασης 0,15 βρίσκεται στην πραγματικότητα (στον πληθυσμό) μεταξύ των μεγεθών 0,03 και 0,27. Παρόλο που το «παράθυρο» αυτό δείχνει κάποιο εύρος, εντούτοις σε όλες του τις διαβαθμίσεις παραμένει σε χαμηλά επίπεδα με αποτέλεσμα να μην ανατρέπεται το τελικό συμπέρασμα αναφορικά με την χαμηλή αποτελεσματικότητα της τιμωρίας στη μείωση της επιθετικής συμπεριφοράς.

Page 109: Kefalaia Statistikis Gia Telikes Eksetaseis

Τέλος, είναι σημαντικό να αξιολογήσουμε μια υπόθεση η οποία στηρίζει περαιτέρω τα παρατηρήσιμα αποτελέσματα. Αυτή αφορά την «ομοιογένεια» των μεγεθών επίδρασης D. Για το λόγο αυτό χρειάζεται να υπολογίσουμε την ομοιογένεια αυτών των D με τη χρήση του τεστ χ2 (Chi-square). Πριν το υπολογίσουμε πρέπει να υπολογίσουμε το μέγεθος [W*(D2’)] όπως φαίνεται παρακάτω.

Πρώτα δηλαδή υψώνουμε το D’ στο τετράγωνο και στη συνέχεια το πολλαπλασιάζουμε με το ειδικό βάρος W και παίρνουμε το συνολικό άθροισμα.

Έχουμε λοιπόν 3 αθροίσματα:

(α) (β) και(γ)

Τα οποία αθροίσματα χρησιμοποιούμε προκειμένου να υπολογίσουμε τον δείκτη ομοιογένειας Q με τον παρακάτω τύπο:

(Εξίσωση 10)

Ο οποίος μας δίνει:

Page 110: Kefalaia Statistikis Gia Telikes Eksetaseis

Επειδή λοιπόν ο δείκτης Q κατανέμεται όπως ο δείκτης χ2 τότε μπορούμε ανατρέχοντας σε ένα πίνακα κρίσιμων τιμών της κατανομής χ2 να βρούμε κατά πόσο πρέπει να δεχτούμε την μηδενική ή εναλλακτική υπόθεση αναφορικά με την ύπαρξη ομοιογένειας στις έρευνες. Ο αριθμός των βαθμών ελευθερίας του δείκτη Q ισούται με τον αριθμό των ερευνών – 1. Στην παρούσα περίπτωση έχουμε 10-1=9 βαθμούς ελευθερίας. Ανατρέχοντας στον σχετικό πίνακα (βλέπε Παράρτημα Α στατιστικών πινάκων) βλέπουμε ότι η κρίσιμη τιμή για 9 βαθμούς ελευθερίας είναι 16,92 μονάδες. Η παρατηρήσιμη τιμή του δείκτη Q ήταν 14,76 μονάδες και έτσι υιοθετούμε την μηδενική υπόθεση ότι όλες οι έρευνες προέρχονται από τον ίδιο πληθυσμό. Με άλλα λόγια η διακύμανση των μεγεθών επίδρασης D’ δεν ήταν εξαιρετικά ασυνήθιστη.

Παράδειγμα 2Σε μια διαφορετική γραμμή έρευνας τώρα, τα ερευνητικά σχέδια περίπτωσης (Ν = 1) καλούμαστε να κάνουμε μια μετά-ανάλυση συγκρίνοντας τρεις διαφορετικές παρεμβάσεις για την αύξηση της κοινωνικής συμπεριφοράς. Παρακάτω παρουσιάζονται τα δεδομένα από ένα συμμετέχοντα.

Page 111: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 24.1. Ερευνητικό σχέδιο ΑΒ για την αύξηση της κοινωνικής συμπεριφοράς

Όπως φαίνεται στο σχήμα 24.1, ο παραπάνω μαθητής είχε υψηλά επίπεδα κοινωνικής συμπεριφοράς κατά το βασικό επίπεδο (δηλαδή απουσία κάποιας παρέμβασης) ενώ τα επίπεδα αυτά φαίνονται να μειώθηκαν κατά την διάρκεια της παρέμβασης (ένα παράδοξο εύρημα). Αν και μέχρι σήμερα δεν υπήρχε στατιστικά δυνατός τρόπος αξιολόγησης αυτών των δεδομένων (εξαιτίας της παρουσίας της αυτοσυσχέτισης των απαντήσεων) σήμερα είναι δυνατή η ανάλυσή τους με την χρήση των πολύ-επίπεδων μοντέλων. Ο σκοπός λοιπόν της παρακάτω ανάλυσης είναι η αξιολόγηση της υπάρχουσας γνώσης αναφορικά με την αποτελεσματικότητα τριών παρεμβάσεων σε σχέση με την βελτίωση της κοινωνικής συμπεριφοράς. Όπως αναφέρθηκε και στο κεφάλαιο 14, αρχικά πρέπει να δημιουργηθούν οι δύο βάσεις δεδομένων57. Στο πρώτο λοιπόν επίπεδο έχουμε τα δεδομένα «εντός του ατόμου» δηλαδή τη συμπεριφορά του ατόμου στο χρόνο (χρονοσειρά) η οποία αξιολογείται ως συνάρτηση της ύπαρξης παρεμβάσεων (δεύτερο επίπεδο). Συνεπώς, η βάση δεδομένων στο πρώτο επίπεδο έχει ως εξής:57 Για περισσότερες πληροφορίες αναφορικά με τα πολύ-επίπεδα μοντέλα ανατρέξτε στο σχετικό κεφάλαιο.

Page 112: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 24.2. Αρχείο πρώτου επιπέδου της μετά-ανάλυσης (Εντός των Ατόμων)

Όπου το άτομο με κωδικό «1» έχει τρείς παρατηρήσεις στο βασικό επίπεδο (τις 48, 53, 44) και τρεις παρατηρήσεις κατά την διάρκεια της παρέμβασης (τις 50, 51, και 38), κλπ. Για περισσότερες πληροφορίες για την δημιουργία αυτών των αρχείων ανατρέξτε στο κεφάλαιο 14.

Στο δεύτερο επίπεδο, για την δημιουργία των δεδομένων «μεταξύ των ατόμων» πρέπει να δημιουργηθεί το παρακάτω αρχείο SPSS/PASW:

Page 113: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 24.3. Αρχείο δευτέρου επιπέδου της μετά-ανάλυσης (Μεταξύ των Ατόμων)

Όπως φαίνεται στο σχήμα 24.3, κάθε γραμμή αντιπροσωπεύει πλέον ένα συμμετέχοντα και οι στήλες «int1 έως και int3» εκφράζουν τις τρεις παρεμβάσεις. Στη συνέχεια εντός του λογισμικού HLM δημιουργείται τα αρχεία με τίτλο που επιλέγετε εσείς και επέκταση .mdm και .mdmt (βλέπε κεφάλαιο 14). Όπως φαίνεται στο σχήμα 24.4, υπήρχαν 2951 παρατηρήσεις στο πρώτο επίπεδο οι οποίες προήλθαν από 273 συμμετέχοντες (μαθητές και μαθήτριες), των οποίων τα δεδομένα αντιπροσωπεύουν πολλές διαφορετικές μελέτες (ερευνητικές εργασίες).

Σχήμα 24.4. Αρχείο που δείχνει τη σύζευξη των δύο βάσεων δεδομένων

Στη συνέχεια αξιολογούμε το παρακάτω μοντέλο, του οποίου η υπόθεση είναι ότι ο γενικός μέσος όρος της επιθετικής συμπεριφοράς είναι διαφορετικός από το μηδέν. Το μοντέλο αυτό λειτουργεί και ως ένα βασικό (διαγνωστικό) μοντέλο αφού δεν θα είχε νόημα η παραπέρα μοντελοποίηση αν τα επίπεδα της επιθετικής συμπεριφοράς δεν ήταν διαφορετικά από το μηδέν.

Page 114: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 24.5. Βασικό πολύ-επίπεδο μοντέλο

Τα αποτελέσματα (όπως φαίνεται στο σχήμα 24.6) έδειξαν ότι ο μέσος όρος της κοινωνικής συμπεριφοράς ήταν 61,34 μονάδες και άρα στατιστικά σημαντικά διαφορετικός από το μηδέν [t(272) = 31,227, p < .001]. Επομένως δικαιολογείται η περαιτέρω αξιολόγηση των διαφορετικών παρεμβάσεων αφού υπάρχουν διαφορετικά, από το μηδέν, επίπεδα κοινωνικής συμπεριφοράς τα οποία μπορούν (εν δυνάμει) να διαφοροποιήσουν τις διαφορετικές παρεμβάσεις. Στη συνέχεια αξιολογείται η κύρια υπόθεση έρευνας, ότι δηλαδή οι τρεις παρεμβάσεις σχετίζονται με διαφορετικά επίπεδα αποτελεσματικότητας. Το μοντέλο αυτό απεικονίζεται στο σχήμα 24.7.

Σχήμα 24.6. Αξιολόγηση του βασικού πολύ-επίπεδου μοντέλου

Page 115: Kefalaia Statistikis Gia Telikes Eksetaseis

Σχήμα 24.7. Μοντέλο κύριας ερευνητικής υπόθεσης

Σχήμα 24.8. Αποτελέσματα από το μοντέλο που αξιολογεί την κύρια ερευνητική υπόθεση

Τα αποτελέσματα από αυτή την ανάλυση απεικονίζονται στο σχήμα 24.8. Όπως φαίνεται στο σχήμα 24.8, όλες οι παρεμβάσεις σχετίζονταν με σημαντικά υψηλότερα επίπεδα μείωσης της επιθετικής συμπεριφοράς (σε σχέση με τη σταθερά η οποία εκφράζει τον γενικό μέσο όρο). Πιο συγκεκριμένα η πρώτη παρέμβαση είχε αύξηση στην κοινωνική συμπεριφορά της τάξης των 12 μονάδων, η δεύτερη 43 περίπου μονάδων και η τρίτη περίπου 17 μονάδων. Τα αποτελέσματα αυτά καταδεικνύουν την αποτελεσματικότατα και των τριών παρεμβάσεων, δεν μας πληροφορούν όμως για την σχετική αποτελεσματικότητά τους. Για την ακρίβεια αναφορικά

Page 116: Kefalaia Statistikis Gia Telikes Eksetaseis

με την παρακάτω υπόθεση δεν μας πληροφορούν σχετικά με το ποια παρέμβαση ήταν πιο αποτελεσματική58:Η0: = μ1 = μ2 = μ3 Ηε: = κάποιο μ ≠ από κάποιο άλλο μ

Για το λόγο αυτό επιλέγουμε τις εντολές: «Other Settings» και «Hypothesis Testing» και «Multivariate Hypothesis Tests» όπως φαίνεται παρακάτω:

Σχήμα 24.9. Τεστ πολλαπλών συγκρίσεων

και «τρέχουμε» το παρακάτω μοντέλο, αφού απαλείψουμε από αυτό την σταθερά59 (intercept):

Σχήμα 24.10. Μοντέλο για την σύγκριση των παρεμβάσεων μεταξύ τους

58Ψάχνουμε δηλαδή ένα αποτέλεσμα αντίστοιχο με αυτό του τεστ πολλαπλών συγκρίσεων (post hoc) στην απλή ανάλυση της διακύμανσης.59Διαφορετικά θα έχουμε το πρόβλημα της πολυσυσχετιστηκότητας, για την ακρίβεια το φαινόμενο «singularity» αφού η σταθερά εμπεριέχει στοιχεία των διχοτομικών μεταβλητών που εκφράζουν τις παρεμβάσεις.

Page 117: Kefalaia Statistikis Gia Telikes Eksetaseis

Τα αποτελέσματα από αυτή την ανάλυση, με τη χρήση του τεστ χ2 (Chi-square60) έδειξαν ότι υπήρχαν στατιστικά σημαντικές διαφορές μεταξύ των παρεμβάσεων 1 και 2:

Σχήμα 24.11. Σύγκριση μεταξύ παρεμβάσεων 1 και 2

Όπως επίσης και μεταξύ των παρεμβάσεων 2 και 3:

Σχήμα 24.12. Σύγκριση μεταξύ παρεμβάσεων 2 και 3

Ενώ δεν παρατηρήθηκαν στατιστικά σημαντικές διαφορές μεταξύ των παρεμβάσεων 1 και 3. Συνεπώς, φαίνεται ότι η παρέμβαση 2, με μέσο όρο 90,27 μονάδες ήταν η πιο αποτελεσματική στο να βελτιώσει τις κοινωνικές συναναστροφές σε σχέση πάντα με το βασικό επίπεδο. 60 Τα τεστ αυτά «έτρεξαν» με ένα βαθμό ελευθερίας. Η κρίσιμη τιμή του τεστ αυτού είναι 3,84 μονάδες.

Page 118: Kefalaia Statistikis Gia Telikes Eksetaseis

24.1. ΚατακλείδαΟι μετά-αναλύσεις είναι από τις πιο χρήσιμες μεθοδολογίες για την συγκέντρωση όλων των δυνατών πληροφοριών για ένα ερευνητικό ερώτημα. Υπάρχουν αρκετές παραλλαγές της μεθόδου και αρκετά πιο περίπλοκοι τρόποι υπολογισμού εμπλεκομένων μεταβλητών. Στο παρών κεφάλαιο παρουσιάστηκαν δύο τρόποι (α) για την αξιολόγηση δεδομένων από ομάδες (group designs) και (β) για την αξιολόγηση δεδομένων από ερευνητικά σχέδια περίπτωσης (Ν = 1). Και για τα δύο αυτά είδη δεδομένων υπάρχουν τρόποι ομαδοποίησής τους ώστε να πραγματοποιηθούν μετά-αναλύσεις. Αυτό όμως που είναι σημαντικό να γνωρίζει ο αναγνώστης είναι ότι τα αποτελέσματα από την εκάστοτε μετά-ανάλυση εκφράζουν και την ποιότητα των συμπεριλαμβανομένων μελετών. Έτσι αν, ποιοτικά οι μελέτες δεν ικανοποιούν τις προϋποθέσεις της εσωτερικής και εξωτερικής εγκυρότητας (κυρίως της πρώτης), τότε το ίδιο θα ισχύει και για τα αποτελέσματα από την μετά-ανάλυση.