νόη α 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). · 2015-11-12 · Στην ενότητα αυτή...

Post on 26-Dec-2019

2 views 0 download

Transcript of νόη α 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). · 2015-11-12 · Στην ενότητα αυτή...

ΣΤΑΤΙΣΤΙΚΗ ΙΙ

Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4).

Επίκ. Καθηγητής Κοντέος Γεώργιος

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Άδειες Χρήσης

• Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

• Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.

2

Χρηματοδότηση• Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια

του εκπαιδευτικού έργου του διδάσκοντα.

• Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο TEI Δυτικής Μακεδονίας και στην Ανώτατη Εκκλησιαστική Ακαδημία Θεσσαλονίκης» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού.

• Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους.

3

Σκοποί ενότητας

• Ανάλυση των στατιστικών μέτρων Διασποράς, ασσυμετρίας και κυρτώσεως. Στην ενότητα αυτή γίνεται υπολογισμός της διακύμανσης και της τυπικής αποκλίσεως. Ιδιαίτερη σημασία δινεται και στον συντελεστή μεταβλητότητας, καθώς και στα μέτρα ασυμμετρίας αλλά και στον συντελεστή κύρτωσης.

4

Περιεχόμενα ενότητας

• Στατιστικά Μέτρα Διασποράς –Ασσυμετρίας – Κυρτώσεως.

• Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως.

• Συντελεστής Μεταβλητότητας.

• Μέτρα Ασυμμετρίας.

• Συντελεστής Κύρτωσης.

5

Στατιστικά Μέτρα Διασποράς –Ασσυμετρίας – Κυρτώσεως (1 / 2)

• Διασπορά – (διακύμανση, εύρος μεταβολής κλπ). – Μας πληροφορεί για τη διασπορά των δεδομένων

συνήθως γύρω από τη μέση τιμή.• Ασυμμετρία.

– Μετράει το βαθμό της συμμετρίας των δεδομένων ως προς τη συχνότητά – κατανομή τους γύρω από τη μέση τιμή.

• Κύρτωση. – Μετράει το βαθμό συγκέντρωσης των δεδομένων

γύρω από τη μέση τιμή. Η κύρτωση δείχνει την αιχμηρότητα ή την πλάτυνση της κατανομής.

6

Στατιστικά Μέτρα Διασποράς –Ασσυμετρίας – Κυρτώσεως (2 / 2)– α) Το εύρος μεταβολής.

– β) Το ενδοτεταρτημοριακό εύρος.

– γ) Η μέση απόκλιση.

– δ) Η μέση απόκλιση τετραγώνου.

– ε) Ο συντελεστής μεταβλητικότητας.

7

Εύρος Μεταβολής (1 από 2)

Το Εύρος μεταβολής είναι:

– Το απλούστερο μέτρο διασποράς.

– Υπολογίζεται ως η διαφορά μεταξύ της μεγαλύτερης και της μικρότερης τιμής.

Το Εύρος μεταβολής δεν θεωρείται αξιόπιστο:

– Γιατί εξαρτάται μόνο από τις δύο ακραίες τιμές των δεδομένων.

– Αν διαφορά των ακραίων τιμών είναι πολύ μεγάλη, τότε και το εύρος θα είναι ανάλογο.

– Χρήση. Π.χ. ΧΑΑ.

8

Εύρος Μεταβολής (2 από 2)

Έστω οι παρακάτω παρατηρήσεις. Να βρεθεί το εύρος μεταβολής.

• 52, 21, 31, 41, 23, 42, 44.

• 54, 55, 56, 57, 60, 61, 62.

• 64, 65, 66, 67, 68, 75, 74.

• 59, 85, 85, 84, 86, 90, 95.

• 78, 87, 92, 93, 45, 89, 90.

=95-21=74

9

Ενδοτεταρτημοριακό Εύρος (1 από 3)

• Η απόσταση μεταξύ πρώτου και τρίτου τεταρτημόριου μας δίνει το :

– Ενδοτεταρτημοριακό εύρος, το οποίο συμβολίζεται με IQR.

10

Ενδοτεταρτημοριακό Εύρος (2 από 3)

• Το 50% των τιμών των δεδομένων βρίσκεται σε ένα εύρος 9.990 ευρώ.

• Με άλλα λόγια, οι μισοί από τους ανθρώπους που έχουμε στο δείγμα μας έχουν εισόδημα από 13.928 ευρώ έως 23.918 ευρώ.

Πίνακας 1: Δεδομένα εισοδήματος.

Πηγή: Διδάσκων (2015).

11

Ενδοτεταρτημοριακό Εύρος (3 από 3)

Πίνακας 2: Δεδομένα

Πηγή: Διδάσκων (2015).

12

Μέση Απόκλιση (1 από 3)

• Η Μέση Απόκλιση (Μ. Α.) ορίζεται ως ο μέσος αριθμητικός των απόλυτων αποκλίσεων (διαφορών) των τιμών μιας μεταβλητής Χ από το μέσο αριθμητικό τους.

• Το άθροισμα των αποκλίσεων είναι ίσο με μηδέν.

– Γι αυτό υπολογίζουμε το άθροισμα των απόλυτων αποκλίσεων.

n

xxAM

i ..

13

Μέση Απόκλιση (2 από 3)

Παράδειγμα: Έστω ότι έχουμε το εισόδημα 5 υπαλλήλων.

• Χ: 1000, 900, 1300, 700, 800.

• Η μέση τιμή είναι 940.

• Υπολογίζουμε τις αποκλίσεις κάθε τιμής από τη μέση τιμή. Για παράδειγμα η πρώτη απόκλιση είναι ίση με:.

• Αθροίζουμε τις αποκλίσεις, και υπολογίζουμε τη Μέση Απόκλιση ως εξής:

14

Μέση Απόκλιση (3 από 3)

Μ. Α. = 37 δρχ.

Η τιμή Μ. Α. = 37 σημαίνει ότι το ημερομίσθιο κάθε εργάτη αποκλίνει (διαφέρει), κατά μέσο όρο, από το μέσο ημερομίσθιο κατά 37.

Η Μέση Απόκλιση πλεονεκτεί από τα δύο προηγούμενα μέτρα διασποράς (R και Q) γιατί λαμβάνει υπόψη όλες τις τιμές της μεταβλητής.

Μειονεκτεί όμως, διότι δεν επιδέχεται αλγεβρικό χειρισμό.

472x

3710

370..

n

xxAM

i

15

Τυπική Απόκλιση και Διακύμανση (1 από 2)

• Το σημαντικότερο στατιστικό μέτρο διασποράς των τιμών μιας μεταβλητής Χ γύρω από το μέσο αριθμητικό τους είναι η Τυπική Απόκλιση.

– Υπολογίζεται με την τετραγωνική ρίζα του μέσου αριθμητικού των τετραγώνων των αποκλίσεων των τιμών μιας μεταβλητής Χ από το μέσο αριθμητικό τους.

• Η τυπική απόκλιση συμβολίζεται με το σ στην περίπτωση του πληθυσμού και S στην περίπτωση του δείγματος.

16

Τυπική Απόκλιση και Διακύμανση (2 από 2)

• Το τετράγωνο της τυπικής απόκλισης, ονομάζεται διακύμανση και συμβολίζεται με:

– σ2 για δεδομένα πληθυσμού.

– S2 για δεδομένα δείγματος.

• Η τυπική απόκλιση εκφράζεται στις μονάδες που εκφράζεται και η υπό μελέτη μεταβλητή Χ.

– Ενώ η διακύμανση εκφράζεται στο τετράγωνο της μεταβλητής Χ.

17

Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως (1 από 6)

• Όταν τα δεδομένα αφορούν πληθυσμό:

– μ είναι ο μέσος του πληθυσμού.

– Ν το πλήθος των δεδομένων του πληθυσμού.

• Όταν τα δεδομένα αποτελούν ένα δείγμα.

18

Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως (2 από 6)

• Mε τον όρο "βαθμοί ελευθερίας" εννοούμε το πλήθος των στατιστικών δεδομένων. – Τα οποία διαμορφώνονται ελεύθερα χωρίς

κανένα περιορισμό.

• Για τον υπολογισμό όμως της διακυμάνσεως ενός δείγματος προκύπτουν n αποκλίσεις . )( xx

i

19

Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως (3 από 6)

• Από τις n αυτές αποκλίσεις μόνο οι n-1 είναι ανεξάρτητες.– Γιατί η n-στή απόκλιση από το χ είναι καθορισμένη

(περιορισμένη).

– Διότι ο υπολογισμός του μέσου αριθμητικού αποτελεί ένα περιορισμό ότι άρα μόνο οι n - 1 αποκλίσεις είναι ανεξάρτητες (αδέσμευτες).

– Επομένως, για τον υπολογισμό της διακυμάνσεως παραμένουν n-1 βαθμοί ελευθερίας.

0)( xxi

20

Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως (4 από 6)

• Για τον πληθυσμό:

• Για το δείγμα:

21

Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως (5 από 6)

Πίνακας 3: Δεδομένα

Πηγή: Διδάσκων (2015).

22

Υπολογισμός Διακυμάνσεως και Τυπικής Αποκλίσεως (6 από 6)

Πίνακας 4: Δεδομένα

Πηγή: Διδάσκων (2015

23

Παραδείγματα (1 από 2)Πίνακας 5: Δεδομένα.

Πηγή: Διδάσκων (2015).

24

Παραδείγματα (2 από 2)Πίνακας 6: Δεδομένα.

Πηγή: Διδάσκων (2015

25

Συντελεστής Μεταβλητότητας(1 από 6)

H τυπική απόκλιση δεν δίνει τη δυνατότητα.

– Να αποφανθούμε για το εάν η διασπορά είναι μικρή ή μεγάλη.

– Να συγκρίνουμε τη διασπορά κατανομών που μετριούνται σε διαφορετική κλίμακα.

– Να συγκρίνουμε τη διασπορά κατανομών τα οποία εκφράζονται σε διαφορετικές μονάδες.

Λύση στο πρόβλημα αποτελεί η χρήση του συντελεστής μεταβλητότητας

– Συμβολίζεται με CV.

– Ο συντελεστής μεταβλητικότητας είναι καθαρός αριθμός (χωρίς μονάδες μετρήσεως).

26

Συντελεστής Μεταβλητότητας(2 από 6)

• Για τον πληθυσμό έχουμε:

• Για το δείγμα:

• Ο συντελεστής μεταβλητότητας είναι η τυπική απόκλιση ως ποσοστό του μέσου.

• Είναι δυνατό να εκφράσουμε το συντελεστή μεταβλητότητας σε αριθμό και όχι σε ποσοστό.

27

Συντελεστής Μεταβλητότητας(3 από 6)

Διαιρούμε την τυπική απόκλιση με το μέσο.

– Μέτρα που είναι εκφρασμένα στις ίδιες φυσικές μονάδες.

• Για παράδειγμα.

– Διαιρούμε κιλά με κιλά, ευρώ με ευρώ, κλπ.

– Επομένως, οι μονάδες εξαφανίζονται και ο συντελεστής μεταβλητότητας μένει ένα καθαρό ποσοστό (ή ένας καθαρός αριθμός).

Π.χ. ζητούμε τη σύγκριση της τυπικής απόκλισης μιας κατανομής βαρών με μια αναστημάτων.

– Πρόβλημα: Διαφορετικές μονάδες μέτρησης.

– Λύση: Συντελεστής μεταβλητικότητας.

28

Συντελεστής Μεταβλητότητας(4 από 6)

• Σε ένα Τμήμα οι φοιτητές παρακολουθούν στατιστική και οικονομικά και υποβάλλονται σε εβδομαδιαία τεστ.

• Στο τέλος της χρονιάς οι φοιτητές έχουν:

– Μέσο όρο βαθμολογίας στη στατιστική 5,5 με τυπική απόκλιση 0,9.

– Ενώ στα οικονομικά έχουν μέσο όρο 7,5 και τυπική απόκλιση 1,1.

• Σε ποιο μάθημα οι φοιτητές αποδίδουν με τη μικρότερη διασπορά (με μεγαλύτερη συνέπεια);

29

Συντελεστής Μεταβλητότητας(5 από 6)

• Απάντηση: Θα υπολογίσουμε τους συντελεστές μεταβλητότητας για τα δύο μαθήματα αντίστοιχα:

• Στα οικονομικά υπάρχει μεγαλύτερη τυπική απόκλιση.

• Ωστόσο, προσέξτε ότι ο μέσος όρος στα οικονομικά είναι μεγαλύτερος από το μέσο όρο στη στατιστική.

30

Συντελεστής Μεταβλητότητας(6 από 6)

• Ο συντελεστής μεταβλητότητας στα οικονομικά είναι χαμηλότερος από ότι στην στατιστική.

– Γεγονός που σημαίνει ότι οι φοιτητές είναι περισσότερο συνεπείς στην απόδοσή τους στα οικονομικά σε σχέση με τη στατιστική.

– Η σχετική διασπορά στη στατιστική είναι μεγαλύτερη.

31

Μέτρα Ασυμμετρίας

• Για να περιγραφεί ικανοποιητικά μια κατανομή συχνοτήτων απαιτείται ο προσδιορισμός τεσσάρων βασικών στατιστικών παραμέτρων:

– i) Κεντρική Τάση.

– ii) Διασπορά.

– iii) Ασυμμετρία.

– iv) Κύρτωση.

• Η ασυμμετρία (skewness) δείχνει πόσο συμμετρικά γύρω από το μέσο κατανέμονται οι παρατηρήσεις, τα δεδομένα μας.

32

ΣΥΝΤΕΛΕΣΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ(1 από 2)

• Απλά δεδομένα - Ασυμμετρία πληθυσμού.

• Απλά δεδομένα - Ασυμμετρία δείγματος.

33

ΣΥΝΤΕΛΕΣΤΗΣ ΑΣΥΜΜΕΤΡΙΑΣ(2 από 2)

• Στη διεθνή βιβλιογραφία χρησιμοποιούνται διάφορες παραλλαγές του τύπου με σκοπό την κατά το δυνατό καλύτερη προσέγγιση της πραγματικής ασυμμετρίας του πληθυσμού.

• Μο είναι η επικρατούσα τιμή και Μd είναι η διάμεσος.

34

Μεταβλητές και δεδομένα (10 από 25)

• G=0 ή μ3=0 Συμμετρική.

Εικόνα 1: Συμμετρική.

Πηγή: Διδάσκων (2015).

35

Θετική Ασυμμετρία

• G>0 ή μ3>0.

Εικόνα 2: Θετική Ασυμμετρία.

Πηγή: Διδάσκων (2015).

36

Αρνητική Ασυμμετρία

• G>0 ή μ3>0.

Εικόνα 3: Αρνητική Ασυμμετρία.

Πηγή: Διδάσκων (2015).

37

Παράδειγμα

• Να βρεθεί ο συντελεστής Pearson.

Πίνακας 7: Δεδομένα ασκησης.

Πηγή: Διδάσκων (2015).

38

ΚΥΡΤΩΣΗΔύο ή περισσότερες κατανομές συχνοτήτων να έχουν:

– Τον ίδιο μέσο αριθμητικό.

– Την ίδια τυπική απόκλιση.

– Να είναι συμμετρικές.

• Αλλά να διαφέρουν ως προς την κύρτωση.

• Δηλαδή ως προς την συγκέντρωση των παρατηρήσεων γύρω από το μέσο – αιχμηρότητα της κορυφής.

• Η κύρτωση (kurtosis) δείχνει κατά πόσο τα δεδομένα της κατανομής σχηματίζουν έντονη κορυφή στο μέσο τους.

39

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ (1 από 8)

• Απλά δεδομένα - Κύρτωση πληθυσμού.

• Απλά δεδομένα - Κύρτωση δείγματος.

40

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ (2 από 8)

• Κατανομές συχνοτήτων που οι τιμές τους διασπείρονται πάρα πολύ αριστερά και δεξιά του μέσου αριθμητικού χαρακτηρίζονται ως πλατύκυρτες και έχουν συντελεστή K<3 (Excel K<0).

Εικόνα 4: ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ.

Πηγή: Διδάσκων (2015).

41

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ (3 από 8)

Εικόνα 5: ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ.

Πηγή: Διδάσκων (2015).

42

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ (4 από 8)

• Οι "Κανονικές Κατανομές" που οι τιμές μιας μεταβλητής ισοκατανέμονται αριστερά και δεξιά του μέσου αριθμητικού χαρακτηρίζονται ως Μεσόκυρτες K=3 (Excel K=0).

• (Excel K<0).

Εικόνα 6: ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ.

Πηγή: Διδάσκων (2015).

43

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ (5 από 8)

Εικόνα 7: ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ.

Πηγή: Διδάσκων (2015).

44

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ (6 από 8)

• Τέλος, κατανομές συχνοτήτων που παρουσιάζουν μεγάλη συγκέντρωση τιμών στην περιοχή του μέσου αριθμητικού χαρακτηρίζονται ως Λεπτόκυρτες και έχουν K>3 (Excel K>0).

Εικόνα 8: ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ.

Πηγή: Διδάσκων (2015).

45

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ (7 από 8)

Εικόνα 9: ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ.

Πηγή: Διδάσκων (2015).

46

ΣΥΝΤΕΛΕΣΤΗΣ ΚΥΡΤΩΣΗΣ (8 από 8)

Εικόνα 10: ΣΥΝΤΕΛΕΣΤΕΣ ΚΥΡΤΩΣΗΣ.

Πηγή: Διδάσκων (2015).

47

Ασκηση (1 από 2)

• Να βρεθεί η κύρτωση.

Πίνακας 8: Δεδομένα ασκησης.

Πηγή: Διδάσκων (2015).

48

Ασκηση (2 από 2)Πίνακας 9: Δεδομένα ασκησης.

Πηγή: Διδάσκων (2015).

49

Ασκήσεις Αξιολόγησης (1 από 2)

• 1. Να υπολογιστεί:

α) Το ενδοτεταρτημοριακό εύρος.

β) Η διακύμανση.

• 2. Να υπολογιστεί η διακύμανση στην παρακάτω σειρά δεδομένων (πληθυσμός).

• X: 1, 3, 5.

Πίνακας 10: Δεδομένα ασκησης.

Πηγή: Διδάσκων (2015).

50

Ασκήσεις Αξιολόγησης (2 από 2) 1. Να υπολογιστεί ο συντελεστής ασυμμετρίας.

2. Να υπολογιστεί η ασυμμετρία στην παρακάτω σειρά δεδομένων (πληθυσμός).

• X: 1, 2, 3, 6.

Πίνακας 11: Δεδομένα ασκησης.

Πηγή: Διδάσκων (2015).

51

Σημείωμα Αναφοράς

Copyright ΤΕΙ Δυτικής Μακεδονίας, Κοντέος Γεώργιος. «ΣΤΑΤΙΣΤΙΚΗ ΙΙ». Έκδοση: 1.0. Κοζάνη 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: URL.

52

Σημείωμα Αδειοδότησης

Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Μη Εμπορική Χρήση Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων».

[1] http://creativecommons.org/licenses/by-nc-sa/4.0/

Ως Μη Εμπορική ορίζεται η χρήση:

• που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο.

• που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο.

• που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο.

Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί.

53

Διατήρηση Σημειωμάτων

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει:

το Σημείωμα Αναφοράς.

το Σημείωμα Αδειοδότησης.

τη δήλωση Διατήρησης Σημειωμάτων.

το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει).

μαζί με τους συνοδευόμενους υπερσυνδέσμους.

54

Σημείωμα Χρήσης Έργων Τρίτων

Το Έργο αυτό κάνει χρήση των ακόλουθων έργων:

Εικόνες/Σχήματα/Διαγράμματα/Φωτογραφίες.

• Βιβλιογραφικές Πηγές.

55