Μια Στατιστική Έρευνα Διακρίνεται σε 3 Στάδια:

97
Μια Στατιστική Έρευνα Μια Στατιστική Έρευνα Διακρίνεται Διακρίνεται σε 3 σε 3 Στάδια: Στάδια: 1 ο : Συλλογή Στατιστικού υλικού 2 ο : Επεξεργασία και παρουσίαση του υλικού 3 ο : Ανάλυση και εξαγωγή χρήσιμων συμπερασμάτων

description

Μια Στατιστική Έρευνα Διακρίνεται σε 3 Στάδια:. 1 ο : Συλλογή Στατιστικού υλικού 2 ο : Επεξεργασία και παρουσίαση του υλικού 3 ο : Ανάλυση και εξαγωγή χρήσιμων συμπερασμάτων. Στατιστική είναι ένα σύνολο αρχών και μεθοδολογιών για:. - PowerPoint PPT Presentation

Transcript of Μια Στατιστική Έρευνα Διακρίνεται σε 3 Στάδια:

Μια Στατιστική Έρευνα ΔιακρίνεταιΜια Στατιστική Έρευνα Διακρίνεται

σε 3 Στάδια:σε 3 Στάδια:1ο: Συλλογή Στατιστικού υλικού

2ο: Επεξεργασία και παρουσίαση του

υλικού

3ο: Ανάλυση και εξαγωγή χρήσιμων

συμπερασμάτων

Στατιστική είναι ένα σύνολο αρχών και μεθοδολογιών για:

• Το σχεδιασμό της διαδικασίας συλλογής δεδομένων (Σχεδιασμός Πειραμάτων-Experimental Design)

• Τη συνοπτική και αποτελεσματική παρουσίαση τους (Περιγραφική Στατιστική-Descriptive Statistics)

• Την ανάλυση και εξαγωγή αντίστοιχων συμπερασμάτων

(Επαγωγική Στατιστική-Inferential Statistics)

R.A. Fisher (1890-1962)

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ11

π.χ. το ύψος, το βάρος, οι απουσίες, η ομάδα αίματος

και το φύλο των μαθητών της Γ΄ Λυκείου

• Πληθυσμός (population)

Ένα σύνολο στοιχείων τα οποία μας ενδιαφέρει να εξετάσουμε ως προς ένα ή περισσότερα χαρακτηριστικά τους.

οι μαθητές της Γ Λυκείου

• Μονάδες ή άτομα του πληθυσμού

Τα στοιχεία του πληθυσμού

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ22

• Μεταβλητές (variables)

Τα χαρακτηριστικά ως προς τα οποία εξετάζουμε έναν πληθυσμό.

Συμβολίζονται με κεφαλαία γράμματα X, Y, Ζ .....

1)το ύψος, 2)το βάρος, 3)η ομάδα αίματος, 4)οι

απουσίες, 5)το φύλλο

• Τιμές της Μεταβλητής

Οι δυνατές τιμές που μπορεί να πάρει μια

μεταβλητή

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ33

Οι Μεταβλητές διακρίνονται σε:

► Ποιοτικές ή Κατηγορικές μεταβλητές:

των οποίων οι τιμές τους δεν είναι αριθμοί

η ομάδα αίματος, το φύλλο

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ44

…και σε:

► Ποσοτικές μεταβλητές: των οποίων οι τιμές τους είναι αριθμοί και διακρίνονται

σε: Διακριτές μεταβλητές: που παίρνουν μόνο

«μεμονωμένες» τιμές

Ο αριθμός των απουσιών Συνεχείς μεταβλητές: που μπορούν να πάρουν

οποιαδήποτε τιμή ενός διαστήματος πραγματικών αριθμών

Το ύψος, το βάρος

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ55

Συλλογή Στατιστικών ΔεδομένωνΜε απογραφή:Εξετάζουμε όλα τα άτομα του πληθυσμού ως προς το χαρακτηριστικό που μας ενδιαφέρει

Με Δειγματοληψία:Μαζεύουμε πληροφορίες από μια μικρή ομάδα ή υποσύνολο του πληθυσμού. Κάνουμε τις παρατηρήσεις μας στο δείγμα αυτό και μετά γενικεύουμε τα συμπεράσματα για ολόκληρο τον πληθυσμό. Προσοχή, όμως.....

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ66

•Για να είναι αξιόπιστα τα συμπεράσματα, το δείγμα πρέπει να είναι αντιπροσωπευτικό.

Αντιπροσωπευτικό δείγμα:

Όταν έχει επιλεγεί κατά τέτοιο τρόπο, ώστε κάθε μονάδα του πληθυσμού να έχει την ίδια δυνατότητα να επιλεγεί.

Ας δούμε τις ερωτήσεις του βιβλίου μας σελ. 61

Στατιστικοί πίνακεςΣτατιστικοί πίνακεςΟι πίνακες διακρίνονται σε :

i. Γενικούς πίνακες

περιέχουν όλες τις πληροφορίες που προκύπτουν από μία στατιστική έρευνα και αποτελούν πηγές στατιστικών πληροφοριών στη διάθεση επιστημόνων-ερευνητών για την εξαγωγή συμπερασμάτων.

ii.Ειδικούς πίνακες

οι οποίοι είναι συνοπτικοί και σαφείς. Συνήθως τα στοιχεία έχουν ληφθεί από τους γενικούς πίνακες.

Κάθε πίνακας που έχει κατασκευαστεί σωστά πρέπει να περιέχει:

ΤΙΤΛΟΣ ΕΠΙΚΕΦΑΛΙΔΕΣ

ΚΥΡΙΟ ΣΩΜΑΠΗΓΗ

3 4 5 8 9 7 6 8 7 10

8 7 6 5 9 3 8 5 6 6

6 3 5 6 4 2 9 8 7 7

1 6 3 1 5 8 1 2 3 4

5 6 7 9 10 9 8 7 6 5

Η βαθμολογία 50 φοιτητών στις εξετάσεις ενός μαθήματος είναι: (Άσκηση 1, σελ. 78)

Πίνακας Κατανομής Συχνοτήτων & Σχετικών Συχνοτήτων

5

10

13

xi Διαλογή

1

2

3

4

5

6

7

8

9

10Σύνολο

|||

|||

||

||||

|||| ||

|||| ||||

|||| ||

|||| ||

||||

||

νi Ni

3

2

5

3

7

9

7

7

5

250

3

20

29

36

43

4850

fi% Fi%6

4

10

6

14

18

1414

10

4

100

νi: (Απόλυτη) Συχνότητα

Νi : Αθροιστική Συχνότητα

fi: Σχετική Συχνότητα

Fi: Αθροιστική Σχετική Συχνότητα

6

10

20

26

40

58

72

86

96

100

ννii:(Απόλυτη) Συχνότητα:(Απόλυτη) Συχνότητα• Είναι ο φυσικός αριθμός που δείχνει πόσες φορές

εμφανίζεται η τιμή xi της εξεταζόμενης μεταβλητής Χ στο σύνολο των παρατηρήσεων

Ιδιότητα των ΣυχνοτήτωνΈστω ένα δείγμα μεγέθους ν και x1, x2,….xκ είναι οι τιμές μιας μεταβλητής Χ, που αφορά τα άτομα του δείγματος (με κν)

►Το άθροισμα όλων των συχνοτήτων είναι ίσο με το μέγεθος του δείγματος

ν1 +ν2 +….+νκ =ν

ΝΝii: : Αθροιστική Συχνότητα Αθροιστική Συχνότητα (ποσοτικές μεταβλητές)(ποσοτικές μεταβλητές)

Εκφράζουν το πλήθος των παρατηρήσεων που είναι μικρότερες ή ίσες της τιμής xi

N1=ν1

Ν2=ν1+ν2

Ν3=ν1+ν2+ν3

.

.

.

Νκ=ν1+ν2+….+νκ Νκ=ν

ffii : Σχετική Συχνότητα: Σχετική Συχνότητα11

Αν διαιρέσουμε την συχνότητα νi με το μέγεθος ν του δείγματος, προκύπτει η σχετική συχνότητα (relative frequency) fi της τιμής xi

i

if i=1,2,….κ

ffii : Σχετική Συχνότητα: Σχετική Συχνότητα33

10 if

;......21 fff

Για τη σχετική συχνότητα ισχύουν οι ιδιότητες:

, Για i=1,2,…κ αφού 0 νi ν

αφού

1.....

.......... 212121

fff

1

ffii %: Σχετική Συχνότητα επί τοις %: Σχετική Συχνότητα επί τοις εκατόεκατό

;%......%% 21 fff 100

FFii :Αθροιστική Σχετική Συχνότητα :Αθροιστική Σχετική Συχνότητα (ποσοτικές μεταβλητές)(ποσοτικές μεταβλητές)

Εκφράζουν το ποσοστό των παρατηρήσεων που είναι μικρότερες ή ίσες της τιμής xi

F1=f1

F2=f1+f2

F3=f1+f2+f3

. .

. Fκ=f1+f2+….+fκ Fκ=1FFii% % :Αθροιστική Σχετική Συχνότητα:Αθροιστική Σχετική Συχνότητα

Fκ%=f1%+f2%+….+fκ% Fκ=100

Παρατηρώντας τον πίνακα να απαντήσετε στις ερωτήσεις του φύλλου εργασίας

ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ11

Παρέχει μια πιο σαφή εικόνα από τον πίνακα, χωρίς να προσφέρει περισσότερη πληροφορία.

Διευκολύνει την σύγκριση ομοειδών στοιχείων για το ίδιο ή διαφορετικά χαρακτηριστικά.

ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ22

πρέπει να συνοδεύονται από:

α) τον τίτλο

β) την κλίμακα με τις τιμές των μεγεθών που απεικονίζονται

γ) το υπόμνημα που επεξηγεί συνήθως τις τιμές της μεταβλητής

δ) την πηγή των δεδομένων

ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ33

•Ραβδόγραμμα

•Διάγραμμα Συχνοτήτων

•Κυκλικό Διάγραμμα

•Σημειόγραμμα

•Χρονόγραμμα

Θα ασχοληθούμε με τα παρακάτω είδη γραφικών παραστάσεων κατανομής συχνοτήτων:

Διάγραμμα (line diagram)1

ΣυχνοτήτωνΔιάγραμμα Σχετικών ΣυχνοτήτωνΧρησιμοποιείται για την γραφική παράσταση των τιμών μιας ποσοτικής μεταβλητής.

Σε κάθε τιμή της μεταβλητής xi υψώνουμε μία κάθετη γραμμή με μήκος ίσο προς την αντίστοιχη συχνότητα.

Διάγραμμα Συχνοτήτωννi

3

2

5

3

7

9

7

7

5

2

xi

νi

Πολύγωνο Συχνοτήτων

Ενώνοντας τα σημεία (xi, νi) ή (xi, fi) έχουμε το πολύγωνο συχνοτήτων ή σχ. συχνοτήτων…

Ραβδόγραμμα (Ραβδόγραμμα (barchart)barchart)11

ΣυχνοτήτωνΡαβδόγραμμα Σχετικών ΣυχνοτήτωνΧρησιμοποιείται για την γραφική παράσταση των τιμών μιας ποιοτικής μεταβλητής.

Σε κάθε τιμή της μεταβλητής Χ αντιστοιχεί μια ορθογώνια στήλη της οποίας το ύψος είναι ίσο με την αντίστοιχη συχνότητα ή σχετική συχνότητα.

Ραβδόγραμμα (Ραβδόγραμμα (barchart)barchart)22

• Οι αποστάσεις μεταξύ των ράβδων και το μήκος των βάσεων καθορίζονται αυθαίρετα.

Τα δημοφιλέστερα ξένα μουσικά συγκροτήματα των 18 αγοριών του πίνακα 4 (σελ.64) ήσαν: (άσκηση 7, σελ. 79)

νi

5

3

4

1

2

318

xi

Metallica

Iron Maiden

Scorpions

Oasis

Rolling Stones

Άλλο

Σύνολο

fi

0,278

0,167

0,222

0,055

0,111

0,167

1

αi=360οfi

360o

100o

60o

80o

20o

40o

60o

1ο Ραβδόγραμμα

2ο Ραβδόγραμμα

3ο Ραβδόγραμμα

Ραβδόγραμμα Σχετικών Συχνοτήτων

0.278

0.167

0.222

0.055

0.111

Met

allic

aIro

n M

aide

nSc

orpi

ons

Oas

is

Rol

ling

Ston

es

Άλλο

Ραβδόγραμμα (Ραβδόγραμμα (barchart)barchart)33

• Μερικές φορές σε ένα ραβδόγραμμα συχνοτήτων ο ρόλος των δύο αξόνων είναι δυνατόν να αντιστραφεί, τότε οι ράβδοι είναι οριζόντιοι, παράλληλοι στον άξονα x΄x

Ραβδόγραμμα Σχετικών Συχνοτήτων

0.2

78

Metallica

Iron Maiden

Scorpions

Oasis

Rolling Stones

Άλλο

0.22

2

0.16

7

0.11

1

0.05

5

Τα μετάλλια που πήραν μερικές χώρες στο 17ο Ευρωπαϊκό Πρωτάθλημα Στίβου το 1998. (άσκηση 10, σελ. 80)

Επειδή θέλουμε να συγκρίνουμε το είδος των μεταλλίων που πήρε η κάθε χώρα, φτιάχνουμε το Ραβδόγραμμα συχνοτήτων ως εξής:

Μ.

ΒΡΕΤΑΝΙΑ

ΓΕΡΜΑΝΙΑ

ΡΩΣΙΑ

ΠΟΛΩΝΙΑ

ΡΟΥΜΑΝΙΑ

ΟΥΚΡΑΝΙΑ

ΙΤΑΛΙΑ

ΠΟΡΤΟΓΑΛΙΑ

ΙΣΠΑΝΙΑ

Κυκλικό Διάγραμμα (piechart)1

Χρησιμοποιείται για την γραφική παράσταση τόσο των ποιοτικών όσο και των ποσοτικών δεδομένων, όταν οι διαφορετικές τιμές της μεταβλητής είναι σχετικά λίγες.

Κυκλικό Διάγραμμα (piechart)2

Είναι ένας κύκλος χωρισμένος σε κυκλικούς τομείς, των οποίων τα εμβαδά ή τα αντίστοιχα τόξα είναι ανάλογα προς τις συχνότητες νi ή τις σχ. συχνότητες fi των τιμών xi της μεταβλητής

iii f

360360

αi: οι μοίρες του κυκλικού

τομέα

για i=1,2,3,….κ

Κυκλικό Διάγραμμα (piechart)2

fi%

27,8

16,7

22,2

5,5

11,1

16,7

100

αi=360οfi

100

60

80

20

40

60

360o

27,8%

22,2%

11,1%

16,7%5,5%

16,7%

Σημειόγραμμα (dot diagram)Χρησιμοποιείται όταν έχουμε λίγες παρατηρήσεις

Οι τιμές παριστάνονται σαν σημεία υπεράνω ενός οριζόντιου άξονα.

Π.χ.Ο χρόνος που χρειάστηκαν 15 μαθητές για να λύσουν ένα διαγώνισμα είναι: 4,2,3,1,5,6,4,2,3,4,7,4,8,6,3.

Χρονόγραμμα ή Χρονολογικό διάγραμμα

Χρησιμοποιείται για τη γραφική απεικόνιση της διαχρονικής εξέλιξης ενός οικονομικού, δημογραφικού ή άλλου μεγέθους.

Ο οριζόντιος άξονας χρησιμοποιείται συνήθως ως άξονας μέτρησης του χρόνου και ο κάθετος ως άξονας μέτρησης της εξεταζόμενης μεταβλητής

Στον παρακάτω πίνακα δίνονται τα κρούσματα δύο λοιμωδών νόσων από το 1987 έως το 1997 (Πηγή ΕΚΕΠΑΠ). Να κατασκευαστεί το αντίστοιχο χρονόγραμμα (άσκηση 11, σελ. 80)

χρονόγραμμα

Ηπατίτιδα Α

Έρπης ζωστήρ

87 88 89 90 91 92 93 94 95 96 97

xi νi fi Ni Fi fi% Fi%

1 10

2 4 0,20 6

3 0,60

4 25

5 2

6

Σύνολο

Να συμπληρώσετε τον πίνακα

(άσκηση 5, σελ. 79)

Το κυκλικό διάγραμμα παριστάνει την βαθμολογία των 450 μαθητών ενός Γυμνασίου σε 4 κατηγορίες: «Άριστα», «Λίαν Καλώς», «Καλώς» και «Σχεδόν Καλώς». (άσκηση 8, σελ. 79)

Οι μαθητές με βαθμό «Σχεδόν Καλώς» είναι διπλάσιοι των μαθητών με «Άριστα»

Πόσοι μαθητές έχουν επίδοση τουλάχιστον «Λίαν Καλώς»;

xi νi fi% αi

Άριστα

Λίαν Καλώς

Καλώς

Σχεδόν Καλώς

Σύνολο 450

30

144

Από το 1960-1968 (Πρωτάθλημα Α΄ Εθνικής) (άσκηση 9, σελ. 80)

xi νi fi αi

Παναθηναϊκός

Ολυμπιακός

ΑΕΚ

ΠΑΟΚ

Λάρισα

Σύνολο

15

12

9

2

1

Η επίδοση 50 υποψηφίων για την πρόσληψη τους σε μια

ιδιωτική σχολή (άσκηση 12, σελ. 80)

xi νi fi Fi

0

1

2

3

4

5

6

7

8

9

Σύνολο

Το παρακάτω χρονόγραμμα δίνει τη σχετική συχνότητα των νέων πτυχιούχων Μαθηματικών σε όλη την Ελλάδα από το 1930-1995 ανάλογα με το φύλλο. (άσκηση 4, σελ.81-82)

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ11

Όταν το πλήθος των τιμών μιας μεταβλητής είναι αρκετά μεγάλο (συνήθως στις ποσοτικές μεταβλητές και πιο πολύ στις συνεχείς) είναι δύσκολο να κατασκευαστούν οι πίνακες κατανομής συχνοτήτων και κατ’ αναλογία τα αντίστοιχα διαγράμματα.

Σ’αυτές τις περιπτώσεις ομαδοποιούμε τα δεδομένα σε μικρό πλήθος ομάδων, που ονομάζονται κλάσεις (class intervals), έτσι ώστε κάθε τιμή να ανήκει σε μία μόνο κλάση.

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ22

• Τα άκρα των κλάσεων καλούνται όρια των κλάσεων (class boundaries)

• Μια κλάση περιέχει το κάτω άκρο της (κλειστή αριστερά) αλλά όχι το άνω άκρο της (ανοικτή δεξιά), δηλαδή είναι ένα διάστημα της μορφής:

[α, β) όπου α: κάτω άκρο και β: άνω άκρο

• Κέντρο xi της κλάσης i αντιπροσωπεύει όλη την κλάση

2

ix

1οΒήμα:Προσδιορισμός του πλήθους κ των κλάσεων

1ος τρόπος: Καθορίζεται αυθαίρετα από εμάς ή μας

προσδιορίζει η άσκηση

2ος τρόπος: η χρησιμοποιούμε σαν οδηγό τον πίνακα:

ΟΜΑΔΟΠΟΙΗΣΗΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΠΑΡΑΤΗΡΗΣΕΩΝ33

Σελ. 72, σχολικό βιβλίο

2οΒήμα:Προσδιορισμός του πλάτους c των κλάσεων

Το πλάτος c της κλάσης [α, β) είναι το c=β-α

Ίσου πλάτους

Κλάσεις

Άνισου πλάτους

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ44

Ισοπλατείς κλάσεις

1ον Εύρος (range) R του δείγματος

Είναι η διαφορά της μικρότερης παρατήρησης από τη

μεγαλύτερη, δηλαδή:

R=xmax-xmin

2ον Πλάτος c

Είναι το πηλίκο του εύρους δια το πλήθος των κλάσεων

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ55

R

c

3οΒήμα:Κατασκευή των κλάσεων

Ξεκινώντας από την μικρότερη παρατήρηση (για πρακτικούς λόγους μπορεί να ξεκινήσουμε λίγο πιο κάτω από τη

μικρότερη παρατήρηση)

προσθέτουμε κάθε φορά το πλάτος c και δημιουργούμε τις κ κλάσεις.

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ66

Δηλαδή: •xmin+c

άρα η 1η κλάση είναι [xmin, xmin+c)

•(xmin+c)+c=xmin+2c

άρα η 2η κλάση είναι [xmin+c, xmin+2c)

•(xmin+2c)+c=xmin+3c

άρα η 3η κλάση είναι [xmin+2c, xmin+3c)

►Η διαδικασία αυτή, σταματάει όταν η μεγαλύτερη τιμή του δείγματος xmax ανήκει στην τελευταία κλάση που έχουμε σχηματίσει.

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ66

Παρατηρήσεις►Καμία παρατήρηση δεν μπορεί να μείνει

έξω από κάποια κλάση

► Μια παρατήρηση που συμπίπτει με το άνω άκρο (το β)μια κλάσης θα τοποθετηθεί κατά τη διαλογή στην αμέσως επόμενη κλάση.

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ88

4οΒήμα:Γίνεται η διαλογή των παρατηρήσεων

Το πλήθος νi των παρατηρήσεων που προκύπτει

από τη διαλογή για την i κλάση είναι η συχνότητα νi της κλάσης αυτής ή η συχνότητα της κεντρικής τιμής xi

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ77

► Οι κεντρικές τιμές διαφέρουν μεταξύ τους όσο και το πλάτος των κλάσεων. Δηλαδή

xi+1-xi=c xi+1=xi+c

ΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝΟΜΑΔΟΠΟΙΗΣΗ ΠΑΡΑΤΗΡΗΣΕΩΝ99

Άρα για να υπολογίσουμε τις κεντρικές τιμές, μπορούμε να υπολογίσουμε την κεντρική τιμή x1 της πρώτης κλάσης [α, β) από την σχέση:

Και στην συνέχεια να προσθέτουμε κάθε φορά το πλάτος c, δηλ. x2=x1+c x3=x2+c κ.λ.π

21

x

Ιστόγραμμα ΣυχνοτήτωνΙστόγραμμα Συχνοτήτων ((histogram)histogram)11

Στον οριζόντιο άξονα σημειώνουμε τα όρια των κλάσεων

Στον κατακόρυφο άξονα τις συχνότητες ή τις σχετικές συχνότητες

Κατασκευάζουμε διαδοχικά ορθογώνια (ιστούς), καθένα από τα οποία έχει βάση ίση με το πλάτος c των κλάσεων και ύψος τέτοιο ώστε το εμβαδόν του ορθογωνίου να ισούται με τη συχνότητα της κλάσης αυτής: Εi=β*υ Εi=c*υ και Ei=νi

Παρατήρηση

Στην κατασκευή του ιστογράμματος θεωρούμε 2 ακόμη υποθετικές κλάσεις, στην αρχή και στο τέλος, με συχνότητα 0.

π.χ.

Ιστόγραμμα ΣυχνοτήτωνΙστόγραμμα Συχνοτήτων ((histogram)histogram)22

Πολύγωνο Πολύγωνο ΣυχνοτήτωνΣυχνοτήτων & Σχ. Συχνοτήτων

(frequency polygon)

Για να σχεδιάσουμε το πολύγωνο συχνοτήτων, ενώνουμε τα μέσα των άνω βάσεων των ορθογωνίων με ευθύγραμμα τμήματα. (μαζί με τις βάσεις των μηδενικών κλάσεων στην αρχή και το τέλος)

Ιστόγραμμα Αθροιστικών Ιστόγραμμα Αθροιστικών Συχνοτήτων & Σχ. ΣυχνοτήτωνΣυχνοτήτων & Σχ. Συχνοτήτων

Κατασκευάζεται με τον ίδιο τρόπο με το ιστόγραμμα συχνοτήτων και σχετικών συχνοτήτων

Πολύγωνο ΑθροιστικώνΠολύγωνο ΑθροιστικώνΣυχνοτήτωνΣυχνοτήτων & Σχ. Συχνοτήτων

Για να σχεδιάσουμε το πολύγωνο Αθροιστικών συχνοτήτων, ενώνουμε τα δεξιά άκρα των άνω βάσεων των ορθογωνίων με ευθύγραμμα τμήματα, ξεκινώντας από το κάτω αριστερό άκρο του πρώτου ορθογωνίου.

Οι χρόνοι (σε λεπτά) που χρειάστηκαν Οι χρόνοι (σε λεπτά) που χρειάστηκαν 55 μαθητές για να λύσουν ένα πρόβλημα 55 μαθητές για να λύσουν ένα πρόβλημα είναι: είναι: (άσκηση 7, σελ. 83)(άσκηση 7, σελ. 83)

Να ομαδοποιηθούν τα δεδομένα σε κατάλληλο αριθμό κλάσεων: Το πλήθος των κλάσεων είναι ………… Η μέγιστη τιμή είναι………….και η ελάχιστη τιμή είναι ……........., άρα το εύρος του δείγματος είναι..………….. και το πλάτος c, είναι:

κ=7

xmax=13,8xmin=1,3

R=12,5

και το πλάτος c, είναι: 8,1768,17

5,12

R

c

Κατασκευή πίνακα με νi, fi%, Ni, Fi%

Κλάσεις [ , ) νi fi% Ni Fi% xi

Σύνολο: 5

1,3-3,1

3,1-4,9

4,9-6,7

6,7-8,58,5-10,3

10,3-12,1

12,1-13,9

14

19

4

6

4

3

5

55

25,5

34,5

7,3

10,9

7,3

5,4

9,1

100

2,2

4,0

5,8

7,6

9,4

11,2

13

Ιστόγραμμα & ΠολύγωνοΙστόγραμμα & Πολύγωνο Σχετικών Συχνοτήτων Σχετικών Συχνοτήτων

Ιστόγραμμα & ΠολύγωνοΙστόγραμμα & Πολύγωνο Αθροιστικών Σχετικών Αθροιστικών Σχετικών

ΣυχνοτήτωνΣυχνοτήτων

Στα σχολεία ενός δήμου υπηρετούν συνολικά 100 εκπαιδευτικοί. Ο συνολικός χρόνος υπηρεσίας των εκπαιδευτικών δίνεται από τον παρακάτω πίνακα:

Χρ. υπηρεσίας

[ - )

Σχ. Συχνότητα

fi%

0-5 10

5-10 15

10-15 12

15-20 15

20-25 18

25-30 18

30-35 12

Σύνολο

Συχνότητανi

Στον επόμενο πίνακα, φαίνεται η κλιμάκωση των βαθμών πρόσβασης, του συνόλου των Μαθητών της Γ΄Λυκείου που εξετάστηκαν σε εθνικό επίπεδο το 2002, σύμφωνα με τα επίσημα στοιχεία που έδωσε στην δημοσιότητα το Υπουργείο Παιδείας

1. Αν είναι γνωστό ότι το πλήθος των μαθητών που πήραν βαθμό πρόσβασης μεγαλύτερο ή ίσο του 16 και μικρότερο του 18 ήταν τετραπλάσιος αυτών που πήραν βαθμό μεγαλύτερο ή ίσο του 4 και μικρότερο του 6, να συμπληρώσετε τον πίνακα με τις δύο σχετικές συχνότητες που λείπουν.

2. Είναι οι γνωστό ότι 55872 μαθητές πήραν βαθμό πρόσβασης μεγαλύτερο ή ίσο του 10. Να βρείτε το συνολικό πλήθος των υποψηφίων

3. Να υπολογίσετε πόσοι υποψήφιοι είχαν βαθμό πρόσβασης μεγαλύτερο ή ίσο του 11 και μικρότερο του 13

[ - ) Σχ. Συχνότητα fi%

0-2 1

2-4 2

4-6

6-8 16

8-10 18

10-12 16

12-14 14

14-16 13

16-18

18-20 5

Σύνολο

Άσκηση 3

[ - ) xi νi Ni fi% Fi%

Σύνολο

Καμπύλες συχνοτήτων

Αριθμητικά ΜέτραΑριθμητικά Μέτρα

Αριθμητικά Μέτρα με τα οποία μπορούμε να περιγράψουμε με συντομία μια κατανομή συχνοτήτων.

Μέτρα θέσης (Location Measures)

Μέτρα

Μέτρα διασποράς (Measures of

Variability)

Μέτρα Θέσης

Μας δίνουν τη θέση του «κέντρου» των παρατηρήσεων στον οριζόντιο άξονα.

Εκφράζουν την “κατά μέσο όρο” απόσταση των παρατηρήσεων από την αρχή των αξόνων.

Τα πιο «συνηθισμένα» μέτρα θέσης είναι:•Μέση τιμή ( ) ή Αριθμητικός Μέσος

(Arithmetic mean or Average)•Σταθμικός Μέσος ( ) (weighted mean)•Διάμεσος (δ) (median)

x

x

Μέση τιμή ( ) (Average)1

1η περίπτωση

Η μέση τιμή ενός συνόλου ν παρατηρήσεων

(t1, t2,….tν) μιας μεταβλητής Χ είναι το άθροισμα των παρατηρήσεων δια του πλήθους των παρατηρήσεων.

x

1

121 1...

ii

ii

tt

tttx

Μέση τιμή ( ) (Average)2

2η περίπτωση

Αν x1, x2,…xκ είναι οι τιμές της μεταβλητής Χ με συχνότητες ν1, ν2, ….,νκ, αντίστοιχα τότε :

ή

1

1

1

21

2211 1

...

...

iii

ii

iii

xx

xxxx

x

11 iii

i

ii fxxx

Παράδειγμα

Μέση τιμή ( ) (Average)3

Παρατήρηση:

Ο τύπος της 2ης περίπτωσης, χρησιμοποιείτε και για ομαδοποιημένα δεδομένα, όπου xi είναι τα κέντρα των κλάσεων

x

Παράδειγμα

Σταθμικός Μέσος ( ) (weighted mean)

Χρησιμοποιείται στις περιπτώσεις όπου δίνεται διαφορετική βαρύτητα (έμφαση) στις τιμές x1, x2,…xν ενός συνόλου δεδομένων.

Αν σε κάθε τιμή x1, x2,…xν δώσουμε διαφορετική βαρύτητα, που εκφράζεται με τους λεγόμενους συντελεστές στάθμισης (βαρύτητας) w1, w2,….wν, τότε

x

1

1

21

2211

....

....

ii

iii

w

wx

www

wxwxwxx

Παράδειγμα

Διάμεσος (δ) (median)1

Η διάμεσος δ είναι ένας αριθμός:

xmin< δ < xmax

και μοιράζει τις παρατηρήσεις σε δύο σύνολα έτσι ώστε το 50% των παρατηρήσεων να είναι μικρότερες ή ίσες του δ.

Διάμεσος (δ) (median)2

Μη Ομαδοποιημένα Δεδομένα

Προσοχή!!

Οι παρατηρήσεις πρέπει να έχουν διαταχθεί κατά αύξουσα σειρά

1η περίπτωση:

Το πλήθος ν των παρατηρήσεων είναι περιττός αριθμός.

δ =μεσαία παρατήρηση

2η περίπτωση:

Το πλήθος ν των παρατηρήσεων είναι άρτιος αριθμός.

δ = ο μέσος όρων των μεσαίων παρατηρήσεων

Παράδειγμα

Διάμεσος (δ) (median)3

Ομαδοποιημένα Δεδομένα1ο Κατασκευάζουμε το ιστόγραμμα των αθροιστικών

σχετικών συχνοτήτων και την πολυγωνική γραμμή.

2ο Από το σημείο του 50% του άξονα (Οy) των αθροιστικών συχνοτήτων φέρνουμε παράλληλη στον άξονα Οx μέχρι το σημείο που τέμνει το πολύγωνο.

3ο Από το σημείο τομής φέρνουμε κάθετη στον Οx

► Στο σημείο τομής με τον άξονα Οx αντιστοιχεί η διάμεσος δ Παράδειγμα

Οι βαθμοί επίδοσης ενός μαθητή σε 10 μαθήματα είναι: 14, 20, 15, 16, 18,15, 14, 16, 16, 18. Να βρεθεί η μέση επίδοση του

2,1616210

1)18161614151816152014(

10

11

1

iitx

xi νi xiνi

14

15

16

18

20

Σύνολο 2,1616210

1

1

1

i

iixx

1ος τρόπος

2ος τρόπος 2

2

2

3

1

10

28

30

48

36

20

162

Δημιουργούμε τον πίνακα Άρα

1i

iix

Εάν το κάθε μάθημα έχει συντελεστή βαρύτητας, αντίστοιχα: xi: 14, 20, 15, 16, 18,15, 14, 16, 16, 18 wi: 2, 1, 3, 1, 2, 3, 2, 1, 2, 3

1620

320

20

543216284536164520283212321312

3*182*161*162*143*152*181*163*151*202*141

1

ii

iii

w

wxx

Ποια είναι τότε η μέση επίδοση;

Ο παρακάτω πίνακας δίνει τον χρόνο που έκαναν 40 μαθητές για να λύσουν μια άσκηση. Να βρεθεί η μέση τιμή

[ - ) xi νi xiνi

0-2 8

2-4 8

4-6 14

6-8 6

8-10 4

Σύνολο 40

1i

iix

Άρα

5,418040

1

1

1

i

iixx

1

3

5

7

9

8

24

70

42

36

180

Οι βαθμοί επίδοσης ενός μαθητή σε 10 μαθήματα είναι: 14, 20, 15, 16, 18,15, 14, 16, 16, 18. Να βρεθεί η διάμεσος των παρατηρήσεων

Οι παρατηρήσεις πρέπει να τοποθετηθούν κατά αύξουσα σειρά

Άρα: 14, 14, 15, 15, 16, 16, 16, 18,18, 20

Το πλήθος των παρατηρήσεων είναι άρτιος αριθμός.

Άρα δ= 162

1616

4 4

Αν προστεθεί ο βαθμός ενός μαθήματος ακόμα, δηλαδή: 14, 20, 15, 16, 18,15, 14, 16, 16, 18, 15, τότε η διάμεσος είναι:

Άρα: 14, 14, 15, 15, 15, 16, 16, 16, 18,18, 20

Το πλήθος των παρατηρήσεων είναι περιττός αριθμός.

Οι παρατηρήσεις πρέπει να τοποθετηθούν κατά αύξουσα σειρά

5 5

Άρα δ=16

Ο παρακάτω πίνακας δίνει τον χρόνο που έκαναν 40 μαθητές για να λύσουν μια άσκηση. Να βρεθεί η διάμεσος των παρατηρήσεων

[ - ) xi νi fi% Fi%

0-2 1 8

2-4 3 8

4-6 5 14

6-8 7 6

8-10 9 4

Σύνολο 40

7520

35

10

15

100

20

40

20

90

100

1ο Βήμα:

Υπολογίζουμε τις Αθροιστικές Σχετικές Συχνότητες

2ο Βήμα: Κατασκευάζουμε το ιστόγραμμα & το πολύγωνο

Αθροιστικών Σχετικών Συχνοτήτων

Α Β

Γ

ΔΕ

%40%50

%40%75

4

46

10

35

4

2

1403520

57.4

16035

Μέτρα Διασποράς (measures of variation, dispersion measures)

• Μας δίνουν την διασπορά των παρατηρήσεων, δηλαδή πόσο αυτές εκτείνονται γύρω από το «κέντρο» τους.

Τα σπουδαιότερα μέτρα διασποράς είναι:

Το εύρος (R) (range)

Η διακύμανση ( ) (variance)

Η τυπική απόκλιση (s) (standard deviation)

Συντελεστής μεταβολής (CV) (coefficient of variation)

2s

Εύρος Εύρος ( R ) (range)( R ) (range)

R=xmax-xmin

• Το εύρος είναι ένα αρκετά απλό μέτρο, • Υπολογίζεται εύκολα• Δεν θεωρείται αξιόπιστο γιατί βασίζεται μόνο στις

δύο ακραίες παρατηρήσεις

Διακύμανση (Διακύμανση ( ) )11

Αν t1, t2, ….tν είναι οι τιμές μιας μεταβλητής Χ,

τότε ti- είναι η απόκλιση της τιμής ti από την μέση τιμή.

Διακύμανση, είναι ο μέσος όρος των τετραγώνων των αποκλίσεων των τιμών ti από την μέση τιμή

x

2s

x

1

22 1

ii xts

2

1

1

22 1 ii

ii

t

tsή

Παράδειγμα

Διακύμανση (Διακύμανση ( ) )22

όταν έχουμε κατανομή συχνοτήτων ή ομαδοποιημένα δεδομένα, τότε η διακύμανση ορίζεται από την σχέση:

1

22 1

iii xxs

2s

2

1

1

22 1 iii

iii

x

xsή

Υπέρ: Αξιόπιστο μέτρο διασποράς

Κατά: Δεν εκφράζεται με τις μονάδες που εκφράζονται οι παρατηρήσεις…

Τυπική Απόκλιση (Τυπική Απόκλιση (s) s) (standard deviation)(standard deviation)

Γι’ αυτό αν πάρουμε την θετική τετραγωνική ρίζα της διακύμανσης, αυτή θα εκφράζεται με την ίδια μονάδα μέτρησης με τις παρατηρήσεις. Η ποσότητα αυτή λέγεται τυπική απόκλιση (s)

s= 2s

Παράδειγμα

Οι βαθμοί επίδοσης ενός μαθητή σε 10 μαθήματα είναι: 14, 20, 15, 16, 18,15, 14, 16, 16, 18. Να βρεθεί η διακύμανση

2,16x

52,32,3510

184,404,004,084,444,1

24,304,044,144,1484,4(10

1

])8,1()2,0()2,0()2,2()2,1(

)8,1()2,0()2,1()8,3()2,2[(10

1

])2,1618()2,1616()2,1616()2,1614(2,1615

)2,1618()2,1615()2,1620()2,1614[(10

1

1

22222

22222

22222

2222

1

22

ii xts

Ο παρακάτω πίνακας δίνει τον χρόνο που έκαναν 40 μαθητές για να λύσουν μια άσκηση. Να βρεθεί η διακύμανση & η τυπική απόκλιση, αν =4,5

[ - ) xi νi xi- (xi- )2 (xi- )2νi

0-2 1 8

2-4 3 8

4-6 5 14

6-8 7 6

8-10 9 4

Σύνολο

40

x

x

-3,5

-1,5

0,5

2,5

4,5

x x

12,25

2,250,25

6,25

20,25

98

183,5

37,5

81

238

1

2

iii xx

95,523840

11

1

22

i

ii xxs

x

44,295,52 ss

Συντελεστής Μεταβολής (Συντελεστής Μεταβολής (CV)CV)11

x

Μας βοηθάει στην σύγκριση ομάδων τιμών, που

είτε εκφράζονται σε διαφορετικές μονάδες μέτρησης

είτε εκφράζονται στην ίδια μονάδα μέτρησης, αλλά έχουν σημαντικά διαφορετικές μέσες τιμές.

Ορίζεται για 0, από τον τύπο:

|| x

sCV

Συντελεστής Μεταβολής (Συντελεστής Μεταβολής (CV)CV)22

Είναι ανεξάρτητος από τις μονάδες μέτρησης

Εκφράζεται επί τοις εκατό

Παριστάνει ένα μέτρο σχετικής διασποράς

Συγκρίνοντας τους συντελεστές μεταβολής CV, δύο δειγμάτων Α και Β, για την ίδια μεταβλητή

►Αν sA=sB και CVA>CVB τότε συμπεραίνουμε ότι το δείγμα Α παρουσιάζει μεγαλύτερη διασπορά από το δείγμα Β.

►Αν sAsB , και CVA>CVB τότε συμπεραίνουμε ότι το δείγμα Α παρουσιάζει μεγαλύτερη διασπορά από το δείγμα Β.

BA xx

Συντελεστής Μεταβολής (Συντελεστής Μεταβολής (CV)CV)33

Ένα δείγμα τιμών μιας μεταβλητής είναι ομοιογενές εάν ο

CV≤10%

Είναι το δείγμα ομοιογενές

%10%7575,018

55,13

x

sCV

55,137,1832 ss

Το δείγμα δεν είναι ομοιογενές