ΜΑΘΗΜΑ 2ο
-
Upload
george-stewart -
Category
Documents
-
view
19 -
download
0
Embed Size (px)
description
Transcript of ΜΑΘΗΜΑ 2ο

1
1ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ
ΕΡΓΑΣΤΗΡΙΟΣΤΑΤΙΣΤΙΚΗΣ
ΕΠΙΜΕΛΕΙΑ ΣΗΜEΙΩΣΕΩΝ:
ΒΑΣΙΛΕΙΑΔΗΣ ΓΕΩΡΓΙΟΣΔΗΜΗΤΡΙΟΥ ΒΑΣΙΛΕΙΟΣΕΛΕΥΘΕΡΙΟΥ ΜΑΥΡΟΥΔΗΣΜΩΥΣΙΑΔΗΣ ΘΕΟΔΩΡΟΣΣΚΟΥΡΚΕΑΣ ΑΝΑΣΤΑΣΙΟΣ
Δ’ ΕΞΑΜΗΝΟ
Περιγραφική Στατιστική
2
Περιγραφική Στατιστική Δύο Μεταβλητών
Η ύπαρξη δύο ή περισσοτέρων μεταβλητών σε μια έρευνα, οδηγεί εύλογα στην αναζήτηση της (πιθανής) μεταξύ τουςσχέσης.
Εξετάζεται η συμπεριφορά των τιμών μιας μεταβλητής σεσχέση με τις τιμές κάποιας άλλης.
Η επιλογή της στατιστικής τεχνικής εξαρτάται αποκλειστικάαπό τη διάκριση των μεταβλητών σε ποσοτικέςποσοτικές ήή ποιοτικέςποιοτικές..
περιγραφική στατιστική δύο ποιοτικώνμεταβλητών
περιγραφική στατιστική μιας ποσοτικήςμεταβλητής μέσα στις κατηγορίες μιαςποιοτικής-ων.

2
3Περιγραφική στατιστική δύο ποιοτικών
μεταβλητών
• Διαδικασία Crosstabs• Analyze DescriptiveStatistics Crosstabs…
FILE OPEN DATA salary.sav (δεδομένα για 474 υπαλλήλουςπου απολύθηκαν από μια τράπεζα μεταξύ του 1969 και του 1971)
Δημιουργεί Γραφήματα
4
• Counts : Παρατηρούμενες συχνότητες (observed) είναι οι μετρήσειςσε κάθε κελί, ενώ αναμενόμενες (expected) είναι ο αριθμός τωνπεριπτώσεων που θα ήταν σε κάθε κελί αν οι μεταβλητές πουορίζουν τις γραμμές και τις στήλες του πίνακα συνάφειας είναιστατιστικά ανεξάρτητες.
• Percentages: Τα ποσοστά των γραμμών/στηλών αθροίζουν στο100% κατά μήκος της κάθε γραμμής/στήλης του πίνακα συνάφειας, ενώ τα συνολικά ποσοστά αθροίζουν στο 100% μέσα σε όλα τα κελιάτου πίνακα.
• Residuals: Τα υπόλοιπα είναι οι διαφορές μεταξύ παρατηρούμενωνκαι αναμενόμενων τιμών του κάθε κελιού.

3
5EMPLOYMENT CATEGORY * SEX OF EMPLOYEE Crosstabulation
110 117 227
48,5% 51,5% 100,0%
42,6% 54,2% 47,9%
23,2% 24,7% 47,9%47 89 136
34,6% 65,4% 100,0%
18,2% 41,2% 28,7%
9,9% 18,8% 28,7%27 0 27
100,0% ,0% 100,0%
10,5% ,0% 5,7%
5,7% ,0% 5,7%34 7 41
82,9% 17,1% 100,0%
13,2% 3,2% 8,6%
7,2% 1,5% 8,6%30 2 32
93,8% 6,3% 100,0%
11,6% ,9% 6,8%
6,3% ,4% 6,8%4 1 5
80,0% 20,0% 100,0%
1,6% ,5% 1,1%
,8% ,2% 1,1%6 0 6
100,0% ,0% 100,0%
2,3% ,0% 1,3%
1,3% ,0% 1,3%258 216 474
54,4% 45,6% 100,0%
100,0% 100,0% 100,0%
54,4% 45,6% 100,0%
Count% within EMPLOYMENTCATEGORY% within SEX OFEMPLOYEE% of TotalCount% within EMPLOYMENTCATEGORY% within SEX OFEMPLOYEE% of TotalCount% within EMPLOYMENTCATEGORY% within SEX OFEMPLOYEE% of TotalCount% within EMPLOYMENTCATEGORY% within SEX OFEMPLOYEE% of TotalCount% within EMPLOYMENTCATEGORY% within SEX OFEMPLOYEE% of TotalCount% within EMPLOYMENTCATEGORY% within SEX OFEMPLOYEE% of TotalCount% within EMPLOYMENTCATEGORY% within SEX OFEMPLOYEE% of TotalCount% within EMPLOYMENTCATEGORY% within SEX OFEMPLOYEE% of Total
CLERICAL
OFFICE TRAINEE
SECURITY OFFICER
COLLEGE TRAINEE
EXEMPT EMPLOYEE
MBA TRAINEE
TECHNICAL
EMPLOYMENTCATEGORY
Total
MALES FEMALESSEX OF EMPLOYEE
Total
Ποια ποσοστά θαερμηνεύσω;;;
6
Το 48,5% των ταμιών είναι άνδρες και το 51,5% γυναίκες.
Από τους άνδρες που απολύθηκαν, είχαμε :
42,6% ταμίες
18,2% office-trainee
10,5% security-officer
13,2% college trainee
11,6% exempt employee
1,6% MBA-trainee
και 2,3 % τεχνικοί.
Σχόλια του προηγούμενου πίνακα:

4
7Ομαδοποιημένο Ραβδόγραμμα
ΓραφικήΓραφικήαναπαράστασηαναπαράσταση
τωντων προηγούμενωνπροηγούμενωναποτελεσμάτωναποτελεσμάτων
Πως θα εμφανιστούν ταποσοστά?
ΠωςΠως θαθα εμφανιστούνεμφανιστούν ταταποσοστάποσοστά??
8

5
9Η διαδικασία Crosstabs μπορεί να χρησιμοποιηθεί και γιαποσοτικές μεταβλητές, αρκεί οι τιμές αυτών να έχουνκωδικοποιηθεί σε διαστήματα τιμών (Transform Recode
….).
To S.P.S.S. παρέχει με τη βοήθεια της επιλογής ”Layers”, τηδυνατότητα να ορίσουμε μία ή περισσότερες ποιοτικέςμεταβλητές σαν μεταβλητές ελέγχου των ζητούμενων πινάκωνσυνάφειας : αρκεί να τη μετακινήσουμε στον κατάλογο Layers 1.
Analyze Descriptive Statistics Crosstabs
1η
2η
3η
Βγάζει τα ποσοστά που είδαμεσε γραφήματα
10training * dance * animal Crosstabulation
Count
26 6 326 30 36
32 36 6823 9 3224 10 3447 19 66
Food as RewardAffection as Reward
training
TotalFood as RewardAffection as Reward
training
Total
animalCat
Dog
Yes Nodance
Total
Συχνότητες
Οι δύο ποιοτικέςμεταβλητές
Layer 1
Η στατιστική ανάλυση των δύο μεταβλητών γίνεται για κάθεστρώμα (κατηγορία) της μεταβλητής ελέγχου (Layer 1).

6
11Γραφήματα του S.P.S.S.
Το μόνο συμπέρασμα αφορά τη σύγκριση του μήκους των ράβδων μέσα στηνκάθε ομάδα.
Για κάθε μια κατηγορία της 3ηςποιοτικής μεταβλητής σχηματίζεται
ένα clustered γράφημα
Για κάθε μια κατηγορία της 3ηςποιοτικής μεταβλητής σχηματίζεται
ένα clustered γράφημα
Τι συμπεραίνετε?
12Καλύτερα:
Πως το πετυχαίνουμε?

7
13
Διπλό κλικ στονάξονα ψ
Πληκτρολογείτε 1 για να γίνει ηκλίμακα 100%
Πληκτρολογείτε 1 για να γίνει ηκλίμακα 100%
14ΕΝΑΛΛΑΚΤΙΚΟΣ ΤΡΟΠΟΣ ΔΗΜΙΟΥΡΓΙΑΣ ΓΡΑΦΗΜΑΤΩΝ
GRAPHS BAR…..

8
15ΟΜΑΔΟΠΟΙΗΜΕΝΟ ΡΑΒΔΟΓΡΑΜΜΑ
Chart Editor δεξί κλικ πάνωσε μια μπάρα και μετατροπή σεσυσσωρευμένο ραβδόγραμμα
Για αλλαγή στο scale 100% διπλό κλικσε μια ράβδο bar options
επιλογή scale 100%
ΣΥΣΣΩΡΕΥΜΕΝΟ ΡΑΒΔΟΓΡΑΜΜΑ
16ΑΛΛΑΓΗ ΓΡΑΜΜΩΝ-ΣΤΗΛΩΝ• ΔΙΠΛΟ ΑΡΙΣΤΕΡΟ ΚΛΙΚ ΣΤΟ ΓΡΑΦΗΜΑ ΝΑ ΑΝΟΙΞΕΙ Ο CHART
EDITOR• Καρτέλα Variables: αλλάζω τη θέση των μεταβλητών στις θέσεις x-Axis
και x-Axis Cluster

9
17ΗΗ ΠεριγραφικήΠεριγραφική ΣτατιστικήΣτατιστική ΜΙΑΣΜΙΑΣ ΠΟΣΟΤΙΚΗΣΠΟΣΟΤΙΚΗΣΜΕΤΑΒΛΗΤΗΣΜΕΤΑΒΛΗΤΗΣ μέσαμέσα στιςστις κατηγορίεςκατηγορίες ΜΙΑΣΜΙΑΣ ΠΟΙΟΤΙΚΗΣΠΟΙΟΤΙΚΗΣ..
α. Διαδικασία Explore
Analyze Descriptive Statistics Explore
ποσοτική ποιοτική
18Στατιστικάμέτρα
θηκόγραμμα+
ιστόγραμμα
ελλείπουσεςτιμές

10
19
Descriptives
8120,56 5236,79226,910 79,8977673,72 5079,31
8567,40 5394,27
7699,97 5139,836300,00 4950,001,3E+07 1378839
3644,712 1174,2403600 3600
31992 1200028392 8400
3075 12482,390 1,767
,152 ,1668,488 5,352
,302 ,330
StatisticStd. ErrorStatisticStatistic
StatisticStatisticStatisticStatisticStatisticStatisticStatisticStatisticStatisticStd. ErrorStatisticStd. Error
Mean
Lower BoundUpper Bound
95% ConfidenceInterval for Mean
5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewness
Kurtosis
BEGINNING SALARYMALES FEMALESSEX OF EMPLOYEE
Descriptives
8120,56 226,9107673,72
8567,40
7699,976300,001,3E+07
3644,7123600
3199228392
30752,390 ,1528,488 ,302
5236,79 79,8975079,31
5394,27
5139,834950,00
13788391174,240
360012000
84001248
1,767 ,1665,352 ,330
MeanLower BoundUpper Bound
95% ConfidenceInterval for Mean
5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosisMean
Lower BoundUpper Bound
95% ConfidenceInterval for Mean
5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosis
SEX OF EMPLOYEEMALES
FEMALES
BEGINNING SALARYStatistic Std. Error
Chart editor pivot trays
Τρόπος καλύτερηςεμφάνισης του πίνακα
αποτελεσμάτων
20
MALES FEMALES
SEX OF EMPLOYEE
0
10000
20000
30000
BEGINNING SALARY
353 332255
220 232
432176
143114
142145231725415 132
243
283
67
122
2
56
5 0 0 0 1 0 0 0 0 1 5 00 0 2 0 00 0 25 0 0 0 30 0 0 0
B E G IN N IN G S A L A R Y
0
30
60
90
1 2 0
1 5 0
Frequency
M e a n = 8 1 20 ,5 6S td . De v . = 36 4 4 ,7 1 2N = 2 5 8
fo r s e x= M A L ES
H is to g ra m
4000 6000 8000 10000 12000
BEGINNING SALARY
0
10
20
30
40
50
Frequency
Mean = 5236,79Std. Dev. = 1174,24N = 216
for sex= FEMALES
Histogram
θηκόγραμμα
1. Δίνει μια ικανοποιητική εικόνατης διασποράς των δεδομένων
2. Διασπορά = ανάλογη τουπλάτους του ορθογωνίου
3. Διάμεσος = η γραμμή μέσαστο ορθογώνιο
Outliers

11
21β. Διαδικασία Means
Analyze Compare Means MeansΤοποθέτηση περισσότερων
ποιοτικών μεταβλητών
22Report
BEGINNING SALARY
5926,96 23 635,4844688,00 30 817,4925225,66 53 963,2596045,48 62 1146,0504934,08 128 799,9645296,75 190 1061,5596250,00 6 294,9586250,00 6 294,9586537,25 83 1049,4355507,27 33 1030,9446244,24 116 1139,671
10145,26 35 4089,5197171,00 24 1456,6308935,39 59 3580,041
11328,00 10 2325,6625100,00 1 .
10761,82 11 2897,24212896,00 9 2552,94212896,00 9 2552,94213905,63 27 4214,39613905,63 27 4214,39614496,00 2 3529,87714496,00 2 3529,87715000,00 1 .15000,00 1 .
8120,56 258 3644,7125236,79 216 1174,2406806,43 474 3148,255
SEX OF EMPLOYEEMALESFEMALESTotalMALESFEMALESTotalMALESTotalMALESFEMALESTotalMALESFEMALESTotalMALESFEMALESTotalMALESTotalMALESTotalMALESTotalMALESTotalMALESFEMALESTotal
EDUCATIONAL LEVEL8
12
14
15
16
17
18
19
20
21
Total
Mean N Std. DeviationReport
BEGINNING SALARY
5225,66 53 963,2595296,75 190 1061,5596250,00 6 294,9586244,24 116 1139,6718935,39 59 3580,041
10761,82 11 2897,24212896,00 9 2552,94213905,63 27 4214,39614496,00 2 3529,87715000,00 1 .
6806,43 474 3148,255
EDUCATIONAL LEVEL8121415161718192021Total
Mean N Std. Deviation
Layer 1 = edlevel
Layer 1 & 2 = edlevel & sex

12
23Τρόποι γραφικής αναπαράστασης των αποτελεσμάτωντης διαδικασίας MEANS (μέχρι δύο Layers)
MIA Ποιοτική μεταβλητή (LAYER)
Graphs Bar Charts Simple
8 1 2 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1
E D U C A T I O N A L L E V E L
0
3 . 0 0 0
6 . 0 0 0
9 . 0 0 0
1 2 . 0 0 0
1 5 . 0 0 0
Mean BEGINNING SALARY
24ΔΥΟ ποιοτικές μεταβλητές (LAYERS)
Graphs Bar Charts Clustered
WHITE NONWHITE
MINORITY CLASSIFICATION
0
2.000
4.000
6.000
8.000
10.000
Mean BEGINNING SALARY
8638
6554
53404780
SEX OF EMPLOYEE
MALESFEMALES

13
25ΜηνΜην ξεχάσετεξεχάσετε τηντην εργασίαεργασία……
• Την επόμενη φοράπου θα έχουμεμάθημα να τιςφέρετε.
• Σχόλια καισυμπεράσματα μεimport text.