Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis)...

43
Ανάλυση παραγόντων Ψυχομετρία ΙΙ, 7/4/2020 Σοφία Παπάζογλου

Transcript of Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis)...

Page 1: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση παραγόντωνΨυχομετρία ΙΙ, 7/4/2020

Σοφία Παπάζογλου

Page 2: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση παραγόντων (factor analysis)

• Εφαρμόζεται σε μία ομάδα μεταβλητών (ερωτημάτων)

• Στόχος: να βρεθούν υποομάδες μετρήσεων που είναι σχετικά ανεξάρτητες μεταξύ τους

• Παράγοντας: μεταβλητές που συσχετίζονται μεταξύ τους και αρκετά ανεξάρτητες από άλλες τέτοιες ομάδες μετρήσεων

• Οι παράγοντες θεωρείται ότι δημιουργούν τις συνάφειες μεταξύ των μετρήσεων

Page 3: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση παραγόντων (factor analysis)

• Π.χ. έχουν συλλεγεί μετρήσεις για διάφορα χαρακτηριστικά φοιτητών

• Προσωπικότητα, κίνητρα, συνήθειες μελέτης, νοητικές ικανότητες, ακαδημαϊκό ιστορικό

• Μέσω ανάλυσης παραγόντων προκύπτουν πρότυπα συναφειών που εκφράζουν τους παράγοντες που επηρεάζουν τη συμπεριφορά των φοιτητών

• Π.χ. μετρήσεις προσωπικότητας, κινήτρων, συνηθειών μελέτης συνδυάζονται σε έναν παράγοντα ανεξαρτησίας (προτίμηση για ανεξάρτητη εργασία), μετρήσεις νοημοσύνης, ακαδημαϊκου ιστορικού για παράγοντα ακαδημαϊκής ικανότητας

Page 4: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση παραγόντων (factor analysis)

«Έχεις άλλα ενδιαφέροντα εκτός της εργασίας σου (χόμπυ);»

«Θεωρείς τον εαυτό σου ομιλητικό άτομο;»

«Σ’ αρέσει να γνωρίζεις νέα πρόσωπα;»

«Σου αρέσει να βγαίνεις συχνά έξω;»

Τα άτομα που τείνουν να συμφωνούν σε όλα αυτά τα ερωτήματα, έχουν υψηλή Εξωστρέφεια, οι συνάφειες οφείλονται στον παράγοντα της Εξωστρέφειας

Page 5: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση παραγόντων (factor analysis)Χρησιμοποιείται στη δημιουργία αντικειμενικών τεστ/ερωτηματολογίων για μέτρηση προσωπικότητας, νοημοσύνης, αξιών κ.τ.λ.

α) πολύ μεγάλος αριθμός ερωτημάτων/ πρώτη ανάλυση παραγόντων

β) βάσει των αποτελεσμάτων προστίθενται/αφαιρούνται ερωτήματα, χορηγείται σε τυχαίο δείγμα

γ) επανάληψη διαδικασίας μέχρι να έχουν δημιουργηθεί παράγοντες με επαρκή αριθμό ερωτημάτων, που αντιπροσωπεύουν το πεδίο

δ) εγκυρότητα παραγόντων- προβλέψεις για τη συμπεριφορά ατόμων βάσει τιμών στους παράγοντες (σχέσεις παραγόντων με μεταβλητές/ πειραματικές συνθήκες βάσει θεωρίας), π.χ. άτομα με μέτριο άγχος έχουν υψηλότερη επίδοση από άτομα με υψηλό, χαμηλό (για εγκυρότητα ερωτηματολογίου για άγχος)

Page 6: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση παραγόντων (factor analysis)• Σύνοψη προτύπων συναφειών: μετρήσεις με συνάφειες μεταξύ τους σε έναν

πίνακα, άλλες με μεγαλύτερη, άλλες με μικρότερη συσχέτιση, οι παράγοντες συνοψίζουν την εικόνα αυτή

• Μεγάλος αριθμός μεταβλητών-μικρός αριθμός παραγόντων: π.χ. 84 ερωτήσεις του Eysenck Personality Questionnaire, 4 παράγοντες

• Λειτουργικός ορισμός (εξίσωση) για τον παράγοντα βάσει των μετρήσεων: βάσει της συσχέτισης των ερωτημάτων με τον παράγοντα, αυτός μπορεί να εκφραστεί ως συνάρτηση των μετρήσεων

• Έλεγχος θεωρίας: κατά πόσο από την ανάλυση προκύπτουν οι διαστάσεις όπως ορίζονται από τη θεωρία

Page 7: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση παραγόντων (factor analysis)

�� = ∑ ����� =���� �����+�����+…+�����

Όπου F ο παράγοντας (i=1 έως k παράγοντες), j οι μετρήσεις που συνδυάζονται στον παράγοντα, X οι αρχικές τιμές και W συντελεστές για τις μετρήσεις,

Για παράδειγμα, σε έναν παράγοντα που εκφράζει Εξωστρέφεια, προστίθενται οι αρχικές τιμές των ερωτημάτων της Εξωστρέφειας επί τους σχετικούς συντελεστές που προκύπτουν από την ανάλυση και δηλώνουν τη συσχέτιση των ερωτημάτων με τον παράγοντα

Page 8: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση παραγόντων (factor analysis)- Βήματα

• Επιλογή και μέτρηση μεταβλητών (π.χ. προσωπικότητα, αξίες, ποιές ερωτήσεις)

• Προετοιμασία του πίνακα συναφειών (τι είδους συνάφειες, τι θα μπει στη διαγώνιο)

• Ανεύρεση παραγόντων από τον πίνακα (επίσης, η καταλληλότητα των δεδομένων για την ανάλυση)

• Αριθμός παραγόντων (πόσοι παράγοντες επαρκούν για τη σύνοψη των συναφειών)

• Περιστροφή αξόνων για καλύτερη ερμηνεία

• Ερμηνεία αποτελεσμάτων

Page 9: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση παραγόντων (factor analysis)

• Σημαντικό για να είναι ικανοποιητική η ανάλυση είναι να υπάρχει ερμηνεία/ να έχουν τα αποτελέσματα νόημα

Εκτός των στατιστικών δεικτών που δείχνουν κατά πόσο τα αποτελέσματα της ανάλυσης είναι ικανοποιητικά (σε σχέση με τα αρχικά δεδομένα), σημαντική είναι η θεωρητική ερμηνεία

• Ερμηνεία παραγόντων βάσει συνδυασμού μεταβλητών που έχουν υψηλή συσχέτιση με αυτούς (π.χ. ερωτήματα που δηλώνουν διαπροσωπικές δεξιότητες, πρωτοβουλία για νέες φιλίες, κοινωνικότητα, μπορεί να μετρούν τον παράγοντα της Εξωστρέφειας)

Page 10: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Μορφές ανάλυσης παραγόντων

• Διερευνητική ανάλυση παραγόντων (Exploratory factor analysis, EFA):περιγραφή/σύνοψη δεδομένων ομαδοποιώντας μεταβλητές που συσχετίζονται, σε αρχικά στάδια της έρευνας και για δημιουργία υποθέσεων

• Επιβεβαιωτική ανάλυση παραγόντων (Confirmatory factor analysis, CFA): έλεγχος θεωρίας για λανθάνουσες διαδικασίες, σε προχωρημένα στάδια της έρευνας, προσεκτική επιλογή μεταβλητών για μέτρηση συγκεκριμένων εννοιών

Page 11: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Όροι για ανάλυση παραγόντων

• Παρατηρούμενος πίνακας συναφειών (observed correlation matrix)

• Πίνακας συναφειών με βάση τους παράγοντες (reproduced correlation matrix)

• Υπόλοιπο (residual correlation matrix), εδώ οι τιμές πρέπει να είναι μικρές, οι παράγοντες ταιριάζουν καλά με τα δεδομένα

• Φορτίσεις (loadings), συνάφειες των μεταβλητών με τους παράγοντες

• Περιστροφή αξόνων (rotation), στάδιο της ανάλυσης με στόχο την καλύτερη ερμηνεία των συσχετίσεων των μεταβλητών με τους παράγοντες

• Παραγοντικές τιμές (factor scores), εκτιμώμενες με βάση την ανάλυση βαθμολογίες των ατόμων στους παράγοντες

Page 12: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανάλυση κυρίων συνιστωσών και ανάλυση παραγόντων

• Ανάλυση κυρίων συνιστωσών (principal components analysis): όλη η διασπορά των παρατηρούμενων μετρήσεων αναλύεται

• Ανάλυση παραγόντων (factor analysis): αναλύεται η κοινή διασπορά μεταξύ των μετρήσεων (εκτιμάται-αφαιρείται η διασπορά σφάλματος και η μοναδική διασπορά κάθε μεταβλητής)

• Θεωρητική διαφορά ως προς το λόγο που συσχετίζονται οι μεταβλητές με παράγοντα ή συνιστώσα α) οι παράγοντες προκαλούν τις τιμές στις μεταβλητές, διαδικασίες που έχουν προκαλέσει τις συνάφειες β) οι κύριες συνιστώσες είναι ομαδοποιήσεις συσχετιζόμενων μεταβλητών, οι μεταβλητές «προκαλούν» την κύρια συνιστώσα, δεν υπάρχει θεωρία για το ποιές μετρήσεις συσχετίζονται με ποιές συνιστώσες, οι ονομασίες δεν αντιστοιχούν απαραίτητα σε θεωρητική σχέση

Page 13: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ερευνητικά ερωτήματα στην ανάλυση παραγόντων

• Να μειωθεί ένας μεγάλος αριθμός μεταβλητών σε έναν μικρό αριθμό παραγόντων

• Πόσοι παράγοντες υπάρχουν (αξιόπιστοι, ερμηνεύσιμοι);

• Πώς ερμηνεύονται οι παράγοντες;

• Πόση διασπορά αποδίδεται σε κάθε παράγοντα;

• Κατά πόσο οι παράγοντες ταιριάζουν με μία αναμενόμενη δομή;

• Ποιές είναι οι τιμές των ατόμων σε κάθε παράγοντα;

Page 14: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Έρευνα που έχει σχεδιαστεί για ανάλυση παραγόντων

• Να υπάρχει κάποια υπόθεση για τους παράγοντες/διαστάσεις του πεδίου που μελετάται/ να συμπεριληφθούν ερωτήματα για όλους τους σημαντικούς παράγοντες

• Για κάθε παράγοντα που υποθέτουμε, συμπεριλαμβάνονται 5 ή 6 ερωτήματα που θεωρούνται «καθαρές» μετρήσεις του παράγοντα (marker variables)

• Προτιμούνται μεταβλητές που συσχετίζονται με έναν παράγοντα

• Να υπάρχει διασπορά στις τιμές των συμμετεχόντων ως προς τους παράγοντες/ ερωτήματα

• Να είναι κανείς προσεκτικός σχετικά με διαφορετική παραγοντική δομή σε ομάδες/ το ίδιο δείγμα σε επαναληπτικές μετρήσεις, διαφορετικές συνθήκες κ.τ.λ.

Page 15: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Προϋποθέσεις

• Τουλάχιστον 10 ερωτήματα στην κλίμακα

• Αντιπροσωπευτικότητα δείγματος

• Οι Tabachnick & Fidell προτείνουν τουλάχιστον 300 άτομα για ανάλυση παραγόντων, 4*αριθμός ερωτημάτων τουλάχιστον (Μυλωνάς, 2012), περισσότερα άτομα αν γίνουν χωριστές αναλύσεις για υποομάδες

Π.χ. Ανάλυση παραγόντων για Eysenck Personality Questionnaire (EPQ), 84 ερωτήσεις, χρειάζεται τουλάχιστον 4*84=336 άτομα

Σε έρευνα με δείγμα που συμπλήρωσε έντυπο ερωτηματολόγιο (Ν=275) και διαδικτυακό ερωτηματολόγιο (Ν=414), έγινε ανάλυση παραγόντων του EPQ με βάση τιμές ατόμων σε ομάδες ερωτημάτων

Page 16: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Προϋποθέσεις

• Απόντα στοιχεία (missing data): εκτίμηση, διαγραφή ατόμων, ερωτημάτων, πίνακας συναφειών με βάση τα υπάρχοντα στοιχεία (pairwise correlations, εδώ οι συνάφειες που προέρχονται από μικρότερο αριθμό ατόμων θα είναι πιο ασταθείς, επίσης οι σχέσεις μεταξύ των στοιχείων του πίνακα θα είναι διαφορετικές από ότι αν ήταν πλήρες το δείγμα, επηρεάζει τις αναλύσεις)

• Κανονική κατανομή (& πολυμεταβλητή), ιδιαίτερα όταν γίνεται έλεγχος υποθέσεων, όχι τόσο σε περιγραφικές αναλύσεις (η επίλυση είναι καλύτερη όταν οι κατανομές είναι κανονικές)

Page 17: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Διμεταβλητή κανονική κατανομή

Page 18: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Προϋποθέσεις

• Ευθύγραμμη σχέση μεταξύ ζευγών μετρήσεων, καθώς οι συνάφειες μετρούν ευθύγραμμη συσχέτιση (διαγράμματα σκεδασμού)

• Έκτοπες τιμές

• Πολύ υψηλές συσχετίσεις μεταξύ μετρήσεων (multicollinearity, singularity)

• Στον πίνακα συναφειών, αρκετές συνάφειες με απόλυτη τιμή τουλάχιστον 0,30

• Θα πρέπει να είναι σύστημα συσχετιζόμενων μετρήσεων, όχι μόνο συνάφειες ανάμεσα σε ζεύγη μετρήσεων

• Μεταβλητή με χαμηλή πολλαπλή συσχέτιση με τις υπόλοιπες, θα έχει και χαμηλή συσχέτιση με τους σημαντικούς παράγοντες

Page 19: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Προϋποθέσεις

• Έκτοπες τιμές (outliers): άτομο (-α) με ακραία τιμή σε μία μεταβλητή ή ασυνήθιστο συνδυασμό τιμών σε περισσότερες μεταβλητές, ώστε να αλλοιώνει τα αποτελέσματα των αναλύσεων

π.χ. Σε ένα τεστ νοημοσύνης με κλίμακα μέτρησης από 0 έως 200, αν τα περισσότερα άτομα του δείγματος έχουν τιμές μεταξύ 80 και 120, ενώ ένα άτομο έχει τιμή 145

ή άτομο ηλικίας 15 ετών με 10 χρόνια εργασιακής εμπειρίας (συνδυασμός τιμών)

Page 20: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Προϋποθέσεις

• Πολυσυγγραμικότητα (multicollinearity): πολύ υψηλή συσχέτιση μεταξύ μεταβλητών (0,90 και πάνω), ή μία μεταβλητή είναι γραμμικός συνδυασμός δύο ή περισσότερων (singularity, συνάφεια 1,00 μεταξύ μίας μέτρησης και ενός συνδυασμού άλλων μετρήσεων)

• π.χ. δύο παρόμοιες κλίμακες νοημοσύνης (συνάφεια 0,90 και πάνω) ή μία κλίμακα νοημοσύνης μαζί με τις υποκλίμακές της (πολλαπλή συνάφεια 1,00)

• Δεν χρειάζονται όλες στην ίδια ανάλυση

• Εξετάζονται διμεταβλητές ή πολυμεταβλητές (πολλαπλή) συνάφειες

Page 21: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Απόντα στοιχεία (missing values)

• Πόσες τιμές λείπουν (λιγότερες από 15% συνόλου στοιχείων);

π.χ. Σε ερωτηματολόγιο 20 ερωτημάτων με 400 άτομα, υπάρχουν 8000 τιμές/στοιχεία, αν λείπουν 10 τιμές για ένα άτομο, είναι (10/8000)*100= 0,12%

• Είναι η κατανομή τους τυχαία ή συστηματική

Είναι οι τιμές που λείπουν διάσπαρτες εντός του αρχείου δεδομένων και λίγες σε αριθμό

ή

λείπουν πολλές τιμές από συγκεκριμένα άτομα, συγκεκριμένα ερωτήματα ή από άτομα με συγκεκριμένα χαρακτηριστικά;

Page 22: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Εκτίμηση απόντων στοιχείων

• Αντικατάσταση με μέσο όρο τιμών μέτρησης (μείωση διασποράς μεταβλητής, μείωση συναφειών με άλλες μεταβλητές)

• Ανάλυση παλινδρόμησης (Regression): πρόβλεψη τιμών στη μεταβλητή με ελλιπείς τιμές (εξαρτημένη) από τις υπόλοιπες μεταβλητές (ανεξάρτητες), με βάση τα άτομα με πλήρη στοιχεία, οι τιμές που εκτιμώνται μπορεί να συσχετίζονται (ταιριάζουν) με τις άλλες μετρήσεις περισσότερο από ότι αν είχαμε τα πραγματικά στοιχεία, επίσης οι άλλες μετρήσεις πρέπει να είναι ικανοποιητικές για την πρόβλεψη (συσχέτιση με την εξαρτημένη)

Page 23: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Εκτίμηση απόντων στοιχείων• Πρόβλεψη με βάση το συνολικό άθροισμα των υπαρχόντων στοιχείων, π.χ.

πρόβλεψη τιμών που λείπουν σε ένα ερώτημα Εξωστρέφειας με βάση το άθροισμα όλων των ερωτημάτων Εξωστρέφειας, ανεξαρτήτως του πόσες τιμές λείπουν για κάθε άτομο (π.χ. για 20 ερωτήματα ο πρώτος απάντησε 19, ο δεύτερος 20, ο τρίτος 15 κ.τ.λ)

• Expectation maximization: εκτιμώνται οι τιμές που λείπουν, ως οι πιο πιθανές με βάση το σύστημα όλων των υπόλοιπων τιμών

περιγράφεται το σύστημα των τιμών (που είναι, πόσες, σχέση με τις υπόλοιπες) και εκτιμάται τι περιμένουμε να υπάρχει με βάση το όλο σύστημα

Page 24: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Πίνακας συναφειών

• Πίνακας συναφειών όλων των μετρήσεων ανά ζεύγη [ν*(ν-1)]/2, π.χ. για 20 ερωτήματα έχουμε (20*19)/2=190 συνάφειες

• Τι είδους συνάφειες Pearson r, Spearman rho, Kendall tau, στις δίτιμες ο Φ ταυτίζευται με r

• Kendall tau: για τακτικές τιμές, επηρεάζεται λιγότερο από κόμβους (ίδιες τακτικές τιμές) σε σχέση με Spearman rho

Page 25: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Δείκτες Pearson r

v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21

v1 1,00

v2 0,44 1,00

v3 0,25 0,33 1,00

v4 0,55 0,34 0,23 1,00

v5 0,24 0,27 0,25 0,35 1,00

v6 0,38 0,32 0,27 0,47 0,47 1,00

v7 0,19 0,18 0,19 0,25 0,28 0,28 1,00

v8 0,30 0,26 0,24 0,42 0,29 0,56 0,31 1,00

v9 0,15 0,30 0,17 0,23 0,42 0,34 0,20 0,34 1,00

v10 0,38 0,43 0,26 0,41 0,31 0,46 0,34 0,40 0,27 1,00

v11 0,12 0,01 0,05 0,06 0,00 -0,01 0,01 0,01 -0,03 0,06 1,00

v12 -0,08 -0,09 -0,01 -0,06 -0,05 -0,12 -0,08 -0,08 -0,04 -0,01 0,04 1,00

v13 0,12 0,03 0,19 0,08 0,04 0,03 0,13 0,06 0,00 0,13 0,13 0,03 1,00

v14 0,04 -0,02 0,10 0,01 0,01 0,00 0,09 0,00 -0,04 0,00 0,13 0,10 0,26 1,00

v15 0,13 0,05 0,16 0,07 -0,02 0,01 0,06 0,01 -0,10 0,04 0,13 0,13 0,24 0,38 1,00

v16 0,16 0,03 0,21 0,10 0,03 0,02 0,15 0,04 -0,05 0,13 0,16 0,20 0,30 0,37 0,45 1,00

v17 0,14 0,06 0,21 0,15 0,13 0,12 0,19 0,13 0,00 0,15 0,11 0,08 0,26 0,28 0,25 0,41 1,00

v18 0,02 -0,11 0,05 -0,04 -0,06 -0,07 0,02 -0,03 -0,10 -0,04 0,04 0,11 0,13 0,09 0,23 0,21 0,18 1,00

v19 0,14 0,04 0,20 0,13 0,09 0,04 0,20 0,11 -0,02 0,12 0,15 0,11 0,25 0,31 0,37 0,53 0,45 0,19 1,00

v20 0,21 0,07 0,20 0,17 0,11 0,10 0,13 0,14 0,00 0,11 0,12 0,09 0,28 0,26 0,27 0,36 0,43 0,18 0,50 1,00

v21 0,24 0,10 0,25 0,21 0,14 0,22 0,13 0,18 0,03 0,13 0,09 0,03 0,28 0,18 0,31 0,31 0,30 0,17 0,32 0,41 1,00

Page 26: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Πίνακας συναφειών

• Fisher z για σύγκριση συναφειών

• Για κλίμακες Likert (π.χ. «διαφωνώ», «μάλλον διαφωνώ», «μάλλον συμφωνώ», «συμφωνώ»)

Μπορεί να γίνει σύγκριση μεταξύ δεικτών συνάφειας για αριθμητικά δεδομένα (Pearson r) και τακτικές τιμές (Kendall tau), αν δεν υπάρχει διαφορά μεταξύ των δύο ειδών δεικτών, μπορεί να θεωρηθούν ίσων διαστημάτων, η ανάλυση να γίνει με Pearson r.

Αν υπάρχει διαφορά, τότε αναλύονται οι δείκτες Kendall tau

Page 27: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Παράδειγμα

• Ερωτηματολόγιο Οικογενειακών Αξιών του Γεώργα (Γεώργας, 1986. Γεώργας, Γκαρή, & Μυλωνάς, 2005)

• παραδοσιακές οικογενειακές αξίες της εκτεταμένης αγροτικής οικογένειας

• ιεράρχιση των ρόλων του πατέρα και της μητέρας

• Αλληλοβοήθεια/σεβασμός μέσα στην οικογένεια, αμοιβαίες υποχρεώσεις των μέλων της οικογένειας

• 21 ερωτήσεις

• Χρησιμοποιήθηκε κλίμακα Likert τεσσάρων διαβαθμίσεων (1 = «διαφωνώ» έως 4 = «συμφωνώ»)

Page 28: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Παράδειγμα ανάλυσης παραγόντων

Ερωτήματα, π.χ.

«Ο πατέρας πρέπει να είναι ο αρχηγός της οικογένειας»

«Η θέση της μητέρας είναι στο σπίτι»

(ιεραρχικοί ρόλοι πατέρα-μητέρας)

«Οι γονείς πρέπει να μαθαίνουν στα παιδιά να φέρονται σωστά»

«Τα παιδιά πρέπει να διατηρούν καλές σχέσεις με τους συγγενείς»

(σχέσεις με οικογένεια-συγγενείς)

Page 29: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21

v1 1,00

v2 0,44 1,00

v3 0,25 0,33 1,00

v4 0,55 0,34 0,23 1,00

v5 0,24 0,27 0,25 0,35 1,00

v6 0,38 0,32 0,27 0,47 0,47 1,00

v7 0,19 0,18 0,19 0,25 0,28 0,28 1,00

v8 0,30 0,26 0,24 0,42 0,29 0,56 0,31 1,00

v9 0,15 0,30 0,17 0,23 0,42 0,34 0,20 0,34 1,00

v10 0,38 0,43 0,26 0,41 0,31 0,46 0,34 0,40 0,27 1,00

v11 0,12 0,01 0,05 0,06 0,00 -0,01 0,01 0,01 -0,03 0,06 1,00

v12 -0,08 -0,09 -0,01 -0,06 -0,05 -0,12 -0,08 -0,08 -0,04 -0,01 0,04 1,00

v13 0,12 0,03 0,19 0,08 0,04 0,03 0,13 0,06 0,00 0,13 0,13 0,03 1,00

v14 0,04 -0,02 0,10 0,01 0,01 0,00 0,09 0,00 -0,04 0,00 0,13 0,10 0,26 1,00

v15 0,13 0,05 0,16 0,07 -0,02 0,01 0,06 0,01 -0,10 0,04 0,13 0,13 0,24 0,38 1,00

v16 0,16 0,03 0,21 0,10 0,03 0,02 0,15 0,04 -0,05 0,13 0,16 0,20 0,30 0,37 0,45 1,00

v17 0,14 0,06 0,21 0,15 0,13 0,12 0,19 0,13 0,00 0,15 0,11 0,08 0,26 0,28 0,25 0,41 1,00

v18 0,02 -0,11 0,05 -0,04 -0,06 -0,07 0,02 -0,03 -0,10 -0,04 0,04 0,11 0,13 0,09 0,23 0,21 0,18 1,00

v19 0,14 0,04 0,20 0,13 0,09 0,04 0,20 0,11 -0,02 0,12 0,15 0,11 0,25 0,31 0,37 0,53 0,45 0,19 1,00

v20 0,21 0,07 0,20 0,17 0,11 0,10 0,13 0,14 0,00 0,11 0,12 0,09 0,28 0,26 0,27 0,36 0,43 0,18 0,50 1,00

v21 0,24 0,10 0,25 0,21 0,14 0,22 0,13 0,18 0,03 0,13 0,09 0,03 0,28 0,18 0,31 0,31 0,30 0,17 0,32 0,41 1,00

Pearson r

v1 v2 v3 v5 v6 v7 v9 v10 v11 v13 v14 v15 v17 v18 v19 v21 v22 v23 v25 v26 v27

v1 1,00

v2 0,40 1,00

v3 0,21 0,32 1,00

v5 0,51 0,34 0,23 1,00

v6 0,24 0,28 0,24 0,31 1,00

v7 0,34 0,31 0,26 0,38 0,42 1,00

v9 0,15 0,17 0,18 0,24 0,26 0,25 1,00

v10 0,26 0,28 0,26 0,34 0,28 0,52 0,29 1,00

v11 0,13 0,24 0,16 0,18 0,28 0,26 0,18 0,32 1,00

v13 0,33 0,37 0,26 0,37 0,27 0,41 0,30 0,39 0,22 1,00

v14 0,13 0,05 0,07 0,10 0,03 0,03 0,05 0,05 0,05 0,10 1,00

v15 -0,07 -0,11 -0,01 -0,05 -0,02 -0,10 -0,11 -0,10 -0,01 0,00 0,06 1,00

v17 0,10 0,02 0,16 0,07 0,04 0,04 0,09 0,04 0,02 0,09 0,15 0,04 1,00

v18 0,02 -0,02 0,09 -0,02 0,04 0,03 0,08 0,00 0,00 0,00 0,14 0,08 0,26 1,00

v19 0,15 0,09 0,15 0,11 0,05 0,06 0,08 0,04 0,01 0,09 0,14 0,12 0,23 0,34 1,00

v21 0,15 0,05 0,20 0,10 0,08 0,07 0,13 0,07 0,02 0,14 0,21 0,17 0,31 0,31 0,38 1,00

v22 0,11 0,06 0,18 0,13 0,13 0,11 0,15 0,10 0,00 0,13 0,14 0,07 0,24 0,24 0,22 0,36 1,00

v23 0,00 -0,10 0,03 -0,02 -0,05 -0,02 0,01 -0,04 -0,10 -0,03 0,06 0,09 0,13 0,09 0,19 0,19 0,17 1,00

v25 0,12 0,07 0,19 0,12 0,12 0,07 0,18 0,11 0,01 0,13 0,18 0,11 0,25 0,31 0,31 0,49 0,39 0,17 1,00

v26 0,19 0,09 0,18 0,18 0,10 0,13 0,11 0,14 0,02 0,12 0,13 0,09 0,25 0,22 0,23 0,30 0,35 0,15 0,43 1,00

v27 0,20 0,10 0,22 0,18 0,15 0,23 0,11 0,19 0,06 0,13 0,12 0,03 0,24 0,16 0,26 0,28 0,27 0,14 0,28 0,37 1,00

Kendall tau

Μετατροπή των δύο πινάκων σε Fisher z τιμές

Page 30: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Σύγκριση δεικτών Pearson r και Kendall tau, μέσω Fisher z

z-τιμή μεγαλύτερη του 1,96

Page 31: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ορολογία για ανάλυση παραγόντων

• Ιδιοτιμές (eigenvalues, διασπορά παραγόντων), γίνεται σύμπτυξη διασποράς από πίνακα συναφειών στους παράγοντες

• Οι πληροφορίες από τον πίνακα συναφειών τοποθετούνται πάνω στη διαγώνιο

• Τόσες ιδιοτιμές (παράγοντες) όσες οι μετρήσεις, αλλά δεν θα χρησιμοποιηθούν όλες (αυτές με την περισσότερη διασπορά)

• Στόχος η περιγραφή των συσχετίσεων των μεταβλητών με λίγους σε αριθμό παράγοντες

Page 32: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Βασικές εξισώσεις

• L = V΄RV

• Όπου ο πίνακας ιδιοτιμών L προκύπτει από τον πίνακα συναφειών R και τον πίνακα με τα ιδιοδιανύσματα V

• Ιδιοδιανύσματα (eigenvectors): αντιστοιχεί ένα για κάθε ιδιοτιμή, έχει στοιχεία όσα οι μετρήσεις, δείχνουν τη συσχέτιση μετρήσεων με τον παράγοντα

• � = � � ο πίνακας Α με τις φορτίσεις των μεταβλητών στους παράγοντες προκύπτει από τα ιδιοδιανύσματα επί τη ρίζα του πίνακα ιδιοτιμών

Page 33: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ιδιοτιμή % διασποράς Αθροιστικό %

1 4,599 21,898 21,898

2 3,109 14,804 36,702

3 1,123 5,346 42,048

4 1,022 4,866 46,914

5 ,988 4,704 51,618

6 ,943 4,489 56,108

7 ,876 4,170 60,278

8 ,870 4,144 64,422

9 ,848 4,039 68,460

10 ,791 3,769 72,229

11 ,724 3,448 75,677

12 ,664 3,161 78,838

13 ,649 3,089 81,927

14 ,595 2,834 84,761

15 ,580 2,764 87,525

16 ,532 2,534 90,059

17 ,500 2,379 92,438

18 ,442 2,107 94,545

19 ,420 2,000 96,545

20 ,378 1,799 98,344

21 ,348 1,656 100,000

Κύρια συνιστώσα

Αρχικές ιδιοτιμές

Cattell scree test

Page 34: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

1 2

v1 0,60 -0,23

v2 0,48 -0,39

v3 0,53 -0,04

v4 0,61 -0,34

v5 0,49 -0,38

v6 0,60 -0,48

v7 0,48 -0,15

v8 0,56 -0,39

v9 0,34 -0,46

v10 0,59 -0,35

v11 0,17 0,21

v12 0,01 0,31

v13 0,38 0,35

v14 0,31 0,48

v15 0,38 0,52

v16 0,49 0,56

v17 0,51 0,40

v18 0,13 0,40

v19 0,52 0,51

v20 0,53 0,42

v21 0,53 0,28

Φορτίσεις

Ερώτημα

Κύρια Συνιστώσα

Στην πρώτη κύρια συνιστώσα, όλες οι μετρήσεις θα πρέπει να έχουν φορτίσεις από 0,30 και πάνω, ώστε να αποτελούν ένα σύστημα (μία αξιολογική κλίμακα μέτρησης)

Τρία ερωτήματα (υπ’αριθμόν 11, 12, 18) δεν φαίνεται να ανήκουν στο ίδιο σύστημα με τις υπόλοιπες

Στο στάδιο αυτό της ανάλυσης δεν φαίνεται ξεκάθαρα ποιές μετρήσεις συσχετίζονται με ποιόν παράγοντα

Page 35: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Περιστροφή αξόνων

• Για καλύτερη ερμηνεία

• Μεγιστοποίηση υψηλών συσχετίσεων, ελαχιστοποίηση χαμηλών

• Ορθόγωνη περιστροφή – Varimax (μεγιστοποιούνται οι υψηλές φορτίσεις, ελαχιστοποιούνται οι χαμηλές, αύξηση διασποράς φορτίσεων ανά παράγοντα)

• Φαίνεται ξεκάθαρα ποιές μεταβλητές σχετίζονται με τον παράγοντα

Page 36: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

1 2

v1 0,62 0,17

v2 0,62 -0,02

v3 0,45 0,28

v5 0,69 0,10

v6 0,62 -0,01

v7 0,76 -0,03

v9 0,47 0,16

v10 0,68 0,02

v11 0,55 -0,17

v13 0,68 0,07

v14 0,02 0,27

v15 -0,17 0,25

v17 0,09 0,51

v18 -0,04 0,57

v19 -0,01 0,64

v21 0,05 0,74

v22 0,17 0,63

v23 -0,13 0,39

v25 0,11 0,72

v26 0,18 0,65

v27 0,26 0,54

Παράγοντας

1. Ο πατέρας πρέπει να είναι ο αρχηγός της οικογένειας.

2. Η θέση της μητέρας είναι στο σπίτι.

3. Η μητέρα πρέπει να ζει για τα παιδιά της.

5. Ο πατέρας πρέπει να κουμαντάρει τα χρήματα του σπιτιού.

6. Όταν ο πατέρας πεθάνει, ο γιος πρέπει να παντρέψει την αδελφή του.

7. Η μητέρα πρέπει να δέχεται τις αποφάσεις του πατέρα.

9. Ο πατέρας πρέπει να δίνει προίκα στην κόρη του.

10. Η μητέρα πρέπει να συμφωνεί με τη γνώμη του πατέρα σε ό,τι αφορά τα παιδιά.

11. Η μητέρα πρέπει να ψηφίζει ό,τι ψηφίζει ο πατέρας.

13. Ο πατέρας πρέπει να είναι ο χρηματοδότης της οικογένειας.

14. Οι γονείς δεν πρέπει να μαλώνουν μπροστά στα παιδιά.

15. Η μόρφωση και η επαγγελματική κατάρτιση αποτελούν την καλύτερη προίκα για τη γυναίκα.

17. Τα προβλήματα της οικογένειας λύνονται μέσα στην οικογένεια.

18. Πρέπει να είμαστε φιλότιμοι.

19. Οι γονείς πρέπει να μαθαίνουν στα παιδιά να φέρονται σωστά.

21. Πρέπει να τιμούμε και να προστατεύουμε την οικογένειά μας.

22. Τα παιδιά έχουν την υποχρέωση να φροντίζουν τους γονείς όταν γεράσουν.

23. Τα παιδιά πρέπει να βοηθούν στις δουλειές του σπιτιού.

25. Τα παιδιά πρέπει να σέβονται τους παππούδες τους.

26. Τα παιδιά πρέπει να διατηρούν καλές σχέσεις με τους συγγενείς.

27. Τα παιδιά πρέπει να υπακούουν τους γονείς τους.

Page 37: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Περιστροφή αξόνων

• Πλάγια περιστροφή (oblique rotation)

• Οι παράγοντες έχουν συσχέτιση μεταξύ τους

• Pattern matrix (μοναδικές συσχετίσεις μεταβλητής-παράγοντα, χωρίς κοινή διασπορά παραγόντων)

• Structure matrix (συσχετίσεις μεταβλητών-παραγόντων όπου συμπεριλαμβάνεται η κοινή διακύμανση των παραγόντων, πιο δύσκολη η ερμηνεία)

Page 38: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Παράγοντας 1

Μέτρηση 1Παράγοντας 2

Page 39: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

1 2

v1 0,61 0,14

v2 0,62 -0,05

v3 0,44 0,26

v5 0,69 0,06

v6 0,63 -0,04

v7 0,77 -0,06

v9 0,47 0,14

v10 0,68 -0,01

v11 0,56 -0,19

v13 0,68 0,04

v14 0,00 0,27

v15 -0,19 0,26

v17 0,07 0,50

v18 -0,07 0,57

v19 -0,04 0,65

v21 0,02 0,74

v22 0,14 0,62

v23 -0,15 0,40

v25 0,08 0,72

v26 0,14 0,64

v27 0,24 0,53

Πλάγια περιστροφή (Pattern)

Παράγοντας

1 2

v1 0,63 0,20

v2 0,62 0,01

v3 0,46 0,30

v5 0,69 0,13

v6 0,62 0,02

v7 0,76 0,01

v9 0,48 0,18

v10 0,68 0,05

v11 0,54 -0,14

v13 0,68 0,11

v14 0,03 0,27

v15 -0,16 0,24

v17 0,12 0,51

v18 -0,01 0,56

v19 0,02 0,64

v21 0,09 0,74

v22 0,20 0,63

v23 -0,11 0,39

v25 0,15 0,73

v26 0,21 0,66

v27 0,29 0,55

Πλάγια περιστροφή (Structure)

Παράγοντας

Συνάφεια παραγόντων 0,097

Page 40: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

1 2 1 2 1 2

1. Αισθάνομαι ήρεμος -0,42 0,56 -0,30 0,49 -0,55 0,65

2. Αισθάνομαι ασφαλής -0,26 0,55 -0,13 0,54 -0,40 0,60

3. Νιώθω μια εσωτερική ένταση 0,64 -0,36 0,61 -0,21 0,71 -0,51

4. Έχω αγωνία 0,68 -0,27 0,68 -0,09 0,73 -0,43

5. Αισθάνομαι άνετα -0,27 0,70 -0,09 0,70 -0,44 0,74

6. Αισθάνομαι αναστατωμένος 0,71 -0,33 0,70 -0,15 0,78 -0,50

7. Ανησυχώ αυτή τη στιγμή για ενδεχόμενες ατυχίες 0,56 -0,33 0,52 -0,20 0,63 -0,47

8. Αισθάνομαι αναπαυμένος -0,20 0,59 -0,04 0,60 -0,34 0,62

9. Αισθάνομαι άγχος 0,63 -0,33 0,61 -0,18 0,70 -0,49

10. Αισθάνομαι βολικά -0,20 0,71 -0,01 0,73 -0,38 0,74

11. Αισθάνομαι αυτοπεποίθηση -0,07 0,60 0,10 0,65 -0,23 0,60

12. Αισθάνομαι νευρικότητα 0,70 -0,32 0,69 -0,14 0,76 -0,49

13. Αισθάνομαι ήσυχος -0,41 0,58 -0,28 0,53 -0,55 0,67

14. Βρίσκομαι σε διέγερση 0,71 0,03 0,80 0,24 0,68 -0,16

15. Είμαι χαλαρωμένος -0,34 0,64 -0,18 0,62 -0,49 0,71

16. Αισθάνομαι ικανοποιημένος -0,14 0,72 0,06 0,77 -0,32 0,73

17. Ανησυχώ 0,65 -0,38 0,61 -0,23 0,73 -0,54

18. Αισθάνομαι έξαψη και ταραχή 0,73 -0,27 0,74 -0,08 0,78 -0,45

19. Αισθάνομαι υπερένταση 0,77 -0,04 0,85 0,19 0,75 -0,24

20. Αισθάνομαι ευχάριστα -0,15 0,78 0,07 0,83 -0,35 0,80

Παράγοντας

Πλάγια περιστροφή (Pattern) Πλάγια περιστροφή (Structure)

Παράγοντας

Ορθόγωνη περιστροφή

Ερώτημα

Παράγοντας

Συνάφεια παραγόντων -0,50

Page 41: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών
Page 42: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών
Page 43: Ανάλυση παραγόντων...Ανάλυση παραγόντων (factor analysis) Χρησιμοποιείται στη δημιουργία αντικειμενικών

Ανεύρεση παραγόντων (factor extraction)• Principal components: μέγιστη διασπορά από τα δεδομένα με κάθε κύρια

συνιστώσα, η πρώτη μεγιστοποιεί τη διασπορά των αντίστοιχων παραγοντικών τιμών, η δεύτερη έχει τη μέγιστη διασπορά αφού αφαιρεθεί η διασπορά της πρώτης

• Principal factors: μέγιστη διασπορά από τα δεδομένα με κάθε παράγοντα, αλλά από την κοινή διασπορά των ερωτημάτων (εκτιμάται με βάση την πολλαπλή συσχέτιση κάθε ερωτήματος με τα υπόλοιπα)

• Maximum likelihood: εκτίμηση φορτίσεων για τον πληθυσμό, έτσι ώστε να μεγιστοποιείται η πιθανότητα να ληφθεί ο πίνακας συναφειών από τον πληθυσμό αυτόν

• Alpha factoring: μεγιστοποίηση αξιοπιστίας παραγόντων, ποιοί παράγοντες τείνουν να επανεμφανίζονται όταν ληφθούν δείγματα μεταβλητών από έναν πληθυσμό μεταβλητών