Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία...

13
Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα. Γκούμας Στράτος. Πτυχιούχος Οικονομολόγος. MSc ‘Εφαρμοσμένη Οικονομική και Χρηματοοικονομική (Ε.Κ.Π.Α./ Τμήμα Οικονομικών)’ e-mail: [email protected], My Blog 29/1/2011 ΕΙΣΑΓΩΓΗ Τα μαθηματικά είναι επιστημονικός κλάδος όπου οι εφαρμογές τους αποτελούν αναπόσπαστο τμήμα σε πλήθος άλλων επιστημών και αντιμετώπισης ζητημάτων, όπως η έρευνα, η διοίκηση, η οικονομία, η αστρονομία, η φυσική κτλ. Στην εργασία αυτή θα ασχοληθούμε με ένα τμήμα των μαθηματικών όπου αφορά την ποσοτικοποίηση των οικονομικών μεγεθών. Το αντικείμενο αυτό ονομάζεται οικονομετρία και εφαρμόζεται σε πληθώρα οικονομικών ζητημάτων, επιχειρησιακής ερευνάς και διοίκησης. Η οικονομετρία προσπαθεί να δώσει υπόσταση και να αναπτύξει τις σχέσεις της οικονομικής θεωρίας. Η μαθηματική, στατιστική και οικονομική ανάλυση συνδυάζονται με σκοπό την εκτίμηση των οικονομικών σχέσεων. Όπως γνωρίζουμε, όλες οι επιστήμες διέπονται από θεωρίες, ωστόσο μια θεωρία, δεν μπορεί να σταθεί αν δεν υπάρξει η επαλήθευσή της και ο έλεγχος. Σκοποί της οικονομετρίας είναι οι εξής 1 . 1) Εμπειρική επαλήθευση ή έλεγχος μιας θεωρίας. 2) Άσκηση οικονομικής πολίτικης 3) Πρόβλεψη οικονομικών μεγεθών. Τα στάδια της οικονομετρικής αναλύσεως συνοψίζονται κατά σειρά στα εξής: Στάδιο 1- Οικονομική Θεωρία. Στάδιο 2- Οικονομικό υπόδειγμα. Στάδιο 3- Οικονομετρικό υπόδειγμα. Στάδιο 4- Εκτίμηση του υποδείγματος (Δεδομένα και Οικονομετρικές Μέθοδοι). Στάδιο 5- Έλεγχος υποδείγματος. Στάδιο 6- Χρήση υποδείγματος (Προβλέψεις, Οικονομική Πολιτική, Έλεγχος Θεωρίας). 1 1 Βλ. ‘’Εισαγωγή στην Οικονομετρία’’ Γ.Κ. Χρήστου

description

Στην εργασία αυτή θα μελετήσουμε και θα παρουσιάσουμε την πολλαπλή γραμμική παλινδρόμηση, η οποία αποτελεί μια από της βασικές μεθόδους εκτίμησης στην οικονομετρία. Η πολλαπλή παλινδρόμηση αποτελεί μια σχέση/ εξάρτηση μεταξύ πολλών μεταβλητών. Δεν θα σταθούμε τόσο στην ανάπτυξη της θεωρίας και την θεμελίωση των μαθηματικών τεχνικών όσο στην παρουσίαση της μεθόδου υπολογισμού και εκτίμησης των σχέσεων. Αυτό που θα χρειαστούμε είναι το excel 2003 (ή 2007) και ένα βιβλίο οικονομετρίας στο οποίο θα μπορούμε να ανατρέξουμε για την ορθή τεκμηρίωση των αποτελεσμάτ

Transcript of Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία...

Page 1: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

Γκούμας Στράτος. Πτυχιούχος Οικονομολόγος.

MSc ‘Εφαρμοσμένη Οικονομική και Χρηματοοικονομική (Ε.Κ.Π.Α./ Τμήμα Οικονομικών)’

e-mail: [email protected], My Blog

29/1/2011

ΕΙΣΑΓΩΓΗ Τα μαθηματικά είναι επιστημονικός κλάδος όπου οι εφαρμογές τους αποτελούν

αναπόσπαστο τμήμα σε πλήθος άλλων επιστημών και αντιμετώπισης ζητημάτων,

όπως η έρευνα, η διοίκηση, η οικονομία, η αστρονομία, η φυσική κτλ.

Στην εργασία αυτή θα ασχοληθούμε με ένα τμήμα των μαθηματικών όπου αφορά

την ποσοτικοποίηση των οικονομικών μεγεθών. Το αντικείμενο αυτό ονομάζεται

οικονομετρία και εφαρμόζεται σε πληθώρα οικονομικών ζητημάτων, επιχειρησιακής

ερευνάς και διοίκησης. Η οικονομετρία προσπαθεί να δώσει υπόσταση και να

αναπτύξει τις σχέσεις της οικονομικής θεωρίας. Η μαθηματική, στατιστική και

οικονομική ανάλυση συνδυάζονται με σκοπό την εκτίμηση των οικονομικών

σχέσεων. Όπως γνωρίζουμε, όλες οι επιστήμες διέπονται από θεωρίες, ωστόσο μια

θεωρία, δεν μπορεί να σταθεί αν δεν υπάρξει η επαλήθευσή της και ο έλεγχος.

Σκοποί της οικονομετρίας είναι οι εξής1. 1) Εμπειρική επαλήθευση ή έλεγχος μιας

θεωρίας. 2) Άσκηση οικονομικής πολίτικης 3) Πρόβλεψη οικονομικών μεγεθών. Τα

στάδια της οικονομετρικής αναλύσεως συνοψίζονται κατά σειρά στα εξής:

Στάδιο 1- Οικονομική Θεωρία.

Στάδιο 2- Οικονομικό υπόδειγμα.

Στάδιο 3- Οικονομετρικό υπόδειγμα.

Στάδιο 4- Εκτίμηση του υποδείγματος (Δεδομένα και Οικονομετρικές Μέθοδοι).

Στάδιο 5- Έλεγχος υποδείγματος.

Στάδιο 6- Χρήση υποδείγματος (Προβλέψεις, Οικονομική Πολιτική, Έλεγχος

Θεωρίας).

1

1 Βλ. ‘’Εισαγωγή στην Οικονομετρία’’ Γ.Κ. Χρήστου

Page 2: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

2

ΠΕΡΙΛΗΨΗ Στην εργασία αυτή θα μελετήσουμε και θα παρουσιάσουμε την πολλαπλή

γραμμική παλινδρόμηση, η οποία αποτελεί μια από της βασικές μεθόδους εκτίμησης

στην οικονομετρία. Η πολλαπλή παλινδρόμηση αποτελεί μια σχέση/ εξάρτηση

μεταξύ πολλών μεταβλητών. Δεν θα σταθούμε τόσο στην ανάπτυξη της θεωρίας και

την θεμελίωση των μαθηματικών τεχνικών όσο στην παρουσίαση της μεθόδου

υπολογισμού και εκτίμησης των σχέσεων. Αυτό που θα χρειαστούμε είναι το excel

2003 (ή 2007) και ένα βιβλίο οικονομετρίας στο οποίο θα μπορούμε να ανατρέξουμε

για την ορθή τεκμηρίωση των αποτελεσμάτων μας.

Έχουμε επιλέξει τρεις χρηματιστηριακούς δείκτες, FTSE-100 (Αγγλία), Dow-

Jones (ΗΠΑ) και Xerta-DAX (Γερμανία) και υπολογίσαμε την μέση εβδομαδιαία

απόδοση για το διάστημα 1/1/2009 έως 1/12/2010. Θα επιχειρήσουμε να εξετάσουμε

την επίδραση στο χρηματιστήριο της Γερμανίας από τα άλλα δυο χρηματιστήρια.

Με τη χρήση του excel θα εκτιμήσουμε ένα πολλαπλό γραμμικό υπόδειγμα της

μορφής Yt= b0+b1*X1t+b2*X2t+ut.

Όπου Υ Απόδοση Γερμανίας, Χ1 Απόδοση Αγγλίας και Χ2 Απόδοση ΗΠΑ.

(Σημ: Υ εξαρτημένη μεταβλητή. Χ1,Χ2 ανεξάρτητες-ερμηνευτικές μεταβλητές)

ΣΧΟΛΙΑ

Οι λόγοι οι οποίοι επιλέξαμε τις μέσες εβδομαδιαίες αποδόσεις είναι οι εξής:

1) Επειδή τα χρηματιστήρια που επιλέξαμε δεν κλείνουν την ίδια ώρα, θα είχαμε

σοβαρό και ουσιαστικό πρόβλημα για τον προσδιορισμό των τιμών και των

αποδόσεων. Για να λάβουμε τις ημερήσιες τιμές θα πρέπει να χρηματιστήρια να

κλείνουν την ίδια ή περίπου την ίδια ώρα. Στην περίπτωσή μας, οι αγορές που

επιλέχθηκαν έχουν μεγάλη διαφορά στην ώρα κλεισίματος, οπότε δεν είναι ούτε

εφικτό ούτε ευνόητο να χρησιμοποιήσουμε τις ημερήσιες τιμές κλεισίματος.

2) Στις ημερήσιες χρηματιστηριακές τιμές παρουσιάζεται έντονη διακύμανση, ως εκ

τούτου τα γραμμικά μοντέλα δεν είναι κατάλληλα για την εκτίμηση των δεδομένων,

διότι δεν έχουν την δυνατότητα να ‘’συλλάβουν’’ αυτή την έντονη μεταβλητότητα.

Έχει αποδειχτεί από αναλυτές-ερευνητές ότι τα οικονομετρικά γραμμικά μοντέλα με

χρήση ημερήσιων τιμών αποτυγχάνουν τόσο στην εκτίμηση των ερμηνευτικών

μεταβλητών όσο και στις προβλέψεις,. Ωστόσο, ένα γραμμικό μοντέλο μπορεί να

αποδειχτεί χρήσιμο όταν λαμβάνουμε λιγότερο συχνές παρατηρήσεις (π.χ.

Page 3: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

3

εβδομαδιαίες, μηνιαίες), η εκτίμηση του οποίου θα μας εξηγήσει την γενικότερη

πορεία της αγοράς.

Αντιθέτως, οι ημερήσιες τιμές προσφέρονται για τεχνική ανάλυση (technical

analysis), με την οποία έχουμε την δυνατότητα να προβλέψουμε την εξέλιξη ενός

δείκτη/ μιας μετοχής για πολύ βραχυχρόνιο και βραχυχρόνιο ορίζοντα. Στις μεθόδους

τεχνικής ανάλυσης συγκαταλέγονται τα εξής: 1) Κινητοί Μέσοι Όροι (Moving

Average), Τάση (Trend), Ζώνες Bollinger (Bollinger Bands), Ταλαντωτές

(Oscillators), Όγκος Συναλλαγών (Volume), Δείκτης Σύγκλισης-Απόκλισης

(MACD), Σχηματισμοί (Patterns) κτλ.

ΘΕΩΡΙΑ Αρχικά θα αναφερθούμε στην απλή γραμμική παλινδρόμηση η οποία αποτελεί

σχέση μεταξύ δυο μεταβλητών. Σκοπός μας είναι να αναπτύξουμε το βασικό

θεωρητικό υπόβαθρο και να παρουσιάσουμε μερικά παράδειγμα με τη χρήση του

excel. Για περεταίρω ανάλυση σε θεωρητική βάση, ο αναγνώστης μπορεί να

συμβουλευτεί κάποιο βιβλίο οικονομετρίας.

1) Απλή Γραμμική Παλινδρόμηση: Yt=a+b*Xt+ut.

X Ανεξάρτητη μεταβλητή, Υ Εξαρτημένη μεταβλητή, u Κατάλοιπα (σφάλμα).

Παράδειγμα: Έστω ότι θέλουμε να εξετάσουμε την επίδραση του Επιτοκίου (r) στην

Προσφορά Χρήματος (Μ). Αφού λάβουμε τις τιμές σχηματίζουμε το υπόδειγμα

Mt=a+b*rt+ut. Με κατάλληλες μεθόδους (π.χ. μέθοδο ελάχιστων τετραγώνων OLS)

εκτιμούμε τους συντελεστές a,b. Όπως είναι φυσικό τα ζεύγη τιμών (Χ,Υ) δεν θα

ταυτίζονται επακριβώς με την γραμμή της παλινδρόμησης (μερικές τιμές θα είναι

πάνω στην γραμμή, ενώ μερικές άλλες θα είναι εκτός της γραμμής 2), με αποτέλεσμα

να υπάρχει πάντοτε σφάλμα (u).

2) Πολλαπλή Γραμμική Παλινδρόμηση:Yt=b0+b1*X1t+b2*X2t+b3*X3t+.+ bn*Xnt+ut.

Xi Ανεξάρτητες (ερμηνευτικές) μεταβλητές, Υ Εξαρτημένη μεταβλητή,

u Κατάλοιπα (σφάλμα).

2 Βλέπε παρακάτω, Γράφημα 1

Page 4: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

4

Παράδειγμα: Έστω ότι θέλουμε να εκτιμήσουμε την επίδραση στην τιμή (Ρ) ενός

προϊόντος από τους Μισθούς (I) και το Κόστος Πρώτων Υλών (C). Αν υποθέσουμε

ότι υπάρχει γραμμική σχέση μεταξύ αυτών των μεταβλητών, τo υπόδειγμα θα έχει

την εξής μορφή: Ρt= b0+b1*Ιt+b2*Ct +ut.

Βασικό συστατικό για να λάβουμε ορθές εκτιμήσεις είναι τα κατάλοιπα να

ακολουθούν την κανονική κατανομή, με μέσο μηδέν και σταθερή διακύμανση

u~N(0,σ2), να μην συσχετίζονται (δηλαδή το ut να μην εμφανίζει σχέση με το us άρα

E(utus)=0 για t≠s) καθώς επίσης να μην υπάρχουν ακριβείς γραμμικές σχέσεις

(συγγραμικότητα) μεταξύ των ερμηνευτικών μεταβλητών (Xi). Ωστόσο, επειδή στην

πράξη οι υποθέσεις αυτές συμβαίνουν σπάνια, αν τα κατάλοιπα ακολουθούν μια

κατανομή που να προσεγγίζει ικανοποιητικά την κανονική κατανομή, υποθέτουμε ότι

η κατανομή είναι η κανονική συνεχίζοντας την διαδικασία και στο τέλος

διορθώνουμε τους συντελεστές μας. Στην περίπτωση που τα κατάλοιπα ακολουθούν

μια κατανομή η οποία δεν είναι η κανονική ούτε την προσεγγίζει, τότε καταφεύγουμε

σε άλλες τεχνικές ανάλυσης. Όσο αφορά την γραμμική σχέση μεταξύ των

ερμηνευτικών μεταβλητών προσπαθούμε να ελέγξουμε για την ύπαρξη έντονης

συσχέτισης μεταξύ τους. Η ύπαρξη γραμμικών σχέσεων, θα οδηγήσει σε λανθασμένα

αποτελέσματα, συνεπώς οφείλουμε να αναδιαρθρώσουμε το μοντέλο μας.

ΓΡΑΦΙΚΗ ΑΠΕΙΚΟΝΙΣΗ ΑΠΛΗΣ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ME TO EXCEL 2003 3.

Στο παρακάτω γράφημα (Γράφημα 1) έχουμε απεικονίσει την απλή γραμμική

παλινδρόμηση Yt=a+b*Xt+ut. Η κατασκευή του γραφήματος στο excel 2003 έγινε ως

εξής

Αρχικά εισάγουμε τα δεδομένα μας στο φύλλο excel.

Από το Μενού Εισαγωγή Γράφημα Διασπορά (ΧΥ)4. Στο παράθυρο που

εμφανίζεται εισάγουμε τα δεδομένα μας στην ‘’Περιοχή Δεδομένων‘’. Πατώντας

‘’Επόμενο….’’ κατασκευάζουμε το διάγραμμα διασποράς των ζευγών (Χ,Υ). Εν

συνεχεία θα προσθέσουμε στο γράφημα την γραμμή παλινδρόμησης.

Επιλέγοντας τα σημεία (Χ,Υ) του γραφήματος και με δεξί κλικ εμφανίζεται ένα νέο

παράθυρο. Επιλεγούμε το ‘’Προσθήκη Γραμμής Τάσης’’. Στην καρτέλα ‘’Τύπος’’ ,

3 Βλ. Φύλλο ‘’rates’’ του excel. 4 Επιλεγούμε το πρώτο γράφημα που έχει μόνο τα σημεία

Page 5: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

επιλεγούμε ‘’Γραμμικός’’ ενώ στην καρτέλα ‘’Επιλογές’’ επιλεγούμε τα ‘’Προβολή

εξίσωσης στο γράφημα’’ και ‘’Προβολή τιμής R-τετράγωνο’’

ΓΡΑΦΗΜΑ 1.

y = 0,7041x + 0,0003R2 = 0,8169

-0,08

-0,06

-0,04

-0,02

0

0,02

0,04

0,06

-0,1 -0,05 0 0,05 0,1

X

Y Σειρά1Γραμμική (Σειρά1)

Από το γράφημα παρατηρούμε ότι τα πραγματικά δεδομένα δεν ταυτίζονται

επακριβώς με την γραμμή παλινδρόμησης, ωστόσο η προσέγγιση επιτυγχάνεται σε

ικανοποιητικό βαθμό.

Η γραμμή η οποία διέρχεται από τα ζεύγη τιμών (Χ,Υ) ονομάζεται γραμμή

παλινδρόμησης (regression line). Το ερώτημα που ανακύπτει είναι αν αυτή η γραμμή

είναι η βέλτιστη ή θα μπορούσαν να υπάρξουν και επιπλέον γραμμές οι οποίες θα

ερμήνευαν ικανοποιητικά τα δεδομένα μας.

Η ιδιότητα η οποία διέπει την απλή γραμμική παλινδρόμηση είναι ότι η τεχνική

που συνηθίζεται να χρησιμοποιείται είναι η μέθοδος ελάχιστων τετραγώνων (OLS), η

οποία αναπτύχτηκε από τους Gauss-Markov και ελαχιστοποιεί το άθροισμα των

τετραγώνων των καταλοίπων (SSE). Ελάχιστο άθροισμα καταλοίπων συνεπάγεται

καλύτερη ερμηνευτικότητα στο υπόδειγμα. Συμπεραίνουμε λοιπόν ότι η γραμμική

αυτή σχέση, με την μέθοδο OLS, είναι η καλύτερη που θα μπορούσε να εξευρεθεί.

Εναλλακτικές μέθοδοι οι οποίες χρησιμοποιήθηκαν μετέπειτα και βασιστήκαν στην

OLS είναι η γενικευμένη μέθοδος ελάχιστων τετραγώνων (GLS), η μέθοδος μέγιστης

πιθανοφάνειας (Maximum Likelihood), η ραχοειδής παλινδρόμησης (Ridge

Regression), η σταθμική μέθοδος ελαχίστων τετραγώνων (Weighted Least Square)

κ.α.

5

Page 6: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

Τελειώνοντας, να αναφέρουμε ότι εκτός των γραμμικών τεχνικών υπάρχουν

βεβαίως και οι μη-γραμμικές τεχνικές, με τις οποίες δεν θα ασχοληθούμε στην

παρούσα ενότητα, όπως η μη γραμμική μέθοδος ελαχίστων τετραγώνων, η

μαθηματική βελτιστοποίηση, η μη-παραμετρική παλινδρόμηση, ο τετραγωνικός

προγραμματισμός κ.α.

ΠΑΛΙΝΔΡΟΜΗΣΗ ΜΕ EXCEL (Για να κατεβάσετε το αρχείο excel πιεστέ εδώ)

Στο αρχείο excel έχουμε τρία φύλλα εργασίας. (rates, regression,stats)

Η διαδικασία της παλινδρόμησης στο excel 2003 έχει ως εξής (με παρόμοιο τρόπο

γίνεται και στο excel 2007)

--------ΣΤΑΔΙΟ Α (Φύλλο excel ‘’rates’’)

1) Εισαγωγή δεδομένων (Φύλλο ‘’rates’’). Στην πρώτη γραμμή έχουμε τις κεφαλίδες

των σειρών.

2) Από το μενού ‘’Εργαλεία’’ ‘’Πρόσθετα’’ Επιλογή το ‘’Πακέτο Εργαλείων

Ανάλυσης’’. Προσθέσαμε ένα νέο πακέτο εργαλείων.

3) Από το μενού ‘’Εργαλεία’’ ‘’Ανάλυση Δεδομένων’’ Επιλογή την

‘’Παλινδρόμηση’’.

4) Στο παράθυρο της παλινδρόμησης που εμφανίζεται εισάγουμε τα εξής:

(Προσοχή! Στην πρώτη γραμμή έχουμε τις κεφαλίδες των σειρών)

α) Περιοχή Εισόδου Υ Επιλεγούμε την περιοχή κελίων με τα δεδομένα του

δείκτης της Γερμανίας (Α1:A99).

β) Περιοχή Εισόδου Χ Επιλεγούμε τα δεδομένα των δεικτών της Αγγλίας και των

ΗΠΑ (B1:C99).

γ) Επιλεγούμε επίσης τα ‘’Ετικέτες’’ και ‘’Βαθμός Εμπιστοσύνης 95%’’.

δ) Επιλεγούμε το ‘’Νέο Φύλλο Εργασίας’’ και το ‘’Υπόλοιπα’’.

Με την επιλογή ‘’Υπόλοιπα’’ θα εκτιμήσουμε τα σφάλματα (u) της παλίνδρομης,

όπου , τα οποία παρουσιάζονται στην περιοχή ‘’Έξοδος Υπολοίπων/ Φύλλο ∧

−= YYu

excel regression’’. 6

Page 7: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

7

Πατάμε το ΟΚ και σε ένα νέο φύλλο εργασίας (Φύλλο ‘’regression’’) υπολογίζονται

τα στοιχεία της παλινδρόμησης τα οποία παρουσιάζονται στους παρακάτω πίνακες.

(βλ. Πίνακες 1,2,3)

--------ΣΤΑΔΙΟ Β (Φύλλο excel ‘’regression’’)

Από τα δεδομένα των Υπολοίπων (Έξοδος Υπολοίπων) θα κατασκευάσουμε ένα

τυπικό γράφημα της κατανομής που ακολουθούν.

1) Από το μενού ‘’Εργαλεία’’ ’’Ανάλυση Δεδομένων’’ Επιλέγω το

‘’Ιστόγραμμα’’. (βλ. παρακάτω, Γράφημα 2)

2) Στην ‘’Περιοχή Εισόδου’’, εισάγω τα δεδομένα των υπολοίπων (Φύλλο excel

‘’regression’’/ C50:C147). Επιλέγω επίσης και το ‘’Ετικέτες’’.

3) Στην ‘’Περιοχή Εξόδου’’, επιλέγω μια κενή περιοχή κελιών (έστω 4x4).

Επιλεγώ επίσης τα ‘’Αθροιστική Σχετική Συχνότητα’’ και το ‘’Έξοδος

Γραφήματος’’.

Πατάμε ΟΚ και κατασκευάζουμε το διάγραμμα κατανομής των υπολοίπων, το οποίο

παρατηρούμε ότι προσεγγίζει την κανονική κατανομή (βλ. Γράφημα ‘’Ιστόγραμμα’’/

Φύλλο excel ‘’regression’’).

Τέλος από το μενού ’’Εισαγωγή’’ ‘’Γράφημα (γραμμές)’’. Πιέζουμε το

‘’Επόμενο’’ και στην ‘’Περιοχή Δεδομένων’’ επιλέγω τα δεδομένα των υπολοίπων

(Φύλλο ‘’regression’’/ C50:C147) και το ‘’Σειρά σε Στήλες’’. Πατώντας

‘’Επόμενο…’’ φτάνω μέχρι το τέλος και κατασκευάζω το γράφημα των υπολοίπων

(βλ. ‘’Γράφημα Υπολοίπων’’/ Φύλλο excel ‘’regression’’).

.

Page 8: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

8

----ΣΤΑΔΙΟ Γ (Φύλλο excel ‘’stats’’). Περιγραφικά στατιστικά των δεδομένων μας.

1) Από το μενού ‘’Εργαλεία’’ ’’Ανάλυση Δεδομένων’’ Επιλέγω το

‘’Περιγραφικά Στατιστικά’’.

2) Στην ‘’Περιοχή Εισόδου’’ επιλέγω τα δεδομένα των υπολοίπων (‘’Φύλλο

regression’’/ C50:C147), καθώς επίσης και το ‘’Νέο Φύλλο’’, ‘’Περιληπτικά

Στατιστικά’’.

3) Πιέζοντας το ΟΚ, εμφανίζονται τα περιγραφικά στατιστικά του Φύλλου ‘’stats’’.

Η ιδία διαδικασία ισχύει για την εύρεση των περιγραφικών στατιστικών των

αποδόσεων των δεικτών (Φύλλο ‘’rates’’/ Α2:A99, B2:B99, C2:C99).

Στο φύλλο excel ‘’stats’’ έχουμε υπολογίσει τα περιγραφικά στατιστικά (μέση τιμή,

διακύμανση, κύρτωση κτλ) τόσο των δεικτών όσο και των σφαλμάτων.

ΦΥΛΛΟ EXCEL ‘’regression’’ (Ανάλυση Παλινδρόμησης)

Στον πρώτο πίνακα παρουσιάζονται τα γενικά στατιστικά της παλινδρόμησης, στον

δεύτερο η ανάλυση διακύμανσης, ενώ στον τρίτο τα στατιστικά των συντελεστών.

ΠΙΝΑΚΑΣ 1. (ΣΤΑΤΙΣΤΙΚΑ ΠΑΛΙΝΔΡΟΜΗΣΗΣ)

Στατιστικά παλινδρόμησης Πολλαπλό R 0,903435424R Τετράγωνο 0,816195565Προσαρμοσμένο R Τετράγωνο 0,812325998Τυπικό σφάλμα 0,012336364Μέγεθος δείγματος 98

Page 9: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

ΠΙΝΑΚΑΣ 2. (ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ)

βαθμοί ελευθερίας SS MS F Σημαντικότητα FΠαλινδρόμηση 2 0,064200174 0,032100087 210,9268438 1,14001E-35Υπόλοιπο 95 0,014457659 0,000152186 Σύνολο 97 0,078657833

ΠΙΝΑΚΑΣ 3. (ΣΥΝΤΕΛΕΣΤΕΣ)

Συντελεστές Τυπικό σφάλμα t τιμή-P

Κατώτερο 95%

Υψηλότερο 95%

Κατώτερο 95,0%

Υψηλότερο 95,0%

Τεταγμένη επί την αρχή (b0) 0,000767503 0,001251986 0,61302813 0,5413226 -0,001718 0,00325301 -0,001718 0,00325301FTSE-100 (b1) 0,622396658 0,125692912 4,9517244 3,188E-06 0,3728647 0,87192863 0,372865 0,87192863Dow Jones (b2) 0,492589505 0,125888417 3,91290571 0,0001713 0,2426694 0,74250961 0,242669 0,74250961

ΚΑΤΑΝΟΜΗ ΚΑΤΑΛΟΙΠΩΝ

ΓΡΑΦΗΜΑ 2.

9

Page 10: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

ΣΤΑΤΙΣΤΙΚΟΙ ΕΛΕΓΧΟΙ: t-stat, F-stat, Jarque-Bera. (Φύλλο excel ‘regression’)

Από την οικονομετρία γνωρίζουμε μερικούς ελέγχους τους οποίους διεξάγουμε για

να αποφανθούμε για την στατιστική σημαντικότητα τόσο των συντελεστών όσο και

της παλινδρόμησης.

Η παλινδρόμηση, όπως ήδη έχουμε αναφέρει, έχει την μορφή

Yt=b0+b1*X1t+b2*X2t. Στον ‘’Πίνακα 3/ Στήλη Συντελεστές’’ (βλ. παραπάνω),

έχουν εκτιμηθεί οι συντελεστές της παλινδρόμησης, οπότε καταλήγουμε στην μορφή

Yt=0,00076+0,622*X1t+0,492*X2t. (Δεν έχουμε γράψει τα τελευταία δεκαδικά ψηφιά

για λόγους κομψότητας….).

Όλοι οι έλεγχοι έγιναν σε επίπεδο σημαντικότητας α=5%. Το μέγεθος του

δείγματος είναι Τ=98 παρατηρήσεις, ενώ ο αριθμός των συντελεστών του

υποδείγματός μας είναι k=2 (b1, b2). Οι έλεγχοι που έχουμε διενεργήσει είναι οι εξής:

(Στο αρχείο excel παρουσιάζεται η διαδικασία αναλυτικά, με τις αντίστοιχες

συναρτήσεις)

1) Έλεγχος σημαντικότητας των συντελεστών (t-statistic).

H0: bi=0

H1: bi<>0

Aν > | τότε απορρίπτω την H0, άρα ο συντελεστής

είναι στατιστικά σημαντικός.

| 1,2/| −− kTat)(| ibstatistict −

Για την τιμή t-statistic των συντελεστών θα ανατρέξουμε στον Πίνακα 3/ Στήλη t

2) Έλεγχος σημαντικότητας της παλινδρόμησης (F-statistic).

H0: Παλινδρόμηση μη σημαντική

H1: Παλινδρόμηση σημαντική

Aν > τότε απορρίπτω την H0, άρα η

παλινδρόμηση είναι στατιστικά σημαντική.

)(regressionstatisticF − 1,, −− kTkaF

Για την τιμή F-statistic της παλινδρόμησης θα ανατρέξουμε στον Πίνακα 2/

Στήλη F.

10

Page 11: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

3) Έλεγχος κανονικότητας διαταρακτικού όρου (X2).

H0: u~N(0,σ2)

H1: u<>N(0,σ2)

Aν 5statisticBeraJarque _− > τότε απορρίπτω την H0, άρα τα κατάλοιπα δεν

ακολουθούν την κανονική κατανομή.

22,aX

Οι συναρτήσεις του excel που έχουμε χρησιμοποιήσει για τις κρίσιμες τιμές των

στατιστικών ελέγχων είναι οι κάτωθι.

1) TINV 1,2/ −− kTat

2) FIVN 1 ,, −− kTkaF

3) CHIINV 2 ,TaX

ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ

(βλ. παραπάνω Πίνακες 1,2,3 και Φύλλο excel ‘’regression’’)

Το κυριότερο που μας ενδιαφέρει από τα στοιχεία της παλινδρόμησης

Yt=b0+b1*X1t+b2*X2t. είναι η στατιστική σημαντικότητά της (F-statistic), η

σημαντικότητα των συντελεστών (t-statistic) καθώς και ο συντελεστής

προσδιορισμού R2. Το R2 δείχνει το βαθμό προσαρμογής της γραμμής της

παλινδρόμησης στα δεδομένα μας. Οι τιμές που λαμβάνει είναι στο διάστημα (0,1).

Όσο πλησιάζουμε προς την μονάδα τόσο καλύτερη είναι η παλινδρόμηση.

Στην περίπτωσή μας από το Φύλλο ‘’regression’’/ Έξοδος Συμπεράσματος το

R2=0.816, οπότε αντιλαμβανόμαστε ότι η ερμηνευτικότητα της παλινδρόμηση είναι

ικανοποιητική6. Το προσαρμοσμένο R2 είναι μια βελτιωμένη εκδοχή του απλού R2.

Παρατηρούμε επίσης ότι οι συντελεστές b1 και b2 είναι στατιστικά σημαντικοί, ενώ

αντιθέτως ο σταθερός όρος b0 δεν είναι στατιστικά σημαντικός (βλ. Φύλλο excel

‘’regression’’/ Στατιστικοί Έλεγχοι). Βέβαια, εκείνο που μας ενδιαφέρει κυρίως

11

5 =BeraJarque −

24)3(

6(*

22 −+

kST ), όπου

Τ Μέγεθος Δείγματος S Τιμή Ασυμμετρίας [κατάλοιπα (u)], k Τιμή Κύρτωσης [κατάλοιπα (u)]. 6 Οι εμπειρικές μελέτες έχουν δείξει ότι για την ικανοποιητική ερμηνεία των χρονολογικών σειρών το R2 της παλινδρόμησης θα πρέπει υπερβαίνει το 0.8, ενώ για διαστρωματικά δεδομένα το R2 θα πρέπει να είναι μεγαλύτερο το 0.6.

Page 12: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

12

είναι η στατιστική σημαντικότητα των ερμηνευτικών μεταβλητών (b1 ,b2) και όχι

τόσο του σταθερού όρου (b0). Να προσθέσουμε επίσης ότι οι συντελεστές b1, b2

δείχνουν την ποσοστιαία μεταβολή της εξαρτημένης μεταβλητής (Υ), όταν οι

ανεξάρτητες (Χ1, Χ2) μεταβάλλονται κατά 1%. Άρα, όταν η απόδοση της Αγγλίας

(Χ1) μεταβάλλεται κατά 1%, η μεταβολή του δείκτη της Γερμανίας είναι

b1=0,6223%, ενώ όταν μεταβάλλεται ο δείκτης των ΗΠΑ (Χ2) κατά 1% τότε η

επίδραση στην απόδοση της Γερμανίας είναι b2=0,4925% (βλ Πίνακα 3/ Στήλη

Συντελεστές).

Επιπλέον διαπιστώνουμε ότι η τιμή F-statistic της παλινδρόμησης (βλ. Φύλλο excel

‘’regression’’/ Στατιστικοί Έλεγχοι) είναι πολύ υψηλή, γεγονός που δείχνει το

υπόδειγμα είναι στατιστικά σημαντικό. Τέλος, εστιάζοντας στην τιμή Jarque-Bera,

εξακριβώνουμε ότι τα κατάλοιπα ακολουθούν την κανονική κατανομή.

ΓΕΩΜΕΤΡΙΚΗ ΕΡΜΗΝΕΙΑ. Όπως γνωρίζουμε από την γεωμετρία, κάθε συνάρτηση της μορφής Y=

b0+b1*X1+b2*X2 παριστάνει ένα επίπεδο στο χώρο. Είναι λοιπόν κατανοητό ότι η

σχέση που έχει εκτιμηθεί μεταξύ των δεικτών παριστάνει ένα επίπεδο. Στο παρακάτω

γράφημα έχουμε σχεδιάσει την γραφική παράσταση με τη βοήθεια του MatLab.

Δυστυχώς οι δυνατότητες του excel είναι πολύ περιορισμένες στα γραφήματα,

ωστόσο παρέχει τη δυνατότητα απεικόνισης διμεταβλητής συνάρτησης με τη χρήση

των γραφημάτων ‘’Επιφάνεια’’.

Page 13: Πολλαπλή γραμμική παλινδρόμηση με χρήση excel 2003. Θεωρία και παραδείγματα.

ΣΥΝΟΨΗ ΣΥΝΑΡΤΗΣΕΩΝ EXCEL Οι συναρτήσεις που χρησιμοποιήσαμε για να εκτιμήσουμε την παλινδρόμηση Y=

b0+b1*X1+b2*X2 και για να διενεργήσουμε τους στατιστικούς ελέγχους ήταν οι εξής:

Μενού Εργαλεία Ανάλυση Δεδομένων Παλινδρόμηση

Μενού Εργαλεία Ανάλυση Δεδομένων Ιστόγραμμα

Μενού Εργαλεία Ανάλυση Δεδομένων Περιγραφικά Στατιστικά

TINV (κρίσιμη τιμή t -κατανομής) 1,2/ −− kTat

FIVN (κρίσιμη τιμή F -κατανομής) 1,, −− kTkaF

CHIINV (κρίσιμη τιμή X2 -κατανομής) 2,TaX

Γραφήματα Διασπορά (ΧΥ) και Προσθήκη Γραμμής Τάσης

Γραφήματα Γραμμή

13