5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 ·...

15
Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Το μοντέλο που δημιουργήσαμε στο προηγούμενο εργαστήριο έχει βελτιωθεί εν μέρει ώστε να συμπεριλάβει και κάποιες δυνατότητες οι οποίες απαιτούν σχετικά εξειδικευμένες γνώσεις που ξεφεύγουν από τους στόχους του μαθήματος. Όπως είδαμε και στο προηγούμενο εργαστήριο το μοντέλο αποτελείται βασικά από διαστάσεις (dimensions) και πεδία τιμών (measures). Το μοντέλο που θα επεξεργαστούμε αποτελείται από τις διαστάσεις: (1) Γεωγραφία, (2) Αντικείμενα Δραστηριοτήτων, (3) Κλάδοι της οικονομίας, (4) Νομικές Μορφές και (6) Χρηματιστήριο. Αναλυτικότερα η διάσταση Γεωγραφία αναλύεται στα επίπεδα (α) Περιφέρεια, (β) Νομό, (γ) Πόλη και (δ) Ταχυδρομικό Κωδικό. Η διάσταση Αντικείμενο Δραστηριότητας αναλύεται στα επίπεδα (α) Γενική Δραστηριότητα και (β) Δραστηριότητα Η διάσταση Κλάδοι έχει ένα επίπεδο (Κλάδος).

Transcript of 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 ·...

Page 1: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 39

5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Το μοντέλο που δημιουργήσαμε στο προηγούμενο εργαστήριο έχει βελτιωθεί εν μέρει ώστε να συμπεριλάβει και κάποιες δυνατότητες οι οποίες απαιτούν σχετικά εξειδικευμένες γνώσεις που ξεφεύγουν από τους στόχους του μαθήματος.

Όπως είδαμε και στο προηγούμενο εργαστήριο το μοντέλο αποτελείται βασικά από διαστάσεις (dimensions) και πεδία τιμών (measures). Το μοντέλο που θα επεξεργαστούμε αποτελείται από τις διαστάσεις: (1) Γεωγραφία, (2) Αντικείμενα Δραστηριοτήτων, (3) Κλάδοι της οικονομίας, (4) Νομικές Μορφές και (6) Χρηματιστήριο.

Αναλυτικότερα η διάσταση

Γεωγραφία αναλύεται στα επίπεδα (α) Περιφέρεια, (β) Νομό, (γ) Πόλη και (δ) Ταχυδρομικό Κωδικό.

Η διάσταση Αντικείμενο Δραστηριότητας αναλύεται στα επίπεδα (α) Γενική Δραστηριότητα και (β) Δραστηριότητα

Η διάσταση Κλάδοι έχει ένα επίπεδο (Κλάδος).

Page 2: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 40

Η διάσταση Νομικές Μορφές έχει ένα επίπεδο (Νομική Μορφή)

Τέλος η διάσταση Χρηματιστήριο έχει ένα επίπεδο (Χρηματιστήριο).

Τα πεδία τιμών περιλαμβάνουν αριθμητικές τιμές οι οποίες εμφανίζονται στις αναλύσεις. Τα πεδία τιμών του μοντέλου είναι: (1) ICAP Count (αθροιστής που περιλαμβάνει πλήθος εταιρειών), (2) Εισαγωγική (αθροιστής που περιλαμβάνει πλήθος εισαγωγικών εταιρειών), (3) Εξαγωγική (αθροιστής που περιλαμβάνει πλήθος εξαγωγικών εταιρειών), (4) Προσωπικό (ο αριθμός ατόμων που απασχολεί κάθε εταιρεία), (5) Τζίρος (ο κύκλος εργασιών κάθε εταιρείας), (6) Τζίρος Εισαγωγών (προκύπτει από το γινόμενο του κύκλου εργασιών επί το ποσοστό εισαγωγών που δήλωσε η κάθε εταιρεία και είναι υπερτιμημένη η τιμή του πεδίου εφ΄όσον υπολογίζεται με βάση τον τζίρο και επομένως περιλαμβάνει και το ποσοστό κέρδους της επιχείρησης), (7) Τζίρος Εξαγωγών (προκύπτει από το γινόμενο του κύκλου εργασιών επί το ποσοστό εξαγωγών που δήλωσε η κάθε εταιρεία), (8) Τζίρος Αντικείμενο (είναι το ποσοστό συμμετοχής του επιπέδου της διάστασης Αντικείμενο Δραστηριοτήτων ως προς το σύνολο) και (9) Τζίρος Γεωγραφία (είναι το ποσοστό συμμετοχής του επιπέδου της διάστασης Γεωγραφία ως προς το σύνολο)

Page 3: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 41

Για να κατανοήσουμε τη λειτουργικότητα του μοντέλου παρατίθενται δυο παραδείγματα. Το πρώτο περιλαμβάνει τη διάσταση Γεωγραφία στις γραμμές (row labels), τη διάσταση Κλάδοι στις στήλες (column labels) και το πεδίο τιμών Τζίρος (Values). Το αποτέλεσμα είναι ο τζίρος ανά γεωγραφική περιοχή (περιφέρεια) και κλάδο της οικονομίας.

Το δεύτερο παράδειγμα είναι εξέλιξη του πρώτου. Έχει προστεθεί το πεδίο

τιμών Τζίρος Γεωγραφία, το οποίο εμφανίζεται πλάι στον τζίρο και δείχνει τη συμμετοχή της συγκεκριμένης περιοχής στο σύνολο όλων των περιοχών της αναφοράς. Επιπρόσθετα η αναφορά έχει ταξινομηθεί ως προς τη τελευταία στήλη (σύνολο όλων των κλάδων). Επομένως βλέπουμε τον τζίρο και τη συμμετοχή των περιφερειών και Νομών (για την περιφέρεια Μακεδονίας) ανά κλάδο της οικονομίας. Π.χ. τα κελιά Η6 και Ι6 δείχνουν το σύνολο όλων των εταιρειών του Νομού Θεσσαλονίκης στον κλάδο του τουρισμού σε αξία (Η6) και ποσοστό (Ι6) ως προς το σύνολο της επικράτειας.

Page 4: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 42

5.1. ΟΡΙΣΜΟΣ ΠΗΓΗΣ ΠΟΛΥΔΙΑΣΤΑΤΩΝ ΔΕΔΟΜΕΝΩΝ

Σε ένα νέο φύλλο εργασίας του

Excel επιλέγουμε Data – Get External Data – From Other Sources – From Analysis Services. Η διαδικασία αυτή γίνεται μόνο την πρώτη φορά που θα συνδεθούμε με μία πηγή. Κάθε επόμενη φορά επιλέγουμε Data – Existing Connections και το πρόγραμμα εμφανίζει όλες τις πηγές που έχουμε ήδη ορίσει.

Επόμενο βήμα είναι ο ορισμός του εξυπηρετητή της βάσης δεδομένων (server) και η μέθοδος σύνδεσης.

Κατόπιν επιλέγουμε βάση δεδομένων

(ICAP) και κύβο (ICAP).

Page 5: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 43

Κατόπιν δίνουμε όνομα στη σύνδεσή μας (ICAP).

Τέλος επιλέγουμε να επιστρέψουν τα δεδομένα στη μορφή Pivot Table στο φύλλο εργασίας.

5.2. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Η επιφάνεια εργασίας αποτελείται από δυο μέρη (α) την περιοχή της αναφοράς (Pivot Table) αριστερά και (β) την περιοχή του κύβου (με τις διαστάσεις και τα πεδία τιμών) δεξιά.

Page 6: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 44

Στην περιοχή του κύβου σύρουμε τη διάσταση Γεωγραφία και την αφήνουμε στις γραμμές (row labels). Σύρουμε τη διάσταση Κλάδος και την αφήνουμε στις στήλες (column labels). Τέλος είτε επιλέγουμε (√) τον Τζίρο από τα πεδία τιμών είτε σύρουμε και αφήνουμε στις τιμές (values). Αποτέλεσμα είναι η δημιουργία ενός πολυδιάστατου πίνακα (pivot table) που δείχνει τζίρο ανά περιφέρεια (γραμμές) και κλάδο (στήλες). Η διάσταση Γεωγραφία όπως προαναφέρθηκε αποτελείται από τέσσερα επίπεδα. Εμφανίζεται μόνο το 1ο επίπεδο (περιφέρεια) με ένα συν (+) μπροστά σε κάθε περιφέρεια που αναλύεται σε χαμηλότερο επίπεδο. Επομένως μπορούμε να αναλύσουμε τις περιοχές μέχρι τη χαμηλότερη διάσταση πατώντας το συν (+).

Διαμορφώνουμε τις τιμές ώστε να είναι ευανάγνωστες. Επιλέγουμε όλο το φύλλο εργασίας και Home – Number και διαμορφώνουμε ώστε να εμφανίζονται οι χιλιάδες και δυο δεκαδικά.

Page 7: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 45

Προσθέτουμε το πεδίο τιμών Τζίρος Γεωγραφία και εμφανίζεται η συμμετοχή κάθε περιφέρειας ανά κλάδο ως προς το σύνολο της Ελλάδας. Μπορούμε να ταξινομήσουμε ώστε να δούμε τις περιφέρειες με τον υψηλότερο τζίρο. Επιλέγουμε το κελί L4 (ώστε η ταξινόμηση να γίνει ως προς το σύνολο των κλάδων) και Data – Sort – Largest to Smallest.

Κατεβαίνουμε ένα επίπεδο (νομοί) σε μια περιφέρεια (π.χ. Μακεδονία) και

ταξινομούμε και ανά νομό.

Βλέποντας το αποτέλεσμα τι επιχειρησιακό συμπέρασμα προκύπτει;

Page 8: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 46

5.2.1. ΠΡΟΣΘΗΚΗ ΦΙΛΤΡΩΝ

Από το σύνολο των επιχειρήσεων θα αναλύσουμε μόνο τις εισηγμένες στο χρηματιστήριο. Σύρουμε τη διάσταση Χρηματιστήριο και αφήνουμε στα Φίλτρα (report filter). Εμφανίζεται η διάσταση στην περιοχή των φίλτρων (πάνω από τις επικεφαλίδες). Επιλέγουμε All και στο παράθυρο που εμφανίζεται επιλέγουμε Ναι (εισηγμένες).

Αποτέλεσμα είναι (α) να εμφανιστεί η τιμή που επιλέξαμε (Ναι) στην περιοχή

των φίλτρων και (β) να αλλάξει ο πίνακας εμφανίζοντας τον τζίρο και τη συμμετοχή μόνο των εισηγμένων.

Page 9: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 47

Προσθέτουμε και ένα δεύτερο φίλτρο (Αντικείμενο Δραστηριότητας) και από το σύνολο των Γενικών Δραστηριοτήτων επιλέγουμε τα Αγροτικά Προϊόντα – Ζωοτροφές.

Αποτέλεσμα είναι να εμφανιστούν από τις εισηγμένες στο ΧΡηματιστήριο μόνο

οι επιχειρήσεις που ασχολούνται με Αγροτικά Προϊόντα – Ζωοτροφές.

Page 10: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 48

Τι συμπέρασμα βγάζουμε;

5.2.2. ΔΗΜΙΟΥΡΓΙΑ ΝΕΟΥ ΠΑΡΑΔΕΙΓΜΑΤΟΣ

Καθαρίζουμε την αναφορά ώστε να δημιουργήσουμε μια νέα. Για να γίνει αυτό σύρουμε κάθε διάσταση από τις γραμμές, τις στήλες και τα φίλτρα και αφήνουμε κάπου στην περιοχή του φύλλου εργασίας. Παρόμοια καθαρίζουμε τις τιμές (values).

Ο νέος πίνακας θα έχει σαν γραμμές τα Αντικείμενα Δραστηριότητας. Παρατηρούμε ότι εμφανίζεται μόνο μια γραμμή γιατί ισχύουν ακόμη τα φίλτρα. Επιλέγουμε Data – Clear.

Page 11: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 49

Τώρα εμφανίζονται όλες οι Γενικές Δραστηριότητες. Προσθέτουμε τη διάσταση Γεωγραφία στις στήλες και το πεδίο τιμής Εξαγωγική (πλήθος εξαγωγικών εταιρειών) στις τιμές (values). Ταξινομούμε ως προς το σύνολο των περιφερειών.

Αναλύουμε κάποιες Γενικές Δραστηριότητες στις Δραστηριότητες και ξαναταξινομούμε τις επί μέρους Δραστηριότητες. Τι μας δείχνει η αναφορά που προέκυψε;

Page 12: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 50

5.3. ΓΡΑΦΗΜΑΤΑ – ΓΡΑΦΙΚΗ ΔΙΑΜΟΡΦΩΣΗ ΑΝΑΦΟΡΑΣ

Δημιουργούμε ένα νέο πίνακα με τον Τζίρο Εξαγωγών ανά Περιφέρεια (διάσταση Γεωγραφία) και Κλάδο. Επιλέγουμε τα κελιά των περιφερειών και Insert – Column – 2D Column – Clustered Column.

Το αποτέλεσμα είναι η δημιουργία ενός γραφήματος με τις τιμές που επιλέξαμε. Το γράφημα αλλάζει καθώς αλλάζουν τα δεδομένα της αναφοράς.

Page 13: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 51

Για τη ίδια περιοχή τιμών επιλέγουμε Home – Conditional Formatting – Data Bars και επιλέγουμε ένα χρώμα.

Αποτέλεσμα είναι η εμφάνιση μιας μπάρας πριν από κάθε αριθμό με μέγεθος

ανάλογο με το ύψος του τζίρου.

Επιλέγω Home – Conditional Formatting – Clear Rules – Clear Rules from this

PivotTable ώστε να καθαρίσουν τα γραφήματα. Επιλέγω Home – Conditional Formatting – Top 10%.

Page 14: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 52

Το αποτέλεσμα είναι να αλλάξουν χρωματισμό τα κελιά με τις κορυφαίες (επιλέγω ποσοστό π.χ. 10%) τιμές.

Αλλάζοντας ποσοστό αλλάζουν και οι τιμές που χρωματίζονται.

Μπορούμε να επιλέξουμε εναλλακτικούς τρόπους εμφάνισης των αποτελεσμάτων.

Page 15: 5. ΠΟΛΥΔΙΑΣΤΑΤΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ · 2018-02-20 · Πολυδιάστατη Ανάλυση Δεδομένων Αριστομένης Μακρής 39 5.

Πολυδιάστατη Ανάλυση Δεδομένων

Αριστομένης Μακρής 53

Επιλέγοντας More Rules μπορούμε να

αλλάξουμε τα κριτήρια χρωματισμού των τιμών από 67 – 33 σε κάτι άλλο (π.χ. 30 -10)