3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του...

112

Transcript of 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του...

Page 1: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία
Page 2: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 2

ΠΕΡΙΕΧΟΜΕΝΑ

ΚΕΦΑΛΑΙΟ 1........................................................................................................................... 5

1.1 Εισαγωγή στο Marketing................................................................................................... 6 1.1.1 Παραδοσιακό Marketing........................................................................................................6

1.1.1.1 Από το μονόλογο στο διάλογο ..........................................................................................................7 1.1.1.2 Καθετί παλιό γίνεται ξανά καινούργιο ..............................................................................................7

1.2 E – Marketing..................................................................................................................... 7 1.2.1 Ορισμός E-marketing ...........................................................................................................10 1.2.2 E – Marketing Functions ......................................................................................................11

1.2.2.1 Οι βασικές λειτουργίες για συναλλαγές ( Τα 4Ρs) ..........................................................................11 1.2.3 Traditional Marketing vs E – Marketing............................................................................13

ΚΕΦΑΛΑΙΟ 2......................................................................................................................... 14

2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση................................................... 15 2.1.1 Ορισμός και ιστορία της On-line Διαφήμισης....................................................................15 2.1.2 Έννοια και Χαρακτηριστικά της On-line Διαφήμισης ......................................................15

2.1.2.1 Μαζική και διαπροσωπική επικοινωνία ..........................................................................................16 2.1.2.2 Ενεργό Κοινό ..................................................................................................................................17 2.1.2.3 Μετάδοση μεγάλης ποσότητας πληροφοριών.................................................................................17 2.1.2.4 Χαμηλό κόστος ...............................................................................................................................17 2.1.2.5 Δυνατότητα αναπροσαρμογής του διαφημιστικού μηνύματος .......................................................17

2.2 Παραδοσιακή Διαφήμιση ................................................................................................ 18 2.2.1 Χαρακτηριστικά Παραδοσιακής Διαφήμισης ....................................................................18

2.3 Σύγκριση Online Διαφήμισης Και Παραδοσιακής Διαφήμισης.................................... 20 2.3.1 Κριτήρια σύγκρισης..............................................................................................................20

2.4 Συμπεράσματα ................................................................................................................. 23

2.5 Τι δεν είναι το E-marketing ............................................................................................. 24 2.5.1 E-πραγματικότητα και τι δεν είναι το E-Marketing..........................................................24

ΚΕΦΑΛΑΙΟ 3......................................................................................................................... 26

3.1 Εισαγωγή στο Personalization ........................................................................................ 27 3.1.1 Εισαγωγικά και τι είναι Personalization.............................................................................27 3.1.2 Ορισμός του Personalization................................................................................................30

3.2 Τι είναι το Web Personalization; ..................................................................................... 32 3.2.1 Εισαγωγή ...............................................................................................................................32

3.2.1.1 H έννοια του WEB Personalization ................................................................................................32 3.3 Διαφορές στο Personalization ......................................................................................... 34

3.3.1 Τι είναι το Web Customization και τι το Personalization;................................................34 3.3.2 Customizing or personalizing?.............................................................................................34 3.3.3 Πώς δουλεύει το Web Personalization? ..............................................................................35

3.4 Προσωποποίηση vs. Προσαρμογή (Customization)....................................................... 36

Page 3: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 3

3.5 Λειτουργίες και Τεχνικές ................................................................................................. 38

3.6 Τεχνικές Προσωποποίησης ............................................................................................. 39 3.6.1 Αναζήτηση προσωπικών εγγραφών σε μια βάση δεδομένων/αρχείων .........................39 3.6.2 Αναζήτηση μιας βάσης κανόνων ή μιας βάσης δεδομενων προφίλ ..................................39 3.6.3 Εξόρυξη Εγγραφών Ιστού ....................................................................................................40 3.6.4 Εξόρυξη κειμένου ..................................................................................................................40 3.6.5 OLAP......................................................................................................................................40

3.7 Τεχνικές Προκλήσεις ....................................................................................................... 41

3.8 Μη Τεχνικές Προκλήσεις ................................................................................................ 43

3.9 Είδη Προσωποποίησης ................................................................................................... 45 3.9.1 Προσωποποίηση Υπερ-συνδέσμων (link personalization) ................................................45 3.9.2 Προσωποποίηση Περιεχομένων (Content Personalization) .............................................45 3.9.3 Προσωποποίηση Δομής (Structure Personalization) .........................................................45 3.9.4 Ενότητες Προσωποποίησης..................................................................................................46

Κεφαλαιο 4.............................................................................................................................. 48

4.1 Personalization και Data Mining .................................................................................... 49 4.1.1 Χαρακτηριστικά Διαδικτύου και Data Mining .................................................................50 4.1.2 Γιατί είναι χρήσιμη η εξόρυξη δεδομένων;........................................................................51

4.2 Αλγόριθμοι Εξόρυξης Δεδομένων ................................................................................... 51 4.2.1 Κλασσικές Τεχνικές ..............................................................................................................51

4.2.1.1 Προσωποποίηση και Εξόρυξη Δεδομένων .....................................................................................52 4.2.1.2 Ένα απλό παράδειγμα Nearest Neighbor ........................................................................................53 4.2.1.3 Ομαδοποίηση για Σαφήνεια ............................................................................................................54 4.2.1.4 Ένα απλό παράδειγμα ομαδοποίησης (Clustering) .........................................................................55 4.2.1.5 Ιεραρχική και Μη-Ιεραρχική Ομαδοποίηση ...................................................................................55

4.2.2 Τεχνικές Νέες Γενιάς (N.G.T.):Δέντρα ,Δίκτυα ,και Κανόνες ...........................................57 4.2.2.1 Η Νέα Γενιά ....................................................................................................................................57 4.2.2.2 Εισαγωγή Κανόνα ...........................................................................................................................60 4.2.2.3 Κανόνες vs. Δέντρα αποφάσεων .....................................................................................................62

4.3 Εξόρυξη Δεδομένων Και Βασικά είδη προβλημάτων .................................................... 63 4.3.1 Πρόβλεψη..............................................................................................................................64 4.3.2 Ανακάλυψη Γνώσης ..............................................................................................................64

Κεφαλαιο 5.............................................................................................................................. 67

5.1 Τι είναι το Web Mining; ................................................................................................. 68 5.1.1 Τα πλεονεκτήματα του Web Mining ...................................................................................68 5.1.2 Προσωποποίηση για το Web Mining...................................................................................68

5.2 Web Mining (Εξόρυξη Διαδικτύου) ................................................................................ 69 5.2.1 Ταξινόμηση του πολυμεσικού περιεχομένου και των ιστοχώρων.....................................71

5.2.1.1 Focused crawling ............................................................................................................................71 5.2.1.1 Ομαδοποίηση των αντικειμένων Διαδικτύου..................................................................................72

5.3 Συμπεράσματα ................................................................................................................. 74

Κεφαλαιο 6.............................................................................................................................. 76

Page 4: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 4

6.1 Εισαγωγή .......................................................................................................................... 77

6.2 Πηγές και τύποι δεδομένων............................................................................................. 78 6.2.1 Δεδομένα χρήσης ...................................................................................................................79 6.2.2 Δεδομένα περιεχομένου.........................................................................................................79 6.2.3 Δεδομένα δομής .....................................................................................................................80 6.2.4 Δεδομένα χρηστών ................................................................................................................80

6.3 Web Server Logs............................................................................................................... 81

6.4 User Entry Data / Profiles ............................................................................................... 82

6.6 Έξυπνο E-Marketing με εξόρυξη δεδομένων και interfaces προσαρμοσμένα στο χρήστη .................................................................................................................................... 83

6.6.1 User Profile ............................................................................................................................83 6.6.2 Data Collection ......................................................................................................................84

6.6.2.1 Privacy Issues.................................................................................................................................85 6.6.3 Προετοιμασία Δεδομένων Χρήσης ......................................................................................85 6.6.4 Εξεύρεση Προτύπων Από Δεδομένα Χρήσης Διαδικτύου .................................................87

6.6.4.1 Επίπεδα και τύποι ανάλυσης ...........................................................................................................87 6.6.4.2 Θέματα εξόρυξης δεδομένων για δεδομένα χρήσης διαδικτύου .....................................................88 6.6.4.3 Κανόνες ένωσης..............................................................................................................................88 6.6.4.4 Διαδοχικά Πρότυπα και Πρότυπα Εξερεύνησης.............................................................................89 6.6.4.5 Προσεγγίσεις Ομαδοποίησης ( Μέθοδοι Ομαδοποίησης) .............................................................89

6.6.5 Χρησιμοποιώντας Τα Πρότυπα Που Έχουν Ανακαλυθφεί Για Personalization .............91 6.6.5.1 Η Προσέγγιση kNN ........................................................................................................................91 6.6.5.2 Χρησιμοποιώντας ομαδοποιήσεις στην προσωποποίηση ...............................................................92 6.6.5.3 Χρησιμοποιώντας τους κανόνες ένωσης για Personalization .........................................................92 6.6.5.4 Χρησιμοποιώντας Διαδοχικά Πρότυπα για Personalization ...........................................................92

ΚΕΦΑΛΑΙΟ 7......................................................................................................................... 93

7.1 Privacy Issues................................................................................................................... 94

7.2 Κίνδυνοι Προστασίας Προσωπικών Δεδομένων............................................................ 96

7.3 Εφαρμογή Θεμιτών Πληροφοριών ................................................................................. 97 7.3.1 Αρχές Εξάσκησης ..................................................................................................................97 7.3.2 Νόμοι Ιδιωτικοποίησης και οδηγίες αυτορύθμισης ...........................................................99 7.3.3 Μέθοδοι μείωσης ιδιωτικών κινδύνων στην προσοπωποίηση του ηλεκτρονικού εμπορίου ........................................................................................................................................100

7.3.3.1 Ψευδώνυμα Προφίλ ......................................................................................................................100 7.3.3.2 Προφίλ εκ μέρους των Πελατών ...................................................................................................101 7.3.3.3 Προσωποποίηση βασισμένη σε συνόδους ....................................................................................101 7.3.3.4 Ελέγχοντας τους Χρήστες .............................................................................................................102

7.4 Το Ενδιαφέρων Του Καταναλωτή Για Την Ιδιωτικοποίηση ....................................... 104

7.5 Συμπέρασμα ................................................................................................................... 106

Συμπεράσματα ..................................................................................................................... 109

ΒΙΒΛΙΟΓΡΑΦΙΑ.................................................................................................................. 110

Page 5: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 5

ΚΕΦΑΛΑΙΟ 1

Page 6: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 6

1.1 Εισαγωγή στο Marketing

1.1.1 Παραδοσιακό Marketing

Το μάρκετινγκ υποβάλλεται σε έναν σημαντικό μετασχηματισμό, καθώς οι παραδοσιακές τεχνικές μάρκετινγκ δίνουν τη θέση τους στις νέες μεθόδους μάρκετινγκ ηλεκτρονικού εμπορίου. Στο ανταγωνιστικό πεδίο που εδρεύει το ηλεκτρονικό εμπόριο, οι επιτυχείς εμπορικές οργανώσεις κινούνται από το μαζικό μάρκετινγκ προς το προσωποποιημένο, σύγχρονο μάρκετινγκ, από το μάρκετινγκ ως κέντρο δαπανών στο μάρκετινγκ ως επένδυση και από τα μακροπρόθεσμα σχέδια μάρκετινγκ στη γρήγορη εφαρμογή των εκστρατειών μάρκετινγκ σε Διαδικτυακή ταχύτητα.

Για να επιζήσουν σε αυτό το νέο περιβάλλον, οι εμπορικές οργανώσεις πρέπει ριζικά να αλλάξουν τον τρόπο με τον οποίο λειτουργούν. Πρέπει να λειτουργήσουν συνολικά πέρα από τα πολλαπλάσια κανάλια αλληλεπίδρασης πελατών, πρέπει να αυξήσουν την εσωτερική αποτελεσματικότητά τους με τη στόχευση των κατάλληλων πελατών και τη διαχείριση εκστρατειών σε πραγματικό χρόνο, και πρέπει να μειώσουν το χρόνο στην αγορά με την αυτοματοποίηση των διαδικασιών του μάρκετινγκ και την ενσωμάτωση, πέρα από τα όρια της επιχείρησης και των καναλιών αλληλεπίδρασης πελατών.

Οι οργανώσεις μπορούν να επιτύχουν αυτούς τους επιτακτικούς στόχους μόνο μέσω μίας ολοκληρωμένης λύσης διοίκησης – μάρκετινγκ ηλεκτρονικού εμπορίου η οποία παρέχει περιεκτική αυτοματοποίηση, ανάλυση, και πολυκάναλες δυνατότητες εκτέλεσης, καθώς επίσης και μία ασύνδετη ενσωμάτωση πωλήσεων, υπηρεσιών, και διαδικασιών. Τέλος στο μαζικό μάρκετινγκ, η προσαρμογή είναι το κλειδί

Η τελευταία πολυτέλεια που ένας πελάτης μπορεί να λάβει είναι προϊόντα και υπηρεσίες σχεδιασμένα αποκλειστικά για αυτόν. Η χρησιμοποίηση του δικτύου για την πώληση αγαθών μαζικής παραγωγής θα είναι όπως η χρησιμοποίηση ενός υπολογιστή ως γραφομηχανή. Το Δίκτυο προσφέρει μια τεράστια ευκαιρία στην κατανόηση των αναγκών των πελατών, μια κάθε φορά, και προσφέρει προσαρμοσμένα προϊόντα και υπηρεσίες. Για πάνω από δύο δεκαετίες, η εταιρία Henry Ford κατασκεύασε 6 εκατομμύρια αυτοκίνητα μοντέλου Τ, όλα μαύρα. Σήμερα ο μέσος αριθμός αυτοκινήτων που παράγονται από μια γραμμή συναρμολόγησης σε κάθε «οργάνωση παραγωγής» είναι λιγότερα από 50. Κατασκευάζονται σε ποικιλότητα χρωμάτων, μορφών, σχεδιασμού, και επιλογών εξοπλισμού. Η Software Sportswear, μια επιχείρηση της Καλιφόρνια πωλεί ιδιαίτερα bikinis για ιδιαίτερους σωματότυπους. Το Loop Bra δημιουργείται επιστημονικά ώστε να μπορέσει να λάβει υπόψιν τις ασυμμετρίες των μεμονωμένων σωματικών μορφών. Όλα αυτά κατασκευάζονται από 150 διαφορετικά υφάσματα και 100 περίεργα σχέδια και η επιλογή σας γίνεται αφού δείτε την εικόνα σας στην οθόνη ντυμένη με το bikini ή το στηθόδεσμο της επιλογής σας. Το Δίκτυο προσφέρει απέραντες δυνατότητες ώστε να συλληφθούν οι μεμονωμένες προτιμήσεις και να συνδυαστούν με τις προσαρμοσμένες εγκαταστάσεις παραγωγής για να ικανοποιηθούν οι ιδιαίτερες ανάγκες. Για παράδειγμα, ένας πελάτης που επισκέπτεται ένα βιβλιοπωλείο στο δίκτυο μπορεί να κοιτάξει μέσα στα βιβλία και ενδεχομένως να παραγγείλει μερικά κεφάλαια ενός βιβλίου και να τιμολογηθεί για αυτά και όχι για ολόκληρο το βιβλίο. Με τους νόμους πνευματικών δικαιωμάτων να το επιτρέπουν, ένας πελάτης μπορεί να είναι ικανός να λάβει το βιβλίο του με συνδυασμό κεφαλαίων από διαφορετικά βιβλία.

Page 7: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 7

1.1.1.1 Από το μονόλογο στο διάλογο Η παραδοσιακή διαφήμιση χρησιμοποίησε τη μονόδρομη επικοινωνία για να πείσει τους πελάτες να αγοράσουν τα προϊόντα και τις υπηρεσίες τους. Στην εποχή Διαδικτύου, η επικοινωνία είναι διπλής κατεύθυνσης καθώς εμπλέκει τον πελάτη σε έναν διάλογο με την επιχείρηση από την παραγωγή της ιδέας έως την ανάπτυξη και το μάρκετινγκ προϊόντων και μετά τις υπηρεσίες πωλήσεων. Στην πραγματικότητα οι επιχειρήσεις παίρνουν ακόμη ιδέες από τους πελάτες τους ως προς τον τρόπο με τον οποίο θα ήθελαν να τους διατίθενται τα προϊόντα που χρησιμοποιούν. Το παραδοσιακό μάρκετινγκ λειτουργεί στο αξίωμα: «Εμείς φτιάχνουμε, εσείς παίρνετε, Εμείς μιλάμε, εσείς ακούτε». Η επικοινωνία είναι μονόδρομη και είναι πάντα υπέρ του κατασκευαστή. Στο καθεστώς του ηλεκτρονικού εμπορίου, καλείται ενσωματωμένη επικοινωνία, η οποία έχει συνοχή και που προσαρμόζεται για κάθε άτομο.

1.1.1.2 Καθετί παλιό γίνεται ξανά καινούργιο Οι νέες εξελίξεις στο ηλεκτρονικό εμπόριο καταδεικνύουν το γεγονός ότι το ηλεκτρονικό εμπόριο έχει πολλά κοινά με το μάρκετινγκ των προβιομηχανικών ημερών. Πριν από τη βιομηχανική επανάσταση, πριν από τη μαζική παραγωγή προϊόντων, και πριν από τα μέσα μαζικής επικοινωνίας, οι έμποροι και οι βιοτέχνες έχτισαν τις επιχειρήσεις τους μία-μία. Ο ιδιοκτήτης ενός γενικού καταστήματος, μια τράπεζα, ένα κομμωτήριο, ή ένας σταύλος ενοικίασης αλόγων μιας πόλης φαντάζονταν τις επιχειρήσεις τους με όρους μεριδίου του πελάτη χωρίς ποτέ να φανταστούν το μερίδιο της αγοράς. Ο τοπικός παντοπώλης συναντούσε και ήξερε κάθε έναν από τους πελάτες του. Γνώριζε το είδος των λαχανικών που η κυρία Smith θα χρειαστεί κάθε εβδομάδα. Αν και οι όροι δεν είχαν εφευρεθεί, ο παντοπώλης πριν τον εικοστό αιώνα ήταν ένας έμπορος σχέσεων, ο οποίος φρόντιζε και έθρεφε τους πελάτες του σύμφωνα με τις ιδιαίτερες ανάγκες του καθενός . Είχε ένα πρόγραμμα ικανοποίησης πελατών σε ισχύ και ήταν δεσμευμένος στο πρόγραμμα διατήρησης των πελατών του. Στηρίχθηκε σε μια μορφή «βάσης δεδομένων του μάρκετινγκ», φροντίζοντας κάθε πελάτη διαφορετικά, στηριζόμενος στη δική του γνώση για εκείνον τον συγκεκριμένο πελάτη. Κατείχε τη βάση δεδομένων του στο μυαλό του. Το ένα προς ένα μέλλον αλληλεπίδρασης εξετάζει έναν τρόπο πραγματοποίησης επιχειρηματικών δραστηριοτήτων που δεν ήταν εφικτός μόλις πριν 10 έτη, αν και είναι μια άμεση αντανάκλαση της επιχείρησης όπως την ασκούσαν εκατόν δέκα έτη πριν! Η τεχνολογία μας έχει φέρει πίσω σε έναν παλαιά διαμορφωμένο τρόπο πραγματοποίησης επιχειρήσεων με το να καταστήσει εφικτό να θυμόμαστε τις σχέσεις με τους μεμονωμένους πελάτες - μερικές φορές εκατομμύρια από αυτούς - έναν κάθε φορά, ακριβώς όπως έκαναν οι ιδιοκτήτες και οι τεχνίτες καταστημάτων με μερικές εκατοντάδες πελάτες τους 150 έτη πριν.

1.2 E – Marketing Προκειμένου να πραγματοποιηθεί το ηλεκτρονικό μάρκετινγκ, είναι απαραίτητο να γνωρίζουμε για το παραδοσιακό μάρκετινγκ, τις επιστήμες υπολογισμού και επίσης για τις αναλυτικές μεθόδους. Το ηλεκτρονικό μάρκετινγκ είναι η συγκέντρωση όλων των προσπαθειών από την άποψη να προσαρμοστούν και να αναπτυχθούν οι στρατηγικές μάρκετινγκ σε ένα περιβάλλον δικτύου. Το ηλεκτρονικό μάρκετινγκ περιλαμβάνει όλα τα στάδια της εργασίας σχετικά με έναν ιστοχώρο, όπως η σύλληψη, το ίδιο το πρόγραμμα, η προσαρμογή του

Page 8: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 8

περιεχομένου, η ανάπτυξη, η συντήρηση, η αναλυτική μέτρηση και η διαφήμιση. Μια από τις σοβαρότερες παρανοήσεις είναι να αντιμετωπιστεί ο Ιστός σαν απλή επέκταση των εκστρατειών μάρκετινγκ της επιχείρησης, ή σαν «φθηνή» θεσμική προπαγάνδα. Κατά την προώθηση μιας επιχείρησης στο διαδίκτυο, είτε είναι ένα θεσμικό site είτε μια περιοχή για on-line αγορές/ηλεκτρονικές ανταλλαγές, είναι απαραίτητο να κατανοούμε ότι αυτό σημαίνει συνδιαλλαγή με τα μέσα, με πολύ ιδιαίτερα χαρακτηριστικά. Ο γνωστός γκουρού του μάρκετινγκ, ο Philip Kotler (1999), στο πρόσφατο βιβλίο του κάνει την ακόλουθη παρατήρηση για το μάρκετινγκ: «Είχα ένα ειδύλλιο 38 ετών με το μάρκετινγκ και συνεχίζει να μου κεντρίζει το ενδιαφέρον. Όταν σκεφτόμαστε ότι τελικά καταλαβαίνουμε το μάρκετινγκ, αρχίζει μία καινούργια διαδρομή και πρέπει να την ακολουθήσουμε όσο καλύτερα μπορούμε». Αυτό το άρθρο εστιάζει στον τρόπο με τον οποίο το μάρκετινγκ αλλάζει την εστίαση και τη μορφή του δεδομένου, ότι κινούμαστε προς μία εποχή πληροφοριών με το ηλεκτρονικό εμπόριο και τις ηλεκτρονικές αγορές του. Οι ηλεκτρονικές αγορές επιτρέπουν στους καταναλωτές να καθίσουν στην άνεση των νοικοκυριών τους και να ερευνήσουν και να αγοράσουν τα αγαθά τους. Δεν υπάρχουν πλήθη, προβλήματα στάθμευσης ή σειρά αναμονής ελέγχων. Κάποιος μπορεί να αγοράσει στο μέσο της νύχτας και από οποιοδήποτε μέρος του κόσμου. Με το πάτημα ενός κουμπιού, ουσιαστικά οποιοδήποτε προϊόν μπορεί να παραγγελθεί από οποιοδήποτε μέρος του κόσμου. Αυτή είναι η δύναμη του ηλεκτρονικού εμπορίου.

Το ηλεκτρονικό εμπόριο μπορεί να είναι οποιαδήποτε site με εμπορικούς σκοπούς που υπάρχει στο διαδίκτυο, ανεξάρτητα από τα χαρακτηριστικά του site. Μια ταξινόμηση αυτών των δραστηριοτήτων σύμφωνα με τους διαφορετικούς αμερόληπτους στόχους μας οδηγεί σε τέσσερις βασικές μορφές της χρήσης του Διαδικτύου για την επιχείρηση :

Online promotion Online Shopping Online Service and Online Collaboration.

O στόχος του Online Promotion είναι να παρέχει ένα διαφημιστικό μήνυμα το οποίο απευθύνεται στη συγκεκριμένη ομάδα πελατών γρήγορα και οικονομικά. Μια βασική υπηρεσία μέσω του Διαδικτύου είναι η πώληση προϊόντων, Online Shopping. Οι βασικές προϋποθέσεις για ένα online shop είναι ένας κατάλογος προϊόντων και μια ασφαλής συναλλαγή για τη παραγγελία και την πληρωμή των προϊόντων και των υπηρεσιών.

Το Online-service αποσκοπεί στην παροχή υπηρεσιών μέσω του Διαδικτύου. Αυτές οι υπηρεσίες μπορεί να είναι δωρεάν ή ο χρήστης πρέπει να καταβάλει μια αμοιβή για αυτό. Το σημαντικό πλεονέκτημα είναι ότι αυτές οι υπηρεσίες μπορούν να προσπελαστούν από παντού στο κόσμο οποιαδήποτε στιγμή. Online Collaboration ονομάζονται όλες τις στρατηγικές μέσω τις οποίες οι χρήστες έρχονται σε επαφή με άλλους χρήστες. Πολύ δημοφιλή είναι τα φόρουμ χρηστών(user forums). Ένας άλλος πολύ κοινός τρόπος είναι δωμάτια συνομιλίας (chat rooms). Ο στόχος του Online Collaboration είναι η μετάδοση μιας ιδέας σε μια συγκεκριμένη ομάδα, η οποία δεν μπορεί να δημιουργηθεί μέσω της κλασικής διαφήμισης. Το ηλεκτρονικό κατάστημα (online shop) θα κάνει επίσης κάποια προώθηση των προϊόντων μέσω του ηλεκτρονικού ταχυδρομείου ή θα παράσχει υπηρεσίες στον πελάτη για να τον δελεάσει να μείνει πελάτης του. Οι επιτυχείς διαδικτυακές παρουσιάσεις είναι ένα αναπόσπαστο κομμάτι ολόκληρου του μάρκετινγκ και της στρατηγικής επικοινωνιών. Απαιτούνται οι εξής γενικές αρχές του e-marketing για τις παρουσιάσεις αυτές: • Διαλογικό και εύκαμπτο • Πληροφοριακό • Στιγμιαίο • Μετρήσιμο • Προσιτό και • Διαισθητικά περιηγήσιμο

Page 9: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 9

Είναι σημαντικό να οργανωθεί το μοντέλο ηλεκτρονικού εμπορίου κατά τέτοιο τρόπο, έτσι ώστε χρησιμοποιεί τις 6 αρχές του e-marketing αφ' ενός, και, αφ' ετέρου να ικανοποιούν τον πελάτη ή τις προσωπικές απαιτήσεις του χρήστη για τις υπηρεσίες, τα προϊόντα και τις πληροφορίες. Αυτό απαιτείται να είναι γνωστό για την κατανόηση της συμπεριφοράς, των αναγκών και των προσδοκιών της συγκεκριμένης ομάδας. Εκτός από το παραδοσιακό μάρκετινγκ που βασίζεται στην έρευνα αγοράς το e-marketing μπορεί και πρέπει να χρησιμοποιεί τα δεδομένα που δίνονται από τους χρήστες ενώ περιηγούνται μέσα στην ιστοσελίδα. Εδώ το marketing στηρίζεται στην άδεια που παρέχει ο χρήστης για την χρησιμοποίηση των προσωπικών του δεδομένων για περαιτέρω επικοινωνία, και με αυτόν τον τρόπο επιτυγχάνεται μια πολλά υποσχόμενη πελατειακή σχέση.

Εδώ τα δεδομένα του χρήστη θεωρούνται πραγματικός θησαυρός. Για να χρησιμοποιηθεί απαιτείται ένα καλό επιχειρησιακό μοντέλο, τεχνικές αποθήκευση δεδομένων και φυσικά τεχνικές εξόρυξης δεδομένων. Ένα καλό μοντέλο χρήση είναι η βάση για όλες τις δραστηριότητες. Εντούτοις, τέτοιες ομάδες πελατών δεν είναι στατικές, αλλά αλλάζουν με την πάροδο του χρόνου. Το Διαδίκτυο είναι ένα γρήγορο μέσο. Το συμφέρον των ομάδων των πελατών αυτών θα αλλάξει γρήγορα. Οι πελάτες θα απομακρυνθούν από έναν προμηθευτή για να πλησιάσουν αργότερα κάποιον άλλον. Και εκτός από αυτό προκύπτει και η ερώτηση: Είναι οι υπηρεσίες ή τα προϊόντα σας κατάλληλα να πουληθούν μέσω του Διαδικτύου; Πώς θα πρέπει να είναι οι ιστοσελίδες σας; Ποιες τεχνολογικές εγκαταστάσεις έχει ο πελάτης που επισκέπτεται την ιστοσελίδα σας;

Για να διατηρηθεί το ενδιαφέρον του πελάτη για τον ιστοχώρο σας είναι πολύ βασικό να δημιουργηθεί μια ισχυρή πελατειακή σχέση και να προσφέρονται υπηρεσίες που θα προσελκύουν τον πελάτη να επισκέπτεται την ιστοσελίδα σας συχνά, για να αγοράζει προϊόντα και υπηρεσίες. Η ανάγκη για την ανάπτυξη συγκεκριμένων στρατηγικών marketing για το Διαδίκτυο συνεπάγετε ότι μερικές παραδοσιακές αρχές του marketing πρέπει να προσαρμοσθούν, ή ακόμα και να εφευρεθούν ξανά. Ένα ηλεκτρονικό κατάστημα προσφέρει όλα τα συστατικά (π.χ. μάρκετινγκ/πώληση δεδομένων, δεδομένα κεντρικών υπολογιστών, web meta data) για την επίλυση και την αυτοματοποίηση στόχων (βλ. το σχέδιο 1). Όταν ένας πελάτης επισκέπτεται μια ιστοσελίδα αφήνει το ίχνη δεδομένων που μπορούν να χρησιμοποιηθούν για την κατανόηση των αναγκών των πελατών, τις επιθυμίες και τις απαιτήσεις τους.

Το διαδίκτυο μπορεί να θεωρηθεί για τις εταιρίες ως ένα αναπόσπαστο κομμάτι του μοντέρνου marketing και αυτό συμβαίνει γιατί :

• Μπορεί να χρησιμοποιηθεί για την πλήρη κάλυψη των λειτουργιών της εταιρίας και των διαδικασιών διανομής προϊόντων και υπηρεσιών.

• Είναι ένα πανίσχυρο μέσο επικοινωνιών που μπορεί να ενώσει ακόμα και εντελώς διαφορετικά κομμάτια της επιχείρησης, όσον αφορά την λειτουργία τους.

• Διευκολύνει την διαχείριση πληροφοριών, η οποία πλέον θεωρείτε ως ένα από τα πιο σημαντικά εργαλεία marketing για την διαμόρφωση στρατηγικών και υλοποιήσεων.

• Η μελλοντική εξέλιξη του διαδικτύου θα αποτελέσει σημαντικό ρόλο στο οραματισμό των επιχειρήσεων.

Χωρίς επαρκής πληροφορίες, οι επιχειρήσεις θα βρίσκονται σε μειονεκτική θέση όσον αφορά τους ανταγωνιστές της και το εξωτερικό περιβάλλον της. Οπότε η έγκυρη και σωστά χρονισμένη πληροφόρηση για την βιομηχανία, την αγορά, την νέα τεχνολογία, τους ανταγωνιστές και τους πελάτες είναι ένας σημαντικός παράγοντας στην ικανότητα μιας επιχείρησης που καταστρώνει στρατηγικές και ανταγωνίζεται σε μια τέτοια αγορά.

Page 10: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 10

1.2.1 Ορισμός E-marketing

Το διαδικτυακό marketing μπορεί να ορισθεί ως η χρήση του διαδικτύου και των σχετικών ψηφιακών τεχνολογιών για την επίτευξη στόχων marketing και την υποστήριξη των μοντέρνων ιδεών marketing.

Αυτές οι τεχνολογίες είναι το διαδίκτυο και άλλα ψηφιακά μέσα όπως η ασύρματη τεχνολογία(κινητών). Στην πράξη, το διαδικτυακό marketing εμπεριέχει την χρήση της ιστοσελίδας μιας επιχείρησης σε συνδυασμό με online τεχνικές διαφήμισης όπως είναι: μηχανές αναζήτησης, banner advertising, άμεση αποστολή e-mail, και σύνδεσμοι ή υπηρεσίες από άλλες ιστοσελίδες για την απόκτηση νέων πελατών αλλά και για την παροχή υπηρεσιών στους πελάτες. E-marketing Προσδιορισμός

Ο όρος “Διαδικτυακό Marketing” αναφέρεται σε μια όψη για το πώς το διαδίκτυο μπορεί να χρησιμοποιηθεί σε συνδυασμό με παραδοσιακά μέσα για την απόκτηση και παροχή υπηρεσιών σε πελάτες. Ένας εναλλακτικός όρος του e-marketing είναι το ότι μπορεί να θεωρηθεί ότι έχει μια ευρύτερη βλέψη όσον αφορά το διαδίκτυο, ψηφιακή τηλεόραση και κινητής τεχνολογίας. Ο ορισμός του marketing σύμφωνα με το Chartered Institute of Marketing(www.cim.co.uk) είναι:

Το marketing είναι η διαχείριση διαδικασιών για την αναγνώριση, πρόβλεψη και ικανοποίηση των αναγκών των πελατών αποδοτικότερα. Σύμφωνα με αυτόν τον ορισμό το marketing επικεντρώνετε στo πελάτη, ενώ στην ίδια στιγμή αφήνει να εννοηθεί μια ανάγκη για συνεργασία με άλλες λειτουργίες της επιχείρησης για καλύτερη αποδοτικότητα.

Ο Smith και ο Chaffey(2001) τονίζουν ότι η τεχνολογία του διαδικτύου μπορεί να χρησιμοποιηθεί για την υποστήριξη αυτών των στόχων όπως :

Αναγνώριση – το διαδίκτυο χρησιμοποιείται από το marketing για την αναγνώριση των αναγκών και επιθυμιών του πελάτη.

Πρόβλεψη – το διαδίκτυο παρέχει ένα επιπλέων κανάλι με το οποίο οι πελάτες μπορούν να έχουν πρόσβαση στις πληροφορίες και να κάνουν τις αγορές τους.

Ικανοποίηση – ένας παράγοντας κλειδί στης επιτυχία του e-marketing είναι η επίτευξη της ικανοποίησης του πελάτη μέσω των ηλεκτρονικών καναλιών, αυτό περιλαμβάνει την ευχρηστία της ιστοσελίδας, το αν λειτουργεί επαρκώς και το πώς παρουσιάζονται τα προϊόντα.

Ένας ευρύτερος ορισμός έχει αναπτυχθεί από τους Dibb, Simkin, Pride και Ferrell(Dibb et al .2000): Το Marketing αποτελείτε από προσωπικές και επιχειρησιακές δραστηριότητες που διευκολύνουν και διεκπεραιώνουν ικανοποιητικές σχέσεις συναλλαγών σε ένα δυναμικό περιβάλλον μέσω δημιουργίας, διανομής, προβολής και τιμολόγησης αγαθών, υπηρεσιών και ιδεών.

Αυτός ο ορισμός είναι χρήσιμος από τη στιγμή που επισημαίνει τις διαφορετικές δραστηριότητες του marketing που είναι αναγκαίες για να επιτευχθεί η «σχέση συναλλαγών», η ανάπτυξη του προϊόν, η τιμολόγηση, η προβολή του και η διανομή. Νεότερα στην ιστορία του marketing, γινόταν αντιληπτό ότι το marketing στόχευε στις συναλλαγές. Αλλά τουλάχιστον δύο τάσεις ότι αυτό είναι ένας πολύ περιορισμένος χαρακτηρισμός του marketing. Πρώτα, στη δεκαετία του 90’ η θεωρία του marketing προσέκλινε προς αυτή των σχεσιακών συναλλαγών. Και αυτό γιατί το marketing ιστορικά έχει αποδείξει πώς είναι κυρίως πιο ικανό για την απόκτηση νέων πελατών και όχι για την διατήρηση των είδη υπάρχων . Και οι αποδείξεις λένε πως υπάρχει ένα πολύ μεγάλο οικονομικό κέρδος στην διατήρηση των πελατών μέσω της εμπιστοσύνης που αυτοί μπορεί

Page 11: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 11

να δέιχνουν. Κάποιοι έχουν συνθέσει αυτές τις απόψεις ως έννοιες του σχεσιακού marketing μαζί με την ανάγκη των 1 προς 1 σχέσεων με προσωπικούς πελάτες. Όπως δηλώνει και ο Kotler στο κείμενο του για την διαχείριση του marketing «το marketing των συναλλαγών είναι ένα κομμάτι μιας μεγαλύτερης έννοιας που ονομάζεται σχεσιακό marketing».

Ο δεύτερος αντίκτυπος στη φιλοσοφία μάρκετινγκ είναι η πραγματικότητα των αλληλεπιδράσεων που βασίζονται στο web, οι οποίες είναι από τις πιο κοινές μορφές ψηφιακών αλληλεπιδράσεων. Στο περιβάλλον βασισμένο στο web, οι πελάτες μπορούν να αρχίσουν μία αλληλεπίδραση οποιαδήποτε στιγμή και από οπουδήποτε, καθώς επίσης, και κατά τη διάρκεια, ή και μετά από τη συναλλαγή, το οποίο κάνει το παράδειγμα συναλλαγής πολύ περιοριστικό όταν σκεπτόμαστε το ηλεκτρονικό μάρκετινγκ. Περαιτέρω, οι περισσότερο βασισμένες στο web αλληλεπιδράσεις τείνουν να γίνουν πιο προσωποποιημένες, τουλάχιστον με κάποιο ελάχιστο τρόπο, όπως η αναγνώριση ενός επισκέπτης που χρησιμοποιεί ένα cookie. Όπως επισημαίνουν ο Peppers και o Rogers (1999), «To σχεσιακό μάρκετινγκ προσφάτως έχει γίνει πρακτικό και κόστισε αποδοτικά σε μια μεγάλη κλίμακα λόγω της τεχνολογίας βάσεων δεδομένων και του Διαδικτύου». Αυτές οι τάσεις καταδεικνύουν ότι το μάρκετινγκ πρέπει να καθοριστεί από την προοπτική σχεσιακών συναλλαγών παρά από μια προοπτική συναλλαγών. Οι σχεσιακές συναλλαγές είναι συναλλαγές και αλληλεπιδράσεις που μνημονεύονται από την εταιρία, συνήθως σε μια βάση δεδομένων, και χρησιμοποιούνται στην προσαρμογή μερικών πτυχών της αλληλεπίδρασης με έναν δεδομένο πελάτη. Το πεδίο του ηλεκτρονικού μάρκετινγκ, έπειτα, περιλαμβάνει τα εργαλεία που επιτρέπουν τις αλληλεπιδράσεις με τα άτομα που βρίσκονται σε ψηφιακό και διαλογικό περιβάλλον δικτύου (DNI).

Αυτό αποτελεί τις διαλογικές επικοινωνίες χρησιμοποιώντας τα ψηφιακά μέσα. Όλες, οι αλληλεπιδράσεις που βασίζονται στο web είναι μια μορφή ψηφιακών αλληλεπιδράσεων δικτύου. Μία τέτοια αλληλεπίδραση μπορεί γίνει για οποιαδήποτε πτυχή μιας πιθανής σχέσης μάρκετινγκ ή μιας συγκεκριμένης συναλλαγής. Η αλληλεπίδραση μπορεί να επεκταθεί στην πραγματική παράδοση ενός αυξανόμενου αριθμού ψηφιακών προϊόντων όπως χάρτες, τέχνη, ειδήσεις, λογισμικό, φωτογραφίες, εισιτήρια, γραπτά υλικά, πληροφορίες, μουσική, ταινίες, κ.λπ. Οι ψηφιακές αλληλεπιδράσεις θα κάλυπταν το αναφερόμενο ως μάρκετινγκ σε «υπολογιστικά περιβάλλοντα».

1.2.2 E – Marketing Functions

1.2.2.1 Οι βασικές λειτουργίες για συναλλαγές ( Τα 4Ρs)

Τι λειτουργίες χρειάζονται για να λειτουργήσουν και να καθιστούν δυνατό τις συσχετιστικές συναλλαγές σε ψηφιακά, δικτυακά και αλληλεπιδραστικά περιβάλλοντα; Η πρόσφατη θεωρία μάρκετινγκ εστιάζει στην ιδέα των συναλλαγών, και αναγνωρίζει την προσφορά, την αξιολόγηση, την επικοινωνία και προσεγγίζει την προσφορά αυτή ως τις τέσσερις απαραίτητες λειτουργίες του μάρκετινγκ. Τα λεγόμενα λοιπόν τέσσερα P είναι: Price (Τιμή), Product(Προϊόν), Promotion(Προώθηση) και Place(Τοποθεσία). Επιπροσθέτως, των συναλλαγματικών αυτών λειτουργιών η επιστήμη του μάρκετινγκ χρειαζόταν να παρέχει σχετικές λειτουργίες του E-marketing όπου είναι το Personalization (Προσωποποίηση), Security (Ασφάλεια), Privacy (Προστασία προσωπικών δεδομένων) , Site (Δικτυακή τοποθεσία), και Customer Service (Υπηρεσίες Πελατών). Παρακάτω αναλύονται λίγο περισσότερο.

Site: (Οπουδήποτε, οποτεδήποτε ψηφιακό σημείο πρόσβασης): Ένα ψηφιακό μέσο βασισμένο στην ανάπτυξη σχέσεων απαιτεί ένα από οπουδήποτε, οποτεδήποτε ψηφιακό σημείο πρόσβασης. Χρησιμοποιείται ο όρος Site γιατί είναι κοινά κατανοητός στην

Page 12: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 12

διάλεκτο της βιομηχανίας, για να προσδιορίσουμε αυτή τη λειτουργία. Αναγνωρίζουμε ότι ένα web site είναι μόνο η ¨βιτρίνα¨ του Site. Το σημείο πρόσβασης μπορεί να αλληλεπιδράσει για κάθε ¨τύπο¨ συσχετιστικής συναλλαγής. Π.χ. ένας πελάτης μπορεί να αποκτήσει οποιαδήποτε πληροφορία που έχει σχέση με το προϊόν, ή την τιμολόγησή του, ή να έχει πρόσβαση σε τελευταίες καμπάνιες πωλήσεων ή να ζητήσει και υποστήριξη. Το σημείο πρόσβασης συμβιβάζεται με κάθε λειτουργία του Emarketing και θεωρείται ως μία υπερθετική λειτουργία.

Προσωποποίηση: Εφ’ όσον η ανάπτυξη σχέσεων είναι ο στόχος του μάρκετινγκ, ένα σημαντικό βήμα είναι η αναγνώριση των χρηστών και η συλλογή πληροφοριών για αυτούς, όπου είναι και η βασική ιδέα της Προσωποποίησης. Η προσωποποίηση προσδιορίζεται ως κάθε τύπος προσαρμογής που συμβαίνει βάση της ιδιαίτερης αναγνώρισης ενός χρήστη. Για παράδειγμα, ένα cookie που τοποθετείται στον ηλεκτρονικό υπολογιστή του χρήστη επιτρέπει την ιστοσελίδα να εμφανίζει στο χρήστη μία κεντρική σελίδα η οποία θα περιέχει πολύ λίγα γραφικά αν για π..χ. η σύνδεσή του είναι PSTN. Η προσωποποίηση μπορεί να εφαρμοστεί σε κάθε τύπο mix E-marketing, καθώς μπορεί να επηρεάζει κάθε άλλη λειτουργία του που έχει να κάνει σχέση με την εμπειρία του χρήστη.

Privacy: Η συλλογή των πληροφοριών για προσωποποίηση ενισχύει παραπάνω την δυσκολία της απόφασης για το πώς θα χρησιμοποιηθούν αυτές οι πληροφορίες και ακόμα παραπάνω για την πρόσβαση σ’ αυτές. Πρέπει επίσης να σημειωθεί ότι αποφάσεις σχετικά με το Privacy είναι αναπόφευκτες αφού οι πληροφορίες για τους ξεχωριστούς χρήστες συλλέγονται και αποθηκεύονται. Τέλος, οι θεωρήσεις περί Privacy αναγνωρίζονται απ’ όλες τις κυβερνητικές πολιτικές σε οποιαδήποτε κοινωνία γιατί συχνά συμβαδίζουν με την ισχύς των νόμων.

Ασφάλεια: Μία άλλη “απαραίτητη” λειτουργία του E-Marketing καθώς μεταφερόμαστε στο σκεπτικό της απλοποίησης των συναλλαγών, είναι αυτή της ασφάλειας. Υπάρχουν τουλάχιστον δύο παράμετροι της ασφάλειας, όπου η πρώτη και η σημαντικότερη είναι αυτή της ασφάλειας των συναλλαγών. Ένα παράδειγμα, είναι η διασφάλιση ότι τρίτα πρόσωπα δεν υπάρχει περίπτωση να παραβιάσουν τις όποιες συναλλαγές. Η αναγκαιότητα για αριθμούς πιστωτικής κάρτας και άλλες κρίσιμες πληροφορίες όπου εκθέτει ο χρήστης παίρνοντας και το αντίστοιχο ρίσκο μέσω του διαδικτύου, περιλαμβάνει παραπέρα και την αύξηση της εμπιστοσύνης προς τον marketer της επιχείρησης, αλλά και γενικότερα της εμπιστοσύνης και εντιμότητας των διαδικτυακών συναλλαγών, πέραν του προϊόντος. Αυτού του είδους η εμπιστοσύνη περιλαμβάνει και την αναγνώριση της αμείωτης προσπάθειας του marketer σε θέματα σχετικά με την ασφάλεια.

Customer Service: Πολλές πρόσφατες έρευνες για το marketing mix περιλαμβάνουν το Customer Service, ως μία λειτουργία υποστήριξης που απαιτείται αρκετά συχνά για να πραγματοποιηθεί μία συναλλαγή. Η εισαγωγή του «χρόνου» στο διάγραμμα συναλλαγών, ( ο κύριος παράγοντας ώστε να μεταφερθούμε σε μία σχεσιακή προοπτική) σημαίνει ότι ο μάρκετερ θα πρέπει να δώσει προσοχή ώστε να παρέχεται συνεχώς στον πελάτη υποστήριξη. Αυτό επιβάλλει τη θεώρηση του Customer Service (στην ευρεία του έννοια) ως μία αυξανόμενη και απαραίτητη λειτουργία. Η υπηρεσία μπορεί να αναφέρεται γύρω απ’ το προϊόν, την διαθεσιμότητα, τα πλάνα υπηρεσιών, την τιμολόγηση ή τέλος τις προωθητικές ενέργειες. Για το λόγο αυτό η υποστήριξη του πελάτη είναι μία υπερθετική λειτουργία.

Τελειώνοντας τις λειτουργίες του Emarketing και για να ολοκληρώσουμε αυτό το κεφάλαιο, καλό θα ήταν να αναφέρουμε και τα οφέλη της παρουσίας στο Διαδίκτυο τα οποία μπορούν να συνοψιστούν χρησιμοποιώντας τα «6Cs», παραδείγματος χάριν, του Bocij (1999):

Page 13: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 13

1) Μείωση δαπανών. Πραγματοποιείται μέσω της μείωσης της ανάγκης για έρευνες πωλήσεων και μάρκετινγκ και τη μείωση της ανάγκης για εκτύπωση υλικού των επικοινωνιών του μάρκετινγκ, το οποίο δημοσιεύεται αντ' αυτού στον ιστοχώρο.

2) Νέες δυνατότητες. Το Διαδίκτυο παρέχει νέες ευκαιρίες για νέα προϊόντα και υπηρεσίες και για την εκμετάλλευση των νέων αγορών.

3) Ανταγωνιστικό πλεονέκτημα. Εάν μια επιχείρηση εισαγάγει τις νέες ικανότητες πριν τους ανταγωνιστές της, κατόπιν θα επιτύχει ένα πλεονέκτημα έως ότου την αντιγράψουν οι ανταγωνιστές της. Παραδείγματος χάριν, οι πελάτες που μεταφέρθηκαν στο Federal Express λόγω των νέων υπηρεσιών Διαδικτύου είναι πιθανό να είναι λιγότερο διατεθειμένοι, να επιστρέψουν σε μία υπάρχουσα εταιρεία διανομής, δεδομένου ότι είναι «δεσμευμένοι» στη χρησιμοποίηση των ιδιαίτερων εργαλείων που παρέχονται από τον Federal Express.

4) Βελτίωση επικοινωνιών. Αυτές περιλαμβάνουν τις βελτιωμένες επικοινωνίες με τους πελάτες, το προσωπικό, τους προμηθευτές και τους διανομείς.

5) Έλεγχος. Το Διαδίκτυο και τα intranets μπορούν να παρέχουν καλύτερη έρευνα μάρκετινγκ μέσω της ανίχνευσης της συμπεριφοράς των πελατών τους και τον τρόπο με τον οποίο το προσωπικό παραδίδει τις υπηρεσίες.

6) Βελτίωση εξυπηρέτησης πελατών. Παρέχεται η δυνατότητα αλληλεπιδραστικών ερωτήσεων με την βάση δεδομένων, όπως παραδείγματος χάριν, τη διαθεσιμότητα αποθεμάτων ή τις ερωτήσεις εξυπηρέτησης πελατών.

1.2.3 Traditional Marketing vs E – Marketing

Τα τελευταία χρόνια η ανάπτυξη των υπολογιστικών δικτύων άλλαξε ουσιαστικά το σκηνικό στο χώρο της επικοινωνίας. Με τη χρήση των δικτύων, γνωστά και ως «δίκτυα αλληλεπίδρασης», πραγματοποιείται μετά από πολλά χρόνια ένας μεγάλος στόχος της πληροφορικής και των τηλεπικοινωνιών για μετάδοση και άμεση πρόσβαση σε εκατομμύρια πληροφορίες και δεδομένα. Η επανάσταση χωρίς κανένα ίχνος υπερβολής και η καθιέρωση του νέου μοντέλου αμφίδρομης επικοινωνίας πραγματοποιείται κυρίως από το μεγαλύτερο και δημοφιλέστερο δίκτυο υπολογιστών, το διαδίκτυο. Την τελευταία δεκαετία η ανάπτυξη και εξέλιξη του διαδικτύου με εκπληκτικά ταχύτατους ρυθμούς και η επίσης σύντομη υιοθέτηση του από ένα κοινό που αυξάνεται με σχεδόν γεωμετρικούς ρυθμούς, καθιερώνει ουσιαστικά το διαδίκτυο ως επικοινωνιακό μέσο με ακόμα μεγαλύτερες προοπτικές ανάπτυξης. Οι άνθρωποι του χώρου της διαφήμισης δε θα μπορούσαν σε καμία περίπτωση να μη δείξουν ενδιαφέρον γι' αυτό το νέο δίαυλο επικοινωνίας και να μην εκμεταλλευτούν το «καινούριο», από πολλές απόψεις, κοινό του διαδικτύου. Η διαφημιστική χρήση του διαδικτύου έχει ξεκινήσει εδώ και πολύ λίγα χρόνια (ειδικότερα στην Ελλάδα) και αναζητούνται συνεχώς τρόποι και στρατηγικές ώστε το νέο αυτό μέσο να περιληφθεί αποτελεσματικά στο πρόγραμμα μάρκετινγκ και πιο συγκεκριμένα στο μείγμα προβολής μιας επιχείρησης.

Η αποτελεσματική χρήση κάθε διαφημιστικού μέσου προϋποθέτει ότι έχει μελετηθεί σωστά, ότι έχουν εντοπισθεί πιθανές ιδιαιτερότητές του, ότι μπορούν να αξιοποιηθούν τυχόν πλεονεκτήματά του και ότι φυσικά μπορούν να ξεπεραστούν τυχόν αδυναμίες του. Το διαδίκτυο σε καμία περίπτωση δεν αποτελεί πανάκεια στο χώρο της διαφήμισης. Η προσφορά του στη διαφήμιση οφείλεται ως ένα βαθμό στη διαφορετικότητά του από τα υπάρχοντα διαφημιστικά μέσα. Παρακάτω επιχειρείται μια σύγκριση της διαφήμισης μέσω του διαδικτύου με την παραδοσιακή κλασική διαφήμιση με σκοπό τη γνωριμία του Διαδικτύου και κυρίως την κατανόηση του επικοινωνιακού και διαφημιστικού του ρόλου.

Page 14: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 14

ΚΕΦΑΛΑΙΟ 2

Page 15: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 15

2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση

Η διαφήμιση ως γνωστόν, είναι μια απρόσωπη μαζική επικοινωνία. Πιο συγκεκριμένα, πρόκειται για την προσπάθεια κάθε επιχείρησης να επικοινωνήσει με πολλούς καταναλωτές μέσω ενός μηνύματος που προβάλλεται από τα Μαζικά Μέσα Ενημέρωσης και να δημιουργήσει μια θετική εικόνα γύρω από τα προϊόντα ή τις υπηρεσίες της με τελικό στόχο φυσικά την προώθηση και πώλησή τους. Το διαδίκτυο είναι σίγουρα ένα μέσο επικοινωνίας που έχει τη δυνατότητα μετάδοσης μηνυμάτων στο ευρύ κοινό, αλλά η ιδιαιτερότητά του ως διαφημιστικό μέσο έγκειται στη δυνατότητά του να λειτουργεί και ως μέσο αλληλεπίδρασης. Στις παραγράφους που ακολουθούν περιγράφεται σύντομα η έννοια και η λειτουργία της διαφήμισης μέσω του διαδικτύου.

2.1.1 Ορισμός και ιστορία της On-line Διαφήμισης

Διαφήμιση μέσω του διαδικτύου ή διαφορετικά on-line διαφήμιση (όρος που υιοθετήθηκε τα τελευταία χρόνια από τον ακαδημαϊκό και διαφημιστικό χώρο) είναι το είδος της διαφήμισης που χρησιμοποιεί αποκλειστικά ως μέσο επικοινωνίας και προβολής το διαδίκτυο και πιο συγκεκριμένα το βασικό εργαλείο του διαδικτύου, τον Παγκόσμιο Ιστό Πληροφοριών (World Wide Web).

Η ιστορία της on-line διαφήμισης ξεκινάει στις αρχές της δεκαετίας του 90. Για τις πρώτες διαφημίσεις στο διαδίκτυο χρησιμοποιήθηκε η υπηρεσία του ηλεκτρονικού ταχυδρομείου. Οι πρώτες αντιδράσεις στις διαφημίσεις αυτές ήταν έντονα αρνητικές.

Οι χρήστες του διαδικτύου εκείνης της εποχής που στην πλειοψηφία τους ήταν ακαδημαϊκοί, φοιτητές και εργαζόμενοι μεγάλων ερευνητικών κέντρων θεώρησαν την on-line διαφήμιση παράταιρη με το μέχρι τότε πνεύμα της χρήσης του διαδικτύου που είχε να κάνει περισσότερο με την ανταλλαγή επιστημονικών και πνευματικών ιδεών.

Το ρεύμα αυτό αντίθεσης προς τη διαφημιστική και εμπορική χρήση του διαδικτύου ονομάστηκε Netiquette και υπήρξε τροχοπέδη στις πρώτες on-line διαφημιστικές προσπάθειες. Τα πράγματα άλλαξαν με την εμφάνιση του πρώτου on-line περιοδικού στην Αμερική που φιλοξενούσε στις ιστοσελίδες του διαφημιστικά μηνύματα προϊόντων και επιχειρήσεων. Το Netiquette αποδυναμώνεται και το διαδίκτυο αρχίζει να υιοθετείται από αρκετές επιχειρήσεις ως διαφημιστικό μέσο.

Σήμερα, για τις περισσότερες μορφές της on-line διαφήμισης χρησιμοποιείται η υπηρεσία του Παγκόσμιου Ιστού Πληροφοριών λόγω του χαμηλού κόστους διάθεσης και διάδοσης πληροφοριών σε ένα πολύ μεγάλο κοινό, αλλά κυρίως λόγω της αλληλεπίδρασης του συγκεκριμένου μέσου που παρέχει στις επιχειρήσεις τη δυνατότητα αλληλεπιδραστικής και διαπροσωπικής επικοινωνίας με τους καταναλωτές. Αυτός είναι ο λόγος που θα ασχοληθούμε περισσότερο με την on-line διαφήμιση μέσω του Παγκόσμιου Ιστού Πληροφοριών και συγκεκριμένα με τη βασική μορφή που είναι οι διαφημιστικές ιστοσελίδες προϊόντων, υπηρεσιών και επιχειρήσεων που φιλοξενούνται φυσικά στον Παγκόσμιο Ιστό Πληροφοριών.

2.1.2 Έννοια και Χαρακτηριστικά της On-line Διαφήμισης

Page 16: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 16

Με τον Παγκόσμιο Ιστό Πληροφοριών και τις υπόλοιπες υπηρεσίες του διαδικτύου όπως είναι το ηλεκτρονικό ταχυδρομείο και οι ομάδες ειδήσεων, οι υπεύθυνοι της διαφήμισης έχουν τη δυνατότητα να διατηρήσουν στοιχεία της παραδοσιακής επικοινωνίας και διαφήμισης, όπως η μαζικότητα ως προς την προσέγγιση του κοινού, αλλά και να καινοτομήσουν δίνοντας πολλές εναλλακτικές λύσεις σε πολύπλοκες αποφάσεις που αφορούν την επιλεκτικότητα του κοινού κ.ά. 2.1.2.1 Μαζική και διαπροσωπική επικοινωνία

Με τον Παγκόσμιο Ιστό Πληροφοριών καταργείται μετά από πολλές δεκαετίες η απρόσωπη μαζική επικοινωνία «μιας κατεύθυνσης» προς όφελος και της επιχείρησης αλλά και του κοινού. Από την πλευρά της επιχείρησης είναι εφικτή η πολυπόθητη για τους υπεύθυνους της διαφήμισης «ανάδραση» (feedback) και «αλληλεπίδραση» (interaction). Αυτό σημαίνει ότι οι υπεύθυνοι διαφήμισης μπορούν να ελέγξουν άμεσα και σε σύντομο χρονικό διάστημα τις αντιδράσεις των καταναλωτών εφόσον έχουν τη δυνατότητα να γνωρίζουν στοιχεία, όπως τον αριθμό των ατόμων που είδαν το διαφημιστικό μήνυμα, αλλά και τον τρόπο και το χρόνο που εκτέθηκαν τα παραπάνω άτομα στη διαφήμιση. Τα πράγματα αλλάζουν και από την πλευρά του κοινού. Οι χρήστες του διαδικτύου που εκτίθενται στα διαφημιστικά μηνύματα μπορούν να ελέγξουν την ποσότητα και το είδος των πληροφοριών που θα αποκτήσουν ακόμα και το χρόνο που θα αφιερώσουν για να πάρουν αυτές τις πληροφορίες (advertising on demand). Καθιερώνεται με άλλα λόγια ένα είδος διαφημιστικού διαλόγου ανάμεσα στην επιχείρηση και το κοινό που χαρακτηρίζεται από την ανταλλαγή πληροφοριών και εντυπώσεων. Ουσιαστικά με τη χρήση του μόνου προς το παρόν αμφίδρομου επικοινωνιακού μέσου πραγματοποιείται ένας μεγάλος στόχος των διαφημιστών και επιχειρήσεων για μαζική και ταυτόχρονα διαπροσωπική επικοινωνία με το κοινό (σχήμα 1). Σχήμα 1

Page 17: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 17

2.1.2.2 Ενεργό Κοινό

Η δυνατότητα «αλληλεπίδρασης» με τη χρήση του διαδικτύου και του Παγκόσμιου Ιστού Πληροφοριών οδήγησε σε ένα κοινό που λειτουργεί «ενεργά» από την αρχή και μέχρι το τέλος της έκθεσής του στο διαφημιστικό μήνυμα. Αυτό σημαίνει ότι αρχικά ο χρήστης επιλέγει το αν και πότε θα εκτεθεί στο διαφημιστικό μήνυμα. Επίσης επιλέγει και το πώς θα εκτεθεί στο μήνυμα επιλέγοντας τις πληροφορίες που θα αντλήσει ζητώντας περισσότερες όταν του δίνεται η δυνατότητα.

2.1.2.3 Μετάδοση μεγάλης ποσότητας πληροφοριών

Ο Παγκόσμιος Ιστός Πληροφοριών βασίζεται στην τεχνολογία των ηλεκτρονικών υπολογιστών και χρησιμοποιεί το «υπερκείμενο» (hypertext). Το τελευταίο αποτελείται από κόμβους και συνδέσμους που δίνουν τη δυνατότητα στο χρήστη με ένα απλό «κλικ» του ποντικιού να μεταφέρεται από ιστοσελίδα σε ιστοσελίδα και να επιλέγει κάθε φορά τις πληροφορίες που θέλει. Αυτό σημαίνει ότι κάθε χρήστης εκτίθεται διαφορετικά στη διαφήμιση και πάντα σύμφωνα με τις επιθυμίες και τα ενδιαφέροντά του. Με τη χρήση του υπερκειμένου υπάρχει πλέον η δυνατότητα όχι μόνο μετάδοσης πολλών πληροφοριών αλλά και δόμησής τους με τέτοιο τρόπο που να διευκολύνει την περιήγηση του κάθε χρήστη.

2.1.2.4 Χαμηλό κόστος

Το χαμηλό κόστος μετάδοσης της οn-line διαφήμισης αναφέρεται τόσο στο κόστος προσέγγισης του κοινού όσο και στο κόστος μετάδοσης πληροφοριών. Όπως αναφέρθηκε και παραπάνω το κοινό του διαδικτύου αποφασίζει πότε θα εκτεθεί στο διαφημιστικό μήνυμα με αποτέλεσμα το κόστος προσέγγισης του κοινού από την πλευρά της επιχείρησης να μειώνεται σημαντικά. Επίσης με τη χρήση του υπερκειμένου και την τεχνολογία των πολυμέσων έχουμε τη δυνατότητα μετάδοσης μεγάλου όγκου πληροφοριών με ελάχιστο κόστος, αλλά και σημαντικά χαμηλό κόστος αναπροσαρμογής του περιεχομένου των μηνυμάτων.

2.1.2.5 Δυνατότητα αναπροσαρμογής του διαφημιστικού μηνύματος

Η δυνατότητα του κοινού να εκτίθεται στα διαφημιστικά μηνύματα του διαδικτύου ανάλογα με τις ιδιαίτερες ανάγκες του για πληροφόρηση αλλάζει τη νοοτροπία που επικρατούσε στο χώρο της διαφήμισης τα τελευταία χρόνια. Οι επιχειρήσεις και οι υπεύθυνοι της διαφήμισης προσανατολίζονται πλέον προς την ικανοποίηση των αναγκών και επιθυμιών του κάθε χρήστη ξεχωριστά εφόσον αυτό είναι δυνατόν. Αυτό, σε συνδυασμό με την εύκολη και γρήγορη «ανάδραση» που παρέχει το μέσο και τη χρήση του υπερκειμένου, δίνουν τη δυνατότητα στην επιχείρηση και στους υπεύθυνους της διαφήμισης να αναπροσαρμόζουν εύκολα και με ελάχιστο κόστος το περιεχόμενο του διαφημιστικού μηνύματος ώστε το τελευταίο να συμφωνεί με τις ανάγκες και τα ενδιαφέροντα του συγκεκριμένου αποδέκτη από το κοινό (ανάπτυξη διαπροσωπικών σχέσεων, personalization, ο πελάτης αποτελεί το επίκεντρο).

Συμπερασματικά θα μπορούσαμε να πούμε ότι το διαδίκτυο και οι υπηρεσίες του που χρησιμοποιούνται ως διαφημιστικά μέσα εισάγουν στο χώρο της διαφήμισης μια νέα μορφή

Page 18: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 18

επικοινωνίας που υπήρξε πολυπόθητος στόχος για δεκαετίες και απλοποιούν ή διαφοροποιούν αρκετές πολύπλοκες αποφάσεις των υπεύθυνων διαφήμισης στα πλαίσια του προγραμματισμού μέσων. Κάτω από κάποιες προϋποθέσεις το διαδίκτυο μπορεί να προσφέρει ουσιαστικά στο πρόγραμμα προβολής μιας επιχείρησης και να προσεγγίσει με αποτελεσματικό τρόπο το κοινό- στόχο της επιχείρησης.

2.2 Παραδοσιακή Διαφήμιση Με τον όρο παραδοσιακή διαφήμιση εννοούμε τη μετάδοση διαφημιστικών μηνυμάτων με τη χρήση παραδοσιακών μέσων διαφήμισης, δηλαδή μέσων επικοινωνίας που εδώ και πολλά χρόνια χρησιμοποιούνται ως μέσα προβολής από τις επιχειρήσεις. Τα πιο γνωστά είναι η τηλεόραση , το ραδιόφωνο, οι εφημερίδες, τα περιοδικά και το Direct Marketing.

2.2.1 Χαρακτηριστικά Παραδοσιακής Διαφήμισης Είναι πολύ δύσκολο να βγάλει κανείς γενικά συμπεράσματα για την παραδοσιακή διαφήμιση αφού κάθε μέσο έχει τις δικές του δυνατότητες και αδυναμίες. Ωστόσο παρουσιάζουν κάποια κοινά χαρακτηριστικά ως προς το μοντέλο επικοινωνίας το οποίο ακολουθούν και τη μορφή των διαφημιστικών μηνυμάτων που μεταδίδουν. Επικοινωνία μιας κατεύθυνσης

Ο διαφημιστικός λόγος των παραδοσιακών μέσων είναι στην πραγματικότητα μονόλογος από την πλευρά της επιχείρησης. Η τελευταία είναι αυτή που επιλέγει την ποσότητα και το είδος των πληροφοριών που θα μεταδώσει μέσω του διαφημιστικού μηνύματος στο κοινό, το οποίο δεν έχει τη δυνατότητα να ζητήσει περισσότερες πληροφορίες ή και γιατί όχι να ασκήσει κριτική στην επιχείρηση και στις επιλογές της.

Το μοντέλο της μονόδρομης επικοινωνίας δεν εξυπηρετεί ουσιαστικά ούτε την επιχείρηση που δεν έχει τη δυνατότητα να αντλήσει χρήσιμες πληροφορίες που αφορούν την αποτελεσματικότητα του διαφημιστικού μηνύματος, ούτε και το κοινό που δεν αντλεί τις περισσότερες φορές τις πληροφορίες που έχει ανάγκη. Επίσης η προσπάθεια του κοινού να επικοινωνήσει με την επιχείρηση (μέσω τηλεφώνου, ταχυδρομείου) τις περισσότερες φορές είναι μια πολύπλοκη διαδικασία, η οποία και αποφεύγεται (σχήμα 5).

Page 19: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 19

Τυποποιημένα και απλά μηνύματα Με τη χρήση των παραδοσιακών μέσων το διαφημιστικό μήνυμα φτάνει με την ίδια μορφή και το ίδιο περιεχόμενο σε όλο το κοινό ανεξάρτητα από τις ανάγκες και τις επιθυμίες που μπορεί να έχει κάθε καταναλωτής ξεχωριστά. Επιπλέον, εξαιτίας του υψηλού κόστους διαφήμισης που επιβάλλει σύντομες προβολές διαφημιστικών μηνυμάτων στα περισσότερα παραδοσιακά μέσα, το περιεχόμενο των μηνυμάτων απλοποιείται και περιορίζεται σε λίγες πληροφορίες που συμφωνούν με τις προτεραιότητες της επιχείρησης όχι όμως και του κοινού. Παθητικό κοινό Το κοινό των παραδοσιακών μέσων λειτουργεί παθητικά. Λειτουργεί μόνο σαν δέκτης μηνυμάτων από το μέσο. Η μόνη περίπτωση που αντιδρά «ενεργά» είναι για να αποφύγει την έκθεσή του στο διαφημιστικό μήνυμα αλλάζοντας κανάλι ή σταθμό στην τηλεόραση και στο ραδιόφωνο ή αλλάζοντας σελίδα στο περιοδικό και την εφημερίδα, ή να πετάξει σ’ ένα κάδο απορριμμάτων το φυλλάδιο που του έδωσαν, αντιδρώντας δηλαδή να δεχθεί την έκθεσή του στο συγκεκριμένο μήνυμα. Υψηλό κόστος παραδοσιακής διαφήμισης

Ο νόμος προσφοράς και ζήτησης στα παραδοσιακά μέσα δε λειτουργεί προς όφελος της επιχείρησης. Η μετάδοση ενός διαφημιστικού μηνύματος σε μέσα επικοινωνίας με μεγάλο κοινό κοστίζει πολύ ακριβά και τις περισσότερες φορές δε γίνεται σύμφωνα με τις αρχικές επιλογές της επιχείρησης και των υπεύθυνων διαφήμισης. Επίσης μεγάλο είναι το κόστος σχεδιασμού και ανάπτυξης ενός διαφημιστικού προγράμματος που συνδυάζει πολλά παραδοσιακά μέσα μαζί προκειμένου να επιτευχθούν οι διαφημιστικοί στόχοι της επιχείρησης.

Οι ιδιαιτερότητες κάθε μέσου είναι βέβαια αυτές που το καθιστούν κάθε φορά κατάλληλο για την προβολή ενός διαφημιστικού μηνύματος. Εξάλλου οι τεχνολογικές εξελίξεις των τελευταίων ετών συντέλεσαν στην παραγωγή διαφημίσεων υψηλού επιπέδου σε μερικά από τα παραδοσιακά μέσα. Ωστόσο είναι αλήθεια ότι το σκηνικό στην παραδοσιακή διαφήμιση παραμένει το ίδιο εδώ και πολλές δεκαετίες και δεν έχει προσαρμοστεί αποτελεσματικά στις ανάγκες του σύγχρονου ανθρώπου για ουσιαστική πληροφόρηση σε λίγο χρόνο. Ουσιαστικά λοιπόν, η μόνη προσαρμογή των τελευταίων ετών, έγκειται στην καινοτομία του μεταδιδόμενου μηνύματος.

Page 20: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 20

2.3 Σύγκριση Online Διαφήμισης Και Παραδοσιακής Διαφήμισης Στο σημείο αυτό θα επιχειρηθεί μια σύγκριση ανάμεσα στην on-line διαφήμιση και στην παραδοσιακή διαφήμιση. Στόχος αυτής της σύγκρισης, όπως αναφέρθηκε και παραπάνω, είναι να τονισθεί η διαφορετικότητα του διαδικτύου σαν επικοινωνιακό μέσο και να εντοπισθούν δυνατότητες και αδυναμίες του σαν μέσο προβολής διαφημιστικών μηνυμάτων.

2.3.1 Κριτήρια σύγκρισης

Για τη σύγκριση θα χρησιμοποιηθούν τα κριτήρια που χρησιμοποιούνται στα πλαίσια αποφάσεων του προγραμματισμού μέσων. Ο προγραμματιστής μέσων στοχεύει να επιλέξει το μέσο με το μεγαλύτερο κοινό που θα του δίνει όμως τη δυνατότητα να προσεγγίσει εύκολα το κοινό-στόχο (ένα κοινό με συγκεκριμένα χαρακτηριστικά) και θα του παρέχει δυνατότητες ανάδρασης και μέτρησης αποτελεσματικότητας με το χαμηλότερο δυνατό κόστος. Πιο συγκεκριμένα, θα χρησιμοποιηθούν τα παρακάτω κριτήρια:

Προσέγγιση: αναφέρεται στο μέγεθος του κοινού που μπορεί να προσεγγιστεί συνολικά από το μέσο

Επιλεκτικότητα: αναφέρεται στη δυνατότητα του υπευθύνου μάρκετινγκ να προσεγγίσει αποτελεσματικά τμήματα του κοινού με ιδιαίτερα χαρακτηριστικά.

Ανάδραση: αναφέρεται στη δυνατότητα του κοινού για ανάδραση, μετάδοση πληροφοριών διαμέσου του ίδιου του μέσου στην επιχείρηση που διαφημίζεται.

Μέτρηση αποτελεσματικότητας: αναφέρεται στη δυνατότητα εύκολης και σε σύντομο χρονικό διάστημα μέτρησης της αποτελεσματικότητας του μέσου (ως προς τη μετάδοση του διαφημιστικού μηνύματος).

Κόστος: αναφέρεται στο κόστος μετάδοσης του διαφημιστικού μηνύματος μέσω του συγκεκριμένου διαφημιστικού μέσου.

Η σύγκριση θα γίνει για κάθε κριτήριο ξεχωριστά λαμβάνοντας υπόψη κάποιες από τις ιδιαιτερότητες ορισμένων παραδοσιακών μέσων. Ωστόσο για ευνόητους λόγους δε θα γίνει λεπτομερειακή ανάλυση για κάθε μέσο ξεχωριστά. Προσέγγιση Το διαδίκτυο προσεγγίζει το μικρότερο σε μέγεθος κοινό σε σχέση με τα μέσα της παραδοσιακής διαφήμισης. Το περιορισμένο κοινό του διαδικτύου οφείλεται στην υποδομή σε υλικό (ηλεκτρονικός υπολογιστής) και γνώσεις που απαιτεί η διαδικτυακή χρήση και αποτελεί τη σημαντικότερη αδυναμία του. Θα περάσουν ίσως μερικά χρόνια ακόμα για να μπορέσει το διαδίκτυο να ανταγωνιστεί την τηλεόραση που παρουσιάζει τις μεγαλύτερες δυνατότητες προσέγγισης κοινού. Ωστόσο κάποιες αισιόδοξες προβλέψεις που βασίζονται στη μεγάλη αύξηση των χρηστών του διαδικτύου αναφέρουν ότι το διαδίκτυο σε μια πενταετία θα παρουσιάζει υψηλότερη προσέγγιση από την έντυπη διαφήμιση σε κάποιες περιοχές

Page 21: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 21

Επιλεκτικότητα Η επιλεκτικότητα είναι εφικτή περισσότερο με το διαδίκτυο παρά με οποιοδήποτε άλλο διαφημιστικό μέσο. Αυτό συμβαίνει γιατί όπως αναφέρθηκε στις προηγούμενες παραγράφους το κοινό είναι αυτό που επιλέγει να εκτεθεί στη διαφήμιση. Με το διαδίκτυο είναι εφικτό το πολυπόθητο για κάθε επιχείρηση και διαφημιστή «exposure on demand», που πολύ απλά σημαίνει ότι άτομα που ήδη ενδιαφέρονται για το προϊόν ή την υπηρεσία μιας επιχείρησης (πρόκειται ενδεχομένως για πιθανούς αγοραστές) επιλέγουν να ενημερωθούν και να πληροφορηθούν καλύτερα με την έκθεσή τους στις on-line διαφημίσεις. Ανάδραση Ένα από τα μεγαλύτερα προβλήματα που απασχολούν τους διαφημιστές είναι αυτό της ανάδρασης, της δυνατότητας του κοινού να «αντιδράσει» άμεσα στο διαφημιστικό μήνυμα. Το διαδίκτυο είναι το μόνο προς το παρόν (τουλάχιστον στην χώρα μας) μέσο που παρέχει στο κοινό τη δυνατότητα «ανάδρασης». Το κοινό του διαδικτύου την ώρα που εκτίθεται στη διαφήμιση (κάνοντας περιήγηση σε μια διαφημιστική ιστοσελίδα) μπορεί με τη χρήση του ηλεκτρονικού ταχυδρομείου ή μέσα από έτοιμες φόρμες ερωτήσεων να ζητήσει περισσότερες πληροφορίες απ' αυτές που υπάρχουν στο περιεχόμενο της διαφήμισης. Η ανάδραση γίνεται αποτελεσματικά και μέσω του ίδιου μέσου χωρίς κόπο και χρόνο από την πλευρά του χρήστη ή της επιχείρησης. Μέτρηση αποτελεσματικότητας Η τεχνολογία των ηλεκτρονικών υπολογιστών και του Παγκόσμιου Ιστού Πληροφοριών δίνει τη δυνατότητα στους υπεύθυνους της διαφήμισης να ελέγχουν σε τακτά χρονικά διαστήματα (ακόμα και σε καθημερινή βάση) τις αντιδράσεις του κοινού στις διάφορες διαφημιστικές τους προσπάθειες. Με την εφαρμογή του κατάλληλου λογισμικού οι διαφημιστές μπορούν να γνωρίζουν πόσοι εκτέθηκαν στην on-line διαφήμιση, το χρόνο που

Page 22: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 22

αφιέρωσαν για να τη δουν και ποιες πληροφορίες επέλεξαν να αντλήσουν. Μ' αυτό τον τρόπο γίνεται άμεσα, γρήγορα και αξιόπιστα η μέτρηση αποτελεσματικότητας κάθε διαφημιστικής ενέργειας. Δεν ισχύει το ίδιο για τα παραδοσιακά μέσα διαφήμισης. Για τα περισσότερα από αυτά απαιτείται ένα χρονικό διάστημα μηνών, εκτεταμένες «έρευνες κοινού» και επομένως μεγάλα ποσά για να πάρουν κάποια πρώτα αποτελέσματα που θα ελέγχουν την αποδοτικότητα του μέσου και την ποιότητα του διαφημιστικού μηνύματος. Κόστος

Το κόστος μιας οn-line διαφήμισης είναι χαμηλό σε σχέση με τα περισσότερα παραδοσιακά μέσα και ως προς το σχεδιασμό και την παραγωγή και ως προς την ποσότητα της μεταδιδόμενης πληροφορίας. Μια διαφημιστική ιστοσελίδα στον Παγκόσμιο Ιστό Πληροφοριών διαφημίζει ένα προϊόν εικοσιτέσσερις ώρες το εικοσιτετράωρο, επτά ημέρες την εβδομάδα. Το πρόσθετο κόστος μιας on-line διαφήμισης αφορά την προώθηση της ίδιας της διαφήμισης. Με απλά λόγια θα πρέπει να διαφημίσω ότι διαφημίζομαι on-line, κάτι που δε συμβαίνει με τα υπόλοιπα μέσα. Γι' αυτό το λόγο η παραπάνω σύγκριση ως προς το κόστος είναι πολύ γενικευμένη και ίσως ανορθόδοξη, μια και κάθε μέσο ξεχωριστά έχει τις δικές του ιδιαιτερότητες.

Page 23: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 23

2.4 Συμπεράσματα

Το διαδίκτυο από πολλές απόψεις αντιπροσωπεύει μια ιδανική μορφή επικοινωνίας που αλλάζει τα δεδομένα της διαφήμισης. Συνολικά θα μπορούσε να πει κανείς ότι το διαδίκτυο υπερτερεί σε σχέση με πολλά παραδοσιακά μέσα. Είναι το μόνο μέσο που μπορεί να ανταγωνιστεί τα υπόλοιπα ως προς την ποσότητα πληροφοριών που μπορεί να μεταδώσει σε ένα διαφημιστικό μήνυμα λόγω της χρήσης του υπερκειμένου.

Επιπλέον με το διαδίκτυο γίνεται πλέον εφικτός ο διαφημιστικός διάλογος ανάμεσα στην επιχείρηση και τους καταναλωτές μέσα μόνο από ένα μέσο επικοινωνίας. Ως μέσο αλληλεπίδρασης δίνει τη δυνατότητα στο χρήστη να επικοινωνήσει με την επιχείρηση και να ζητήσει επιπλέον πληροφορίες και να εκφράσει την άποψή του για το προϊόν ή το ίδιο το διαφημιστικό μήνυμα. Εξασφαλίζει επίσης το πολυπόθητο «exposure on demand», που σημαίνει ότι είναι το μόνο μέσο όπου το κοινό επιλέγει να εκτεθεί στο διαφημιστικό μήνυμα. Επιτυγχάνεται επίσης με την ανταλλαγή πληροφοριών ανάμεσα στο κοινό και την επιχείρηση η αξιόπιστη και σε σύντομο χρονικό διάστημα η αξιολόγηση κάθε διαφημιστικής προσπάθειας στο μέσο.

Ωστόσο η μεγάλη του αδυναμία που είναι η προσέγγιση ενός μικρού, σε σχέση με τα υπόλοιπα διαφημιστικά μέσα, κοινού το καταργεί από πρωταρχικό μέσο σε ένα ολοκληρωμένο πρόγραμμα προβολής. Προς το παρόν για τα περισσότερα προϊόντα το διαδίκτυο μπορεί να λειτουργήσει σαν συμπληρωματικό μέσο.

Για πολλούς η on-line διαφήμιση βρίσκεται σε νηπιακό στάδιο. Οι ταχύτατες εξελίξεις στο χώρο των υπολογιστών και η αύξηση των χρηστών του διαδικτύου προμηνύουν τεράστιες αλλαγές στο χώρο της on-line διαφήμισης. Ήδη περνάμε από το στάδιο των μεμονωμένων on-line διαφημίσεων στο σχεδιασμό οργανωμένων on-line διαφημιστικών προγραμμάτων που συνδυάζουν όλα τα είδη της οn-line διαφήμισης. Οι διαφημιστές και οι προγραμματιστές μέσων θα πρέπει να παρακολουθούν τις εξελίξεις σ' αυτό το χώρο, καθώς ήδη για κάθε επιχείρηση η διαφημιστική παρουσία στο διαδίκτυο είναι επιβεβλημένη.

Page 24: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 24

2.5 Τι δεν είναι το E-marketing

2.5.1 E-πραγματικότητα και τι δεν είναι το E-Marketing

Τελειώνοντας το κεφάλαιο αυτό θα πούμε το τι ακριβώς δεν είναι το e-marketing. Το e-marketing δεν είναι η διαφήμιση στο Internet. To e-marketing δεν είναι η ύπαρξη ενός εταιρικού web site. To e-marketing δεν είναι τα κείμενα του web site και η σωστή ορθογραφία και σύνταξή τους. To e-marketing δεν είναι οι επισκέπτες στο web site. To e-marketing δεν είναι οι πωλήσεις που σημειώνονται μέσω ενός web site.

Το e-marketing δεν είναι οι άνθρωποι που το εκτελούν. (Και κυρίως) Το e-marketing δεν είναι απλό marketing με ένα “e” μπροστά του. Το e-marketing είναι μια σειρά από δυνατές στρατηγικές που απαρτίζουν την ηλεκτρονική διαχείριση μιας επιχείρησης, καθώς και την ανάπτυξή της. Όπως το όλο, που είναι πάντα μεγαλύτερο από τα μέρη του, το e-marketing εμπεριέχει διάφορες δομές που προσομοιάζουν με αυτές που αναφέραμε παραπάνω, αλλά δεν είναι από μόνο του καμία από αυτές.

Βεβαίως, ως εδώ όλα καλά… Θεωρητικά άρθρα για το e-marketing έχουν γραφεί κατά χιλιάδες και η “επιχειρηματική λογοτεχνία” σφύζει από σχόλια και αναλύσεις –που λίγο διαφέρουν μεταξύ τους- σχετικά με την οργάνωση και τη σημασία του e-marketing στη σύγχρονη επιχείρηση. Πρακτικά όμως το τι σημαίνει “e-marketing” και το πώς όλη αυτή η θεωρητικολογία σκοντάφτει πάνω στην ελληνική πραγματικότητα (e-pragmatikotita) είναι ένα ζήτημα που δεν έχει καλυφθεί σχεδόν καθόλου.

Αν και είναι μεγάλο βήμα το να συναντάμε σήμερα φορτηγάκια και εταιρικά αυτοκίνητα με τυπωμένο το URL του web site της εταιρείας πάνω τους και έχουμε ήδη συναντήσει διαφημίσεις στην τηλεόραση για καθαρά ηλεκτρονικές εταιρείες (που συνήθως έχουν να κάνουν με τον τζόγο δυστυχώς), δεν είναι είδηση για κανέναν να πούμε τη φράση “Υπάρχουν ακόμα πολλά περιθώρια βελτίωσης”. Με τα δεδομένα που προκύπτουν μέσω ερευνών των τελευταίων ετών ( που δεν είναι διόλου ενθαρρυντικές) θα ήταν λίγο δύσκολο για έναν Έλληνα επιχειρηματία να μπορούσε να μιλήσει για το e-marketing ως ένα θέμα που τον ενδιαφέρει.

Συνήθως θεωρείται ότι θα ήταν προτιμότερο να ασχοληθεί με θέματα προώθησης της επιχείρησής του, που να τον φέρουν σε καλύτερη οικονομική κατάσταση στην ελληνική αγορά. Ίσως. Αλλά υπάρχουν -τουλάχιστον- τρεις λόγοι/θέματα τα οποία θα πρέπει να σχολιάσουμε στην epragmatikotita, που δίνουν έμφαση στο θέμα e-marketing: 1. Κατ’ αρχάς, μπορεί οι χρήστες του Διαδικτύου στην Ελλάδα να είναι λίγοι και να έχουμε την τιμή να κυμαινόμαστε στα μικρότερα ποσοστά στην Ευρώπη, όμως το προφίλ του Έλληνα χρήστη είναι πολύ συγκεκριμένο, σε αντίθεση με τις απίστευτες διαφοροποιήσεις που ισχύουν για το ευρωπαϊκό και το παγκόσμιο Διαδίκτυο. Ο Έλληνας χρήστης είναι άντρας, μορφωμένος ή φοιτητής και σχετικά ευκατάστατος. Ενημερώνεται πολύ, βλέπει λιγότερη τηλεόραση από τον μέσο Έλληνα και έχει περισσότερα από ένα μπουκαλάκια αντρικής περιποίησης στο μπάνιο του. Η περιγραφή αυτή ακούγεται “λουκούμι” για πολλές επιχειρήσεις που στοχεύουν σε αυτό ακριβώς το κοινό και οι οποίες θα μπορούσαν να “χτυπήσουν” την προώθηση των προϊόντων τους μέσα από το Διαδίκτυο. 2. Το δεύτερο ζήτημα αφορά στο τμήμα της ελληνικής αγοράς στο οποίο δίνεται ιδιαίτερα μεγάλη έμφαση με σκοπό τη γενικότερη ανάπτυξη και εξέλιξή του στον τουρισμό και τα στηριζόμενα σε αυτόν επαγγέλματα. Το κοινό των επιχειρήσεων στην προκειμένη περίπτωση δεν είναι μόνο το ελληνικό, αλλά το παγκόσμιο.

Page 25: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 25

3. Το τρίτο ζήτημα είναι κάπως παράξενο. Για χρόνια στον ελληνικό χώρο ακουγόταν η φράση “σιγά μωρέ μην πιάσει ποτέ το e-commerce στην Ελλάδα” και υπό μία έννοια οι άνθρωποι που το έλεγαν, και στις συνθήκες που το έλεγαν, είχαν απόλυτο δίκιο. Όμως η ουσιαστική αποτυχία του e-commerce στον παγκόσμιο χώρο έφερε σε εξέλιξη ένα σύστημα e-commerce “ανατολικού τύπου”, που ταιριάζει σχεδόν απόλυτα στην ψυχοσύνθεση του ελληνικού στοιχείου. Η μόδα, το trend στο Διαδίκτυο σήμερα (το ονομαζόμενο Web 2.0) αντιμετωπίζει τις αγορές ως μια επικοινωνία (market as conversation) και προσπαθεί να στήσει αγορές ως συνονθυλεύματα χρηστών και επισκεπτών που αλληλεπιδρούν μεταξύ τους. Κάτι σαν μια ηλεκτρονική έκφανση της Αγοράς των αρχαίων Αθηνών ή του παζαριού στο Μοναστηράκι. Το ζήτημα είναι ότι ο ελληνικός χώρος είναι τόσο κοντά σε αυτήν τη λογική, που θα μπορούσαν να αναπτυχθούν άμεσα τέτοιου είδους προσπάθειες.

Υπάρχουν βεβαίως και άλλοι λόγοι που αφορούν στον τρόπο με τον οποίο η ανάπτυξη της οικονομίας, του Διαδικτύου και των τεχνικών του e-marketing και του περιεχομένου στο Διαδίκτυο εξελίσσονται σε παράλληλες τροχιές και με μη γραμμικούς τρόπους αναπτύσσονται και αλληλοσυμπληρώνονται.

Το emarketing ουσιαστικά σημαίνει για το χώρο της e-pragmatikotitas την ανάπτυξη όλων των τεχνικών που θα αναπτύξουν μέσω του Διαδικτύου την ανταγωνιστικότητα των επιχειρήσεων και θα οδηγήσουν υπηρεσίες και προϊόντα σε καινούργια κανάλια διανομής. Παρ’ όλα αυτά, οι κίνδυνοι της μη σωστής εφαρμογής του e-marketing είναι το ίδιο σοβαροί με τους κινδύνους μη εφαρμογής του, καθώς, όπως συμβαίνει και με τη σωστή διαχείριση μιας επιχείρησης, υπάρχουν πολλά κομμάτια που είναι κοντύτερα στην τέχνη από την επιστήμη. Ωστόσο, είναι εξίσου επικίνδυνο το να στηρίζεται το e-marketing περισσότερο στην τέχνη και λιγότερο στη σκληρή επιστήμη και τις μετρήσεις.

Page 26: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 26

ΚΕΦΑΛΑΙΟ 3

Page 27: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 27

3.1 Εισαγωγή στο Personalization

3.1.1 Εισαγωγικά και τι είναι Personalization

Στο Internet, έχουμε εμπειρία στην μεγάλη ανάπτυξη των συστημάτων όπου έχουν την δυνατότητα να προσωποποιούν το περιεχόμενο που θα παραδοθεί σε ξεχωριστούς χρήστες. Η επιστήμη της προσωποποίησης έχει υποβληθεί σε τεράστιες αλλαγές τα τελευταία χρόνια, όμως ο βασικός στόχος των συστημάτων «προσωποποίησης» παραμένει ο ίδιος: να διασφαλίσουν στους χρήστες αυτό που θέλουν ή χρειάζονται χωρίς να απαιτείται να τους το ζητούν άμεσα.

Η «προσωποποίηση» είναι η πρόβλεψη στα προσαρμοσμένα στις ξεχωριστές ανάγκες προϊόντα, υπηρεσίες, πληροφορίες ή σχετικές πληροφορίες για τα προϊόντα ή τις υπηρεσίες. Είναι μια ευρεία περιοχή, καλύπτοντας επίσης τα συστήματα συστάσεων, προσαρμογής και τα προσαρμόσιμα Web Sites. Τρεις πτυχές του web site έχουν επιπτώσεις στην εξασφάλιση της χρησιμότητας των προτεινόμενων υπηρεσιών στους χρήστες τους.

Αυτά είναι τα περιεχόμενα που παρέχονται στο web site, η διάταξη των ξεχωριστών σελίδων και η δομή ολόκληρου του web site αυτό κάθε αυτό. Η εφαρμογή του κάθε αντικειμένου ξεχωριστά που περιλαμβάνεται στο web site στις ανάγκες των χρηστών επηρεάζει ξεκάθαρα το επίπεδο ικανοποίησής τους.

Η δομή του web site, ορίζεται από την ύπαρξη υπερσυνδέσμων (links) μεταξύ των διαφορετικών σελίδων, περιορίζουν την περιήγηση από τον χρήστη φτιάχνοντας προκαθορισμένα μονοπάτια και επομένως προσδιορίζεται η ικανότητα του χρήστη να έχει πρόσβαση σε σχετικές μεταξύ τους σελίδες με σχετική ευκολία. Ωστόσο, ο καθορισμός της καταλληλότητας είναι υποκειμενικός. Και αυτό γιατί συνήθως υπάρχει ένα κακό ταίριασμα για το τι πιστεύει ο σχεδιαστής ότι χρειάζονται οι χρήστες απ’ αυτό που πραγματικά χρειάζονται. Αυτό μπορεί να έχει μεγαλύτερη επιρροή στην λειτουργικότητα ενός web site. H τεχνολογία της προσωποποίησης περιλαμβάνει software τέτοιο όπου μαθαίνει πρότυπα, συνήθειες και προτιμήσεις.

Στο Internet αυτό που χρησιμοποιείτε κυρίως στα συστήματα είναι η υποστήριξη στο e-business. H προσωποποίηση λειτουργεί σε αυτό το πλαίσιο επειδή βοηθά τους χρήστες να βρουν λύσεις, αλλά ακόμα σημαντικότερο είναι ότι δίνει τη δυνατότητα στους παροχείς του e-business με να μετράνε την ποιότητα αυτής της λύσης.

Όσον αναφορά την γρήγορα αναδυόμενη περιοχή της διαχείρισης σχέσης πελατών (CRM), η προσωποποίηση επιτρέπει στους παροχείς του ηλεκτρονικού εμπορίου να υλοποιήσουν στρατηγικές που θα κρατάν τους ήδη υπάρχον πελάτες και να αποκτούν νέους.

Ο Danie E. O’ Leary από το πανεπιστήμιο της Νότιας Καλιφόρνιας επινόησε την φράση «AI Αναγέννηση» το 1997, για να περιγράψει πως η τεχνητή νοημοσύνη (ΑΙ) μπορεί να καταστήσει το διαδίκτυο πιο χρήσιμο. Η τεχνολογία της προσωποποίησης είναι μέρος αυτής της αναγέννησης. Παράλληλα με την ακαδημαϊκή πρόοδο που καλύπτεται σε αυτό το ειδικό τμήμα, ο εμπορικός κόσμος είναι μάρτυρας σε πρωτοφανή αύξηση της τεχνολογίας της προσωποποίησης στις επιχειρήσεις.

Οι αρχικές προσπάθειες στην επίτευξη της προσωποποίησης στο διαδίκτυο έχουν περιοριστεί στην προσωποποίηση του check-box, όπου οι πύλες επιτρέπουν στο χρήστη να επιλέξουν τις συνδέσεις που θα ήθελαν στη "προσωπική" τους σελίδα. Εντούτοις, αυτό έχει περιορίσει τη χρήση του, δεδομένου ότι οι χρήστες ξέρουν εκ των προτέρων το ενδιαφέρον για αυτούς περιεχόμενο. Σχετικά, το συνεργατικό φιλτράρισμα ήταν η πρώτη προσπάθεια στη χρησιμοποίηση του AI για την επίτευξη της προσωποποίησης κατά τρόπο ευφυέστερο. Αυτό επιτρέπει στους χρήστες να παραδειγματιστούν από συμπεριφορές άλλων χρηστών βασιζόμενοι στην μεταξύ τους ομοιότητα. Αυτές οι τεχνικές απαιτούν από τους χρήστες να

Page 28: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 28

αποκαλύψουν κάποιες προσωπικές πληροφορίες για τα ενδιαφέροντα τους, προτιμήσεις και αντιπάθειες, πληροφορίες που πολλοί χρήστες δεν θα επιθυμούσαν να αποκαλύψουν. Μια εναλλακτική λύση είναι η παρατηρητική προσωποποίηση, η οποία προσπαθεί να καταστρατηγήσει την ανάγκη των χρηστών να αποκαλύψουν οποιεσδήποτε προσωπικές πληροφορίες. Η θεμελιώδης υπόθεση σε αυτήν την προσέγγιση είναι η πληροφορία που κρύβεται μέσα στα αρχεία της προηγούμενης πλοηγικής συμπεριφοράς ενός χρήστη και αποτελούν ενδείξεις για το πώς πρέπει οι υπηρεσίες, τα προϊόντα, και οι πληροφορίες να προσωποποιηθούν για μία πιο «ενισχυμένη» αλληλεπίδραση. Κατά την άποψή μας, υπάρχουν τρία κύρια συστατικά στην παρατηρητική προσωποποίηση:

Μέθοδος λογικής ανάλυσης, αναπαράσταση, και παράταξη. Η εξόρυξη διαδικτύου παρέχει εργαλεία για να αναλύσει τα log δεδομένα

Διαδικτύου με κέντρο το χρήστη. Μερικά απ’ αυτά είναι η τμηματοποίηση, η σκιαγράφηση, και η ανακάλυψη του περιεχομένου μέσω των click των χρηστών. Η επιτυχία της προσωποποίησης στο Web στηρίζεται στην ικανότητά της να αναβαθμίζει τη χρησιμότητα της τεχνολογίας στο ηλεκτρονικό εμπόριο. Μια πρόσφατη αξιολόγηση των χρηστών του Ιστού υποδηλώνει ότι πάνω από 70% των χρηστών Ιστού θεωρούν τα ερεθίσματα που λαμβάνουν από μια ιστοσελίδα εμπόδιο στην διευκόλυνσή τους και όχι κάτι το βοηθητικό, και πάνω από 50% των χρηστών Ιστού ανησυχούν για τα ιδιωτικά τους δικαιώματα. Το πώς οι παροχείς των εφαρμογών προσωποποίησης μπορούν να κρατούν την ισορροπία μεταξύ της προσωποποίησης και την καταπάτηση των προσωπικών δεδομένων, και από το πώς θα καταφέρουν αυτοί να ελέγξουν τις απάτες γύρω από το αντικείμενο θα προσδιορίσει το μέλλον αυτού του τομέα.

Στο σημερινό ανταγωνιστικό επιχειρησιακό κόσμο, ερμηνεύοντας και δραστηριοποιώντας την ισχύς των τεσσάρων Ps του μάρκετινγκ, δηλαδή το προϊόν, την τιμή, τη θέση και την προώθηση έχουν γίνει ένας από τους σημαντικότερους παράγοντες που θα καθορίσουν τη μελλοντική επιβίωση ή την επιτυχία του μάρκετινγκ μιας επιχείρησης. Εντούτοις, αυτά τα τέσσερα Ps όλα έχουν τροποποιηθεί από τις τεχνολογικές εξελίξεις και ειδικά από το Web και έχουν μετατραπεί στα τέσσερα Ps του e-marketing, δηλαδή άδεια, προστασία προσωπικών δεδομένων, σκιαγράφηση και προσωποποίηση (Goldsmith, 1999). Σύμφωνα με τον Mobasher & Dai,2003 « η προσωποποίηση είναι η παροχή προσαρμοσμένων σε κάθε άτομο, πληροφοριών, προϊόντων, ή υπηρεσιών » και το θέμα αυτού του κεφαλαίου είναι να μελετηθεί ο σημαντικός ρόλος της προσωποποίησης στις ευφυείς εφαρμογές e-marketing. Οι ρίζες της προσωποποίησης επισημαίνονται στην εισαγωγή των προσαρμοστικών εφαρμογών υπερμεσών ( Brusilovsky 1996 ,2001). Τα προσαρμοστικά υπερμέσα εισήχθησαν ως εναλλακτική λύση της παραδοσιακής "one-size-fits-all" προσέγγισης, που αναπτύσσει ένα μοντέλο των στόχων, των προτιμήσεων και της γνώσης κάθε ξεχωριστού χρήστη, και που χρησιμοποιεί αυτό το μοντέλο σε όλη την αλληλεπίδραση, προκειμένου να προσαρμοστούν στις ιδιαίτερες ανάγκες του χρήστη (Perkowitz & Etzioni, 1997,2000a).

Η προσωποποίηση είναι μια ευρεία επιστημονική και τεχνολογική περιοχή, καλύπτοντας επίσης συμβουλευτικά συστήματα , προσαρμοστικότητα, το ένα προς ένα μάρκετινγκ, και τους προσαρμοστικούς ιστοχώρους (Blom, 2000;Mulvenna et Al, 2000 Schafer et Al, 2001). Είναι η διαδικασία συλλογής και αποθήκευσης πληροφοριών για τους επισκέπτες ενός Web Site, που αναλύουν τις πληροφορίες προκειμένου να μάθουν τις συνήθειες των χρηστών, τα πρότυπά τους και τις προτιμήσεις τους. Βασισμένη δε, σε αυτήν την ανάλυση, διανέμουν τις σωστές πληροφορίες σε κάθε επισκέπτη στο σωστό χρόνο (Eirinaki & Vazirgiannis, 2003). Η προσωποποίηση μπορεί να αναπτυχθεί από το ηλεκτρονικό εμπόριο (οποιοδήποτε Web site το οποίο λειτουργεί και έχει εμπορικούς σκοπούς, π.χ., e-shop “ηλεκτρονικό κατάστημα”, e-procurement “ηλεκτρονική προμήθεια”, e-auction “ηλεκτρονική δημοπρασία”, e-mall “ηλεκτρονική αλληλογραφία”, portal, “πύλη”,

Page 29: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 29

κ.λπ....) και χρησιμοποιείται ως βασική τεχνολογία για τη διαχείριση των σχέσεων πελατών, «τρέχοντας» στοχευμένη διαφημιστική εκστρατεία, προωθώντας προϊόντα ή υπηρεσίες και προσαρμόζοντας το περιεχόμενο του Web Site (Perner & Fiss, 2002).

Εκτός αυτού, σύμφωνα με τον τέταρτο από τους πέντε μεταβλητούς νόμους για το Web marketing (Wilson, 1999) τo αντικείμενο του ηλεκτρονικού εμπορίου πρέπει να είναι τέτοιο "που να τραβά τους επισκέπτες στην σελίδα για το ελκυστικό περιεχόμενό της, κατόπιν να τους ωθεί σε ποιοτικές πληροφορίες τακτικά μέσω του ηλεκτρονικού ταχυδρομείου." Παρ’ όλα αυτά, προσωποποιημένο περιεχόμενο πέραν των email μπορεί να διαφημιστεί, συνιστώμενα αντικείμενα , διάταξη της οθόνης, ειδήσεις, ή οτιδήποτε άλλο το οποίο μπορεί να προσπελαστεί μέσω του εμπορικού Web site.

Τα ψηφιακά κανάλια που μπορούν να αναπτυχθούν από το ηλεκτρονικό εμπόριο για να φθάσουν στους πελάτες είναι πολυάριθμα: Web, e-mail (ηλεκτρονικό ταχυδρομείο), ftp, chat (συνομιλία), search (αναζήτηση), ομιλία μέσω IP διευθύνσεων,αλληλεπιδραστικά πολυμέσα, κ.λπ.... Η δύναμη αυτών των ψηφιακών καναλιών είναι σημαντική, δεδομένου ότι μπορούν να αλλάξουν εντυπωσιακά τον τρόπο που το ηλεκτρονικό εμπόριο εισακούει, καταλαβαίνει και αποκρίνεται στους πελάτες και τους προμηθευτές του. Επιπλέον, αυτά τα κανάλια διευκολύνουν τις στιγμιαίες απαντήσεις στις πληροφορίες που συγκεντρώνονται από τα διάφορα touch-points «σημεία-επαφής» (πλήκτρο επιλογής, υπερσύνδεσμοι, συναλλαγές, δεδομένα από log αρχεία, κ.λπ....) χωρίς την ανάγκη της ανθρώπινης παρέμβασης (Yao et al, 2001). Το Web Personalization μπορεί να εφαρμοστεί υπό μορφή:

Παρουσίαση και παράδοση προσωποποιημένου περιεχομένου (εισαγωγή ή αφαίρεση θεματικών ενοτήτων/ τμήματα / παράγραφοι, προαιρετικές εξηγήσεις ή αναλυτικές πληροφορίες, εξατομικευμένες συστάσεις / προσφορές / τιμές / προϊόντα / υπηρεσίες).

Προσωποποιημένη δομή (ταξινόμηση, κρύψιμο, προσθήκη, αφαίρεση ή τονισμός υπερσυνδέσμων), π.χ., yahoo.com (Manber et Al, 2000).

Προσωποποιημένη παρουσίαση της σελιδοποίησης του ιστοχώρου και των τύπων των μέσων (από τις εικόνες στο κείμενο, από το κείμενο στον ήχο).

Τα ανωτέρω μπορούν να βασιστούν στην ανάλυση των δεδομένων από online και offline πηγές χρησιμοποιώντας διάφορες τεχνικές: εξόρυξη κανόνων ένωσης, αλγορίθμους τμηματοποίησης, τεχνικές ταξινόμησης, συνεργατικό φιλτράρισμα, ανακάλυψη προτύπων, πρόβλεψη, ανάλυση log αρχείων, κ.λπ. (Vassiliou et Al, 2002).

Τα οφέλη για τις επιχειρήσεις μπορούν να είναι σημαντικά και να περιλαμβάνουν μεταξύ άλλων αυξανόμενη χρησιμότητα της ιστοσελίδας, μετατροπή των χρηστών σε αγοραστές, διατήρηση των τρεχόντων πελατών, επανάκτηση χαμένων πελατών, διείσδυση σε νέες αγορές, κ.λπ. (Νielsen, 1994). Αφ' ετέρου, η προσωποποίηση εφαρμοσμένη στο ηλεκτρονικό εμπόριο είναι ένας αποτελεσματικός τρόπος για την παροχή προστιθέμενης αξίας στους πελάτες αναγνωρίζοντάς τους και εξυπηρετώντας τους ως ξεχωριστά άτομα. Οι πελάτες πρέπει να νιώσουν ότι έχουν μια μοναδική προσωπική σχέση με τις επιχειρήσεις που έρχονται σε επαφή. Οι χρήστες έχουν τώρα τη δυνατότητα να επισκεφτούν το ιστοχώρους που τους επιτρέπουν να βρούν πληροφορίες ή να επιλέξουν προϊόντα και υπηρεσίες ώστε να αγοράσουν γρήγορα και εύκολα. Επιπλέον, μπορούν να λάβουν από το ηλεκτρονικό ταχυδρομείο, ενημερωτικά δελτία ή άλλες πληροφορίες που έχουν σημασία για αυτούς.

Και ακόμα το σημαντικότερο ποσοστό των χρηστών που δίνει την άδειά τους να λαμβάνουν τέτοιου είδους πληροφορίες από τους εμπόρους, τείνουν να διαγραφούν από την παροχή αυτής της υπηρεσίας και να πάρουν πίσω την άδειά τους όταν οι προτιμήσεις και οι ανάγκες τους δεν ικανοποιούνται και καταλήγουν να λαμβάνουν άχρηστη ή ενοχλητική για αυτούς πληροφορία. Αυτή η παρατήρηση φέρνει εις γνώσην τη σημασία της ποιότητας και της ακρίβειας στην παραγωγή και την παράδοση της προσωποποίησης, ως μέσα για την πίστη πελατών.

Page 30: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 30

Υπάρχουν δύο γενικές προσεγγίσεις στην προσωποποίηση στις εφαρμογές ηλεκτρονικού εμπορίου:

Οδηγούμενη με βάση τον αγοραστή (Buyer driven): ο πελάτης προσυπογράφει στις διάφορες υπηρεσίες, συμπληρώνει τις φόρμες ή τα ερωτηματολόγια, βαθμολογεί προϊόντα, συμμετέχει σε έρευνες, κ.λπ.

Οδηγούμενη με βάση τον πωλητή: η προσαρμογή ελέγχεται από τον ιδιοκτήτη του ηλεκτρονικού καταστήματος. Το περιεχόμενο προάγεται χρησιμοποιώντας προκαθορισμένους επιχειρησιακούς

κανόνες, στοχευμένη on-line διαφήμιση, καθώς επίσης και παρόμοια προϊόντα που προτείνονται ( cross – selling) ή αύξηση της ποσότητας των προϊόντων που αγοράζονται (up – selling). Τυπικά χρησιμοποιεί μια μηχανή κανόνων που συλλαμβάνει και κωδικοποιεί τους επιχειρησιακούς κανόνες, περιγράφοντας διαγράμματα ροής και αυτοματοποιώντας χειροκίνητα θέματα.

Τα βασικά βήματα που περιλαμβάνουν τη διαδικασία προσωποποίησης (που απεικονίζεται στο σχήμα 3) είναι τα ακόλουθα (Cooley et Al, 1999a Srivastava et Al, 2000):

Συλλογή δεδομένων. Επεξεργασία δεδομένων. Παραγωγή προσωποποίησης.

Σχήμα 8: Βήματα Διαδικασίας Προσωποποίησης

Η προσωποποίηση, που εφαρμόζεται κατάλληλα, φέρνει την εστίαση στο μήνυμά σας και παραδίδει μια εμπειρία που είναι προσανατολισμένη στον επισκέπτη με σκοπό να τον ενημερώσει γρήγορα, και σχετικά. Η προσωποποίηση, που εφαρμόζεται κακώς, περιπλέκει την εμπειρία χρηστών σε συνδυασμό με το φτωχό περιεχόμενο.

3.1.2 Ορισμός του Personalization

Όπως αναφέρθηκε και προηγουμένως, ο όρος personalization έχει τουλάχιστον δύο ξεχωριστές προελεύσεις: Αυτός είναι κυρίως ο λόγος που δημιουργείται σύγχυση για την έννοια του ορισμού στην αγορά. Η μία προέλευση είναι ο αχανής όγκος πληροφοριών, οι οποίες είχαν ή μπορούν να αποθηκευτούν στους ηλεκτρονικούς υπολογιστές και να αναπτυχθούν μέσω δικτύων επικοινωνιών, συμπεριλαμβάνοντας και το World Wide Web. Οι ποσότητες και οι τύποι των πληροφοριών που είναι αυτή τη στιγμή προσβάσιμοι μέσω

Page 31: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 31

ηλεκτρονικών υπολογιστών έχουν απλά ξεπεράσει κατά πολύ την ποσότητα πληροφοριών που οι χρήστες θεωρούν χρήσιμες για αυτούς. Ο τεράστιος αριθμός των ιστοσελίδων στον κόσμο και οι τεράστιοι τόμοι των ψηφιακών πληροφοριών που διαρρυθμίζονται απ’ τα προσωπικά αρχεία ενός υπολογιστή σε αποθήκες δεδομένων, δορυφορικές μεταδόσεις, ψηφιακές βιβλιοθήκες, ψηφιακές εφημερίδες, ψηφιακά βιβλία, περιοδικά, άρθρα, κλπ.

Όλα αυτά έχουν επιφέρει μία υπερφόρτωση πραγματικών πληροφοριών για τους χρήστες. Ο στόχος της προσωποποίησης για την επιδίωξη της παράδοσης των προσωποποιημένων πληροφοριών είναι αρκετά απλός. Είναι η παράδοση πληροφοριών τα οποία είναι σχετικά με ένα άτομα ή μία ομάδα ατόμων διατεταγμένα και κατηγοριοποιημένα ανάλογα με τα άτομα αυτά. Όταν ανανεώνονται οι πηγές των πληροφοριών είναι πολύ σημαντικό να παραδίδεται και στο άτομο αυτή η ανανεωμένη πληροφορία. Οι ενημερωμένες πληροφορίες μπορούν να παραδοθούν άμεσα, μέσω ανανέωσης της πηγής πληροφοριών ή με βάση ένα χρονοδιάγραμμα που ορίζεται απ’ το κάθε άτομο ή ορισμένο απ’ ένα υπολογιστικό σύστημα. Η πληροφορία που παραδίδεται μπορεί να είναι το αποτέλεσμα μιας άμεσης ανάκτησης απ’ την πηγή της ή το αποτέλεσμα των διαφόρων παραλλαγών της πληροφορίας από περισσότερες της μίας πηγές. Επιπλέον, η παράδοση μιας πληροφορίας περιλαμβάνει τη θεώρηση του τύπου (π.χ., HTML, PDF, WORD, ASCII, LaTex, etc.) και της διαρρύθμισης στα οποία η πληροφορία έχει ζητηθεί από ένα ξεχωριστό άτομο. Η δεύτερη προέλευση του όρου της προσωποποίησης είναι η ιδέα του μάρκετινγκ ένα – προς –ένα , στην οποία μία επιχείρηση αναπτύσσει τακτικές μάρκετινγκ σε μία ομάδα ξεχωριστών ατόμων απ’ ότι στον ολόκληρο πληθυσμό της γεωγραφικής περιοχής της επιχείρησης. Το κίνητρο του ένα προς ένα μάρκετινγκ είναι η αύξηση του εισοδήματος και η μείωση του κόστους για μία επιχείρηση μέσω της κατανόησης των αναγκών, των συνηθειών και του τρόπου ζωής των πελατών της. Το σκεπτικό είναι πως κάνοντας αυτό η επιχείρηση μπορεί να αναπτύξει διαφορετικές εκστρατείες μάρκετινγκ και στρατηγικές τιμολόγησης και διανομής για διαφορετικές κατηγορίες πελατών. Επιπλέον, μία επιχείρηση μπορεί να μειώσει το οικονομικό κόστος και τα οφέλη μειώνοντας το κόστος που της αποφέρει η απόκτηση νέων πελατών, η απώλεια ήδη υπάρχοντων πελατών, και η αναγνώριση αλλά και παρεμπόδιση ριψοκίνδυνων οικονομικών συναλλαγών με ορισμένους πελάτες.

Η προσωποποίηση στο περιβάλλον του μάρκετινγκ ένα προς ένα δεν αποτελεί νέα έννοια. Είναι γεγονός ότι είναι τόσο παλιά ένα όσο το εμπόριο και η ανταλλαγή. Ο στόχος της προσωποποίησης στο μάρκετινγκ ένα προς ένα πρέπει να θεωρηθεί από δύο διαφορετικές όψεις: επιχείρηση και πελάτης. Για τις επιχειρήσεις όπως αναφέρθηκε και παραπάνω είναι η αύξηση των κερδών και/η μείωση του κόστους και των δαπανών. Για τους πελάτες ο στόχος είναι να παραλαμβάνουν και να αποσπούν χρήσιμες συστάσεις για την αγορά αγαθών και υπηρεσιών με τον καλύτερο για αυτούς τρόπο. Βεβαίως, η ιδέα το ότι οι ανάγκες και οι προτιμήσεις του πελάτη, πρέπει να καθοριστούν ακριβέστατα και έγκαιρα είναι το πιο σημαντικό. Δεν βοηθάει κανέναν εάν οι ανάγκες και οι προτιμήσεις των πελατών έχουν καθοριστεί λανθασμένα. Ο στόχος της προσωποποίησης και για το ένα προς ένα μάρκετινγκ και για την παράδοση επιλεγμένων πληροφοριών είναι μια ομάδα ατόμων που διαμοιράζονται κοινά ενδιαφέροντα και χαρακτηριστικά (π.χ. οπαδοί ίδιου τραγουδιστή ή οπαδοί ίδιας ομάδας). Το μέγεθος μίας τέτοιας ομάδας μπορεί να είναι από ένα άτομο μέχρι ένα πολύ μεγάλο αριθμό ατόμων. Στηριζόμενοι στις παραπάνω απόψεις μπορούμε να ορίσουμε την προσωποποίηση ως, την παράδοση, σε μία ομάδα ατόμων σχετικές πληροφορίες οι οποίες έχουν ανακτηθεί, τροποποιηθεί και/ή αποσπαστεί από πηγές πληροφοριών.

Page 32: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 32

3.2 Τι είναι το Web Personalization;

To Web Personalization είναι μία στρατηγική, ένα εργαλείο μάρκετινγκ και μία τέχνη. Το Personalization, απαιτεί άμεσα ή έμμεσα την συλλογή πληροφοριών απ’ τους χρήστες και την χρησιμοποίηση της γνώσης για τον χειρισμό των πληροφοριών που παρουσιάζονται στους χρήστες και πώς παρουσιάζονται αυτές. Χρησιμοποιώντας το σωστά, η προσωποποίηση σύμφωνα με τις εμπειρίες του χρήστη κάνει το χρόνο του πιο παραγωγικό και πιο ευχάριστο.

Δυστυχώς η προσωποποίηση από μόνη της έχει την δυνατότητα να αυξήσει την περιπλοκότητα της ιστοσελίδας το οποίο θα οδηγήσει στην ανεπάρκεια της αρχιτεκτονικής της. Μπορεί ακόμα να δεσμεύσει την αποδοτικότητα του μηνύματος μάρκετινγκ που θέλουμε να αποδώσουμε, ή ακόμα χειρότερα να βλάψουμε την εμπειρία του χρήστη.

Ο όρος προσωποποίηση χρησιμοποιείται σήμερα ευρέως και ασαφώς. Χρησιμοποιείται για την λήψη από ένα μεγάλο πλήθος πληροφοριών ενός μόνο κομματιού, το οποίο ενδιαφέρει το άτομο ή την ομάδα ατόμων. Ο όρος χρησιμοποιείται επίσης στο πλαίσιο στήριξης του μάρκετινγκ ένα προς ένα. Όπως για παράδειγμα η προβολή συγκεκριμένων προϊόντων ή υπηρεσιών, όπου μπορεί πιθανώς να ενδιαφέρουν κάποιον επισκέπτη κατά την επίσκεψή του. Οπότε γίνεται αναγνώριση με αυτόν τον τρόπο νέων πελατών ενός νέου προϊόντος και στη συνέχεια στέλνοντάς τους διαφημιστικό υλικό και προσφορές για το συγκεκριμένο προϊόν.

3.2.1 Εισαγωγή

Η συνεχής ανάπτυξη του μεγέθους και της χρήσης του παγκόσμιου ιστού μας έχει αποφέρει νέες μεθόδους σχεδιασμού και ανάπτυξης on line υπηρεσιών πληροφοριών. Οι περισσότερες διαδικτυακές δομές, είναι τεράστιες και πολύπλοκες και οι χρήστες συχνά χάνουν το στόχο της έρευνάς τους ή λαμβάνουν αμφιλεγόμενα αποτελέσματα όταν προσπαθούν να περιηγηθούν σ’ αυτές.

Οπότε, η προϋπόθεση για την πρόβλεψη τον αναγκών του χρήστη έτσι ώστε να αναβαθμιστεί η χρησιμότητα μίας ιστοσελίδας μπορεί να επιτευχθεί μέσω της προσωποποίησής της. Το Web Personalization ορίζεται σαν κάθε πράξη που προσαρμόζει τις πληροφορίες ή τις υπηρεσίες, που παρέχονται μέσω μιας ιστοσελίδας, ανάλογα με τις ανάγκες του συγκεκριμένου χρήστη ή της ομάδας χρηστών, εκμεταλλεύοντας την γνώση που αποκτήθηκε από την περιηγητική συμπεριφορά του χρήστη και τα προσωπικά του ενδιαφέροντα, σε συνδυασμό με το περιεχόμενο και τη δομή της ιστοσελίδας. Ο στόχος ενός συστήματος Web Personalization είναι το να παρέχει στους χρήστες με πληροφορίες που πραγματικά θέλουν και έχουν ανάγκη χωρίς να περιμένει απ’ αυτούς να το ζητήσουν άμεσα. [Mulvenna et al. 2004]

3.2.1.1 H έννοια του WEB Personalization

Το personalization, όπως προαναφέρθηκε, ορίζεται ως η διαδικασία της συγκέντρωσης και αποθήκευσης πληροφοριών αναφορικά με τους χρήστες ενός site, η ανάλυση των πληροφοριών αυτών και με βάση την ανάλυση, η αποστολή της σωστής πληροφορίας σε κάθε επισκέπτη στο σωστό χρόνο. Αποτελεί τεχνολογία-κλειδί σε διάφορες πτυχές του ηλεκτρονικού εμπορίου, όπως στο CRM (Customer Relationship Management), στη στοχευμένη διαφήμιση και προώθηση προϊόντων, στη διαχείριση των marketing

Page 33: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 33

campaigns, στη διαχείριση των περιεχομένων του web site, στη διαχείριση γνώσης, και στη διαχείριση personalized διακτυακών πυλών (portals) και καναλιών (channels). Αν και κάθε μια από τις περιοχές εφαρμογής ενδέχεται να απαιτεί ειδικές ρυθμίσεις, ειδικά για τα θέματα του περιβάλλοντος αλληλεπίδρασης και της διαδικασίας συλλογής δεδομένων, οι βασικές τεχνικές personalization, όπως φαίνονται και στο επόμενο σχήμα έχουν σημαντικές ομοιότητες.

Παρακάτω, οι όροι πελάτης, χρήστης και επισκέπτης θα χρησιμοποιούνται εναλλάξ με την προφανή τους έννοια.

To personalization έχει περάσει από πολλά διαφορετικά στάδια. Αρχικά χρησιμοποιούνταν για να κρατήσει τον επισκέπτη στο site ώστε να εξερευνήσει περισσότερα μέρη του, γεγονός που παρείχε περισσότερες ευκαιρίες για διαφήμιση και προώθηση προϊόντων. Στην επόμενη φάση επιχειρήθηκε να αυξηθεί το ποσό που ξόδευε ο χρήστης σε κάθε επίσκεψη προσφέροντας πιο δαπανηρά ή/και σχετικά προϊόντα. Σήμερα, το personalization χρησιμοποιείται για να επισπεύσει την παράδοση των πληροφοριών στον επισκέπτη, κάνοντας το site πιο χρήσιμο και ελκυστικό ώστε να θελήσει ο ίδιος να επιστρέψει.

Σύμφωνα με μια μελέτη [Forrester Research, 1999], οι εταιρείες χρειάζονται το personalization για να επιτύχουν στόχους που ποικίλουν, από το να κάνουν τα site τους πιο εύκολο στη χρήση, μέχρι το να αυξήσουν τις πωλήσεις. Ο σημαντικότερος στόχος είναι η αύξηση των επαναλαμβανόμενων συναλλαγών. Οι εταιρείες χρησιμοποιούν διάφορες μεθόδους ώστε να προσωποποιήσουν τα site τους. Οι κυριότερες από αυτές είναι τα προσαρμοσμένα email alerts, το εξατομικευμένο περιεχόμενο και η πρόσβαση μέσω λογαριασμών (account access).

H προσαρμοσμένη τιμολόγηση, το περιεχόμενο, το στοχευμένο marketing και η διαφήμιση αποτελούν πιο προηγμένες μορφές personalization και απαιτούν τη χρήση εκλεπτυσμένων τεχνικών data mining. Οι μέθοδοι αυτές στηρίζονται στις personalized

Page 34: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 34

ιστοσελίδες και έχουν επιχειρηματική αξία γιατί δίνουν στους ιδιοκτήτες των site τη δυνατότητα να καθορίσουν το πώς και το πότε θα μεταβάλλεται το περιεχόμενο των ιστοσελίδων που καταλήγουν στους χρήστες. Εντούτοις, η δυναμική κατασκευή των σελίδων αυτών απαιτεί επιπλέον πόρους και ενδέχεται να επηρεάσει τη συνολική απόδοση του συστήματος. Για να μειωθεί η επίδραση αυτή απαιτείται μια επεκτάσιμη μηχανή personalization που να μπορεί να εξυπηρετεί ένα μεγάλο αριθμό από αιτήσεις, ένα σύνθετο και ευρύ περιεχόμενο καθώς και τη συλλογή των ατομικών δεδομένων ανά πελάτη.

3.3 Διαφορές στο Personalization

3.3.1 Τι είναι το Web Customization και τι το Personalization; Για τους σκοπούς της εργασίας θα χρησιμοποιούνται πλέον, οι ακόλουθοι ορισμοί: Customization (Προσαρμοστικότητα): Οι χρήστες επιλέγουν προτιμήσεις που επηρεάζουν την προβολή του περιεχομένου. Το Customization οδηγείται κυρίως απ’ το χρήστη. Το διαδικτυακό περιεχόμενο προβάλλεται στο χρήστη με βάση τις δηλωμένες προτιμήσεις του. Το περιεχόμενο των προτιμήσεών του δεν αλλάζει παρά μόνο αν το ενημερώσει – κάνει – αλλάξει ο ίδιος. Personalization (Προσωποποίηση): Το περιεχόμενο του site προβάλλεται και ενημερώνεται (κάθε φορά) με βάση την καταγεγραμμένη συμπεριφορά του χρήστη και τα ενδιαφέροντα που δείχνει να έχει, κάθε φορά. Αντιθέτως με το Customization το Personalization, είναι οδηγούμενο απ’ τον υπολογιστή. Το διαδικτυακό περιεχόμενο προσαρμόζεται στις ανάγκες του κάθε ξεχωριστού χρήστη με βάση τις πληροφορίες που παρέχονται, καταγράφοντας την συμπεριφορά του. Οι προτιμήσεις του περιεχομένου αλλάζουν κάθε φορά με βάση τα περιηγητικά πρότυπα του χρήστη, τις αγορές του και την συμμετοχή του.

3.3.2 Customizing or personalizing? Ποια είναι τα πλεονεκτήματα, όμως, της προσαρμογής ή της προσωποποίησης ενός ιστοχώρου;

Παρόλο που κάποιες φορές οι παραπάνω όροι χρησιμοποιούνται εναλλακτικά, αυτοί

είναι όμως δύο εντελώς διαφορετικά πράγματα. Σκοπός τους είναι να παρέχουν μεγαλύτερη προστιθέμενη αξία στους χρήστες ενός ιστοχώρου, αλλά το κάθε ένα χρησιμοποιεί διαφορετικές προσεγγίσεις και διαφέρουν τα πλεονεκτήματά τους. Ας δούμε μερικά απ’ τα πλεονεκτήματα του καθενός (C=Customization, P=Personalization): Πλεονεκτήματα για τους χρήστες:

• Προσωπική επαφή (P) • Εξοικονόμιση χρόνου για ομαδοποίηση σχτετικών μεταξύ τους πληροφοριών (C, P) • Παροχή ευκολίας για να κάνει κάποιος εμπόριο μέσω διαδικτύου (C, P) • Ικανότητα να συνδέεται κάποιος επισκέπτης με τις σωστές πηγές και ανθρώπους

πολύ σύντομα(C, P)

Πλεονεκτήματα για την επιχείρηση: • Μεγαλύτερη πίστη των χρηστών, δυνατότερες σχέσεις (C, P)

Page 35: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 35

• Δυνατότητα σύνδεσης των μελών με τα προϊόντα και τις υπηρεσίες με την μέθοδο «one – to - one» (P)

• Επίγνωση των αναγκών των χρηστών – γιατί επισκέπτονται ή συναλλάσονται μ’ ένα συγκεκριμένο ιστοχώρο (P)

• Δυνατότητα καταγραφής των προτιμήσεων του χρήστη καθώς αυτός βρίσκεται στον ιστοχώρο (C, P)

• Δυνατότητα χρησιμοποίησης ευφυϊας για τον σχεδιασμό προγραμμάτων ή προϊόντων ώστε να έρθουμε πιο κοντά στις ανάγκες του χρήστη ( P)

• Θετική επιρροή στην πρώτη γραμμή (C, P) Μειονεκτήματα για τους χρήστες

• Αντίληψη απώλειας του ελέγχου απ’ τα μέλη που αισθάνονται ότι χάνουν μέρος του περιεχομένου του ιστοχώρου (P)

• Υποθέσεις σχετικά με τα προσωπικά δεδομένα – π.χ. πώς πρόκειται να χρησιμοποιηθούν έπειτα αυτές οι προσωπικές πληροφορίες; (P)

Μειονεκτήματα για τις επιχειρήσεις

• Απαιτούνται περισσότεροι πόροι και δαπάνες ( P) • Αύξηση των προσδοκιών για customization και personalization, «διορθώνοντας» όλο

και περισσότερα βασικά διαδικτυακά προβλήματα χρησιμότητας (C, P) • «Υπερ-Προσωποποίηση» - μειώνονται οι ευκαιρίες για πώληση παραπάνω

προϊόντων ή παρεμφερή, περιορίζοντας την έκθεση – προβολή προϊόντων ή υπηρεσιών.

3.3.3 Πώς δουλεύει το Web Personalization?

Το Web Personalization περιλαμβάνει μία ανταλλαγή της τιμής των μελών και του οργανισμού. Κάποιο μέλος για να ευχαριστηθεί τα πλεονεκτήματα της προσωποποίησης θα πρέπει πρώτα να υποβάλλει κάποιες προσωπικές πληροφορίες ώστε να δημιουργηθεί ένα ξεχωριστό προφίλ χρήστη.

Τα δεδομένα αυτά ενός προφίλ περισυλλέγονται συνήθως από on line φόρμες και οι πληροφορίες αυτές αποθηκεύονται σε κάποια βάση δεδομένων. Κάθε φορά αρχεία log μέσα σ’ ένα ιστοχώρο ή σε ιστοσελίδα που χρησιμοποιεί cookies / ενσωματωμένες διευθύνσεις / εργαλεία στον κεντρικό υπολογιστή και παραπάνω πληροφορίες για το προφίλ, αποκτώνται μέσω καταγραφής της περιηγητικής συμπεριφοράς του χρήστη, της συμμετοχής του/ ή των αγορών του.

Κάθε φορά που ένα μέλος επιστρέφει στο site, καλωσορίζεται με το όνομά του/της και παραδίδεται το αντίστοιχο περιεχόμενο που ταιριάζει/αντιστοιχεί στον συγκεκριμένο χρήστη. Το σύστημα μπορεί επίσης να παρέχει συστάσεις με βάση σύγκρισης κάποιων άλλων προφίλ χρηστών ( συνεργατικό φιλτράρισμα).

Ένα σύστημα προσωποποίησης δρομολογεί την παράδοση του περιεχομένου και των συστάσεων σε πραγματικό χρόνο ή όπως αλλιώς λέγεται “on-the-fly”. Τέλος καθώς αλλάζει το προφίλ του συγκεκριμένου μέλους/χρήστη, έτσι προσαρμόζεται αντίστοιχα και το παραδιδόμενο περιεχόμενο και συστάσεις.

Page 36: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 36

Τι χρειάζεται συνήθως για να κάνουμε προσαρμογή ή προσωποποίηση σ’ έναν ιστοχώρο;

Δεν υπάρχει κάποια συγκεκριμένη φόρμουλα – λύση για να κάνει κάποιος Web Personalization ή Customization. Για την κάθε ιστοσελίδα με βάση το σκοπό της και τις ανάγκες της το κάθε σύστημα παραμετροποιείται διαφορετικά. Αν θα μπορούσαμε να πούμε ότι υπάρχουν κάποιες ελάχιστες απαιτήσεις για να παρέχεται Web Personalization ή Customization αυτές θα ήταν:

• Δυναμική βάση συνδεδεμένη με τον ιστοχώρο • Σύστημα Διαχείρισης Περιεχομένου (CMS) με ταξινομημένο σύστημα • Κατανεμημένοι κεντρικοί υπολογιστές ιστού και κεντρικοί υπολογιστές βάσεων

δεδομένων με επαρκή ικανότητα υποστήριξης ενός δυναμικού ιστοχώρου • Προσωπικό που θα διαχειρίζεται / διατηρεί το σύστημα.

Τι μπορούμε να μάθουμε από μία ιστοσελίδα χρησιμοποιώντας τεχνικές προσωποποίησης; Η διαδικτυακή προσωποποίηση παρέχει ορισμένα μοναδικά πλεονεκτήματα σε έναν οργανισμό :

• Δεδομένα πραγματικού-χρόνου για τα ενδιαφέροντα των μελών-πελατών • Δυνατότητα τμηματοποίησης των δεδομένων των μελών, για την αναγνώριση των

ενδιαφέρων τους σε διάφορες κατηγορίες • Δυνατότητα παράδοσης στοχευμένων περιεχομένων και συστάσεων σε μέλη • Γνώση για δημιουργία επιχειρησιακών στρατηγικών για την σχεδίαση

προγραμμάτων, προϊόντων και υπηρεσιών που να ικανοποιούν τις ανάγκες των χρηστών.

3.4 Προσωποποίηση vs. Προσαρμογή (Customization)

Η έννοια της προσωποποίησης για τους πελάτες σίγουρα δεν είναι νέα .Αλλά ο ιστός την εξυψώνει σε μία μορφή τέχνης .Ο ιστός είναι το τέλειο αγοραστικό περιβάλλον για ακριβές μάρκετινγκ ,επειδή ο καθένας μπορεί να αναγνωριστεί με μοναδικό τρόπο και ένα μήνυμα μπορεί να δημιουργηθεί αποκλειστικά για αυτούς (Cliff Allen, 1999).

Ας σκεφτούμε πως οι παραδοσιακές επιχειρήσεις προσωποποιούν την επικοινωνία τους μέσω των πωλητών και των ομάδων υποστήριξης τους. Πολλοί στην πραγματικότητα ,είναι αρκετά πέρα από αυτό που η τυπική «προσωποποιημένη» ιστοσελίδα προσφέρει σήμερα .Ο λόγος είναι ότι οι παραδοσιακές επιχειρήσεις εστιάζονται στην δημιουργία μιας συζήτησης όπως στην πραγματική ζωή με τους πελάτες ,με σκοπό να καταλάβουν τι επιθυμούν οι πελάτες . Ποιος δεν έχει γευματίσει με παρέα που απαιτεί τόσες πολλές αλλαγές σε ένα στοιχείο του μενού, προσαρμόζοντας αναγκαστικά την παραγγελιά το ρέστοραν; Τι είναι αυτό όμως που μας φέρνει στο θέμα αυτής της στήλης- προσαρμογή vs. προσωποποίηση ;

Τις περισσότερες φορές όταν απαιτείς κάτι διαφορετικό από την στάνταρ προσφορά –όπως σε ένα ρέσταραν-αυτό θεωρείται προσαρμογή .Όταν έχεις μια συζήτηση αλληλεπίδρασης με ένα άλλο άτομο ,αυτό είναι προσωποποίηση .

Page 37: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 37

Αυτό είναι κάτι περισσότερο από σημασιολογική διαφορά –είναι διαφορά μεταξύ του να αφήνεις τον αναγνώστη να ελέγξει τη δική του/της εμπειρία στον ιστό σε αντίθεση με δημιουργούς περιεχομένων που θα καθοδηγούν την εμπειρία των αναγνωστών. Μου αρέσει η προσαρμογή ,επειδή γνωρίζω τι να περιμένω σε μια σελίδα που εγώ έχω προσαρμόσει .Η αρχική σελίδα μου είναι μια προσαρμοσμένη σελίδα νέων(ειδήσεις)/έρευνας που με συνδέει απευθείας στο υλικό που συχνά χρειάζομαι .

Αλλά φαίνεται ότι το πραγματικό όφελος της προσωποποίησης εμφανίζεται όταν κάποιος έχει μια «a h a!» εμπειρία που πραγματοποιείται όταν το περιεχόμενο που προσαρμόζεται από μόνο του στο προφίλ του ατόμου, και παρέχει κάτι καινούργιο, διαφορετικό και πιθανώς απροσδόκητο .Για τον αναγνώστη ,που βιώνει το απροσδόκητο, θα πρέπει να υπάρχει ένας δημιουργός περιεχομένου «πίσω από τις κουρτίνες» που θα ετοιμάζει το υλικό ,έτσι ώστε η μηχανή προσωποποίησης να μπορεί να προσαρμόσει το περιεχόμενό του βάση του προφίλ του κάθε ατόμου. Με άλλα λόγια χρειάζεται σχεδόν πάντα να γίνεται μια συζήτηση ανάμεσα στον δημιουργό του περιεχομένου και τα μέλη του κοινού μέσα στο διαδίκτυο. Είναι μερικές φορές δύσκολο να πει κανείς πότε ένα site προσαρμόζεται και πότε προσωποποιείτε. Αυτό που κάνει αυτή την διαφορά δύσκολη είναι ότι ένα προσαρμοσμένο site μπορεί να δώσει προσωποποιημένο περιεχόμενο. Όταν προσθέτεις το Amazon.com στο δικό σου MyPortal χαρτοφυλάκιο αγοράς ,γνωρίζεις ότι θα δεις αυτή την αγορά (προσαρμογή) ,αλλά δεν ξέρεις ποια θα είναι η σημερινή τιμή (προσωποποίηση) .

Ένα site περιεχομένου, όπου αναπτύσσονται διασυνδέσεις με νέες ιστορίες βασισμένες σε ατομικά προφίλ ,είναι προσωποποιημένο επειδή οι επικεφαλίδες αλλάζουν κάθε μέρα .Αυτό είναι ένας θαυμάσιος τρόπος εξοικονόμησης χρόνου, επειδή το κοινό συνεργάζεται με τους συντάκτες για να θέσει νέες και πληροφοριακές επικεφαλίδες μέσα σε ένα οικείο ,προσαρμοσμένο σύστημα .

Για τους καταστηματάρχες που επιθυμούν να εμπλέξουν κάθε προσδοκία σε μια συζήτηση μέσω της ιστοσελίδας τους ,η πλήρης προσωποποίηση απαιτείται προκείμενου να απευθύνονται ερωτήσεις, να ακούγονται οι απαντήσεις του κάθε ατόμου και να παρατηρούνται οι πράξεις τους στο website. Αυτό απαιτεί κάτι περισσότερο από τεχνικές προσωποποίησης ,απαιτεί μια ομάδα ειδικών δημιουργίας περιεχομένου που θα έχουνε δουλέψει με τα διαφορετικά είδη των πελατών που μια εταιρία εξυπηρετεί και που γνωρίζει τις ανάγκες πληροφοριών τους και τις απαιτήσεις των προϊόντων τους .

Φυσικά, το πραγματικό ερώτημα δεν είναι αν χρησιμοποιούμε την προσαρμογή ή την προσωποποίηση σε ένα website ,αλλά αν καλύπτουμε τις ανάγκης του κοινού μας, έτσι ώστε να αισθανθούν άνετα με μας ,την εταιρία μας και τα προϊόντα μας .

Σε αυτό το σημείο χρειάζεται να τονίσουμε για άλλη μία φορά την διαφορά ανάμεσα στην προσαρμογή της διάταξης και την προσωποποίηση .Στην προσαρμογή της διάταξης το site μπορεί να προσαρμοστεί στις αναγνωστικές προτιμήσεις του κάθε χρήστη, τη δομή και την παρουσίαση .Κάθε φορά που ένας εγγεγραμμένος χρήστης καταγράφεται μέσα, η προσαρμοσμένη αρχική σελίδα τους φορτώνεται .Αυτή η διεργασία εκτελείται είτε χειροκίνητα, είτε ημιαυτόματα .Στα συστήματα προσωποποίησης οι τροποποιήσεις που αφορούν το περιεχόμενο ή ακόμα και την δομή ενός website εκτελούνται δυναμικά .

Όσον αφορά, βασικά στοιχεία της προσωποποίησης του Ιστοί αυτά περιλαμβάνουν (α) την κατηγοριοποίηση και την προεπεξεργασία των Web data, (β)την εξαγωγή των συσχετίσεων ανάμεσα και κατά μήκος των διάφορων ειδών κάθε δεδομένου ,και (γ) τον καθορισμό των πράξεων που θα πρέπει να συστήνονται από κάθε σύστημα προσωποποίησης Mobasher et al.2000a.

Page 38: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 38

3.5 Λειτουργίες και Τεχνικές

Πρόσφατα, οι μέθοδοι και οι τεχνικές που χρησιμοποιούνται στην προσωποποίηση στο Web μπορούν να χωριστούν σε κατηγορίες σε τρία γενικά γκρουπ: χειροκίνητα συστήματα αποφάσεων κανόνων, πράκτορες βασισμένοι στο φιλτράρισμα περιεχομένου, συστήματα συνεργατικού φιλτραρίσματος. Τα χειροκίνητα συστήματα αποφάσεων κανόνων ,όπως είναι το Broadvision (www.broadvision.com) επιτρέπουν στους διαχειριστές του Web site να δημιουργηθούν κανόνες βασισμένοι στις δημογραφίες του χρήστη ,ή στα στατιστικά προφίλ (συλλεγμένα μέσω μιας διαδικασίας καταγραφής). Οι κανόνες χρησιμοποιούνται για να επιδρούν στο περιεχόμενο που εξυπηρετείται για έναν συγκεκριμένο πελάτη. Τα συστήματα συνεργατικού φιλτραρίσματος όπως το Net Perceptions(www.net perceptions.com) τυπικά δέχονται άμεσα πληροφορίες με την μορφή των βαθμολογήσεων και μέσω μιας μηχανής συσχετίσεων , επιστρέφουν πληροφορίες που ταιριάζουν αρκετά καλά στις προτιμήσεις των χρηστών. Τα συστήματα πρακτόρων βασισμένα στο φιλτράρισμα περιεχομένου όπως αυτά που χρησιμοποιούνται από το Web Watcher [Joachims et al., 1997] βασίζονται στα προσωπικά προφίλ και στην ομοιότητα του περιεχομένου των εγγράφων του Web με τα προφίλ δημιουργίας συστάσεων. Υπάρχουν αρκετά μειονεκτήματα των τεχνικών φιλτραρίσματος βασισμένα στο περιεχόμενο ή σε κανόνες για προσωποποίηση. Το είδος της εισαγωγής είναι συχνά μια υποκειμενική περιγραφή των χρηστών από τους ίδιους τους χρήστες και επομένως είναι επιρρεπείς σε προκαταλήψεις. Τα προφίλ είναι συχνά στατικά ,αποκτημένα μέσω μιας εγγραφής του χρήστη και επομένως η εκτέλεση του συστήματος μειώνετε όσο περνάει ο καιρός και παλαιώνουν τα προφίλ. Επιπλέον, χρησιμοποιώντας την ομοιότητα του περιεχομένου από μόνη της μπορεί να καταλήξει στην έλλειψη σημαντικών ‘’πραγματολογικών’’ σχέσεων στα Web αντικείμενα βασισμένη στον τρόπο με τον οποίο είναι προσβάσιμα από τους χρήστες.

Το συνεργατικό φιλτράρισμα [Herlocker et al., 1999;Konstan et al.,1997;Shardanand and Μaes ,1995] έχει προσπαθήσει να διευθετήσει μερικά από αυτά τα θέματα και στην πραγματικότητα ,έχει γίνει η επικρατέστερη εμπορική μέθοδος στα περισσότερα επιτυχημένα συστήματα ηλεκτρονικού εμπορίου. Αυτές οι τεχνικές γενικά περιέχουν τον συνδυασμό των βαθμολογήσεων κάποιου πρόσφατου χρήστη για αντικείμενα (π.χ., ταινίες ή προϊόντα) με αυτά παρόμοιων χρηστών (κοντινοί γείτονες) με σκοπό να παράγουν συστάσεις για αντικείμενα που δεν έχουν ακόμα βαθμολογηθεί από τον χρηστή. Η πρώτη τεχνική που χρησιμοποιείται για να κατορθωθεί αυτό το θέμα είναι η k-Nearest-Neighbor (kNN) [Κοντινότερου Γείτονα] μέθοδος ταξινόμησης ,η οποία συγκρίνει την καταγραφή κάποιου στοχευμένου χρήστη με προηγούμενες εγγραφές άλλων χρηστών με στόχο να βρουν τους k “ομοιότερους” χρήστες που έχουν ίδια γούστα και ενδιαφέροντα. Ωστόσο, οι τεχνικές συνεργατικού φιλτραρίσματος έχουν πιθανά τους δικούς τους σοβαρούς περιορισμούς. Ο πιο σημαντικός από αυτούς τους περιορισμούς είναι η έλλειψη κλιμάκωσης. Στην ουσία το kNN απαιτεί από την φάση μορφοποίησης γείτονα να εκτελείται σαν μια online διεργασία, και για ένα μεγάλο σύνολο δεδομενων αυτό μπορεί να οδηγήσει σε μία λανθάνουσα κατάσταση για παροχή συστάσεων. Άλλος ένας περιορισμός βασισμένος στις kNN τεχνικές προέρχεται από την μειωμένη ποσότητα του συνόλου των δεδομένων. Καθώς ο αριθμός των αντικειμένων στη βάση δεδομενων αυξάνεται ,η πυκνότητα της εγγραφής του κάθε χρήστη θα μειωθεί με σεβασμό σε αυτά τα αντικείμενα .Αυτό, ως αντάλλαγμα ,θα μειώσει την πιθανότητα μιας σημαντικής υπερκάλυψης επισκεπτόμενων ή βαθμολογούμενων αντικειμένων ανάμεσα σε ζευγάρια χρηστών καταλήγοντας σε λιγότερο έμπιστες υπολογιστικές συσχετίσεις. Επιπλέον, το συνεργατικό φιλτράρισμα συνήθως εκτελείται καλυτέρα όταν είναι διαθέσιμο σε άμεσες μη δεκαδικές βαθμολογήσεις χρηστών για όμοια αντικείμενα. Σε πολλά Web sites ,ωστόσο ,μπορεί να είναι επιθυμητό να μειώνονται οι πράξεις προσωποποίησης μέσα στο site εμπλέκοντας διαφορετικά είδη αντικειμένων ,περιλαμβάνοντας σελίδες πλοήγησης και

Page 39: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 39

περιεχομένου καθώς και υπονοούμενες καταστάσεις προσανατολισμένες ανάλογα με τα προϊόντα του χρήστη όπως αλλαγές αγοραστικών μεταφορών ή απαιτήσεις πληροφοριών για προϊόντα. Ένας αριθμός στρατηγικών βελτιστοποίησης έχει προταθεί και εφαρμοστεί ώστε να περιορίσει αυτές τις ατέλειες [Aggarwal et al.,1999;O’Conner and Herlocker, 1999;Sarwar et al.,2000a;Ungar and Foster ,1998;Yu,1999].

Αυτές οι τεχνικές περιλαμβάνουνε δείκτες ομοιότητας και ελάττωση διάστασης για να μειωθούν τα έξοδα των ερευνών σε πραγματικό χρόνο, καθώς επίσης offline ομαδοποίηση των εγγραφών των χρηστών ,επιτρέποντας το άμεσης χρήσης συστατικό μέρος κάποιου συστήματος να ερευνήσει μόνο ανάμεσα σε ένα σύμπλεγμα συσχετισμού. Υπάρχει τέλος, πολύ δουλειά ακόμη για τον εμπλουτισμό του συνεργατικού φιλτραρίσματος ομαδοποιώντας δεδομένα από άλλες πηγές όπως είναι τα περιεχόμενα ή δημογραφικά στοιχεία χρηστών [Claypool,1999;Pazzani,1999].

3.6 Τεχνικές Προσωποποίησης

Οι μετατροπείς Document format software/facilities υπάρχουν για να μετατρέπουν τα έγγραφα ανάμεσα στα διάφορα format: από WORD σε PDF ,από WORD σε ASCII, από WORD σε HTML ,κ.λ.π. Οι Web browsers μετατρέπουν και τοποθετούν σελίδες στον Ιστό που είναι αποθηκευμένες σε HTML ,XML ,WML ,κ.λ.π. και άλλα format. Η προσωποποίηση για το one – to – one marketing χρησιμοποιεί ένα εύρος τεχνικών σε μια ποικιλία πηγών δεδομένων. Οι πηγές αυτές περιέχουν σχεσιακές βάσεις δεδομένων κρατώντας καταγραφές ιστού ,αποθήκη δεδομενων των πελατειακών δημογραφιών, τον τρόπο ζωής, δεδομένα συναλλαγής και βάσεις κανόνων ή προφίλ βάσης δεδομενων που περιέχουν συγκεντρωποιημένα προφίλ γενικού πληθυσμού κ.τ.λ. Οι τεχνικές προσωποποίησης, που βρίσκονται πρόσφατα σε χρήση περιέχουν τα εξής:

3.6.1 Αναζήτηση προσωπικών εγγραφών σε μια βάση δεδομένων/αρχείων

Η βάση δεδομενων των προσωπικών εγγραφών των πελατών διατηρείται και λέξεις

κλειδιά (π.χ., όνομα ή πελάτης ID) για έναν πελάτη χρησιμοποιούνται για να αναγνωρίζεται η εγγραφή του στην βάση δεδομενων ,και σχετικές πληροφορίες όσων αφορά τον πελάτη εξάγονται από την εγγραφή. Σχετικές πληροφορίες για τον πελάτη μπορούν να αποθηκευτούν σε μία απλή εγγραφή ή σε πολλές εγγραφές σε διαφορετικούς πίνακες/αρχεία. Σχετικές πληροφορίες θα είναι διαφορετικές από εφαρμογή σε εφαρμογή. Γενικά, όμως, θα περιλαμβάνεται δημογραφικό δεδομένο, δεδομένο τρόπου ζωής, ιστορικό αγορών προϊόντων, ιστορικό των ερευνών υποστήριξης των πελατών ,δεδομένο πίστωσης κ.λ.π.

3.6.2 Αναζήτηση μιας βάσης κανόνων ή μιας βάσης δεδομενων προφίλ

Μια βάση κανόνα ή μια βάση δεδομένων προφίλ συντηρείται και ερευνάται

βασισμένη σε χαρακτηριστικά που έχουν δοθεί(π.χ. κάθε συνδυασμό επιπέδου του εισοδήματος ,φύλου ,ηλικίας ,περιοχής διαμονής ,εθνικότητα κ.λ.π)από κάποιο πελάτη. Η βάση κανόνα ή η βάση δεδομένων προφίλ μπορεί να έχει δημιουργηθεί μέσω χρήσης της εξόρυξης δεδομένων, εξόρυξης καταγραφών του δικτύου, εξόρυξης κειμένου, OLAP

Page 40: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 40

τεχνικές (βλέπε παρακάτω). Τέτοιες τεχνικές μπορούν να εφαρμοστούν είτε offline είτε online στις εγγραφές του χρήστη ή των συναλλαγών που είναι αποθηκεμένες σε αποθήκες δεδομένων [Inmon 96][Kimball et al.98], εξαρτώμενες από διαθέσιμες υπολογιστικές πηγές. Εξόρυξη δεδομένων (αριθμητικών δεδομένων και δεδομένων σε μορφή πινάκων). Οι περισσότερες υπάρχουσες τεχνικές εξόρυξης δεδομένων έχουν σχεδιαστεί για να επεξεργάζονται αριθμητικά δεδομένα και δεδομένα μικρού μήκους [Berry and Linoff 97] [Han and Kamber 2000].

Οι τεχνικές εξυπηρετούν έναν αριθμό σκοπών συμπεριλαμβανομένης της ομαδοποίησης (ομαδοποίηση δεδομενων βασισμένοι σε όμοια χαρακτηριστικά) ,ταξινόμησης ή δημιουργίας κατηγοριών (τοποθετώντας νέα δεδομένα σε μια από τις υπάρχουσες κατηγορίες) ,δημιουργίας κανόνων συσχετισμού (αποφασίζοντας για την πιθανότητα κάποιου γεγονότος που ακολουθεί κάποια άλλα γεγονότα όπως η αγορά κάποιου πελάτη ενός ζευγαριού παπουτσιών, αφού έχει αγοράσει κάλτσες) κ.λ.π. Οι αλγόριθμοι εξόρυξης δεδομένων μπορεί να εκτελούνται σε έναν μεγάλο αριθμό πελατειακών εγγράφων για να διαχωρίσουν τους πελάτες ή να τους ταξινομήσουν. Μπορεί να εκτελούνται σε έναν μεγάλο αριθμό αποθηκεμένων εγγραφών συναλλαγών προκειμένου να αποφασίσουν τους κανόνες συσχέτισης .

3.6.3 Εξόρυξη Εγγραφών Ιστού

Τα δεδομένα των εγγράφων ιστού, αποθηκεύονται σε διατεταγμένους πίνακες/φακέλους. Τα δεδομένα αυτά είναι απλά από την άποψη ότι αποτελούνται από 10-15 πεδία. Ωστόσο, μπορεί να αναπτυχθούν αρκετά γρήγορα και ιδιαίτερα πολύ, επειδή κάθε επίσκεψη σε ιστοσελίδα καταγράφεται. Η εξόρυξη των εγγράφων αυτών είναι μια ειδική περίπτωση στην εξόρυξη δεδομένων [Mena 99].Το σκοπός είναι να καθοριστεί ένα πλήθος από διαφόρων τύπων πρόσβασης στον Ιστό και στις ιστοσελίδες όπως είναι ο μέσος όρος της διάρκειας επίσκεψης για διαφορετικές ιστοσελίδες, τα κοινά σχεδία πλοήγησης ιστοσελίδων, επαναλαμβανόμενες επισκέψεις. Διάφοροι τύποι πληροφοριών που μπορούν να αποφασιστούν μέσω ανάλυσης εγγραφών ιστού είναι χρήσιμες στους κατόχους των ιστοσελίδων.

Ωστόσο, η απουσία του ονόματος του επισκέπτη ή της προσωπικής του ταυτότητας (όπως είναι το νούμερο κοινωνικής ασφάλειας) περιορίζει την έλλειψη χρησιμότητας των δεδομενων δικτυακής καταγραφής της ένα προς ένα αγορά.

3.6.4 Εξόρυξη κειμένου Η εξόρυξη κειμένου, έχει ως στόχο τον αυτόματο καθορισμό αποφάσεων διάφορων άμορφων κειμένων(π.χ., ένα άρθρο εφημερίδας ,υπόμνημα γραφείου ,τεχνική αναφορά, κ.λ.π.) συμπεριλαμβάνοντας τα ιδιαίτερα γνωρίσματα, τις συχνά εμφανιζόμενες λέξεις, περίληψη, κατηγορία, κ.λ.π[Sullivan 2000][IBM].Τα ιδιαίτερα γνωρίσματα αυτά, περιλαμβάνουν για παράδειγμα ονόματα ανθρώπων, οργανισμών, προϊόντων, περιοχών, ημερομηνίες, τιμές κ.λ.π. Οι συχνά εμφανιζόμενες λέξεις και συγκεκριμένες φράσεις όπως είναι η φράση «κλείνοντας» χρησιμοποιούνται για να βοηθήσουν να γίνει αυτόματα η περίληψη ενός κειμένου.

3.6.5 OLAP Οι Online τεχνικές αναλυτικής επεξεργασίας (OLAP) χρησιμοποιούνται για να υπολογίζουν (αριθμητικά) τις περιλήψεις (ή συναθροίσεις ,όπως είναι το σύνολο ,ο μέσος όρος ,το υποσύνολο ,το μέγιστο ,το ελάχιστο) των δεδομενων (γνωστές ως μετρήσεις όπως είναι ο

Page 41: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 41

αριθμός πωλήσεων και η ποιότητα) από έναν αριθμό διαστάσεων (π.χ., το ένα τέταρτο των πωλήσεων ,η περιοχή των πωλήσεων ,οι γραμμές προϊόντων ,οι ομάδες πωλήσεων, κ.λ.π.)[Thomsen 97] [Berson and Smith 97].Οι OLAP συνήθως περιέχουν ομάδες εγγράφων από συγκεκριμένα πεδία (διαστάσεις) και υπολογίστηκες περιλήψεις δεδομενων για την κάθε ομάδα .Για παράδειγμα ,οι περιλήψεις των πωλήσεων μπορούν να αποκτηθούν πρώτα ομαδοποιώντας όλες τις εγγραφές των πωλήσεων από είδη προϊόντων και μετά υπολογίζοντας τις περιλήψεις των πωλήσεων για κάθε ομάδα εγγραφών με το ίδιο είδος εγγραφών.

3.7 Τεχνικές Προκλήσεις

Η υπολογιστική προσωποποίηση ,ξεκίνησε να εφαρμόζεται στην πελατειακών σχέσεων διαχείριση, στο ηλεκτρονικό εμπόριο και στις υπηρεσίες πυλών πληροφοριών. Καθώς αυτές οι περιοχές εφαρμογής είναι σχετικά νέες ,υπάρχουν πολλές τεχνικές προκλήσεις για την αντιμετώπιση της προσωποποίησης. Ας τις εξετάσουμε λοιπόν:

1. Είναι απαραίτητο να μειωθεί ουσιαστικά ο αριθμός των άσχετων “hits’’ που επιστρέφονται στις έρευνες στον ιστό. Ένα από τα πιο σοβαρά προβλήματα στην παράδοση προσωποποιημένων πληροφοριών σήμερα είναι η ανικανότητα της τεχνολογίας να επιτρέψει στους ανθρώπους να συγκεκριμενοποιήσουν εύκολα και με ακρίβεια τις πληροφορίες που θέλουν ή να καταλάβουν την σημασιολογία των περιεχομένων των πολυμεσικών εγγραφών. Το αποτέλεσμα είναι ένας μεγάλος αριθμούς εντελώς άσχετων «hits» από τις σημερινές μηχανές έρευνας του ιστού (π.χ., προκαλώντας τους ανθρώπους να σκεφτούνε το βιβλίο ‘’Γυμνός στο Κυβερνητικό Διάστημα’’, μια πορνογραφική ιστοσελίδα), η επανάκτηση και το χειροκίνητο σκαναρισμα μεγάλων εγγράφων κειμένου περιέχουν έναν μικρό αριθμό επιθυμητών πληροφοριών ή ίσως και καθόλου κ.λ.π. Μια λύση έγκειται στο να γίνονται οι συνθήκες έρευνας πιο έξυπνες από ότι αναγνωρίζουν οι σημερινές μηχανές αναζήτησης. Πρέπει να είναι πιθανό να προσδιορίζονται οι συνθήκες έρευνας που περιλαμβάνουν λέξεις κλειδιά συνδεδεμένες από τους Boolean χειριστές (AND, OR,NOT),συγκριτικούς (= ,> ,< ,κ.λ.π.),χειριστές ρυθμίσεων (CONTAINS ,IN ,Intersection, Difference ,Union),, χειριστές χρόνου (before ,after ,κ.λ.π.) και χειριστές χώρου (near, within, intersects ,contains ,κ.λ.π.).Εμπειρίες από την χρήση σχεσιακών συστημάτων βάσεων δεδομενων και αποτελέσματα ερευνών σε προσωρινή διαχείριση δεδομένων και διαχείριση δεδομένων σχετικά με τον χώρο θα δρέπει να ισχυροποιούνται . 2. Είναι απαραίτητο να γενικοποιείται η “λέξη κλειδί προς αναζήτηση’’ σε ένα “γενικό αντικείμενο” συμπεριλαμβανομένου ενός κειμένου χωρίς μορφή, ένα HTML ή XML εγγράφου αλλά και ενός αντικειμένου πολυμέσων όπως είναι μία εικόνα, ένα video clip ή ένα απόσπασμα ομιλίας. Οι μηχανές αναζήτησης του Διαδικτύου θα ανακτήσουν τότε ‘’γενικά αντικείμενα’’ στο Internet ,που ταιριάζουν επακριβώς στο αντικείμενο ερώτησης (π.χ., ένα δείγμα κειμένου ή ένα δείγμα εικόνας) ή αυτά που είναι ‘’όμοια’’ στο αντικείμενο ερώτησης. Η μέτρηση της ‘’ομοιότητας ‘’ ανάμεσα σε ένα αντικείμενο ερώτησης και σε ένα αντικείμενο στο Internet διαφέρει ανάλογα με τον τύπου του αντικειμένου. Για τα XML έγραφα, η μέτρηση ομοιότητας μπορεί να περιλαμβάνει ομοιότητα της δομής των εγγραφών, το ‘βάρος” των ισοδυναμιών ορών ,κ.λ.π. Από την στιγμή που γίνονται περαιτέρω αναπτύξεις στην κατανόηση των απλών κειμένων ή τέτοιων κειμένων σε XML έγραφα, είναι επιθυμητό να μεταφέρονται κείμενα σε πολλαπλά επίπεδα λεπτομερών εγγράφων σε σχέση με αυτό που επιθυμούν οι άνθρωποι . Υπάρχει μικρή ελπίδα στο ότι η τεχνολογία θα αναπτυχθεί επαρκές στο προβλεπόμενο μέλλον για να επιτρέψει ισοδυναμία περιεχόμενου ήχου και βίντεο .Ωστόσο ,υπάρχουν κάποιες ενδείξεις ανάπτυξης στην αναγνώριση ήχου και

Page 42: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 42

ανάλυσης της εικόνας ,και μπορεί να είναι πιθανό να τις εφαρμόσουν σε έρευνες Ιστού στο ερχόμενο μέλλον . 3. Χρειάζεται να εμπλουτιστούν τα δεδομένα καταγραφών Ιστού με την σύνδεση δεδομένων δημογραφίας, τρόπου ζωής ή ιστορίας συναλλαγής δεδομένων που ήταν αποθηκεμένα σε μια αποθήκη δεδομένων (ή σε μια βάση δεδομένων) και/ή στις πραγματικές σελίδες του Ιστού που πήραν μέρος. Οι τύποι των πληροφοριών που συλλήφθηκαν σε μια καταγραφή Ιστού είναι μάλλον περιορισμένοι και η χρησιμότητα των αποτελεσμάτων της ανάλυσης δεδομένων δικτυακής καταγραφής είναι επίσης περιορισμένη. Μιας και τα δεδομένα καταγραφής Ιστού μπορούν να συνδεθούν με σχετικές καταγραφές σε μια αποθήκη δεδομένων ,και/ή τα περιεχόμενα των σελίδων Web που αναφερθήκαν μια ολοκληρωμένη βάση για τον διαχωρισμό των επισκεπτών της ιστοσελίδας και η πρόβλεψη της συμπεριφοράς τους θα μπορεί να διαμορφωθεί . 4. Μια από τις πιο σημαντικές τεχνολογίες για την προσωποποίηση είναι η εξόρυξη δεδομένων και η εξόρυξη κειμένου. Παρά τις κάποιες επιτυχίες που έχει επιδείξει (π.χ., στην ανίχνευση λαθών στις πιστωτικές ή χρήσεις καρτών τηλεφώνου, απαιτήσεις ιατρικής ασφάλεια ακόμη και ανακάλυψη αστεριών σε ένα αγαλαξία και καινούργιας χημικά, κ.λ.π.),η τεχνολογία εξόρυξης δεδομένων χρειάζεται σημαντικές προόδους για την ευκολία χρήσης, την πρόβλεψη ακρίβειας την εκτέλεση και την κλιμάκωση .Ακόμη, η τεχνολογία δημιουργίας μιας υφιστάμενης ιεραρχίας παραμένει το κλειδί της ευκαιρίας για την ταξινόμηση των κειμένων από εργαλεία εξόρυξης κειμένου. Το βάθος ,το πλάτος και η δομή του αντικειμένου ιεραρχίας είναι δύσκολα να ορισθούν συστηματικά και σωστά ακόμα και από τους ανθρώπους. Για παράδειγμα ,που θα τοποθετούσε κανείς μια ιστορία σχετικά με “ένα εμβατήριο κάποιου αγρότη στην πρωτεύουσα για να ζητήσει συγχώρεση για τα χρέη”- στην οικονομική πολιτική, πολιτική, ή στα λοιπά κοινωνικά;- “Ο Bill Gates κάνει μια δωρεά $100 εκατομμυρίων για να προωθήσει τις τέχνες και την δημόσια εκπαίδευση” -επιχειρήσεις, εκπαίδευση ,τέχνες ; 5. Επιπλέον πρόοδος στην ανίχνευση και διόρθωση άχρηστων δεδομένων είναι απαραίτητη. Αν η προσωποποίηση του ένα προς ένα μάρκετινγκ γίνετε με άχρηστα και αναξιόπιστα δεδομένα, το αποτέλεσμα μπορεί να είναι από λανθασμένες συστάσεις, που μπορεί να αποξενώσει (αιχμαλώτισε) τους πελάτες μέχρι πραγματικής ζημιές στους ανθρώπους. Για παράδειγμα ,αν το εισόδημα του Pedro Gonzales αναγράφεται στα $200.000, όταν στην πραγματικότητα είναι $20.000 ένα σύστημα αίτησης πιστωτικής κάρτας μπορεί να εγκρίνει ένα λανθασμένο όριο πίστωσης ,ένα Website ηλεκτρονικού εμπορίου μπορεί να συστήσει περισσότερα ακριβά καλά (αγαθά ,προϊόντα)ή υπηρεσίες από αυτές που ο Pedro Gonzales μπορεί να αντέξει. Το μη ακριβές δεδομένο περιέχει λανθασμένο δεδομένο, ελλιπές δεδομένο και δεδομένο που δεν συμμορφώνεται σε μια στάνταρ μορφή [Kim et al 2002]. Το μη ακριβές δεδομένο προέρχεται από λάθη στην εισαγωγή του δεδομένου (λάθος δαχτυλογραφήθηκε, ορθογραφικά λάθη, ελλιπές πληροφορίες), ατελή στερεοποίηση πολλαπλών ανεξάρτητα δημιουργημένων βάσεων δεδομένων (διαφορετικές μονάδες μέτρησης, πλεονάζουσα εισαγωγή για το ίδιο δεδομένο, κ.λ.π.) Παρά την μεγάλη σημασία των δεδομένων υψηλής –ποιότητας ,σήμερα ανεπαρκής προσοχή δίνεται στην ποιότητα του δεδομένου [English 99]. 6. Τα θέματα εκτέλεσης και κλιμάκωσης είναι πάντα τεχνικές προκλήσεις όταν επεξεργάζονται μεγάλοι όγκοι δεδομένων που μπορούν να είναι προσβάσιμοι από έναν μεγάλο αριθμών ταυτόχρονων χρηστών. Η ανάγκη για συστάσεις ,σε πραγματικό χρόνο σε καταστάσεις πραγματικού εμπορίου (π.χ., όταν ένας επισκέπτης επισκέπτεσαι ένα Website, εμφανίζονται διάφορα προϊόντα πιθανού ενδιαφέροντας για κάποιον επισκέπτη) και η ανάγκη για επεξεργασία μεγάλου όγκου πελατειακών δεδομένων προκειμένου να επιτευχθεί

Page 43: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 43

μια κατηγοριοποίηση για κάθε ένα ξεχωριστά είναι δυο από τους λόγους που κάνουν δύσκολη την χρονική μεταφορά πληροφοριών προσωποποίησης. Τα δημογραφικά στοιχεία του πελάτη και τα δεδομένα του τρόπου ζωής του ,καθώς και η πελατειακή συναλλαγή δεδομένου είναι τυπικά μεγάλες. Για να μπορέσει κάνεις να προσφέρει προσωποποιημένες συστάσεις σε πραγματικό χρόνο σε διαδυκτιακους επισκέπτες ηλεκτρονικού εμπορίου ή να αναλύσει τεράστιους τομείς δεδομένων σε καθορισμένο χρόνο ώστε να επηρεάσει τις επιχειρηματικές αποφάσεις ,όλες οι τεχνικές που αναπτύχθηκαν για να διευθύνουν θέματα λειτουργιών και κλιμάκωσης σε σχεσιακά συστήματα βάσεων δεδομένων και αλλά συστήματα επεξεργασίας δεδομένων πρέπει να μπουν σε χρήση. Οι τεχνικές περιλαμβάνουν παράλληλη επεξεργασία, τοποθέτηση δεικτών και αναδιατύπωση, κατακερματισμό, χρήση ενός γρήγορου πακέτου ταξινόμησης, συντονισμός εκτέλεσης παραμέτρων κ.λ.π. Συγκεκριμένα, η παράλληλη επεξεργασία περιλαμβάνει άμεση διοχέτευση επεξεργασίας, τμηματοποίηση βάσης δεδομένων, συμμετρική πολυεπεξεργασία ,κ.λ.π .Στην άμεση διοχέτευση επεξεργασίας ,η επεξεργασία αίτησης οργανώνεται σε διάφορα πολλαπλά βήματα επεξεργασίας και το ένα βήμα ξεκινά την στιγμή που τα αποτελέσματα του προηγούμενου βήματος είναι διαθέσιμα. Στη επεξεργασία της τμηματοποιημένης βάσης δεδομένων η βάση δεδομένων χωρίζεται σε πολλαπλά μέρη και το καθένα από αυτά καταγράφεται σε διαφορετικό υπολογιστή ,έτσι ώστε να επεξεργάζονται την ίδια αίτηση σε διαφορετικά μέρη της βάσης δεδομένων ταυτόχρονα.

3.8 Μη Τεχνικές Προκλήσεις

Η προσωποποίηση για το ένα προς ένα μάρκετινγκ από τις επιχειρήσεις μπορεί

μερικές φορές να προκαλέσει απροσδόκητο και δυσάρεστο αποτέλεσμα σε αυτές. Αυτό μπορεί να συμβεί αν η προσπάθειες προσωποποιημένου μάρκετινγκ καταλήξουν στο να δυσαρεστήσουν τους πελάτες ή αν η χρήση του πελατειακού δεδομένου παραβιάσει ή θεωρηθεί ότι παραβιάζει την προσωπική ζωή (στοιχεία) του πελάτη.

Υπάρχει μια συχνά παραβλεπόμενη πλευρά του ένα προς ένα μάρκετινγκ στην προσωποποίηση .Είναι η ψυχολογία του ατόμου που είναι ο στόχος αυτού του τύπου μάρκετινγκ. Αν δεν πραγματοποιηθούν (αντιμετωπισθεί) σωστά, όλες οι προσπάθειες πώλησης “cross-sell”, και “up-sell” σε έναν πελάτη (π.χ., έναν επισκέπτη σε ιστοσελίδα ηλεκτρονικού εμπορίου) ,προκείμενου αυτός να αποστατήσει σε κάποιον ανταγωνιστή, διατρέχεται κίνδυνος αυτές οι προσπάθειες να ενοχλούν και να αποξενώνουν τον πελάτη με μια αίσθηση ότι αυτός/η “βομβαρδίζεται και συνθλίβεται μέχρι και για το τελευταίο του ευρώ”. Στο σημερινό υψηλά ανταγωνιστικό κόσμο των επιχειρήσεων το ρίσκο είναι εξίσου υψηλό.

Οι προσπάθειες προσωποποιήσεις μπορεί να αποτρέπουν τους πελάτες αν είναι υπερβολικές ή άσχετες. Το καταχρηστικό μάρκετινγκ περιλαμβάνει προσφορές από πολλές συστάσεις (π.χ., πάρα πολλά αντικείμενα προτείνονται για αγορά), “βομβαρδίζοντας” τους πελάτες (κάθε εβδομάδα ή κάθε φορά που ο πελάτης επισκέπτεται το website) και “εγκλωβίζοντας” τους πελάτες (π.χ., απαιτώντας να απαντηθούν πάρα πολλές απαντήσεις). Αυτά είναι τα αποτελέσματα της “φτωχά” δημιουργημένης προσωποποίησης, εξαιτίας της αμέλειας θεώρησης της ανθρώπινης αντίδρασης στο μάρκετινγκ. Το μη σχετικό μάρκετινγκ περιλαμβάνει ανακριβείς και άσχετες συστάσεις. Αυτά είναι συνήθως τα αποτελέσματα των συστάσεων που βασίζονται σε ασαφής ή λανθασμένα δεδομένα ή σε ανεπαρκή εκπαίδευση των αλγόριθμων εξόρυξης δεδομένων.

Το Internet έχει ήδη αποδειχθεί ως ένα μεγάλο μέσο διάδοσης πληροφοριών άμεσα σε όλο τον κόσμο και απόκτησης πληροφοριών κάθε είδους από οποιοδήποτε σημείο του κόσμου. Ευαίσθητες (ευπαθείς) πληροφορίες για κάποιον (π.χ., εγγραφές, τραπεζικές, ιατρικές έγγραφες ,σχολικές εγγραφές ,επαγγελματικές εγγραφές, δικαστικές ,φορολογικές,

Page 44: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 44

αγοραστικές εγγραφές αντικειμένων μεγάλωνα κλήσεων ακόμη και συμβιβασμός φωτογραφιών κ.λ.π.), αποθηκευμένες σε πολλά μέρη (π.χ., τράπεζες, νοσοκομεία, σχολεία, εργοδότες, δικαστήρια, λογχίστηκες εταιρίες, εμπορικά κέντρα ,κ.λ.π.),μπορεί να τοποθετηθούν σε μια ιστοσελίδα για άμεση παράδοση σε όλο τον κόσμο.

Μη εξουσιοδοτημένη διάδοση πληροφοριών, ευαίσθητων για κάποιο άτομο, μπορεί να είναι το αποτέλεσμα της κλοπής από hackers τέτοιων πληροφοριών, ασυνείδητα άτομα (π.χ., εργαζομένους σε εταιρίες πιστωτικών καρτών, τράπεζες, κυβερνητικοί πράκτορες, νοσοκομεία ,κ.λ.π.)που θα έχουν πρόσβαση σε τέτοιες πληροφορίες, ή πώληση τέτοιων πληροφορικών από επιχειρήσεις για εμπορικά οφειλή νόμιμα ή όχι .Φυσικά ,μη εξουσιοδοτημένη διάδοση ευαίσθητων πληροφοριών μπορεί να συμβεί (και έχει ήδη γίνει) και χωρίς το Internet. Τη στιγμή αυτή η παγκόσμια έκταση του Internet προκαλεί απλά την ζημιά σε μεγαλύτερο μέγεθος απ’ ότι θα μπορούσε να συμβεί. Μολονότι, τα θέματα περί πνευματικών δικαιωμάτων είναι σε κάποιον βαθμό νόμιμα ,είναι και σε κάποιον βαθμό παράλογα. Για κάποιον που αγοράζει τη σειρά τον Νόμπελ των Tom Clancy και Frederick Forsythe, ή που ψωμίζει για καθημερινά ρούχα στου Macy’s, επισκεπτόμενος την ιστοσελίδα της IBM και της Cisco ,δεν υπάρχει λόγος να ανησυχεί κάνεις για τις δικές του/της εγγραφές αγοράς ή την καταγραφή δεδομένων του ιστού ότι μπορούν να κάνουνε τον γύρο του κόσμου.

Επιπλέον ,δεν υπάρχει γενικά κανένας λόγος ανησυχίας ,αν η πληροφορία για κάποιο άτομο ακόμα και αν αυτή είναι ευαίσθητη πληροφορία, χρησιμοποιείται απλά, σαν μέρος ευρέων στατιστικών πληροφοριών (π.χ., ο αριθμός των ατόμων στο Dallas που αγοράζει μια BMW Ζ5 το 2005 ,ένα ποσοστό ανδρών αυτών χρησιμοποιούσε συνοδευτικές υπηρεσίες, ένα ποσοστό ατόμων δήλωσαν ψεύτικα εισοδήματα, κ.λ.π.). Υπάρχει λόγος ανησυχίας, ωστόσο σε κάποιον που γράφεται μέλος σε μια πορνογραφική ιστοσελίδα που εμπλέκεται σε τραπεζικές συναλλαγές με σκοπό το ξέπλυμα χρημάτων, ψεύτικη δήλωση εισοδήματος με σκοπό την αποφυγή φόρων, εισαγωγή στο νοσοκομείο για θεραπεία κάποιων αφροδίσιων νοσημάτων, ψέματα στον εργοδότη του/της για το επαγγελματικό ιστορικό του/της ή για την εκπαιδευτική του κατάρτιση, κ.λ.π. Φυσικά, υπάρχει ο κίνδυνος ότι ένα εντελώς αθώο άτομο μπορεί να υποφέρει από κάποιες λανθασμένες πληροφορίες για αυτόν/αυτήν ,συχνά απαιτεί τεράστιες προσπάθειες, δαπάνες και αρκετό καιρό για να διορθωθούν οι βλάβες που προκλήθηκαν από τέτοιου είδους πληροφόρηση.

Η ανησυχία για τα προσωπικά δεδομένα, θα προκαλέσει καμπυλότητα σε ανεξέλεγκτες προσπάθειες προσωποποίησης στο ένα προς ένα μάρκετινγκ από τις επιχειρήσεις. Θα πρέπει να υπάρχουν νόμοι, που θα εκτιμούν πότε οι επιχειρήσεις μπορούν να διανέμουν (επί χρήμασι) ή δωρεάν τα δεδομένα των πελατών τους (σε άλλες επιχειρήσεις, κυβερνητικούς πράκτορες, αλλά άτομα, κ.λ.π.) χωρίς εξουσιοδότηση από τους πελάτες, και, όπου μπορούν, τι είδους πελατειακών δεδομένων θα διανέμουν. Ωστόσο, δεν θα πρέπει να υπάρχει κανένα πρόβλημα με κάποιον έμπορο (online ή offline) να διατηρεί ένα ιστορικό αγορών και δημογραφικών δεδομένων που ο κάθε πελάτης έχει συμπληρώσει ώστε χρησιμοποιώντας αυτές τις πληροφορίες να προσφέρει καλύτερες πληροφορίες σε αυτόν τον συγκεκριμένο πελάτη (π.χ., προτείνοντας ενεά προϊόντα ή υπηρεσίες για να αγοράσει ,είτε στέλνοντας μια ευχετήρια κάρτα γενεθλίων κάθε χρόνο). Δεν θα πρέπει να υπάρχει κανένα πρόβλημα με κάποιον έμπορο ,να χρησιμοποιήσει κάποιο πελατειακό δεδομένο για να καταλάβει διάφορες γενικές τάσεις ανάμεσα στους πελάτες και χρησιμοποιώντας τέτοιες πληροφορίες να κάνει επανάληψη σε επιχειρηματικές στρατηγικές από στιγμή σε στιγμή .

Page 45: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 45

3.9 Είδη Προσωποποίησης

3.9.1 Προσωποποίηση Υπερ-συνδέσμων (link personalization)

Αυτή η στρατηγική περιλαμβάνει επιλογή των υπερ-συνδέσμων που είναι πιο

σχετικοί στον χρήστη, αλλάζοντας το αρχικό χώρο περιήγησης, με τη μείωση ή βελτίωση των σχέσεων μεταξύ των κόμβων. Οι εφαρμογές του ηλεκτρονικού εμπορίου χρησιμοποιούν το link personalization για σύσταση αντικειμένων βασισμένα στα ιστορικά αγοράς των πελατών ή για κάποιες κατηγόριες πελατών βασισμένες στις προτιμήσεις τους. Οι χρήστες που ψάχνουν όμοιες βαθμολογήσεις σε όμοια αντικείμενα θεωρούνται ότι έχουν ίδια γούστα, έτσι όταν ένας χρήστης ψάχνει συστάσεις για προϊόντα ,οι σελίδες προτείνουν αυτά που είναι περισσότερο δημοφιλή για τα γούστα του, ή αυτά που είναι πιο σχετικά με το συγκεκριμένο προϊόν. Το link personalization χρησιμοποιείται ευρέως στο www.Amazon.com για να εισάγει στην αρχική σελίδα συστάσεις ,νέες αποδεσμεύσεις, αγοραστικές ομάδες ,κ.λ.π. που είναι προσωποποιημένες. Το Amazon.com έχει εφαρμόσει αυτή την μέθοδο χτίζοντας στα άκρα μια “New For You” αρχική σελίδα παρουσιάζοντας σε κάθε χρήστη τα νέα προϊόντα για τα όποια μπορεί να ενδιαφέρεται

3.9.2 Προσωποποίηση Περιεχομένων (Content Personalization)

Μπορούμε να πούμε ότι το περιεχόμενο προσωποποιείτε όταν οι σελίδες παρουσιάζουν διαφορετικές πληροφορίες σε διαφορετικούς χρήστες .Η διαφορά με την link personalization κατά παραγγελία είναι απειροελάχιστη αφού από την στιγμή που οι υπερ-συνδέσεις προσωποποιούνται, τότε ένα μέρος των περιεχομένων παρουσιάζουν διαφορετικές πληροφορίες. Ωστόσο ,θα αναφερθούμε στο content personalization όταν μια ουσιώδη πληροφορία σε έναν κόμβο προσωποποιείτε. Το content personalization, μπορεί να ταξινομηθεί περαιτέρω σε δυο τύπους: προσαρμογή της δομής των κόμβων και προσαρμογή των περιεχομένων του κόμβου.

3.9.3 Προσωποποίηση Δομής (Structure Personalization) Η προσωποποίηση δομής συνήθως εμφανίζεται σε αυτά τα δίκτυα που φιλτράρουν

τις πληροφορίες που είναι σχετικές με τον χρήστη δείχνοντας μόνο τομείς και λεπτομέρειες για τα οποία ο χρήστης μπορεί να ενδιαφέρεται .Ο χρήστης μπορεί να έμμεσα να μας επιδείξει τις προτιμήσεις του ή μπορεί να εννοηθούν αυτόματα από το προφίλ του από τις ενέργειες της πλοήγησής του. Για παράδειγμα, στο my.yahoo.com ή στο www.mycnn.com οι χρήστες επιλέγουν μια ομάδα επιλογών(από μια μεγαλύτερη ομάδα που περιλαμβάνει τον καιρό, τα νέα, την μουσική ,κ.λ.π.) και περαιτέρω προσωποποιεί αυτές τις επιλογές διαλέγοντας μια ομάδα ρυθμίσεων της ενότητας που πρόκειται να γίνει αισθητή. Κάποια “αυτόματη” προσαρμογή μπορεί να πραγματοποιηθεί χρησιμοποιώντας τον αριθμό του ταχυδρομικού κωδικού του χρήστη ,όπως για παράδειγμα, για να συλλέξει πια αθλητικά γεγονότα μπορεί να τον ενδιαφέρουν. Η μέθοδος που ακολουθείται σε αυτές τις εφαρμογές

Page 46: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 46

είναι ότι ο χρήστης θα δρέπει να είναι ικανός να “χτίσει” την δίκη του σελίδα, ακόμα διαρρύθμιση της σελίδας μπορεί προσαρμοστεί.

3.9.4 Ενότητες Προσωποποίησης

Ολόκληρη η διαδικασία της προσωποποίησης αποτελείται από πέντε ενότητες, οι οποίες είναι τα βήματα της διαδικασίας αυτής. Αυτές είναι οι εξής:

• Δημιουργία προφίλ χρήστη: σε ένα domain, η δημιουργία του προφίλ του χρήστη γίνεται με την συγκέντρωση συγκεκριμένων πληροφοριών για κάθε χρήστη είτε άμεσα είτε έμμεσα. Το προφίλ ενός χρήστη περιλαμβάνει δημογραφικές πληροφορίες σχετικά με τον χρήστη, τα ενδιαφέροντα του/της, ακόμα και την συμπεριφορά του/της όταν περιήγατε στο διαδίκτυο. Αυτή την πληροφορία την εκμεταλλεύεται έτσι ώστε να προσαρμοστεί το περιεχόμενο της ιστοσελίδας σύμφωνα με τις ανάγκες του επισκέπτη.

• Ανάλυση των Log αρχείων και την εξόρυξη χρήσης διαδικτύου (Web Usage Mining): Αυτή είναι η διαδικασία όπου οι πληροφορίες που αποθηκεύονται στα αρχεία του server επεξεργάζονται με την εφαρμογή τεχνικών εξόρυξης δεδομένων έτσι ώστε, α) να αποσπαστούν στατιστικές πληροφορίες και να ανακαλυφθούν ενδιαφέροντα πρότυπα χρήσης, β) να ομαδοποιηθούν οι χρήστες ανάλογα με την συμπεριφορά της περιήγησής τους, γ) να ανακαλυφθούν πιθανή συσχετισμοί μεταξύ των ιστοσελίδων και των ομάδων των χρηστών. Αυτή η διαδικασία απόσπασης πληροφοριών που αφορούν την συμπεριφορά της περιήγησης του χρήστη μπορεί να θεωρηθεί ως μέρος της διαδικασίας δημιουργίας του προφίλ του χρήστη. Έτσι λοιπόν αποδεικνύεται ότι οι ενότητες της δημιουργίας προφίλ του χρήστη και του Web Usage Mining, έχουν κοινά χαρακτηριστικά.

• Διαχείριση περιεχομένου: Αυτή είναι η διαδικασία της ταξινόμησης του περιεχομένου μιας ιστοσελίδας σε κατηγορίες με σκοπό να γίνει ευκολότερη, στους χρήστες, η ανάκτηση των πληροφοριών και η παρουσίασή τους. Η διαχείριση περιεχομένου είναι πολύ σημαντική για τις Ιστοσελίδες των οποίων το περιεχόμενο αυξάνεται σε μια ημερησία βάση όπως είναι τα site ειδήσεων και οι πύλες .

• Δημοσίευση Ιστοσελίδας: Ένας μηχανισμός δημοσίευσης χρησιμοποιείται προκειμένου να παρουσιάσει το περιεχόμενο που αποθηκεύτηκε τοπικά σε ένα Web server και/ή να ανακτήσει κάποιες πληροφορίες από άλλες πηγές του διαδικτύου με ένα ομοιόμορφο τρόπο για τον τελικό χρήστη. Διαφορετικές τεχνολογίες μπορούν να χρησιμοποιηθούν για να δημοσιευθούν διδόμενα στο διαδίκτυο.

• Απόκτηση και ερεύνα πληροφοριών: σε πολλές περιπτώσεις η πληροφορία που μας παρέχει ένα Website δεν αποθηκεύεται με φυσικό τρόπο στον server της ιστοσελίδας. Στην περίπτωση μιας διαδικτυακής πύλης, οι χρηστές ενδιαφέρονται για πληροφορίες από διάφορες πηγές του διαδικτύου. Οπότε είναι στο χέρι των κατασκευαστών της ιστοσελίδας να ερευνήσουν το διαδίκτυο για ενδιαφέρον περιεχόμενο όπου θα μπορούσε να ταξινομηθεί σε θεματικές κατηγορίες. Πρέπει να γίνεται έρευνα και κατηγοριοποίηση στις τεχνικές που θα πρέπει να εφαρμόζονται στην επεξεργασία απόκτησης πληροφορικών αλλά και την δημοσίευση των ιδανικών δεδομενων για την κάθε ομάδα χρήστη . Τα βήματα της διαδικασίας της προσωποποίησης του διαδικτύου είναι: α) συλλογή δεδομένων, β) δημιουργία μοντέλων και κατηγοριών αυτών των δεδομένων (φάση προ-επεξεργασίας ), γ) την ανάλυση των συλλεγμένων δεδομένων και,

δ) την αποφασιστικότητα των πράξεων που θα πρέπει να γίνουν. Οι τρόποι που εφαρμόζονται με σκοπό την ανάλυση των συλλεγμένων δεδομένων περιλαμβάνουν:

το φιλτράρισμα του περιεχομένου,

Page 47: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 47

συνεργατικό φιλτράρισμα, φιλτράρισμα βασισμένο σε κανόνες, και το Web Usage Mining.

Το site προσωποποιείτε μέσο της επισήμανσης των είδη υπαρχόντων υπερσυνδέσεων, της δυναμικής εισόδου νέων υπερσυνδέσεων που είναι ενδιαφέροντες για τον χρήστη ή ακόμα και την δημιουργία νέων υποσελίδων.

Τα συστήματα φιλτραρίσματος βασίζονται αποκλειστικά στις προτιμήσεις του κάθε χρήστη. Το σύστημα ιχνηλατεί την συμπεριφορά του κάθε χρήστη και συστήνει αντικείμενα σε αυτούς που είναι όμοια με τα αντικείμενα που του είχαν αρέσει στο παρελθόν.

Τα συστήματα συνεργατικού φιλτραρίσματος καλούν τους χρήστες να βαθμολογήσουν τα αντικείμενα ή να φανερώσουν τις προτιμήσεις και τις επιθυμίες τους και μετά να επιστρέφουν την πληροφορία που προβλεπόμενα θα τους ενδιαφέρει. Αυτό βασίζεται στην θεωρία ότι οι χρήστες με όμοια συμπεριφορά (π.χ., χρήστες που βαθμολογούν όμοια ένα αντικείμενο) έχουνε ανάλογα ενδιαφέροντα. Στα συστήματα φιλτραρίσματος κανόνων οι χρήστες ζητούνται να απαντήσουν μια σειρά ερωτήσεων. Αυτές οι ερωτήσεις προέρχονται από δέντρα αποφάσεων, έτσι ώστε ο χρήστης να κατευθύνεται στο να τις απαντήσει, ώστε αυτό που τελικά θα λάβει ως αποτέλεσμα (π.χ. μια λίστα προϊόντων) να είναι φτιαγμένο σύμφωνα με τις ανάγκες του. Τα φιλτραρίσματα περιεχομένων, κανόνων και συνεργασιών μπορούν ακόμα να χρησιμοποιηθούν σε συνδυασμούς, για την εξαγωγή πιο ακριβής συμπερασμάτων.

Με αυτή την εργασία εστιαζόμαστε στο Web Usage Mining. Αυτή η διαδικασία βασίζεται στην εφαρμογή μεθόδων στατιστικής και εξόρυξης δεδομένων στα καταγραμμένα δεδομένα του διαδικτύου, καταλήγοντας έτσι, σε ένα σύστημα χρήσιμων μορφών που επιδεικνύουν την συμπεριφορά της περιήγησης των χρηστών. Οι μέθοδοι εξόρυξης δεδομένων που εφαρμόζονται είναι: η εξόρυξη συνεργατικών κανόνων, η ανακάλυψη διαδοχικών προτύπων, η ομαδοποίηση και η ταξινόμησης. Η γνώση αυτή χρησιμοποιείται, στη συνέχεια, από το σύστημα με σκοπό να προσωποποιήσει το site ανάλογα με την συμπεριφορά και το προφίλ του κάθε χρήστη.

Page 48: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 48

Κεφαλαιο 4

Page 49: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 49

4.1 Personalization και Data Mining

Όταν οι επισκέπτες αλληλεπιδρούν μ’ ένα site, παρέχονται πληροφορίες γι’ αυτούς

και πώς ανταποκρίνονται στο περιεχόμενο αυτού: σε ποιους υπερσυνδέσμους (link) κάνουν κλικ οι επισκέπτες, που ξοδεύουν περισσότερο το χρόνο τους, ποιους όρους αναζήτησης χρησιμοποιούν, και πότε ψάχνουν. Κάποιοι μπορεί ακόμα και να συμπληρώνουν έρευνες που σχετίζονται με τον τρόπο ζωής τους (lifestyle) ή να παρέχουν προσωπικά στοιχεία όπως ονόματα και διευθύνσεις. Ένα πολύπλοκο περιεχόμενο περιλαμβάνει επίσης σημαντικές πληροφορίες, όπως λέξεις κλειδιά ανάμεσα στα άρθρα, περιγραφές εργασίας ή περιλήψεις, και χαρακτηριστικά ανταγωνιστικών ή συμπληρωματικών προϊόντων. Όλες αυτές οι πληροφορίες αποθηκεύονται συνήθως σε μία βάση.

Αυτά τα αποθηκευτικά συστήματα αναφοράς συνήθως αποκαλούνται ως online αναλυτικά συστήματα επεξεργασίας (OLAP Systems). Τα OLAP συστήματα μπορούν να δώσουν αναφορές μόνο για απευθείας παρατηρούμενες και εύκολα συσχετιζόμενες πληροφορίες. Βασίζονται στο γεγονός ότι ο διαχειριστής θα βρει πρότυπα και θα αποφασίσει έπειτα τι θα κάνει μ’ αυτά. Επίσης τα συστήματα αυτά δεν θα μας πουν ποτέ ότι αυτοί οι άνθρωποι αγοράζουν συχνά κάποιο ηλεκτρονικό gadget και το συνοδεύουν με κάποιο αξεσουάρ την ίδια στιγμή ή δεν μπορούν να ανακαλύψουν ότι μερικοί άνθρωποι παρακολουθούν ταινίες που περιλαμβάνουν εκρήξεις. Οι πληροφορίες είναι ακόμη και για τον άνθρωπο περίπλοκες ώστε να ανακαλύψει τα πρότυπα που χρησιμοποιεί ένα OLAP σύστημα.

Για να λυθεί το πρόβλημα αυτό, οι αναλυτές επιχειρήσεων χρησιμοποιούν τεχνικές εξόρυξης δεδομένων. Αυτοί είναι μαθησιακοί αλγόριθμοι όπου μπορούν να βρούν “κρυμμένα” πρότυπα σε βάσεις ώστε να δώσουν αναφορά ή να δράσουν σ’ αυτά τα ευρήματα. Έχοντας υπ’ όψιν ότι υπάρχουν πολλές τεχνικές εξόρυξης δεδομένων και είναι αρκετά δύσκολο για έναν άνθρωπο να κατανοήσει ολόκληρο το πεδίο, μέσα από μία εργασία ή ένα άρθρο θα αναφερθούμε επιγραμματικά σ’ αυτές καθώς και στα προβλήματα που είναι ικανές να επιλύσουν.

Όσον αφορά τα χαρακτηριστικά ενός επισκέπτη αυτά περιλαμβάνουν δημογραφικά, ψυχοβιογραφικά και τεχνογραφικά στοιχεία. Τα δημογραφικά είναι απτά χαρακτηριστικά γνωρίσματα όπως διεύθυνση σπιτιού, εισόδημα, αγοραστική ικανότητα ή ψυχαγωγικός ιδιόκτητος εξοπλισμός.

Τα ψυχοβιογραφικά είναι τύποι προσωπικοτήτων, όπου μπορούν να προκύψουν μέσα από ψυχολογικές έρευνες, όπως υψηλά προστατευτικά αισθήματα για τα παιδιά, αγοραστικές τάσεις, πρόσφατα τεχνολογικά ενδιαφέροντα και ούτο καθεξής. Τα τεχνογραφικά είναι χαρακτηριστικά του συστήματος του χρήστη, όπως το λειτουργικό του σύστημα, ο περιηγητής του (browser), ή και η ταχύτητα με την οποία συνδέεται στο internet.

Τα στατιστικά των επισκεπτών αυξάνονται όσο αυτοί αλληλεπιδρούν με συγκεκριμένα “αντικείμενα” του site ή με ολόκληρο το web site. Τα στοιχεία αλληλεπιδράσεων έχουν να κάνουν με προηγούμενες αγορές, με προτιμήσεις σε διαφημίσεις και προτιμήσεις πληροφοριών.

Τα στατιστικά αυτά είναι τυπικά χαρακτηριστικά ανά τμήμα, όπως συνολικός χρόνος παραμονής του επισκέπτη, σελίδες που εμφάνισε στην οθόνη του, και κέρδος ανά τμήμα από κάποιον συγκεκριμένο. Τέλος, οι άδειες είναι ιδιότητες που έχει αποκτάει ο χρήστης παραχωρώντας ο ίδιος την άδεια για αποστολή ενημερωτικών emails, ή ο διαμοιρασμός πληροφοριών που τον αφορούν σε συνεργαζόμενες εταιρείες μάρκετινγκ και ούτω καθεξής.

Page 50: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 50

Έχοντας υπόψιν, ότι το μεγάλο πλεονέκτημα του διαδικτυακού μάρκετινγκ είναι ότι μπορούμε να μετρήσουμε πιο αποτελεσματικά τις αλληλεπιδράσεις του χρήστη, θα πρέπει για την εξόρυξη των δεδομένων να έχουμε σαφείς και μετρήσιμους στόχους. Κάποιοι απ’ αυτούς είναι:

1. Αύξηση μέσου όρου θέασης σελίδων 2. Αύξηση του αριθμού των αναφερθέντων επισκεπτών 3. Αύξηση αναγνωρισιμότητας 4. Αύξηση ρυθμού επιστροφής των επισκεπτών 5. Μείωση των κλικ για την άφιξη στην επιθυμητή πληροφορία

4.1.1 Χαρακτηριστικά Διαδικτύου και Data Mining Συχνά λέγεται ότι το διαδίκτυο προσφέρει ανεπανάληπτες ευκαιρίες και προκλήσεις για Data Mining. Εμείς πιστεύουμε ότι αυτό συμβαίνει εξαιτίας των ακόλουθων χαρακτηριστικών του διαδικτύου :

1. Το σύνολο των δεδομένων/πληροφοριών που υπάρχει στο διαδίκτυο είναι τεράστιο και αλματωδώς αυξανόμενο. Έτσι ώστε τα δεδομένα αυτά να είναι ευκόλως προσβάσιμα

2. Η κάλυψη των πληροφοριών του διαδικτύου είναι ευρύς. Μπορεί κάποιος να βρεί σχεδόν οποιαδήποτε πληροφορία στο διαδίκτυο

3. Στο διαδίκτυο υπάρχουν δεδομένα όλων των τύπων (εικόνα, ήχος, κείμενο κ.α) 4. Οι πληροφορίες στο διαδίκτυο είναι ετερογενείς. Πολλές ιστοσελίδες μπορεί να

παρουσιάζουν τις ίδιες ή παραπλήσιες πληροφορίες χρησιμοποιώντας όμως εντελώς διαφορετικές συντάξεις και τύπους, κάτι το οποίο την ενοποίηση των πληροφοριών αρκετά προκλητικό έργο.

5. Αρκετές πληροφορίες του διαδικτύου είναι ημι-δομημένες με μια ένθετη δομή από κώδικα HTML, δίνοντας έτσι στους κατασκευαστές ιστοσελίδων την ευκαιρία να παρουσιάσουν τις επιθυμητές πληροφορίες με απλό και εύχρηστο τρόπο έτσι ώστε να γίνει πιο εύκολη η χρήση της ιστοσελίδας από τους χρήστες.

6. Οι περισσότερες πληροφορίες στο διαδίκτυο είναι διασυνδεμένες. Υπάρχουν σύνδεσμοι μεταξύ σελίδων σε μία ιστοσελίδα, καθώς επίσης και μεταξύ διαφορετικών ιστοσελίδων (sites). Αυτοί οι σύνδεσμοι εξυπηρετούν ως ένα πληροφοριακό εργαλείο αλλά και ως μία ένδειξη εμπιστοσύνης προς στις συνδεδεμένες σελίδες ή ιστοσελίδων.

7. Οι περισσότερες πληροφορίες στο διαδίκτυο είναι υπεράριθμες. Το ίδιο κομμάτι πληροφορίας ή κάποια παραλλαγή αυτής μπορεί να εμφανίζεται σε κάποια άλλη σελίδα ή ιστοσελίδα. Η ιδιότητα αυτή εξεταστεί σε πολλά θέματα σχετικά με την εξόρυξη δεδομένων στο διαδίκτυο.

8. Μία ιστοσελίδα περιέχει διαφορετικά είδη πληροφοριών, π.χ. το κυρίως περιεχόμενο, διαφημίσεις, πίνακες περιήγησης κλπ. Για μία συγκεκριμένη εφαρμογή μόνο ένα μέρος των πληροφοριών αυτών μπορεί να θεωρηθεί χρήσιμο ενώ τα υπόλοιπα θα είναι περιττά.

9. Το διαδίκτυο μπορούμε να πούμε ότι αποτελείται από το “επιφανειακό” διαδίκτυο και τον πυρήνα του διαδικτύου. Το επιφανειακό διαδίκτυο αποτελείται από σελίδες που μπορούν να περιηγηθούν χρησιμοποιώντας έναν απλό περιηγητή (Web Browser). Ενώ ο πηρύνας του διαδικτύου αποτελείται από μία σύνθεση βάσεων δεδομένων που είναι προσβάσιμες μέσω παραμετροποιημένων ερωτημάτων χρησιμοποιώντας φόρμες.

Page 51: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 51

10. Το διαδίκτυο προσφέρει και παροχή υπηρεσιών. Πολλές ιστοσελίδες δίνουν την δυνατότητα στους χρήστες να εκτελέσουν διάφορες εργασίες με την εισαγωγή παραμέτρων.

11. Πάνω απ’ όλα το διαδίκτυο είναι μία εικονική κοινωνία. Δεν αφορά μόνο δεδομένα, πληροφορίες και υπηρεσίες αλλά και αλληλεπιδράσεις μεταξύ ανθρώπων, οργανισμών και αυτοματοποιημένων συστημάτων.

12. Το διαδίκτυο είναι δυναμικό. Οι πληροφορίες στο διαδίκτυο αλλάζουν συνεχώς. Ένα σημαντικό θέμα για πολλές εφαρμογές είναι η παρακολούθηση των αλλαγών αυτών.

4.1.2 Γιατί είναι χρήσιμη η εξόρυξη δεδομένων; Ένα λογισμικό εξόρυξης δεδομένων επιτρέπει στους χρήστες την ανάλυση μεγάλων

βάσεων δεδομένων για την λήψη αποφάσεων επιλύοντας διάφορα επιχηρειματικά και μη, προβλήματα. Η εξόρυξη δεδομένων είναι κατά κάποιο τρόπο μία επέκταση της επιστήμης της στατιστικής περιέχοντας τεχνητή νοημοσύνη και μαθησιακές μηχανές. Όπως και η στατιστική, έτσι και η εξόρυξη δεδομένων δεν αποτελεί λύση για μία επιχείρηση. Είναι απλά μία τεχνολογία.

Για παράδειγμα, ας υποθέσουμε ότι ένας πωλητής λιανικής, πρέπει να αποφασίσει ποιος απ’ τους πελάτες του πρέπει να πληροφορηθεί για ένα νέο προϊόν. Η πληροφορία που θα χειριστεί η εξόρυξη δεδομένων θα περιέχεται σε μία ιστορική βάση δεδομένων η οποία περιλαμβάνει προηγούμενες αλληλεπιδράσεις με τους πελάτες και τα χαρακτηριστικά που σχετίζονται με αυτούς, όπως για παράδειγμα: ηλικία, ταχυδρομικός κώδικας, και προηγούμενες ανταποκρίσεις τους. Το λειτουργικό εξόρυξης δεδομένων θα χρησιμοποιούσε αυτήν την πληροφορία για να κατασκευάσει ένα μοντέλο συμπεριφοράς του πελάτη το οποίο θα χρησιμοποιηθεί για να προβλέψει ποιοι πελάτες θα είναι πιθανότερο να έχει ανταπόκριση το νέο προϊόν. Έτσι, το λειτουργικό λογισμικό της επιχείρησης θα μπορέσει να τροφοδοτήσει με αποτελέσματα τα κατάλληλα συστήματα, ώστε ο κάθε πελάτης να λάβει την αντίστοιχη για αυτόν προσφορά.

4.2 Αλγόριθμοι Εξόρυξης Δεδομένων Στην παράγραφο αυτή θα δώσουμε μία πολύ σύντομη περιγραφή των πιο κοινών αλγορίθμων εξόρυξης δεδομένων που χρησιμοποιούνται σήμερα. Την περιγραφή αυτή την έχουμε χωρίσει σε δύο μέρη, το καθένα με συγκεκριμένο θέμα: Κλασσικές τεχνικές: Στατιστικές, “Πλησιέστερος Γείτονας” και Τμηματοποίηση Τεχνικές επόμενης γενιάς: Δέντρα, Δίκτυα και Κανόνες

Το κάθε τμήμα περιγράφει ένα σύνολο αλγορίθμων εξόρυξης δεδομένων ώστε να γίνει αντιληπτό πώς ο κάθε αλγόριθμος είναι κατάλληλος στο πεδίο των τεχνικών εξόρυξης δεδομένων.

4.2.1 Κλασσικές Τεχνικές Τα κλασσικά

Page 52: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 52

Τα δύο τμήματα αυτά έχουν χωριστεί με βάση το πότε αυτές οι τεχνικές έχουν αναπτυχθεί και το πότε έχουν γίνει τεχνικά αρκετά ώριμες για να χρησιμοποιηθούν στις επιχειρήσεις. Έτσι το τμήμα αυτό περιέχει περιγραφές τεχνικών που έχουν χρησιμοποιηθεί ευρέως επί δεκαετίες, απ’ τις αρχές του 1980. Οι τεχνικές αυτές που αναλύονται στην εργασία αυτή χρησιμοποιούνται για την επίλυση των 99.9% επιχειρησιακών προβλημάτων. Υπάρχουν βεβαίως πολλές άλλες ιδιόκτητες τεχνικές από συγκεκριμένους παρόχους αλλά στη βιομηχανία χρησιμοποιούνται οι παρακάτω γιατί είναι πιο αξιόπιστοι, πιο σταθεροί και περισσότερο κατανοητοί.

4.2.1.1 Προσωποποίηση και Εξόρυξη Δεδομένων

Στατιστική Με την αυστηρή τους έννοια η λέξη “στατιστική” ή τεχνικές στατιστικών δεν σημαίνουν εξόρυξη δεδομένων (Data Mining) .Χρησιμοποιούνταν για πολύ καιρό πριν καν επινοηθεί ο ορός Data Mining για να χρησιμοποιηθεί σε επιχειρηματικές εφαρμογές .Ωστόσο ,οι στατιστικές τεχνικές οδηγηθήκαν από τα δεδομένα και χρησιμοποιηθήκαν για να ανακαλύψουν πρότυπα και να σχεδιάσουν μοντέλα πρόβλεψης .Και από την πλευρά των χρηστών αντιμετωπίζουν μια συνειδητή επιλογή όταν έρχονται αντιμέτωποι με την λύση ενός προβλήματος εξόρυξης δεδομένων για το αν θα χρησιμοποιήσουν τεχνικές εξόρυξης δεδομένων ή άλλα στατιστικά μοντέλα. Γι΄ αυτό τον λόγο είναι σημαντικό να υπάρχει μια ιδέα σχετικά με το πώς λειτουργούν οι στατιστικές τεχνικές και πως μπορούν αυτές να εφαρμοστούν . Τι είναι διαφορετικό ανάμεσα στην στατιστική και στην εξόρυξη δεδομένων ;

Οι τεχνικές που χρησιμοποιούνται στην εξόρυξη δεδομένων ,όταν πετυχαίνουν ,είναι πετυχημένες για τους ίδιους λόγους για τους οποίους είναι και οι στατιστικές (π.χ. καθαρά δεδομένα ,ένας καλά ορισμένος στόχος για πρόβλεψη και σωστή εγκυρότητα για να αποφευχθεί το overfitting).Και στο μεγαλύτερο μέρος τους οι τεχνικές χρησιμοποιούνται για τους ίδιους τύπους προβλημάτων (πρόβλεψη ,ανακάλυψη ,ταξινόμηση).Στην πραγματικότητα μερικές από τις τεχνικές που κλασικά ορίζονται ως ‘’εξόρυξη δεδομένου’’ όπως είναι η CART και η CHAID προέκυψαν από στατιστικολόγους .Ποια είναι λοιπόν η διαφορά; Γιατί δεν είμαστε τόσο ενθουσιασμένοι με την στατιστική όσο είμαστε με την “εξόρυξη δεδομένων”;

Υπάρχουν διάφοροι λόγοι .Ο πρώτος είναι ότι οι κλασικές τεχνικές εξόρυξης δεδομένων όπως είναι η CART ,τα νευρωνικά δίκτυα και ο «διπλανέστερος γείτονας» τείνουν να χρησιμοποιούνται περισσότερα στα κύρια δεδομένα στον πραγματικό κόσμο και επίσης είναι πιο φιλικά αλλά και ισχυρά στο να χρησιμοποιηθούν από λιγότερο ειδικούς χρήστες. Αλλά αυτός δεν είναι ο μόνος λόγος. Ο άλλος είναι ότι ο χρόνος είναι σωστός. Εξαιτίας της χρήσης των υπολογιστών για επαναλαμβανόμενη αποθήκευση δεδομένων αλλά και παραγωγή, υπάρχουν πλέον μεγάλες ποσότητες δεδομενων που είναι διαθέσιμες στους χρήστες.

Page 53: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 53

Αν δεν υπήρχαν καθόλου δεδομένα –δεν θα υπήρχε καθόλου ενδιαφέρον στο να εξορυχθούν. Παρομοίως, το γεγονός ότι το υλικό του υπολογιστή έχει αυξήσει δραματικά τις απαιτήσεις από ξεχωριστές ταξινομήσεις σπουδαιότητας στην αποθήκευση και επεξεργασία των δεδομένων ,κάνει εφικτές σήμερα μερικές από τις πιο ισχυρές τεχνικές εξόρυξης δεδομένων. Η τελευταία σειρά, ωστόσο, από μια ακαδημαϊκή σκοπιά τουλάχιστον, είναι ότι υπάρχει μικρή διαφορά μεταξύ μιας στατιστικής τεχνικής και μιας κλασικής τεχνική εξόρυξης δεδομένων.

Τι είναι η στατιστική;

Η στατιστική είναι ένας κλάδος των μαθηματικών που αφορά την συλλογή και περιγραφή δεδομένων. Συνήθως η στατιστική θεωρείται ως ένας από τους τρομακτικότερους τίτλους στο κολλέγιο κάπου εκεί μαζί με την φυσική και με την χημεία. Ωστόσο, είναι πιθανώς ένας αρκετά φιλικότερος κλάδος των μαθηματικών επειδή μπορεί να χρησιμοποιηθεί κάθε μέρα. Η στατιστική γεννήθηκε από πολύ ταπεινά θεμέλια των προβλημάτων του πραγματικού κόσμου από τις επιχειρήσεις, την βιολογία και τα τυχερά παιχνίδια!

Σήμερα η εξόρυξη δεδομένων μπορεί να ορισθεί ανεξάρτητα από τη στατιστική παρόλο που η ‘’εξόρυξη δεδομένου’’ για πρότυπα είναι αυτό που πραγματικά είναι οι στατιστικές .Μερικές από τις τεχνικές που ταξινομούνται κάτω απ’ την εξόρυξη δεδομενων όπως η CHAID και η CART έχουν πραγματικά αναπτυχθεί από στατιστικά επαγγέλματα περισσότερο από πουθενά αλλού και οι βασικές ιδέες της πιθανότητας ,ανεξαρτησίας, αιτιολόγησης και overfitting είναι η υποδομή πάνω όπου και η εξόρυξη δεδομένων αλλά και η στατιστική χτίστηκαν .

Nearest Neighbor [Κοντινότερος Γείτονας]

Η ομαδοποίηση και η τεχνική πρόβλεψης Nearest Neighbor είναι ανάμεσα στις πιο παλιές τεχνικές που χρησιμοποιήθηκαν στην εξόρυξη δεδομένου. Οι περισσότεροι άνθρωποι έχουν την διαίσθηση ότι καταλαβαίνουν τι είναι η ομαδοποίηση –δηλαδή ότι όπως οι εγγραφές, σχηματίζονται και τοποθετούνται μαζί . Ο Nearest Neighbor είναι μια τεχνική πρόβλεψης που είναι παρόμοια με την ομαδοποίηση –η κύρια ουσία της είναι ότι προκειμένου να προβλέψει ποια είναι η τιμή της πρόβλεψης σε μια εγγραφή ,ψάχνει για εγγραφές με όμοιες τιμές πρόβλεψης στην ιστορική βάση δεδομενων και χρησιμοποιεί την τιμή πρόβλεψης από την εγγραφή που “είναι πιο κοντά” στην μη ταξινομημένη εγγραφή.

4.2.1.2 Ένα απλό παράδειγμα Nearest Neighbor

Ένα απλό παράδειγμα πρόβλεψης αλγορίθμων Nearest Neighbor,είναι όταν κοιτάξεις τους ανθρώπους στην γειτονιά σου (στην περίπτωση αυτή αυτούς που στην πραγματικότητα βρίσκονται γεωγραφικά γύρω σου ). Έτσι αν κάποιος έχει εισόδημα μεγαλύτερο των $100,000 ,οι πιθανότητες θα ήταν να έχεις περίπου και εσύ ένα υψηλό εισόδημα. Σίγουρα οι πιθανότητες να έχεις και εσύ ένα υψηλό εισόδημα είναι μεγαλύτερες όταν όλοι οι γείτονες σου έχουν εισόδημα περίπου $100,000 από ότι αν είχαν όλοι εισόδημα των $20,000. Μέσα στην γειτονιά σου μπορεί ακόμα να υπάρχει μια μεγάλη ποικιλία εισοδημάτων πιθανώς ανάμεσα ακόμα και στους πιο “κοντινούς” σου γείτονες, αλλά αν ήταν να προβλέψεις το εισόδημα κάποιου βασισμένος μονό στο ότι ξέρεις τους γείτονες, η καλύτερη ευκαιρία στο

Page 54: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 54

να είσαι σωστός και να το πετύχεις θα ήταν να προβλέψεις το εισόδημα των γειτόνων που μένουν κοντινότερα στο άγνωστο άτομο. Η πρόβλεψη του αλγορίθμου του Nearest Neighbor λειτουργεί σχετικά με τον ίδιο τρόπο εκτός το ότι η “κοντινότητα” σε μια βάση δεδομένων μπορεί να αποτελείται από διάφορες παράγοντες και όχι μονό το που μένει το άτομο. Μπορεί, για παράδειγμα, να είναι πολύ σημαντικό να γνωρίζεις σε πιο σχολείο πήγαιναν κάποιοι και τι βαθμό πήρανε, όταν προβλέπεις το εισόδημα. Ο καλύτερος ορισμός για το “κοντά” μπορεί στην πραγματικότητα να είναι άλλοι άνθρωποι με τους οποίους αποφοίτησες μαζί απ΄ το κολλέγιο παρά οι άνθρωποι που μένεις δίπλα τους .

Οι τεχνικές Nearest Neighbor είναι από τις ευκολότερες στην χρήση και την κατανόησή τους επειδή δουλεύουν με έναν παρόμοιο τρόπο με τον τρόπο που σκέφτονται οι άνθρωποι –ανιχνεύοντας σχετικά ταιριαστά παραδείγματα. Εκτελούνται ακόμα αρκετά καλά στα πλαίσια της αυτοματοποίησης ,καθώς πολλοί από τους αλγορίθμους είναι ισχυροί με τα μη ξεκάθαρα και χαμένα δεδομένα. Τελευταία είναι ιδιαίτερα ικανοί στην εκτέλεση των πολύπλοκων ROI υπολογισμών επειδή οι προβλέψεις είναι φτιαγμένες σε τοπικό επίπεδο όπου οι επιχειρηματικές προσομοιώσεις μπορούν να λειτουργήσουν με σκοπό να βελτιστοποιήσουν το ROI.

4.2.1.3 Ομαδοποίηση για Σαφήνεια

Η ομαδοποίηση είναι η μέθοδος με την οποία όμοιες εγγραφές μπαίνουν σε ομάδες μαζί. Συνήθως χρησιμοποιείται για να δώσει στον τελικό χρήστη ένα υψηλό επίπεδο άποψης του τι συμβαίνει στην βάση δεδομένων .

Η ομαδοποίηση πολλές φορές συνηθίζεται να σημαίνει τμηματοποίηση - που πολλοί άνθρωποι της αγοράς θα έλεγαν πως είναι χρήσιμη για να τα βγάλεις πέρα με τις δύσκολες υποθέσεις των επιχειρήσεων. Δυο από αυτά τα συστήματα ομαδοποίησης είναι το σύστημα PRIZM από την εταιρία Claritas και το MicroVision της εταιρίας Equifax. Για να σχηματιστούν αυτές οι ομάδες χρησιμοποιούν πληροφορίες όπως είναι το εισόδημα, η ηλικία, η απασχόληση, η οικογενειακή κατάσταση και η φυλή, συλλεγμένες από την US Census. Μετά προσδιορίζουν ευκολομνημονευτα ΄΄ nick names’’ στις ομάδες. Μερικά παραδείγματα υπάρχουν στον πίνακα 3

Name Income Age Education Vendor Blue Blood Estates Wealthy 35-54 College Claritas

Prizm™ Shotguns and Pickups Middle 35-64 High School Claritas

Prizm™ Southside City Poor Mix Grade School Claritas

Prizm™ Living Off the Land Middle-Poor School Age

Families Low Equifax

MicroVision™University USA Very low Young -

Mix Medium to High

Equifax MicroVision™

Sunset Years Medium Seniors Medium Equifax MicroVision™

Πίνακας 3: Κάποιες εμπορικά διαθέσιμες ετικέτες ομαδοποίησης

Αυτή η ομαδοποιημένη πληροφορία χρησιμοποιείται τότε από τον τελικό χρήστη για να βάλει ετικέτα στους καταναλωτές στην βάση δεδομενων τους. Από την στιγμή που γίνεται αυτό, ο χρηστής της βάσης δεδομένων μπορεί να πάρει μια υψηλού επιπέδου (γενική

Page 55: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 55

δηλ.) γνώμη του τι γίνεται με αυτή την ομάδα .Από την στιγμή που ο επιχειρηματίας χρήστης έχει δουλέψει με αυτούς τους κώδικες για κάποιο καιρό ξεκινούν να αποκτούν κάποια ιδέα για το πώς αυτές οι διαφορετικές ομάδες πελατών θα αντιδράσουν στις σχετικές αγοραστικές προσφορές με τις επιχειρήσεις τους. Προς το παρόν μερικές από τις ομάδες μπορούν να σχετίζονται με τις επιχειρήσεις τους και άλλες όχι. Αλλά έχοντας αυτό, και έχοντας υπόψη ότι και ο ανταγωνισμός μπορεί πολύ σωστά να χρησιμοποιεί αυτές τις ίδιες ομάδες για να χτίσει τις επιχειρηματικές και αγοραστικές προσφορές, είναι σημαντικό να γνωρίζουμε το πώς η δική μας πελατειακή βάση συμπεριφέρεται σύμφωνα με αυτές τις ομάδες .

4.2.1.4 Ένα απλό παράδειγμα ομαδοποίησης (Clustering)

Ένα απλό παράδειγμα ομαδοποίησης θα ήταν η ομαδοποίηση που οι περισσότεροι άνθρωποι εκτελούν όταν βάζουν πλυντήριο-ομαδοποιώντας (ξεχωρίζοντας) τα σιδερωμένα από τα ασιδέρωτα ,τα ρούχα για στεγνό καθάρισμα ,τα άσπρα και τα έγχρωμα ρούχα ,είναι σημαντικό γιατί έχουν όμοια χαρακτηριστικά. Και προκύπτει ότι έχουν σημαντικές κοινές ιδιότητες (χαρακτηριστικά) όσον αφορά πώς συμπεριφέρνονται (και μπορούν να καταστραφούν) στην πλύση. Για να ομαδοποιήσουμε το πλυντήριό μας οι περισσότερες αποφάσεις μας παίρνονται σχεδόν απευθείας .Υπάρχουν φυσικά δύσκολες αποφάσεις να παρθούν σχετικά με το που θα ταίριαζε τα άσπρο μπλουζάκι με τις κόκκινες ρίγες (το οποίο είναι το περισσότερο άσπρο αλλά έχει κάποιο χρώμα και είναι ασιδέρωτο). Όταν η ομαδοποίηση χρησιμοποιείται στις επιχειρήσεις οι ομάδες είναι συνήθως πολύ περισσότερο δυναμικές –ακόμα και μεταβλητές εβδομαδιαίος έως και μηνιαίως-και μπορεί να είναι δυσκολότερες όταν πολλές από τις αποφάσεις αφορούν σε ποια ομάδα θα ανήκει μια εγγραφή. Πως μοιάζει η ομαδοποίηση με την τεχνική του Nearest Neighbor;

Ο αλγόριθμος του Nearest Neighbor είναι βασικά μία εκλέπτυνση της ομαδοποίησης

με την έννοια ότι χρησιμοποιούν και οι δύο απόσταση σε κάποιο ιδιαίτερο χώρο για να δημιουργήσουν είτε δομή στα δεδομένα είτε προβλέψεις. Ο Nearest Neighbor αλγόριθμος είναι μία εκλέπτυνση καθώς μέρος του αλγορίθμου συνήθως προσδιορίζει με τρόπο αυτόματο το βάρος της σημαντικότητας των προβλέψεων και πώς η απόσταση θα μετρηθεί μέσα στον ιδιαίτερο χώρο. Η ομαδοποίηση είναι μια ειδική περίπτωση αυτού ,όπου η σημαντικότητα της κάθε πρόβλεψης θεωρείται ίση.

4.2.1.5 Ιεραρχική και Μη-Ιεραρχική Ομαδοποίηση

Υπάρχουν 2 βασικά είδη τεχνικών ομαδοποίησης, αυτές που δημιουργούν μια ιεραρχία ομάδων και αυτές οι οποίες δεν κάνουν κάτι τέτοιο. Οι ιεραρχικές τεχνικές ομαδοποίησης δημιουργούν μια ιεράρχηση ομάδων από το μικρό προς το μεγαλύτερο. Ο κύριος λόγος για αυτό είναι ότι, όπως έχει ήδη αναφερθεί, η ομαδοποίηση είναι μια τεχνική μάθησης χωρίς εποπτεία. Για αυτό τον λόγο και αναλόγως την εφαρμογή ομαδοποίησης ,λιγότεροι και μεγαλύτεροι αριθμοί ομάδων μπορεί να είναι επιθυμητοί. Με μια ορισμένη ιεραρχία ομάδων είναι πιθανό να επιλεχθεί ο αριθμός που είναι επιθυμητός. Στο έσχατο

Page 56: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 56

σημείο, είναι πιθανό να υπάρχουν τόσες πολλές ομάδες όσες είναι και οι εγγραφές σε μια βάση δεδομένων.

Σε αυτή την περίπτωση οι εγγραφές μέσα στην ομάδα είναι φαινομενικά ίδιες η μια με την άλλη(μιας και υπάρχει μόνο μια) και σίγουρα διαφορετικές από τις άλλες ομάδες. Φυσικά ,όμως μια τέτοια τεχνική ομαδοποίησης χάνει τον στόχο της από την άποψη ότι η ιδέα της ομαδοποίησης είναι να βρει χρήσιμα πρότυπα στην βάση δεδομένων που την συνοψίζουν και την κάνουν ευκολότερη στο να κατανοηθεί. Κάθε αλγόριθμος ομαδοποίησης που τελειώνει σε τόσες ομάδες όσος είναι ο αριθμός των εγγραφών δεν έχει βοηθήσει τον χρηστή να καταλάβει περισσότερο τα δεδομένα.

Επομένως ,ένα από τα κύρια σημεία της ομαδοποίησης είναι ότι θα υπάρχουν πολύ λιγότερες ομάδες απ’ ότι οι γνήσιες εγγραφές .Τα πλεονεκτήματα των μεθόδων ιεραρχικής ομαδοποίησης είναι ότι επιτρέπουν στον τελικό χρήστη να διαλέξει είτε από πολλές ομάδες είτε από αρκετές. Η ιεραρχία των ομάδων χαρακτηρίζεται ως ένα δέντρο όπου οι μικρότερες ομάδες συγχωνεύονται μεταξύ τους για να δημιουργήσουν το επόμενο υψηλότερο επίπεδο ομάδων και αυτές που βρίσκονται σε αυτό το επίπεδο συγχωνεύονται μεταξύ τους για να δημιουργήσουν το αμέσως επόμενο ψηλότερο επίπεδο ομάδων .Το σχεδιάγραμμα 1.5 κάτω, δείχνει πως πολλές ομάδες μπορούν και δημιουργούν μια ιεραρχία .Όταν μια ιεραρχία ομάδων σαν αυτήν δημιουργείται ,ο χρήστης μπορεί να αποφασίσει ποιος είναι ο σωστός αριθμός ομάδων που συνοψίζει επαρκώς τα δεδομένα τα οποία εξακολουθούν να παρέχουν χρήσιμες πληροφορίες (από μια εντελώς άλλη γωνιά μια μονή ομάδα που περιλαμβάνει όλες τις εγγραφές είναι μια αρκετά επαρκής σύνοψη ,αλλά δεν περιέχει αρκετές ειδικές πληροφορίες που θα είναι χρήσιμες).

Αυτή η ιεραρχία ομάδων δημιουργείται μέσω του αλγορίθμου που κατασκευάζει τις ομάδες. Υπάρχουν δυο κύρια είδη αλγορίθμων ιεραρχικής ομαδοποίησης: Agglomerative - Οι τεχνικές ομαδοποίησης Agglomerative ξεκινούν με τόσες ομάδες όσες εγγραφές υπάρχουν, όπου κάθε ομάδα περιλαμβάνει μια μόνο εγγραφή. Οι ομάδες που είναι πιο κοντά η μια στην άλλη συγχωνεύονται μεταξύ τους για να δημιουργήσουν την επόμενη μεγαλύτερη ομάδα .Αυτή η συγχώνευση συνεχίζεται μέχρι να δημιουργηθεί μια ιεραρχία ομάδων με μια μονό μονή ομάδα που θα περιλαμβάνει όλες τις εγγραφές στην κορυφή της ιεραρχίας. Divisive (Διαχωριστικές) - Οι τεχνικές Divisive (διαχωριστικής) ομαδοποίησης αναλαμβάνουν την αντίθετη μέθοδο από τις Agglomerative τεχνικές. Κι αυτές οι τεχνικές ξεκινούν με όλες τις εγγραφές σε μια ομάδα και μετά προσπαθούν να διασπάσουν αυτήν την ομάδα σε μικρότερα κομμάτια και μετά ξανά προσπαθούνε αυτά, να σπάσουν αυτά τα μικρότερα κομμάτια. Από τις δυο, οι Agglomerative τεχνικές είναι οι πιο συχνά χρησιμοποιημένες στην ομαδοποίηση και έχουν περισσοτέρους αλγορίθμους που αναπτύσσονται για αυτές. Οι μη ιεραρχικές τεχνικές γενικά είναι γρηγορότερο να δημιουργούν από την ιστορική βάση δεδομενων ,αλλά απαιτούν από τον χρήστη να πάρει κάποιες αποφάσεις σχετικά με τον αριθμό των αμάδων που απαιτείται ή το ελάχιστο «πλησιεστερο» που απαιτείται για δυο εγγραφές μέσα στην ίδια ομάδα. Αυτές οι μη ιεραρχικές τεχνικές εκτελούνται πάρα πολλές φορές ξεκινώντας από κάποια αυθαίρετη ή ακόμα και τυχαία ομαδοποίηση και μετά επαναλαμβανόμενες, βελτιώνουν την ομαδοποίηση μετακινώντας μεταξύ τους κάποιες εγγραφές. Ή αυτές οι τεχνικές μερικές φορές δημιουργούν ομάδες που χρησιμοποιούνται με ένα μόνο πέρασμα μέσω της βάσης δεδομένων προσθέτοντας εγγραφές σε υπάρχουσες ομάδες ,όταν υπάρχουν ,και δημιουργώντας νέες ομάδες όταν καμιά υπάρχουσα ομάδα δεν είναι μια καλή υποψήφιος για την δοσμένη εγγραφή. Επειδή ο ορισμός κατά τον οποίο οι ομάδες σχηματίζονται εξαρτάται από αυτές τις πρωταρχικές επιλογές, σύμφωνα με τις οποίες πρέπει να επιλέγεται ποιες θα είναι οι αρχικές ομάδες, ή ακόμα και πόσες θα είναι αυτές, οι συγκεκριμένες τεχνικές μπορεί να είναι λιγότερο επαναλαμβανόμενες από τις ιεραρχικές και μερικές φορές δημιουργούν είτε πάρα πολλές είτε πάρα πολύ λίγες ομάδες, επειδή ο αριθμός των ομάδων είναι

Page 57: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 57

προαποφασισμένος από τον χρήστη και όχι αποφασισμένος μόνο από τα έμφυτα πρότυπα στην βάση δεδομενων .

Σχήμα 10: Το Διάγραμμα δείχνει μια ιεραρχία ομάδων .Οι ομάδες στο χαμηλότερο επίπεδο συγχωνεύονται μεταξύ τους για να δημιουργήσουν μεγαλύτερες ομάδες στο επόμενο επίπεδο της ιεραρχίας .

4.2.2 Τεχνικές Νέες Γενιάς (N.G.T.):Δέντρα ,Δίκτυα ,και Κανόνες

4.2.2.1 Η Νέα Γενιά

Οι τεχνικές εξόρυξης δεδομένων ,σε αυτόν το τμήμα, αντιπροσωπεύουν τις πιο συχνά χρησιμοποιημένες τεχνικές που έχουν αναπτυχθεί τις τελευταίες δυο δεκαετίες έρευνας Επιπλέον ,αντιπροσωπεύουν την τεράστια πλειοψηφια των τεχνικών που συζήτιουνται όταν η εξόρυξη δεδομένων αναφέρεται στις επώνυμες εφημερίδες (τύπος ). Αυτές οι τεχνικές μπορούν να χρησιμοποιηθούν είτε για να ανακαλύψουν νέες τεχνολογίες μέσα σε μεγάλες βάσεις δεδομένων, ή για την κατασκευή μοντέλων πρόβλεψης. Παρόλο που οι παλαιότερες τεχνικές δέντρων αποφάσεων όπως η CHAID χρησιμοποιούνται όλο και πιο πολύ οι νέες τεχνικές όπως η CART είναι περισσότερο αποδεκτές .

Δέντρα αποφάσεων Τι είναι το Δέντρο Απόφασης; Το δέντρο απόφασης είναι ένα μοντέλο πρόβλεψης που, όπως λέει και το όνομα του, μπορούμε να το φανταστούμε σαν δέντρο. Συγκεκριμένα το κάθε κλαδί του δέντρου είναι μια ερώτηση ταξινόμησης και τα φύλλα του δέντρου είναι μερίδια της μορφής των δεδομένων με την δική τους ταξινόμηση .Για παράδειγμα αν προσπαθούσαμε να ταξινομήσουμε τους πελάτες που δεν ανανεώνουν τα τηλεφωνικά τους συμβόλαια στην Cellular Telephone Industry το δέντρο αποφάσεων θα έμοιαζε σαν αυτά στο σχήματος 11.

Page 58: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 58

Σχήμα 11 Το δέντρο αποφάσεων είναι ένα προβλέψιμο μοντέλο που κάνει προβλέψεις σαν μια σειρά αποφάσεων όμοιου με το παιχνίδι των 20 ερωτήσεων. Μπορείτε να προσέξετε κάποια ενδιαφέροντα πράγματα στο δέντρο: Διαχωρίζει τα δεδομένα σε κάθε άκρη του κλαδιού χωρίς να υπάρχει απώλεια δεδομένων (ο αριθμός όλων των εγγράφων σε ένα δοσμένο κόμβο-κηδεμόνα είναι ίσως με τον αριθμό των εγγραφών που περιλαμβάνετε στα δύο τους παιδιά). Είναι πάρα πολύ εύκολο να κατανοηθεί πώς κατασκευάζεται το μοντέλο (σε αντίθεση με τα μοντέλα από ουδέτερα δίκτυα η από στατιστικές).

Θα ήταν εύκολο να χρησιμοποιηθεί αυτό το μοντέλο στην περίπτωση που ένας πελάτης είναι δυσαρεστημένος με μια εύστοχη αγοραστική προσφορά . Μπορεί ακόμα να δημιουργήσεις κάποιες απόψεις για τον πελάτη σου .Π.Χ. ,πελάτες που υπήρξαν δική σου για κάποια χρόνια και έχουν κινητά τηλέφωνα τελευταίας τεχνολογίας είναι αρκετά πιστοί σε σένα. Πού μπορούν να χρησιμοποιηθούν τα δέντρα αποφάσεων;

Τα δέντρα αποφάσεων είναι μια τεχνολογία εξόρυξης δεδομένων που υπάρχουν, σε μορφή αρκετά όμοια με την σημερινή τεχνολογία, για σχεδόν 20 χρόνια τώρα και οι νεότερες εκδόσεις των αλγορίθμων αυτών δημιουργήθηκαν την δεκαετία του 1960.

Πολλές φορές οι τεχνικές αυτές χρησιμοποιούταν από στατιστικολόγους για να αυτοματοποιήσουν τη λειτουργία που αποφασίζει ποια πεδία στη βάση δεδομένων τους ήταν στην πραγματικότητα χρήσιμα ή σχετικά με το συγκεκριμένο πρόβλημα που προσπαθούν να κατανοήσουν.

Εν μέρη εξαιτίας τις ιστορίας οι αλγόριθμοι των δέντρων αποφάσεων τείνουν να αυτοματοποιούν ολόκληρη την διαδικασία της υπόθεσης της δημιουργίας και μετά της εγκυρότητας ακόμη πιο ολοκληρωμένα και σε ένα ακόμα πιο ακέραιό τρόπο όσο καμία άλλη από τις τεχνικές εξόρυξης δεδομένων. Είναι ακόμη ιδιαίτερα ικανά στο χειρισμό ακατέργαστων δεδομένων με λίγη ή χωρίς προεργασία. Ίσως επειδή ήταν αρχικά ανεπτυγμένες στο να μιμούνται τον τρόπο με τον οποίο ένας αναλυτής εκτελούσε εξόρυξη δεδομένων ,παρείχαν ένα ευκολονόητο μοντέλο βασισμένο σε κανόνες (“ το 90% των περιπτώσεων οι πελάτες των πιστωτικών καρτών λιγότερο των τριών μηνών, οι οποίοι μεγαλώνουν το όριο τις πιστωτικής κάρτας πρόκειται να αθετήσουν το δάνειο της κάρτας τους”). Επειδή τα δέντρα των αποφάσεων είναι πάρα πού καλά σε τόσα πολλά κριτικά

Page 59: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 59

χαρακτηριστικά της εξόρυξης δεδομένων μπορούνε να χρησιμοποιηθούν σε μια μεγάλη ποικιλία επιχειρησιακών προβλημάτων για έρευνα και πρόβλεψη. Έχουν χρησιμοποιηθεί για προβλήματα που εκτείνονται από την πρόβλεψη φθοράς της πιστωτικής κάρτας μέχρι τη μακροχρόνια πρόβλεψη του ποσοστού συναλλαγών διαφορετικών κυκλοφοριών χρημάτων. Υπάρχουν ακόμη και κάποια προβλήματα όπου τα δέντρα αποφάσεων δεν μπορούν να επιλύσουν. Κάποια πολύ απλά προβλήματα όπου η πρόβλεψη είναι ένα απλό πολλαπλάσιο του μεταβλητών , μπορεί να λυθεί πιο γρήγορα και εύκολα με γραμμική παλινδρόμηση. Συνήθως τα μοντέλα που πρόκειται να δημιουργηθούν και οι αλληλεπιδράσεις που θα αποκαλυφθούν είναι πολύ πιο πολύπλοκες στα προβλήματα του πραγματικού κόσμου και εκεί είναι που τα δέντρα αποφάσεων υπερτερούν. Χρησιμοποιώντας τα δέντρα αποφάσεων για την προεργασία των δεδομένων.

Ένας άλλος τρόπος όπου η τεχνολογία του δέντρου αποφάσεων έχει χρησιμοποιηθεί είναι για την προεργασία των δεδομενων σε άλλες αλγοριθμικές προβλέψεις. Επειδή ο αλγόριθμος είναι πραγματικά σθεναρός με σεβασμό στην ποικιλία των μεταβλητών της πρόβλεψης (π.χ. ,αριθμός ,κατηγορικός κ.λ.π.) και επειδή μπορεί να εκτελεστεί σχετικά γρήγορα , τα δέντρα αποφάσεων μπορούν να χρησιμοποιηθούν στο πρώτο πέρασμα της εκτέλεσης της εξόρυξης δεδομένων για να δημιουργήσει ένα υποσύστημα από πιθανώς χρήσιμων μεταβλητών που μπορούν μετά να τροφοδοτηθούν μέσω νευρωνικών δικτύων, πλησιέστερες γειτονιές και φυσιολογικές στατιστικές ρουτίνες –που μπορεί να διαρκέσουν ένα λογικό χρονικό διάστημα για να εκτελεστούν αν υπάρχουν μεγάλα νούμερα πιθανών μεταβλητών που θα χρησιμοποιηθούν στο μοντέλο.

Νευρωνικά Δίκτυα Τι είναι το Νευρωνικό Δίκτυο;

Όταν μιλάμε σήμερα για αλγορίθμους εξόρυξης δεδομένων, οι περισσότεροι άνθρωποι εννοούν είτε τα δέντρα αποφάσεων είτε τα νευρωνικά δίκτυα. Από τα δύο, τα νευρωνικά δίκτυα είναι πιθανώς περισσότερο ενδιαφέροντα μέσα από τα στάδια μορφοποίησης της τεχνολογίας εξόρυξης δεδομένων .Όπως θα δούμε τα νευρωνικά δίκτυα έχουν μειονεκτήματα που μπορούν να μειωθούν με την ευκολία της χρήσης τους και την ευκολία της ανάπτυξής τους, αλλά επιπλέον έχουν κάποια σημαντικά πλεονεκτήματα. Το πιο σπουδαίο από αυτά τα πλεονεκτήματα είναι τα ακριβή μοντέλα πρόβλεψης που μπορούν να εφαρμοστούν σε ένα μεγάλο αριθμό διαφορετικών προβλημάτων. Για να ακριβολογούμε με τον ορό «νευρωνικά δίκτυα» μπορεί κάποιος να εννοεί τα «τεχνητά νευρωνικά δίκτυα». Οι πραγματικές νευρωνικές διεργασίες είναι βιολογικά συστήματα (a k a brains [Κοινοτικό Πρόγραμμα Brains]) που ανακαλύπτουν σχέδια, κάνουν προβλέψεις και μαθαίνουν.

Τα τεχνητά νευρωνικά δίκτυα τώρα είναι προγράμματα υπολογιστών τα οποία διευκολύνουν την ανίχνευση σχεδίων και εκμάθηση μηχανικών αλγορίθμων σε έναν υπολογιστή, για να δημιουργήσει μοντέλα πρόβλεψης από μεγάλες ιστορικές βάσεις δεδομένων. Τα τεχνητά νευρωνικά δίκτυα έχουν πάρει το όνομα τους από ιστορική τους ανάπτυξη που ξεκίνησε με την προϋπόθεση ότι οι μηχανές θα μπορούσαν να είχαν δημιουργηθεί για να «σκέφτονται», αν οι επιστήμονες έβρισκαν τρόπους για να μιμηθούν την δομή και λειτουργία του ανθρώπινου μυαλού στον υπολογιστή. Συνεπώς, τα ιστορικά νευρωνικά δίκτυα εφευρέθηκαν από την κοινότητα της Artificial Intelligence (Τεχνική Νοημοσύνη ) ,παρά από την επιστήμη της στατιστικής. Παρά το γεγονός ότι οι επιστήμονες δεν μπορούν να καταλάβουν το ανθρώπινο μυαλό ,πόσο μάλιστα να το μιμηθούν ,τα νευρωνικά δίκτυα που εκτελούνται σε έναν υπολογιστή μπορούν να κάνουν κάποια από τα πράγματα που κάνουν οι άνθρωποι. Είναι πολύ δύσκολο να πούμε πότε ακριβώς δημιουργήθηκε το πρώτο «Νευρωνικό Δίκτυο» σε έναν υπολογιστή. Κατά την διάρκεια του 2ου Παγκοσμίου Πολέμου δημοσιεύτηκε ένα εμβρυώδης άρθρο από τους MacCulloch και Pitts που πρώτοι έδωσαν τα κύρια σημεία της ιδέας ότι απλές μονάδες επεξεργασίας (όπως

Page 60: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 60

το κάθε νεύρο στο ανθρώπινο μυαλό) μπορούν να συνδεθούν μεταξύ τους σε μεγάλα δίκτυα για να δημιουργήσουν ένα σύστημα, που μπορεί να λύσει δύσκολα προβλήματα και να εκδηλώνει συμπεριφορά πολύ περισσότερο μπερδεμένη από τα απλά κομμάτια που το δημιουργούν.

Από εκείνη την στιγμή, έχει γίνει μεγάλη πρόοδος στην εύρεση τρόπων για την εφαρμογή τεχνικών νευρωνικών δικτύων σε προβλήματα πρόβλεψης του πραγματικού κόσμου και την βελτίωση της παρουσίας του αλγορίθμου γενικά .Από πολλές απόψεις τα μεγαλύτερα ξεσπάσματα στα νευρωνικά δίκτυα τα τελευταία χρόνια έχουν γίνει στην εφαρμογή των εγκόσμιων προβλημάτων του πραγματικού κόσμου ,όπως την πρόβλεψη της πελατειακής ανταπόκρισης ή την ανίχνευση απατών, παρά τους ύψιστους στόχους που αρχικά αριθμίστηκαν για τις τεχνικές, όπως την πλήρη εκμάθηση του ανθρώπου και του λόγου του υπολογιστή και την κατανόηση της εικόνας .

4.2.2.2 Εισαγωγή Κανόνα

Η εισαγωγή κανόνα είναι μια από τις κυριότερες μορφές εξόρυξης δεδομένων και

ίσος η πιο κοινή μορφή ανακάλυψης γνώσης σε συστήματα εκμάθησης .Είναι επίσης, η μορφή εξόρυξης δεδομένων που πιο πολύ μοιάζει με την επεξεργασία για την όποια οι περισσότεροι άνθρωποι νοιάζονται όταν σκέφτονται την εξόρυξη δεδομένων, δηλαδή «εξόρυξη» για το χρυσό μέσω μιας τεράστιας βάσης δεδομένου.

Ο χρυσός στην περίπτωση αυτή θα είναι ένας κανόνας που θα είναι ιδιαίτερα ενδιαφέρον –που θα μας λέει κάτι για την βάση δεδομένων που διαφορετικά δεν θα ήταν δυνατόν να γνωρίζουμε. Η εισαγωγή κανόνα σε μια βάση δεδομένων μπορεί να είναι μια μαζική αναδοχή όπου όλα τα πιθανά σχέδια, αποκλείονται συστηματικά από τα δεδομένα και μετά η ακρίβεια και η σπουδαιότητα προστίθενται σε αυτά που λένε στον χρήστη πόσο δυνατό είναι το σχέδιο και πόσο πιθανό είναι να ξανασυμβεί .Γενικά οι κανόνες αυτοί είναι σχετικά απλοί όπως για ένα αγοραστικό καλάθι βάσης δεδομένων για αντικείμενα που ανιχνεύονται σε ένα καταναλωτικό καλάθι αγορών και μπορεί να βρείτε ενδιαφέρουσες συσχετίσεις στις βάσεις δεδομενων σας όπως: Αν ψωμάκια για σάντουιτς αγοράζονται ,τότε το κασέρι θα αγοράζεται κατά 90% περισσότερο κάθε φορά και αυτή η αναλογία συμβαίνει στο 30% όλων των αγοραστικών καλαθιών . Εάν ζωντανά φυτά αγοράζονται από μια αποθήκη υλικών, τότε το λίπασμα για τα φυτά θα αγοράζεται κατά 60% κάθε φόρα και αυτά τα δυο αντικείμενα αγοράζονται μαζί στο 6% των αγοραστικών καλαθιών .

Οι κανόνες που ανακτώνται από την βάση δεδομένων, αποσπώνται και ταξινομούνται για να παρουσιαστούν στον χρήστη βασισμένοι στο ποσοστό των περιπτώσεων όπου είναι σωστοί και πόσο συχνά εφαρμόζονται. Το κακό των συστημάτων εισαγωγής κανόνων είναι η δύναμή τους –που επιτρέπει να επανακτήσει όλα τα πιθανά ενδιαφέροντα σχέδια στην βάση δεδομένων. Αυτή είναι μια δύναμη της ,από την έποψη ότι δεν αφήνει ούτε ένα στοιχείο που να μην εξεταστεί, αλλά μπορεί ακόμα να θεωρηθεί σαν αδυναμία επειδή ο χρηστής μπορεί εύκολα να κατακλιστεί από τέτοιο μεγάλο αριθμό κανόνων που θα ήταν δύσκολο να τους εξετάσει όλους. Χρειάζεται σχεδόν ένα δεύτερη εξόρυξη δεδομένων για να περάσει κανείς σε μια λίστα ενδιαφερόντων κανόνων που έχουν δημιουργηθεί από το σύστημα εισαγωγής κανόνων στο πρώτο μέρος με σκοπό να βρουν τον πιο αξιόλογο «χρυσό» ανάμεσα σε όλα τα υπόλοιπα. Αυτή η υπεραφθονία σχεδίων μπορεί ακόμη να είναι προβληματική για την πιο απλή εργασία πρόβλεψης, επειδή όλα τα πιθανά σχέδια επιλέγονται από την βάση δεδομένων, μπορεί να υπάρχουν αντικρουόμενες προβλέψεις κατασκευασμένες από κανόνες ίσων ενδιαφερόντων. Αυτοματοποιώντας την επεξεργασία της επιλογής των πιο ενδιαφερόντων κανόνων και της έρευνας των συστάσεων μιας ποικιλίας κανόνων, χειρίζονται σωστά από πολλά από τα διαθέσιμα διαφημιστικά

Page 61: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 61

συστήματα εισαγωγής κανόνων στην αγορά σήμερα και είναι ακόμα μια περιοχή οργανωμένης έρευνας. Τι είναι ο κανόνας;

Στα συστήματα εισαγωγής κανόνων, ο κανόνας από μόνος του είναι μιας απλής μορφής του τύπου «αν αυτό και αυτό και αυτό τότε αυτό». Για παράδειγμα ,ο κανόνας που ένα σούπερ μάρκετ μπορεί να βρει στα δεδομένα που μαζευτήκαν από τις ταμειακές μηχανές, θα είναι «αν οι πίκλες αγοράζονται, τότε αγοράζεται και το κέτσαπ». Ή Αν τα χάρτινα πιάτα τότε και τα πλαστικά πιρουνιά Αν η μαγιονέζα τότε και τα πατατάκια Αν η σάλτσα τότε και τα τορτίλλας Για να είναι οι κανόνες χρησμοί υπάρχουν δυο μέρη πληροφοριών που θα πρέπει να μας παρέχει, καθώς επίσης και τον πραγματικό κανόνα:

Ακρίβεια – Πόσο συχνά είναι ο κανόνας σωστός; Προστασία (Κάλυψη)- Πόσο συχνά εφαρμόζεται ο κανόνας; Απλά επειδή το σχέδιο των βάσεων δεδομένων εκφράζετε σαν κανόνας ,αυτό δεν

σημαίνει ότι είναι συνέχεια σωστός .Έτσι ,όπως ακριβώς σε άλλους αλγορίθμους εξόρυξης δεδομένων είναι σημαντικό να αναγνωρίζεται και να γίνεται σαφής η αβεβαιότητα στον κανόνα. Αυτό είναι που εννοεί η ακρίβεια ενός κανόνα. Η κάλυψη του κανόνα έχει να κάνει με το πόσες βάσεις δεδομένων «καλύπτει» ο κανόνας ή σε πόσες εφαρμόζεται. Παραδείγματα των δυο αυτών μέτρων για μια ποικιλία κανόνων φαίνεται στον Πίνακα 4.

Σε ορισμένες περιπτώσεις η ακρίβεια χαρακτηρίζεται ως η πεποίθηση του κανόνα και η κάλυψη ως η υποστήριξη. Ακρίβεια και κάλυψη φαίνεται ότι είναι οι προτιμότεροι τρόποι για να ονομαστούν τα δυο αυτά μετρά .

Rule Accuracy Coverage If breakfast cereal purchased then milk purchased. 85% 20% If bread purchased then swiss cheese purchased. 15% 6% If 42 years old and purchased pretzels and purchased dry roasted peanuts then beer will be purchased.

95% 0.01%

Πίνακας 4: Παραδείγματα των κανόνων Ακρίβειας και Κάλυψης

Οι κανόνες από μόνοι τους αποτελούνται από δυο μισά. Η αριστερή πλευρά ονομάζεται «πρόγονος» και η δεξιά πλευρά ονομάζεται «συνέπεια». Ο πρόγονος μπορεί να αποτελείται από έναν μόνο όρο ή πολλαπλούς όρους που θα πρέπει να είναι όλοι αληθείς για να είναι αληθής και η συνέπεια στην δοσμένη ακρίβεια. Γενικά η συνέπεια είναι απλά μια μόνο κατάσταση (Πρόβλεψη αγοράς αντικειμένου καταστήματος ψιλικών) παρά πολλαπλές συνθήκες. Έτσι υπάρχουν κανόνες όπως: «Αν χ και ψ τότε a και bκαι c».

Page 62: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 62

4.2.2.3 Κανόνες vs. Δέντρα αποφάσεων

Τα δέντρα αποφάσεων παράγουν και αυτά κανόνες αλλά με έναν εντελώς διαφορετικό τρόπο από ότι τα συστήματα εισαγωγής κανόνων. Η κύρια διαφορά μεταξύ των κανόνων που παράγονται από τα δέντρα αποφάσεων και τα συστήματα εισαγωγής κανόνων έχει ως εξής:

Τα δέντρα αποφάνσεων παράγουν κανόνες που είναι αμοιβαίας αποκλειστικότητας και συλλογικά διεξοδικοί με σεβασμό στην εκπαίδευση των βάσεων δεδομενων καθώς τα συστήματα εισαγωγής κανόνων παράγουν κανόνες που δεν είναι με αμοιβαίο τρόπο αποκλειστικοί και μπορεί να είναι συλλογικά διεξοδικοί. Με απλά λόγια αυτό σημαίνει ότι για μια δεδομένη εγγραφή θα ύπαρχε ένας κανόνας που θα δρέπει να την καλύψει και να υπάρχει μόνο ένας κανόνας για κανόνες που προέρχονται από δέντρα αποφάσεων. Μπορεί να υπάρχουνε πολλοί κανόνες που να ταιριάζουν με μια δεδομένη έγγραφη από ένα σύστημα εισαγωγής κανόνων και για πολλά συστήματα δεν εγγυάται ,ότι ο κανόνας θα υπάρχει για κάθε πιθανή εγγραφή που μπορεί να συναντηθεί τυχαία(παρόλο που τα περισσότερα συστήματα όντως δημιουργούν πολύ γενικούς κανόνες παραβίασης για να εγκλωβίσουν αυτές τις έγγραφες).

Η αιτία αυτής τις διαφοράς είναι ο τρόπος με τον όποιο οι δυο αλγόριθμοι λειτουργούν. Ο κανόνας εισαγωγής ψάχνει από κάτω προς τα πάνω και συλλέγει όλα τα πιθανά σχέδια που είναι ενδιαφέροντα και μετά να χρησιμοποιήσει όλα αυτά τα σχέδια για κάποιο προβλεπόμενο στόχο. Τα δέντρα αποφάσεων από την άλλη δουλεύουν από ένα χαμηλότερο προβλεπόμενο στόχο, αυτό που λέγεται «άπληστη» έρευνα. Αναζητώντας το καλύτερο πιθανό σπάσιμο στο επόμενοι βήμα (π.χ., άπληστα διαλέγοντας το καλύτερο χωρίς να βλέπει πιο μπροστά παρά μόνο το επόμενο βήμα). Μολονότι ,ο άπληστος αλγόριθμος μπορεί να κάνει επιλογές στα υψηλοτέρα επίπεδα του δέντρου τα οποία είναι λιγότερο ορατά στα χαμηλότερα επίπεδα του δέντρου, είναι αρκετά καλός στην αποτελεσματική εύρεση των συσχετίσεων μεταξύ αυτών που προβλέπουν και της πρόβλεψης. Τα συστήματα εισαγωγής κανόνων από την άλλη διατηρούν όλα τα πιθανά σχέδια ακόμα και αν αυτά είναι πλεόνασμα ή δεν βοηθούν στην προβλέψιμη ακρίβεια .

Για παράδειγμα ,έστω ότι σε ένα συστήματα εισαγωγής κανόνων μπορεί να είχε δυο στήλες δεδομένων που ήταν υψηλά συσχετισμένες (ή στην πραγματικότητα μόνο απλές μεταμορφώσεις μεταξύ τους) θα κατέλεγαν σε δυο κανόνες ενώ σε ένα δέντρο αποφάσεων μια μεταβλητή θα διαλεγόταν και έτσι ,από την στιγμή που ο δεύτερος θα ήταν πλεονάζον δεν θα επανεκλέγονταν. Ένα παράδειγμα θα ήταν οι δυο μεταβλητές ετήσιων χρεώσεων που βγάζουν τον μέσο ορό των μηνιαίων χρεώσεων (ο μέσος όρος των μηνιαίων χρεώσεων είναι οι ετήσιες χρεώσεις χωρισμένες σε 12). Αν το ποσό ήταν προβλέψιμο, τότε τα δέντρα αποφάσεων θα διάλεγαν μία μεταβλητή και θα την χρησιμοποιούσαν σε ένα σημείο διάσπασης κάπου στο δέντρο. Το δέντρο αποφάσεων αποτελεσματικά «έστυψε» την προβλέψιμη αξία από την μεταβλητή και μετά προχώρησε στην επόμενη. Ένα σύστημα εισαγωγής κανόνων θα δημιουργούσε από την άλλη δυο κανόνες. Ίσως κάτι σαν: Αν οι ετήσιες χρεώσεις > 12,000 τότε default =true 90% ακρίβεια Αν ο μέσος όρος των μηνιαίων χρεώσεων >1,000 τότε default =true 90% ακρίβεια .

Σε αυτό το παράδειγμα έχουμε δείξει μια ακραία περίπτωση όπου δυο μεταβλητές ήταν ακριβώς ίδιες αλλά υπάρχουν και λιγότερο ακραίες περιπτώσεις. Για παράδειγμα ,το ύψος μπορεί να χρησιμοποιηθεί παρά το μέγεθος του παπουτσιού στο δέντρο αποφάσεων, ενώ σε ένα σύστημα εισαγωγής κανόνων και τα δυο θα παρουσιαζόταν σαν κανόνες .

Ούτε η μια τεχνική ούτε η άλλη είναι απαραίτητα καλύτερη, μολονότι έχοντας μια ποικιλία κανόνων και μεταβλητών βοηθά στην πρόβλεψη όταν υπάρχουν ελλιπές αξίες. Για παράδειγμα αν το δέντρο αποφάσεων όντως διάλεγε το ύψος σαν ένα σημείο διάσπασης, αλλά η μεταβλητή δεν καταχωρήθηκε σε μια εγγραφή (μια άκυρη αξία) αλλά το μέγεθος του ποδιού θα ήταν το σύστημα εισαγωγής κανόνων που θα είχε ακόμα έναν ισοδύναμο κανόνα για την καταχώρηση της εγγραφής. Τα δέντρα αποφάσεων έχουν όντως τρόπους να

Page 63: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 63

ξεπερνούν αυτή την δυσκολία κρατώντας «υποκατάστατα» σε κάθε σημείο διάσπασης αυτό δουλεύει σχεδόν τόσο καλά όσο όταν διασπώνται τα δεδομένα όπως κάνει η επιλεγμένη μεταβλητή. Σε αυτήν την περίπτωση το νούμερο των παπουτσιών μπορεί να έχει κρατηθεί σαν υποκατάστατο για το ύψος σε αυτό το συγκεκριμένο κλαδί του δέντρου .

4.3 Εξόρυξη Δεδομένων Και Βασικά είδη προβλημάτων Εξόρυξη δεδομένων. 4 μέθοδοι μπορούν να διαχωριστούν σε δύο βασικές κατηγορίες προβλημάτων εξόρυξης δεδομενων: 1. Πρόβλεψη και 2. Ανακάλυψη γνώσης. Καθώς η πρόβλεψη είναι ο δυνατότερος στόχος, η ανακάλυψη της γνώσης είναι η πιο αδύναμη μέθοδος και συνήθως προγενέστερη από την πρόβλεψη.

Η ταξινόμηση από πελάτη σε πελάτη που είναι αρκετά πιθανό να αγοράσει ένα προϊόν, ανήκει στην προβλέψιμη εξόρυξη δεδομένων. Σε αυτό το παράδειγμα πρέπει να εξορύξουμε μια βάση δεδομενων ή ένα σύστημα κανόνων που περιγράφει το προφίλ ενός πελάτη που προτιμά ένα συγκεκριμένο προϊόν. Ο βοηθός στο κατάστημα μπορεί να χρησιμοποιεί αυτή την ταξινόμηση για να αναγνωρίζει ένα πελάτη ως πιθανό αγοραστή .

Για αυτό το είδος εξόρυξης δεδομένων, πρέπει να γνωρίζουμε τις ομάδες που θα έπρεπε να προβλέπει το σύστημα. Στις περιπτώσεις αυτές θα πρέπει να γνωρίζουμε αυτούς τους στόχους από πριν. Σε αυτή την περίπτωση ,θα πρέπει να βρούμε τις ομάδες βασισμένες σε μεθόδους όπως η ομαδοποίηση πριν προβούμε σε προβλέψεις εξόρυξης. Επιπλέον ,οι μέθοδοι πρόβλεψης μπορούν να χωριστούν σε ταξινόμηση και παλινδρόμησης, ενώ η ανακάλυψη γνώσης μπορεί να χωριστεί σε: εκτροπή(απόκλιση) ,ανίχνευση ,ομαδοποίηση, κανόνες σχετικά με την εξόρυξη. Για να κατατάξουμε το πραγματικό πρόβλημα σε έναν από τους τύπους προβλημάτων είναι το πρώτο αναγκαίο βήμα όταν έχουμε να κάνουμε με την εξόρυξη δεδομένων. Το σχέδιο 4 περιγράφει μόνο τους βασικούς τύπους εξόρυξης δεδομένων.

Εμείς θεωρούμε ότι π.χ. η εξόρυξη κείμενου ,η εξόρυξη ιστού ή η εξόρυξη εικόνας είναι είδη των βασικών τύπων εξόρυξης δεδομένων που χρειάζονται μια ειδική προετοιμασία.

Page 64: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 64

4.3.1 Πρόβλεψη

Ταξινόμηση

Θεωρήστε ότι υπάρχει μια ομάδα παρατηρήσεων ενός συγκεκριμένου πεδίου. Ανάμεσα σε αυτήν την ομάδα δεδομενων υπάρχει μια υποκατηγορία δεδομενων που έχουν ετικέτα «ομάδα 1» και ακόμα μια υποκατηγορία δεδομενων ονομαζόμενη «ομάδα 2». Κάθε εισαγωγή δεδομένων περιγράφεται από κάποια περιγραφικά πεδία μεταβλητών και την ετικέτα της ομάδας. Για να δώσουμε στον αναγνώστη μια γενική άποψη, ας πούμε ότι έχουμε συλλέξει πληροφορίες σχετικές με τους πελάτες όπως είναι η οικογενειακή κατάσταση ,φύλο και αριθμό παιδιών. Η ετικέτα της ομάδας είναι η πληροφορία για το αν ο πελάτης έχει αγοράσει ένα συγκεκριμένο προϊόν ή όχι. Τώρα θέλουμε να δούμε πως χαρακτηρίζετε η ομάδα των αγοραστών και αυτών που δεν αγόρασαν .

Το θέμα είναι τώρα να βρούμε μια χαρτογραφημένη λειτουργία που επιτρέπει τον διαχωρισμό δειγμάτων που ανήκουν στην ομάδα 1(π.χ. η ομάδα των χρηστών του internet) από αυτούς που ανήκουν στη αμάδα 2 (π.χ. η ομάδα των ατόμων που δεν χρησιμοποιούνε το internet). Επιπλέον ,αυτή η λειτουργία πρέπει να επιτρέπει την πρόβλεψη των καινούργιων μελών της ομάδας.

Προβλήματα αυτού του είδους ανήκουν στον τύπο του προβλήματος «ταξινόμησης». Μπορεί να υπάρξουνε περισσότερες από δυο ομάδες ,άλλα για περισσότερη ευκολία λαμβάνουνε υπόψη μας μόνο το προβλημα των δυο ομάδων .Η χαρτογραφημένη λαιτουργια μπορεί να γίνει γνωστή από δέντρα απόφασης ή εισαγωγή κανόνων, νευρωνικά δίκτυα, ανάλυση διάκρισης ή αιτιολόγηση βασισμένη σε υπόθεση .

Παλινδρόμηση

Ενώ η ταξινόμηση αποφασίζει για τα μέλη των δειγμάτων ,η απάντηση στην παλινδρόμηση είναι αριθμητική. Σκεφτείτε ότι έχουμε έναν αισθητήρα CCD. Δίνουμε φως σε αυτόν τον αισθητήρα. Μετά αυτό το φως μεταμορφώνεται σε μια γκρι απόχρωση από τον αισθητήρα σύμφωνα με μια λειτουργία μεταμόρφωσης. Εάν αλλάξουμε την πηγή αλλάζουμε επίσης και την γκρι απόχρωση. Αυτό σημαίνει ότι η ποικιλία της εξαγόμενης μεταβλητής, θα αναλυθεί σύμφωνα με τη μεταβλητότητα ενός η περισσοτέρων μεταβλητών εισαγωγής .

4.3.2 Ανακάλυψη Γνώσης

Παρέκκλιση Αναζήτησης

Οι παρατηρήσεις του πραγματικού κόσμου είναι συχνό φαινόμενο. Ο προσδιορισμός χαρακτηριστικών τιμών όπως η ποιότητα μιας εργοστασιακής περιοχής ,η επίδραση μιας ιατρικής περίθαλψης σε μια ομάδα ασθενών ή η ανίχνευση προσέχτηκα ορατών περιοχών σε εικόνες μπορούν να γίνουν βασισμένες σε στατιστικά τεστ παραμέτρων .

Page 65: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 65

Ομαδοποιημένη ανάλυση

Ένας αριθμός αντικειμένων που παρουσιάζονται από ένα n-διάστασης διανυσματικός καταλογισμός θα πρέπει να ταξινομηθούν σε παρόμοιες ομάδες. Αντικείμενα που ταξινομούνται σε μια ομάδα θα πρέπει να μοιάζουν όσο γίνεται πιο πολύ .Αντικείμενα διαφορετικών ομάδων θα πρέπει να είναι όσο το δυνατών περισσότερα ανόμοια .Η βάση για αυτή την λειτουργία είναι μια ιδέα ομοιότητας που μας επιτρέπει να μετράμε την κοντινότητα της εισαγωγής δυο δεδομένων και να εκφράζουν τον βαθμό της κοντινότητας τους .Την στιγμή που έχουν βρεθεί οι ομάδες ,μπορούμε να προσδιορίσουμε τις ετικέτες της κατηγορίας τους και να βάλουμε ετικέτα στην εισαγωγή κάθε δεδομένου στην βάση δεδομένων σύμφωνα με το σύνολο των μελών της ομάδας τους με την αντίστοιχη ετικέτα της κατηγορίας ..Μετά θα έχουμε μια βάση δεδομένων που μπορεί να εξυπηρετεί σαν μια βάση ταξινόμησης.

Οπτικοποίηση

Η πολύ γνωστή παροιμία «Μια εικόνα, χίλιες λέξεις» ταιριάζει ειδικά για την εξερεύνηση μεγάλων συνόλων δεδομένων. Οι αριθμοί δεν περνάν απαρατήρητοι από τους ανθρώπους. Το άθροισμα αυτών των δεδομένων σε μια σωστή γραφική παρουσίαση μπορεί να δώσει στους ανθρώπους καλύτερη πρόσβαση μέσα στα δεδομένα. Για παράδειγμα, οι ομάδες είναι συνήθως αναπαρίστανται αριθμητικά. Το δενδρόγραμμα απεικονίζει αυτές τις ομάδες και δίνει στους ανθρώπους μια αντίληψη των σχέσεων μεταξύ των διαφόρων ομάδων και υποομάδων. Ένα μεγάλο σύστημα κανόνων είναι ευκολότερο να κατανοηθεί όταν είναι δομημένο σε ένα ιεραρχικό σχήμα και γραφικά εμφανίζεται ως ένα δέντρο αποφάσεων.

Κανόνες Συσχετισμού

Για να βρούμε συσχετισμούς ανάμεσα σε διαφορετικούς τύπους πληροφοριών που φαίνεται να μην έχουν κάποια σημασιολογική έννοια, που μπορούν να δώσουν χρήσιμες προβλέψεις π.χ. πελατεία συμπεριφορά. Ο διευθυντής μάρκετινγκ έχει ανακαλύψει ότι οι πελάτες που αγοράζουν λάδι από ένα σούπερ μάρκετ ,θα αγοράσουν και λαχανικά .Τέτοιες πληροφορίες μπορούν να βοηθήσουν στην οργάνωση ενός σούπερ μάρκετ έτσι ώστε προσελκύει τους πελάτες. Για να ανακαλυφτούν ποια HTML έγγραφα επανακτώνται σε σχέση με όλα τα HTML έγγραφα μπορεί να προβλέψει το προφίλ κάποιου χρήστη από τους επισκέπτες της ιστοσελίδας.

Τμηματοποίηση

Θεωρείστε ότι έχουμε εξορύξει μια βάση δεδομένων για προφίλ χρηστών. Στο επόμενο βήμα θέλουμε να στείλουμε κάποιο e-mail με σκοπό να διαφημίσουμε το προϊόν το οποίο είναι αρκετά πιθανό να προσελκύσει αυτήν την ομάδα χρηστών. Συνεπώς ,πρέπει να συλλέξουμε όλες τις διευθύνσεις στη βάση δεδομένων μας που έχουν σχέση με το προφίλ του επιθυμητού χρήστη. Χρησιμοποιώντας τους κανόνες σαν ερώτημα στην βάση δεδομενων μπορούμε τμηματοποιήσουμε τη βάση δεδομένων μας σε πελάτες που δεν έχουν σχέση με το προφίλ του χρήστη και σε αυτούς που δεν έχουνε σχέση. Ο διαχωρισμός των δεδομενων ,σε

Page 66: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 66

αυτά που σχετίζονται με ένα δοσμένο προφίλ από αυτά που δεν έχουν σχέση ονομάζεται τμηματοποίηση. Μπορεί να χρησιμοποιηθεί για μια ενέργεια αποστολής e-mail όπου μόνον η διεύθυνση των πελατών που σχετίζονται με το δοσμένο προφίλ συλλέγονται και ταχυδρομούνται σε αυτούς διαφημιστικά γράμματα .

Page 67: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 67

Κεφαλαιο 5

Page 68: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 68

5.1 Τι είναι το Web Mining;

Η εξόρυξη δεδομένων είναι η τεχνολογία που χρησιμοποιείται για να ανακαλύπτει μη προφανής, αλλά πιθανόν χρήσιμες και προηγουμένως άγνωστες πληροφορίες από πηγές δεδομένων.

Οι δυνατότητες της εξόρυξης διαδικτύου βρίσκονται στην εφαρμογή των υπαρχόντων και νέων αλγορίθμων εξόρυξης δεδομένων στα δεδομένα του Διαδικτύου που περιλαμβάνουν logs κεντρικών υπολογιστών του Διαδικτύου καθώς επίσης και εξωτερικά δεδομένα πελατών, πωλήσεων και προϊόντων.

Η εξόρυξη Διαδικτύου μπορεί να υποδιαιρεθεί στην εξόρυξη περιεχομένου του Διαδικτύου, την εξόρυξη δομών του Διαδικτύου και την εξόρυξη χρήσης του Διαδικτύου. Η εξόρυξη περιεχομένου του Διαδικτύου είναι η εξόρυξη των σελίδων Διαδικτύου, κοινή για την επόμενη γενεά των XML/RKF-βασισμένων μηχανών αναζήτησης/ή των spiders. Η εξόρυξη δομών του Διαδικτύου είναι η εφαρμογή της εξόρυξης δεδομένων για να αναδημιουργηθεί η δομή ενός ή και περισσότερων ιστοχώρων. Η εξόρυξη χρήσης του Διαδικτύου είναι η εξόρυξη των αρχείων καταγραφής (logs) και των σχετικών δεδομένων από έναν ιδιαίτερο ιστοχώρο για να ανακαλύψει τη γνώση της μηχανής αναζήτησης και συμπεριφοράς των αγοραστών σε εκείνη την ιστοσελίδα. Εν ολίγοις, η εξόρυξη Διαδικτύου μπορεί να εφαρμόζει τις υπάρχουσες τεχνικές ανάλυσης με την τεχνολογία αιχμής στο μεγάλο αριθμό δεδομένων που παράγει το Διαδίκτυο.

5.1.1 Τα πλεονεκτήματα του Web Mining

Το Web Mining δίνει τη δυνατότητα να αυξηθεί η εισροή δεδομένων των online χρηστών ώστε να κατανοείται και να προβλέπεται η συμπεριφορά τους. Για πρώτη φορά, δίνετε η δυνατότητα ακόμα και για τους λιανοπωλητές μέσω διαδικτύου να έχουν πρόσβαση σε λεπτομερείς πληροφορίες που σχετίζονται με το μάρκετινγκ για τους επισκέπτες των web site τους.

Τα επιχειρηματικά πλεονεκτήματα που προσφέρει το Web Mining στους παροχείς ηλεκτρονικής εξυπηρέτησης περιλαμβάνουν την προσωποποίηση (ή αλλιώς εξατομίκευση), συνεργατικό φιλτράρισμα, εμπλουτισμένη υποστήριξη χρηστών – πελατών, προϊοντικός στρατηγικός προσδιορισμός, μοριακό μάρκετινγκ και ανίχνευση απατών. Εν συντομία, την ικανότητα να εξυπηρετούνται οι ανάγκες των χρηστών και να παραδίδετε η καλύτερη και καταλληλότερη εξυπηρέτηση σε αυτούς τους χρήστες οποιαδήποτε στιγμή.

5.1.2 Προσωποποίηση για το Web Mining

Έχουμε πραγματικά φτάσει στην εποχή της Πληροφορίας. Υπάρχει μία συνεχώς αυξανόμενη ποσότητα πληροφορίας. Επιπροσθέτως, η επανάσταση του Ίντερνετ στην παγκόσμια υποδομή Πληροφορίας, ταιριάζοντας με την πελώρια δημοτικότητα του διαδικτύου, κατέστη δυνατό για τον κάθε συνηθισμένο πολίτη να γίνει όχι απλά ένας καταναλωτής της πληροφορίας αλλά και μέσο διάδοσης αυτής. Δεδομένων όλων αυτών, τίθεται το ζήτημα, κατά πόσο ο μέσος χρήστης μπορεί να βρει γρήγορα αυτό που ψάχνει – ένα θέμα όπου στις μέρες μας οι μηχανές αναζήτησης δεν φαίνεται να βοηθούν και πολύ!

Μία πιθανή προσέγγιση είναι να προσωποποιήσουμε το χώρο του διαδικτύου – η δημιουργία ενός συστήματος που ανταποκρίνεται σε ερωτήματα του χρήστη από πιθανές ολοκληρωμένες πληροφορίες από διάφορες πηγές, όπου κατά κάποιο τρόπο εξαρτάται από το ποιος είναι ο χρήστης. Ένα ασήμαντο παράδειγμα θα ήταν – ένα ερώτημα για ευρωπαϊκά

Page 69: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 69

καζίνο θα ήταν πιθανόν καλύτερα να εξυπηρετείται από διευθύνσεις που απευθύνονται στο Μονακό, ενώ για κάποιο της Νότιας Αμερικής να λαμβάνει διευθύνσεις του Las Vegas. Ένα βιολογικό ερώτημα για το ποδόσφαιρο πιθανότατα θα θέλει κάτι παραπάνω από κάποιο ενθουσιώδες σχόλιο.

Τα υπάρχοντα εμπορικά συστήματα επιδιώκουν να κάνουν κάποια ελάχιστη εξατομίκευση βασισμένη στις δηλωμένες πληροφορίες που παρέχονται άμεσα από το χρήστη, όπως ο ταχυδρομικός κώδικάς τους, ή τις λέξεις κλειδιά που περιγράφουν τα ενδιαφέροντα τους, ή συγκεκριμένα URLs, ή ακόμα και συγκεκριμένα κομμάτια πληροφοριών που ενδιαφέρονται (π.χ. αξία ενός ιδιαίτερου αποθέματος). Οι ερευνητικοί στόχοι στη δημιουργία συστημάτων είναι να προσαρμόζουν σχεδόν (ημι) αυτόματα το περιεχόμενο που παραδίδεται στο χρήστη από έναν ιστοχώρο. Αυτό πετυχαίνετε με την εξαγωγή του Διαδικτύου μαζί με το περιεχόμενο, καθώς επίσης και την αλληλεπίδραση των χρηστών.

5.2 Web Mining (Εξόρυξη Διαδικτύου)

Η εξόρυξη Διαδικτύου είναι η χρήση των τεχνικών εξόρυξης δεδομένων για να ανακαλυφθούν αυτόματα και να εξαχθούν οι πληροφορίες από τα έγγραφα και τις υπηρεσίες Διαδικτύου.

Ορισμός : Στη διαχείριση σχέσης πελατών (CRM), η εξόρυξη Διαδικτύου είναι η ολοκλήρωση των πληροφοριών που συγκεντρώνονται από τις παραδοσιακές μεθοδολογίες και τις τεχνικές εξόρυξης δεδομένων με τις πληροφορίες που συγκεντρώνονται πέρα από το World Wide Web. (Η εξόρυξη σημαίνει κάτι χρήσιμο ή πολύτιμο από μια βασική ουσία, όπως η εξόρυξη χρυσού από τη γη). Η εξόρυξη Διαδικτύου χρησιμοποιείται για να γίνει κατανοητή η συμπεριφορά πελατών, να αξιολογηθεί η αποτελεσματικότητα ενός συγκεκριμένου site, και για να βοηθήσει στην επιτυχία μιας εκστρατείας μάρκετινγκ. Η εξόρυξη Διαδικτύου επιτρέπει σε κάποιον να ψάξει για πρότυπα στα δεδομένα μέσω της εξόρυξης περιεχομένου, της εξόρυξης δομών, και της εξόρυξης χρήσης. Η εξόρυξη περιεχομένου χρησιμοποιείται για να εξετάσει τα δεδομένα που συλλέγονται από τις μηχανές αναζήτησης και απ’ τα spiders. Η εξόρυξη δομών χρησιμοποιείται για να εξετάσει τα δεδομένα σχετικά με τη δομή ενός συγκεκριμένου ιστοχώρου και η εξόρυξη χρήσης χρησιμοποιείται για να εξετάσει τα δεδομένα σχετικά με μία μηχανή αναζήτησης ενός συγκεκριμένου χρήστη καθώς επίσης και τα δεδομένα που συγκεντρώνονται από τις φόρμες που ο χρήστης μπορεί να είχε υποβάλει κατά τη διάρκεια των συναλλαγών μέσω Διαδικτύου.

Οι πληροφορίες που συγκεντρώνονται μέσω της εξόρυξης Διαδικτύου αξιολογούνται (μερικές φορές με την ενίσχυση του λογισμικού που δίνει με γραφική παράσταση τις εφαρμογές) με τη χρησιμοποίηση των παραδοσιακών παραμέτρων εξόρυξης δεδομένων όπως η συγκέντρωση και η ταξινόμηση, η ένωση, και η εξέταση των διαδοχικών προτύπων. Μια κοινή ταξινόμηση της εξόρυξης Διαδικτύου καθορίζει τρεις κύριες ερευνητικές γραμμές: την εξόρυξη περιεχομένου, την εξόρυξη δομών και την εξόρυξη χρήσης. Η διάκριση μεταξύ αυτών των κατηγοριών δεν είναι ευδιάκριτη, και πολύ συχνά πλησιάζει το συνδυασμό χρήσης τεχνικών από τις διαφορετικές κατηγορίες. Η εξόρυξη περιεχομένου καλύπτει τις τεχνικές εξόρυξης δεδομένων για να εξαχθούν τα πρότυπα από τα αντικείμενα περιεχομένου του Διαδικτύου συμπεριλαμβανομένου του απλού κειμένου, των ημιδομημένων εγγράφων (π.χ., HTML ή XML), των δομημένων εγγράφων (ψηφιακές βιβλιοθήκες), των δυναμικών εγγράφων, και των εγγράφων πολυμέσων. Τα αποσπασματικά εξαγόμενα μοντέλα χρησιμοποιούνται για να ταξινομήσουν τα αντικείμενα Διαδικτύου, για να εξαγάγουν λέξεις κλειδιά που χρησιμεύουν στην

Page 70: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 70

ανάκτηση πληροφοριών, καθώς επίσης και για να συμπεράνει τη δομή των ημιδομημένων ή μη δομημένων αντικειμένων. Η εξόρυξη δομών στοχεύει στην εύρεση της βασικής τοπολογίας των εσωτερικών συνδέσεων μεταξύ των αντικειμένων Διαδικτύου. Το πρότυπο που χτίζεται μπορεί να χρησιμοποιηθεί για να ταξινομήσει και να κατατάξει τους ιστοχώρους, και επίσης να ανακαλύψει τυχόν ομοιότητες μεταξύ τους. Η εξόρυξη χρήσης είναι η εφαρμογή των τεχνικών εξόρυξης δεδομένων για να ανακαλυφθεί η χρήση των προτύοπων από τα δεδομένα Διαδικτύου. Τα δεδομένα συλλέγονται συνήθως από την αλληλεπίδραση του χρήστη με τον Ιστό, π.χ. από log αρχεία, από ερωτήσεις χρηστών, ή από δεδομένα εγγραφής. Τα εργαλεία εξόρυξης χρήσης ανακαλύπτουν και προβλέπουν τη συμπεριφορά χρηστών, προκειμένου να βοηθηθεί ο σχεδιαστής για να βελτιώσει τον ιστοχώρο, για να προσελκύσει τους επισκέπτες, ή για να δώσουν στους τακτικούς χρήστες εξατομικευμένες και προσαρμόσιμες υπηρεσίες.

Η εξόρυξη περιεχομένου Διαδικτύου είναι σχετικό αλλά διαφορετικό από την εξόρυξη δεδομένων και τη εξόρυξη κειμένων. Συσχετίζεται με την εξόρυξη δεδομένων επειδή πολλές τεχνικές εξόρυξης δεδομένων μπορούν να εφαρμοστούν στην εξόρυξη περιεχομένου. Συσχετίζεται με την εξόρυξη κειμένων επειδή ένα μεγάλο μέρος του περιεχομένου Διαδικτύου είναι κείμενα. Εντούτοις, είναι επίσης αρκετά διαφορετικό από την εξόρυξη δεδομένων επειδή τα στοιχεία Διαδικτύου είναι κυρίως ημι-δομημένα ή/και μη δομημένα, ενώ η εξόρυξη δεδομένων ασχολείται κατά κύριο λόγο με τα δομημένα στοιχεία. Η εξόρυξη περιεχομένου είναι επίσης διαφορετικό από την εξόρυξη κειμένων λόγω της φύσης των ημι-δομών του Διαδικτύου, ενώ η εξόρυξη κειμένων εστιάζει στα μη δομημένα κείμενα. Η εξόρυξη περιεχομένου, ακόμα, απαιτεί τις δημιουργικές εφαρμογές των τεχνικών εξόρυξης δεδομένων ή/και εξόρυξης κειμένων και επίσης των μοναδικών προσεγγίσεών τους. Στο παρελθόν, υπήρξε μια γρήγορη επέκταση των δραστηριοτήτων στον τομέα εξόρυξης περιεχομένου του Διαδικτύου. Κάτι τέτοιο δεν προκαλεί έκπληξη λόγω της φαινομενικής αύξησης του περιεχομένου του Διαδικτύου και του σημαντικού οικονομικού οφέλους από μία εξόρυξη. Εντούτοις, λόγω της ετερογένειας και της έλλειψης δομής των στοιχείων του Διαδικτύου, η αυτοματοποιημένη ανακάλυψη στοχευμένων ή απροσδόκητων πληροφοριών γνώσης παρουσιάζει ακόμα πιο πολλά προκλητικά ερευνητικά προβλήματα. Σε αυτό το σεμινάριο, θα εξετάσουμε τα ακόλουθα σημαντικά προβλήματα εξόρυξης περιεχομένου Διαδικτύου και θα συζητήσουμε τις υπάρχουσες τεχνικές για αυτά τα προβλήματα. Μερικά άλλα αναδυόμενα προβλήματα θα ερευνηθούν επίσης. Εξαγωγή στοιχείων/πληροφοριών: Εστιάζουμε στην εξαγωγή των δομημένων στοιχείων από ιστοσελίδες, όπως τα προϊόντα και τα αποτελέσματα αναζήτησης. Η εξαγωγή τέτοιων στοιχείων επιτρέπει σε κάποιον να παρέχει υπηρεσίες. Δύο κύριοι τύποι τεχνικών καλύπτονται, εκμάθηση μηχανών και αυτοματοποιημένες εξαγωγές. Ολοκλήρωση πληροφοριών Διαδικτύου και συνδυασμός σχημάτων: Αν και ο Ιστός περιέχει ένα τεράστιο ποσό δεδομένων, κάθε ιστοχώρος (ή ακόμα και σελίδα) παρουσιάζει παρόμοιες πληροφορίες διαφορετικά. Το πώς θα προσδιορίσουμε ή θα συνδυάσουμε σημασιολογικά παρόμοια δεδομένα είναι ένα πολύ σημαντικό πρόβλημα με πολλές πρακτικές εφαρμογές. Εξαγωγή συμπερασμάτων-απόψεων από on line πηγές: Υπάρχουν πολλές πηγές απόψεων απευθείας σύνδεσης, όπως για παράδειγμα κριτικές πελατών για προϊόντα, φόρουμ, blogs και δωμάτια συνομιλίας. Η εξαγωγή απόψεων (ειδικά απόψεις καταναλωτών) είναι μεγάλης σπουδαιότητας για τις υπηρεσίες μάρκετινγκ και την αξιολόγηση προϊόντων. Σύνθεση γνώσης: Οι ιεραρχίες ή η οντολογία έννοιας είναι χρήσιμες σε πολλές εφαρμογές. Εντούτοις, η παραγωγή τους χειροκίνητα είναι πολύ χρονοβόρα. Θα παρουσιαστούν μερικές υπάρχουσες μέθοδοι που ερευνούν τον πλεονασμό πληροφοριών του Διαδικτύου. Η κύρια εφαρμογή είναι να συντεθούν και να οργανωθούν τα κομμάτια των πληροφοριών Διαδικτύου ώστε να δώσουν στο χρήστη μια συνεπή εικόνα του θέματος του domain.

Page 71: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 71

Τμηματοποίηση και ανίχνευση του “θορύβου” της ιστοσελίδας: Σε πολλές εφαρμογές Διαδικτύου, το μόνο που είναι απαραίτητο είναι το κύριο περιεχόμενο ιστοσελίδας χωρίς διαφημίσεις, συνδέσεις καθοδήγησης, ή σημειώσεις πνευματικών δικαιωμάτων. Η αυτοματοποιημένη τμηματοποίηση μιας ιστοσελίδας για να εξαχθεί το κύριο περιεχόμενο των σελίδων είναι ένα ενδιαφέρον πρόβλημα, με διάφορες ενδιαφέρουσες τεχνικές έχουν προταθεί στο παρελθόν.

5.2.1 Ταξινόμηση του πολυμεσικού περιεχομένου και των ιστοχώρων

Προκειμένου να ανακτηθεί κάποια σχετική γνώση ένα σύστημα πρέπει πρώτα να αναλύσει το περιεχόμενο Διαδικτύου. Η ταξινόμηση των αντικειμένων Διαδικτύου προσφέρει έναν αυτόματο τρόπο ώστε να αποφασιστεί η σχετικότητα των αντικειμένων του Διαδικτύου. Η εστίασή μας σε αυτήν την περιοχή είναι η ταξινόμηση των ιστοχώρων ή host. Δεδομένου ότι οι ιστοχώροι αντιπροσωπεύουν τις πληροφορίες σε γενικότερο επίπεδο (π.χ. μια πλήρης επιχείρηση) και αντιπροσωπεύονται συνήθως από πολλαπλάσιες σελίδες, ο ταξινομούμενος ιστοχώρος πάνω από την ταξινόμηση της ιστοσελίδας απαιτεί τους νέους αλγορίθμους. Σχήμα 13

5.2.1.1 Focused crawling Ένα Focused Web Crawler παίρνει ένα σύνολο καλά επιλεγμένων ιστοσελίδων που εξηγούν το ενδιαφέρον χρηστών. Ψάχνοντας για περαιτέρω σχετικές ιστοσελίδες, ο Focused Crawler αρχίζει από τις δοσμένες σελίδες και ερευνά κατ' επανάληψη συνδεμένες ιστοσελίδες. Ενώ οι Crawlers που χρησιμοποιούνται για την ανανέωση των δεικτών των μηχανών αναζήτησης Διαδικτύου εκτελούν μια πρωταρχική αναζήτηση ολόκληρου του Διαδικτύου, οι Focused Crawlers ερευνούν μόνο μια μικρή μερίδα του Διαδικτύου χρησιμοποιώντας μια καλύτερη πρώτη αναζήτηση που καθοδηγείται από το ενδιαφέρον των χρηστών. Εξετάζετε ειδικά το Crawling ωστέ να ανακτήσουμε τους πλήρεις ιστοχώρους, ένα θέμα που απαιτεί νέες στρατηγικές Crawl. Επιπλέον, μας ενδιαφέρει το Crawling για το

Page 72: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 72

περιεχόμενο πολυμέσων στον Ιστό, ανακτώντας θέματα συγκεκριμένων πολυμεσικών περιεχομένων αντί των σαφών εγγράφων HTML. Σχήμα 14

5.2.1.1 Ομαδοποίηση των αντικειμένων Διαδικτύου Το Focused Crawling ανακτά μεγάλο όγκο σχετικών μεταξύ τους δεδομένων. Προκειμένου να προσφέρει γρήγορη και πιο συγκεκριμένη πρόσβαση στα αποτελέσματα των ερωτημάτων, η συγκέντρωση είναι μια καθιερωμένη μέθοδος για να ομαδοποιήσει τις ανακτημένες πληροφορίες και να επιτύχει την καλύτερη κατανόηση. Εάν τα αποτελέσματα των ερωτημάτων είναι ιστοχώροι ή συνδυασμένα αντικείμενα όπως εικόνες με τις περιγραφές των κειμένων τους, απαιτείται νέος αλγόριθμος για να χειριστεί αυτούς τους συνδυασμένους τύπους δεδομένων ώστε να βρεθούν σημαντικές ομαδοποιήσεις. Σχήμα 15 Τι είναι η εξαγωγή δομής του Διαδικτύου; Η δομή μιας χαρακτηριστικής γραφικής παράστασης Διαδικτύου αποτελείται από ιστοσελίδες ως κόμβοι, και τους υπερσυνδέσμους ως άκρες που συνδέουν μεταξύ τους δύο σχετικές σελίδες.

Page 73: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 73

Σχήμα 16 Ο στόχος της εξαγωγής δομών Διαδικτύου είναι να παραχθεί μία δομημένη περίληψη για τον ιστοχώρο και την ιστοσελίδα. Τεχνικά, η εξαγωγή περιεχομένου Διαδικτύου εστιάζει κυρίως στη δομή του εσωτερικού εγγράφου, ενώ η εξαγωγή των δομών Διαδικτύου προσπαθεί να ανακαλύψει τη δομή συνδέσεων των υπερ-συνδέσμων στο επίπεδο του υπερ-κειμένου. Με βάση την τοπολογία των υπερ-συνδέσμων, η εξαγωγή των δομών του Διαδικτύου θα ταξινομήσει τις ιστοσελίδες και θα εξάγει πληροφορίες, όπως η ομοιότητα και η σχέση μεταξύ των διαφορετικών ιστοχώρων. Η εξόρυξη των δομών του Διαδικτύου μπορεί επίσης να έχει μια άλλη κατεύθυνση, την ανακάλυψη της δομής του ίδιου του εγγράφου του Διαδικτύου. Αυτός ο τύπος εξαγωγής δομών μπορεί να χρησιμοποιηθεί για να αποκαλύψει τη δομή (σχήμα) των ιστοσελίδων. Αυτό θα ήταν καλό για σκοπούς καθοδήγησης και για ύπαρξη δυνατότητας να συγκρίνει/ενσωματώσει τα πρότυπα της ιστοσελίδας. Αυτός ο τύπος εξαγωγής δομών διευκολύνει την εισαγωγή των τεχνικών βάσεων των δεδομένων για τις πληροφορίες της ιστοσελίδας με την παροχή ενός σχήματος αναφοράς. Τι είναι οι δομικές πληροφορίες, και πώς να ανακαλυφθούν; Ο S.Madria καθώς και άλλοι ερευνητές έδωσαν μια λεπτομερή περιγραφή για το πώς θα ανακαλυφθούν τα ενδιαφέροντα και πληροφοριακά γεγονότα περιγράφοντας τη συνδετικότητα στο υποσύνολο Διαδικτύου, βασισμένο στη δεδομένη συλλογή των διασυνδεόμενων εγγράφων Διαδικτύου. Οι δομικές πληροφορίες που παράγονται από την εξόρυξη των δομών του Διαδικτύου περιλαμβάνουν τα ακόλουθα: α)τις πληροφορίες που μετρούν τη συχνότητα των τοπικών συνδέσεων tuples* σε έναν πίνακα Διαδικτύου, β)τις πληροφορίες που μετρούν τη συχνότητα tuples σε έναν πίνακα Διαδικτύου που περιέχει τις συνδέσεις που είναι εσωτερικές και τις συνδέσεις που είναι μέσα στο ίδιο έγγραφο, γ) τις πληροφορίες που μετρούν τη συχνότητα tuples Διαδικτύου σε έναν πίνακα Διαδικτύου που περιέχονται οι συνδέσεις που είναι σφαιρικές και οι συνδέσεις που εκτείνονται τους διαφορετικούς ιστοχώρους, δ) τις πληροφορίες που μετρούν τη συχνότητα όμοιων tuples που εμφανίζονται στον πίνακα Διαδικτύου ή μεταξύ των πινάκων Διαδικτύου. Γενικά, εάν η ιστοσελίδα συνδέεται με μια άλλη ιστοσελίδα απευθείας, ή οι ιστοσελίδες είναι γειτονικές, θα θέλαμε να ανακαλύψουμε τις σχέσεις (* Web schemas are used to bind a web table that contains a collection of interlinked web documents called web tuples.) μεταξύ αυτών των ιστοσελίδων. Οι σχέσεις ίσως ανήκουν σε έναν από τους τύπους, καθώς συσχετίζονται από τα συνώνυμα ή την οντολογία, μπορούν να έχουν παρόμοιο περιεχόμενο, και οι δύο μπορούν να βρίσκονται στον ίδιο κεντρικό υπολογιστή επομένως να έχουν δημιουργηθεί από το ίδιο πρόσωπο. Ένας άλλος στόχος της εξαγωγής δομών Διαδικτύου είναι να ανακαλύπτει τη φύση της ιεραρχίας ή το δίκτυο των υπερσυνδέσμων στους ιστοχώρους ενός συγκεκριμένου domain. Αυτό μπορεί να βοηθήσει στη γενίκευση της ροής των πληροφοριών στους ιστοχώρους που μπορούν να αντιπροσωπεύουν κάποιο συγκεκριμένο domain, επομένως η επεξεργασία ερωτήματος θα είναι ευκολότερη και αποδοτικότερη. Η εξόρυξη των δομών του Διαδικτύου έχει μια φυσική σχέση με την εξόρυξη περιεχομένου του Διαδικτύου, δεδομένου ότι είναι πολύ πιθανό τα έγγραφα του Διαδικτύου να περιέχουν συνδέσεις, και να χρησιμοποιούν και τα δύο τα πραγματικά ή αρχικά στοιχεία

Page 74: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 74

όσον αφορά τον Ιστό. Είναι αρκετά συχνό να συνδυάζονται αυτοί οι δύο στόχοι της εξόρυξης σε μια εφαρμογή.

Η εξαγωγή δομών του Διαδικτύου μπορεί να είναι η διαδικασία ανακάλυψης των δομών των πληροφοριών από τον Ιστό: αυτός ο τύπος εξαγωγής μπορεί να εκτελεστεί είτε στο επίπεδο εγγράφων (εσωτερικών σελίδων) είτε στο επίπεδο υπερσυνδέσμων (εξωτερικών σελίδων) η έρευνα στο επίπεδο υπερσυνδέσμων καλείται επίσης ανάλυση υπερσυνδέσμων Δομή υπερσυνδέσμων Οι υπερσύνδεσμοι εξυπηρετούν δύο κύριους σκοπούς.

• Λιτή περιήγηση. • Κατεύθυνση στις σελίδες με την εξουσιοδότηση στο ίδιο θέμα της σελίδας που

περιέχει τον σύνδεσμο.

Ορολογία δομών Διαδικτύου Ιστογραφική παράσταση: Μια κατευθυνόμενη γραφική παράσταση που αντιπροσωπεύει τον Ιστό. Κόμβος: Κάθε ιστοσελίδα είναι ένας κόμβος της Ιστογραφικής παράστασης. Σύνδεση: Κάθε υπερσύνδεσμος στον Ιστό είναι μια κατευθυνόμενη άκρη της Ιστογραφικής παράστασης. Εσωτερικός βαθμός: Ο εσωτερικός βαθμός ενός κόμβου, p είναι ο αριθμός ευδιάκριτων συνδέσεων που δείχνουν το p. Εξωτερικός βαθμός: Ο εξωτερικός βαθμός ενός κόμβου, p είναι ο αριθμός ευδιάκριτων συνδέσεων που δημιουργούνται στο σημείο p το οποίο μας συνδέει σε άλλους κόμβους. Κατευθυνόμενη πορεία: Μια ακολουθία συνδέσεων, που αρχίζει από το p που μπορεί να ακολουθηθεί για να φθάσει στο q. Συντομότερη πορεία: Από όλες τις πορείες μεταξύ των κόμβων p και q, οι οποίοι έχουν το πιο σύντομο μήκος, δηλαδή ο αριθμός συνδέσεων σε αυτά. Διάμετρος: Το μέγιστο όλων των κοντύτερων πορειών μεταξύ ενός ζευγαριού των κόμβων p και q, για όλα τα ζευγάρια των κόμβων p και q μέσα στην Ιστογραφική παράσταση.

5.3 Συμπεράσματα Η δομή του Διαδικτύου είναι μια χρήσιμη πηγή για την εξαγωγή των πληροφοριών όπως:

• Η ποιότητα της ιστοσελίδας.

• Την αυθεντία μιας σελίδας σε ένα θέμα

• Ταξινόμηση των ιστοσελίδων με βάση διάφορα θέματα

• Ενδιαφέρουσες δομές Διαδικτύου

• Σχέδια γραφικών παραστάσεων

• Απόφαση ποιων ιστοσελίδων να προστεθούν στη συλλογή των ιστοσελίδων

Page 75: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 75

• Εύρεση των σχετικών σελίδων

• Λαμβάνοντας υπόψη μια σχετική σελίδα, εύρεση όλων των υπολοίπων σχετικών σελίδων

• Ανίχνευση των διπλών σελίδων

• Ανίχνευση των κοντινών ομοίων περιοχών, με σκοπό τη μείωση των διπλοτύπων.

Page 76: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 76

Κεφαλαιο 6

Page 77: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 77

6.1 Εισαγωγή

Η ιδέα πίσω απ’ την εξόρυξη χρήσης Διαδικτύου είναι να εξάγει συμπεράσματα και πληροφορίες απ’ την συμπεριφορά των χρηστών του διαδικτύου. Η εξόρυξη χρήσης Διαδικτύου κάποιες φορές είναι αρκετά εμφανής. Ένα τυπικό παράδειγμα είναι η τεχνική “cross-selling”, μία τεχνική που χρησιμοποιείται από πολλά on line καταστήματα: για παράδειγμα όταν ένας χρήστης ζητάει πληροφορίες για ένα βιβλίο, η ιστοσελίδα προσφέρει, μεταξύ άλλων και άλλα προϊόντα, όπως μία πληροφορία του τύπου “ Επισκέπτες που αγόρασαν το βιβλίο αυτό, αγόρασαν επίσης…”. Με τον τρόπο αυτό το κατάστημα μπορεί και δείχνει στο χρήστη άλλες πιθανόν ενδιαφέρουσες πληροφορίες, παρακάμπτοντας κάθε περιήγηση στο περιεχόμενο του site ή της δομής του, αλλά αντ’ αυτού χρησιμοποιεί ένα αρχείο καταγραφής της συμπεριφοράς του χρήστη στο site. Μ’ αυτό τον τρόπο είναι ξεκάθαρο, ότι μπορούν να βρεθούν ενώσεις του site που διαφορετικά θα ήταν πολύ δύσκολο χρησιμοποιώντας απλά εξόρυξη περιεχομένου ή δομής. Αντιθέτως, η ευφυΐα του υπολογιστικού συστήματος, αποδεικνύεται, εξάγοντας απευθείας την σωστή πληροφορία στον εκάστοτε χρήστη. Αυτό είναι ένα απ’ τα σημαντικότερα και θεμελιώδη πλεονεκτήματα της εξόρυξης χρήσης Διαδικτύου από άλλες κατηγορίες εξόρυξης διαδικτύου.

Η εφαρμοσιμότητα της εξόρυξης χρήσης διαδικτύου είναι πολύ πιο ευρύς απ’ το παραπάνω παράδειγμα, και μπορεί να επίσης να εφαρμοστεί και με λιγότερο εμφανής τρόπους. Για παράδειγμα, μία μηχανή αναζήτησης που κρατάει σε ένα log αρχείο τις λέξεις προς αναζήτηση, που έχουν πληκτρολογήσει οι χρήστες της, μπορεί να εντοπίσει κάποιες λέξεις που συχνά πληκτρολογούνται μαζί, ή λέξεις που έχουν επιτυχημένα αποτελέσματα αναζήτησης. Με τον τρόπο αυτό, μία μηχανή αναζήτησης μπορεί να βοηθήσει το χρήστη παρουσιάζοντας σελίδες που δεν περιέχουν τις ακριβής πληκτρολογούμενες λέξεις αλλά παρόμοιες ή να παροτρύνει το χρήστη να ξανακάνει την αναζήτηση με κάποιες άλλες προτεινόμενες λέξεις.

Οι αυτοπροσαρμοζόμενες σελίδες είναι ένα άλλο επιτυχημένο παράδειγμα εξόρυξης χρήσης διαδικτύου. Τέτοιου είδους σελίδες κρατάνε αρχεία καταγραφών, για το πόσες φορές ένας χρήστης ακολούθησε συγκεκριμένους συνδέσμους, και με βάση αυτήν την πληροφορία μπορεί αυτοί να επανατοποθετηθούν μέσα στην σελίδα ώστε να είναι πιο εύκολα προσπελάσιμοι, να είναι πιο εμφανείς, και γενικότερα να γίνεται και η ιστοσελίδα πιο ενδιαφέρουσα για τον συγκεκριμένο χρήστη.

Η εξόρυξη χρήσης διαδικτύου γίνεται ολοένα και πιο σημαντική καθώς όλο και περισσότερες εταιρίες υιοθετούν στρατηγικές e-business. Τα εταιρικά site γίνονται νέα κανάλια για την διαχείριση πελατειακών σχέσεων (CRM). Μία εξαιρετικά μεγάλη ποσότητα δεδομένων χρήσης διαδικτύου εξάγεται από τις αλληλεπιδράσεις των χρηστών με το διαδίκτυο, όπως είναι τα cookies, τα δεδομένα φορμών, τα δεδομένα αναφορών, τα δεδομένα συνόλου κλπ. Αυτά τα δεδομένα (πιθανόν συνδυασμένα με τα δεδομένα περιεχομένου και δομής) μπορεί να γίνουν μια πολύτιμη πηγή γνώσης για τους διαδυκτιακούς χρήστες ή πελάτες. Με την εξόρυξη χρήσης διαδυκτίου τα CRM και το Marketing ξεχωριστά μπορεί να γίνουν ιδιαίτερα έξυπνα. μαθαίνοντας για τους πελάτες και ταιριάζοντας τις προτιμήσεις τους παρέχεται ένα νέο ανταγωνιστικό πλεονέκτημα.

Ο σκοπός της προσωποποίησης που βασίζεται στην εξόρυξη χρήσης διαδυκτίου είναι να προτείνει ένα σύνολο αντικειμένων σε ένα συγκεκριμένο ενεργό χρήστη που πιθανόν το σύνολο αυτό θα αποτελείται από συνδέσμους, διαφημίσεις, κείμενα, προϊόντα ή υπηρεσίες, προσαρμοσμένα στις ιδιαίτερες προτιμήσεις του χρήστη όπως αυτές προκύπτουν από το συνδυασμό των προτύπων χρήσης. Η διαδικασία αυτή εκτελείται συνδέοντας την ενεργή σύνοδο του χρήστη (πιθανότατα σε συνδυασμό με προηγούμενα αποθηκευμένα προφίλ του συγκεκριμένου χρήστη) με τα πρότυπα χρήσης που έχουν βρεθεί μέσω της εξόρυξης χρήσης διαδικτύου. Η όλη διαδικασία της προσωποποίησης στο διαδίκτυο που βασίζεται στην εξόρυξη χρήσης διαδικτύου αποτελείται από τρεις φάσεις: προετοιμασία δεδομένων και

Page 78: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 78

μετασχηματισμός, ανακάλυψη προτύπων και συστάσεις. Από όλες αυτές μόνο η τελευταία φάση εκτελείται σε πραγματικό χρόνο. Η φάση προετοιμασίας δεδομένων μετατρέπει τα ανεπεξέργαστα αρχεία διαδικτύου log σε δεδομένα συναλλαγής που μπορούν να επεξεργαστούν από διαδικασίες εξόρυξης δεδομένων. Ένα σύνολο τεχνικών εξόρυξης δεδομένων μπορούν να εφαρμοστούν σε αυτά τα δεδομένα συναλλαγών στη φάση εύρεσης προτύπου όπως είναι η ομαδοποίηση, η εξόρυξη εύρεσης κανόνων και η διαδοχική εύρεση προτύπου. Τα αποτελέσματα της φάσης της εξόρυξης μετατρέπονται σε ολοκληρωμένα προφίλ χρήσης κατάλληλα για χρησιμοποίηση στη φάση των συστάσεων. Η μηχανή σύστασης θεωρεί την ενεργή σύνοδο του χρήστη σε συνδυασμό με το πρότυπο που ανακαλύφθηκε για να παρέχει προσωποποιημένο περιεχόμενο.

Η εξόρυξη χρήσης διαδικτύου σκοπεύει να ανακαλύψει ενδιαφέροντα πρότυπα για χρήση αναλύοντας τα δεδομένα χρήσης διαδικτύου. Πέραν των τριών κατηγοριών εξόρυξης διαδικτύου η εξόρυξη χρήσης διαδικτύου είναι η πιο σχετική για προσωποποίηση. Το πλεονέκτημα να θεωρούμε το Web Personalization ως μια εφαρμογή της εξόρυξης χρήσης διαδικτύου είναι ότι η εργασία της χρήσης εξόρυξης μπορεί να είναι μια πηγή ιδεών και λύσεων σε μερικά από τα προβλήματα που παρουσιάζονται κατά τις έρευνες στην προσωποποίηση. Η εξορυξη χρήσης διαδικτύου είναι μια ολοκληρωμένη διαδικασία παρά ένα ξεχωριστός αλγόριθμος. Τα βασικά στάδια για την εξόρυξη δεδομένων είναι:

• Συλλογή δεδομένων. Κατά τη διάρκεια αυτού του σταδίου, τα στοιχεία συλλέγονται είτε από τους κεντρικούς υπολογιστές δικτύου είτε από τους πελάτες που επισκέπτονται έναν ιστοχώρο.

• Προεπεξεργασία δεδομένων. Αυτό είναι το στάδιο που περιλαμβάνει το αρχικό

ξεκαθάρισμα των δεδομένων, την αναγνώριση του χρήστη και την περιοδική αναγνώριση του χρήστη

• Ανακάλυψη προτύπων. Κατά τη διάρκεια αυτού του σταδίου, η γνώση εξάγεται με τη

Εφαρμογή τεχνικών μαθησιακών μηχανών, όπως η συγκέντρωση, η ταξινόμηση, η εξεύρεση συσχετιστικών κανόνων κ.λπ., στα στοιχεία.

• Μετα-επεξεργασία γνώσης. Σε αυτό το τελευταίο στάδιο, η εξαγόμενη γνώση

αξιολογείται και παρουσιάζεται σε μια μορφή που είναι κατανοητή στους ανθρώπους, π.χ. με τη χρησιμοποίηση των εκθέσεων, ή των τεχνικών απεικόνισης.

6.2 Πηγές και τύποι δεδομένων

Οι αρχικές πηγές στοιχείων που χρησιμοποιούνται στο Web Usage Mining είναι τα αρχεία log κεντρικών υπολογιστών, τα οποία περιλαμβάνουν τα logs πρόσβασης κεντρικών υπολογιστών δικτύου και τα logs των εφαρμογών των κεντρικών υπολογιστών. Οι πρόσθετες πηγές στοιχείων που είναι επίσης ουσιαστικές και για την προετοιμασία στοιχείων και για την ανακάλυψη προτύπων περιλαμβάνουν τα αρχεία ιστοσελίδα και τα meta δεδομένα, τις λειτουργικές βάσεις δεδομένων, τα πρότυπα εφαρμογής, και τη γνώση των domain. Γενικά, τα στοιχεία που λαμβάνονται μέσω αυτών των πηγών μπορούν να ταξινομηθούν σε τέσσερις ομάδες

Page 79: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 79

6.2.1 Δεδομένα χρήσης

Το αρχείο log που συλλέγετε αυτόματα από τους Web και application servers αντιπροσωπεύει την ακριβής συμπεριφορά πλοήγησης των επισκεπτών. Ανάλογα με τους στόχους της ανάλυσης, αυτό το δεδομένο πρέπει να μετασχηματιστεί και να αθροιστεί σε διαφορετικά επίπεδα αφαίρεσης.

Στο Web usage mining, το πιο βασικό επίπεδο συλλογής δεδομένων είναι αυτό της προβολής μίας ιστοσελίδας. Φυσικά, η προβολή μιας ιστοσελίδας (pageview) είναι ένας αντιπροσωπευτικός τρόπος συλλογής Web στοιχείων τα οποία διαμοιράζονται για να εμφανίσουν τα αποτελέσματα μιας περιήγησης του χρήστη μέσω μιας απλής πράξης του χρήστη (όπως είναι αυτή του απλού κλικ για την μετάβασή του απ’ την μία ιστοσελίδα σε μία άλλη). Αυτά τα Web στοιχεία μπορεί να περιλαμβάνουν πολλαπλές σελίδες ( όπως π.χ. μία ιστοσελίδα η οποία περιλαμβάνει frames), εικόνες, άλλα ενσωματωμένα στοιχεία, script ή ερωτήματα σε βάσεις δεδομένων που εξάγουν τμήματα της προβεβλημένης ιστοσελίδας (σε περιπτώσεις δυναμικών ιστοσελίδων).

Εννοιολογικά, κάθε προβολή μιας σελίδας αντιπροσωπεύει ένα συγκεκριμένο "τύπο" δραστηριότητας του χρήστη στην ιστοσελίδα, π.χ., διάβασμα ενός άρθρου ειδήσεων, ξεφύλλισμα των αποτελεσμάτων μιας αναζήτησης , προβολή μιας σελίδας προϊόντων, πρόσθεση ενός προϊόντος στον κάδο αγορών, και τα λοιπά.

Αφ' ετέρου, στο επίπεδο χρηστών, το πιο βασικό επίπεδο είναι αυτό της συνόδου κεντρικών υπολογιστών (ή απλά μιας συνόδου). Μια σύνοδος (καλούμενη συνήθως και ως "επίσκεψη") είναι μια ακολουθία προβολών σελίδων από έναν απλό χρήστη κατά τη διάρκεια μιας απλής επίσκεψης. Η έννοια της συνόδου μπορεί να τμηματοποιηθεί περαιτέρω με την επιλογή ενός υποσυνόλου προβεβλημένων σελίδων στη σύνοδο που είναι σημαντικές ή σχετικές για μετέπειτα θέματα ανάλυσης. Θα αναφερθούμε στο σημαντικό σημασιολογικά υποσύνολο των προβολών σελίδων ως συναλλαγή . Είναι σημαντικό να σημειωθεί ότι μια συναλλαγή δεν αναφέρεται απλά στις αγορές προϊόντων, αλλά μπορεί να περιλάβει ποικίλες ενέργειες χρηστών όπως η σύλληψη προβολής διαφορετικών σελίδων σε μια σύνοδο.

6.2.2 Δεδομένα περιεχομένου

Τα δεδομένα περιεχομένου σε μία σελίδα είναι η συλλογή των αντικειμένων και των σχέσεων που μεταβιβάζονται στο χρήστη. Ως επί το πλείστον, αυτό το δεδομένο αποτελείται από τους συνδυασμούς υλικού κειμένου και εικόνων. Οι πηγές δεδομένων που χρησιμοποιούνται για να παραδώσουν ή να παράγουν αυτό το δεδομένο περιλαμβάνουν τις στατικές HTML σελίδες, εικόνες, βίντεο κλιπ, αρχεία ήχου, τμήματα που έχουν παραχθεί δυναμικά από scripts ή άλλες εφαρμογές και συλλογές εγγραφών από λειτουργικές βάσεις δεδομένων. Τα δεδομένα περιεχομένου της ιστοσελίδας, περιλαμβάνουν επίσης σημασιολογικά ή δομικά μεταδεδομένα που ενσωματώνονται στην ιστοσελίδα ή σε μεμονωμένες σελίδες, όπως οι περιγραφικές λέξεις κλειδιά, τα ταξινομημένα έγγραφα, οι σημασιολογικές ετικέτες, ή οι μεταβλητές HTTP.

Τέλος, η βασική οντολογία ονόματος για την ιστοσελίδα θεωρείται επίσης ένα μέρος των δεδομένων περιεχομένου. Η οντολογία ονομάτων μπορεί να συλληφθεί σιωπηρά μέσα στην ιστοσελίδα, ή μπορεί να υπάρξει σε κάποια σαφή φόρμα. Οι σαφής αντιπροσωπεύσεις των οντολογιών ονομάτων μπορούν να περιλάβουν εννοιολογικές ιεραρχίες πέρα από το περιεχόμενο σελίδων, όπως οι κατηγορίες προϊόντων, δομικές ιεραρχίες

Page 80: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 80

αντιπροσωπευόμενες από βασικές δομές αρχείων και καταλόγου όπου η ιστοσελίδα είναι αποθηκευμένη, σαφής αντιπροσωπεύσεις του σημασιολογικού περιεχομένου και των σχέσεων μέσω μιας οντολογικής γλώσσας, όπως ένα RDF αρχείου, ή ενός σχήματος βάσεων δεδομένων πέρα από τα στοιχεία που περιλαμβάνονται στις λειτουργικές βάσεις δεδομένων.

6.2.3 Δεδομένα δομής

Τα δεδομένα δομής αντιπροσωπεύουν το πώς ο σχεδιαστής οργάνωσε το περιεχόμενο μέσα στην ιστοσελίδα. Αυτή η οργάνωση συλλαμβάνεται μέσω της δομής συνδέσμων μεταξύ των ιστοσελίδων, όπως είναι η απεικόνιση μέσω των υπερσυνδέσμων. Τα δεδομένα δομής περιλαμβάνουν επίσης την κατασκευή ενδο-σελίδων όπου το περιεχόμενο εμφανίζεται με βάση τις HTML ή XML ετικέτες. Για παράδειγμα, HTML και XML έγγραφα μπορούν να παρουσιαστούν ώς δενδρική μορφή πέρα από το κενό των ετικετών στη σελίδα.

Τα δεδομένα δομής για μια ιστοσελίδα τυπικά απεικονίζονται από ένα "χάρτη ιστοσελίδας" (site map) που παράγεται αυτόματα και που αντιπροσωπεύει τη δομή των υπερσυνδέσμων της ιστοσελίδας. Ένα εργαλείο χαρτογράφησης ιστοσελίδων πρέπει να έχει την δυνατότητα να απεικονίζει και να αντιπροσωπεύει τις δια- και ενδο- σχέσεις των pagrviews. Αυτή η ανάγκη γίνεται πιο επιτακτική σε μία ιστοσελίδα που έχει δημιουργηθεί με πλαίσια όπου τα τμήματα των ξεχωριστών σελίδων προβολών αντιπροσωπεύουν την ίδια φυσική ιστοσελίδα. Για τις σελίδες που έχουν παραχθεί δυναμικά, τα εργαλεία χαρτογράφησης πρέπει το καθένα να ενσωματώνει την εγγενή γνώση των βασικών εφαρμογών και script ή πρέπει να έχει τη δυνατότητα να παραγάγει τα τμήματα περιεχομένου, χρησιμοποιώντας μια δειγματοληψία των παραμέτρων που περνούν σε τέτοια εφαρμογές ή χειρόγραφα.

6.2.4 Δεδομένα χρηστών

Η λειτουργική βάση δεδομένων μίας ιστοσελίδας μπορεί να περιλαμβάνει πρόσθετες πληροφορίες για τα προφίλ χρηστών. Τέτοια δεδομένα μπορούν να περιλαμβάνουν δημογραφικές ή άλλες αναγνωριστικές πληροφορίες για τους εγγραμμένους χρήστες, εκτιμήσεις χρηστών στα διάφορα αντικείμενα όπως οι σελίδες, τα προϊόντα, ή τους κινηματογράφους, την προηγούμενη αγορά ή αγοραστικές εμπειρίες χρηστών, καθώς επίσης και άλλες σαφής ή ασαφής παρουσιάσεις ενδιαφερόντων των χρηστών.

Προφανώς, η σύλληψη τέτοιων δεδομένων θα απαιτούσε σαφής αλληλεπιδράσεις με τους χρήστες της ιστοσελίδας. Μερικά από τα δεδομένα μπορούν να συλληφθούν ανώνυμα, χωρίς καμία αναγνωριστική πληροφορία απ' την πλευρά των χρηστών (εφ' όσον υπάρχει η δυνατότητα να γίνεται διάκριση μεταξύ των διαφορετικών χρηστών). Παραδείγματος χάριν, οι ανώνυμες πληροφορίες που περιλαμβάνονται στα cookies των χρηστών, μπορούν να θεωρηθούν ως μέρος των πληροφοριών του χρήστη, και μπορούν να χρησιμοποιηθούν για να αναγνωρίζονται επαναλαμβανόμενοι χρήστες της ιστοσελίδας.

Πολλές εφαρμογές που χρησιμοποιούνται για προσωποποίηση απαιτούν την αποθήκευση των προηγούμενων πληροφοριών των προφίλ των χρηστών. Παραδείγματος χάριν, οι εφαρμογές συνεργατικού φιλτραρίσματος αποθηκεύουν συνήθως τις προγενέστερες εκτιμήσεις από τους χρήστες, έτσι αυτό σημαίνει ότι τέτοιες πληροφορίες μπορούν να ληφθούν ανώνυμα, επίσης.

Page 81: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 81

6.3 Web Server Logs Τα Logs κεντρικών υπολογιστών: παράγονται αυτόματα από τον κεντρικό υπολογιστή όταν ένας χρήστης επισκέπτεται ένα URL σε μία ιστοσελίδα. Σ' ένα τέτοιο log καταχωρείται η διεύθυνση IP του επισκέπτη, η ώρα που μπήκε στην ιστοσελίδα, η χρονική διάρκεια που επισκέφθηκε το ζητούμενο URL και αυτό/α στο οποίο/α μετέβη. Από αυτές τις πληροφορίες μπορεί να παραχθεί το μονοπάτι που ακολούθησε ο χρήστης μέσα σ' αυτή την ιστοσελίδα.

Τα Web Server Logs αποτελούν σημαντικές πληροφορίες αν θέλουμε να καταγράψουμε την συμπεριφορά του χρήστη μέσα σε μία ιστοσελίδα. Παρ' όλα αυτά, η διεύθυνση IP που αποθηκεύεται στον κεντρικό υπολογιστή δεν οδηγεί απαραίτητα σ' ένα διαφορετικό χρήστη. Η διεύθυνση μπορεί να έχει αλλαχτεί από τον proxy server και το αναγνωριστικό που χρησιμοποιείται για την αναγνώριση μίας συνόδου μπορεί να πάψει να είναι σε ισχύς.

Επομένως τα cookies logs υπάρχει πιθανότητα να προτιμώνται περισσότερο. Τα cookies είναι μικρά αρχεία κειμένων που παράγονται από τον κεντρικό υπολογιστή στην πλευρά του χρήστη καθώς αυτός περιηγείται στην ιστοσελίδα. Τα cookies επιτρέπουν να θέτουν έναν ειδικό προσδιοριστικό αριθμό ή κώδικα για κάθε ξεχωριστό χρήστη. Ωστόσο για να τοποθετηθεί ένα cookie απαιτείται αυτός να δώσει την άδεια, κάτι το οποίο δεν γίνεται σε κάθε περίπτωση. Επομένως μόνο ο συνδυασμός server logs και cookies θα είναι μια καλή βάση για την εξόρυξη δεδομένων.

Στο παράδειγμα που δίνεται στο σχήμα 17 ένα τυπικό αρχείο log κεντρικών υπολογιστών παρουσιάζεται. Ο πίνακας 5 παρουσιάζει τον κώδικα για το URL. Στον πίνακα 6 παρουσιάζεται το μονοπάτι που έκανε ο χρήστης στον ιστοχώρο.. Ο χρήστης έχει επισκεφτεί τον ιστοχώρο 4 φορές. Μια σύνοδος χρηστών θεωρείται ότι έχει κλείσει όταν ο χρήστης δεν κάνει καμία νέα δράση μέσα σε 20 λεπτά. Αυτό είναι ένας κανόνας ο οποίος δεν μπορούμε να πούμε ότι ισχύει σε όλες τις περιπτώσεις. . Πρωτύτερα, στο παράδειγμά που δόθηκε η χρονική διάρκεια μεταξύ της πρώτης πρόσβασης του χρήστη αρχίζει στις 1: 54 και η δεύτερη στις 2:24 η οποία είναι και μεγαλύτερη κατά 20 λεπτά. Οπότε, πρακτικά θεωρούμε την πρώτη πρόσβαση και τη δεύτερη ως δύο συνόδους. Παρ’ όλο αυτά, ο χρήστης θεωρείται ότι παρέμεινε στην ιστοσελίδα για παραπάνω από 20 λεπτά, αφού δεν εισήλθε στην ιστοσελίδα, απ’ την κεντρική σελίδα. Παρακάτω γίνεται μία εκτενέστερη ανάλυση για τα cookies.

Σχήμα 17: Απόσπασμα από ένα log αρχείο κεντρικού υπολογιστή

Page 82: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 82

Πίνακας 5: URL διευθύνσεις και κωδικός για την διεύθυνση

Πίνακας 6: Χρήστης, ώρα και μονοπάτι που ακολούθησε ο χρήστης στον ιστοχώρο

6.4 User Entry Data / Profiles

Οι on-line φόρμες σε έναν ιστοχώρο είναι πολύ δημοφιλή μέσα για την απόκτηση στοιχείων από τους επισκέπτες. Συνήθως ο επισκέπτης καλείται να συμπληρώσει μέσα σε αυτές τις φόρμες πληροφορίες όπως το όνομα, τη διεύθυνση, τον αριθμό τηλεφώνου κ.λπ. αλλά και τις πληροφορίες για τον τρόπο ζωής και τα ενδιαφέροντα . Αυτές οι πληροφορίες μπορούν να αποθηκευτούν άμεσα σε μια βάση δεδομένων όπου μπορούν να ανασυρθούν αργότερα για εξόρυξη δεδομένων. Εντούτοις, για έναν χρήστη είναι συχνά βαρετό να απαντήσει όλες αυτές τις ερωτήσεις. Επομένως, οι on - line φόρμες ή τα ερωτηματολόγια πρέπει να "στήνονται" με τέτοιο τρόπο ώστε να μην χρειάζεται ο χρήστης πολύ ώρα για να τις συμπληρώσει και να παρακινείτε ώστε δοθούν όλες οι ζητούμενες απαντήσεις.

Μια νέα τάση είναι η στάνταρτ ανοιχτή σκιαγράφηση (Open Profiling Standard) (OPS) που επιτρέπει την αυτόματη εισαγωγή των προφίλ των χρηστών απ' τον περιηγητή του. Το πρότυπο OPS καθορίζει τον τύπο των δεδομένων καθώς και την ηλεκτρονική δοσοληψία των προφίλ.

Ο χρήστης μπορεί να οργανώσει το προφίλ του σε μία προσωρινή βάση και με αυτόν τον τρόπο να παρακολουθεί, να επιλέγει και να ελέγχει ποιες πληροφορίες επιθυμεί να παρέχει προς τα έξω. Το άλλο πλεονέκτημα ενός ηλεκτρονικού προφίλ για το χρήστη είναι ότι πρέπει να καθορίσει το βασικό του προφίλ μία μόνο φορά και όχι όποτε είναι να μπεί σε έναν ιστοχώρο.

Page 83: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 83

6.6 Έξυπνο E-Marketing με εξόρυξη δεδομένων και interfaces προσαρμοσμένα στο χρήστη

Στόχοι

Παρακάτω, περιγράφουμε μία πρόσφατη έρευνα που αναπτύχθηκε για τις on line πωλήσεις, τις πρότυπες μεθόδους διαφημιστικών μοντέλων, τις διαδικασίες για ολοκληρωμένη εξόρυξη δεδομένων, καθώς και την μετέπειτα προσαρμογή του περιεχομένου μιας ιστοσελίδας, σε κάθε ξεχωριστό χρήστη. Το αποτέλεσμα είναι εργαλεία περιλαμβάνοντας τα ακόλουθα βήματα: - Αναγνώριση και καταγραφή των περιεχομένων του ιστού που είναι στα ακόλουθα βήματα η βάση για την ενίσχυση των προφίλ των χρηστών. - Ανάλυση των δεδομένων με τις διαδικασίες εξόρυξης δεδομένων προκειμένου να ανακαλυφθούν και να ενισχυθούν τα προφίλ των χρηστών, π.χ. συσχετισμός των δραστηριοτήτων όπως την αγορά των σχετικών προϊόντων ή του συνδυασμού της αγοράς μερικών προϊόντων με ορισμένες επιλογές παράδοσης. - Ολοκλήρωση και απεικόνιση, αντίστοιχα, των αναλυθέντων δεδομένων για τη διαχείριση περιεχομένου του ιστού και την επεξεργασία των συντακτών, αντίστοιχα. - Μετατροπή των προφίλ των χρηστών και εφαρμογή των κανόνων στις προσαρμοζόμενες στο χρήστη παρουσιάσεις πολυμέσων και φόρμες αλληλεπίδρασης. Οι λύσεις που επιτυγχάνονται σε αυτό το σημείο πρόκειται να είναι νέες επεξεργασίες για εξόρυξη δεδομένων ,προσανατολισμένες στο Web-Mining, επιτρέποντας συγχρόνως την ανατροφοδότηση σύμφωνα με τη γνώση που προέρχεται από την επεξεργασία εξόρυξης δεδομένων στο περιεχόμενο του ιστού και την διαχείριση περιεχομένου, αντίστοιχα.

6.6.1 User Profile

Προκειμένου να προσωποποιηθεί ένας ιστοχώρος, το σύστημα πρέπει να είναι σε θέση να διακρίνει μεταξύ των διαφορετικών χρηστών ή των ομάδων χρηστών. Αυτή η διαδικασία καλείται user profiling και ο στόχος του είναι η δημιουργία μιας βάσης πληροφοριών που περιέχει τις προτιμήσεις, τα χαρακτηριστικά, και τις δραστηριότητες των χρηστών. Στο WEB DOMAIN και ειδικά στο ηλεκτρονικό εμπόριο, το user profiling έχει αναπτυχθεί σημαντικά επειδή οι τεχνολογίες Διαδικτύου παρέχουν εύκολα πληροφορίες για τους χρήστες ενός ιστοχώρου, οι οποίες στην περίπτωση των ιστοσελίδων ηλεκτρονικού εμπορίου είναι πιθανοί πελάτες.

Ένα user profile μπορεί να είναι είτε στατικό, όταν οι πληροφορίες που περιέχονται σ' αυτό δεν αλλάζουν ποτέ ή σπάνια (π.χ., δημογραφικές πληροφορίες), είτε δυναμικές όταν αλλάζουν συχνά . Τέτοιες πληροφορίες λαμβάνονται είτε άμεσα, χρησιμοποιώντας τις απευθείας σύνδεση φόρμες εγγραφής και τα ερωτηματολόγια με συνέπεια την απόκτηση στατικών πληροφοριών για τα προφίλ των χρηστών, είτε σιωπηρά, με την καταγραφή της πλοήγησης , της συμπεριφοράς ή/και των προτιμήσεων κάθε χρήστη, με συνέπεια την δημιουργία δυναμικών προφίλ χρηστών. Στην τελευταία περίπτωση, υπάρχουν δύο περαιτέρω επιλογές: είτε σχετικά με κάθε χρήστη ως μέλος μιας ομάδας και της δημιουργίας ενός ολοκληρωμένου προφίλ, είτε της εξέτασης οποιωνδήποτε αλλαγών σε κάθε χρήστη χωριστά.

Όταν ομαδοποιούνται οι χρήστες ως γκρουπ η μέθοδος που χρησιμοποιείται είναι η δημιουργία ενός ολοκληρωμένου προφίλ χρήστη βασισμένο σε κανόνες και πρότυπα που

Page 84: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 84

εξάγονται χρησιμοποιώντας τεχνικές εξόρυξης δεδομένων διαδικτύου στα logs του web server. Χρησιμοποιώντας αυτή τη γνώση, το site μπορεί να προσαρμοστεί αναλόγως κατάλληλα. Παρακάτω παρέχεται μία περιγραφή διαφόρων μεθόδων για άμεση ή έμμεση συλλογή δεδομένων προφίλ χρηστών.

6.6.2 Data Collection

Ένας τρόπος ώστε να αναγνωρίζεται μοναδικά ένας χρήστης μέσω μίας συνόδου είναι χρησιμοποιώντας cookies. Η W3C προσδιορίζει το cookie ως «δεδομένα που στέλνονται από έναν web server σ’ έναν Web Client, τα οποία αποθηκεύονται τοπικά στον client και στέλνονται πίσω στον server σε διαδοχικές αιτήσεις.» Μ’ άλλα λόγια, ένα cookie είναι μία απλή κεφαλίδα HTTP, που αποτελείται από ένα απλό string, το οποίο εισάγεται στην μνήμη του browser. Χρησιμοποιείται για να αναγνωρίζεται μοναδικά ένας χρήστης κατά τη διάρκεια διαδικτυακών αλληλεπιδράσεων σ’ ένα site και περιέχει παραμέτρους που επιτρέπουν σ’ έναν απομακρυσμένο HTTP εξυπηρετητή να κρατάει εγγραφές αναγνώρισης του χρήστη, και τι κινήσεις έκανε στο απομακρυσμένο web site.

Τα περιεχόμενα ενός αρχείου cookie εξαρτώνται απ’ την ιστοσελίδα που επισκέπτεται. Σε γενικές γραμμές, αποθηκεύονται πληροφορίες για την αναγνώριση του χρήστη, όπως και πληροφορίες του κωδικού του πρόσβασης. Επιπρόσθετες πληροφορίες όπως λεπτομέρειες πιστωτικής κάρτας, αν χρησιμοποιήθηκε κατά τη διάρκεια μιας συναλλαγής, αλλά και λεπτομέρειες αναλόγως με τις δραστηριότητες του χρήστη στην ιστοσελίδα, για παράδειγμα ποιες σελίδες επισκέφθηκε, ποιες αγορές έκανε, ή ποιες διαφημίσεις επέλεξε, μπορεί επίσης να συμπεριλαμβάνονται.

Ένας άλλος τρόπος για την μοναδική αναγνώριση χρηστών μέσω μίας διαδικτυακής συναλλαγής είναι χρησιμοποιώντας το id entd, το οποίο είναι ένα πρωτόκολλο αναγνώρισης, αναγνωρισμένο στο RFC 1413 το οποίο μας παρέχει τρόπους για να καθορίσουμε την ταυτότητα του χρήστη μέσω μίας ξεχωριστής TCP σύνδεσης. Δίνοντας μία ένα ζευγάρι αριθμών TCP πόρτας, επιστρέφει έναν αλφαριθμητικό χαρακτήρα, όπου αναγνωρίζει τον ιδιοκτήτη αυτής της σύνδεσης στο σύστημα του Web Server.

Τέλος, ένας χρήστης μπορεί να αναγνωριστεί κάνοντας την υπόθεση ότι κάθε IP ανταποκρίνεται σ’ έναν χρήστη. Σε ορισμένες περιπτώσεις οι διευθύνσεις IP διαχωρίζονται σε domain names, τα οποία είναι κατοχυρωμένα σε έναν άνθρωπο ή μία εταιρεία. Μ’ αυτόν τον τρόπο γίνεται συλλογή πιο συγκεκριμένων πληροφοριών.

Όπως έχει αναφερθεί, πληροφορίες για το προφίλ του χρήστη μπορούν να αποκτηθούν εμμέσως, χρησιμοποιώντας on line φόρμες απαιτώντας πληροφορίες για το χρήστη, όπως όνομα, ηλικία, φύλο, και προτιμήσεις. Τέτοιες πληροφορίες αποθηκεύονται σε μία βάση δεδομένων και κάθε φορά που ο χρήστης επισκέπτεται την ιστοσελίδα τότε οι πληροφορίες ανακτώνται και αναβαθμίζονται ανάλογα με τις αλληλεπιδράσεις του στη σελίδα.

Όλες οι τεχνικές που αναφέρθηκαν προηγουμένως, για την κατασκευή των προφίλ των χρηστών έχουν και ορισμένα μειονεκτήματα. Πρώτα απ’ όλα σε περίπτωση, όπου το σύστημα εξαρτάται απ’ τα cookies για την συλλογή των πληροφοριών του χρήστη, τότε υπάρχει πιθανότητα ο χρήστης να έχει απενεργοποιημένη την χρήση των cookies στον browser. Άλλα προβλήματα που μπορούν να υπάρξουν όταν χρησιμοποιούμε την τεχνολογία των cookies είναι το γεγονός το ότι επειδή το cookie αρχείο αποθηκεύεται τοπικά στον υπολογιστή του χρήστη, τότε αυτός μπορεί να το διαγράψει και όταν ξαναεπισκεφθεί την σελίδα να αναγνωριστεί και πάλι ως νέος επισκέπτης. Επιπλέον, αν δεν έχουν προσδιοριστεί επιπλέον πληροφορίες, τότε υπάρχει ένα πρόβλημα αναγνώρισης εάν παραπάνω από ένας χρήστης επισκεφθεί την ιστοσελίδα χρησιμοποιώντας τον ίδιο υπολογιστή. Ένα παρόμοιο πρόβλημα, εμφανίζεται χρησιμοποιώντας το πρωτόκολλο identd. Ένα άλλο πιθανό

Page 85: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 85

πρόβλημα, στην αναγνώριση χρηστών χρησιμοποιώντας IP διευθύνσεις είναι ότι στις περισσότερες περιπτώσεις αυτές οι διευθύνσεις ανήκουν στον παροχέα ίντερνετ, και αυτό δεν αρκεί για να αναγνωριστεί η τοποθεσία του χρήστη. Απ’ την άλλη όμως, όταν γίνεται συλλογή των πληροφοριών του χρήστη μέσω ερωτηματολογίου ή φορμών πολλοί χρήστες χρησιμοποιούν ψεύτικες πληροφορίες για το άτομό τους και τα ενδιαφέροντά τους, έχοντας ως αποτέλεσμα τη δημιουργία μη σωστών προφίλ.

6.6.2.1 Privacy Issues

Τα πιο σημαντικά ζητήματα που μπορούν να αντιμετωπιστούν κατά τη διαδικασία δημιουργίας των προφίλ των χρηστών είναι η παραβίαση των δικαιωμάτων. Πολλοί χρήστες είναι απρόθυμοι να δώσουν προσωπικές πληροφορίες είτε άμεσα είτε έμμεσα και διστακτικοί να επισκεφθούν μία σελίδα που χρησιμοποιεί την τεχνολογία των cookie. Και γενικά αποφεύγουν την κοινοποίηση των προσωπικών τους δεδομένων στις διάφορες φόρμες εγγραφής. Σ’ όλες τις περιπτώσεις , ο χρήστης χάνει την ανωνυμότητά του, και γνωρίζει ότι όλες οι ενέργειές του, θα αποθηκευτούν και θα χρησιμοποιηθούν και κυρίως χωρίς να το γνωρίζει ο ίδιος. Επιπλέον, εάν ένας χρήστης έχει συμφωνήσει να παρέχει προσωπικές πληροφορίες σε μία ιστοσελίδα, μέσω της τεχνολογίας των cookies, τότε οι πληροφορίες αυτές μπορούν να ανταλλαχθούν μεταξύ ιστοσελίδων.

Η τεχνολογία P3P (Platform for Privacy Preferences) είναι μία W3C προτεινόμενη σύσταση , το οποίο προτείνει μία υποδομή για την ιδιωτικοποίηση των δεδομένων που ανταλλάσσονται. Αυτό το πρότυπο, επιτρέπει στις ιστοσελίδες να θέσουν σε εφαρμογή τις πρακτικές για ιδιωτικοποίηση για ένα τυποποιημένο πρότυπο, το οποίο μπορεί αυτόματα να ανακτηθεί και να ερμηνευτεί από τους διαδικτυακούς πράκτορες των χρηστών. Επομένως, η διαδικασία ανάγνωσης πολιτικών περί προσωπικών δεδομένων θα απλοποιηθεί απ’ τους χρήστες επειδή μία πληροφορία κλειδί που αφορά για το τι δεδομένα συλλέγονται από μία ιστοσελίδα, θα μπορούν αυτόματα να μεταβιβάζονται στο χρήστη, και οι αποκλίσεις μεταξύ των πρακτικών μιας ιστοσελίδας και των επιλογών ενός χρήστη που αφορούν την κοινοποίηση των προσωπικών δεδομένων, θα επισημαίνεται αυτόματα. Το P3P, εντούτοις, δεν παρέχει μηχανισμούς για την εξασφάλιση ότι οι ιστοσελίδες δρουν σύμφωνα με τις πολιτικές τους.

6.6.3 Προετοιμασία Δεδομένων Χρήσης

Οι προαπαιτούμενες υψηλού επιπέδου λειτουργίες για την προ επεξεργασία χρήσης

δεδομένων είναι ο καθαρισμός δεδομένων, αναγνώριση pageview, αναγνώριση χρήστη, αναγνώριση συνόδου, το συμπέρασμα των παραλειπόμενων αναφορών κατά τη διάρκεια caching, και ηαναγνώριση συναλλαγών.

Ο καθαρισμός δεδομένων αναφέρεται συνήθως συγκεκριμένα σε κάποια ιστοσελίδα και περιέχει λειτουργίες, όπως η αφαίρεση εξωτερικών αναφορών των εσωτερικών αντικειμένων, γραφικών, ή αρχείων ήχου και την αφαίρεση αναφορών από των spider περιηγήσεων. Η τελευταία λειτουργία μπορεί να εκτελεστεί από την συντήρηση μιας λίστας γνωστών spider, μέσω των ευριστικών αναγνωρίσεων των spiders και των Web Robots. [Tan and Kumar, 2002]. Μπορεί επίσης να είναι αναγκαία η ένωση log αρχείων από διάφορους διαδικτυακούς server και server εφαρμογών. Αυτό μπορεί να χρειάζεται παγκόσμιο συγχρονισμό αυτών των server για την λειτουργία του. Με την απουσία των κοινόχρηστων ενσωματωμένων συνόλων ταυτοτήτων, τότε χρησιμοποιούνται εβριστικοί μέθοδοι

Page 86: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 86

βασισμένοι στα αντίστοιχα πεδία των server logs μαζί με διάφορες μεθόδους αναγνώρισης συνόδων και χρηστών για την εκτέλεση των ενώσεων.

Η προσπέλαση της μνήμης cache από τη μεριά του χρήστη μπορεί συχνά να αποτελέσει απώλεια πρόσβασης αναφορών στις ιστοσελίδες ή τα αντικείμενα τα οποία έχουν αποθηκευτεί στη μνήμη αυτή.

Οι αναφορές που έχουν χαθεί λόγω του caching, μπορούν ευριστικά να φτάσουν στο ζητούμενο αποτέλεσμα, ολοκληρώνοντας το μονοπάτι το οποίο βασίζεται στην γνώση της κατασκευής της ιστοσελίδας και αναφέρει τις πληροφορίες των server logs [Cooley et al., 1999]. Στην περίπτωση της δυναμικής δημιουργίας ιστοσελίδων, οι εφαρμογές που βασίζονται σε φόρμες χρησιμοποιώντας τη μέθοδο HTTP POST έχουν ως αποτέλεσμα η εισαγόμενη παράμετρος του χρήστη να μην προσαρτηθεί στο αντίστοιχο URL στο οποίο έχει πρόσβαση ο χρήστης.

Η αναγνώριση των pageview βασίζεται κυρίως στην εσωτερική δομή της ιστοσελίδας, όπως επίσης και στα περιεχόμενα της σελίδας και στην βασική γνώση του site. Για ένα απλό frame site, κάθε html αρχείο έχει μία συσχέτιση ένα –προς-ένα με το pageview. Ενώ, για multi-frame site, πολλά αρχεία δημιουργούν ένα pageview. Χωρίς μία λεπτομερής πληροφόρηση για τη δομή της ιστοσελίδας, είναι αρκετά δύσκολο να εξαχθούν pageview από ένα web server log. Επιπλέον, μπορεί να θεωρηθεί επιθυμητή η χρήση των pageview, σε ένα μεγαλύτερο επίπεδο ολοκλήρωσης, όπου κάθε pageview αντιπροσωπεύει ένα σύνολο σελίδων ή αντικειμένων, για παράδειγμα οι ιστοσελίδες, που ανήκουν στην ίδια κατηγορία.

Βεβαίως, δεν είναι όλα τα pageview, σχετικά με συγκεκριμένες λειτουργίες εξόρυξης, και μεταξύ των κατάλληλων pageviews, μερικά μπορεί να είναι πιο σημαντικά από κάποια άλλα. Η σημαντικότητα ενός pageview εξαρτάται από τα χαρακτηριστικά της χρήσης των περιεχομένων και της δομής ενός site, όπως επίσης και σε προηγούμενη αποκτώμενη γνώση. Για παράδειγμα, σε μία ιστοσελίδα ηλεκτρονικού εμπορίου τα pageviews είναι προσανατολισμένα σε γεγονότα που αφορούν προϊόντα (π.χ. αλλαγές στο καλάθι αγορών ή προβολές σε πληροφορίες προϊόντων). Παρομοίως, σ’ ένα site σχεδιασμένο για προβολή περιεχομένου, οι σελίδες περιεχομένου μπορεί να έχουν μεγαλύτερη βαρύτητα απ’ ότι τις σελίδες περιήγησης.

Για να παρέχεται μία ευέλικτη δομή για ένα σύνολο δραστηριοτήτων εξόρυξης δεδομένων, πρέπει να καταγράφονται τα χαρακτηριστικά για κάθε ένα pageview. Τα χαρακτηριστικά αυτά είναι η ταυτότητα του pageview, η διάρκεια, ο στατικός τύπος του pageview, και άλλα μεταδεδομένα όπως χαρακτηριστικά του περιεχομένου.

Η ανάλυση του Web Usage, δεν απαιτεί γνώση της ταυτότητας του χρήστη. Παρ’ όλα αυτά, είναι απαραίτητο να διαχωρίζονται μεταξύ τους οι χρήστες. Με την απουσία των μηχανισμών εγγραφής και ταυτοποίησης, η πιο ευρέως διαδεδομένη προσέγγιση για το διαχωρισμό μεταξύ της μοναδικότητας είναι η χρήση των cookies από την πλευρά του χρήστη. Δεν χρησιμοποιούν όλες οι ιστοσελίδες cookies, και λόγω της εκμετάλλευσης από μερικούς οργανισμούς και επειδή τα προσωπικά δεδομένα αφορούν κάθε χρήστη η τεχνολογία των cookies πολλές φορές είναι απενεργοποιημένη. Οι διευθύνσεις IP, πολλές φορές από μόνες τους δεν είναι αρκετά ικανοποιητικές για την καταγραφή μοναδικών χρηστών. (Web Usage Mining and Personalization B. Mobasher).

Απ’ την στιγμή που ένας χρήστης μπορεί να επισκεφτεί μία ιστοσελίδα παραπάνω από μία φορά, τα server logs καταγράφουν πολλαπλά session για κάθε χρήστη. Χρησιμοποιούμε την έκφραση καταγεγραμμένη δραστηριότητα του χρήστη για να αναφερθούμε σε μία ακολουθία καταγεγραμμένων δραστηριοτήτων που ανήκουν στον ίδιο χρήστη. Έτσι, η αναγνώριση συνόδου είναι η διαδικασία τμηματοποίησης καταγεγραμμένων δραστηριοτήτων του κάθε χρήστη στις συνόδους.

Οι ιστοσελίδες που δεν έχουν το προνόμιο επιπλέον πληροφοριών ταυτοποίησης για τους χρήστες, και δεν έχουν μηχανισμούς όπως ενσωμάτωσης session ids, πρέπει να βασιστούν σε ευριστικές μεθόδους για την αναγνώριση των συνόδων. Η ευριστική

Page 87: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 87

αναγνώριση συνόδων είναι μία μέθοδος για την εκτέλεση της τμηματοποίησης μιας βάσης υποθέσεων για την συμπεριφορά των χρηστών ή για τα χαρακτηριστικά της ιστοσελίδας.

6.6.4 Εξεύρεση Προτύπων Από Δεδομένα Χρήσης Διαδικτύου

6.6.4.1 Επίπεδα και τύποι ανάλυσης Διαφορετικά είδη ανάλυσης μπορεί να εκτελεστούν σε ολοκληρωμένα δεδομένα χρήσης, σε διαφορετικά επίπεδα άθροισης ή αφαίρεσης δεδομένων (όπως φαίνεται και στο σχήμα 6, ). Οι τύποι και τα επίπεδα ανάλυσης, εξαρτώνται από τους βασικούς στόχους του αναλυτή και τα επιθυμητά αποτελέσματα. Για παράδειγμα, ακόμα και χωρίς τα πλεονεκτήματα μιας ολοκληρωμένης ηλεκτρονικής αγοραπωλησίας, η στατιστική ανάλυση μπορεί να εκτελεστεί και στο επίπεδο προεπεξεργασίας ή συναλλαγής δεδομένων. Όντως, τα στατικά σύνολα αναφορών αποτελούν τον πιο συνηθισμένο τρόπο για ανάλυση. Σε αυτή την περίπτωση τα δεδομένα ολοκληρώνονται από προκαθορισμένα τμήματα, όπως ημέρες, συνόδους, επισκέπτες ή domains. Οι συνήθεις στατιστικές τεχνικές μπορούν να χρησιμοποιηθούν σ’ αυτά τα δεδομένα, για την απόκτηση γνώσης σχετικά με την συμπεριφορά του επισκέπτη. Οι αναφορές που βασίζονται πάνω σ’ αυτόν τον τύπο ανάλυσης μπορούν να περιέχουν πληροφορίες για τις συχνότερα προσπελαζόμενες ιστοσελίδες, για το μέσο χρόνο προβολής μιας σελίδας, για το μέσο μήκος του “μονοπατιού” προς ένα site, τα συνηθισμένα σημεία εισόδου και εξόδου και άλλες ολοκληρωμένες μετρήσεις.

Σχήμα 18: Ένα ολοκληρωμένο πλαίσιο για ανάλυση Χρήσης Διαδικτύου Το μειονέκτημα αυτού του τύπου ανάλυσης είναι η ανικανότητα να ψάξει πιο «βαθιά» στα δεδομένα ή να βρει κρυμμένα πρότυπα ή σχέσεις. Εξαιρώντας το μειονέκτημα αυτό, η τελική γνώση μπορεί πιθανός να αποδειχτεί χρήσιμη για την αναβάθμιση της απόδοσης του συστήματος, και την παροχή υποστήριξης αποφάσεων μάρκετινγκ. Οι αναφορές αυτές δίνουν μία πρώτη ματιά, για το πώς ένα site χρησιμοποιείται και απαιτούν ελάχιστο χώρο δίσκου ή επεξεργαστική ισχύ. Επιπλέον, τα τελευταία χρόνια, πολλά εμπορικά προϊόντα για την ανάλυση log μας παρέχουν μια ποικιλία εργαλείων εξόρυξης

Page 88: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 88

δεδομένων για την ανακάλυψη βαθύτερων σχέσεων και κρυφών προτύπων στα δεδομένα χρήσης. Ένας άλλος τρόπος ανάλυσης, των ολοκληρωμένων δεδομένων χρήσης είναι το OLAP, (On Line Analytical Processing). Το OLAP μας παρέχει μία πιο ολοκληρωμένη δομή ανάλυσης με μεγαλύτερο βαθμό ελαστικότητας. Όπως φαίνεται και στο σχήμα 6, η πηγή δεδομένων για μία OLAP ανάλυση είναι μία πολυδιάστατη αποθήκη δεδομένων, όπου ενοποιούνται η χρήση, τα περιεχόμενα και τα δεδομένα του ηλεκτρονικού εμπορίου σε διαφορετικά επίπεδα αθροίσματος για κάθε διάσταση. Τα εργαλεία OLAP επιτρέπουν αλλαγές στις συναθροίσεις των επιπέδων μαζί με κάθε διάσταση στην πορεία της ανάλυσης. Όντως, τα server log data, μπορούν να αποθηκευτούν σε μία πολυδιάστατη μορφή δεδομένων για ανάλυση OLAP [Zaiane et al., 1998].

Οι διαστάσεις αναλύσεων σε μία τέτοια δομή μπορεί να βασιστεί σε διάφορα πεδία διαθέσιμα σε log αρχεία και μπορεί να περιέχει χρονική διάρκεια, domain, απαιτούμενους πόρους, πράκτορες χρηστών, αναφορές κ.ο.κ. Αυτό επιτρέπει αυτού του τύπου την ανάλυση να εκτελεστεί, για παράδειγμα, σε τμήματα ενός log αρχείου που αναφέρεται σε συγκεκριμένα χρονικά διαστήματα ή σε υψηλά επίπεδα αφαίρεσης στο δομικό μονοπάτι URL. Η ολοκλήρωση δεδομένων ηλεκτρονικού εμπορίου σε μία αποθήκη μπορεί να εμπλουτίσει τις δυνατότητες των εργαλείων OLAP, για την αποκόμιση σημαντικών μετρικών επιχειρηματικών πληροφοριών.

Τα εργαλεία OLAP δεν μπορούν από μόνα τους, να ανακαλύψουν πρότυπα χρήσης στα δεδομένα. Αλλά έχουν την ικανότητα να βρίσκουν πρότυπα ή σχέσεις των δεδομένων που εξαρτώνται αποκλειστικά στην αποτελεσματικότητα των διάφορων ερωτημάτων OLAP που εκτελούνται στην αποθήκη δεδομένων. Παρ’ όλα αυτά, η εξαγωγή αυτής της διαδικασίας μπορούν να χρησιμοποιηθούν ως εισαγωγή για ένα πλήθος αλγορίθμων εξόρυξης δεδομένων.

6.6.4.2 Θέματα εξόρυξης δεδομένων για δεδομένα χρήσης διαδικτύου

6.6.4.3 Κανόνες ένωσης

Οι κανόνες ένωσης βρίσκουν τις σχέσεις μεταξύ αντικειμένων που βασίζονται στα πρότυπα των κοινών εμφανίσεων μεταξύ των συναλλαγών ( μη λαμβάνοντας υπ’ όψιν τα αντικείμενα που έχουν παραγγελθεί). Στην περίπτωση των συναλλαγών μέσω διαδικτύου, οι κανόνες ένωσης βρίσκουν σχέσεις μεταξύ των pageviews, βασιζόμενοι στα εξερευνητικά πρότυπα των χρηστών. Οι πιο κοινές προσεγγίσεις στην εξεύρεση συνεργασιών είναι βασισμένες στον αλγόριθμο Apriori [Agrawal and Srikant, 1994, 1995] ο οποίος ακολουθεί την μεθοδολογία της δημιουργίας και τεστ – αρίσματος. Αυτός ο αλγόριθμος βρίσκει ομάδες αντικειμένων ( pageviews που εμφανίζονται στο log προ-επεξεργασίας) που βρίσκονται, συχνά μαζί, σε πολλές συναλλαγές ( ικανοποίηση ενός χρήστη καθορίζοντας ελάχιστο όριο υποστήριξης).

Μία σημαντική ιδιότητα υποστήριξης του Apriori αλγόριθμου είναι η προς τα κάτω ολοκλήρωση: εάν ένα σύνολο αντικειμένων δεν ικανοποιεί τα minimum κριτήρια υποστήριξης, τότε κανένα που βρίσκεται από πάνω δεν θα τα υποστηρίζει. Η ιδιότητα αυτή είναι απαραίτητη για την ελαχιστοποίηση του χώρου αναζήτησης κατά τη διάρκεια κάθε επανάληψης του Αλγορίθμου Apriori. Οι κανόνες ένωσης που ικανοποιούν ένα ελάχιστο διάστημα εμπιστοσύνης, δημιουργούνται από τις συχνά εμφανιζόμενες ομάδες αντικειμένων.

Η εξεύρεση κανόνων ένωσης στις διαδικτυακές συναλλαγές δεδομένων έχει πολλά πλεονεκτήματα. Για παράδειγμα, ένας υψηλής εμπιστοσύνης κανόνας, μπορεί να παρέχει κάποιες ενδείξεις, που πρόκειται να επηρεάσουν κάποιο on line πρόγραμμα για τη

Page 89: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 89

δημιουργία μίας προωθητικής καμπάνιας. Επίσης εάν μία ιστοσελίδα δεν παρέχει συνδεσμολογία μεταξύ δύο σελίδων Α και Β, η εξεύρεση του κανόνα Α ένωση Β θα σήμαινε ότι παρέχεται ένας απευθείας υπερσύνδεσμος που στοχεύει να βρουν οι χρήστες την στοχευμένη πληροφορία.

Το αποτέλεσμα της εξόρυξης κανόνων ένωσης μπορεί να χρησιμοποιηθεί για την παραγωγή ενός μοντέλου συστάσεων ή ενός συστήματος προσωποποίησης.

Πρώτα απ’ όλα όλοι οι κανόνες ένωσης ανακαλύπτονται στις πληροφορίες αγοράς. Οι πληροφορίες για το ιστορικό αγορών των πελατών έπειτα ταιριάζονται με το αριστερό μέρος του κανόνα ώστε να βρεθούν όλοι οι κανόνες που υποστηρίζονται από ένα χρήστη. Όλα τα αντικείμενα της δεξιάς πλευράς απ’ τους υποστηριζόμενους κανόνες κατατάσσονται με βάση την εμπιστοσύνη και τα πρώτα Ν υψηλότερα σε βαθμολογία αντικείμενα που επιλέγονται ως μία προτεινόμενη ομάδα – σετ. Ένα πρόβλημα των συστημάτων σύστασης βασιζόμενα στους κανόνες ένωσης είναι ότι το σύστημα δεν μπορεί να δώσει κάποια σύσταση όταν η βάση δεδομένων δεν έχει πολλά στοιχεία ή γενικότερα είναι αραιή.

Ένα πρόβλημα που προκύπτει χρησιμοποιώντας ένα κοινό ελάχιστο υποστηριζόμενο όριο στην εξόρυξη συνεργατικών κανόνων είναι ότι τα πρότυπα που ανακαλύπτονται δεν περιλαμβάνουν “σπάνια” και παράλληλα σημαντικά αντικείμενα, που μπορεί να μην λαμβάνουν χώρα συχνά στα δεδομένα συναλλαγών. Αυτό είναι ιδιαίτερα σημαντικό στις δοσοληψίες με δεδομένα χρήσης ιστού, όπου υπάρχουν πολλές περιπτώσεις με αναφορές σε πιο εξειδικευμένες σελίδες ή σελίδων που περιλαμβάνουν κυρίως προϊόντα. Αυτές οι σελίδες λοιπόν, δεν εκτελούνται τόσο συχνά όσο αυτές που είναι προσανατολισμένες στο επίπεδο εξερεύνησης. Έτσι για πιο αποτελεσματικό Web Personalization, είναι σημαντικό να συλλαμβάνουν πρότυπα και να εξάγουν προτάσεις που περιέχουν τα αντικείμενα αυτά.

6.6.4.4 Διαδοχικά Πρότυπα και Πρότυπα Εξερεύνησης

Τα σειριακά πρότυπα στα δεδομένα χρήσης διαδικτύου συλλαμβάνουν συνήθως τα μονοπάτια σε μία ιστοσελίδα όπου έχουν επισκεφθεί πιο συχνά οι χρήστες. Τα διαδοχικά πρότυπα είναι αυτές οι ακολουθίες αντικειμένων που εκτελούνται πιο συχνά σε μία ιδιαίτερα μεγάλη ποσότητα συναλλαγών.

6.6.4.5 Προσεγγίσεις Ομαδοποίησης ( Μέθοδοι Ομαδοποίησης)

Σε γενικά πλαίσια, υπάρχουν δύο τύποι ομαδοποίησης που μπορούν να εκτελεστούν σε μία συναλλαγή δεδομένων χρήσης: ομαδοποίηση των συναλλαγών (ή των χρηστών) μεταξύ τους, ή ομαδοποίηση των pageviews. Κάθε μία απ’ αυτές τις προσεγγίσεις είναι χρήσιμες σε διαφορετικές εφαρμογές και κάθε προσέγγιση μπορεί να χρησιμοποιηθεί ξεχωριστά για Web Personalization. Υπάρχει σημαντικός φόρτος εργασίας στις εφαρμογές ομαδοποίησης στο Web Usage Mining, στο emarketing, στο personalization και στα συνεργατικά φίλτρα.

Page 90: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 90

Για παράδειγμα, ένας αλγόριθμος ο οποίος ονομάζεται PageGather, χρησιμοποιείται για να ανακαλύπτει σημαντικά σύνολα σελίδων βασισμένα σε πρότυπα εισόδου χρηστών. [Perkowitz and Etzioni, 1998].

Ο αλγόριθμος χρησιμοποιεί ως βάση του ομαδοποίηση σελίδων βασισμένες στην τεχνική ομαδοποίησης Clique ( Complete Click). Οι συνακόλουθες ομάδες χρησιμοποιούνται για να συνθέτονται αυτόματα εναλλακτικές στατικές σελίδες ευρετηρίου για ένα site, όπου η κάθε μία μπορεί να αντιπροσωπεύει πιθανά ενδιαφέροντα ενός τμήματος χρηστών. Η ομαδοποίηση με βάση τις εγγραφές ψηφοφορίας των χρηστών, έχει επίσης χρησιμοποιηθεί, ως προγενέστερο βήμα στο συνεργατικό φιλτράρισμα ώστε να διορθωθούν τα αυξομειώμενα προβλήματα απ’ τον αλγόριθμο k-nearest neighbor. [O’Conner and Herlocker, 1999].

Και η ομαδοποίηση συναλλαγών αλλά και η ομαδοποίηση των pageview έχουν χρησιμοποιηθεί ως ένα ακέραιο μέρος στη δομή του web personalization βασιζόμενο στο web usage mining [Mobasher et al., 2002b] . Δίνοντας την χαρτογράφηση των συναλλαγών ενός χρήστη σε ένα πολυδιάστατο χώρο όπως αυτός των δiανυσματικών pageviews οι συνηθισμένοι αλγόριθμοι ομαδοποίησης όπως αυτός του k-means ορίζουν το χώρο αυτό σε ομάδες συναλλαγών που η μια είναι κοντά στην άλλη βασιζόμενη στο μέτρημα της απόστασης ή στην ομοιότητα μεταξύ των διανυσμάτων. Η ομαδοποίηση των συναλλαγών που εξασφαλίζονται με αυτό τον τρόπο μπορεί να αντιπροσωπεύουν τμήματα χρηστών ή επισκεπτών βασιζόμενα στην εξερευνητική τους συμπεριφορά ή άλλες ιδιότητες που έχουν βρεθεί στο αρχείο συναλλαγών. Παρ όλα αυτά η ομαδοποίηση συναλλαγών από μόνη της δεν είναι μια αποτελεσματική έννοια για βρεθεί μια συνολική εικόνα των προτύπων των συνιθησμένων χρηστών. Κάθε ομαδοποιημένη συναλλαγή πιθανών να περιέχει χιλιάδες συναλλαγές ενός χρήστη συμπεριλαμβάνοντας εκατοντάδες αναφορές σε pageview.

Ο βασικός σκοπός στην ομαδοποίηση συναλλαγών χρηστών είναι να παρέχει την ικανότητα να αναλύεται κάθε τμήμα ώστε να αποκομίζεται business intelligence ή να χρησιμοποιείται για θέματα όπως αυτό του personalization. Μια άμεση προσέγγιση στη δημιουργία μιας συνολικής προβολής για κάθε ομαδοποίηση είναι ο υπολογισμός του διανύσματος της κάθε ομαδοποίησης. Το μέγεθος τις τιμής για κάθε pageview υπολογίζεται βρίσκοντας το λόγο του αθροίσματος των pageview επί των συναλλαγών προς των αριθμών των συναλλαγών σε μια ομαδοποίηση.

Page 91: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 91

6.6.5 Χρησιμοποιώντας Τα Πρότυπα Που Έχουν Ανακαλυθφεί Για Personalization

Όπως έχει αναφερθεί ο σκοπός μιας μηχανής συστάσεων είναι να ταιριάξει την

ενεργή σύνοδο ενός χρήστη με τα συνολικά προφίλ που έχουν βρεθεί κατά τη διάρκεια του web usage mining και να προτείνει ένα σύνολο αντικειμένων στο χρήστη. Αναφέρουμε το σύνολο των προτεινόμενων αντικειμένων (αντιπροσωπεύοντας από pageview) ως ένα σύνολο συστάσεων. Παρακάτω παρουσιάζονται μερικοί αποτελεσματικοί αλγόριθμοι συστάσεων λίγο αναλυτικότερα βασισμένοι στην ομαδοποίηση, στην εξόρυξη κανόνων ένωσης, στα σειριακά πρότυπα ή στην εύρεση συνεχόμενων σειριακών προτύπων. Στις τρεις τελευταίες περιπτώσεις θεωρούμε αποτελεσματικό και τη βαθμωτή δομή των δεδομένων για την αποθήκευση συχνών συνόλων αντικειμένων και τα σειριακά πρότυπα ως έναν αλγόριθμο παραγωγής συστάσεων που χρησιμοποιεί αυτή τη δομή των δεδομένων ώστε να παράγει απ’ ευθείας συστάσεις σε πραγματικό χρόνο (χωρίς τη παραγωγή του κανόνα apriori).

Γενικώς ένα μέρος της δραστηριότητας ενός συγκεκριμένου χρήστη χρησιμοποιείται για τη διαδικασία παραγωγής σύστασης. Η συντήρηση ενός αρκετά μεγάλου ιστορικού είναι απαραίτητη διότι οι περισσότεροι χρήστες περιηγούνται σε διάφορα μονοπάτια οδηγώντας έτσι στη παραγωγή ανεξάρτητων κομματιών πληροφορίας κατά τη διάρκεια μιας συνόδου. Στις περισσότερες περιπτώσεις αυτές υποσύνοδοι έχουν ένα μήκος όχι μεγαλύτερο των τριών ή τεσσάρων αναφορών. Σε μια τέτοια περίπτωση δεν θα ήταν καλό να χρησιμοποιούνται αναφορές ενός χρήστη φτιαγμένες από προηγούμενη υποσύνοδο ώστε να δημιουργήσουμε συστάσεις κατά τη διάρκεια της τρέχουσας υποσυνόδου. Μπορούμε να βρούμε το βάθος του ιστορικού του χρήστη μέσω ενός ολιστικού παραθύρου από την τρέχουσα σύνοδο. Το ολιστικό παράθυρο μεγέθους Ν μέσω της ενεργής συνόδου επιτρέπει μόνο τις τελευταίες Ν επισκεπτόμενες σελίδες να επηρεάσουν την προτεινόμενη τιμή αντικειμένων του συνόλου συστάσεων.

Για παράδειγμα εάν η τρέχων σύνοδος (με μέγεθος παραθύρου 3) είναι A,B,C, και ο χρήστης προσπελάσει το pageview D, τότε η νέα ενεργή σύνοδος γίνεται B,C,D. Το ολιστικό αυτό παράθυρο καλείτε ως παράθυρο ενεργής συνόδου του χρήστη. Τα δομικά χαρακτηριστικά του site ή η γνώση του προηγούμενου domain μπορούν να χρησιμοποιηθούν για να συνδυαστεί πρόσθετη μέτρηση της σπουδαιότητας για κάθε pageview στην ενεργή σύνοδο του χρήστη. Για παράδειγμα ο ιδιοκτήτης του site μπορεί να εύχεται να δει ο χρήστης συγκεκριμένο τύπο σελίδων (π.χ. περιεχόμενο vs περιήγηση)ή κατηγορίες προϊόντων όπου έχουν μεγαλύτερη σπουδαιότητα στους ορισμούς των τιμών συστάσεων. Σ’αυτή τη περίπτωση τα βάρη (οι δείκτες) σπουδαιότητας μπορούν να καθοριστούν ως μέρη της γνώσης του domain.

6.6.5.1 Η Προσέγγιση kNN

Το φιλτράρισμα στο οποίο βασίζεται η μέθοδος kNN(k-Nearest-Neighbor) αποσκοπεί στην σύγκριση των εγγράφων των δραστηριοτήτων ενός χρήστη με τα ιστορικά έγγραφα άλλων χρηστών, έτσι ώστε να βρεθούν οι πρώτοι k χρήστες που έχουν κοινά ενδιαφέροντα. Η χαρτογράφηση ενός εγγράφου κάποιου επισκέπτη στο γειτονικό του σύστημα μπορεί να βασιστεί στην ομοιότητα των αποτιμήσεων των αντικειμένων, στην πρόσβαση των σελίδων όμοιου περιεχομένου, ή την αγορά ομοίων αντικειμένων. Τότε το αναγνωρισμένο αυτό γειτονικό σύστημα χρησιμοποιείτε για την εισήγηση αντικειμένων τα οποία δεν έχουν ακόμα προσπελασθούν ή αγορασθούν από κάποιο ενεργό χρήστη. Όποτε υπάρχουν δύο αρχικές φάσεις στο φιλτράρισμα αυτό: α) η φάση διάπλασης του γειτονικού συστήματος και β) η φάση της εισήγησης αντικειμένων

Page 92: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 92

6.6.5.2 Χρησιμοποιώντας ομαδοποιήσεις στην προσωποποίηση

Όπως αναφέρθηκε σ’αυτήν την παρουσίαση, από κάθε ομάδα συναλλαγών μπορούμε να αντλήσουμε και να συναθροίσουμε τα προφίλ χρήσης με τον υπολογισμό των διανυσμάτων centroid της συγκεκριμένης ομάδας. Αυτή η μέθοδος ονομάζεται PACT (Profile Aggregation Based on Clustering Transactions) [Mobasher et al, 2002b]. Γενικά ως PACT μπορεί να χαρακτηρισθεί ένας αριθμός παραγόντων για τον καθορισμό της βαρύτητας των αντικειμένων από κάθε προφίλ, και για τον καθορισμό των βαθμών των εισηγήσεων. Αυτοί οι επιπρόσθετοι παράγοντες μπορεί να εμπεριέχουν την απόσταση της διασύνδεσης των pageviews στην τωρινή τοποθεσία του χρήστη μέσα στο site ή το επίπεδο του προφίλ όσον αφορά την σημαντικότητά του. Ωστόσο, για να μπορεί κάποιος να συγκρίνει διαρκώς την αποτελεσματικότητα των μεθόδων που βασίζονται σε αυτές της ομαδοποιήσεις, όπως το kNN, τότε περιορίζουμε την βαρύτητα των αντικειμένων έτσι ώστε να αποτελέσουν το πιο ασήμαντο χαρακτηριστικό των τιμών της ομάδας των συναλλαγών των centroid. Σε αυτή τη περίπτωση η μόνη διαφορά μεταξύ της PACT μεθόδου και της kNN είναι ότι ανακαλύπτουμε ομάδες συναλλαγών ανεξάρτητα από μια συγκεκριμένη σύνοδο του χρήστη.

6.6.5.3 Χρησιμοποιώντας τους κανόνες ένωσης για Personalization

Η μηχανή συστάσεων που βασίζεται στους κανόνες ένωσης ταιριάζει την τρέχουσα σύνοδο του χρήστη με συχνά σύνολα αντικειμένων ώστε να βρει υποψήφια pageviews για σύσταση.

Δίνοντας ένα ενεργό παράθυρο συνόδου W και ένα σύνολο συχνά εμφανιζόμενων αντικειμένων, θεωρούμε ότι όλα τα συχνά εμφανιζόμενα σύνολα αντικειμένων μεγέθους |W| + 1, περιέχουν το τρέχον παράθυρο συνόδου. Η προτεινόμενη τιμή για κάθε υποψήφιο pageview βασίζεται στη σιγουριά του αντίστοιχου κανόνα ένωσης του οποίου το συμπέρασμα είναι μοναδικό και περιέχεται στο προτεινόμενο pageview.

6.6.5.4 Χρησιμοποιώντας Διαδοχικά Πρότυπα για Personalization

Ο προτεινόμενος αλγόριθμος που βασίζεται στους κανόνες ένωσης μπορεί να υιοθετηθεί ώστε να δουλέψει και με τα διαδοχικά πρότυπα (ή αντίστοιχα με του πλησιέστεου γείτονα). Σ’ αυτήν την περίπτωση, θα εστιάσουμε στις συχνές αλληλουχίες (γειτονικές) μεγέθους |w| + 1 των οποίων το πρόθεμα περιέχει μία ενεργή σύνοδο W. Τα υποψήφια pageviews που θα προταθούν είναι τα τελευταία αντικείμενα σ’ όλες τις παρόμοιες αλληλουχίες. Οι προτεινόμενες τιμές είναι βασισμένες στην αξιοπιστία των προτύπων. Εάν όντως η αξιοπιστία αυτή, καλύπτει τα απαιτούμενα όρια, τότε τα υποψήφια pageviews, προστίθενται στο προτεινόμενο σύνολο.

Page 93: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 93

ΚΕΦΑΛΑΙΟ 7

Page 94: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 94

7.1 Privacy Issues

Οι ηλεκτρονικές ιστοσελίδες αγοραπωλησίας συνεχώς αυξάνουν την εισαγωγή προσωποποιημένων χαρακτηριστικών με σκοπό τη δημιουργία και διατήρηση των σχέσεων με τους πελάτες καθώς και την αύξηση του αριθμού των αγορών από τον κάθε πελάτη.

Καθώς η προσεκτική εξέταση δεδομένων αλλά και η εμπειρία απέδειξαν ότι πολλά άτομα εκτιμούν την προσωποποίηση και τη βρίσκουν χρήσιμη , η προσωποποίηση ακόμα αυξάνει την έκταση θεμάτων προσωπικών δεδομένων και την δυσφορία του χρηστή για την συναγωγή ηλεκτρονικών πληροφοριών που αφορούν τους ίδιους βασιζόμενες στις αγορές τους μέχρι ανησυχίες για τους συναδέλφους τους ,αναγνώριση κλεφτών, ή την δυνατότητα της κυβέρνησης να έχει πρόσβαση σε προσωποποιημένα προφίλ. Σε ορισμένες περιπτώσεις οι χρήστες θα παρέχουν προσωπικά δεδομένα σε ιστοσελίδες προκειμένου να λάβουνε προσωπικές υπηρεσίες ,παρόλο τα θέματα περί προσωπικών δεδομένων: σε άλλες πάλι οι χρήστες μπορεί να αποφύγουν τις ιστοσελίδες λόγω αυτών των θεμάτων. Αυτή η εργασία σκιαγραφεί τους κινδύνους περί πνευματικών δικαιωμάτων που σχετίζονται με την προσωποποίηση και περιγράφει έναν αριθμό μεθόδων για το σύστημα σχεδιασμού προσωποποίησης το οποίο μπορεί να μειώσει αυτούς τους κινδύνους. Στην εργασία επίσης αναφέρεται μια περιγραφή των αρχών για σωστή διαχείριση των πληροφοριών και συζητά πως μπορούν να εφαρμοστούν στο σχεδιασμό του συστήματος προσωποποίησης.

Ξεκινώντας να πούμε ότι, πολλά γενικά είδη συστημάτων προσωποποίησης θεωρείται ότι διαφέρουν σε τέσσερεις τομείς: Άμεση εναντίον έμμεση συλλογή δεδομένων

• Άμεση συλλογή δεδομένων. Η προσωποποίηση βασίζεται στη δημογραφία, τις προτιμήσεις, τα ποσοστά η άλλες πληροφορίες που παρέχει άμεσα ο χρήστης .Τυπικά τα συστήματα παροχής συστάσεων και προσωποποίησης απαιτούν από τους χρήστες να βαθμολογήσουν έναν αριθμό από άρθρα ώστε να λάβουν συστάσεις για αλλά άρθρα τα οποία μπορεί να τους ενδιαφέρουν. Άλλα συστήματα επιτρέπουν στους χρηστές να δημιουργήσουν προσωπικές σελίδες η να προσαρμόσουν τη δική τους άποψη για κάποια ιστοσελίδα βασισμένη στις προσωπικές τους προτιμήσεις η στη δημογραφία.

• Έμμεση συλλογή δεδομένων προσωποποίηση βασίζετε σε πληροφορίες που

αποκτώνται έμμεσα για έναν χρήστη. Για παράδειγμα, οι ερωτήσεις ερευνάς ενός χρηστή, ιστορικό αγοράς ,η ιστορικό εξεύρεσης υλικών υπολογιστή μπορεί να χρησιμοποιηθούν για να εξάγουν συμπεράσματα για τα ενδιαφέροντα και τις προτιμήσεις του χρήστη.

Διάρκεια

• Προσωποποίηση εστιασμένη σε έργα ή συνεδριάσεις (συνόδους). Ένας απλοποιημένος τρόπος παροχής εστιασμένης σε έργα προσωποποίησης είναι να τοποθετηθούν διαφημίσεις σε σελίδες όπου είναι περισσότερο σχετικές – για παράδειγμα ,διαφημίζοντας τα pay-per view ματς πυγμαχίας στον αθλητικό τομέα μιας σελίδας ειδήσεων και μαγειρική στον τομέα σπιτιού και κήπου. Ένας πιο σοφιστικέ τρόπος παροχής εστιασμένης σε έργα προσωποποίησης είναι να γίνουν προτάσεις βασιζόμενες σε δραστηριότητες που έκανε κάποιος χρήστης ενώ αναλάμβανε τα έργα. Για παράδειγμα ,αν ένας χρήστης τοποθετήσει ένα ζευγάρι γυναικείων παπουτσιών τρεξίματος στο καλάθι αγορών του, η ιστοσελίδα θα

Page 95: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 95

πρότεινε να αγοράσει και αθλητικές κάλτσες ,φόρμα γυμναστικής ή κάποιο αθλητικό σουτιέν. Αυτού του είδους η προσωποποίηση βασίζεται σε πληροφορίες παρερχόμενες άμεσα η έμμεσα από τον χρηστή κατά την διάρκεια της ισχύουσας συνόδου ή καθώς ολοκλήρωνε το τρέχον έργο.

• Προσωποποίηση βασισμένη σε προφίλ. Πολλά συστήματα προσωποποίησης

αναπτύσσουν προφίλ χρηστών και προσθέτουν άμεσα παρερχόμενες η έμμεσα πληροφορίες σχετικά με τους χρηστές κάθε φορά που αυτοί επιστρέφουν στη σελίδα.

Εμπλοκή χρήστη

• Προσωποποίηση που γίνεται απ’ το χρήστη. Μερικές σελίδες προσφέρουν στους χρηστές την δυνατότητα επιλογής προσαρμογής όπως όταν κάποιος επιλέγει stock εισιτήρια να του εμφανίζει και άλλα stock παρόμοιου ενδιαφέροντος, ενημέρωση για τον καιρό της περιοχής του χρήστη, ή ειδήσεις πάνω σε θέματα τα οποία διάλεξε ο χρήστης. Οι χρήστες μπορούν ακόμα να διαλέξουν την σελίδα καθορισμού πληροφοριών ή τον αριθμό των θεμάτων που θέλουν να προβάλλονται , ή μπορούν να δώσουν πληροφορίες σχετικά με την προβολή τους και για το περιορισμένο bandwidth και να ζητήσουν να αποκτήσουν κατά συνέπεια μια σελίδα αποτελεσματική.

• Προσωποποίηση εκτελούμενη απ’ το σύστημα. Μερικές σελίδες προσπαθούν να

προσωποποιήσουν το περιεχόμενο για κάθε χρήστη ,ακόμα και αν οι χρήστες δεν απαιτούν προσαρμοσμένα χαρακτηριστικά και δεν απαιτούν άμεσα Προσωποποίηση. Σε Μερικές περιπτώσεις ,οι σελίδες παρέχουν έναν τρόπο για τους χρήστες να μη διαλέξουν την Προσωποποίηση.

Εμπιστοσύνη στις προβλέψεις

• Προσωποποίηση βασισμένη στις προβλέψεις. Μερικές σελίδες χρησιμοποιούν τις άμεσες ή έμμεσες βαθμολογήσεις των χρηστών προκειμένου να δημιουργήσουν το προφίλ του χρήστη το οποίο μπορεί να συγκριθεί με το προφίλ άλλων χρηστών. Όταν ανακαλύπτονται χρήστες με κοινά προφίλ ,το σύστημα προβλέπει ότι θα έχουν κοινές προτιμήσεις και κάνει συστάσεις σε ένα χρήστη βασισμένες στις δηλωμένες προτιμήσεις των άλλων. Τέτοια συστήματα συχνά αναφέρονται ως συστήματα συστάσεων η συστήματα συνεργατικού φιλτραρίσματος. Έτσι, για παράδειγμα, εάν η Jane και η Sue βαθμολογήσουν με τον ίδιο τροπο10 βιβλία, το σύστημα συστάσεων θα προτείνει στην Jane 2 αλλά βιβλία που δεν βαθμολόγησε καθόλου αλλά είχε βαθμολογήσει πολύ η Sue. Τα προτεινόμενα βιβλία μπορεί να μην έχουν αναγκαστικά τα ίδια θέματα με αυτά που η Jane βαθμολόγησε.

• Προσωποποίηση βασισμένη στο περιεχόμενο.

Κάποιες σελίδες χρησιμοποιούν της συγκεκριμένες απαιτήσεις η άλλες δραστηριότητες

κάποιου χρήστη προκειμένου να προκαλέσουν αυτόματη Προσωποποίηση. Για παραδειγμα,αν ένας χρήστης αγοράσει ένα βιβλίο για θέματα προσωπικών δεδομένων στο Internet,η σελίδα μπορεί να προτείνει άλλα, παρόμοια Σε αυτή την περίπτωση η σελίδα δεν χρησιμοποιεί βαθμολογίες για να προβλέψει αλλά είδη βιβλίων που ο χρήστης μπορεί να ήθελε να αγοράσει, αλλά απλά προσφέρει στον χρήστη επιπλέον βιβλία στα ίδια θέματα όπως το βιβλίο που έχει ήδη αγοράσει.

Page 96: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 96

Παραδείγματα από όλα αυτά τα είδη προσωποποίησης είναι αμέσως φανερά σε ηλεκτρονικές ιστοσελίδες αγοραπωλησίας. Για παράδειγμα ,πρόσφατα βρέθηκαν 23 ανεξάρτητες αιτήσεις προσωποποίησης στο Amazon.com. Από τον Ιούνιο του 2003 το Amazon.com web site βρέθηκε να χρησιμοποιεί όλα τα είδη προσωποποίησης που αναφέρονται σε αυτήν εδώ την εργασία. Αυτή η σελίδα επιτρέπει στους χρήστες να δώσουν σαφές βαθμολογίες για βιβλία και αλλά προϊόντα, τα οποία χρησιμοποιεί για να κάνει συστάσεις για αλλά θέματα στον χρήστη. Χρησιμοποιεί ακόμα πληροφορίες για παλαιότερες αγορές και τι αντικείμενα είδε ο χρήστης άμεσα με το οποίο θα κάνει συστάσεις. Το Amazon παρέχει προσωποποίηση βασισμένη σε έργα δημιουργώντας έναν σύνδεσμο με μια σελίδα αντικειμένων που έχει πρόσφατα παρατηρήσει ο χρήστης με προτάσεις για σχετικά αντικείμενα που ο χρήστης μπορεί να ενδιαφερθεί. Το Amazon παρέχει επίσης Προσωποποίηση βασισμένη στο προφίλ προσφέροντας προτάσεις στον χρήστη βασισμένες σε όλες τις αγορές του και το ιστορικό συστάσεων. Το μεγαλύτερο μέρος της προσωποποίησης του Amazon γίνεται αυτόματα από το σύστημα.

Παρόλα αυτά οι χρήστες μπορούν να επιμεληθούν την ρύθμιση προσωποποίησης και να αρνηθούν κάποια είδη προσωποποίησης ή να ζητήσουν συγκεκριμένα αντικείμενα να μην θεωρηθούν ως μέρος του προφίλ τους. Ο χρήστης μπορεί να βαθμολογήσει αντικείμενα αλλάζοντας τα με σκοπό να τα θεωρήσει ως μέρος του προφίλ του. Μπορεί ακόμα να απαιτήσει αυτή η πληροφορία πληρωμής να βρίσκεται αποθηκεμένη ώστε να επιτρέπει πιο άνετη παραγγελιά μετέπειτα. Το Amazon κάνει προβλέψιμες συστάσεις στους χρήστες βασισμένες σε μια ανάλυση της βαθμολογίας και των αγορών του χρήστη συγκρινόμενες με άλλων χρηστών-συμπεριλαμβανομένου του ‘΄πελατες που αγόρασαν αυτό το βιβλίο αγόρασαν επίσης’’ χαρακτηριστικού. Το Amazon παρέχει ακόμα στους χρήστες λίστες αντικειμένων της ίδιας κατηγορίας με τα αντικείμενα που ζήτησαν.

7.2 Κίνδυνοι Προστασίας Προσωπικών Δεδομένων Η προσωποποίηση ηλεκτρονικής αγοραπωλησίας προκάλεσε έναν αριθμό κινδύνων

σε θέματα προσωπικών δεδομένων του χρήστη. Διάφοροι από αυτούς τους κινδύνους αναφέρονται παρακάτω. Ένας από τους πρώτους κινδύνους περί προσωπικών δεδομένων που ο χρήστης Internet αναφέρει είναι το εκούσιο μάρκετινγκ. Σαφεστατα, οι συνέπειες αυτού του είδους μάρκετινγκ είναι λιγότερο σοβαρές από τις πιθανές συνέπειες άλλων παρουσιαζόμενων κινδύνων.

Όμως ,ο κίνδυνος αυτός ενδιαφέρει αρκετά τους χρήστες ,και μια έντονη επιθυμία να μη λάβουν ανεπιθύμητες επικοινωνίες αγοράς μπορεί να είναι ένας λόγος στις αποφάσεις κάποιων χρηστών να μην κάνουν χρήση του ηλεκτρονικού εμπορίου. Οι χρήστες ανησυχούν μήπως οι πληροφορίες που παρέχουν για την χρήση της ηλεκτρονικού εμπορίου μπορεί να χρησιμοποιηθούν για να τους σταλούν στοχευμένες διαφημίσεις, η να πουληθούν σε άλλες εταιρίες που μπορεί να τους διαφημίζουν. Συχνά φοβούνται ότι όσα περισσότερα γνωρίζει για αυτούς μια εταιρία, τόσο μεγαλύτερο ενδιαφέρον θα δείξει αυτή στο να τους προτείνει διάφορα πράγματα.

Πολλοί χρηστές ανησυχούν ακόμη και για κάποιον υπολογιστή που ‘βγάζει συμπεράσματα για αυτούς’’. Δεν αισθάνονται άνετα με την ιδέα ότι κάποιος υπολογιστής μπορεί να κάνει προβλέψεις για τις συνήθειες και τα ενδιαφέροντα τους. Σε ορισμένες περιπτώσεις, κάποια άτομα εκνευρίζονται καθώς οι προβλέψεις κάποιου υπολογιστή μπορεί να είναι εντελώς εκτός και φοβούνται σαν αποτέλεσμα μήπως κάποιος βρει και σχηματίσει λανθασμένα συμπεράσματα. Σε άλλες περιπτώσεις, ορισμένα άτομα ανησυχούν γιατί οι προβλέψεις των υπολογιστών είναι αδέξια ακριβής, και ίσως αποκαλύψουν πληροφορίες που πιστεύουν ότι άλλοι άνθρωποι δεν γνώριζαν για αυτούς. Κάποιοι χρηστές του ψηφιακού video recorder Tivo έχουν ενθουσιαστεί με τις επιλογές στην τηλεόραση που τους κάνει για

Page 97: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 97

αυτούς βασισμένο στην ιστορία της τηλεόρασης, και κάποιοι ούτε καν πιστεύουν ότι το TIVo τους κάνει αναφορές για τόσο προσωπικά χαρακτηρίστηκα όπως τη σεξουαλική τους προτίμηση. Άσχετα με την ακρίβεια των αναφορών και προτιμήσεων ενός υπολογιστή, πολλοί απλά δεν είναι άνετοι με την ιδέα ότι κάποιες από τις δραστηριότητες τους παρακολουθούνται’’. Επιπλέον ανησυχίες εμφανίζονται όταν υπάρχει κάποιο μπέρδεμα ανάμεσα στις απόψεις των χρηστών για θέματα προσωπικών δεδομένων και τα είδη της συλλογής δεδομένων και χρήσης που τελικά πραγματοποιούνται.

Ορισμένοι ανησυχούν ακόμη μήπως οι εταιρίες θα τους φακελώσουν με σκοπό να διευκολύνουν την διάκριση των τιμών. Ενώ οι οικονομολόγοι τονίζουν ότι οι διάκριση τιμών πολύ συχνά μπορεί να ωφελήσει και τις επιχειρήσεις και τους καταναλωτές η αντίδραση των καταναλωτών στην διάκριση των τιμών είναι συνήθως αρκετά αρνητική. Επιπλέον η αποτελεσματική διάκριση τιμών συχνά οδηγεί σε μειώσεις όσο αναφορά τον αριθμό των προσωπικών πληροφοριών που σχετίζονται με την συναλλαγή. Ορισμένοι ανησυχούν όχι μονό με την πιθανότητα μήπως χρεωθούν περισσότερο εξαιτίας των πληροφοριών για το προφίλ τους,αλλα και για το γεγονός ότι μπορεί να έχουν διαφορετική αντιμετώπιση σε σχέση με άλλους ανθρώπους.

Ένας άλλος κίνδυνος περί προσωπικών δεδομένων που σχετίζεται με την προσωποποίηση είναι ότι οι χρήστες μπορούν χωρίς δημοσιοποίηση να αποκαλύψουν προσωπικές πληροφορίες σε άλλους χρήστες του υπολογιστή τους. Όταν τα cookies χρησιμοποιούνται για επιβεβαίωση εγκυρότητας η πρόσβαση στο προφίλ κάποιου χρήστη, οποιοσδήποτε χρησιμοποιεί έναν υπολογιστή μπορεί να έχει πρόσβαση σε πληροφορίες για το προφίλ του χρήστη. Αυτό οδηγεί σε ανησυχίες όπως την περίπτωση που κάποια μέλη της οικογένειας μπορούν να μάθουν για δώρα που έχουν παραγγελθεί για τους ίδιους και κάποιοι συνάδελφοι που μπορούν να μαθαίνουν για προσωπικά ή θέματα υγείας κάποιων άλλων. Επιπλέον όταν τα προφίλ έχουν κώδικες ή «μυστικές» πληροφορίες.

7.3 Εφαρμογή Θεμιτών Πληροφοριών

7.3.1 Αρχές Εξάσκησης Διάφορες ρυθμίσεις αρχών έχουν αναπτυχθεί τις τελευταίες τρεις δεκαετίες για την

προστασία των ιδιωτικών θεμάτων όταν χρησιμοποιούνται προσωπικές πληροφορίες .Ο Οργανισμός Οικονομικής Συνεργασίας και Αρχών Ανάπτυξης (OECD)για την Προστασία των Ιδιωτικών Θεμάτων και την Διασυνοριακή Ροή Δεδομένων των Προσωπικών Δεδομένων είναι μια από της πιο γνωστές αρχές. Πολλές άλλες ρυθμίσεις νομοθεσιών και μερικοί νομοί ιδιωτικοποίησης βασίζονται σε αυτές τις αρχές .Οι οκτώ OECD αρχές παρέχουν ένα χρήσιμο πλαίσιο ανάλυσης ιδιωτικών θεμάτων, σχετικών με την προσωποποίηση του ηλεκτρονικού εμπορίου. Οι αρχές ερμηνεύονται εδώ και συζητούνται στο πλαίσιο της προσωποποίησης του ηλεκτρονικού εμπορίου. Σε αυτές τις αρχές ,ο όρος αντικείμενο δεδομένου αναφέρεται στο άτομο από το οποίο τα δεδομένα έχουν συναθροιστεί, και ο όρος ελεγκτής δεδομένου αναφέρεται στην οντότητα που ελέγχει τη συλλογή ,αποθήκευση και χρήση προσωπικών δεδομένων . Περιορισμός Συλλογής. Η συλλογή και χρήση δεδομένων πρέπει να είναι περιορισμένη .Στο πλαίσιο της προσωποποίησης του ηλεκτρονικού εμπορίου ,αυτό προβλέπει ότι τα συστήματα προσωποποίησης πρέπει να επιλέγουν μόνο τα δεδομένα που χρειάζονται ,και όχι κάθε πιθανό κομμάτι δεδομένου που μπορεί να θεωρήσουν ότι θα τους φανεί χρήσιμο στο μέλλον. Ποιότητα δεδομένου. Το δεδομένο πρέπει να χρησιμοποιείται μόνο σε περιπτώσεις για τις οποίες είναι σχετικό ,και πρέπει να είναι ακριβές ,πλήρη ,και έγκυρο. Στο πλαίσιο της προσωποποίησης ηλεκτρονικού εμπορίου, αυτό προβλέπει ότι θα πρέπει να σιγουρευτεί ότι το δεδομένο χρησιμοποιείται για σχετικούς λόγους (αυτό σημαίνει, μη χρησιμοποιείς δεδομένα για να κάνεις αναφορές που είναι άσχετες σε αυτά) ,άλλα και τα συστήματα

Page 98: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 98

προσωποποίησης πρέπει να παρέχουν την ικανότητα στα άτομα να ενημερώνουν και να διορθώνουν τις πληροφορίες στα προφίλ τους. Συγκεκριμενοποίηση της αιτίας. Οι ελεγκτές δεδομένων πρέπει να αναφέρουν από πριν πως θα χρησιμοποιήσουν τα δεδομένα ,και μετά να τα χρησιμοποιούν σύμφωνα με την αναφορά τους. Στο πλαίσιο της προσωποποίησης ηλεκτρονικού εμπορίου ,αυτό προβλέπει ότι οι χρήστες πρέπει να γνωρίζουν από πριν όταν ένα σύστημα συλλέγει δεδομένα που θα χρησιμοποιηθούν για προσωποποίηση (η για οποιοδήποτε άλλο λόγο) .Οι αρχές ιδιωτικοποίησης συχνά χρησιμοποιούνται για να εξηγήσουν πως οι ιστοσελίδες θα χρησιμοποιήσουν τα δεδομένα που συλλέξαν .Ωστόσο ,με το να δίνουν προσοχή σχετικά με την χρήση δεδομένων την στιγμή που αυτά συλλέγοντα ,οι σελίδες μπορούν πιο αποτελεσματικά να προκαλέσουν την προσοχή των χρηστών για αυτές τις πληροφορίες την πιο σχετική στιγμή. Περιορισμός χρήσης. Τα δεδομένα δεν πρέπει να χρησιμοποιούνται η να αποκαλύπτονται για λόγους άσχετους σύμφωνα με την αρχή καθορισμού σκοπού, εκτός αν υπάρχει η συγκατάθεση του αντικειμένου δεδομένων ή όπως το προβλέπει ο νόμος .Στο πλαίσιο της προσωποποίησης του ηλεκτρονικού εμπορίου ,αυτό προβλέπει ότι τα δεδομένα που συλλεχθησαν από τα συστήματα προσωποποίησης δεν θα πρέπει να χρησιμοποιούνται για άλλους λόγους χωρίς την συγκατάθεση του χρήστη. Αυτό ακόμα προβλέπει ότι οι σελίδες που θέλουν να κάνουν άλλες χρήσεις αυτών των δεδομένων θα πρέπει να αναπτύσσουν αναφορές που θα απαιτούν την συγκατάθεση του χρήστη . Μέτρα Ασφαλείας. Τα δεδομένα θα πρέπει να προστατεύονται με λογικά μέτρα ασφαλείας .Στο πλαίσιο της προσωποποίησης του ηλεκτρονικού εμπορίου ,αυτό προβλέπει ότι τα μέτρα που εφαρμόστηκαν σε αποθηκεμένα προφίλ προσωποποίησης θα πρέπει να μεταφέρονται μέσω ασφαλών καναλιών . Άνοιγμα. Οι συλλογή δεδομένων και οι ασκήσεις χρήσης δεν θα πρέπει να θεωρούνται μυστικές. Στο πλαίσιο της προσωποποίησης του ηλεκτρονικού εμπορίου ,αυτό προβλέπει ,όπως και η Αρχή καθορισμού σκοπού, ότι οι χρήστες θα πρέπει να γνωρίζουν από πριν όταν ένα σύστημα συλλέγει δεδομένα που θα χρησιμοποιηθούν για προσωποποίηση .Στους χρήστες θα πρέπει να παρέχονται πληροφορίες σχετικές με το είδος των δεδομένων που έχουν συλλεχθει ,το πώς θα χρησιμοποιηθούν ,και ποιος τις συλλέγει. Είναι ιδιαιτέρα σημαντικό να γνωρίζουν οι χρήστες την έμμεση συλλογή δεδομένων . Προσωπική Συμμετοχή. Τα άτομα θα πρέπει να έχουν το δικαίωμα να ανακτούν τα δεδομένα τους από κάποιον ελεγκτή δεδομένων έτσι ώστε να διορθώνονται ή να τροποποιούνται τα λανθασμένα δεδομένα. Στο πλαίσιο της προσωποποίησης του ηλεκτρονικού εμπορίου αυτό προβλέπει ,όπως και με την Αρχή της Ποιότητας Δεδομένων ,ότι οι θα πρέπει να παρέχεται στους χρήστες πρόσβαση στα προφίλ τους και η δυνατότητα να τα διορθώνουν και να μετακινούν πληροφορίες από αυτά . Υπευθυνότητα. Οι ελεγκτές δεδομένων πρέπει να συμμορφώνονται με αυτές τις αρχές. Στο πλαίσιο της προσωποποίησης του ηλεκτρονικού εμπορίου ,αυτό προβλέπει ότι ,οι υλοποιείς των συστημάτων προσωποποίησης και οι χειριστές των σελίδων θα πρέπει να είναι αποτελεσματικοί σε πολιτικές ανάπτυξης ,διαδικασίες ,και λογισμικό που θα συμβαδίζουν με τις αρχές αυτές. Τα μαθήματα προσωποποίησης ηλεκτρονικού εμπορίου που προήλθαν από κάθε μια από αυτές τις αρχές μπορούν να επεκταθούν περαιτέρω ο πλαίσιο μιας συγκεκριμένης εφαρμογής .Για παράδειγμα ,o Patrick και ο Kenny έχουν εκτελέσει μια παρόμοια ανάλυση και έχουν κάνει μια αναλυτική προσαρμογή σχεδιασμού συστάσεων του χρήστη για ένα εργαλείο έρευνας εργασίας στο Internet [20].

Page 99: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 99

7.3.2 Νόμοι Ιδιωτικοποίησης και οδηγίες αυτορύθμισης

Οι νόμοι ιδιωτικοποίησης και οι οδηγίες αυτορύθμισης μπορούν να επηρεάσουν τα είδη των συστημάτων προσωποποίησης που μπορούν να χρησιμοποιηθούν στην πράξη. Εδώ υπάρχει μια περίληψη των τρόπων με τους οποίους οι νόμοι και οι οδηγίες μπορεί να έχουν επίδραση στην προσωποποίηση του ηλεκτρονικού εμπορίου. Σε καμιά περίπτωση δεν είναι μια κατανοητή ανασκόπηση των νόμων ιδιωτικοποίησης ή των οδηγιών. Στις Ηνωμένες Πολιτείες ,οι περισσότεροι νόμοι ιδιωτικοποίησης αναφέρονται σε συγκεκριμένους τομείς .Σε πολλούς από αυτούς ,κανένας νομός ιδιωτικοποίησης δεν περιορίζει τα συστήματα προσωποποίησης των ιστοσελίδες ηλεκτρονικού εμπορίου. Ωστόσο ,στις οικονομικές σελίδες, στις σελίδες για παιδιά και στις σελίδες σχετικά με την υγεία μπορεί να χρειαστεί να σχεδιαστούν προσεχτικά τα συστήματα προσωποποίησης για να τηρήσουνε τις νόμιμες απαιτήσεις. Στο μεγαλύτερο του μέρος αυτό χρειάζεται επαρκή προσοχή σχετικά με το σύστημα προσωποποίησης. Σε κάποιους τομείς, υπάρχουν περιορισμοί στην διανομή δεδομένων από τρίτους. Στις παιδικές σελίδες, απαγορεύεται η συλλογή αναγνωρίσιμων προσωπικών πληροφοριών από παιδιά κάτω των 13 χωρίς την συγκατάθεση ενός γονέα τους.

Επιπλέον ,οι σελίδες στις Ενωμένες Πολιτείες θα πρέπει να είναι ενήμερες για κάθε νόμο της πολιτείας που μπορεί να επιδρά σε αυτές καθώς επίσης και για τους νόμους ιδιωτικοποίησης των άλλων χωρών όπου ορισμένοι πελάτες τους μπορεί να κατοικούν. Οι εταιρείες των Ηνωμένων Πολιτειών που παρέχουν διαφημίστηκες υπηρεσίες πολλαπλές ιστοσελίδες και είναι μέλη του Δικτύου Αρχικής Διαφήμισης (ΝΑΙ) θα πρέπει να συμμορφώνονται με τις Αρχές της ΝΑΙ που επιβάλλονται από την Federal Trade Commission (Ομοσπονδιακή Επιτροπή Εμπορίου ) [17].Αυτές οι αρχές απαγορεύουν την χρήση ευαίσθητων δεδομένων στο targeted εμπόριο. Ακόμη απαιτούν από αυτές τις εταιρίες να επιτρέπουν τα άτομα να έχουν πρόσβαση στις πληροφορίες τους ,και να προσφέρουν περιορισμένες δυνατότητες .Ένας αριθμός μερικών άλλων βιομηχανικών οργανισμών όπως είναι η Online Privacy Alliance ,η Direct Marketing Association , και η Personalization Consortium έχουν υιοθετήσει οδηγίες αυτορύθμισης που μπορούν να εφαρμοστούν στην προσωποποίηση του ηλεκτρονικού εμπορίου των μελών τους. Στην Ευρώπη, οι νόμοι ιδιωτικοποίησης επιδρούν στον σχεδιασμό της προσωποποίησης ηλεκτρονικού εμπορίου σε κάθε τομέα. Αυτοί οι νόμοι, που βασίζονται στις Αρχές τις OECD, απαιτούν την ειδοποίηση των χρηστών για την ιδιωτικότητα και απαγορεύουν τον διαμοιρασμό των δεδομένων από τρίτους. Η Kobsa [12] ανέλυσε την European Data Protection Directive και την German Teleservices Data Protection Act και βρήκαν έναν αριθμό περιορισμών που θα μπορούσαν να επιδράσουν την προσωποποίηση του ηλεκτρονικού εμπορίου σε σελίδες κάτω από την δικαιοδοσία του Γερμανικού νόμου.

Για παράδειγμα , δεδομένα από την χρήση των καταγραφών πρέπει να διαγράφονται μετά από κάθε χρήση ,και η χρήση των καταγραφών από διαφορετικές υπηρεσίες ,δεν θα πρέπει να συνδυάζονται ,εκτός αν πρόκειται για τις περιπτώσεις των λογαριασμών των χρηστών. Επιπλέον ,ανώνυμες και ψευδώνυμες υπηρεσίες θα πρέπει να παρέχονται όποτε είναι εφικτό ,και τα προφίλ των χρηστών θα πρέπει να είναι ψευδώνυμα. Αυτοί οι νόμοι περιορίζουν ακόμα και την δυνατότητα στις σελίδες να παίρνουν εντελώς αυτόματα αποφάσεις που θα είχαν σοβαρές επιδράσεις στα άτομα (για παράδειγμα ,σχετικά με την εργοδοσία ,τις πιστωτικές ,κ.λ.π.) .

Page 100: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 100

7.3.3 Μέθοδοι μείωσης ιδιωτικών κινδύνων στην προσοπωποίηση του ηλεκτρονικού εμπορίου

Τα προηγούμενα κεφάλαια αναγνώρισαν ορισμένους ιδιωτικούς κίνδυνους και

περιγράψανε νόμιμες απαιτήσεις σχετικές με την ιδιωτικοποίηση ,τις οδηγίες και τις αρχές της προσωποποίησης του ηλεκτρονικού εμπορίου. Αυτό το κεφάλαιο περιγράφει διάφορες μεθόδους στο σχεδιασμό συστημάτων που μειώνουν τους κινδύνους ιδιωτικοποίησης και κάνουν την ιδιωτική συγκατάθεση ευκολότερη.

Καμιά μέθοδος στην προσωποποίηση του ηλεκτρονικού εμπορίου δεν θα παρέχει πάντα την επιθυμητή λειτουργικότητα στην διάρκεια της προστασίας των ιδιωτικών θεμάτων. Υπάρχουν ισοσταθμίσεις σχετικά με κάθε μια από αυτές τις μεθόδους. Οι τρεις πρώτοι μέθοδοι που συζητηθήκαν εδώ απευθύνονται πρώτα στην Αρχή Περιορισμού Συλλογής μειώνοντας τον αριθμό των προσωπικά αναγνωρίσιμων δεδομένων που αποθηκεύτηκαν από μια ιστοσελίδα. Αυτό μειώνει τον κίνδυνο να γίνει κατάχρηση των δεδομένων από τις εταιρίες ή τους εργαζομένους ,περιορίζει την έκθεση δεδομένων στην περίπτωση παραβίασης της ασφαλείας ,και μειώνει τον αριθμό των δεδομένων που μπορούν να κλητευθούν δικαστικά. Η τελευταία μέθοδος –που θέτει σε έλεγχο τους χρήστες – απευθύνεται στην Data Quality και τις Αρχές της Individual Participation και υποστηρίζει την ικανότητα της απαίτησης της συγκατάθεσης των χρηστών σύμφωνα με την Αρχή του Περιορισμού Χρήσης. Φυσικά, για να είναι αποτελεσματικές αυτές οι μέθοδοι ,χρειάζεται να προσαυξάνονται από υπηρεσίες προφύλαξης και σωστά συναρθρωμένες πολιτικές ιδιωτικοποίησης που εφαρμόζονται από μια επιχείρηση.

7.3.3.1 Ψευδώνυμα Προφίλ

Συχνά το όνομα κάποιου και άλλες προσωπικές πληροφορίες που αναγνωρίζουν τον χρήστη δεν χρειάζονται για την προσφορά υπηρεσιών προσωποποίησης. Για παράδειγμα, συστήματα συστάσεων τυπικά δεν απαιτούν κάποιες προσωπικές πληροφορίες προκειμένου να κάνουν συστάσεις. Αν οι προσωπικές πληροφορίες δεν χρειάζονται ,τα συστήματα προσωποποίησης ,μπορούν να σχεδιαστούν έτσι ώστε οι χρήστες να αναγνωρίζονται από ψευδώνυμα παρά από τα πραγματικά τους ονόματα .Αυτό μειώνει την πιθανότητα κάποιος που αποκτά παράνομη πρόσβαση στο προφίλ κάποιου χρήστη να είναι ικανός να συνδέσει αυτό το προφίλ με ένα συγκεκριμένο άτομο ,παρόλο που δεν εξουδετερώνει αυτόν τον κίνδυνο της παράνομης πρόσβασης. Κάποιος που αποκτά πρόσβαση στο λογαριασμό κάποιου χρήστη χρησιμοποιώντας τον υπολογιστή του/της ή μαθαίνοντας το user name ή το password αποκτά πρόσβαση στο ψευδώνυμο προφίλ. Επιπλέον ,κάποιοι συνδυασμοί από μη-αναγνωρίσιμες πληροφορίες που περιλαμβάνονται σε ένα ψευδώνυμο προφίλ μπορεί να αποδειχθούν αναγνωρίσιμες στην πράξη ,ειδικά όταν συνδυάζονται με πληροφορίες αποθηκεμένες σε καταγραφές χρήσης ιστοσελίδων.

Όμως ,τα ψευδώνυμα προφίλ είναι ένας ωραίος τρόπος να απευθύνεις κάποιες ανησυχίες ιδιωτικοποίηση. Επιπλέον , οι εταιρίες μπορεί να το βρουν ιδιαίτερα εύκολο να συμμορφωθούν με κάποιους νόμους ιδιωτικοποίησης όταν αποθηκεύουν μόνο ψευδώνυμα προφίλ παρά αναγνωρίσιμες προσωπικές πληροφορίες. Για αυξημένη ιδιωτική προστασία οι σελίδες που χρησιμοποιούν ψευδώνυμα προφίλ πρέπει να σιγουρέψουν ότι αυτές οι πληροφορίες του προφίλ αποθηκεύονται χωριστά από καταγραφές χρήσης του ιστού που περιέχουν ΙΡ διευθύνσεις και κάθε αναφορές συναλλαγής που μπορεί να περιέχουν προσωπικές πληροφορίες αναγνώρισης . Οι καταγραφές χρήσης του ιστού πρέπει να καθαρίζονται έτσι ώστε να μην περιέχουν πληροφορίες που θα επέτρεπαν τα ψευδώνυμα προφίλ να συνδεθούν με άλλα δεδομένα .

Page 101: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 101

Η Arlein et al προτείνει μια αρχιτεκτονική για την προσωποποίηση του ψευδωνύμου χρησιμοποιώντας πληροφορίες που τις συνέλλεξαν από πολλαπλές ιστοσελίδες .Αυτό το σύστημα επιτρέπει στους χρήστες να προσδιορίζουν πολλαπλά προφίλ που είναι αποθηκεμένα σε servers προσωπικοτήτων που βρίσκονται στο δίκτυο. Οι χρήστες μπορούν να παρέχουν προνομία στις ιστοσελίδες στο να διαβάζουν ή να επεξεργάζονται ένα συγκεκριμένο προφίλ .Επιπλέον ,οι ιστοσελίδες μπορούν να περιορίσουν περαιτέρω την πρόσβαση σε δεδομένα που έχουν γραφτεί για ένα προφίλ. Οι Kobsa και Schreck προτείνει μια περισσότερο περίπλοκη αρχιτεκτονική και υπηρεσίες που χρησιμοποιούν ψευδώνυμα προφίλ .Οραματίζονται την ύπαρξη των server’s των χρηστών του μοντέλου που μπορούν να επικοινωνούν με χρήστες και υπηρεσίες προσωποποίησης μέσο ανώνυμων καναλιών. Ενώ η αρχιτεκτονική μπορεί να αποδειχθεί αρκετά δύσκολη για υιοθεσία από μια μόνο ιστοσελίδα ηλεκτρονικού εμπορίου ,είναι όμως ένας ενδιαφέρον τρόπος που μπορεί να θεωρηθεί από ένα σύνολο σελίδων σαν ένα ηλεκτρονικό πορτοφόλι πρωτόκολλου ή υπογραφή μιας όψεως .

7.3.3.2 Προφίλ εκ μέρους των Πελατών

Άλλη μια εναλλακτική λύση για την μείωση των ανησυχιών ιδιωτικοποίησης που σχετίζονται με τα προφίλ των χρηστών και την ικανοποίηση μερικών νομικών απαιτήσεων είναι να αποθηκευτούν αυτά τα προφίλ (στον υπολογιστή) του πελάτη ή του χρήστη παρά σε ένα web server .Αυτό θα διαβεβαιώσει ότι τα προφίλ έχουν πρόσβαση μόνο από τους χρήστες και από τα άτομα που έχουν πρόσβαση στον υπολογιστή του/της. Τα προφίλ εκ μέρους των πελατών μπορούν να αποθηκευτούν σε cookies τα οποία θα χρησιμοποιούνται από μια ιστοσελίδα για να παρέχει υπηρεσίες προσωποποίησης και έπειτα θα τα απορρίπτει αμέσως.

Οι πληροφορίες που αποθηκεύονται σε αυτά τα προφίλ πρέπει να κρυπτογραφούνται και να αποκρυπτογραφούνται έτσι ώστε να μην αποκαλύπτονται στη μετακίνηση και να μην είναι προσβάσιμα από άλλους ανθρώπους που έχουν πρόσβαση στον υπολογιστή κάποιου χρήστη ή σε ιούς ή σε άλλα κακόβουλα προγράμματα που μπορεί να ψάχνουν για προσωπικές πληροφορίες αποθηκεμένες σε cookies. Ένα περιβάλλον προσωποποίησης που χρησιμοποιεί την μέθοδο αυτή, μπορεί να παρέχει προσωπικές υπηρεσίες εξετάζοντας τις πληροφορίες των προφίλ των χρηστών για τον πελάτη χωρίς καν να το μεταφέρουν στην ιστοσελίδα .Ο Canny προτείνει μια αρχιτεκτονική για ένα σύστημα συστάσεων στο οποίο οι συμμετέχοντες υπολογίζουν ένα δημόσιο "συνάθροισα" των δεδομένων τους για να τα μοιραστούνε με τα μέλη της κοινότητας τους .Τα άτομα μπορούν μετά να υπολογίσουν τις δικές τους προσωπικές συστάσεις χωρίς να αποκαλύψουν τα προσωπικά δεδομένα τους.

Προτείνει ότι τέτοιου είδους μέθοδος μπορεί να είναι ιδιαίτερα σημαντική σε μια ευρέως διαδεδομένη ρύθμιση χρήσης υπολογιστή όπου η χρήστες τους μπορεί να επιθυμούνε συστάσεις για τις καθημερινές τους δραστηριότητες αλλά ενδιαφέρονται αυτές οι λεπτομερείς πληροφορίες, για τις δικές τους δραστηριότητες, να μην αποκαλυφθούν [4].

7.3.3.3 Προσωποποίηση βασισμένη σε συνόδους

Η προσωποποίηση βασισμένη σε συνόδους μειώνει τις ανησυχίες τις ιδιωτικοποίησης και διευκολύνει στη συμμόρφωση με τους νόμους της ιδιωτικοποίησης, επειδή λίγα δεδομένα προφίλ χρήστη χρειάζεται να αποθηκευτούν για προσωποποίηση. Σε μια σύνοδο μπορεί να χρησιμοποιηθεί κάποιο cookie το οποίο να αποθηκεύει κάποιες πληροφορίες περιστασιακά, αλλά αυτές οι πληροφορίες να μπορούν να διαγραφούν στο τέλος της συνόδου. Ανάλογα με τους στόχους της προσωποποίησης ,η προσωποποίηση που είναι

Page 102: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 102

βασισμένη σε συνόδους μπορεί να παρέχει πολλά από τα υπέρ της προσωποποίησης που βασίζεται σε προφίλ. Μπορεί να είναι αρκετό να γνωρίζει μόνο το είδος της συνόδου που ο χρήστης είναι απασχολημένος αυτή τη στιγμή, παρά πληροφορίες σχετικά με τις προτιμήσεις του/της ή παλαιότερες δραστηριότητες. Εστιάζοντας σε μια πρόσφατη σύνοδο του χρήστη μπορεί να επιτρέψει ένα απλούστερο σύστημα αρχιτεκτονικής το οποίο δεν χρειάζεται να διευκολύνει την αποθήκευση και την επανάκτηση των δεδομένων προφίλ του χρήστη.

Επιπλέον ,εξαλείφει τα προβλήματα που μπορεί να προκύψουν όταν ένα σύστημα προσφέρει συστάσεις σε ένα χρήστη ,οι οποίες αποτελούνται από όλο το προφίλ αλλά δεν είναι σχετικές με την τρέχουσα εργασία .Για παράδειγμα ,όταν ένας χρήστης αγοράζει ένα δώρο για κάποιον άλλο ,οι συστάσεις βασισμένες σε προσωπικές προτιμήσεις μπορεί να είναι άσχετες . Η προσωποποίηση που προέρχεται απευθείας από τις απαιτήσεις του χρήστη παρά από προβλέψεις που είναι βασισμένες σε αυτές τις απαιτήσεις, επιτρέπει την αποθήκευση λίγων δεδομένων. Ένα σύστημα το οποίο απλά αναφέρει την διαθεσιμότητα άλλων προϊόντων της ίδιας κατηγορίας με τα προϊόντα για τα οποία ο χρήστης έχει εκφράσει ενδιαφέρον ,για παράδειγμα, είναι απίθανο να προκαλέσει κινδύνους ιδιωτικοποίησης.

7.3.3.4 Ελέγχοντας τους Χρήστες

Άσχετα με την μέθοδο που εφαρμόζεται στην προσωποποίηση ,αυτοί που την εκτελούν και θέλουν να ευαισθητοποιηθούν σχετικά με τα θέματα περί προσωπικών δεδομένων και συμμορφώνονται με τις αξίες τις χρησιμοποίησης των πληροφοριών πρέπει να δημιουργήσουν συστήματα που θα δίνουν στους χρήστες την ικανότητα να ελέγχουν την συλλογή και την χρήση των πληροφοριών τους .Οι χρήστες πρέπει να μπορούν να ελέγχουν ποιες πληροφορίες είναι αποθηκεμένες στο προφίλ τους ,το λόγο για τον οποίο θα χρησιμοποιηθούν ,και τις συνθήκες (αν υπάρχουν) κάτω από τις οποίες θα γνωστοποιηθούν .Θα πρέπει ακόμη να μπορούν να ελέγχουν ποτέ και αν η προσωποποίηση πραγματοποιείτα .

Σε ορισμένες περιπτώσεις ,τέτοιου είδους έλεγχοι θα πρέπει να επιβάλλονται από τον νόμο. Αναπτύσσοντας μια αλληλεπίδραση χρήστη που να τους επιτρέπει να ελέγχουν τις πληροφορίες τους στα προφίλ τους είναι ένα περίπλοκο πρόβλημα, ειδικά αν η αλληλεπίδραση παρέχει ελέγχους που προχωρούν κάτω από ένα αρκετά υψηλό επίπεδο ελλείπεις επεξεργασίας.

H Lau et al ανακάλυψε τρόπους προσαρμογής για ένα λογισμικό εργαλείο που επιτρέπει στον χρήστη να δημιουργήσει ιδιωτικούς κανόνες για να μοιραστεί ιστορίες του web browsing. Βρήκαν ότι τα interface που απαιτούν από τους χρήστες να εφαρμόσουν ιδιωτικούς κανόνες ξεχωριστά για κάθε αντικείμενο στο σύστημα, ήταν πολύ μονότονο για αυτούς ,και τους σύστησαν interface που αναπτύσσονται και τα οποία επιτρέπουν στους χρήστες να συγκεκριμενοποιήσουν πολιτικές ιδιωτικοποίησης που εφαρμόζονται αυτόματα σε αντικείμενα ενώ αυτά συναντιούνταν τυχαία. Ωστόσο ,η μορφοποίηση ενός κανόνα περί προσωπικών δεδομένων είναι μια περίπλοκη εργασία ,που μπορεί να απαιτεί μια βαθύτερη κατανόηση των θεμάτων αυτών, που πολλοί χρήστες έχουν επίσης και την ικανότητα να προβλέπουν μελλοντικές δραστηριότητες. Ένας αριθμός ιστοσελίδων ηλεκτρονικού εμπορίου παρέχει στους χρήστες πρόσβαση στα προφίλ τους: ωστόσο, δεν είναι ξεκάθαρο αν όλοι οι χρήστες είναι ενήμεροι γι’αυτό και αναφορές από παροχείς κάποιων συστημάτων προσωποποίησης απέδειξαν ότι οι χρήστες σπάνια αναλαμβάνουν εκ των προτέρων να κατασκευάσουν τις on line εμπειρίες τους. Για να ενημερώσουν τις πληροφορίες προσωποποίησης του προφίλ στο Amazon.com, για παράδειγμα, απαιτείται από τους χρήστες να δραστηριοποιηθούν πηγαίνοντας στη δική τους «Your Account Page» και να διαλέξουν από διάφορα αντικείμενα από ένα τομεα “Συστάσεων’’ στο τέλος της σελίδας τους. Εδώ οι χρήστες μπορούν να επέμβουν σε προηγούμενες άμεσες βαθμολογήσεις που έχουν δώσει, καθώς επίσης και να ανασκοπήσουν το ιστορικό της συναλλαγής και της βαθμολόγησής τους και να απαιτήσουν να αποκλειστούν συγκεκριμένα αντικείμενα από θεωρήσεις όταν το Amazon τους κάνει

Page 103: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 103

συστάσεις στο μέλλον .Αυτό το interface απαιτεί αναγκαστικά από τους χρήστες να παίρνουν προσωπικές αποφάσεις για κάθε αντικείμενο που έχει σχέση με τα προσωπικά τους δεδομένα στο σύστημα. Επιπλέον, καθώς οι χρήστες κάνουν νέες αγορές θα πρέπει να θυμούνται να επανεξετάσουν τις θέσεις τους. Ένα interface μπορεί να αναπτυχθεί έτσι ώστε να επιτρέπει στους αγοραστές του Amazon να συγκεκριμενοποιούν γενικές πολιτικές ιδιωτικοποίησης που θα εφαρμόζονται αυτόματα.Τέτοιου είδους κανόνες μπορεί να επιτρέψουν στους χρήστες να καθορίζουν, για παράδειγμα, κάποιες αγορές να μην χρησιμοποιηθούν για να γίνουν συστάσεις, ή ότι οι αγορές τους θα αποκλείονται από το προφίλ τους μετά από ένα εξάμηνο. Έτσι, κάποιος χρηστής θα μπορεί να προσδιορίσει αν οι αγορές που κάνει εκείνη τη στιγμή χρησιμοποιώντας τις πιστωτικές κάρτες του αν θα εξαιρεθούν για επόμενες συστάσεις. Αυτού του είδους οι κανόνες θα είναι χρήσιμοι σε ένα χρήστη που θα μπορεί να προβλέπει προκαταβολικά τα είδη των αγορών που δεν θα έχουν επιρροή στις συστάσεις του. Μια εναλλακτική μέθοδος που θα απαιτούσε λιγότερη πρόγνωση από μέρους των χρηστών θα ήταν να επέτρεπε αυτούς να προσδιορίζουν τις προτιμήσεις τους περί προσωπικών δεδομένων ως μέρος της διαδικασίας της συναλλαγής. Συνεπώς ,όταν ένας χρηστής εισάγει τον αριθμό της πιστωτικής του και τη διεύθυνση αγοράς θα υποκινείται να αποφασίσει αμέσως αν αυτή η συναλλαγή θα πρέπει να αποκλειστεί από το προφίλ του. Θα μπορούσε επίσης να εγκαθιδρυθεί μια προκαθορισμένη ρύθμιση που θα εφαρμόζεται σε όλες τις αγορές του εκτός και αν υποδείκνυε διαφορετικά ,η ακόμα να προσδιορίσει γενικές πολιτικές σαν αυτές που περιγραφτηκαν πριν που μπορούν να υπερισχύσουν εύκολα για μια συγκεκριμένη αγορά. Ένα ευρύ σύστημα προκαθορισμού θα μπορούσε να περιλαμβάνει τα αντικείμενα που οι χρήστες έχουν υποδείξει οι έχουν αγοραστεί σαν δώρα και έτσι να αποκλείονται από το προφίλ συστάσεών τους. Ένα interface χρήστη μπορεί ακόμη να περιλαμβάνει ένα check box που θα επιτρέπει στον χρήστη να δηλώνει ότι μία αγορά είναι για δώρο (δεν το αγόρασα για τον εαυτό μου) σαν ένα τρόπο που δεν θα εμπλέκει τον εαυτό του σε αυτή την συγκεκριμένη αγορά σαν την συνήθεια που έχουν κάποιοι άνθρωποι να απαιτούν συμβουλές «για έναν φίλο» σε μια προσπάθεια να προστατέψουν την προσωπική τους ζωή. Μια πιο σοφιστικέ μέθοδος θα επέτρεπε τους χρήστες να εγκαθιδρύσουν πολλαπλές προσωπικότητες που καθεμιά από αυτές θα είχε το δικό της προφίλ προσωποποίησης. Έτσι ,ακόμα ο χρήστης θα μπορούσε να έχει ξεχωριστό προφίλ για προσωπικές και επιχειρηματικές αγορές και θα μπορούσε να έχει ένα προφίλ για κάθε άτομο για το οποίο αγοράζει δώρο .Εξάλλου κατευθύνοντας κάποια θέματα προσωπικών δεδομένων, όπως μια τέτοια προσέγγιση πιθανότατα θα οδηγήσει σε μια καλύτερη προσωποποίηση επειδή θα προσφέρει συστάσεις με το αντίστοιχο περιεχόμενο. Φυσικά, οι σχεδιαστές ενός τέτοιου συστήματος θα πρέπει να αναλογιστούν πιθανές προσωπικές ανησυχίες των παραληπτών των δώρων. Στο παράδειγμά μας, με το Amazon, το interface επιτρέπει τους χρήστες να αποκλείουν αγορές από τις δικές τους συστάσεις αλλά να μην τις μετακινήσουν από το προφίλ τους όλες μαζί. Αποκλείοντας αγορές από μελλοντικές συστάσεις διεκπεραιώνονται κάποια θέματα προσωπικών δεδομένων, αλλά κάποια άλλα παραμένουν. Καθώς νομικά και θέματα ευθύνης απαιτούν από το Amazon να διατηρήσει το ιστορικό των συναλλαγών για ορισμένο χρόνο ,θα πρέπει να υπάρχει μια περίοδος διατήρησης μετά την οποία αυτό το ιστορικό δεν θα πρέπει να παραμένει αν το επιθυμεί ο χρηστής .Επιπλέον ,ακόμα και μέσα στην περίοδο διατήρησης το Amazon πρέπει να επιτρέπει στους χρήστες να απαιτούν όλο η μέρος του ιστορικού της συναλλαγής να μην είναι διαθέσιμο μέσω του ιστού. Όταν τα interface για τους χρήστες αναπτύσσονται, επιτρέποντας στους χρήστες να ελέγχουν την χρήση των πληροφοριών τους, είναι ακόμη απαραίτητο τα παλιά συστήματα να είναι σε θέση που θα μπορούν να μεταφέρουν σωστά τις οδηγίες του κάθε χρήστη.

Page 104: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 104

Αυτό είναι ευκολότερο όταν τα προφίλ προσωποποίησης χρησιμοποιούνται μονό για προσωποποίηση ιστοσελίδας :ωστόσο μερικές εταιρίες κάνουν επιπλέον χρήση αυτού του δεδομένου για καμπάνιες μέσω email ή για άλλους λογούς. Όταν αυτές οι εταιρίες έχουν βάσεις δεδομένων διασκορπισμένες σε πολλά διαφορετικά συστήματα υπολογιστών ,καθώς οι χρήστες αλλάζουν τις προσωπικές τους ρυθμίσεις, αυτές οι αλλαγές πρέπει να διαδίδονται σε πολλαπλά συστήματα που μπορούν να αποθηκευόσουν δεδομένα σε διαφορά formats. Επιπλέον ,πολιτικές και επεξεργασίες πρέπει να τοποθετούνται έτσι ώστε να περιορίζουν την πρόσβαση σε αυτές τις βάσεις δεδομένων και να διαβεβαιώνουν ότι αυτοί που έχουν πρόσβαση στα δεδομένα των χρηστών θα σέβονται τις ιδιωτικές ρυθμίσεις του κάθε χρήστη .

7.4 Το Ενδιαφέρων Του Καταναλωτή Για Την Ιδιωτικοποίηση

Από την στιγμή που οι χρήστες χρειάζονται να λένε τις πληροφορίες για τις προτιμήσεις τους με σκοπό ο εκάστοτε πωλητής να προσαρμόσει τις προσφορές του στα γούστα τους ,η προσωποποίηση είναι ανέφικτο να πραγματοποιηθεί χωρίς έστω και λίγη απώλεια της μυστικότητας τους. Το ερώτημα τότε είναι ,αν οι online καταναλωτές θα αποφύγουν να χρησιμοποιήσουν τις υπηρεσίες προσωποποίησης. Συμφωνά με αυτό ,προηγούμενη ερευνά προβάλει με επιχειρήματα ότι οι άνθρωποι βάζουν σε υψηλή εκτίμηση στην ιδιωτική τους ζωή και πιο ειδικά , οι καταναλωτές θα ήθελαν να μοιραστούν τις προσωπικές πληροφορίες και προτιμήσεις τους αν συνειδητοποιούσαν ότι υπάρχουν αρκετά οφέλη που μπορούν να επιτευχθούν σε αντάλλαγμα. Τέτοια οφέλη δεν περιορίζονται σε χρηματικά οφέλη αλλά μπορεί να περιλαμβάνουν και άλλα σχεδόν απεριόριστα οφέλη. Σε αυτή την εργασία, προβάλουμε με επιχειρήματα ότι ο καταναλωτής θέλει να μοιραστεί τις πληροφορίες των προτιμήσεων του με αντάλλαγμα προφανή οφέλη ,όπως η άνεση ,στη χρήση προσωποποιημένων προϊόντων και υπηρεσιών.

Η λογοτεχνία του μάρκετινγκ ομαδοποιεί την ανταλλαγή των πληροφοριών των προτιμήσεων για οφέλη από την προσωποποίηση ως ένα παράδειγμα μιας κοινωνικής ανταλλαγής που περιλαμβάνει την μεταφορά απροσδιόριστων στοιχειών. Έχει περαιτέρω τεκμηριωθεί ότι οι άνθρωποι συμμετέχουν σε τέτοιες κοινωνικές συναλλαγές ,μονό όταν οι προσδοκόμενες ανταμοιβές τους υπερβαίνουν η τουλάχιστον αντισταθμίζουν την απώλεια εξαιτίας της συμμετοχής. Σε όλες αυτές τις σειρές προτείνουμε ότι οι online καταναλωτές θα συμμετέχουν στην ανταλλαγή πληροφοριών της προτίμησης τους για οφέλη που απορρέουν από την προσωποποίηση αν η ποιοτική αξία των προσωποποιημένων υπηρεσιών υπερβαίνει την ποιοτική απώλεια των πληροφοριών ιδιωτικού περιεχομένου. Αυτή η πρόταση αποτελεί επίσης τις απόψεις των Cullman και Byes, η οποία προτείνει ότι οι άνθρωποι θα δεχτούν την έλλειψη ιδιωτικών θεμάτων με τον ορό ότι υπερέχει ένα θετικό δικτυακό αποτέλεσμα από τέτοιες πληροφορίες κοινοποίησης. Επομένως ,όπως ακριβώς αναπτύξαμε την δομή της αξίας της προσωποποίησης σε προηγούμενες υποκατηγορίες ,τώρα υπολογίζουμε την απώλεια που αφορούν τα οφέλη και τις δαπάνες των καταναλωτών. Ερευνά στα IS και το μάρκετινγκ έχει αποδείξει με επιχειρήματα ότι οι πληροφορίες προσωπικού περιεχομένου και το καταναλωτικό ενδιαφέρον είναι ένα από τα πιο σημαντικά θέματα στο σημερινό τεχνολογικό περιβάλλον. Η ιδέα περί προσωπικών δεδομένων δεν είναι από μονή της καινούργια και έχει γενικά ορισθεί ως η ικανότητα κάποιων ατόμων να ελέγχουν τους ορούς όπου οι προσωπικές τους πληροφορίες απόκτιουνται και χρησιμοποιούνται.

Για να μετρήσουμε το ενδιαφέρον για πληροφορίες ιδιωτικού τύπου, αναπτύχθηκε ένα όργανο το οποίο ονομάζεται Ενδιαφέρον για Ιδιωτικές Ανησυχίες (CFΙP) που αναπτύχθηκε από τον Smith et al. Αναγνωρίζει 4 παράγοντες, οι οποίοι είναι: ονομαστική συλλογή ,λάθη ,δευτερεύουσα χρήση και παράνομη πρόσβαση για το μέγεθος της

Page 105: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 105

μυστικότητας των προσωπικών δεδομένων κάποιου. Παλαιότερη ερευνά έχει δείξει ότι το “CFIP χρειάζεται να επανεξετάσει έστω και επιφανειακά την αναδυόμενη τεχνολογία, την πρακτική της, και έρευνα” και επίσης προτείνει ότι “ο κυριότερος παράγοντας της CFIP μπορεί να είναι η φιλαργυρία παρά μια ομάδα συσχετιζομενων μεταξύ τους παραγόντων”. Η άποψη αυτή υποστηρίζεται από άλλους που προτείνουν ότι η μέτρηση της μυστικότητας χρειάζεται να επανεξετασθεί σε διαφορά καταναλωτικά περιβάλλοντα, και υποστηρίζουν ότι επιπροσθέτως στo CFIP, χρειάζεται μια έγκυρη κλίμακα που να μετράει όλες τις συμπεριφορές που έχουν να κάνουν σχέση με τα προσωπικά δεδομένα και τη μυστικότητα αυτών. Από την άλλη, έχει επίσης τεκμηριωθεί ότι μέσω διαδικαστικής αμεροληψίας, «οι οργανισμοί μπορούν να εφαρμόσουν διαδικασίες αμεροληψίας», για να μειωθούν οι ανησυχίες των καταναλωτών για τα ιδιωτικά θέματα και να οδηγηθούν στην απόκτηση εμπιστοσύνης.

Παρόμοια, μια άλλη ερευνά αγοράς παρατήρησε ότι τα θέματα περί προσωπικών δεδομένων των χρηστών, κατευθύνονται από ένα περιβάλλον ελέγχου και έπειτα από τη χρήση πληροφοριακού ελέγχου. Η πρώτη αναφέρεται στην ικανότητα του καταναλωτή να ελέγχει τις πράξεις άλλων ομοίων του σε ένα περιβάλλον συναλλαγών ,ενώ η δεύτερη υποδηλώνει την ικανότητα να ελέγχει κάποιος την επακόλουθη χρήση κάθε παρερχομένης πληροφορίας στην διάρκεια της συναλλαγής. Εφόσον κάποιοι καταναλωτές υπάρχει περίπτωση να μην μπορούν να εξασκήσουν εντελώς τα πιστεύω τους ,όσον αφορά την ιδιωτικοποίηση και δίνεται περισσότερη προσοχή σε υφιστάμενες διαφημίστηκες δραστηριότητες ,η διαφύλαξη των προσωπικών πληροφοριών σε εμπορικές συναλλαγές έχουν υποκύψει στο πεδίο των περιβαλλοντικών υπάρξεων /οντοτήτων όπως η Federal Trade Commission (FTC). Η FTC παρέχει ένα σύστημα οδηγιών γνωστό ως Fair Information Practices που είναι χτισμένο πάνω σε πιστοποιητικά ερευνητών σε αυτόν τον τομεα αλλά και σε προγενέστερα ευρήματα .Αποτελούμενα από την αναπτυσσομένη κλίμακα του CFIP, οι κατευθυντήριες γραμμές ενσωματώνουν κανόνες που ορίζουν πως οι πωλητές θα έπρεπε να συλλέγουν πληροφορίες ,πως θα πρεπε να διορθώσουν κάθε λάθος που αφορά προσωπικές πληροφορίες ,πως θα΄πρεπε να ενημερώνουν τους καταναλωτές όσο αφορά την επακόλουθη χρήση των πληροφοριών και πως οι πωλητές θα πρέπει να αποφεύγουν κάθε παράνομη πρόσβαση στις πληροφορίες.

Παρομοίως ,αποτελούμενες από ευρήματα των Cullman και Armstrong και Hoffman et al, οι οδηγίες απαιτούν ότι οι πωλητές θα’πρεπε να παρέχουν στους καταναλωτές έλεγχο πάνω σε όλα τα θέματα συλλογής και χρήσης πληροφοριών .Οι οδηγίες αυτές μπορούν να συνοψιστούν σε 5 βασικές ενέργειες: παρατήρηση ,επιλογή ,πρόσβαση ,ακεραιότητα και επιβολή. Πρώτον ,η παρατήρηση προβλέπει ότι οι αποκαλυπτωμενες παρατηρήσεις θα πληροφορούν τους καταναλωτές σχετικά με τον τρόπο με τον οποίο οι πληροφορίες τους θα συλλεχθούν. Δεύτερον ,η επιλογή προβλέπει ότι οι καταναλωτές έχουν την δυνατότητα να επιλέξουν πως θα χρησιμοποιηθούν οι πληροφορίες τους και ποια μέρη αυτών θα αποκαλυφθούν .Τρίτον ,η πρόσβαση προβλέπει ότι οι online καταναλωτές έχουν την δυνατότητα να ασκήσουν έλεγχο πάνω στις πληροφορίες τους. Τέταρτο, η ακεραιότητα ότι οι επαρκείς μηχανισμοί θα ενσωματώνονται προκειμένου να προστατευθούν οι πληροφορίες των καταναλωτών από παράνομη (μη εξουσιοδοτημένη) χρήση. Κλείνοντας ,η επιβολή προβλέπει ότι υπάρχει μια αποτελεσματική εξουσία που θα εφαρμόσει και θα επιβάλλει κυρώσεις για ενδεχόμενες παραβιάσεις .

Μια σημαντική διαφορά του θέματος για τις πληροφορίες ιδιωτικοποίησης μεταξύ online και offline συναλλαγών είναι το γεγονός ότι όλες οι μορφές ηλεκτρονικής πρόσβασης αφήνουν ίχνη. Αυτό επιτρέπει στους πωλητές να συσχετίζουν ακόμα και φαινομενικά ασήμαντες πληροφορίες, για να δημιουργήσουν ακριβή καταναλωτικά προφίλ .Μια πρόσφατη αναφορά ,από το FTC2 παρατηρεί ότι «παρόλο που οι πληροφορίες που συλλέγονται από διαδικτυωτές διαφημιστές, είναι συχνά ανώνυμες (π.χ.,τα προφίλ είναι συνδεδεμένα στον αριθμό εξακρίβωσης του cookie στον υπολογιστή του καταναλωτή παρά στο όνομα ενός συγκεκριμένου ατόμου) σε μερικές περιπτώσεις, τα προφίλ που παράγονται

Page 106: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 106

από την ιχνηλάτηση των δραστηριοτήτων των καταναλωτών στον ιστό είναι συνδεδεμένα η συγχωνευμένα σε προσωπικά αναγνωρίσιμες πληροφορίες. Αυτό το καταναλωτικό δεδομένο μπορεί ακόμα να συνδεθεί με δεδομένα από τις offline αγορές του καταναλωτή, ή με πληροφορίες συλλεγμένες άμεσα από τον καταναλωτή μέσω επισκοπήσεων και φορμών εγγραφής. Συνεπώς στο online περιβάλλον οι καταναλωτές δεν ενδιαφέρονται μονό για ιδιωτικά θέματα των προσωπικά αναγνωρίσιμων πληροφοριών τους αλλά και για άλλες πληροφορίες που μπορούν να συνδεθούν μεταξύ τους στο κοντινό μέλλον. Συμφωνά με αυτά ,το FTC βασικά κατατάσσει τις online πληροφορίες που συλλέχθησαν σε 3 κατηγορίες:

(α) Ανώνυμες πληροφορίες .Αναφέρεται σε πληροφορίες συγκεντρωμένες από τις επισκέψεις σελίδων χωρίς την χρήση κάποιων τεχνολογιών “εισβολής”, τυπικά η στανταρ πληροφορία στάλθηκε με οποιαδήποτε διαδικτυακή αίτηση. Τέτοια πληροφορία περιλαμβάνει μια μηχανή ΙΡ διεύθυνσης, domain τύπος, τύπος και έκδοση browser, σύστημα χειρισμού, γλωσσά browser και τοπική ώρα . (β) Προσωπικές μη αναγνωρίσιμες πληροφορίες. Αναφέρεται σε πληροφορίες που, από μονές τους, δεν μπορούν να χρησιμοποιηθούν για να αναγνωρίσουν ή να εντοπίσουν κάποιον. Πληροφορίες όπως ηλικία ,ημερομηνία γεννήσεως ,γένος, ενασχόληση, εκπαίδευση, εισόδημα, ταχυδρομικός κώδικας χωρίς διεύθυνση, ενδιαφέροντα και χόμπι κατατάσσονται σε αυτή την κατηγορία .Ο καταναλωτής μέσω κουμπιά επιλογής, μενού ή check boxes σε μια σελίδα του πρέπει να αποκαλύψει άμεσα τις περισσότερες από αυτές τις πληροφορίες. Επιπρόσθετα ,με τις αιτούμενες πληροφορίες, η προσωπικά μη αναγνωρίσιμη πληροφορία μπορεί συχνά να περιλαμβάνει την χρήση τεχνολογιών ιχνηλάτησης όπως π.χ.,Coοkies κ.α. Τέτοιου είδους τεχνολογίες, παρόλο που δεν αναγνωρίζουν κάθε πελάτη ξεχωριστά, καθιστούν ικανή την συλλογή πληροφοριών ώστε να σχεδιάζεται ένα αποτελεσματικό πελατειακό προφίλ. (γ) Προσωπικά αναγνωρίσιμες πληροφορίες. Αναφέρεται σε πληροφορίες που μπορούν να χρησιμοποιηθούν για να αναγνωρίζουν ή να εντοπίζουν καποιον. Αυτές περιλαμβάνουν διευθύνσεις email, όνομα, διεύθυνση, αριθμό πιστωτικής, αριθμός κοινωνικής ασφαλείας, κ.τ.λ. Σταθερά, τέτοιες πληροφορίες σχεδόν πάντα συγκεντρώνονται άμεσα από τον πελάτη και συνήθως συλλέγονται όταν αυτός κάνει κάποιου είδους αίτηση σε ιστοσελίδες ή εμπλέκεται σε οικονομικές συναλλαγές. Καθώς η online προσωποποίηση περιλαμβάνει την συλλογή και χρήση από το καθένα από αυτά τα διαφορετικά είδη πληροφοριών ,η ανησυχία των καταναλωτών για την ιδιωτικοποίηση στη χρήση των υπηρεσιών προσωποποίησης ,πρέπει να αποτιμήσει τις ιδιωτικές αντιλήψεις ανάλογα με το κάθε είδος πληροφορίας. Συνεπώς, για να υπολογιστεί το «έλλειμμα» από την ιδιωτικοποίηση του καταναλωτή, θα πρέπει εμείς να μετρήσουμε τις καταναλωτικές συμπεριφορές ανάλογα με το πώς θα συλλέξουμε και θα χειρισθούμε το κάθε είδος πληροφορίας με σεβασμό στις αρχές χρήσης πληροφοριών. Τελειώνοντας, για λόγους κάλυψης πληρότητας όσο το δυνατόν περισσότερων περιπτώσεων, να αναφέρουμε και την άποψη που λέει ότι είναι λογικό, να περιμένει κανείς ότι αν οι καταναλωτές πιστέψουν ότι οι πληροφορίες τους συλλεχθησαν και μεταχειρίστηκαν σωστά, έπειτα θα επιθυμούν να μοιραστούν περισσότερο τις πληροφορίες προτιμήσεων τους και επομένως να χρησιμοποιήσουν παραπάνω υπηρεσίες προσωποποίησης που προσφέρονται.

7.5 Συμπέρασμα

Σ’ αυτή την εργασία έχουμε εξετάσει μέχρι στιγμής διάφορους κινδύνους ιδιωτικοποίησης στην προσωποποίηση ηλεκτρονικού εμπορίου καθώς και άλλα θέματα που μπορεί να έχουν κάποια επίδραση στο σχεδιασμό των συστημάτων προσωποποίησης. Ενώ

Page 107: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 107

δεν υπάρχει κανένας παγκόσμιος τύπος για τον σχεδιασμό ενός συστήματος προστασίας προσωπικών δεδομένων στην προσωποποίηση του ηλεκτρονικού εμπορίου ,υπάρχει όμως ένας αριθμός μεθόδων που μπορούν να φανούν χρήσιμες αναλόγως την λειτουργία του κάθε συστήματος .Τα ψευδώνυμα προφίλ είναι μια καλή μέθοδος όταν οι πληροφορίες προσωποποίησης δεν χρειάζεται να συγχέονται με προσωπικά αναγνωρίσιμες πληροφορίες. Τα προφίλ με βάση τους χρήστες μπορούν να φανούν χρήσιμα όταν οι υπηρεσίες προσωποποίησης μπορούν να εφαρμοστούν στον χρήστη. Η προσωποποίηση που βασίζεται σε έργο μπορεί να είναι χρήσιμη όταν γνωρίζουμε ότι το ιστορικό του προφίλ ενός χρήστη δεν βελτιώθηκε σημαντικά από την υπηρεσία προσωποποίησης .Τα interface που θέτουν τους χρήστες σε έλεγχο της συλλογής και χρήσης των δεδομένων τους ,καθώς επίσης και των ειδών της παρερχομένης προσωποποίησης μπορούν να κάνουν τα περισσότερα συστήματα προσωποποίησης περισσότερο φιλικά σε θέματα προσωπικών δεδομένων, μολονότι χρειάζεται περισσότερη δουλειά για να αναπτυχθούν.

Οι επενδύσεις της τεχνολογίας πληροφοριών (ΙΤ )που απαιτηθήκαν για να εφαρμοστεί η προσωποποίηση δεν είναι καθόλου ασήμαντες. Αναφορές από τον τύπο του εμπορίου (https://www.crm-forum.com) και εταιρίες ερευνών όπως η Gartner απέδειξαν ότι το CRM και αλλά τεχνολογικά μέσα προσαρμοσμένα για τον καταναλωτή μπορούν να φτάσουν σε εκατομμύρια δολάρια με στανταρ κόστος το οποίο δεν αλλάζει. Γι αυτό είναι κρίσιμο για τους on line “πωλητές” ( και μη ) να καταλάβουν την συμπεριφορά του καταναλωτή στο περιβάλλον της προσωποποίησης.

Στο αυτόνομο περιβάλλον η απόφαση των καταναλωτών να χρησιμοποιήσουν προσωποποιημενες υπηρεσίες εξαρτάται αρχικά από την αξία που παρέχει στο κάθε άτομο και στο χρηματικό αντίτιμο που θα πρέπει να πληρώσει κάποιος προκειμένου να απολαύσει αυτές τις υπηρεσίες. Ακόμα και αν οι καταναλωτές δεν πληρώνουν κάποιο ποσό για να χρησιμοποιήσουν τις online υπηρεσίες, θα πληρώσουν μονό αν αξιολογήσουν την προσωποποίηση .Επιπλέον ,ακόμα και αν οι υπηρεσίες έχουν αξία από μονές τους ,ένας καταναλωτής μπορεί να τις χρησιμοποιήσει αν οι ανυσηχιες για την ιδιωτικοποίηση που προέρχονται από το μοίρασμα των σχετιζομενων πληροφοριών υπερτερεί σε σπουδαιότητα από το όφελος χρήσης των υπηρεσιών .Έτσι ,για να κατανοήσουμε την συμπεριφορά των online καταναλωτών από τα περιβάλλοντα προσωποποίησης ,θα πρέπει πρώτα να αναπτύξουμε 2 σχέδια : ένα νέο σχέδιο που ονομάζεται ‘αξία της online προσωποποίησης’’ και ένα ακόμα καλά ερευνώμενο σχέδιο « ενδιαφέρον του καταναλωτή για την προσωποποίηση’’ των πληροφοριών των συναλλαγών τους . Η αξία της online προσωποποίησης για τους καταναλωτές - χρήστες

Μέχρι στιγμής υπάρχει σχετική λίγη ακαδημαϊκή βιβλιογραφία για την online προσωποποίηση. Μια βιομηχανική ομάδα χαρακτηρίζει την online προσωποποίηση ως την χρήση της τεχνολογίας και των πληροφοριών των καταναλωτών για να ψάξουν τις αλληλεπιδράσεις του ηλεκτρονικού εμπορίου μεταξύ μιας επιχείρησης και καθενός ξεχωριστά από τους πελάτες (http://www.personalization.org). Η αξία της online προσωποποίησης για κάποιο χρήστη προέρχεται αρχικά από την εφαρμογή που παρέχουν ένα προϊόν η μια υπηρεσία ,και την ευκολία να μεταφέρεται με αποδοτική μέθοδο. Αναλογίζοντας τις περιπτώσεις της προσωποποίησης που ένας online πελάτης μπορεί να συναντήσει (αντιμετωπίσει ).

Πρώτον ,ένα κατάστημα μπορεί να προσφέρει προσωποποίηση βασισμένη σε ιδιαιτέρα προσωπικά χαρακτηριστικά όπως είναι το όνομα ,η διεύθυνσης αποστολής και επιθυμητό τόπο αποστολής καθώς και προτιμήσεις σε αξία προεξόφλησης, κ.λ.π. Το κατάστημα μπορεί ακόμα να προσφερθεί να μεταφέρει αυτές τις υπηρεσίες σε μια μικροσκοπική συσκευή ,π.χ.,ένα στιγμιαίο σύνθημα συναγερμού στέλνεται στο PDA του

Page 108: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 108

πελάτη ,όταν οι τιμές συγκεκριμένων μετοχών στη ΄΄watch list΄’(λίστα παρακολούθησης μετοχών) πέφτουν σε προκαθορισμένο επίπεδο η όταν μια δημοπρασία έρχεται σε κλείσιμο. Ακόμα οι εταιρίες στον ιστό μπορούν ακόμα να προσωποποιήσουν κάποιες αγοραστικές εμπειρίες του πελάτη. Για παράδειγμα ,οι Amazon ,Barnes και Noble αναπτύσσουν την συλλογική γνώση της βάσης πελατών τους προκειμένου να προβλέψουν τις προτιμήσεις του κάθε πελάτη για να κάνουν προσωποποιημενες συστάσεις. Χρησιμοποιώντας την τεχνολογία συνεργατικού φιλτραρίσματος ,το κατάστημα μπορεί να προτείνει νέες επιλογές CD σε συγκεκριμένους πελάτες βασισμένες σε συστάσεις άλλων χρηστών που εξέθεσαν πανόμοιες προτιμήσεις. Μερικά καταστήματα επιτρέπουν στους χρήστες να προσωποποιούν άλλα χαρακτηριστικά όπως είναι το χρώμα των δικών τους ιστοσελίδων ,το όνομα με το οποίο κάποιος προτιμά να χαιρετάτε και την σειρά των αποτελεσμάτων των ερευνών που βασίζονται στο ιστορικό της αγοράς και της ερευνάς του πελάτη.

Επιπλέον, στη βασισμένη σε καταναλωτικά χαρακτηριστικά και προτιμήσεις περιήγησης και αγοράς, προσωποποίηση, οι εταιρίες στον ιστό μπορούν από μόνες τους να προσωποποιήσουν στη στιγμή προσφορές προϊόντων. Εταιρίες όπως οι Dell και Gateway παρέχουν προσωποποιημενες σελίδες που ενσωματώνονται σε κάποιους πελάτες για να ρυθμίσουν online την παραγγελία και πληρωμή τους για τα προϊόντα που πρόκειται να πάρουν. Πολλές άλλες προσωποποιούνε αφού εφοδιαστούν οι πωλήσεις ειδικά για το αγοραστικό σύστημα. Τέτοιες υπηρεσίες μπορεί να περιλαμβάνουν στατικές πληροφορίες (π.χ.,FAQ) καθώς επίσης και δυναμικές αλληλεπιδράσεις όπως αυτόματο σύστημα ανίχνευσης και μεταφοράς αντίστοιχων ενημερώσεων.

Καθώς, οι πωλητές φυσικών προϊόντων όπως είναι οι κατασκευαστές αυτοκινήτων και οι σχεδιαστές επίπλων χρησιμοποιούν το Internet για να δημιουργήσουν ένα περιβάλλον αλληλεπιδράσεων που επιτρέπει στους καταναλωτές να πραγματοποιούν εισαγωγές στην τελική παραγωγή των φυσικών τους προϊόντων ,ψηφιακά αγαθά και υπηρεσίες (π.χ., μουσικά άλμπουμ ,λογισμικό δέμα ,συστάσεις αναλογιών καταστημάτων ) μπορούν από μονές τους να είναι εντελώς προσωποποιημενες ως αναφορά τα προφίλ των καταναλωτών. Μιλώντας πιο γενικά ,τα προφίλ των καταναλωτών κατασκευάζονται με βάση διάφορα κριτήρια, και διαφορετικές τεχνικές ταιριάσματος χρησιμοποιούνται για να προσωποποιήσουν τα προϊόντα και τις υπηρεσίες για το προφίλ ενός συγκεκριμένου καταναλωτή. Ο αριθμός των κριτηρίων που περιγράφουν το προφίλ κάποιου καταναλωτή ποικίλει ανάλογα με το περιβάλλον και τις τεχνολογίες που χρησιμοποιούνται για την προσωποποίηση.

Για παράδειγμα, το Double click (διπλό κλικ) είναι γνωστό επειδή χρησιμοποιεί 22 κριτήρια για να περιγράψει ένα ανώνυμο προφίλ περιήγησης ενός δικτυακού καταναλωτή. Έτσι, τα οφέλη της online προσωποποίησης για τους καταναλωτές μπορεί να θεωρηθούν ότι είναι η ευκολία να είναι διαφορετικά μέρη προσωποποιημένα απ’ την περιήγησή τους ή απ’ τις αγορές τους. Καθώς οι καταναλωτές μπορούν να δώσουν διαφορετική έμφαση σε διαφορετικά είδη προσωποποίησης ,που συζητηθήκαν πριν ,εμείς χρειάζεται να ενσωματώσουμε τα αντικείμενα για να μετρήσουμε το κάθε είδος διαφορετικά κατά την διάρκεια μιας κλιμακωτής ανάπτυξης .Ο καταναλωτής μπορεί να διαλέξει να χρησιμοποιεί ένα η περισσότερα από αυτά τα είδη αναλόγως από την αξία για κάθε χαρακτηριστικό που προσωποποιείτε. Για παράδειγμα ,ένας καταναλωτής που ταξιδεύει συχνά μπορεί να δώσει περισσότερη αξία στη γνωστοποίηση των αλλαγών των προγραμμάτων πτήσεων μεταφερομένων στο κινητό του και στις μικροσκοπικές συσκευές ,ενώ ένας συχνός αγοραστής θα προτιμούσε να έχει προσωποποιημενα κουπόνια σταλμένα στον λογαριασμό του email του .Αυτό προϋποθέτει ότι ο πρώτος καταναλωτής θα έδινε τον αριθμό του τηλεφώνου του σε μια Ιστοσελίδα αερογραμμών ενώ ο δεύτερος θα έδινε τις πληροφορίες του email του σε μια ιστοσελίδα ενός καταστήματος. Έτσι, μπορούμε να προβάλουμε με επιχειρήματα ότι η γενική χρήση των υπηρεσιών προσωποποίησης εξαρτάται από την συνολική αξία που οι καταναλωτές θέτουν σε κάθε πιθανό είδος μιας online

Page 109: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 109

προσωποποίησης, λ.χ., ο καταναλωτής θα χρησιμοποιήσει μονό αυτές τις υπηρεσίες που βρίσκει χρήσιμες.

Συμπεράσματα

Το διαδίκτυο από πολλές απόψεις αντιπροσωπεύει μια ιδανική μορφή επικοινωνίας και υπερτερεί σε σχέση με πολλά παραδοσιακά μέσα.

Η on line διαφήμιση αν και βρίσκεται για πολλούς ακόμα σε νηπιακό στάδιο η

εξέλιξη και η ανάπτυξη του κλάδου αυτού, αναμφισβήτητα θα είναι ραγδαίος τα επόμενα χρόνια, λόγω της συνεχόμενης διείσδυσής του διαδικτύου σε κάθε σπίτι.

Το e-marketing δεν είναι απλό marketing με ένα “e” μπροστά του. Το e-marketing

είναι μια σειρά από δυνατές στρατηγικές που απαρτίζουν την ηλεκτρονική διαχείριση ενός οργανισμού ή μιας επιχείρησης, καθώς και την ανάπτυξή του/της.

Δεν υπάρχει κάποια συγκεκριμένη φόρμουλα – λύση για να κάνει κάποιος Web

Personalization, ανάλογα με τον εκάστοτε σκοπό και τις ανάγκες το κάθε σύστημα παραμετροποιείται διαφορετικά.

Οι άνθρωποι βάζουν σε υψηλή εκτίμηση στην ιδιωτική τους ζωή και πιο ειδικά , οι

καταναλωτές θα ήθελαν να μοιραστούν τις προσωπικές πληροφορίες και προτιμήσεις τους αν συνειδητοποιούσαν ότι υπάρχουν αρκετά οφέλη που μπορούν να επιτευχθούν σε αντάλλαγμα.

Έχει περαιτέρω τεκμηριωθεί ότι οι άνθρωποι συμμετέχουν σε κοινωνικές

συναλλαγές, μονό όταν οι προσδοκόμενες ανταμοιβές τους υπερβαίνουν η τουλάχιστον αντισταθμίζουν την απώλεια εξαιτίας της συμμετοχής.

Η πρόθεση των καταναλωτών να χρησιμοποιήσουν τις υπηρεσίες προσωποποίησης , εξαρτάται από την ιδιαίτερη αξία που θέτουν τα άτομα στα προϊόντα ,τις υπηρεσίες και τις αγοραστικές εμπειρίες .

Page 110: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 110

ΒΙΒΛΙΟΓΡΑΦΙΑ

C.M. Christensen, 2000, After the Gold Rush: Patterns of Success and Failure on the Internet.

The Boston Consulting Group Inc, 2000. Winning in the

New Economy: Consumer Marketers Face the Challenges C. Allen, D. Kania, B. Yaeckel, Internet World Guide to

One-To-One Web Marketing (Internet World Series) 1998, Mecklermedia.

C.M. Christensen, in: The Innovator’s Dilemma, Harvard

Business School Press, Cambridge, MA, 1998 M.E. Porter, Strategy and the Internet, Harvard Business

Review, March 2001 N.H. Borden, The concept of the Marketing Mix, Journal of

Advertising Research 4 X. McCarthy, in: Basic Marketing, a Managerial Approach,

Irwin, Homewood, IL C. Gro¨nroos, in: From Marketing Mix to Relationship

Marketing—Towards a Paradigm Shift in Marketing, Man- agement Decision 34/5, MCB University Press, Bradford, UK, 1997

R.E. Goldsmith, The personalised marketplace: beyond the

4Ps, Marketing Intelligence and Planning K. Ohmae, in: The Mind of the Strategist: The Art of

Japanese Business, McGraw-Hill, New York A.R. Bennet, The five Vs—a buyer’s perspective of the

marketing mix, Marketing Intelligence and Planning D. Hoffman, T. Novak, A New Marketing Paradigm for

Electronic Commerce. The Information Society, Special Issue for electronic Commerce

J. Sterne, in: World Wide Web Marketing: Integrating the

Web into Your Marketing Strategy, 2nd Edition, Wiley, New York, 1999.

Page 111: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 111

K. Bayne, in: The Internet Marketing Plan, Wiley, New York, 1997.

T. Vassos, in: Strategic Internet Marketing, Que, Indianapolis,

IN, 1996

D. Chaffey, R. Mayer, K. Johnston, F. Ellis-Chadwick, in: Internet Marketing, Strategy, Implementation and Practice, FT/ Prentice Hall, Englewood Cliffs, NJ, 2000

R.W. Oliver, The Seven Laws of E-Commerce Strategy,

Journal of Business Strategy 29 B. Mahadevan, Business models for internet based E-Com-

merce an anatomy, California Management Review 42 M. Rappa, Business models on the web, 2001 http: / /

digitalenterprise.org /models/models.html E. Lawrence, B. Corbitt, J.A. Fisher, J. Lawrence, A.

Tidwell, in: Internet Commerce, 2nd Edition, Wiley, Aus- tralia, 1999.

P. Bickerton, M. Bickerton, U. Pardesi, in: CyberMarketing,

Chartered Institute of Marketing Series, Buttenworth– Heineman, Oxford, 1996

T. Patty, 1997. Mastering the Five P’s of Marketing. J. O’Connor, E. Galvin, in: Marketing and Information

Technology—The Strategy, Application and Implementation of IT in Marketing, Pitman, London, 1997

D. Hoffman, T. Novak, A. Schlosser, 2000, Consumer

Control in Online Environments, Working Paper, eLab, Owen Graduate School of Management, Vanderbilt Univer- sity.

P. Kotler, in: Marketing Management, 2000. The Millennium

Edition, Prentice-Hall, Englewood Cliffs, NJ, 2000. Watchfire Whitepaper Series, 2000. Bad Things Shouldn’t

Happen to Good Web sites, Best Practices for Managing the Web Experience.

Forrester Research, May 2000, Targeting European Con-

sumers–Market Overview, Edwin van der Harst, www. forrester.com

Page 112: 3.9 45 448 4.1 Personalization Data Mining 49 4.2 51...2.1 Διαφήμιση μέσω του διαδικτύου - Online Διαφήμιση..... 15 2.1.1 Ορισμός και ιστορία

Προσωποποιημένο E- Marketing ΤΕΙ ΜΕΣΟΛΟΓΓΙΟΥ

Καλόφας Κωνσταντίνος - Πετρίδης Σταύρος 112

C. Shapiro, R. Varian, in: Information Rules: A Strategic Guide to the Network Economy, Harvard Business School Press, Boston, MA, 1999

O. R. Zaiane, M. Xin, and J. Han. Discovering web access patterns and

trends by applying olap and data mining technology on web logs. Santa Barbara, CA, 1998.

ΔΙΑΔΙΚΤΥΑΚΕΣ ΠΗΓΕΣ

SITES

Http: / /www.etforecasts.com Http: / /www.emarketer.com Http: / /ecommerce.internet.com Http: / /news.ft.com Http: / /www.webmergers.com Http: / /www.innosight.com Http: / /www.ecademy.com Http: / / www.i-strategies.com Http: / /www.jaderiver.com Http: / /www.ub.rug.nl Http: / /digitalenterprise.org Http: / /www.innosight.com

LINKS

http://www.mindworks.gr/blog/index.php http://www.davechaffey.com/E-business/ http://www.davechaffey.com/My-Training http://www.apinfo.co.uk/pressreleases/pressreleases.htm http://www.clickz.com/experts/ http://crm.ittoolbox.com/nav/t.asp?t=493&p=493&h1=493 http://www.destinationcrm.com/newsletter/newsletter_index.asp http://www.destinationcrm.com/newsletter/ http://www.ebusinessforum.gr/index.php?op=modload&modname=Sitemap&action=sitemapviewpage&pageid=93&page=14&language=el http://www.google.com.gr/search?hl=el&q=one-to-one+marketing&meta http://www.managingchange.com/onetoone/overview.htm http://en.wikipedia.org/wiki/Personalized_marketing http://www.b2bedocuments.com/html/personalizedmarketing.html http://www.go-online.gr/goonline/newsletter/newsletter_14.html#section13