Post on 03-Jan-2016
description
Τζόγος, Κυκλωματα και Facebook2η Διάλεξη
Α. ΓελαστόπουλοςΡ. ΓρηγορίουΘ. Κεχαγιάς
Μάρτης 2009
Facebook by Touchgraph
Περίπατος στο Facebook
Ερώτημα: Ποιος είναι ο Βασικός Facebooker?
Παράδειγμα: Που βαδίζουμε κύριοι
Παράδειγμα: Web Surfing
Παράδειγμα: Αναφορές σε μια Εργασία
Παράδειγμα: Αριθμός Erdos
Πως να το μοντελοποιήσουμε?
Τυχαίοι περίπατοιΓράφοι
Αλυσίδες Markov
Γράφοι
1 2
1 2
( , )
Κόμβοι: , ,...,
Ακμές: , ,...,
δηλ.
N
M
i m n
G V E
V V V V
E E E E
E V V e v v
Π.χ. V={Θανάσης, Ορέστης, Χριστίνα, ...}, Ε={ΘανΟρε, ΘανΧρι, ΟρεΧρι,...}
Με γράφους μπορούμε να μοντελοποιήσουμε:•Ηλ. Κυκλώματα•Το Facebook•Το Internet / Web•Το …
Facebook by Touchgraph
Αλυσίδες Markov
Ενας τυχαίος περίπατος πάνω σε γράφο
1
0
( , )
για 0,1,2,...
Πίνακας μετάβασης: Pr
Αρχικές πιθανότητες: Pr
t
mn t m t n
m m
G V E
X V t
P X v X v
X v
Μαρκοβιανή ιδιότητα: το παρελθόν δεν μετράει:
1 1 11 1 1Pr ,..., Pr
t t t tm t m t m t m t mX v X v X v X v X v
Τυχαίος Περίπατος στο Facebook (Touchgraph)
0 1 2
0 0 1 1
0 0 1 1 2 1
1
0
0 1 2
0 0 1 1
Πίνακας μετάβασης: Pr
Αρχικές πιθανότητες: Pr
Pr( , , ,..., )
Pr Pr ...Pr
...
T
T t
T T
mn t m t n
m m
m m m T m
m m m T m T m
m m m m m m m
P X v X v
X v
X v X v X v X v
X v X v X v X v X v
P P P
1 11
Pr( ) Pr( ) Pr( )N
t m t n t n t mn
X v X v X v X v
1 2
( ) Pr( )
( ) ( ) ( ) ... ( )
( ) ( 1)
( )
m t m
N
t
p t X v
t p t p t p t
t t
t
p
p p P
p πP
Παράδειγμα 1
1 0 0 0 0
1/ 2 0 1/ 2 0 0
0 1/ 2 0 1/ 2 0
0 0 1/ 2 0 1/ 2
0 0 0 0 1
P
Παράδειγμα 2
0 1 0 0 0 0
1 / 2 0 1 / 2 0 0 0
0 1 / 2 0 1 / 2 0 0
0 0 1 / 2 0 1 / 2 0
0 0 0 1 / 2 0 1 / 2
0 0 0 0 1 0
P
0 1 2 3 4 5
Παράδειγμα 3
1 0 0 0
0 1 0 0
1 / 4 1 / 4 0 1 / 2
1 / 5 2 / 5 2 / 5 0
P
Παράδειγμα 4
0 0 1 / 2 1 / 2
0 0 1 / 3 2 / 3
1 / 4 1 / 4 0 1 / 2
1 / 5 2 / 5 2 / 5 0
P
Παράδειγμα 5
0 1
1 0
P
Παράδειγμα 6
0 1 0 0 0
1 0 0 0 0
0 1 / 2 0 1 / 2 0
0 0 0 0 1
0 0 0 1 0
P
0 1 3 42
( ) ( 1)
lim ( )
lim ( ) lim ( 1)
είναι η πιθανότητα ισορροπίας
lim
t
t t
tt
t t
t
t t
p p P
p p
p p P p pP
p
P P
Ασυμπτωτική Συμπεριφορά
Θεώρημα: Αν υπάρχει s > 0 τέτοιο ώστε Ps > 0, τότε υπάρχουν pn (n=1,2,…,N) τέτοια ώστε για m, n = 1, …, N:
limt∞[Pt]mn= pn
Ερώτημα: Ποιος είναι ο βασικός Facebooker?
1η Απάντηση: Αυτός που έχει περισσότερη πιθανότητα
(αυτός που έχει μέγιστη πιθανότητα ισορροπίας)
Matlab Code
Παράδειγμα 7
10 20 30 40 50 60
10
20
30
40
50
60
Ερώτημα: Ποιος είναι ο βασικός Facebooker?
2η Απάντηση: Αυτός που είναι το κέντρο του γράφου
???
Ευκλείδεια Γεωμετρία:Το κέντρο ενός κύκλου?
Το κέντρο ενός παραλληλογράμμου?
Το κέντρο ενός τυχόντος σχήματος?
Κέντρο – Ορισμός 1:
Δίνεται σχήμα S (ένα σύνολο σημείων) Το κέντρο του S είναι το σημείο M το οποίο ελαχιστοποιεί την ποσότητα
max ( , )N S d M N
max ( , ) min max ( , )N S M S N Sd M N d M N
δηλαδή
Κέντρο – Ορισμός 2 (Βαρύκεντρο):
Δίνεται σχήμα S (ένα σύνολο σημείων) Το κέντρο του S είναι το σημείο M το οποίο ελαχιστοποιεί την ποσότητα
2 ( , )N S
d M N
2 2( , ) min ( , )N S M S N S
d M N d M N
δηλαδή
Γεωμετρία των Γράφων:
Η απόσταση δύο κόμβων u,v ενός γράφου είναι το μήκος του μικρότερου μονοπατιού από το u,v
1 2
1
Μονοπάτι μεταξύ , : ...
όπου: , ,
Μήκος του μονοπατιού: 1
K
K m n
u v V w w w
w u w v w w
K
u
v
d(u,v)=3
1 2
1 1 2
Ευθύγραμμο τμήμα από το στο : ...
όπου: , , το ... είναι μονοπάτι ελαχίστου μήκους
Μπορεί να υπάρχουν περισσότερα από ένα ευθ. τμήματα από το στο
K
K K
u v w w w
w u w v w w w
u v
u
v
Αρχικοποίηση:dist = …
for (k=1:n) for (i=1:n) for (j=1:n) through_k = dist(i,k)+dist(k,j); if (through_k < dist(i,j)) dist(i,j) = through_k;
end end
endend
Αλγόριθμος FloydΥπολογισμός των αποστάσεων σε ένα Γράφο:
Γεωμετρία των Γράφων:
Δίνεται γράφος G (V,E). Το κέντρο του G είναι ο κόμβος u ο οποίος ελαχιστοποιεί την ποσότητα
max ( , )v V d u v
max ( , ) min max ( , )v V u V v Vd u v d u v
δηλαδή
Παράδειγμα 1
1 2 3
6 5 4 8
7
9
Παράδειγμα 2
0 1 0 0 0
1 0 0 0 0
0 1 0 1 0
0 0 0 0 1
0 0 0 1 0
P
0 1 3 42
Παράδειγμα 3(Facebook)
ΕρώτησηΠοια είναι η σχέση των δύο λύσεων
του βασικού Facebooker?
, τότε N m N n P m P n
όπου N το σύνολο των φίλων του i i
Εκμεταλλευόμαστε τη συμμετρία.Οι 3 πρώτες εξισώσεις είναι γραμμικώς εξαρτημένες. Η τέταρτη λέει ότι το άθροισμα των πιθανοτήτων είναι 1
α
αα
α
α
αα
α
β
β β
4b
a
pp
3
4b
c
pp
33
cb a
pp p
9 3 1a b cp p p
Λύση:
1
24ap 1
6bp 1
8cp
Αλλά το γ είναι το κέντρο, είτε με min(max(dist)) είτε με min(sum(dist)). Άρα «κέντρο != μέγιστη πιθανότητα»
α
α
α
αα
α
αα
β
β
β
γ
Ερώτηση ? Το θεώρημα δεν απαντάει στη σχέση μεταξύ των 2
λύσεων
Αν , τότε -N m n N n m P m P n
όπου N το σύνολο των φίλων του i i
Six Degrees of Separation
Yet the world is small: 6˚
The planet is very large: 6.5b!
Six degrees of separation
Ο συντομότερος δρόμος για να συνδεθούν μεταξύ τους δύο τυχαίοι άνθρωποι στην γη αποτελείται το πολύ από 6 ακμές.
1 2 3 4 5Α Β
Έρευνα: Milgram(1967) 300 γράμματα από Δυτική Αμερική με τον ίδιο προορισμό που βρισκόταν στην Μασαχουσέτη.
Συμπεράσματα: Έφτασαν μόνο τα 64, με μέσω αριθμό ενδιάμεσων αλλαγών 5,5.
Έλλειψη αξιοπιστίας λόγω μικρού αριθμού δείγματος.
Έρευνα: Watts(2001) Αποστολή 28.000 e-mails σε 157 χώρες απ’ όλο τον κόσμο με τελικό στόχο 19 παραλήπτες.
Συμπεράσματα: Ο μέσος όρος των ενδιάμεσων αποστολών ίσος με 6.
Αξιόπιστο πείραμα, η θεωρία δείχνει να επαληθεύεται.
• 14.562 χρήστες (κόμβοι)• 601.735 ακμές• Διάμετρος 8
Συμπεράσματα:
• Για δύο τυχαίους χρήστες μέσος όρος της απόστασης 2,85. Το 0,69% των χρηστών αποτελούν αποκομμένα ζεύγη, για τα οποία δεν ισχύει η θεωρία.
Έρευνες σε social networks
MSN
• 240 εκατ. χρήστες (κόμβοι)• 30 δισ. συζητήσεις (ακμές) σε έναν μήνα • Υπολογισμός αποστάσεων χρηστών με τον
αλγόριθμο Floyd
Συμπεράσματα:
Για δύο τυχαίους χρήστες μέσος όρος της απόστασης 6,6. Ωστόσο για το 22% των χρηστών η θεωρία καταρρίπτεται.
Είναι τα αποτελέσματα αξιόπιστα..?
Όχι γιατί…
0
5
10
15
20
25
30
35
40
0-14 15-24 25-49 50-64 65-79 80+
Ηλικίες
Πο
σο
στό
% τ
ου
πλη
θυσ
μο
ύ
Διάγραμμα κατανομής ΜΣΝ χρηστών / απόλυτες τιμές
Διάγραμμα κατανομής ΜΣΝ χρηστών / ανηγμένο κατά κεφαλή
Μαθηματική προσέγγιση:
kΟ μέσος αριθμός γνωστών
NΟ πληθυσμός της γης
Για να αποδειχθεί η θεωρία αρκεί να δείξουμε ότι:
k*k*k*k*k*k = N k6 = N
1 2 3 4 5Α Β
Αν L μέση απόσταση 2 κόμβων C συντελεστής ομαδοποίησης του τυχαίου κόμβου
ΤυχαίοΣυγκεκριμένο
Συγκεκριμένο
• L n / k• C = 3/6 = 1/2
Τυχαίο
• L lnn / lnk
• C ≈ k / n 0
Six clicks of separation
Παραδείγματα:
• Six degrees of Kevin Bacon• Six degrees of Wikipedia• Μαθηματικοί Γενικού τμήματος• WWW ???
Six degrees of Kevin Bacon
O Kevin Bacon έχει τον αριθμό 0.
• Ένας/Μια ηθοποιός (Α) που έχει εμφανιστεί μαζί του σε κάποια ταινία έχει τον αριθμό 1.
• Ένας/Μια ηθοποιός (Β) που έχει εμφανιστεί σε κάποια ταινία μαζί με τον Α έχει τον αριθμό 2.
• κλπ
http://oracleofbacon.org
Six degrees of Wikipedia
• Ξεκινάμε από ένα άρθρο με ένα συγκεκριμένο θέμα που έχει αριθμό 0.
• Χρησιμοποιούμε ένα από τα links που εμφανίζονται στο άρθρο για να πάμε σε ένα άλλο με αριθμό 1.
• Φαίνεται ότι μέσω το πολύ 6 “κλικ” μπορούμε να καταλήξουμε σε κάτι τελείως άσχετο.
http://www.netsoc.tcd.ie/~mu/wiki
Μαθηματικοί Γενικού Τμήματος
• Ο μαθηματικός από τον οποίο ξεκινάμε έχει τον αριθμό 0
• Ένας μαθηματικός που έγραψε ένα σύγγραμμα μαζί του έχει τον αριθμό 1
• Κλπ
http://www.ams.org/mathscinet/collaborationDistance.html
Λίγα λόγια για τoν συντελεστή ομαδοποίησης(C)
Όπου:
kiΟ αριθμός των ακμών που υπάρχουν μεταξύ των γειτόνων του i
niΟ αριθμός όλων των δυνατών ακμών μεταξύ των γειτόνων
ii
i
kC
n