Δημήτριος Λορέντζος
description
Transcript of Δημήτριος Λορέντζος
Εφαρμογή της Θεωρίας Βέλτιστης Παύσης στον έλεγχο συνέπειας (consistency) σε WWW Caching Servers
Δημήτριος Λορέντζος
ΠΛΣ Διπλωματική Εργασία
Επιβλέπων: Χατζηευθυμιάδης ΕυστάθιοςΜέλη ΕΚ: Μοσχολιός Ιωάννης, Καψάλης Βασίλειος
2
Επισκόπηση
Θέμα (στόχοι) 1 slide Σχετιζόμενα πεδία – ευρύτερο αντικείμενο 1 slide Μεθοδολογία 6 slides Αποτελέσματα 3 slides Συμπεράσματα 1 slide
Θέμα
Aξιολόγηση της εφαρμογής της Θεωρίας της Βέλτιστης Παύσης για τη διατήρηση της συνέπειας Web αντιγράφων, σε σύγκριση με την τεχνική του Adaptive TTL (ATTL).
υλοποιείται και αξιολογείται σύστημα που εφαρμόζει την τεχνική του ΑΤΤL,
προτείνεται συνάρτηση που παρακολουθεί πόσο επιτακτική είναι η ενημέρωση ενός αντιγράφου και
υλοποιείται και αξιολογείται σύστημα που εφαρμόζει αλγόριθμο, ο οποίος παρατηρεί τις τιμές που λαμβάνει η παραπάνω συνάρτηση και επιβάλλει ένα κριτήριο παύσης.
Ευρύτερο Αντικείμενο
Web Caching : χρήση αντιγράφων αποθηκευμένων σε ενδιάμεσους εξυπηρετητές (caching servers)
Πλεονεκτήματα Web Caching : Χρήστες : μείωση καθυστέρησης απόκρισης από απομακρυσμένοserver, δεν απαιτείται εκ νέου επικοινωνία με origin server ISPs : μείωση κίνησης στο δίκτυό τους, μείωση εύρους ζώνηςπου δεσμεύει από άλλους ISPs Πηγαίοι Εξυπηρετητές : μειωμένος αριθμός αιτήσεων που εξυπηρετούν, μειωμένο κόστος συντήρησης
Πρόβλημα Web Caching : Διατήρηση συνέπειας αντιγράφου σε σχέση με το αυθεντικό
Μηχανισμός Ασθενούς Συνέπειας : Adaptive TTL χρόνος ζωής = k * (send_time – last_modified_time)
Μεθοδολογία 1/6
Πηγή – Αρχείο ΤροποποιήσεωνΧρονικές αφίξεις: εκθετική κατανομή , μελ = 0.0026 αφίξεις/minΜέση Χρονική Απόσταση διαδοχικών Tροποποιήσεων: 391 min
xe)x(f
Caching Server – Αρχείο ΑιτήσεωνΑντικείμενα σε κάθε site: κατανομή ZipfMέση Χρονική Απόσταση διαδοχικών Αιτήσεων: κατανομή Pareto, 38min10000 αιτήσεις
Προσομοίωση - ΑξιολόγησηΑριθμός stale hitΑριθμός ελέγχων για το αν τροποποιήθηκε ή όχι ένα αντικείμενο στην πηγή μετά τη λήξη του χρόνου ζωής του
Υλοποίηση Μηχανισμού Adaptive TTL
Μεθοδολογία 2/6
Θεωρία Βέλτιστης Παύσης : Λήψη απόφασης έπειτα από παρατήρηση μιας διαδικασίας
που εξελίσσεται χρονικά με τυχαίο τρόπο Μεγιστοποίηση κέρδους ή ελαχιστοποίηση κόστους Χρόνος παύσης : καθορίζει αν πρέπει να σταματήσουμε μετά
το βήμα n σε μια ακολουθία παρατηρήσεων Χ1, Χ2, ..., Χn
Αλγόριθμος Odds : παύση σε συγκεκριμένο γεγονός που παρατηρείται τελευταίο σε μια ακολουθία γεγονότων
pk: πιθανότητα η παρατήρηση να είναι «ενδιαφέρουσα»
qk = 1 – pk
rk = pk/qk
παρατηρήσεις: k = 1, …, n
Παύση στην πρώτη «ενδιαφέρουσα» παρατήρηση όταν k ≥
s, όπου s το βήμα για το οποίο ισχύει < 1. Αν δεν
υπάρχει s τότε η παύση γίνεται στο βήμα n.
Μεθοδολογία 3/6
Αλγόριθμος Odds με σειριακή εκτίμηση των odds: Παραλλαγή αλγορίθμου Odds όταν pk άγνωστο
s
1
s
1
fk
vp
n
1skr
Εκτίμηση p με βάση τον αριθμό των «ενδιαφέροντων»
παρατηρήσεων μέχρι το βήμα s:
Προσδιορισμός «μελλοντικών τιμών» pk, qk και rk με
βάση προγενέστερες παρατηρήσεις : pk = p*fk, με fk γνωστό.
Μεθοδολογία 4/6
Συνάρτηση που παρακολουθεί την ανάγκη για ενημέρωση του κάθε αντιγράφου i που ανήκει στο site x
i4i3i2i1i wwkwhwU
ήύ
xsiteήk
xsiteή
xsiteέhitsh
x,i
x,i
i
ix,i
ix,i
)time_loadtime_ires(exp)time_currenttime_ires(exp
1
time_irationexp_average)time_loadtime_current(
Μεθοδολογία 5/6
Πηγή – Αρχείο Τροποποιήσεων Όπως στο Adaptive TTL Χρονικό διάστημα για τα οποία τα αντίγραφα θεωρούνται έγκυρα ορίστηκε ως k*ttl, όπου ttl είναι 200 φορές μεγαλύτερο από το χρόνο μεταξύ διαδοχικών τροποποιήσεων, όπου k είναι τυχαίος αριθμός με k [1,2]
Caching Server – Αρχείο Αιτήσεων Όπως στο Adaptive TTL
Προσομοίωση - Βήματα Αίτηση για νέο αντικείμενο: expires_time, expiration_time Αίτηση για αντικείμενο που ήδη υπάρχει: ελέγχει για stale hit Σε τακτά χρονικά διαστήματα υπολογίζει U για κάθε αντικείμενοκαι εφαρμόζει τον Αλγόριθμο
Υλοποίηση Odds with Sequential Estimation of Odds
Μεθοδολογία 6/6
Προσομοίωση - Παράμετροι Χρονικό Διάστημα μεταξύ υπολογισμών συνάρτησης U
1000 min, 3000 min, 6000 min Πλήθος n των τιμών της συνάρτησης U για τo οποίο ο Αλγόριθμος
εφαρμόζεται για κάθε αντικείμενο 7 τιμές, 10 τιμές, 15 τιμές
Τιμή Ικ πάνω από την οποία έχουμε «ενδιαφέρουσα» παρατήρηση για τη συνάρτηση U
0.8, 0.75, 0.7, 0.6, 0.5, 0.25
Προσομοίωση - Αξιολόγηση Αριθμός stale hits Αριθμός ελέγχων για το αν έχει τροποποιηθεί το αντικείμενο στην
πηγή μετά από απόφαση του Αλγορίθμου, δηλαδή όταν
<1
n
1skr
Αποτελέσματα 1/3Χρονικό Διάστημα 6000
0
200
400
600
800
1000
1200
1400
1600
1800
0 0.2 0.4 0.6 0.8 1
Τιμή Ik "ενδιαφέροντων" παρατηρήσεων
Stal
e H
its
Πλήθος 15
Πλήθος 10
Πλήθος 7
ATTL - 509 stale hits
Χρονικό διάστημα: 6000
Χρονικό Διάστημα 6000
0 359 422 766 880 8800
666 1264 1334 14090
882 9101569 1944 2098
709
0
2000
4000
6000
8000
10000
12000
14000
0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25
Τιμή Ik "ενδιαφέροντων" παρατηρήσεων
Αρι
θμός
Αντ
ικει
μένω
ν πο
υ ελ
έγχθ
ησαν
UpdatedNot changedTotalπλήθος 10πλήθος 15 πλήθος 7
ATTL - 467 ελεγχμένα αντικείμενα
Αποτελέσματα 2/3Χρονικό Διάστημα 3000
0
200
400
600
800
1000
1200
1400
1600
1800
0 0.2 0.4 0.6 0.8 1
Τιμή Ik "ενδιαφέροντων" παρατηρήσεων
Stal
e H
its
Πλήθος 15
Πλήθος 10
Πλήθος 7
ATTL - 509 stale hits
Χρονικό Διάστημα 3000
0784 989 1622 1779 1920
01192
2326 2774 2961
0
1604 19313357
4015 4354
1424
0
2000
4000
6000
8000
10000
12000
14000
0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25
Τιμή Ik "ενδιαφέροντων" παρατηρήσεων
Αριθ
μός Α
ντικ
ειμέ
νων
που
ελέγ
χθησ
αν
UpdatedNot changedTotalπλήθος 10πλήθος 15 πλήθος 7
ATTL - 467 ελεγχμένα αντικείμενα
Χρονικό διάστημα: 3000
Αποτελέσματα 3/3
0
200
400
600
800
1000
1200
1400
1600
1800
0 0.2 0.4 0.6 0.8 1Τιμή Ik "ενδιαφέροντων" παρατηρήσεων
Stal
e H
its
Πλήθος 15
Πλήθος 10
Πλήθος 7
ATTL - 509 stale hits
Χρονικό διάστημα: 1000
Χρονικό Διάστημα 1000
0
2300 2795
47795629 6138
0
3454
71198471
9311
0
49015903
10104
1214213397
4121
0
2000
4000
6000
8000
10000
12000
14000
0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25
Τιμή Ik "ενδιαφέροντων" παρατηρήσεων
Αρι
θμός
Αντ
ικει
μένω
ν πο
υ ελ
έγχθ
ησαν Updated
Not changedTotal
πλήθος 10πλήθος 15 πλήθος 7
ATTL - 467 ελεγχμένα αντικείμενα
• Όταν η τιμή Ik πάνω από την οποία η παρατήρηση της U θεωρείται «ενδιαφέρουσα» είναι μικρή, ο αλγόριθμος καταλήγει πιο γρήγορα στο <1, λόγω του ότι σημειώνονται περισσότερες «επιτυχίες». Γίνονται επομένως περισσότεροι έλεγχοι και ενημερώνονται πιο πολλά αντίγραφα.
14
Συμπεράσματα Στις περισσότερες περιπτώσεις, με την εφαρμογή του αλγορίθμου Odds
with sequential estimation πετυχαίνουμε καλύτερη συμπεριφορά από το ATTL
ως προς τα stale hits.
n
1skr
• Ωστόσο, λαμβάνει χώρα ένας μεγάλος αριθμός ελέγχων, πολλαπλάσιος σε κάποιες περιπτώσεις του αριθμού ελέγχων στο ATTL.
• Μικραίνοντας το χρονικό διάστημα μεταξύ των υπολογισμών της U, ο αλγόριθμος εκτελείται πιο συχνά και περισσότερες φορές. Κατά συνέπεια, όλο και περισσότεροι έλεγχοι γίνονται και περισσότερα αντίγραφα ενημερώνονται, με αποτέλεσμα να μειωθεί ο αριθμός των stale hits.
• Τέλος, για μικρότερες τιμές του πλήθους τιμών n για τις οποίες εφαρμόζεται ο αλγόριθμος, η παύση γίνεται σε μικρότερο βήμα με αποτέλεσμα να εκτελούνται περισσότεροι έλεγχοι και να ενημερώνονται πιο πολλά αντίγραφα..
Τέλος Παρουσίασης