Δημήτριος Λορέντζος

15
Εφαρμογή της Θεωρίας Βέλτιστης Παύσης στον έλεγχο συνέπειας (consistency) σε WWW Caching Servers Δημήτριος Λορέντζος ΠΛΣ Διπλωματική Εργασία Επιβλέπων: Χατζηευθυμιάδης Ευστάθιος Μέλη ΕΚ: Μοσχολιός Ιωάννης, Καψάλης Βασίλειος

description

ΠΛΣ Διπλωματική Εργασία. Εφαρμογή της Θεωρίας Βέλτιστης Παύσης στον έλεγχο συνέπειας ( consistency) σε WWW Caching Servers. Δημήτριος Λορέντζος. Επιβλέπων: Χατζηευθυμιάδης Ευστάθιος Μέλη ΕΚ: Μοσχολιός Ιωάννης, Καψάλης Βασίλειος. Επισκόπηση. Θέμα (στόχοι) 1 slide - PowerPoint PPT Presentation

Transcript of Δημήτριος Λορέντζος

Page 1: Δημήτριος Λορέντζος

Εφαρμογή της Θεωρίας Βέλτιστης Παύσης στον έλεγχο συνέπειας (consistency) σε WWW Caching Servers

Δημήτριος Λορέντζος

ΠΛΣ Διπλωματική Εργασία

Επιβλέπων: Χατζηευθυμιάδης ΕυστάθιοςΜέλη ΕΚ: Μοσχολιός Ιωάννης, Καψάλης Βασίλειος

Page 2: Δημήτριος Λορέντζος

2

Επισκόπηση

Θέμα (στόχοι) 1 slide Σχετιζόμενα πεδία – ευρύτερο αντικείμενο 1 slide Μεθοδολογία 6 slides Αποτελέσματα 3 slides Συμπεράσματα 1 slide

Page 3: Δημήτριος Λορέντζος

Θέμα

Aξιολόγηση της εφαρμογής της Θεωρίας της Βέλτιστης Παύσης για τη διατήρηση της συνέπειας Web αντιγράφων, σε σύγκριση με την τεχνική του Adaptive TTL (ATTL).

υλοποιείται και αξιολογείται σύστημα που εφαρμόζει την τεχνική του ΑΤΤL,

προτείνεται συνάρτηση που παρακολουθεί πόσο επιτακτική είναι η ενημέρωση ενός αντιγράφου και

υλοποιείται και αξιολογείται σύστημα που εφαρμόζει αλγόριθμο, ο οποίος παρατηρεί τις τιμές που λαμβάνει η παραπάνω συνάρτηση και επιβάλλει ένα κριτήριο παύσης.

Page 4: Δημήτριος Λορέντζος

Ευρύτερο Αντικείμενο

Web Caching : χρήση αντιγράφων αποθηκευμένων σε ενδιάμεσους εξυπηρετητές (caching servers)

Πλεονεκτήματα Web Caching : Χρήστες : μείωση καθυστέρησης απόκρισης από απομακρυσμένοserver, δεν απαιτείται εκ νέου επικοινωνία με origin server ISPs : μείωση κίνησης στο δίκτυό τους, μείωση εύρους ζώνηςπου δεσμεύει από άλλους ISPs Πηγαίοι Εξυπηρετητές : μειωμένος αριθμός αιτήσεων που εξυπηρετούν, μειωμένο κόστος συντήρησης

Πρόβλημα Web Caching : Διατήρηση συνέπειας αντιγράφου σε σχέση με το αυθεντικό

Μηχανισμός Ασθενούς Συνέπειας : Adaptive TTL χρόνος ζωής = k * (send_time – last_modified_time)

Page 5: Δημήτριος Λορέντζος

Μεθοδολογία 1/6

Πηγή – Αρχείο ΤροποποιήσεωνΧρονικές αφίξεις: εκθετική κατανομή , μελ = 0.0026 αφίξεις/minΜέση Χρονική Απόσταση διαδοχικών Tροποποιήσεων: 391 min

xe)x(f

Caching Server – Αρχείο ΑιτήσεωνΑντικείμενα σε κάθε site: κατανομή ZipfMέση Χρονική Απόσταση διαδοχικών Αιτήσεων: κατανομή Pareto, 38min10000 αιτήσεις

Προσομοίωση - ΑξιολόγησηΑριθμός stale hitΑριθμός ελέγχων για το αν τροποποιήθηκε ή όχι ένα αντικείμενο στην πηγή μετά τη λήξη του χρόνου ζωής του

Υλοποίηση Μηχανισμού Adaptive TTL

Page 6: Δημήτριος Λορέντζος

Μεθοδολογία 2/6

Θεωρία Βέλτιστης Παύσης : Λήψη απόφασης έπειτα από παρατήρηση μιας διαδικασίας

που εξελίσσεται χρονικά με τυχαίο τρόπο Μεγιστοποίηση κέρδους ή ελαχιστοποίηση κόστους Χρόνος παύσης : καθορίζει αν πρέπει να σταματήσουμε μετά

το βήμα n σε μια ακολουθία παρατηρήσεων Χ1, Χ2, ..., Χn

Αλγόριθμος Odds : παύση σε συγκεκριμένο γεγονός που παρατηρείται τελευταίο σε μια ακολουθία γεγονότων

pk: πιθανότητα η παρατήρηση να είναι «ενδιαφέρουσα»

qk = 1 – pk

rk = pk/qk

παρατηρήσεις: k = 1, …, n

Page 7: Δημήτριος Λορέντζος

Παύση στην πρώτη «ενδιαφέρουσα» παρατήρηση όταν k ≥

s, όπου s το βήμα για το οποίο ισχύει < 1. Αν δεν

υπάρχει s τότε η παύση γίνεται στο βήμα n.

Μεθοδολογία 3/6

Αλγόριθμος Odds με σειριακή εκτίμηση των odds: Παραλλαγή αλγορίθμου Odds όταν pk άγνωστο

s

1

s

1

fk

vp

n

1skr

Εκτίμηση p με βάση τον αριθμό των «ενδιαφέροντων»

παρατηρήσεων μέχρι το βήμα s:

Προσδιορισμός «μελλοντικών τιμών» pk, qk και rk με

βάση προγενέστερες παρατηρήσεις : pk = p*fk, με fk γνωστό.

Page 8: Δημήτριος Λορέντζος

Μεθοδολογία 4/6

Συνάρτηση που παρακολουθεί την ανάγκη για ενημέρωση του κάθε αντιγράφου i που ανήκει στο site x

i4i3i2i1i wwkwhwU

ήύ

xsiteήk

xsiteή

xsiteέhitsh

x,i

x,i

i

ix,i

ix,i

)time_loadtime_ires(exp)time_currenttime_ires(exp

1

time_irationexp_average)time_loadtime_current(

Page 9: Δημήτριος Λορέντζος

Μεθοδολογία 5/6

Πηγή – Αρχείο Τροποποιήσεων Όπως στο Adaptive TTL Χρονικό διάστημα για τα οποία τα αντίγραφα θεωρούνται έγκυρα ορίστηκε ως k*ttl, όπου ttl είναι 200 φορές μεγαλύτερο από το χρόνο μεταξύ διαδοχικών τροποποιήσεων, όπου k είναι τυχαίος αριθμός με k [1,2]

Caching Server – Αρχείο Αιτήσεων Όπως στο Adaptive TTL

Προσομοίωση - Βήματα Αίτηση για νέο αντικείμενο: expires_time, expiration_time Αίτηση για αντικείμενο που ήδη υπάρχει: ελέγχει για stale hit Σε τακτά χρονικά διαστήματα υπολογίζει U για κάθε αντικείμενοκαι εφαρμόζει τον Αλγόριθμο

Υλοποίηση Odds with Sequential Estimation of Odds

Page 10: Δημήτριος Λορέντζος

Μεθοδολογία 6/6

Προσομοίωση - Παράμετροι Χρονικό Διάστημα μεταξύ υπολογισμών συνάρτησης U

1000 min, 3000 min, 6000 min Πλήθος n των τιμών της συνάρτησης U για τo οποίο ο Αλγόριθμος

εφαρμόζεται για κάθε αντικείμενο 7 τιμές, 10 τιμές, 15 τιμές

Τιμή Ικ πάνω από την οποία έχουμε «ενδιαφέρουσα» παρατήρηση για τη συνάρτηση U

0.8, 0.75, 0.7, 0.6, 0.5, 0.25

Προσομοίωση - Αξιολόγηση Αριθμός stale hits Αριθμός ελέγχων για το αν έχει τροποποιηθεί το αντικείμενο στην

πηγή μετά από απόφαση του Αλγορίθμου, δηλαδή όταν

<1

n

1skr

Page 11: Δημήτριος Λορέντζος

Αποτελέσματα 1/3Χρονικό Διάστημα 6000

0

200

400

600

800

1000

1200

1400

1600

1800

0 0.2 0.4 0.6 0.8 1

Τιμή Ik "ενδιαφέροντων" παρατηρήσεων

Stal

e H

its

Πλήθος 15

Πλήθος 10

Πλήθος 7

ATTL - 509 stale hits

Χρονικό διάστημα: 6000

Χρονικό Διάστημα 6000

0 359 422 766 880 8800

666 1264 1334 14090

882 9101569 1944 2098

709

0

2000

4000

6000

8000

10000

12000

14000

0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25

Τιμή Ik "ενδιαφέροντων" παρατηρήσεων

Αρι

θμός

Αντ

ικει

μένω

ν πο

υ ελ

έγχθ

ησαν

UpdatedNot changedTotalπλήθος 10πλήθος 15 πλήθος 7

ATTL - 467 ελεγχμένα αντικείμενα

Page 12: Δημήτριος Λορέντζος

Αποτελέσματα 2/3Χρονικό Διάστημα 3000

0

200

400

600

800

1000

1200

1400

1600

1800

0 0.2 0.4 0.6 0.8 1

Τιμή Ik "ενδιαφέροντων" παρατηρήσεων

Stal

e H

its

Πλήθος 15

Πλήθος 10

Πλήθος 7

ATTL - 509 stale hits

Χρονικό Διάστημα 3000

0784 989 1622 1779 1920

01192

2326 2774 2961

0

1604 19313357

4015 4354

1424

0

2000

4000

6000

8000

10000

12000

14000

0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25

Τιμή Ik "ενδιαφέροντων" παρατηρήσεων

Αριθ

μός Α

ντικ

ειμέ

νων

που

ελέγ

χθησ

αν

UpdatedNot changedTotalπλήθος 10πλήθος 15 πλήθος 7

ATTL - 467 ελεγχμένα αντικείμενα

Χρονικό διάστημα: 3000

Page 13: Δημήτριος Λορέντζος

Αποτελέσματα 3/3

0

200

400

600

800

1000

1200

1400

1600

1800

0 0.2 0.4 0.6 0.8 1Τιμή Ik "ενδιαφέροντων" παρατηρήσεων

Stal

e H

its

Πλήθος 15

Πλήθος 10

Πλήθος 7

ATTL - 509 stale hits

Χρονικό διάστημα: 1000

Χρονικό Διάστημα 1000

0

2300 2795

47795629 6138

0

3454

71198471

9311

0

49015903

10104

1214213397

4121

0

2000

4000

6000

8000

10000

12000

14000

0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25 0.8 0.75 0.7 0.6 0.5 0.25

Τιμή Ik "ενδιαφέροντων" παρατηρήσεων

Αρι

θμός

Αντ

ικει

μένω

ν πο

υ ελ

έγχθ

ησαν Updated

Not changedTotal

πλήθος 10πλήθος 15 πλήθος 7

ATTL - 467 ελεγχμένα αντικείμενα

Page 14: Δημήτριος Λορέντζος

• Όταν η τιμή Ik πάνω από την οποία η παρατήρηση της U θεωρείται «ενδιαφέρουσα» είναι μικρή, ο αλγόριθμος καταλήγει πιο γρήγορα στο <1, λόγω του ότι σημειώνονται περισσότερες «επιτυχίες». Γίνονται επομένως περισσότεροι έλεγχοι και ενημερώνονται πιο πολλά αντίγραφα.

14

Συμπεράσματα Στις περισσότερες περιπτώσεις, με την εφαρμογή του αλγορίθμου Odds

with sequential estimation πετυχαίνουμε καλύτερη συμπεριφορά από το ATTL

ως προς τα stale hits.

n

1skr

• Ωστόσο, λαμβάνει χώρα ένας μεγάλος αριθμός ελέγχων, πολλαπλάσιος σε κάποιες περιπτώσεις του αριθμού ελέγχων στο ATTL.

• Μικραίνοντας το χρονικό διάστημα μεταξύ των υπολογισμών της U, ο αλγόριθμος εκτελείται πιο συχνά και περισσότερες φορές. Κατά συνέπεια, όλο και περισσότεροι έλεγχοι γίνονται και περισσότερα αντίγραφα ενημερώνονται, με αποτέλεσμα να μειωθεί ο αριθμός των stale hits.

• Τέλος, για μικρότερες τιμές του πλήθους τιμών n για τις οποίες εφαρμόζεται ο αλγόριθμος, η παύση γίνεται σε μικρότερο βήμα με αποτέλεσμα να εκτελούνται περισσότεροι έλεγχοι και να ενημερώνονται πιο πολλά αντίγραφα..

Page 15: Δημήτριος Λορέντζος

Τέλος Παρουσίασης