Μάνος Ρουμελιώτης Πανεπιστήμιο Μακεδονίας etl.uom.gr/mr
description
Transcript of Μάνος Ρουμελιώτης Πανεπιστήμιο Μακεδονίας etl.uom.gr/mr
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 11
Μάνος ΡουμελιώτηςΠανεπιστήμιο Μακεδονίαςhttp://www.etl.uom.gr/mr/
Αξιοπιστία Υπολογιστικών Συστημάτων
Αξιοπιστία Υπολογιστικών Συστημάτων
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 22
• Ορισμοί• Ελάττωμα, Σφάλμα και Αποτυχία• Υπολογισμός Αξιοπιστίας• Σύνθετα συστήματα• Ικανότητα συντήρησης• Διαθεσιμότητα
Θέματα
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 33
Η Αξιοπιστία ενός συστήματος ορίζεται ως η πιθανότητα ότι το δεδομένο σύστημα θα εκτελεί την επιθυμητή λειτουργία του κάτω από προδιαγεγραμμένες συνθήκες για συγκεκριμένη χρονική περίοδο.
Αξιοπιστία
MTBF (Mean Time Between Failures): Ο μέσος χρόνος που ένα σύστημα θα λειτουργήσει ανάμεσα σε δύο αποτυχίες. Ο MTBF εκφράζεται συνήθως σε ώρες και είναι πιο χρήσιμο μέτρο για τον χρήστη απ’ ότι η αξιοπιστία.
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 44
Ελάττωμα, Σφάλμα και Αποτυχία
• Ελάττωμα είναι η μη κανονική κατάσταση που μπορεί να προκαλέσει μείωση ή και πλήρη απώλεια της ικανότητας ενός συστήματος να εκτελεί την απαιτούμενη λειτουργία του.
• Σφάλμα είναι η ασυμφωνία ανάμεσα στην παρατηρούμενη κατάσταση και την θεωρητικά ορθή κατάσταση.
• Αποτυχία είναι η ανικανότητα ενός συστήματος να εκτελέσει τις απαιτούμενες λειτουργίες του εντός προδιαγραφών.
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 55
Παράδειγμα
Έστω ότι έχουμε μια μνήμη υπολογιστή, η οποία βομβαρδίζεται με ιόντα υψηλής ενέργειας:
• Αν τα ιόντα προκαλέσουν αλλοίωση σε κάποιο κελί της μνήμης, τότε έχουμε ελάττωμα
• Αν το κελί αυτό της μνήμης αλλάξει τιμή από 0 σε 1 ή το αντίστροφο, τότε έχουμε σφάλμα
• Αν το κελί αυτό διαβαστεί, προφανώς θα διαβαστεί η λάθος τιμή, οπότε έχουμε αποτυχία
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 66
Υπολογισμός αξιοπιστίας
Η αξιοπιστία ενός συστήματος συχνά μοντελοποιείται ως:
R(t) = e-λt
• όπου λ είναι ο ρυθμός αποτυχίας εκφρασμένος ως το ποσοστό των αποτυχιών ανά 1000 ώρας ή ανά ώρα.
Όταν το γινόμενο “λt” είναι μικρό, τότε:
• R(t) = 1 - λt
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 77
Σχέση ανάμεσα στον MTBF και τον ρυθμό αποτυχίας
MTBF είναι ο μέσος χρόνος λειτουργίας του συστήματος ανάμεσα σε αποτυχίες και δίνεται από τον τύπο:
– MTBF = ∫0∞ R(t) dt = ∫0
∞ e-λt dt = 1/λ
– Δηλαδή, ο MFBF είναι το αντίστροφο του ρυθμού αποτυχίας
– Αν το «λ» είναι ο αριθμός των αποτυχιών ανά ώρα, τότε ο MTBF εκφράζεται σε ώρες
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 88
Παράδειγμα
• Ένα σύστημα έχει 5000 στοιχεία με ρυθμό αποτυχίας 0.04% ανά 1000 ώρες. Υπολογίστε το λ και τον MTBF.
• λ = (0.04 / 100) * (1 / 1000) * 5000 = 2 * 10-3 αποτυχίες/ώρα
• MTBF = 1 / (2 * 10-3 ) = 500 ώρες
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 99
Αξιοπιστία και MTBF
• R(t) = e–λt = e–t / MTBF
• Επομένως, – MTBF = - t / ln(R(t))
Αξιοπιστία R(t)
1.0
0
0.8
0.6
0.4
0.2
1 MTBF 2 MTBF
0.36
χρόνος t
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 1010
Παράδειγμα
• Ένας υπολογιστής περιέχει 10000 στοιχεία που το καθένα έχει λ = 0.4%/(1000 ώρες). Για ποια περίοδο έχει το σύστημα αξιοπιστία 99%;
• MTBF = - t / ln(R(t)) = - t / ln(0.99)– t = - MTBF * ln(.99) = 0.01 / λμ
– Όπου λμ είναι ο μέσος ρυθμός αποτυχίας– N = αριθμός στοιχείων = 10000– λ = ρυθμός αποτυχίας ενός στοιχείου
• = 0.4% / (1000 ώρες) = 0.004/1000 = 4 * 10-6 ανά ώρα
• Επομένως, λμ = N λ = 10000 * 4 * 10-6 = 4 * 10-2 ανά ώρα
• και, t = 0.01 / (4 * 10-2 ) = 15 λεπτά
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 1111
Εν σειρά και παράλληλη αξιοπιστία
R R R R R1 2 3 4 N
Συνολική αξιοπιστία = Rt = R * R * R…. R = RN
1. Σύνδεση εν σειρά
2. Παράλληλη σύνδεση
R
R
R
1
2
N
Rt = 1 – (πιθανότητα να αποτύχουν όλα τα στοιχεία)
Rt = 1 – (1 - R)N
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 1212
Ικανότητα συντήρησης
• Ικανότητα συντήρησης ενός συστήματος είναι η πιθανότητα ανεύρεσης και επιδιόρθωσης ενός σφάλματος εντός δεδομένων χρονικών περιθωρίων.
• Η ικανότητα συντήρησης δίνεται από:
– M(t) = 1 – e-µt
– όπου μ είναι ο ρυθμός επιδιόρθωσης
– και t τα είναι τα επιτρεπτά χρονικά περιθώρια για την επιδιόρθωση
– µ = 1/(Μέσος χρόνος επιδιόρθωσης) = 1/MTTR
– M(t) = 1 – e-t/MTTR
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 1313
Διαθεσιμότητα
• Διαθεσιμότητα ενός συστήματος είναι η πιθανότητα ότι το σύστημα θα λειτουργεί εντός προδιαγραφών οποιαδήποτε στιγμή της ωφέλιμης ζωής του.
• Διαθεσιμότητα = Χρόνος λειτουργίας / (Χρόνος λειτουργίας + Χρόνος βλάβης)
• Χρόνος βλάβης = Αριθμός αποτυχιών * MTTR
• Χρόνος βλάβης = Χρόνος λειτουργίας * λ * MTTR
Επομένως,
– Διαθεσιμότητα = Χρόνος λειτουργίας / (Χρόνος λειτουργίας + (Χρόνος λειτουργίας * λ * MTTR)
• = 1 / (1+(λ*MTTR)
– Διαθεσιμότητα = MTBF / (MTBF + MTTR)
Τμήμα Διοίκησης Τεχνολογίας - 2008Τμήμα Διοίκησης Τεχνολογίας - 2008 1414
Βιβλιογραφία
• Ebeling, Charles E., (1997), An Introduction to Reliability and Maintainability Engineering, McGraw-Hill Companies, Inc., Boston.
• Kapur, K.C., and Lamberson, L.R., (1977), Reliability in Engineering Design, John Wiley & Sons, New York.
• Kececioglu, Dimitri, (1991) "Reliability Engineering Handbook", Prentice-Hall, Englewood Cliffs, New Jersey
• Leemis, Lawrence, (1995) Reliability: Probabilistic Models and Statistical Methods, 1995, Prentice-Hall. ISBN 0-13-720517-1
• MacDiarmid, Preston; Morris, Seymour; et al., (1995), Reliability Toolkit: Commercial Practices Edition, Reliability Analysis Center and Rome Laboratory, Rome, New York.
• Modarres, Mohammad; Kaminskiy, Mark; Krivtsov, Vasiliy (1999), "Reliability Engineering and Risk Analysis: A Practical Guide, CRC Press, ISBN 0-8247-2000-8.
• Neubeck, Ken (2004) "Practical Reliability Analysis", Prentice Hall, New Jersey
• O'Connor, Patrick D. T. (2002), Practical Reliability Engineering (Fourth Ed.), John Wiley & Sons, New York.
• Shooman, Martin, (1987), Software Engineering: Design, Reliability, and Management, McGraw-Hill, New York.
• Tobias, Trindade, (1995), Applied Reliability, Chapman & Hall/CRC, ISBN 0-442-00469-9
• Springer Series in Reliability Engineering