ΕΡΕΥΝΗΤΙΚΗΣΣΗΜΕΙΩΣΕΙΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ... · 2013-05-13 ·...

34
ΣΗΜΕΙΩΣΕΙΣ ΕΡΕΥΝΗΤΙΚΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ Π. Σκαπινάκης

Transcript of ΕΡΕΥΝΗΤΙΚΗΣΣΗΜΕΙΩΣΕΙΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ... · 2013-05-13 ·...

ΣΗΜΕΙΩΣΕΙΣ ΕΡΕΥΝΗΤΙΚΗΣΜΕΘΟΔΟΛΟΓΙΑΣ

Π. Σκαπινάκης

ΕΡΕΥΝΗΤΙΚΗ ΜΕΘΟΔΟΛΟΓΙΑ – ΒΑΣΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Βασικές Αρχές της αξιολόγησης ενός επιστημονικού άρθρου

1. Εισαγωγή

Ο όρος ‘κριτική αξιολόγηση’, όπως έχει χρησιμοποιηθεί στα πλαίσια της

‘Ιατρικής Βασισμένης σε Ενδείξεις’(ΙΒΕ) (Evidence Based Medicine) αναφέρεται

στην εφαρμογή προκαθορισμένων κανόνων και αρχών για την εκτίμηση α) της

μεθοδολογικής ποιότητας ενός επιστημονικού άρθρου [1] και β) της κλινικής

χρησιμότητάς του [2]. Η αναγκαιότητα αξιολόγησης των ιατρικών μελετών δεν είναι

φυσικά καινούρια, το νέο όμως ‘παράδειγμα’ της ΙΒΕ δίνει εξέχουσα βαρύτητα σ’

αυτό διότι στοχεύει στην αναζήτηση των βέλτιστων ενδείξεων και, συνεπώς,

προϋποθέτει την εφαρμογή μιας συστηματικής μεθόδου ιεράρχησης και αξιολόγησης

των ενδείξεων. Η κριτική αξιολόγηση της βιβλιογραφίας συνιστά το πιο τεχνικό

βήμα στην διαδικασία της ΙΒΕ, το οποίο μπορεί να απαιτήσει από τον κλινικό

εξειδικευμένες γνώσεις ερευνητικής μεθοδολογίας και κλινικής επιδημιολογίας.

Στόχος αυτού του κειμένου είναι να υπενθυμίσει στον αναγνώστη και να

συνοψίσει τις αρχές πάνω στις οποίες βασίζεται η αξιολόγηση ενός επιστημονικού

άρθρου. Η παρουσίαση του θέματος θα γίνει με την αδρή σειρά που ακολουθείται

από τον ερευνητή κατά τον σχεδιασμό και την πραγματοποίηση της μελέτης του.

Πρώτον, θα συζητηθούν οι βασικοί τύποι (σχέδια) των ιατρικών μελετών. Δεύτερον,

θα εξετασθούν οι κύριες στατιστικές διαδικασίες που ακολουθούνται κατά την

ανάλυση των ερευνητικών δεδομένων (στατιστική σημαντικότητα). Τρίτον, θα

συζητηθεί ο τρόπος με τον οποίο διερευνώνται οι συσχετίσεις που ανευρίσκονται ως

προς την αιτιώδη συνάφεια (αιτιολογική συμπερασματολογία). Τέλος, θα σχολιασθεί

η έννοια της κλινικής σημαντικότητας όπως αντιπαραβάλλεται στην στατιστική

σημαντικότητα.

2. Τύποι και σχέδια ερευνητικών μελετών

‘Τα πιο σημαντικά θέματα στην ερευνητική μεθοδολογία δεν αναφέρονται στις

στατιστικές διαδικασίες. Είναι περισσότερο επιστημονικής παρά στατιστικής υφής και

σχετίζονται με τον αρχιτεκτονικό σχεδιασμό της έρευνας, όχι με τους αριθμούς με τους

οποίους τα δεδομένα κωδικοποιούνται και ερμηνεύονται’.

Feinstein [3]

2

Ο καλός σχεδιασμός μιας μελέτης αποτελεί βασική προϋπόθεση για την

επίτευξη μεθοδολογικής εγκυρότητας. Κάθε ερευνητικό ερώτημα (που μπορεί να

αφορά την αιτιολογία, διάγνωση, πρόγνωση – φυσική ιστορία και πρόληψη-θεραπεία

ενός νοσήματος) απαιτεί διαφορετικό σχέδιο για την διερεύνησή του. Η λανθασμένη

επιλογή σχεδίου οδηγεί αναπόφευκτα σε ελλιπή εσωτερική εγκυρότητα (ο βαθμός

κατά τον οποίο τα αποτελέσματα της έρευνας προσεγγίζουν την ‘αλήθεια’) και άρα

και εξωτερική εγκυρότητα (ο βαθμός κατά τον οποίο τα αποτελέσματα μιας έρευνας

μπορούν να εφαρμοσθούν σε ευρύτερους πληθυσμούς, δηλαδή σε ‘πραγματικές

συνθήκες’). Ανεπάρκεια του σχεδίου συνεπάγεται ελλιπή εγκυρότητα η οποία,

αντίθετα με ότι πιστεύεται δεν μπορεί να βελτιωθεί με την χρήση περίπλοκων και

δυσνόητων στατιστικών τεχνικών.

Μια χρήσιμη διάκριση των ερευνητικών μελετών (Πίνακας 1) είναι σε

πρωτογενείς, που αναλύουν δεδομένα με πρωτότυπο τρόπο, και σε δευτερογενείς,

που συνοψίζουν δεδομένα πρωτογενών μελετών. Οι πρωτογενείς μελέτες

διακρίνονται περαιτέρω σε μη πειραματικές ή μελέτες παρατηρήσεως (οικολογικές,

συγχρονικές, ασθενών – μαρτύρων, και προοπτικές ή μελέτες κοόρτης) και σε

πειραματικές (κυρίως οι τυχαιοποιημένες ελεγχόμενες μελέτες – randomized

controlled trials) [4]. Από τους διάφορους τύπους δευτερογενών μελετών ιδιαίτερη

αναφορά θα γίνει στις συστηματικές ανασκοπήσεις και μετα-αναλύσεις. Κάθε τύπος

μελέτης είναι κατάλληλος για συγκεκριμένο γενικό σκοπό έρευνας (Πίνακας 2)

Πίνακας 1: Τύποι Μελετών στην Ιατρική Έρευνα

Πρωτογενείς Μελέτες Δευτερογενείς Μελέτες

Μελέτες Παρατηρήσεως Πειραματικές Μελέτες

Οικολογικές Συστηματικές Ανασκοπήσεις

Συγχρονικές Μετα-Αναλύσεις

Ασθενών –Μαρτύρων

Κόορτης ή Διαχρονικές

Τυχαιοποιημένες Ελεγχόμενες Μελέτες

Άλλα (Άρθρα σύνταξης, σχόλια, αναφορές

εμπειρογνωμόνων κ.λ.π)

3

Πίνακας 2:Τα καταλληλότερα είδη μελετών ανάλογα με τον ερευνητικό σκοπό

Σκοπός Καταλληλότερο είδος μελέτης

Θεραπεία Τυχαιοποιημένη ελεγχόμενη μελέτη, συστηματική ανασκόπηση

Διάγνωση - Ομαδικός έλεγχος (screening)

Συγχρονική έρευνα, συστηματική ανασκόπηση

Αιτιολογία Διαχρονική ή μελέτη ασθενών-μαρτύρων Πρόγνωση / φυσική ιστορία Διαχρονική μελέτη

2.1 Μελέτες Παρατηρήσεως (Observational Studies)

Η βασική αρχή των μελετών παρατηρήσεως είναι ότι ο ερευνητής δεν

παρεμβαίνει αλλά απλά παρατηρεί και καταγράφει με συστηματικό τρόπο κάτι που

συμβαίνει. Οι τύποι αυτοί μελετών είναι πολύ διαδεδομένοι στην Ιατρική ακριβώς

λόγω της μη πειραματικής τους φύσης: ο ερευνητής δεν παρεμβαίνει άμεσα και έτσι

δεν ανακύπτουν ηθικά θέματα όπως συμβαίνει συχνά στις πειραματικές μελέτες.

2.1.1 Οικολογικές Μελέτες (Ecological Studies): Οι μελέτες αυτές ερευνούν την

συσχέτιση (association) μεταξύ νοσημάτων και παραγόντων ή χαρακτηριστικών σε

επίπεδο συλλογικό (aggregate) και όχι ατομικό (individual). Πρέπει όμως να είμαστε

προσεκτικοί με τις οικολογικές συσχετίσεις διότι υπάρχει ο κίνδυνος της καλούμενης

'οικολογικής πλάνης' [1], δηλαδή συσχετίσεις στο συλλογικό επίπεδο μπορεί να μην

ευσταθούν στο ατομικό επίπεδο. Ένα παράδειγμα οικολογικής μελέτης αποτελεί η

μελέτη των Lewis και συν. [5] οι οποίοι εξέτασαν την συσχέτιση μεταξύ του

προτυπωμένου δείκτη θνησιμότητας από αυτοκτονίες (Standardised Mortality Rate -

SMR) και της παροχής ψυχιατρικών υπηρεσιών. Και οι δυο μεταβλητές είναι

συλλογικές. Οι ερευνητές βρήκαν ότι τα ποσοστά αυτοκτονίας ήταν υψηλότερα σε

περιοχές όπου υπήρχαν περισσότεροι επαγγελματίες ψυχικής υγείας. Η συσχέτιση

ωστόσο αυτή μειώθηκε πολύ όταν οι ερευνητές έλαβαν υπόψη τους τις συγχυτικές

επιδράσεις της οικονομικής ανάπτυξης και της παρουσίας πανεπιστημιακού

νοσοκομείου σε κάθε περιοχή. Η ερμηνεία που έδωσαν ήταν ότι περισσότεροι

επαγγελματίες ψυχικής υγείας εργάζονται (στη Μ. Βρετανία) σε φτωχές περιοχές

4

λόγω της μεγαλύτερης ανάγκης. Επίσης τα πανεπιστημιακά νοσοκομεία πιο συχνά

βρίσκονται σε αστικές περιοχές με υψηλά ποσοστά αυτοκτονίας.

2.1.2 Συγχρονικές Μελέτες (Cross-sectional surveys): Στις μελέτες αυτές εξετάζεται η

σχέση μεταξύ της νόσου ή κάποιου άλλου χαρακτηριστικού ('έκβαση' ή 'εξαρτημένη

μεταβλητή' - outcome) και διαφόρων παραγόντων ('έκθεση' ή 'ανεξάρτητη μεταβλητή'

- exposure) σε έναν συγκεκριμένο πληθυσμό σε μια δεδομένη χρονική στιγμή. Με

αυτόν τον τρόπο μπορούμε να έχουμε στοιχεία για τον επιπολασμό της νόσου σε

αυτόν τον πληθυσμό (όχι όμως και της επίπτωσης - των νέων δηλαδή περιστατικών)

ενώ συγκρίνοντας τον επιπολασμό σε διαφορετικές υπο-ομάδες που διαφέρουν ως

προς την συχνότητα των διαφόρων παραγόντων ή εκθέσεων μπορούμε να ελέγξουμε

και αιτιολογικές υποθέσεις. Ωστόσο, οι συσχετίσεις που αποκαλύπτονται με αυτό τον

τρόπο εξαρτώνται όχι μόνο από την έναρξη ενός νέου περιστατικού της νόσου

(επίπτωση) αλλά και από την χρονική της διάρκεια. Επίσης με τον τύπο αυτό των

μελετών δεν μπορούμε να γνωρίζουμε εάν ο παράγοντας κινδύνου προηγήθηκε της

έναρξης της νόσου, και έτσι συχνά αντιμετωπίζουμε προβλήματα αντίστροφης

αιτιότητας στην ερμηνεία των αποτελεσμάτων που προκύπτουν. Το γενικό σχέδιο

των συγχρονικών μελετών απεικονίζεται στο Γράφημα 1. Ένα παράδειγμα

συγχρονικής μελέτης αποτελεί η εργασία των Skapinakis και συν. [6]. Στην εργασία

αυτή μελετήθηκε ένα αντιπροσωπευτικό δείγμα 10000 περίπου Βρετανών και

Νόσος

Παράγοντας

+

-

+ -

a b

c d

Πληθυσμός Δείγμα

Μέτρο της Συσχέτισης: Σχετικός Επιπολασμός = a/a+c

b/b+d

ή odds ratio (ad/bc)

Γράφημα 1: Σχέδιο Συγχρονικών Μελετών

5

εκτιμήθηκε η κατάσταση της ψυχολογικής τους υγείας καθώς και η παρουσία

διαφόρων συμπτωμάτων όπως η χρόνια κόπωση χωρίς εμφανή αιτία. Οι ερευνητές

ανέλυσαν το σύμπτωμα της κόπωσης και ανέφεραν τον επιπολασμό της στον γενικό

πληθυσμό καθώς και την σχέση της με την ψυχιατρική νοσηρότητα, η οποία ήταν

πολύ ισχυρή. Η συγχρονική όμως φύση της μελέτης αυτής περιορίζει την αιτιολογική

σημασία των αποτελεσμάτων, αφού η ψυχιατρική νοσηρότητα θα μπορούσε να είναι

το αποτέλεσμα της κόπωσης και όχι η αιτία της, ή η ψυχιατρική νοσηρότητα μπορεί

να έχει σημασία στην διατήρηση της κόπωσης και όχι στην έκλυσή της.

2.1.3 Μελέτες ασθενών – μαρτύρων (Case – control studies): Στις αναδρομικές αυτές

μελέτες, άτομα με τη νόσο συγκρίνονται με ομάδα ελέγχου χωρίς τη νόσο. Εάν ο

παράγοντας της έκθεσης είναι συχνότερος στους ασθενείς απ' ότι στους μάρτυρες

τότε η έκθεση μπορεί να αποτελεί παράγοντα κινδύνου για τη νόσο, εάν είναι

λιγότερο συχνός τότε μπορεί να αποτελεί προστατευτικό παράγοντα. Συνήθως τα

Παράγοντας Κινδύνου

Ναι Οχι

d

c

b

a Δείγμα Ασθενών

Δείγμα ατόμων χωρίς τη νόσο

Πληθυσμός Ατόμων με Νόσο

Πληθυσμός Ατόμων χωρίς τη νόσο

Μέτρο της Συσχέτισης: Odds Ratio = ad/bc

Παράγοντας Κινδύνου

Ναι Οχι

Χρόνος

Γράφημα 2: Σχέδιο μελετών Ασθενών - Μαρτύρων

6

αποτελέσματα παρουσιάζονται με την μορφή των λόγων των οτζ ή λόγο των

ενδεχομένων (odds ratios). Το γενικό σχέδιο των μελετών αυτών απεικονίζεται στο

Γράφημα 2. Οι μελέτες αυτές είναι γρήγορες, έχουν σχετικά χαμηλό κόστος και είναι

ιδανικές για την μελέτη σπάνιων νοσημάτων, όπως π.χ. η σχιζοφρένεια. Είναι ωστόσο

ευάλωτες σε συστηματικά σφάλματα, τόσο μέτρησης όσο και επιλογής (βλ.

παρακάτω). Χρειάζεται ιδιαίτερη προσπάθεια ώστε η ομάδα ελέγχου να δίνει μια

αμερόληπτη εκτίμηση της συχνότητας της έκθεσης στον πληθυσμό από τον οποίο

προέρχονται οι ασθενείς. Για παράδειγμα, οι Kendell και συν. [7] διεξήγαγαν μια

μελέτη ασθενών - μαρτύρων με σκοπό να δουν εάν υπάρχει συσχέτιση μεταξύ των

μαιευτικών επιπλοκών και της ανάπτυξης σχιζοφρένειας στην ενήλικο ζωή. Βρήκαν

μια ισχυρή θετική συσχέτιση και συμπέραναν ότι το ιστορικό μαιευτικών επιπλοκών

τόσο κατά την διάρκεια της κύησης όσο και κατά τον τοκετό αποτελούν παράγοντες

που αυξάνουν τον κίνδυνο νόσησης από σχιζοφρένεια αρκετά χρόνια μετά. Ωστόσο,

σε νέα τους εργασία [8] ανάλυσαν ξανά τα ίδια δεδομένα έχοντας όμως τώρα

μεγαλύτερο χρόνο παρακολούθησης, και βρήκαν το αντίθετο αποτέλεσμα.

Διαπίστωσαν, ότι το προηγούμενο αποτέλεσμα οφειλόταν σε συστηματικό σφάλμα

επιλογής της ομάδα ελέγχου που είχε δημιουργηθεί από το σχεδιασμό της μελέτης και

το οποίο επέλεγε μάρτυρες με ασυνήθιστα χαμηλή συχνότητα μαιευτικών επιπλοκών.

Στην πραγματικότητα δεν υπήρχε σχέση μεταξύ μαιευτικών επιπλοκών και της

σχιζοφρένειας.

7

2.1.4 Μελέτες Κοόρτης ή διαχρονικές μελέτες (Cohort Studies – Longitudinal studies):

Στις μελέτες αυτές παρακολουθούνται για ένα χρονικό διάστημα δυο ομάδες ατόμων,

μια που είναι εκτεθειμένη σε έναν δυνητικό παράγοντα κινδύνου μιας νόσου (π.χ.

καπνιστές) και μια που δεν είναι εκτεθειμένη σε αυτόν τον παράγοντα (π.χ. μη

καπνιστές). Όλοι οι συμμετέχοντες δεν νοσούν κατά την διάρκεια της εισόδου στη

μελέτη. Μετά την λήξη της παρακολούθησης συγκρίνεται η επίπτωση της νόσου (π.χ.

καρκίνος πνεύμονα) στους εκτεθειμένους σε σχέση με τους μη εκτεθειμένους.

Συνήθως τα αποτελέσματα παρουσιάζονται με την μορφή των σχετικών κινδύνων

(relative risks), μπορούν όμως να υπολογισθούν και απόλυτα μέτρα όπως η διαφορά

στην επίπτωση της νόσου μεταξύ των δυο συγκρινόμενων ομάδων (εκτεθειμένων –

μη εκτεθειμένων). Το γενικό σχέδιο των μελετών αυτών απεικονίζεται στο Γράφημα

3. Η βασική διαφορά με τις μελέτες ασθενών - μαρτύρων είναι ότι η ανίχνευση και

μέτρηση της έκθεσης γίνονται πριν την εμφάνιση της νόσου. Έτσι, αποφεύγονται τα

συστηματικά σφάλματα επιλογής και μέτρησης. Επίσης αποκλείεται η ερμηνεία της

αντίστροφης αιτιότητας αφού η έκθεση έχει προηγηθεί εξ ορισμού. Το μειονέκτημα

είναι ότι οι έρευνες αυτές κοστίζουν πολύ και είναι ιδιαίτερα δύσκολες για τη μελέτη

σπάνιων εκβάσεων λόγω του μεγάλου αριθμού συμμετεχόντων. Επίσης, ιδιαίτερη

προσπάθεια χρειάζεται ώστε να παρακολουθηθεί ο μεγαλύτερος δυνατός αριθμός

Το Δείγμα - Μέλλον

Χρόνος

Παράγοντας +

Παράγοντας -

Νόσος + (a)

Νόσος - (b)

Νόσος + (c)

Νόσος - (d)

Μέτρο της Συσχέτισης: Σχετικός Κίνδυνος a/a+b c/c+d

Γράφημα 3: Σχέδιο μελετών κοόρτης

Ο Πληθυσμός - Παρόν

8

μέχρι τέλους, διότι μπορεί η έκθεση να σχετίζεται με την συμπλήρωση της

παρακολούθησης και αυτό θα εισάγει συστηματικό σφάλμα. Μια ενδιαφέρουσα

υποκατηγορία των μελετών κοόρτης αποτελούν οι λεγόμενες ιστορικές μελέτες

κοόρτης [4]. Σε αυτές χρησιμοποιούνται ιστορικά δεδομένα (δηλαδή δεδομένα που

έχουν ήδη συλλεχθεί, συχνά για άλλους σκοπούς) τόσο για την έκθεση όσο και για

την έκβαση. Με αυτόν τον τρόπο δεν είναι ανάγκη να περιμένει κανείς για να

καταγράψει την έκβαση, αυτή έχει ήδη συμβεί στο παρελθόν. Η διαφορά με τις

μελέτες ασθενών - μαρτύρων είναι ότι οι συμμετέχοντες επιλέγονται πρώτα ως προς

την έκθεση, και μετά παρακολουθούνται στον χρόνο μέχρι την καταγραφή της

έκβασης. Μια κλασική μελέτη κοόρτης στην Ιατρική αποτελεί η μελέτη των Doll και

Hill για την σχέση καπνίσματος και καρκίνου του πνεύμονα. Επίσης και η μελέτη

Framingham στην καρδιολογία [10].

2.2. Πειραματικές Μελέτες (Experimental studies)

Οι πειραματικές μελέτες περιλαμβάνουν την παρέμβαση του ερευνητή, ο

οποίος συμμετέχει ενεργά στην διαμόρφωση των παραγόντων που επιδρούν πάνω

Πληθυσμός

Κριτήρια Επιλογής

Επιλέξιμος Πληθυσμός

Μη επιλέξιμος

Συναινούν σε Τυχαιοποίηση Δεν Συναινούν

Ομάδα Παρέμβασης

Ομάδα Ελέγχου

Έκβαση Γνωστή

Έκβαση Άγνωστη

Έκβαση Γνωστή

Έκβαση Άγνωστη

Γράφημα 4: Σχέδιο τυχαιοποιημένων ελεγχόμενων μελετών

9

στις συγκρινόμενες ομάδες. Οι πειραματικές μελέτες που ενδιαφέρουν ιδιαίτερα την

Ιατρική είναι οι τυχαιοποιημένες ελεγχόμενες μελέτες (randomized controlled trials –

RCTs). Οι μελέτες αυτές θεωρούνται ως οι πιο ενδεδειγμένες για την εξακρίβωση της

αποτελεσματικότητας των προληπτικών ή θεραπευτικών παρεμβάσεων [11]. Η

ανάγκη για τυχαιοποίηση προκύπτει από το γεγονός ότι κατά την διάρκεια μιας

μελέτης είναι αδύνατο να ελέγξουμε όλους τους πιθανούς συγχυτικούς παράγoντες

που μπορεί να δημιουργούν πλασματικές συσχετίσεις (το φαινόμενο της σύγχυσης –

confounding – αναλύεται πιο κάτω). Η διαδικασία της τυχαιοποίησης εξασφαλίζει ότι

οι πιθανοί συγχυτικοί παράγοντες θα έχουν παρόμοια κατανομή στις ομάδες που

συγκρίνονται, εάν βεβαίως ο αριθμός των συμμετεχόντων είναι επαρκής. Αν δεν

υπήρχαν πλασματικές συσχετίσεις και η έκβαση μπορούσε να προβλεφθεί με σχετική

ακρίβεια τότε το σχέδιο των διαχρονικών μελετών θα ήταν επαρκές για την

διερεύνηση της αποτελεσματικότητας των θεραπειών [11].

Η διενέργεια RCTs (χρησιμοποιείται η Αγγλική σύντμηση διότι με αυτό τον

όρο μπορεί κανείς να αναζητήσει τις μελέτες αυτές στην βιβλιογραφία)

δικαιολογείται μόνο σε περιπτώσεις όπου υπάρχει κλινική αβεβαιότητα. Εάν δεν

υπάρχει αμφισβήτηση για την αποτελεσματικότητα μιας θεραπείας τότε δεν είναι

ορθή η πραγματοποίηση μιας RCT εάν δεν συντρέχουν και άλλοι λόγοι, π.χ.

ερωτήματα σχετικά με την ασφάλεια της θεραπείας ή την οικονομική της

αποδοτικότητα. Όσο πιο κοινό το θεραπευτικό δίλημμα, τόσο πιο ενδιαφέρουσα και

χρήσιμη γίνεται μια RCT. Η κλινική αβεβαιότητα συμβάλλει επίσης στην ηθική

αποδοχή της τυχαιοποίησης από ασθενείς και ερευνητές: εάν ο κλινικός γιατρός δεν

είναι βέβαιος για τα αποτελέσματα μιας θεραπείας τότε το τυχαιοποιημένο πείραμα

είναι από ηθικής πλευράς ορθή ή ακόμα και επιβεβλημένη επιλογή.

Το γράφημα 4 παρουσιάζει το γενικό σχέδιο των RCTs. Τονίζεται ιδιαίτερα

ότι οι ασθενείς θα πρέπει να κατανέμονται στις δυο ομάδες (παρέμβασης και ελέγχου)

με αμερόληπτο τρόπο. Αυτό μπορεί να γίνει μόνο με την απόκρυψη της διαδικασίας

τυχαιοποίησης από εκείνους που κάνουν την αρχική εκτίμηση των ασθενών για το αν

πληρούν τα κριτήρια εισόδου. Λόγω της μεγάλης της σημασίας η μέθοδος απόκρυψης

(concealment) της τυχαιοποίησης έχει χρησιμοποιηθεί και ως μέτρο της

μεθοδολογικής ποιότητας μιας RCT [12].

Η εγκυρότητα της σύγκρισης των ομάδων που προέκυψαν με την

τυχαιοποίηση εξαρτάται επίσης από την αμερόληπτη εκτίμηση της έκβασης στις

ομάδες αυτές. Αυτό συνήθως εξασφαλίζεται όταν ο εκτιμητής δεν γνωρίζει σε ποια

10

ομάδα ανήκει ο ασθενής. Οι RCTs είναι συνήθως ‘διπλές τυφλές’, δηλαδή τόσο ο

ασθενής όσο και ο εκτιμητής δεν γνωρίζουν την ομάδα στην οποία τοποθετήθηκε ο

πρώτος. ‘Τριπλό τυφλό’ λέγεται το σχέδιο όταν επιπλέον και ο ερευνητής που

αναλύει τα δεδομένα δεν γνωρίζει την ομάδα κατανομής.

Ένα από τα κυριότερα προβλήματα που δυσκολεύουν την ερμηνεία των

RCTs αφορά τους ασθενείς εκείνους που ‘χάνονται’ κατά την διάρκεια της

παρακολούθησης ή αποσύρονται για άλλους λόγους από την μελέτη. Η απόσυρση

ασθενών έχει ως αποτέλεσμα την δημιουργία ανομοιογένειας στις συγκρινόμενες

ομάδες και αυτή μπορεί να οδηγήσει σε απώλεια των ωφελειών της αρχικής

τυχαιοποίησης. Εάν χαθούν πολλοί ασθενείς τότε είναι πιθανό τα όποια

αποτελέσματα να οφείλονται σε αδιευκρίνιστους συγχυτικούς παράγοντες και να

είναι πλασματικά. Επίσης, δεδομένου ότι εκείνοι που χάνονται είναι πιο συχνά

ασθενείς που έχουν υψηλή πιθανότητα φτωχής έκβασης, υπάρχει μεγάλη πιθανότητα

να παρεισφρήσει και συστηματικό σφάλμα επιλογής σε περίπτωση που οι ασθενείς

από την μια ομάδα χάνονται κατά προτεραιότητα. Σημειώνεται ότι οι αναγνώστες

μιας RCT πρέπει να είναι ιδιαίτερα επιφυλακτικοί σε μελέτες κατά τις οποίες έχουν

χρησιμοποιηθεί περίπλοκες στατιστικές τεχνικές για να σταθμίσουν για τις απώλειες

ασθενών κατά την παρακολούθηση.

Ένας τρόπος να διαφυλαχθούν τα οφέλη της τυχαιοποίησης είναι με την

λεγόμενη ‘ανάλυση με βάση την αρχική θεραπευτική πρόθεση’, όπως αυτή

διαμορφώθηκε από την τυχαιοποίηση (‘intention to treat analysis’). Σ’ αυτού του

τύπου την ανάλυση, όλοι οι ασθενείς που τυχαιοποιήθηκαν αρχικά,

συμπεριλαμβάνονται στην ανάλυση ως μέλη της αρχικής ομάδας κατανομής

ανεξάρτητα αν τελικά έλαβαν αυτή ή άλλη θεραπεία (π.χ. αλλαγή της ομάδας μπορεί

να έγινε λόγω παρενεργειών ή ανεπαρκούς ανταπόκρισης). Σε περίπτωση που

υπάρχουν ελλιπή δεδομένα, χρησιμοποιούνται όσα στοιχεία υπάρχουν μέχρι που ο

ασθενής ‘βγήκε’ από τη μελέτη. Με τον τρόπο αυτό διατηρούνται τα οφέλη της

τυχαιοποίησης, αλλά με το μειονέκτημα της μείωσης του μεγέθους της διαφοράς στην

έκβαση, που μπορεί να μην είναι εμφανής σε οριακές καταστάσεις.

Αν και οι RCTs θεωρούνται από πολλούς ως το πρότυπο σχέδιο για την

εξακρίβωση της αποτελεσματικότητας των θεραπειών, δεν λείπουν και εκείνοι που

εκφράζουν τις επιφυλάξεις τους. Τρία είναι τα κύρια επιχειρήματά τους [13]:

α) Εξωτερική εγκυρότητα: Οι RCTs αποκλείουν συνήθως τόσες πολλές

κατηγορίες ασθενών (οι οποίοι δεν πληρούν τα κριτήρια εισόδου, ή δεν συναινούν

11

στην τυχαιοποίηση κ.λ.π.), που τα αποτελέσματά τους μπορεί να έχουν μειωμένη

κλινική χρησιμότητα [14],

β) Δυσκολίες στην διεξαγωγή τους: Για πολλά θέματα δεν είναι δυνατό να

διεξαχθούν τυχαιοποιημένες μελέτες, ιδιαίτερα σε σπάνιες εκβάσεις. Για παράδειγμα

μια μελέτη για την πρόληψη των αυτοκτονιών θα έπρεπε να τυχαιοποιήσει χιλιάδες

άτομα,

γ) Σπανιότητα επαρκών RCTs: Πολλοί υποστηρίζουν ότι ο αριθμός των

μεθοδολογικά έγκυρων RCTs θα είναι πάντα περιορισμένος και έτσι θα υπάρχουν

αναρίθμητες κλινικές αποφάσεις που θα πρέπει να ληφθούν με βάση άλλες

βιβλιογραφικές ενδείξεις.

Οι μελέτες αυτές συχνά είναι διπλές τυφλές, δηλαδή τόσο οι ασθενείς όσο και

οι ερευνητές που εκτιμούν την έκβαση δεν γνωρίζουν το είδος της θεραπείας που έχει

ληφθεί.

2.3 Δευτερογενείς μελέτες

Οι δευτερογενείς δημοσιεύσεις περιλαμβάνουν μεταξύ άλλων τις κλασικές

ανασκοπήσεις, τα άρθρα σύνταξης, τα σχόλια, τα γράμματα, τις αναφορές

εμπειρογνωμόνων, τις κατευθυντήριες οδηγίες, καθώς και τις συστηματικές

ανασκοπήσεις και μετα-αναλύσεις [15]. Θεωρητικά, στόχος των δευτερογενών

δημοσιεύσεων είναι να συνοψίσουν τα ευρήματα όλων των γνωστών πρωτογενών

μελετών πάνω σε ένα συγκεκριμένο θέμα και να εξάγουν σχετικά συμπεράσματα.

Στην πραγματικότητα όμως αυτό μπορούν να το πετύχουν (όχι πάντα) οι

συστηματικές ανασκοπήσεις και οι μετα-αναλύσεις, διότι είναι τα μόνα είδη

δευτερογενών δημοσιεύσεων που εφαρμόζουν τις ίδιες ακριβώς επιστημονικές αρχές

που ισχύουν και για τις πρωτογενείς δημοσιεύσεις. Στις συστηματικές ανασκοπήσεις

γίνεται μια ποιοτική σύνθεση των δεδομένων ενώ στις μετα-αναλύσεις

χρησιμοποιούνται ειδικές στατιστικές τεχνικές, που αποσκοπούν στην ποσοτική

σύνθεση των δεδομένων με την εξαγωγή ενός συνολικού μέτρου της έκβασης μαζί με

τα διαστήματα εμπιστοσύνης του.

Τα κυριότερα πλεονεκτήματα και μειονεκτήματα των συστηματικών

ανασκοπήσεων παρουσιάζονται στον Πίνακα 3. Ιδιαίτερα τονίζεται το συστηματικό

σφάλμα δημοσίευσης (publication bias) το οποίο προκύπτει από το γεγονός ότι

μελέτες με μικρά δείγματα, είναι λιγότερο πιθανό να δημοσιευθούν εάν έχουν

12

αρνητικά αποτελέσματα συγκριτικά με εκείνες που έχουν θετικά αποτελέσματα (για

ευνόητους λόγους…) [16]. Ειδικές τεχνικές υπάρχουν για την εκτίμηση αυτού του

φαινομένου με κυριότερο το διάγραμμα του ‘ανάστροφου κώνου’ (‘funnel plot’).

Πίνακας 3: Πλεονεκτήματα και Μειονεκτήματα των Δευτερογενών δημοσιεύσεων: Πλεονεκτήματα Μειονεκτήματα

Όλες οι διαθέσιμες ενδείξεις

χρησιμοποιούνται για την εκτίμηση της

παρέμβασης

Συστηματικό σφάλμα Δημοσίευσης

Μεγαλύτερη στατιστική ισχύς Η εγκυρότητά τους εξαρτάται από την

ποιότητα των πρωτογενών μελετών

Διερευνούν την ετερογένεια και την

γενικευσιμότητα των αποτελεσμάτων

Η σύνθεση ετερογενών μελετών μπορεί

να μην είναι έγκυρη (μπορεί όμως να

διερευνηθεί)

Ένα άλλο πρόβλημα είναι η σύνθεση μελετών με σημαντική μεθοδολογική

ετερογένεια, η οποία μπορεί να μην είναι έγκυρη. Θα πρέπει ωστόσο να επισημανθεί

ότι οι συστηματικές ανασκοπήσεις προσφέρουν τη μοναδική δυνατότητα διερεύνησης

αυτής της ετερογένειας [17,18].

Περισσότερα για την μεθοδολογία των συστηματικών ανασκοπήσεων ο

αναγνώστης μπορεί να διαβάσει σε άλλο κεφάλαιο του βιβλίου. Σ’ αυτό το σημείο

υπενθυμίζεται η βιβλιογραφική βάση της συνεργασίας Cochrane (Cochrane

Collaboration) που αποτελεί την καλύτερη πηγή αναζήτησης συστηματικών

ανασκοπήσεων και μετα-αναλύσεων. Η ομάδα αυτή πήρε το όνομά της από τον

Βρετανό επιδημιολόγο Archie Cochrane, ο οποίος δούλεψε τον περισσότερο καιρό

στο Cardiff της Ουαλίας, και ο οποίος αναγνώρισε πολύ νωρίς ότι η ανυπαρξία

αξιόπιστων ανασκοπήσεων όλων των διαθέσιμων ενδείξεων δημιουργεί εμπόδια στην

λήψη έγκυρων κλινικών αποφάσεων. Ο Cochrane τόνισε ότι οι ανασκοπήσεις θα

πρέπει να γίνονται με τρόπο συστηματικό και να ανανεώνονται σε τακτική βάση

καθώς προστίθενται νέα ερευνητικά δεδομένα. Το έργο αυτό ξεκίνησε το 1993 μια

ομάδα 77 επιστημόνων από 11 χώρες ιδρύοντας την ‘Συνεργασία Cochrane’. Σκοπός

της είναι να ανασκοπήσει συστηματικά όλες τις RCTs που έχουν γίνει στην Ιατρική

από το 1948 και έπειτα και να ανανεώνει τις ανασκοπήσεις αυτές σε τακτικά χρονικά

13

διαστήματα. Η συνεργασία δημοσιεύει τις ανασκοπήσεις στην βάση δεδομένων που

διατηρεί στο Internet με την ονομασία ‘Cochrane Library’ (www.cochrane.org είναι ο

δικτυακός τόπος της συνεργασίας, όπου δίνονται και πληροφορίες για την πρόσβαση

στην βιβλιοθήκη).

3. Βασικά θέματα στην Στατιστική Ανάλυση

3.1 Το δείγμα της μελέτης

Τον πληθυσμό (population) της μελέτης αποτελούν όλα εκείνα τα άτομα για

τα οποία θέλουμε να μάθουμε κάτι με την διεξαγωγή της, π.χ. ο πληθυσμός των

ανδρών 50-70 με στεφανιαία νόσο που κατοικούν στην Ελλάδα. Επειδή συνήθως δεν

είναι δυνατό να μελετήσουμε όλα τα άτομα ενός πληθυσμού επιλέγουμε ένα δείγμα

(sample) των ατόμων αυτών, το οποίο και μελετούμε λεπτομερειακά. Υπενθυμίζεται

όμως ότι τελικός μας στόχος είναι να εξάγουμε συμπεράσματα για όλον τον

πληθυσμό. Αυτό μπορούμε να το πετύχουμε θεωρητικά, εάν επιλέξουμε ένα τυχαίο

(random) δείγμα το οποίο να είναι αντιπροσωπευτικό (representative) του

πληθυσμού.

Εάν επιλέξουμε δυο τυχαία δείγματα 100 ατόμων από έναν πληθυσμό που

έχει την ίδια αναλογία ανδρών και γυναικών (50% άνδρες, 50% γυναίκες), το ένα

δείγμα μπορεί να περιέχει 55 γυναίκες και το άλλο 44 γυναίκες. Αυτό δεν σημαίνει

ότι τα δείγματα δεν είναι ‘σωστά’. Ο τυχαίος τρόπος επιλογής των δειγμάτων είχε ως

αποτέλεσμα την εισαγωγή σφάλματος κατά την μέτρηση του χαρακτηριστικού αυτού

(φύλου). Αυτό ονομάζεται ‘δειγματική μεταβλητότητα’ (sampling variation). Η

εκτίμηση της δειγματικής μεταβλητότητας γίνεται με στατιστικές τεχνικές, ώστε να

μπορούμε να εξάγουμε ακριβή συμπεράσματα για τον πληθυσμό από τον οποίο

προέρχεται το δείγμα. Υπενθυμίζεται ότι εάν δεν υπήρχε μεταβλητότητα δεν θα

υπήρχε και λόγος για την εφαρμογή στατιστικών τεχνικών!

3.2 Έλεγχος Υποθέσεων

Οι μελέτες συνήθως σκοπεύουν στο να απαντήσουν σε κλινικά ερωτήματα

του τύπου: ‘Υπάρχει κάποια διαφορά μεταξύ αυτών των δυο μεθόδων για την

θεραπεία του άσθματος;’

14

Στην στατιστική, το ερώτημα αυτό συνήθως παίρνει τη μορφή δυο

στατιστικών υποθέσεων οι οποίες ελέγχονται για την ορθότητά τους, της μηδενικής

υπόθεσης και των εναλλακτικών:

Η μηδενική υπόθεση, η οποία συμβολίζεται ως H0, αντιπροσωπεύει την

κατάσταση κατά την οποία δεν υπάρχει διαφορά ή μεταβολή, ενώ οι εναλλακτικές H1

αντιπροσωπεύουν την κατάσταση εκείνη κατά την οποία υπάρχει διαφορά μεταξύ

των δυο μεθόδων.

Το κριτήριο για το ποια από τις δυο είναι σωστή αποτελεί το γνωστό p (p-

value). Η τιμή του p αποτελεί την πιθανότητα να βρούμε ένα αποτέλεσμα

τουλάχιστον τόσο ακραίο, όσο θα βρίσκαμε εάν η μηδενική υπόθεση ήταν σωστή.

Μικρή τιμή του κριτηρίου p, όπως π.χ. 0,05, σημαίνει ότι είναι σχετικά απίθανο το

αποτέλεσμα αυτό να οφείλεται στην τύχη, και αυτό αποτελεί στοιχείο εναντίον της

μηδενικής υπόθεσης. Αντίθετα, μεγάλη τιμή του κριτηρίου p τείνει σε γενικές

γραμμές να υποστηρίζει την μηδενική υπόθεση. Παραδοσιακά, η κρίσιμη τιμή του p

που επιλέγεται στην Ιατρική για να γίνει ο διαχωρισμός μεταξύ απόρριψης ή μη της

μηδενικής υπόθεσης είναι το 0,05 (ή 5%). Να σημειωθεί ότι όταν η τιμή είναι

μεγαλύτερη του 0,05 δεν αναφέρουμε ότι η μηδενική υπόθεση ισχύει, αλλά ότι τα

δεδομένα της μελέτης δεν υποστηρίζουν την απόρριψή της (ένα άλλο δείγμα, π.χ.

μεγαλύτερο, θα μπορούσε να έχει μικρότερη τιμή p).

3.3 Σφάλματα Τύπου Ι και Τύπου ΙΙ

Κατά τον έλεγχο των στατιστικών υποθέσεων, δυο είναι τα σφάλματα που

μπορεί να γίνουν:

- Ως σφάλμα τύπου Ι ορίζεται εκείνο κατά το οποίο η μηδενική υπόθεση αν

και αληθής απορρίπτεται. Εάν ορίσουμε ως επίπεδο σημαντικότητας το 5%, αυτό

σημαίνει ότι το 5% όλων των στατιστικά σημαντικών διαφορών είναι στην

πραγματικότητα σφάλματα τύπου Ι. όσο πιο πολλές υποθέσεις ελέγχουμε στα

δεδομένα μας τόσο πιο πολύ αυξάνεται η πιθανότητα εσφαλμένου στατιστικά

σημαντικού αποτελέσματος.

- Ως σφάλμα τύπου ΙΙ ορίζεται εκείνο κατά το οποίο η μηδενική υπόθεση αν

και εσφαλμένη δεν απορρίπτεται. Για παράδειγμα, σε μια μελέτη με μικρό δείγμα

είναι αρκετά πιθανό να πάρουμε μεγάλη τιμή του κριτηρίου p παρότι στον πληθυσμό

υπάρχει πραγματικά διαφορά. Τα σφάλματα τύπου ΙΙ πρέπει πάντοτε να λαμβάνονται

υπόψη σε όλες τις μελέτες με αρνητικά αποτελέσματα. Τα διαστήματα εμπιστοσύνης

15

(βλ. πιο κάτω) μπορούν να βοηθήσουν στην καλύτερη εκτίμηση των αρνητικών

αποτελεσμάτων.

3.4 Στατιστική Ισχύς

Ο όρος στατιστική ισχύς (power) μιας μελέτης αναφέρεται στην πιθανότητα

να βρούμε ένα στατιστικά σημαντικό αποτέλεσμα υποθέτοντας ότι ο πληθυσμός της

μελέτης παρουσιάζει μια διαφορά συγκεκριμένου μεγέθους. Πρόκειται ουσιαστικά

για την πιθανότητα να μην έχουμε σφάλμα τύπου ΙΙ. Η ισχύς μιας μελέτης εξαρτάται

από τρεις παράγοντες: α) το επίπεδο σημαντικότητας που επιλέγουμε (συνήθως 5%),

β) το μέγεθος του αποτελέσματος το οποίο υποθέτουμε ότι ισχύει για τον πληθυσμό

της μελέτης και γ) το μέγεθος του δείγματος.

Ο υπολογισμός της ισχύος μιας μελέτης πρέπει να γίνεται κατά την φάση του

σχεδιασμού. Ο υπολογισμός της ισχύος εξαρτάται ιδιαίτερα από το μέγεθος του

αποτελέσματος το οποίο προβλέπουμε ή επιθυμούμε να βρούμε, όσο μικρότερες

διαφορές θέλουμε να διερευνήσουμε τόσο μικρότερη και η ισχύς. Σε γενικές γραμμές

ένα αποδεκτό όριο για την ισχύ μιας μελέτης αποτελεί το 80%. Με βάση αυτή την

τιμή μπορούμε να υπολογίσουμε το μέγεθος του δείγματος το οποίο χρειαζόμαστε

στο επίπεδο σημαντικότητας 5%.

3.5 Η ερμηνεία των ‘στατιστικά σημαντικών’ αποτελεσμάτων

5% όλων των στατιστικών δοκιμασιών θα είναι στατιστικά σημαντικό για

λόγους τυχαίους στο επίπεδο σημαντικότητας 5%. Το επίπεδο αυτό είναι βέβαια

αυθαίρετο και δεν υπάρχει αληθινή διαφορά μεταξύ του επιπέδου 4% ή 6%. Εάν μια

μελέτη αναφέρει 20 τιμές p τότε μια από αυτές θα περιμέναμε να είναι στατιστικά

σημαντική μόνο από τύχη. Όσα πιο πολλά τεστ τόσο αυξάνεται η πιθανότητα

σφαλμάτων τύπου Ι.

3.6 Διαστήματα Εμπιστοσύνης

Είναι γνωστό ότι οι εκτιμήσεις των παραμέτρων μιας μελέτης (π.χ. μέση τιμή,

αναλογία κ.λ.π) υπόκεινται σε δειγματοληπτικό σφάλμα. Το πρωταρχικό ενδιαφέρον

των ερευνητών είναι το μέγεθος του αποτελέσματος, και έτσι είναι αναγκαίο να

γνωρίζουμε την ακρίβεια με την οποία η παράμετρος, π.χ. η αναλογία, έχει εκτιμηθεί.

Τα διαστήματα εμπιστοσύνης βασίζονται στην εκτίμηση του μεγέθους του

16

αποτελέσματος ενώ ταυτόχρονα δίνουν και ένα μέτρο της αβεβαιότητας που

σχετίζεται με την εκτίμηση αυτή.

Το τυπικό σφάλμα (standard error) δείχνει την ακρίβεια με την οποία

εκτιμάται η αληθινή τιμή της παραμέτρου στον πληθυσμό από το δείγμα που έχει

χρησιμοποιηθεί στη μελέτη. Εάν κάνουμε την ίδια μελέτη πολλές φορές

χρησιμοποιώντας κάθε φορά και διαφορετικό τυχαίο δείγμα, τότε το τυπικό σφάλμα

μπορεί να θεωρηθεί ως η τυπική απόκλιση (standard deviation) των δειγματικών

μέσων τιμών. Μεγαλύτερα δείγματα έχουν μικρότερο τυπικά σφάλματα, αφού

αυξάνεται η ακρίβεια με την οποία εκτιμάται η παράμετρος στον πληθυσμό.

Τα διαστήματα εμπιστοσύνης μιας παραμέτρου υπολογίζονται με τον γνωστό

τύπο:

95% ΔΕ = τιμή της παραμέτρου στο δείγμα ± (1,96* SE)

όπου, ΔΕ= διάστημα εμπιστοσύνης και SE= τυπικό σφάλμα.

Την τελευταία δεκαετία, οι στατιστικοί και τα ιατρικά περιοδικά έχουν σε

γενικές γραμμές συμφωνήσει ότι τα αποτελέσματα πρέπει να αναφέρονται με τα

διαστήματα εμπιστοσύνης τους και όχι με τις τιμές του κριτηρίου p, διότι το

τελευταίο δεν δίνει μια εκτίμηση του εύρους των πιθανών τιμών της παραμέτρου σε

αντίθεση με τα διαστήματα εμπιστοσύνης

4. Αιτιολογική Συμπερασματολογία

Στην πράξη, η διερεύνηση της αιτιολογίας των νοσημάτων γίνεται με την

μελέτη της συσχέτισης (association) διαφόρων παραγόντων με το νόσημα που μας

ενδιαφέρει. Στην επιδημιολογική ορολογία, συχνά αναφέρουμε με τον όρο ‘έκθεση’

(exposure) τον παράγοντα και με τον όρο ‘έκβαση’ (outcome) το νόσημα [4].

Ο όρος συσχέτιση είναι ένας γενικός όρος που χρησιμοποιείται για να

περιγράψει την (στατιστική) σχέση μεταξύ δυο ή περισσοτέρων συμβάντων,

χαρακτηριστικών ή μεταβλητών [1]. Συσχέτιση υπάρχει όταν η πιθανότητα της

εμφάνισης ενός συμβάντος ή χαρακτηριστικού ή η το μέγεθος μιας μεταβλητής

εξαρτάται από την παρουσία ενός ή περισσοτέρων συμβάντων ή χαρακτηριστικών ή

από το μέγεθος μιας ή περισσοτέρων μεταβλητών. Η συσχέτιση μπορεί να είναι

αρνητική ή θετική. Αυτό που πρέπει να έχουμε πάντα κατά νου είναι ότι η παρουσία

μιας συσχέτισης δεν σημαίνει κατ’ ανάγκην και αιτιολογική σχέση μεταξύ της

έκθεσης και της έκβασης.

Μια συσχέτιση μπορεί να οφείλεται σε πέντε λόγους (γράφημα 5) [19]:

17

1. Σε τύχη (chance) ή όπως συχνά λέγεται σε τυχαία διακύμανση (random

variation).

2. Σε συστηματικά σφάλματα (bias).

3. Σε συγχυτικούς παράγοντες (confounding).

4. Σε αντίστροφη αιτιολογική σχέση (reverse causality).

5. Σε αιτιολογική σχέση (causality).

Η διερεύνηση της φύσης μιας συσχέτισης ονομάζεται αιτιολογική

συμπερασματολογία..

Παρακάτω αναλύονται οι πέντε αυτές ερμηνείες μιας συσχέτισης.

4. 1. Τύχη

Ένας παράγοντας μπορεί να βρεθεί ότι συσχετίζεται με ένα νόσημα για

λόγους καθαρά τυχαίας διακύμανσης. Με άλλα λόγια το δείγμα που επιλέξαμε να

μελετήσουμε έτυχε να αναδεικνύει μια συσχέτιση που δεν ισχύει στον ευρύτερο

πληθυσμό. Εκεί ακριβώς έγκειται ο ρόλος της στατιστικής, να μας βοηθήσει δηλαδή

στην εκτίμηση του κατά πόσον μια συσχέτιση οφείλεται σε τύχη. Συχνά

X Y

σφάλμα

τύχη

Y X

σύγχυση

Τις περισσότερες φορές θέλουμε η ζυγαριά να κλίνει προς τα δεξιά. Στην ζύγιση όμως πρέπει να προσέξουμε να σταθμίσουμε για όλα τα πιθανά σφάλματα και εναλλακτικές ερμηνείες!

Γράφημα 5: Αιτιολογική Συμπερασματολογία

18

χρησιμοποιούμε τον όρο ‘στατιστικά σημαντική’ συσχέτιση για να δηλώσουμε ότι η

συσχέτιση που βρήκαμε είναι σχετικά απίθανο (π.χ. λιγότερο από 5%) να οφείλεται

στην τύχη. Η εύρεση μιας στατιστικά σημαντικής συσχέτισης δεν σημαίνει ότι ο

παράγοντας έχει αιτιολογική σχέση με το νόσημα, πρέπει να αποκλείσουμε και τις

άλλες εναλλακτικές ερμηνείες. Επίσης η εύρεση μιας στατιστικά μη σημαντικής

σχέσης δεν σημαίνει απαραίτητα ότι αυτό είναι πράγματι έτσι. Μπορεί το μέγεθος

του δείγματος να ήταν αρκετά μικρό για να την καταδείξει.

4.2 Συστηματικά σφάλματα

Τα συστηματικά σφάλματα μπορούν να επηρεάσουν μια συσχέτιση και προς

τις δυο κατευθύνσεις, είτε προς τα πάνω είτε προς τα κάτω. Σε καμιά μελέτη δεν

απουσιάζουν πλήρως, ο προσεκτικός όμως σχεδιασμός και εκτέλεση μιας μελέτης θα

πρέπει να στοχεύουν στην ελαχιστοποίηση των σφαλμάτων.

Τα σφάλματα ταξινομούνται συνήθως σε δυο είδη [16,20]: Τα σφάλματα

επιλογής (Selection bias) και τα σφάλματα πληροφορίας ή μέτρησης (information or

measurement bias). Τα συστηματικά σφάλματα επιλογής προκύπτουν κατά την

επιλογή του ‘πληθυσμού’ της μελέτης όταν οι ερευνητικές μονάδες που επιλέγονται

δεν είναι αντιπροσωπευτικές του πληθυσμού στόχου. Αν και σφάλματα επιλογής

μπορούν να υπεισέλθουν σε όλους τους τύπους ερευνών, αποτελούν ιδιαίτερο

πρόβλημα στις αναδρομικού τύπου έρευνες, όπως στις μελέτες ασθενών – μαρτύρων

(case-control). Στην περίπτωση αυτή σφάλμα επιλογής μπορεί να υπεισέλθει εάν οι

μάρτυρες δεν προέρχονται από τον ίδιο πληθυσμό από τον οποίο προέρχονται οι

ασθενείς και έτσι η συχνότητα του παράγοντα έκθεσης στους μάρτυρες δεν μπορεί να

αποτελέσει μέτρο σύγκρισης. Για παράδειγμα, ας υποθέσουμε ότι θέλουμε να

μελετήσουμε εάν η παρουσία μικρών παιδιών στο σπίτι αυξάνει την συχνότητα της

κατάθλιψης στις γυναίκες. Για το σκοπό αυτό σχεδιάζουμε μια μελέτη ασθενών-

μαρτύρων και παίρνουμε ως ασθενείς γυναίκες που νοσηλεύονται σε ψυχιατρικά

νοσοκομεία για κατάθλιψη. Αν ως ομάδα ελέγχου πάρουμε γυναίκες χωρίς

κατάθλιψη που ζουν στην κοινότητα, μπορεί τα αποτελέσματά μας να είναι

εσφαλμένα διότι η νοσηλεία σε ψυχιατρικό νοσοκομείο ενδέχεται να είναι λιγότερο

πιθανή όταν υπάρχουν μικρά παιδιά [21]. Με άλλα λόγια, αν οι γυναίκες μάρτυρες

αρρωστήσουν μπορεί να μην νοσηλευτούν ακριβώς επειδή έχουν μικρά παιδιά. Έτσι,

η ύπαρξη μικρών παιδιών στην περίπτωση αυτή μπορεί να είναι το ίδιο συχνή ή και

λιγότερο συχνή στις γυναίκες που νοσηλεύονται. Ένα άλλο παράδειγμα σφάλματος

19

επιλογής αναφέρθηκε πιο πριν στην συζήτηση των μελετών ασθενών – μαρτύρων με

τη μελέτη των μαιευτικών επιπλοκών και την σχέση τους με την σχιζοφρένεια [8].

Τα σφάλματα πληροφορίας ή μέτρησης συμβαίνουν όταν η διαδικασία

μέτρησης ή επιβεβαίωσης της έκβασης επηρεάζεται από την γνώση της έκθεσης ή

αντιστρόφως. Για παράδειγμα, στις αναδρομικές μελέτες, που η έκβαση είναι γνωστή,

μπορεί οι ασθενείς να ανακαλούν πιο συχνά στη μνήμη τους τον παράγοντα κινδύνου

που μελετάται απ’ότι οι μάρτυρες. Αυτό ονομάζεται σφάλμα ανάκλησης (recall bias)

[1]. Για παράδειγμα σε μια μελέτη για τον ρόλο των λιπιδίων στον καρκίνο του

μαστού οι ασθενείς μπορεί να θυμούνται πιο συχνά την κατανάλωση λιπαρών τροφών

απ’ ότι οι μάρτυρες. Επίσης, σε προοπτικές μελέτες η γνώση της έκθεσης μπορεί να

εισάγει σφάλμα εάν η διάγνωση τίθεται πιo συχνά σε εκείνους που είχαν εκτεθεί στον

παράγοντα. Σε αυτές τις περιπτώσεις προσπαθούμε η εκτίμηση της έκβασης (π.χ. η

διάγνωση) να γίνεται ‘τυφλά’, χωρίς δηλαδή ο εκτιμητής να γνωρίζει εάν ο

συμμετέχων στην έρευνα είχε εκτεθεί στον παράγοντα ή όχι. Για παράδειγμα, στις

τυχαιοποιημένες ελεγχόμενες μελέτες (randomized controlled trials), κατά τις οποίες

οι ασθενείς χωρίζονται τυχαία σε δυο ομάδες, π.χ. ενεργού και αδρανούς φαρμάκου,

η εκτίμηση της έκβασης (π.χ. βελτίωση των συμπτωμάτων) γίνεται πάντοτε με

‘τυφλό’ τρόπο και μάλιστα ‘διπλό τυφλό’, δηλαδή ούτε οι ερευνητές ούτε οι ασθενείς

γνωρίζουν τι από τα δυο έχουν πάρει.

4.3 Το φαινόμενο της σύγχυσης (Confounding)

Σύγχυση είναι το φαινόμενο κατά το οποίο η συσχέτιση μεταξύ δυο

μεταβλητών, όπως ενός παράγοντα κινδύνου και της νόσου, οφείλεται απόλυτα ή εν

μέρει στην ύπαρξη ενός άλλου παράγοντα που συσχετίζεται και με τις δυο

μεταβλητές[4]. Οι συγχυτικοί λοιπόν παράγοντες έχουν δυο χαρακτηριστικά: α)

συσχετίζονται με τον παράγοντα που μελετάμε και β) συσχετίζονται με την έκβαση.

Αυτό μπορεί να οδηγήσει είτε σε μείωση της συσχέτισης είτε σε αύξησή της. Αν μια

συσχέτιση οφείλεται σε συγχυτικούς παράγοντες αυτό δεν σημαίνει ότι δεν είναι

αληθινή, αλλά ότι ερμηνεύεται με άλλο τρόπο. Η ηλικία και το φύλο είναι συχνοί

συγχυτικοί παράγοντες γι’αυτό και πολλές φορές τα αποτελέσματα των μελετών

σταθμίζονται ως προς αυτές τις μεταβλητές. Ένα παράδειγμα σύγχυσης (γράφημα 6)

αποτελεί η χρήση καφέ (έκθεση) και ο καρκίνος του παγκρέατος (έκβαση). Η χρήση

καφέ συσχετίζεται με αυξημένη επίπτωση καρκίνου παγκρέατος. Αυτό ωστόσο

οφείλεται σε τρίτο παράγοντα που δρα συγχυτικά. Ο παράγοντας αυτός είναι το

20

κάπνισμα. Το κάπνισμα αποτελεί ανεξάρτητο παράγοντα κινδύνου για τον καρκίνο

του παγκρέατος. Επίσης, είναι γνωστό ότι αυτοί που καπνίζουν πίνουν περισσότερο

καφέ από αυτούς που δεν καπνίζουν [4].

4.4 Αντίστροφη αιτιότητα (reverse causality)

Δεν πρέπει να ξεχνάμε ότι όταν βρίσκουμε μια συσχέτιση μεταξύ δυο

μεταβλητών, η κατεύθυνση της αιτιότητας μπορεί να είναι και προς τις δυο

κατευθύνσεις, δηλαδή εάν ο παράγοντας Α συσχετίζεται με το Β, τότε μπορεί το Α να

αποτελεί αίτιο του Β, ή το Β να αποτελεί αίτιο του Α. Για παράδειγμα, εάν σε μια

μελέτη βρούμε μια συσχέτιση μεταξύ κατάθλιψης και διαζυγίου, αυτή μπορεί να

οφείλεται είτε στο γεγονός ότι τα διαζύγια αυξάνουν τον κίνδυνο κατάθλιψης, είτε

διότι η κατάθλιψη αυξάνει την πιθανότητα ένα ζευγάρι να χωρίσει. Όπως γίνεται

αντιληπτό η αντίστροφη αιτιότητα είναι μεγαλύτερο πρόβλημα σε συγχρονικές ή

αναδρομικές μελέτες, σε αντίθεση με τις προοπτικές.

4.5 Αιτιολογική Σχέση

Το γεγονός ότι υπάρχουν πολλές εναλλακτικές ερμηνείες για την ύπαρξη μιας

συσχέτισης, δεν σημαίνει ότι δεν υπάρχουν φορές που μπορούμε με αρκετή ασφάλεια

να θεωρήσουμε ότι ένας παράγοντας πραγματικά αποτελεί μέρος της αιτιολογίας ενός

νοσήματος. Η προηγούμενη συζήτηση όμως δείχνει ότι πρέπει στην διαδικασία αυτή

να είμαστε πολύ προσεκτικοί. Η αποδοχή ενός παράγοντα ως αιτιολογικού

διευκολύνεται και από μια σειρά κριτηρίων που έχουν αναπτυχθεί, με πιο γνωστά

αυτά του Bradford Hill (γράφημα 7) [20]. Τα κριτήρια αυτά αναπτύχθηκαν σε

Καφές Καρκίνος Παγκρέατος

Κάπνισμα

Γράφημα 6: Το κάπνισμα δρα ως συγχυτικός παράγοντας στην πλασματική συσχέτιση καφέ και καρκίνου

21

μεγάλο βαθμό κατά την διάρκεια των μελετών για την διαλεύκανση της σχέσης

καπνίσματος και καρκίνου του πνεύμονα την δεκαετία 1960 –70 [9].

5. Κλινική Σημαντικότητα των Αποτελεσμάτων

Μια μελέτη μπορεί να είναι μεθοδολογικά έγκυρη αλλά να μην είναι κλινικά

χρήσιμη. Το ‘παράδοξο’ αυτό φαινόμενο μπορεί να οφείλεται σε δυο κυρίως λόγους:

πρώτον, το είδος της έκβασης (outcome) το οποίο έχει χρησιμοποιηθεί μπορεί να μην

είναι κατάλληλο για την απ’ ευθείας μεταφορά των αποτελεσμάτων στην κλινική

πράξη, και δεύτερον, το μέγεθος του αποτελέσματος (π.χ. της διαφοράς στην

αποτελεσματικότητα δυο αντιϋπερτασικών φαρμάκων) να μην είναι τέτοιο που να

δικαιολογεί την αλλαγή της κλινικής πράξης.

5.1 Είδη εκβάσεων σχετιζόμενων με την Υγεία (Health Outcomes)

Ως έκβαση στο πλαίσιο αυτής της παρουσίασης, εννοούμε κάθε μεταβολή

(της κλινικής κατάστασης) που επέρχεται στους συμμετέχοντες σε μια μελέτη και η

οποία σχετίζεται με την έκθεσή τους (exposure) είτε σε παράγοντες κινδύνου είτε σε

• Το κριτήριο της χρονικής αλληλουχίας (η έκθεση προηγείται της έκβασης)

• Ο βαθμός της συσχέτισης (ισχυρές συσχετίσεις πιο συχνά αιτιολογικές)

• Η σταθερότητα της συσχέτισης (παρόμοια αποτελέσματα με διαφορετικές μεθόδους)

• Η ύπαρξη δοσολογικής σχέσης (η αύξηση της δόσης της έκθεσης αυξάνει την επίπτωση της νόσου)

• Η ειδικότητα της συσχέτισης (ο παράγοντας δεν συσχετίζεται και με άλλα νοσήματα)

• Η επιστημονική πειστικότητα (ερμηνεύεται το εύρημα με βάση κάποιον παθοφυσιολογικό μηχανισμό;)

• Η συμβατότητα (η συσχέτιση δεν έρχεται σε σύγκρουση με ό,τι είναι γνωστό έως τώρα)

• Η πειραματική επιβεβαίωση (η απομάκρυνση του παράγοντα οδηγεί σε μείωση της επίπτωσης;)

• Η αναλογία (παρόμοιοι παράγοντες προκαλούν παρόμοιες εκβάσεις)

Γράφημα 7: Τα κριτήρια του Hill για την αιτιότητα

22

θεραπευτικές ή προληπτικές παρεμβάσεις. Σε γενικές γραμμές, διακρίνουμε δυο είδη

εκβάσεων: α) τις βιολογικές ή ψυχοκοινωνικές παραμέτρους που δεν σχετίζονται

άμεσα με τη νόσο (π.χ. τιμές χοληστερόλης, σκορ σε μια κλίμακα για την εκτίμηση

του κοινωνικού υποστηρικτικού δικτύου του ασθενή) και β) τις κλινικές παραμέτρους

που έχουν άμεση σχέση με το νόσημα. Οι μη-κλινικές εκβάσεις δεν μπορούν παρά

να θεωρηθούν ως υποκατάστατα των κλινικών και έτσι δεν μπορούν να

χρησιμοποιηθούν για την αλλαγή της κλινικής πράξης. Ένα φάρμακο που μειώνει την

χοληστερίνη (βιολογική παράμετρος) δεν μπορεί να χρησιμοποιηθεί για την πρόληψη

της στεφανιαίας νόσου, εκτός αν τεκμηριώνεται η αποτελεσματικότητά του στην

μείωση π.χ. της επίπτωσης της στεφανιαίας νόσου (κλινική έκβαση).

Κλινικές εκβάσεις που είναι χρήσιμες στην πράξη, συνήθως περιλαμβάνονται

στους εξής τομείς: α) Θάνατος (Death), β) Ανικανότητα (Disability), γ) Στάδιο νόσου

(Disease Status), δ) Έλλειψη ικανοποίησης με την διαδικασία της νοσηλείας

(Dissatisfaction with process of care) και ε) Δυσφορία για τις συνέπειες της ασθένειας

(Discomfort about the effects of disease). Στην Αγγλική γλώσσα, μπορεί να

χρησιμοποιηθεί ο μνημοτεχνικός κανόνας των ‘five Ds’ [22].

5.2 Μέτρα του Αποτελέσματος (Measures of Effect)

Για να εκτιμήσουμε κατά πόσον το μέγεθος του αποτελέσματος είναι τέτοιο

ώστε να δικαιολογείται η αλλαγή της κλινικής πράξης (δηλαδή εάν είναι κλινικά

σημαντικό και όχι μόνο στατιστικά σημαντικό) χρειαζόμαστε κάποιο μέτρο της

αποτελεσματικότητας. Στην έρευνα, χρησιμοποιούνται δυο είδη μέτρων: τα σχετικά

(relative measures) και τα απόλυτα (absolute measures). Τα σχετικά περιλαμβάνουν

μεταξύ άλλων τον σχετικό κίνδυνο (relative risk) και τον λόγο του πηλίκου των

συμπληρωματικών πιθανοτήτων (odds ratio). Τα σχετικά μέτρα είναι χρήσιμα στην

διερεύνηση της αιτιολογίας των νοσημάτων, αλλά όχι και για την κλινική πράξη

όπου ενδιαφερόμαστε και για το απόλυτο αποτέλεσμα [2]. Ένα παράδειγμα μπορεί να

δείξει την διαφορά των δυο μέτρων. Ας υποθέσουμε ότι σε μια κλινική μελέτη η

ομάδα που έλαβε εικονικό φάρμακο εμφάνισε τη νόσο σε ποσοστό 90%, ενώ εκείνη

που πήρε το ενεργό φάρμακο σε ποσοστό 30%. Το αποτέλεσμα της μελέτης

εκφρασμένο σε σχετικούς όρους θα ήταν ότι το φάρμακο επέφερε μια μείωση του

σχετικού κινδύνου νόσησης (relative risk reduction) κατά 66% (90%-30% / 90%

=66%). Η μείωση του απόλυτου κινδύνου (absolute risk reduction) είναι 60% (90% -

30% = 60%). Αν αλλάξουμε τα νούμερα ως εξής, εικονικό φάρμακο 9%, ενεργό

23

φάρμακο 3%, τότε έχουμε μείωση σχετικού κινδύνου 66% αλλά μείωση απόλυτου

κινδύνου μόλις 6%. Αν και η μείωση του σχετικού κινδύνου είναι σημαντική και ίδια

με το πρώτο παράδειγμα, η μείωση του απόλυτου κινδύνου μπορεί να είναι μικρής

κλινικής σημασίας. Το παράδειγμα αυτό δείχνει πολύ εύγλωττα το μειονέκτημα των

σχετικών μέτρων, δηλαδή ότι δεν μπορούν να διακρίνουν μεταξύ μικρών και

μεγάλων αποτελεσμάτων.

Συνηθισμένα απόλυτα μέτρα που χρησιμοποιούνται για δυαδικές (ναι – όχι)

εκβάσεις είναι ο απόλυτος κίνδυνος (absolute risk) ή ο οφειλόμενος κίνδυνος

(attributable risk) που ορίζονται με τον ίδιο τρόπο, δηλαδή η διαφορά στον κίνδυνο

εμφάνισης της έκβασης μεταξύ των δυο συγκρινόμενων ομάδων και ο ‘αριθμός

ασθενών που απαιτείται προς θεραπεία’ (number needed to treat) που ορίζεται ως ο

ελάχιστος αριθμός των ασθενών στους οποίους πρέπει να εφαρμοστεί η παρέμβαση

(θεραπεία) προκειμένου να προληφθεί μία εμφάνιση της υπό μελέτη έκβασης [2]. Για

παράδειγμα, ο αριθμός των ασθενών που πρέπει να υποβληθούν σε αντιλιπιδαιμική

θεραπεία για να προληφθεί ένας θάνατος από στεφανιαία νόσο. Ο υπολογισμός του

αριθμού αυτού, που συμβολίζεται ως NNT από την σύντμησή του στην Αγγλική

γλώσσα, είναι πολύ απλός αφού αποτελεί το αντίστροφο κλάσμα της μείωσης του

απόλυτου κινδύνου. Στο προηγούμενο παράδειγμα της κλινικής μελέτης που είχαμε

απόλυτο κίνδυνο 90% για το εικονικό φάρμακο και 30% για το ενεργό, η μείωση του

απόλυτου κινδύνου είναι 60% και ο αριθμός των ασθενών που απαιτείται προς

θεραπεία για την πρόληψη ενός επεισοδίου της ανεπιθύμητης έκβασης είναι

100/60=1,66 ασθενείς. Αλλάζοντας τα νούμερα σε 9% και 3% αντίστοιχα, τότε η

μείωση του απόλυτου κινδύνου είναι 6% και ο ΝΝΤ είναι 16,66 ασθενείς. Η

σύγκριση των δυο αριθμών NNT δείχνει την κλινική σημαντικότητα των δυο αυτών

αποτελεσμάτων.

24

Παραπομπές

[1] Last JM. A dictionary of Epidemiology 3d edition. Oxford University Press: New York

1995.

[2] Sackett B, Straus S, Richardson WS, Rosenberg W, Haynes RB. Evidence Based

Medicine: How to practice and teach EBM. 2nd Edition. Churchill Livingstone: Edinburgh

2000.

[3] Feinstein AR (1974). A survey of the statistical procedures in general medical journals.

Clinical Pharmacology and Therapeutics 15:97-107.

[4] MacMahon B. & Trichopoulos D. Epidemiology. Principles and methods. Boston: Little,

Brown and Company 1996.

[5] Lewis G, Appleby L, Jarman B. (1994). Suicide and psychiatric services. Lancet 344, 822.

[6] Skapinakis P, Lewis G, Meltzer H (2000). Clarifying the relationship between

unexplained chronic fatigue and psychiatric morbidity: results from a community survey in

Great Britain. American Journal of Psychiatry 157:1492-1498.

[7] Kendell RE, Juszczak E, Cole SK (1996). Obstetric complications and schizophrenia: a

case-control study based on standardised obstetric records. British Journal of Psychiatry 168,

556-561.

[8] Kendell RE, McInneny K, Juszczak E, Bain M (2000). Obstetric complications and

schizophrenia: two case-control studies based on structured obstetric records. British Journal

of Psychiatry 176, 516-522.

[9] Doll R, Hill AB (1964). Mortality in relation to smoking: Ten year's observation of British

doctors. BMJ 1:1399-1410.

[10] Dawber TR, Meadors GF, Moore FG (1951). The epidemiological approach to heart

disease: The Framingham study. American Journal of Public Health 41: 279-286.

[11] Pocock SJ. Clinical Trials. A practical Approach. John Wiley & Sons: Chichester 1983.

[12] Kunz R, Oxman AD (1998). The unpredictability paradox: review of empirical

comparisons of randomised and non-randomised clinical trials.

BMJ 317, 1185-1190.

[13] Black, N (1996) Why we need observational studies to evaluate the effectiveness of

health care BMJ 312, 1215-8

[14] McKee M, Britton A, Black N, McPherson K, Sanderson C, Bain C (1999). Methods in

health services research. Interpreting the evidence: choosing between randomised and non-

randomised studies. BMJ 319, 312-5.

[15] Γερμενής ΑΕ (2001). Ανασκοπήσεων ανασκόπηση. Αρχεία Ελληνικής Ιατρικής 17:232-

236.

25

[16] Σκαπινάκης Π (2001). Συστηματικές Ανασκοπήσεις και συστηματικά σφάλματα. Αρχεία

Ελληνικής Ιατρικής 17:440-445.

[17] Thompson SG. Why sources of heterogeneity in meta-analysis should be investigated.

Br Med J 1994, 309, 1351-1355.

[18] Lau J, Ioannidis JPA, Schmid CH. Summing up evidence: one answer is not always

enough. Lancet 1998, 351, 123-127.

[19] Lewis G, Thomas H, Cannon M, Jones P. Epidemiological Methods. In Textbook of

Community Psychiatry, edited by Thornicroft G and Szmukler G. Oxford University Press:

Oxford 2001.

[20] Rothman KJ, Greenland S. Modern Epidemiology 2nd edition. Lippincott Williams and

Wilkins: Philadelphia 1998.

[21] Brown GW, Harris T. Social Origins of Depression. Tavistock: London 1978.

[22] Muir Gray J. Evidence based health care. How to make health policy and management

decisions. Churchill Livingstone:New York 1997.

ΣΥΣΤΗΜΑΤΙΚΕΣ ΑΝΑΣΚΟΠΗΣΕΙΣ ΑΡΘΡΟ Π. ΣΚΑΠΙΝΑΚΗ

Ανατύπωση από Αρχεία Ελληνικής Ιατρικής

ÓõóôçìáôéêÝò áíáóêïðÞóåéò êáé óõóôçìáôéêÜ óöÜëìáôá

Óå ðñïçãïýìåíï ¢ñèñï Óýíôáîçò, áíáöÝñèçêå çâáóéêÞ äéÜêñéóç ôùí áíáóêïðÞóåùí óå ðåñéãñáöé-êÝò Þ áöçãçìáôéêÝò êáé óå óõóôçìáôéêÝò.1 Ôïíßóôçêåéäéáßôåñá üôé, áí êáé ïé ðñþôåò åîáêïëïõèïýí íáäéáôçñïýí ôç óçìáóßá ôïõò óôçí ðñïáãùãÞ ôçòéáôñéêÞò ãíþóçò (êáé áõôü, Üëëùóôå, ôï ôåý÷ïòáðáñôßæåôáé ìüíï áðü ðåñéãñáöéêÝò áíáóêïðÞ-óåéò), ïé ôåëåõôáßåò áñ÷ßæïõí óôáäéáêÜ íá ôéò áíôé-êáèéóôïýí, óå ôïìåßò üðïõ ç ðáñÝêêëéóç áðü ôçíôåêìçñéùìÝíç ìáñôõñßá ìðïñåß íá Ý÷åé áñíçôéêÜáðïôåëÝóìáôá ãéá ôçí õãåßá.2 Ëüãù ôçò óçìáóßáò,ëïéðüí, ôùí óõóôçìáôéêþí áíáóêïðÞóåùí ãéá ôçëåãüìåíç ôåêìçñéùìÝíç éáôñéêÞ ðñáêôéêÞ (evidence-based medicine),3 óõíå÷ßæïõìå, óå áõôü ôï ôåý÷ïò, ôçóõæÞôçóç ãéá ôéò óõóôçìáôéêÝò áíáóêïðÞóåéò,èßãïíôáò ïñéóìÝíåò ðôõ÷Ýò ôùí áñ÷þí êáé ôçòìåèïäïëïãßáò ôïõò. Óôü÷ïò åßíáé ç åðéóÞìáíóç ôùíðëåïíåêôçìÜôùí ôùí óõóôçìáôéêþí áíáóêïðÞ-óåùí, áëëÜ êáé ï êßíäõíïò ôùí óõóôçìáôéêþí óöá-ëìÜôùí ðïõ õðåéóÝñ÷ïíôáé, áíáðüöåõêôá, óå êÜèååñåõíçôéêÞ äéáäéêáóßá.

Ãéáôß óõóôçìáôéêÝò áíáóêïðÞóåéò; Ãéá ðïéï ëüãïíá ôéò ðñïôéìÞóïõìå, Ýíáíôé ôùí êëáóéêþí Þ Üëëùíðñùôïãåíþí ôýðùí åñåõíþí; Ôé êåñäßæïõìå áëëÜ êáéôé ÷Üíïõìå; Ãéá íá åßíáé ç óõæÞôçóÞ ìáò ðéï ðñá-êôéêÞ, èá ÷ñçóéìïðïéçèïýí ôñßá ðáñáäåßãìáôáóõóôçìáôéêþí áíáóêïðÞóåùí, Ýôóé þóôå ïé èåùñç-ôéêÝò Ýííïéåò íá óõó÷åôéóôïýí Üìåóá ìå ôçí êëéíéêÞêáé åñåõíçôéêÞ ðñÜîç. Êáé ïé ôñåéò áõôÝò ìåëÝôåòÝ÷ïõí äçìïóéåõôåß óôï British Medical Journal êáé,åêôüò ôùí Üëëùí, åðéëÝ÷èçêáí, åðåéäÞ ôï ðåñéïäéêüôéò äéáèÝôåé åëåýèåñá óôï Internet (www.bmj.com).Ôï ðñþôï ðáñÜäåéãìá ðñïÝñ÷åôáé áðü ôçí ÅëëÜäá

(Éíóôéôïýôï Õãåßáò ôïõ Ðáéäéïý). 4 Ïé åñåõíçôÝòÞèåëáí íá åîåôÜóïõí ôçí õðüèåóç üôé ç åðéäçìßáóõããåíïýò åñõ-èñÜò, ðïõ Ýðëçîå ôçí ÅëëÜäá ôï1993, ïöåéëüôáí åí ìÝñåé óôï ãåãïíüò üôé ç ÷þñáìáò, ôá ðñïçãïýìåíá Ýôç, åß÷å ÷áìçëÜ ðïóïóôÜêÜëõøçò åìâïëéáóìïý Ýíáíôé ôçò åñõèñÜò, ìå áðï-ôÝëåóìá íá áõîçèåß ç ìÝóç çëéêßá íüóçóçò áðüåñõèñÜ êáé, êáôÜ óõíÝðåéá, íá áõîçèïýí êáé ôáêñïýóìáôá óõããåíïýò åñõèñÜò. Ãéá íá åîåôÜóïõíáõôÞ ôçí õðüèåóç, ðñáãìáôïðïßçóáí ìéá óõóôçìá-ôéêÞ áíáóêüðçóç üëùí ôùí åñåõíþí ðïõ åß÷áí ãßíåéóôçí ÅëëÜäá óôï äéÜóôçìá 1950–1997 êáé áöïñïý-óáí ôçí ðïëéôéêÞ åìâïëéáóìïý, ôï ðïóïóôü êÜëõøçòåìâïëéáóìïý, ôçí åñãáóôçñéáêÜ åðéâåâáéùìÝíç áíï-óßá êáé ôçí åêäÞëùóç åñõèñÜò êáé óõããåíïýò åñõ-èñÜò. Ç Ýñåõíá áõôÞ äåí åßíáé áðïêëåéóôéêÜóõóôçìáôéêÞ áíáóêüðçóç, åðåéäÞ ïé óõããñáöåßòÝêáíáí, óôçí ïõóßá, êáé ìéá áíáäñïìéêÞ Ýñåõíá ôùíêñïõóìÜôùí åñõèñÜò êáé óõããåíïýò åñõèñÜò ðïõäçëþèçêáí óôçí ÅëëÜäá áðü ôï 1960 êáé ìåôÜ.

Ç äåýôåñç åñãáóßá ðñïÝñ÷åôáé áðü ôçí Ïëëáíäßáêáé åßíáé ìéá ôõðéêÞ óõóôçìáôéêÞ áíáóêüðçóç ÷ùñßòðïóïôéêÞ óýíèåóç ôùí äåäïìÝíùí.5 Ïé óõããñáöåßòèÝëçóáí íá åîåôÜóïõí áí ïé ðñïëçðôéêÝò åðéóêÝøåéòóå óðßôéá çëéêéùìÝíùí, ðïõ æïõí óôçí êïéíüôçôá,âåëôéþíïõí ôç ëåéôïõñãéêüôçôÜ ôïõò êáé ìåéþíïõí ôçíïóçñüôçôá Þ ôç èíçóéìüôçôÜ ôïõò. Ç ôñßôç åñãáóßááðïôåëåß ìéá ôõðéêÞ ìåôá-áíÜëõóç, äçëáäÞ ìéáóõóôçìáôéêÞ áíáóêüðçóç, óôçí ïðïßá Ý÷åé ãßíåéðïóïôéêÞ óýíèåóç ôùí äåäïìÝíùí ôùí ìåëåôþí ðïõóõìðåñéåëÞöèçóáí. Ïé óõããñáöåßò áíáóêüðçóáíôõ÷áéïðïéçìÝíåò åëåã÷üìåíåò ìåëÝôåò (randomizedcontrolled trial, RCT) ó÷åôéêÝò ìå ôçí áðïôåëåóìáôé-êüôçôá ôùí áíôéëéðéäáéìéêþí óêåõáóìÜôùí óôçíðñùôïãåíÞ ðñüëçøç ôçò óôåöáíéáßáò íüóïõ.6

Ôï ðñþôï âÞìá ãéá ôçí ðñáãìáôïðïßçóç ìéáòìåëÝôçò åßíáé ç äéáìüñöùóç ôïõ ðñïâëÞìáôïò ÞèÝìáôïò ðïõ èá åñåõíçèåß7 (ðßí. 1). Óôçí ðåñßðôùóçôùí óõóôçìáôéêþí áíáóêïðÞóåùí, áõôü äåí ðåñé-

ÁÑÈÑÏ ÓÕÍÔÁÎÇÓEDITORIAL

ÁÑ×ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 17(5), 2000 441

ëáìâÜíåé ìüíï ôçí åñåõíçôéêÞ åñþôçóç, áëëÜ, åðß-óçò, êáé ôïí ðëçèõóìü-óôü÷ï, ôï ðåñéâÜëëïí (ð.÷.êïéíüôçôá, ðñùôïâÜèìéá öñïíôßäá, íïóïêïìåßï),ôçí Ýêâáóç, ôç äéÜñêåéá íüóçóçò, êáèþò êáé ôáêñéôÞñéá áðïäï÷Þò Þ áðïêëåéóìïý ôùí ó÷åôéêþíìåëåôþí. Ëüãù ôçò ìåèïäïëïãßáò ôïõò, ðïõ ðñïóåã-ãßæåé åêåßíç ôùí ðñùôïãåíþí äçìïóéåýóåùí, ïéóõóôçìáôéêÝò áíáóêïðÞóåéò åßíáé óõ÷íÜ ðåñéóóüôå-ñï êëéíéêÜ ðñïóáíáôïëéóìÝíåò êáé ìðïñïýí íááðáíôÞóïõí ìå ìåãáëýôåñç áêñßâåéá óå ðåñéïñé-óìÝíïõ åýñïõò êëéíéêÜ èÝìáôá, éäéáßôåñá üóïíáöïñÜ ôçí áðïôåëåóìáôéêüôçôá èåñáðåõôéêþí ðá-ñåìâÜóåùí. Ãéá ôïõò ßäéïõò ëüãïõò åßíáé, åðßóçò,óçìáíôéêÝò ãéá ôçí áîéïëüãçóç ðáñåìâÜóåùíãåíéêüôåñá óôç Äçìüóéá Õãåßá.8 Óå áõôÝò ôéò ðåñé-ðôþóåéò, ðñïôéìïýìå íá âáóéæüìáóôå ðåñéóóüôåñïóôéò ôåêìçñéùìÝíåò óõóôçìáôéêÝò áíáóêïðÞóåéòðáñÜ óôéò éäéïóõãêñáóéáêÝò ðåñéãñáöéêÝò áíáóêï-ðÞóåéò. Êáé óôá ôñßá ðáñáäåßãìáôá, ïé óõããñáöåßòäéáôýðùóáí åñùôÞìáôá, ðïõ Þôáí éäéáßôåñá åóôé-áóìÝíá:

– Ìåéþíïõí ôçí åðßðôùóç óôåöáíéáßáò íüóïõ ôááíôéëéðéäáéìéêÜ öÜñìáêá, óå Üôïìá ÷ùñßò ðñïç-ãïýìåíï éóôïñéêü óôåöáíéáßáò íüóïõ;

– Ðïéü ðïóïóôü ôïõ Åëëçíéêïý ðëçèõóìïý åß÷ååìâïëéáóôåß åíáíôßïí ôçò åñõèñÜò êáôÜ ôçíðåñßïäï 1950–1997;

– Ìåéþíïõí ôç èíçóéìüôçôá ôùí çëéêéùìÝíùí ðïõæïõí óôçí êïéíüôçôá, ïé ðñïãñáììáôéóìÝíåòåðéóêÝøåéò óôï óðßôé;

Âåâáßùò, ôá åñùôÞìáôá áõôÜ èá ìðïñïýóáí íááðáíôçèïýí êáé ìå Üëëïõ ôýðïõ Ýñåõíåò, áëëÜ ïéóõóôçìáôéêÝò áíáóêïðÞóåéò ðñïóöÝñïõí ìéááðïäïôéêüôçôá, ôüóï óå ïéêïíïìéêïýò üóï êáé óå÷ñïíéêïýò üñïõò, ðïõ ôéò êÜíåé éäéáßôåñá åëêõóôéêÝò.

ÕðÜñ÷ïõí, üìùò, êáé Üëëïé ëüãïé ãéá ôçíðñïôßìçóç ôùí óõóôçìáôéêþí áíáóêïðÞóåùíÝíáíôé Üëëùí åíáëëáêôéêþí ôýðùí åñåõíþí, ãéáåñùôÞìáôá ðáñüìïéá ìå áõôÜ ôùí ôñéþí ðáñá-äåéãìÜôùí. Ôï áéôéïëïãéêü, ðïõ áíáëýåôáé ðëçñÝ-óôåñá áðü ôç Murlow,9 Ý÷åé, åíäåéêôéêÜ, ùò åîÞò:

á. Ç åõêïëßá åêôßìçóçò ôçò ãåíéêåõóéìüôçôáò (gen-eralisability), ôçò óõíÝðåéáò (consistency) Þ ôçòáóõíÝðåéáò (inconsistency) ìåëåôþí ìå ôïí ßäéïóêïðü áëëÜ ìå äéáöïñåôéêÞ ìåèïäïëïãßá. ÃéáðáñÜäåéãìá, óôç ìåôá-áíÜëõóç ôùí áíôéëéðéäáé-ìéêþí öáñìÜêùí, ïé óõããñáöåßò óõìðåñéÝëáâáíôåëéêÜ 4 ôõ÷áéïðïéçìÝíåò åëåã÷üìåíåò ìåëÝôåò.6 Áðüôçí áðëÞ óýãêñéóç ôùí ìåëåôþí, ï áíáãíþóôçòìðïñåß íá åîåôÜóåé êáôÜ ðüóï õðÜñ÷åé óõíÝðåéá ÞáóõíÝðåéá óôçí áðïôåëåóìáôéêüôçôá ôçò èåñá-ðåßáò, åíþ åðßóçò ìðïñåß íá äåé êáôÜ ðüóï ìðïñåßíá ãåíéêåýóåé ôá áðïôåëÝóìáôá ôùí åñåõíþí êáé óåÜëëïõò ðëçèõóìïýò Þ ðåñéâÜëëïíôá. Áðü ôïíðßíáêá ðïõ ðáñïõóéÜæïõí ïé óõããñáöåßò, öáßíåôáéüôé êáé ïé 4 ìåëÝôåò åìöáíßæïõí ìéá ôÜóç (trend) ãéáèåôéêü áðïôÝëåóìá, üóïí áöïñÜ ôçí ðñüëçøç íÝùíðåñéóôáôéêþí óôåöáíéáßáò íüóïõ, áí êáé óôçíðñþôç áðü ôéò ìåëÝôåò ôï áðïôÝëåóìá äåí Þôáí«óôáôéóôéêÜ óçìáíôéêü» (ðßí. 2). Áíôßèåôá, óôçíïëëáíäéêÞ áíáóêüðçóç, öÜíçêå üôé õðÞñ÷å ìåãÜëçáóõíÝðåéá ìåôáîý ôùí áðïôåëåóìÜôùí ôùí ìåëå-ôþí, üóïí áöïñÜ ôéò ðñïëçðôéêÝò åðéóêÝøåéò óåóðßôéá çëéêéùìÝíùí áôüìùí.5

â. Ïé óõóôçìáôéêÝò áíáóêïðÞóåéò ìðïñïýí íáóõìâÜëïõí óôçí áýîçóç ôçò éó÷ýïò (power) êáé ôçòáêñßâåéáò (precision) ôçò åêôßìçóçò ôïõ áðïôåëÝ-óìáôïò (effect). Ï üñïò éó÷ýò áíáöÝñåôáé óôçí

Ðßíáêáò 1 . ÓôÜäéá óôçí ðñáãìáôïðïßçóç ìéáò óõóôçìáôéêÞòáíáóêüðçóçò.

Äéáìüñöùóç ôïõ åñåõíçôéêïý ðñïâëÞìáôïòÁíáæÞôçóç êáé åðéëïãÞ ôùí ó÷åôéêþí ìåëåôþíÅîáãùãÞ ôùí äåäïìÝíùí êáé áíÜëõóçÐáñïõóßáóç ôùí áðïôåëåóìÜôùí

Ðßíáêáò 2 . ÁíôéëéðéäáéìéêÜ öÜñìáêá êáé ðñùôïãåíÞò ðñüëçøç óôåöáíéáßáò íüóïõ. Ìåôá-áíÜëõóç.*

ÌåëÝôç 1 155/1906 187/1900 0,81 (0,65–1,01)ÌåëÝôç 2 56/2051 84/2030 0,65 (0,46–0,92)ÌåëÝôç 3 174/3302 248/3293 0,68 (0,56–0,83)ÌåëÝôç 4 56/3304 96/3301 0,58 (0,41–0,80)Óýíïëï 441/10563 615/10524 0,70 (0,62–0,79)

*Áðü Pignone et al. Br Med J 2000, 321:1–5. †ÄÅ: ÄéáóôÞìáôá åìðéóôïóýíçò

ÌåëÝ ôç ÏìÜäá èåñáðå ßáò ÏìÜäá åëÝã÷ïõ Ëüãïò ôùí Ïôæ ( áñ éèìüò ð åñ éð ôþóåùí /áñ éèìüò á ôüìùí ) (áñ éèìüò ðåñ éð ôþóåùí /áñ éèìüò á ôüìùí ) ( 9 5 % Ä Å ) †

éêáíüôçôá ìéáò ìåëÝôçò íá êáôáäåßîåé ìéá ó÷Ýóç (as-sociation), üôáí áõôÞ ðñÜãìáôé õðÜñ÷åé.10 Ç éó÷ýòåîáñôÜôáé éäéáßôåñá áðü ôï ìÝãåèïò ôïõ äåßãìáôïòðïõ ÷ñçóéìïðïéåßôáé. ÊáôÜ êáíüíá, ìéêñÜ äåßãìáôá(ðïëý óõ÷íÜ óôçí êëéíéêÞ Ýñåõíá) áäõíáôïýí åîïñéóìïý íá áíé÷íåýóïõí ìéêñÝò äéáöïñÝò óôïìÝãåèïò ôïõ áðïôåëÝóìáôïò.11 Îáíáãõñíþíôáò ðÜëéóôïí ðßíáêá 2, áðü ôç ìåôá-áíÜëõóç ôïõ ðáñáäåß-ãìáôïò,6 âëÝðïõìå üôé, óôçí ðñþôç ìåëÝôç, áðüôïõò 1906 óõììåôÝ÷ïíôåò ðïõ ðÞñáí áíôéëéðéäáé-ìéêü öÜñìáêï, 155 åìöÜíéóáí óôåöáíéáßá íüóï(åðßðôùóç 81,3 áíÜ 1000). Ðáñüìïéá, óôçí ïìÜäáåëÝã÷ïõ óçìåéþèçêáí 187 íÝá ðåñéóôáôéêÜ áðü ôïõò1900 óõììåôÝ÷ïíôåò (åðßðôùóç 98,4 áíÜ 1000). ÓôçìåëÝôç áõôÞ óõììåôåß÷áí ó÷åäüí 3800 Üôïìá êáéêÜðïéïò èá ðßóôåõå üôé áõôü ôï ìÝãåèïò ôïõäåßãìáôïò èá Þôáí áñêåôü, ãéá íá áðïêáëýøåé ôçäéáöïñÜ ôùí 17,1 áíÜ 1000 ðïõ ðñïÝêõøå. ¸íáòáðëüò õðïëïãéóìüò, üìùò, ôçò éó÷ýïò ôçò óõãêåêñé-ìÝíçò ìåëÝôçò äåß÷íåé üôé ç éó÷ýò Þôáí ìüëéò 43%!12

Ìå Üëëá ëüãéá, ç ìåëÝôç Þôáí áíåðáñêÞò íááðáíôÞóåé óôï óõãêåêñéìÝíï åñþôçìá êáé èá÷ñåéÜæïíôáí ôïõëÜ÷éóôïí 6.500 Üôïìá ãéá ìéáéêáíïðïéçôéêÞ éó÷ý, óôï åðßðåäï ôïõ 80%. ¸ôóé, áíêáé ç åêôßìçóç ôçò äéáöïñÜò ìåôáîý ôùí äýïïìÜäùí Þôáí ðñïò ôç óùóôÞ êáôåýèõíóç (ôááíôéëéðéäáéìéêÜ ðñïóôáôåýïõí), ùóôüóï ôá äéáóôÞ-ìáôá åìðéóôïóýíçò ðåñéåëÜìâáíáí ôç ìïíÜäá, áíêáé ïñéáêÜ, äçëáäÞ ôï áðïôÝëåóìá èá ìðïñïýóå íáïöåßëåôáé êáé óôçí ôý÷ç (chance). Áíôßèåôá, ç ìåôá-áíÜëõóç (ðïõ âáóßóôçêå åí ìÝñåé êáé ó' áõôÞ ôçìåëÝôç) óõìðåñéÝëáâå, ôåëéêÜ, ó÷åäüí 20.000 Üôïìáêáé åß÷å ðñáãìáôéêÜ ðïëý ìåãÜëç éó÷ý, ãéá íááðïêáëýøåé áõôÞí Þ êáé áêüìç ìéêñüôåñç äéáöïñÜ.

Ìéá Üëëç èåôéêÞ óõíÝðåéá ôïõ áõîçìÝíïõ ìåãÝ-èïõò ôïõ äåßãìáôïò, ðïõ ìðïñïýìå íá ðåôý÷ïõìå ìåôéò ìåôá-áíáëýóåéò, åßíáé ç áêñßâåéá (precision) ôçòåêôßìçóçò åíüò áðïôåëÝóìáôïò. Óå ðåñéðôþóåéòüðïõ ç áêñßâåéá åßíáé ìéêñÞ, ôá 95% äéáóôÞìáôáåìðéóôïóýíçò åßíáé åõñÝá êáé áíôéóôñüöùò. Ìå ôéòìåôá-áíáëýóåéò ìðïñïýìå, ðïëëÝò öïñÝò, íá ðåôý-÷ïõìå Ýíá óôåíü åýñïò äéáóôçìÜôùí êáé Ýôóé íááõîÞóïõìå ôçí áêñßâåéá, ìå ôçí ïðïßá åêôéìïýìå ôïáðïôÝëåóìá ìéáò ðáñÝìâáóçò. Ãéá ðáñÜäåéãìá, çäåýôåñç ìåëÝôç ôçò ìåôá-áíÜëõóçò ôïõ ðáñáäåß-ãìáôïò ðáñïõóéÜæåé ßäéá ó÷åäüí åêôßìçóç (point es-timate) ôïõ ëüãïõ ôùí ïíôæ Þ ëüãïõ ôùí åíäå÷ïìÝ-íùí (odds ratio) ìå ôï óõíäõáóôéêü ëüãï ðïõõðïëïãßóôçêå áðü ôç ìåôá-áíÜëõóç. Ôá 95% äéáóôÞ-ìáôá åìðéóôïóýíçò óôç äåýôåñç ðåñßðôùóç, üìùò,

åßíáé ðïëý ðéï óôåíÜ, äçëáäÞ ç åêôßìçóç ãéá ôçíáëçèéíÞ ôéìÞ (true value) åßíáé ðéï áêñéâÞò (óõãêñß-íáôå, óôïí ðßíáêá 2, ôï äéÜóôçìá ôçò äåýôåñçòìåëÝôçò 0,46– 0,92 ìå ôï óõíäõáóôéêü 0,62–0,79).

Ôï äåýôåñï âÞìá óôç óõããñáöÞ ìéáò áíáóêü-ðçóçò áöïñÜ ôçí áíáæÞôçóç ôùí ó÷åôéêþí ìåëåôþíêáé ôçí åðéëïãÞ ôïõò (ðßí. 1). Ôï óôÜäéï áõôü ßóùòåßíáé ôï ðëÝïí óçìáíôéêü, åðåéäÞ ëÜèç ó' áõôÞ ôçöÜóç äåí åßíáé äõíáôü íá äéïñèùèïýí óôçí áíÜëõóçêáé ìðïñåß íá ïäçãÞóïõí óå ðñïâëçìáôéêÞ åãêõñü-ôçôá üëçò ôçò ìåëÝôçò. Ôï óôÜäéï áõôü åßíáééäéáßôåñá åëëåéììáôéêü óôéò êëáóéêÝò áíáóêïðÞóåéòêáé áõôüò åßíáé Ýíáò áêüìç áðü ôïõò ëüãïõò ðïõïäÞãçóáí óôçí áíÜðôõîç ôçò ìåèïäïëïãßáò ôùíóõóôçìáôéêþí áíáóêïðÞóåùí. Ç áíáæÞôçóç êáéåðéëïãÞ ôùí ó÷åôéêþí ìåëåôþí ìðïñåß íá åéóÜãåé ìéáóåéñÜ óõóôçìáôéêþí óöáëìÜôùí (biases), ðïõáíÞêïõí ãåíéêÜ óôçí êáôçãïñßá ôùí óõóôçìáôéêþíóöáëìÜôùí åðéëïãÞò (selection bias).

ÃåíéêÜ, ï üñïò óõóôçìáôéêü óöÜëìá áíáöÝñåôáéóå üëá ôá ëÜèç ôïõ ó÷åäéáóìïý Þ êáé ôçò åêôÝëåóçòìéáò ìåëÝôçò ðïõ ïäçãïýí óå ìç áëçèÝò áðïôÝ-ëåóìá.13 Ìéá ìåëÝôç ìå óõóôçìáôéêÜ óöÜëìáôá äåíáðåéêïíßæåé ôçí ðñáãìáôéêÞ êáôÜóôáóç ðïõ èÝ-ëïõìå íá ðåñéãñÜøïõìå Þ ôç óõó÷Ýôéóç (association)ðïõ èÝëïõìå íá áíáëýóïõìå. Ôá óõóôçìáôéêÜóöÜëìáôá, óå áíôßèåóç ìå Üëëá åßäç åñåõíçôéêþíóöáëìÜôùí, üðùò ôï ôõ÷áßï óöÜëìá (random error)Þ ôï öáéíüìåíï ôçò óýã÷õóçò (confounding), äåíìðïñåß íá áíôéìåôùðéóôåß óôï óôÜäéï ôçò áíÜëõóçòôùí áðïôåëåóìÜôùí. Ãé' áõôüí ôï ëüãï, åßíáéáðáñáßôçôï íá áíáãíùñßæåôáé êáé íá áíôéìåôùðß-æåôáé óôï óôÜäéï ôïõ ó÷åäéáóìïý. ÓõóôçìáôéêÜóöÜëìáôá åðéëïãÞò åßíáé åêåßíá ðïõ ðñïêýðôïõíêáôÜ ôçí åðéëïãÞ ôïõ «ðëçèõóìïý» ôçò ìåëÝôçò êáéôá ïðïßá Ý÷ïõí ùò áðïôÝëåóìá ïé åñåõíçôéêÝòìïíÜäåò ðïõ åðéëÝãïíôáé íá ìçí åßíáé áíôéðñïóù-ðåõôéêÝò ôïõ ðëçèõóìïý-óôü÷ïõ. Áí êáé óöÜëìáôáåðéëïãÞò ìðïñïýí íá õðåéóÝëèïõí óå üëïõò ôïõòôýðïõò åñåõíþí, áðïôåëïýí éäéáßôåñï ðñüâëçìá óåüëåò ôéò áíáäñïìéêïý ôýðïõ Ýñåõíåò, óõìðåñéëáìâá-íïìÝíùí âåâáßùò êáé ôùí áíáóêïðÞóåùí.

Óôçí ðåñßðôùóç ôùí áíáóêïðÞóåùí, ïé åñåõ-íçôéêÝò ìïíÜäåò åßíáé ïé åðéóôçìïíéêÝò ìåëÝôåò. Ïðëçèõóìüò áíáöïñÜò (reference population), óå êÜèåáíáóêüðçóç, áðáñôßæåôáé èåùñçôéêÜ áðü ôï óýíï-ëï ôùí åðéóôçìïíéêþí ìåëåôþí, ïé ïðïßåò åñåýíçóáíôï èÝìá ðïõ áíáóêïðåßôáé, áíåîÜñôçôá áðü ôçäçìïóßåõóÞ ôïõò óå ïðïéáäÞðïôå ìïñöÞ Þ áðü ôçí

442 ARCHIVES OF HELLENIC MEDICINE 17(5), 2000

êáôáëïãïãñÜöçóÞ ôïõò óôéò âéïúáôñéêÝò âÜóåéòäåäïìÝíùí. Äåí åíäéáöÝñåé, åðßóçò, ç ãëþóóá óõã-ãñáöÞò Þ ç ðñïÝëåõóÞ ôïõò. Óå áõôüí ôïí ðëçèõ-óìü, óõíÞèùò, åöáñìüæïíôáé êÜðïéá êñéôÞñéá êá-ôáëëçëüôçôáò (Þ êñéôÞñéá åéóáãùãÞò óôç ìåëÝôçìáò) êáé Ýôóé ðñïêýðôåé ï êáôÜëëçëïò ðëçèõóìüò(eligible population).

Óå áõôÝò ôéò äýï öÜóåéò áíáæÞôçóçò êáé åðéëïãÞòìðïñïýí íá õðåéóÝëèïõí óõóôçìáôéêÜ óöÜëìáôáåðéëïãÞò (ðßí. 3). Óôçí ðåñßðôùóç ôçò áñ÷éêÞòáíÜêôçóçò üëùí ôùí ó÷åôéêþí Üñèñùí áðü ôïíðëçèõóìü áíáöïñÜò, ôá óöÜëìáôá åðéëïãÞò ìðï-ñïýí íá õðåéóÝëèïõí ëüãù ðñïóùðéêþí ìåñïëç-øéþí ôïõ åñåõíçôÞ êáé ëüãù åóöáëìÝíçò áíáæÞôç-óçò. Ç áíáæÞôçóç äåí ðñÝðåé íá ðåñéïñßæåôáé ìüíïóôéò ìåëÝôåò ðïõ Ý÷ïõí äçìïóéåõôåß áëëÜ íá åðå-êôåßíåôáé êáé óå ìåëÝôåò ðïõ äåí Ý÷ïõí äçìïóéåõôåß.Åðßóçò, ç áíáæÞôçóç ðñÝðåé íá ðåñéëáìâÜíåé üëáôá ðåñéïäéêÜ êáé ü÷é ìüíï ôá «êáëÜ» Þ áõôÜ ðïõêáôáëïãïãñáöïýíôáé óå âÜóåéò äåäïìÝíùí. Ôá óöÜ-ëìáôá áõôÜ áíáöÝñïíôáé, ãåíéêþò, ùò óöÜëìáôáäçìïóßåõóçò êáé ðáñáðïìðÞò (publication/citationbias).14 Ãéá ðáñÜäåéãìá, åßíáé áðü ðáëéÜ ãíùóôü üôéåñãáóßåò ìå áñíçôéêÜ áðïôåëÝóìáôá äçìïóéåýïíôáéðéï äýóêïëá áðü áõôÝò ìå èåôéêÜ Þ äçìïóéåýïíôáé óåðéï ðåñéöåñåéáêÜ ðåñéïäéêÜ.15 Áõôü äåí ïöåßëåôáéìüíï óôïõò êñéôÝò Þ óôç Óýíôáîç, áëëÜ êáé óôïõòßäéïõò ôïõò óõããñáöåßò. Óôç öÜóç ôçò åðéëïãÞò ôùíêáôÜëëçëùí ìåëåôþí, óöÜëìáôá ìðïñïýí íá õðåé-óÝëèïõí ëüãù ðñïóùðéêþí ìåñïëçøéþí ôïõ ìåëå-ôçôÞ. Áðü ôÝôïéåò ðñïóùðéêÝò ìåñïëçøßåò åßíáé ãåìÜ-ôåò ïé êëáóéêÝò áíáóêïðÞóåéò êáé ôï ãåãïíüò üôéóõíÞèùò ãñÜöïíôáé áðü ðñüóùðá «êýñïõò» Þ«áõèåíôßåò» äåí ìåéþíåé áëëÜ áíôßèåôá áõîÜíåé ôçíðéèáíüôçôá óöáëìÜôùí!

Ðþò ìðïñåß êáíåßò íá áðïöýãåé ôá óöÜëìáôáåðéëïãÞò, éäéáßôåñá óôï ðëáßóéï ôùí áíáóêïðÞóåùí;Ç ëýóç èåùñçôéêÜ åßíáé áðëÞ. Óôçí ðñÜîç, üìùò,áðïäåéêíýåôáé éäéáßôåñá êïðéþäçò. ÐñÝðåé íá

åíôïðéóôïýí üëåò ïé ó÷åôéêÝò åñãáóßåò, üðïõ êáé áíÝ÷ïõí äçìïóéåõôåß Þ áêüìç êáé áí äåí Ý÷ïõí äçìï-óéåõôåß.16 Áõôü óçìáßíåé üôé êáíåßò èá ðñÝðåé (á) íáøÜîåé üëåò ôéò âÜóåéò äåäïìÝíùí, ð.÷. MedLine, Em-base, Cinahl, Psychinfo, Current Contents, (â) íáøÜîåé ôéò ðáñáðïìðÝò ôùí Üñèñùí ðïõ èá âñåé, ãéáÜëëá Üñèñá ðïõ ðéèáíüí íá ìçí åßíáé êáôá-ëïãïãñáöçìÝíá Þ ôá ïðïßá äåí ìðüñåóå íá áíá-êôÞóåé (êáé ç ôåëåéüôåñç áíáæÞôçóç äåí Ý÷åé ðïôÝåõáéóèçóßá 100%). Ðñïçãïýìåíá Üñèñá áíáóêïðÞ-óåùí ìðïñïýí íá ÷ñçóéìåýóïõí ãé' áõôüí ôï óêïðü,(ã) íá åðéêïéíùíÞóåé ìå óõããñáöåßò ðïõ áó÷ï-ëïýíôáé ìå ôï èÝìá êáé íá ôïõò ñùôÞóåé áí Ý÷ïõíõðüøç ôïõò êÜðïéá äçìïóéåõìÝíç ìåëÝôç, ç ïðïßáäåí áíáêôÞèçêå, Þ êÜðïéá ìåëÝôç ðïõ îåêßíçóå íáãßíåôáé, áëëÜ ðïôÝ äåí äçìïóéåýôçêå ãéá äéáöüñïõòëüãïõò, Þ êÜðïéá ìåëÝôç ðïõ âñßóêåôáé óôï óôÜäéïôçò ðñïåôïéìáóßáò Þ ôçò õðïâïëÞò, (ä) íá øÜîåéôïõò ôüìïõò ôùí ðåñéëÞøåùí áðü äéÜöïñá ó÷åôéêÜóõíÝäñéá, (å) íá øÜîåé âÜóåéò äåäïìÝíùí äéðëùìá-ôéêþí êáé äéäáêôïñéêþí åñãáóéþí, (óô) íá øÜîåéáñ÷åßá êáôáãñáöÞò ìåëåôþí ðïõ âñßóêïíôáé óôïóôÜäéï ôçò åêôÝëåóçò, üðùò áõôÜ ðïõ õðÜñ÷ïõíon-line Þ áõôü ðïõ äéáôçñåß ç óõíåñãáóßá Cochrane(Cochrane Collaboration), (æ) íá øÜîåé ãéá åóùôåñéêÝòáíáöïñÝò óå ïñãáíéóìïýò, õðïõñãåßá ê.ëð. ÐïëëÜáðü ôá ðñïáíáöåñüìåíá åßäç ìåëåôþí áíÞêïõí óôçëåãüìåíç «ãêñßæá» âéâëéïãñáößá (gray literature).

Óå ðïéåò êáé ðüóåò ðçãÝò èá øÜîåé êáíåßò,åîáñôÜôáé áðü ôï åñåõíçôéêü åñþôçìá. Âåâáßùò, äåíåßíáé ðÜíôïôå áðáñáßôçôï íá åîáíôëÞóåé üëåò ôéòêáôÜëëçëåò ðçãÝò. Óôç ìåèïäïëïãßá ôçò áíáóêü-ðçóçò, ðñÝðåé íá áíáöÝñïíôáé ðïéåò áêñéâþò÷ñçóéìïðïéÞèçêáí êáé åßíáé óôçí êñßóç ôïõ áíáãíþ-óôç íá äå÷èåß Þ ü÷é ôá áðïôåëÝóìáôá ùò Ýãêõñá.(ÁíôéðáñáâÜëëåôå åäþ ôçí áóáöÞ ìåèïäïëïãßá ôùíêëáóéêþí áíáóêïðÞóåùí: üëá áõôÜ ôá èÝìáôáêáëýðôïíôáé áðü áäéáöÜíåéá, ðïõ äçìéïõñãåßéäáíéêÝò óõíèÞêåò ãéá ôçí ðáñåßóöñõóç óõóôçìá-ôéêþí óöáëìÜôùí). Ãéá ðáñÜäåéãìá, óôçí åëëçíéêÞóõóôçìáôéêÞ áíáóêüðçóç ôçò óõããåíïýò åñõèñÜò,ïé óõããñáöåßò áíáæÞôçóáí ôï õëéêü ôïõò áðü ôéòáêüëïõèåò ðçãÝò:4 (á) áðü ôç âÜóç äåäïìÝíùí ôïõÉÁÔÑÏÔÅÊ ãéá ôçí ðåñßïäï 1980–1996 êáé ôç âÜóçôïõ Éíóôéôïýôïõ Õãåßáò ôïõ Ðáéäéïý áðü ôï 1979–1996 ãéá ëÞììáôá ó÷åôéêÜ ìå ôçí åñõèñÜ êáé ôçóõããåíÞ åñõèñÜ, (â) áíáæÞôçóç «ìå ôï ÷Ýñé» üëùíôùí ðáéäéáôñéêþí êáé Üëëùí åëëçíéêþí éáôñéêþíðåñéïäéêþí ãéá ôçí ðåñßïäï 1950–1997, êáèþò êáéôùí ðåñéëÞøåùí ôùí åôÞóéùí ðáéäéáôñéêþí êáé

ÁÑ×ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 17(5), 2000 443

Ðßíáêáò 3 . ÓõóôçìáôéêÜ óöÜëìáôá åðéëïãÞò óôéò áíáóêïðÞóåéò.

Ðëçèõóìüò áíáöïñÜò 1. ÐñïóùðéêÝò ìåñïëçøßåò(source population) 2. ÓöÜëìá äçìïóßåõóçò êáé ðáñáðïìðÞò

ÊáôÜëëçëïò ðëçèõóìüò ÐñïóùðéêÝò ìåñïëçøßåò(eligible population)

Ðëçèõóìüò Å ß ä ï ò ó ö Ü ë ì á ô ï ò

éáôñéêþí óõíåäñßùí ãéá ôçí ðåñßïäï 1975–1997 ãéáó÷åôéêÜ ëÞììáôá, (ã) áíáæÞôçóç ó÷åôéêþí Üñèñùíáðü ôéò ðáñáðïìðÝò ôùí Üñèñùí ðïõ áíáêôÞ-èçêáí, (ä) áðü åðßóçìåò, äçìïóéåõìÝíåò Þ ìç,áíáöïñÝò ôïõ Õðïõñãåßïõ Õãåßáò êáé Üëëùíêõâåñíçôéêþí Þ ìç êõâåñíçôéêþí ïñãáíéóìþí ãéáôçí ðåñßïäï 1970–1995, (å) áðü óôïé÷åßá ôçò ÅèíéêÞòÓôáôéóôéêÞò Õðçñåóßáò ãéá ôéò äçëþóåéò êáé ôçèíçóéìüôçôá áðü åñõèñÜ êáé óõããåíÞ åñõèñÜ ãéáôçí ðåñßïäï 1960–1995. (Ï áíáãíþóôçò ðïõ èáðßóôåõå üôé ïé ðçãÝò ðïõ ìðïñåß íá áíáæçôçèïýíóôçí ÅëëÜäá åßíáé åëÜ÷éóôåò, åëðßæïõìå ôþñá íáÜëëáîå ãíþìç!). ¼ëç áõôÞ ç åîáíôëçôéêÞ áíáæÞôçóçÞôáí áðáñáßôçôç, ãéá íá äéáóöáëéóôåß ç ìåßùóç ôùíóõóôçìáôéêþí óöáëìÜôùí. ð.÷., áí ïé óõããñáöåßòáíáæçôïýóáí ìüíï ôéò äçìïóéåõìÝíåò ìåëÝôåò, áõôÝòèá ìðïñïýóå íá õðïôåèåß üôé ðåñéÝ÷ïõí ðïëýáéóéüäïîá óôïé÷åßá ãéá ôï ðïóïóôü êÜëõøçò Þáíïóïðïßçóçò ôïõ ðëçèõóìïý, åðåéäÞ ïé áðáéóéü-äïîåò ìðïñåß íá Ýìåéíáí áðëÜ ùò «åóùôåñéêÝòáíáöïñÝò» óå êÜðïéï õðïõñãåßï.

¼ôáí ïëïêëçñùèåß ç áíáæÞôçóç, ðñÝðåé íááðïöáóéóôåß ðïéåò áðü ôéò åñãáóßåò èá ãßíïõíôåëéêÜ áðïäåêôÝò ãéá ðåñáéôÝñù áíÜëõóç. ÇåðéëïãÞ áõôÞ âáóßæåôáé óå êñéôÞñéá åéóáãùãÞò-áðïêëåéóìïý (inclusion-exclusion), ðïõ Ý÷ïõí áðüðñéí ôåèåß, êáôÜ ôç äéáìüñöùóç ôïõ ðñïâëÞìáôïò.Ç åðéëïãÞ ôùí ìåëåôþí åßíáé ìéá óôáäéáêÞäéáäéêáóßá, ç ïðïßá ðåñéëáìâÜíåé ôçí áíÜêôçóç ôïõðëÞñïõò êåéìÝíïõ áõôþí ðïõ öáßíåôáé íá ðëçñïýíôá êñéôÞñéá, ôçí åêôßìçóÞ ôïõò áðü áíåîÜñôçôïõòìåëåôçôÝò êáé ôçí ôåëéêÞ åðéëïãÞ áõôþí ðïõáðáíôïýí óôï åñåõíçôéêü åñþôçìá. Ãéá ðáñÜäåéãìá,ôá êñéôÞñéá åéóáãùãÞò-áðïêëåéóìïý, ðïõ ÷ñçóéìï-ðïéÞèçêáí óôçí ïëëáíäéêÞ áíáóêüðçóç ôçòáðïôåëåóìáôéêüôçôáò ôùí ðñïëçðôéêþí åðéóêÝ-øåùí óå óðßôéá çëéêéùìÝíùí, Þôáí, ìåôáîý Üëëùí,ôá áêüëïõèá:5 (á) Óå ðñþôç öÜóç, åðéëÝ÷èçêáí üëáôá Üñèñá ðïõ áíáöÝñïíôáí óå ôõ÷áéïðïéçìÝíåòåëåã÷üìåíåò ìåëÝôåò ôçò áðïôåëåóìáôéêüôçôáò ôùíåðéóêÝøåùí óôï óðßôé áôüìùí Üíù ôùí 65 åôþí,ðïõ Ýìåíáí óôçí êïéíüôçôá. ÁõôÜ ôá êñéôÞñéáåöáñìüóôçêáí áðü äýï áíåîÜñôçôïõò åñåõíçôÝòóôïõò ôßôëïõò, ôéò ðåñéëÞøåéò êáé ôéò ëÝîåéò-êëåéäéÜôùí Üñèñùí ðïõ áíáêôÞèçêáí. (â) Ôï ðëÞñåòêåßìåíï ôùí ðñïçãïýìåíùí Üñèñùí óõãêåíôñþèçêåêáé áðü ôï êåßìåíï áöáéñÝèçêáí ôá ïíüìáôá ôùíóõããñáöÝùí, ôïõ éäñýìáôïò êáé ôïõ ðåñéïäéêïý,Ýôóé þóôå ç ðåñáéôÝñù åêôßìçóç íá åßíáé «ôõöëÞ»(blind). (ã) Óôç äåýôåñç öÜóç, ïé åñåõíçôÝò åðÝëåîáí

åêåßíá ôá Üñèñá, ôá ïðïßá ðëçñïýóáí Ýíá óýíïëïêñéôçñßùí ðïõ åß÷áí ôåèåß áðü ðñéí, üðùò, ð.÷., üôéïé åðéóêÝøåéò óôá óðßôéá åß÷áí ùò óôü÷ï ôçíðñüëçøç Þ ìåßùóç ôùí ðñïâëçìÜôùí ðïõ ó÷åôßæïí-ôáé ìå ôçí çëéêßá, ç åêôßìçóç ôùí çëéêéùìÝíùí ÞôáíðïëõäéÜóôáôç, äçëáäÞ ðáèïëïãéêÞ, øõ÷ïëïãéêÞ,êïéíùíéêÞ ê.ëð., ôï ðñüãñáììá äåí áðåõèõíüôáíáðïêëåéóôéêÜ óå Üôïìá ðïõ åß÷áí ðñïçãïõìÝíùòíïóçëåõôåß ïýôå ðñïïñéæüôáí áðïêëåéóôéêÜ ãéá ôçíõðïóôÞñéîç ìéáò óõãêåêñéìÝíçò ðÜèçóçò, ùò ìÝôñïÝêâáóçò åß÷å ÷ñçóéìïðïéçèåß ôïõëÜ÷éóôïí çøõ÷ïêïéíùíéêÞ Þ ç öõóéêÞ ëåéôïõñãéêüôçôá Þ ïéåéóáãùãÝò óå íïóïêïìåßá Þ ç åðßðôùóç ôùí ðôþ-óåùí (falls) Þ ç èíçôüôçôá. Óå ðåñßðôùóç äéáöùíßáòìåôáîý ôùí åñåõíçôþí, áõôÞ ëõíüôáí ìå óõìöùíßáìåôáîý ôïõò ãéá ôï áí èá ðñÝðåé ç ìåëÝôç íáóõìðåñéëçöèåß Þ ü÷é. Ìå ôïí ôñüðï áõôüí, ïé Ïëëá-íäïß åñåõíçôÝò áíÝêôçóáí áñ÷éêÜ 244 ðåñéëÞøåéòÜñèñùí ó÷åôéêþí ìå ôï èÝìá ôïõò. Áðü ôá ÜñèñááõôÜ, 29 åðéëÝ÷èçêáí óôçí ðñþôç öÜóç êáé 15 óôçäåýôåñç.

Ôï ôñßôï âÞìá áíáöÝñåôáé óôçí åîáãùãÞ ôùíäåäïìÝíùí (data extraction) êáé óôçí áíÜëõóç.7 Äåäï-ìÝíá, ôá ïðïßá åîÜãïíôáé, ðåñéëáìâÜíïõí, ìåôáîýÜëëùí, ôïõò áñéèìïýò ôùí áóèåíþí, ôá êïéíùíé-êïäçìïãñáöéêÜ ÷áñáêôçñéóôéêÜ ôïõò, åßäç èåñá-ðåéþí, ôï åßäïò ôçò Ýêâáóçò, ðáñÜãïíôåò êéíäýíïõðïõ ìåëåôÞèçêáí, óõã÷õôéêïýò ðáñÜãïíôåò, ôçäéÜñêåéá ôçò ðáñáêïëïýèçóçò, ôç ÷þñá üðïõðñáãìáôïðïéÞèçêå ç ìåëÝôç, ôï Ýôïò äçìïóßåõóçòê.ëð. Ôéò ðåñéóóüôåñåò öïñÝò, ôá äåäïìÝíá ðáñïõ-óéÜæïíôáé õðü ôç ìïñöÞ åíüò ðßíáêá, ðïõ áðï-óêïðåß, åêôüò ôùí Üëëùí, óôçí êáëýôåñç åêôßìçóçôïõ âáèìïý ïìïéüôçôáò ôùí ìåëåôþí. Ç åêôßìçóçôïõ âáèìïý ïìïéüôçôáò ôùí ìåëåôþí åßíáé Ýíá áðüôá ðéï óçìáíôéêÜ âÞìáôá óå ìéá óõóôçìáôéêÞáíáóêüðçóç êáé óõíÞèùò ðåñéãñÜöåôáé ìå ôïí üñïåêôßìçóç ôçò åôåñïãÝíåéáò (heterogeneity) ôùíìåëåôþí.17 Ïé ìåëÝôåò ìðïñåß íá äéáöÝñïõí óåêëéíéêÜ ÷áñáêôçñéóôéêÜ (êëéíéêÞ åôåñïãÝíåéá), óôçíðïéüôçôá (ìåèïäïëïãéêÞ åôåñïãÝíåéá) êáé óôááðïôåëÝóìáôá (åôåñïãÝíåéá áðïôåëåóìÜôùí). Ãåíé-êÜ, ãéá ôçí åêôßìçóç ôçò åôåñïãÝíåéáò, ÷ñåéÜæåôáéóõíäõáóìüò êïéíïý íïõ êáé óôáôéóôéêþí ôå÷íéêþí.18

¼ôáí ïé ìåëÝôåò åßíáé ó÷åôéêÜ ïìïéïãåíåßò, ôüôå åßíáéäõíáôü íá õðïëïãéóôåß Ýíá óõíïðôéêü óôáèìéóìÝíïáðïôÝëåóìá ìå ôçí ôå÷íéêÞ ôçò ìåôá-áíÜëõóçò.Åðáíåñ÷üìåíïé óôá ðáñáäåßãìáôá ðïõ ÷ñçóéìïðïé-ïýìå, âëÝðïõìå ôá åîÞò: (á) Óôçí åëëçíéêÞ áíáóêü-ðçóç äåí ôÝèçêå èÝìá óõíäõáóìïý ôùí äåäïìÝíùí,åðåéäÞ ï óôü÷ïò ôçò ìåëÝôçò Þôáí äéáöïñåôéêüò.

444 ARCHIVES OF HELLENIC MEDICINE 17(5), 2000

ÁÑ×ÅÉÁ ÅËËÇÍÉÊÇÓ ÉÁÔÑÉÊÇÓ 17(5), 2000 445

Ðáñüëá áõôÜ, ìðïñåß êáíåßò íá óõìðåñÜíåé üôé ôáäåäïìÝíá ðïõ óõëëÝ÷èçêáí, ðáñïõóßáæáí, óå ãåíé-êÝò ãñáììÝò, ìåãÜëç åôåñïãÝíåéá, ôüóï ðïéïôéêÜ üóïêáé óôïí ôïìÝá ôùí áðïôåëåóìÜôùí. (â) Óôçí ïëëáí-äéêÞ áíáóêüðçóç, ïé åñåõíçôÝò Ýêñéíáí üôé ïéìåëÝôåò åß÷áí óçìáíôéêÞ ìåèïäïëïãéêÞ åôåñïãÝíåéáêáé Ýôóé áðïöÜóéóáí íá ìçí êÜíïõí ðïóïôéêÞóýíèåóç ôùí äåäïìÝíùí. (ã) Óôç ìåôá-áíÜëõóç ôùíáíôéëéðéäáéìéêþí öáñìÜêùí, ïé ìåëÝôåò Þôáí ó÷åôéêÜïìïéïãåíåßò êáé ç óôáôéóôéêÞ äïêéìáóßá, ðïõ÷ñçóéìïðïéÞèçêå ãéá ôçí åôåñïãÝíåéá, Ýäùóå ôéìÞôïõ x2 ðïõ äåí Þôáí óôáôéóôéêÜ óçìáíôéêÞ. Ãé' áõôüíôï ëüãï, ôá äåäïìÝíá óõã÷ùíåýôçêáí ãéá ôïíõðïëïãéóìü ìéáò óôáèìéóìÝíçò ìÝóçò ôéìÞò (weight-ed average) ôùí ìåìïíùìÝíùí ëüãùí ôùí ïôæ.

Äåí åßíáé ëßãïé åêåßíïé ðïõ Ý÷ïõí åêöñÜóåé ôéòäéáöùíßåò ôïõò ìå ôç ëïãéêÞ ôùí óõóôçìáôéêþíáíáóêïðÞóåùí. Ðåñéóóüôåñåò åðéèÝóåéò Ý÷åé äå÷èåßç ìåôá-áíÜëõóç, åðåéäÞ äçìéïõñãåß ìåñéêÝò öïñÝòìéá øåõäáßóèçóç áíôéêåéìåíéêüôçôáò, åêåß üðïõðïëëÝò öïñÝò âáóéëåýåé ç õðïêåéìåíéêüôçôá. Çóýíèåóç ìåëåôþí ìå ìåãÜëç åôåñïãÝíåéá ìïéÜæåé ìåôçí ðñüóèåóç ìÞëùí ìå ðïñôïêÜëéá. ÓçìáíôéêÜðñïâëÞìáôá ðáñïõóéÜæåé áêüìç ôï ãåãïíüò ôçòäõóêïëßáò åêôßìçóçò ôùí óõóôçìáôéêþí óöáëìÜôùíôùí åðéìÝñïõò åñãáóéþí. ÓôáôéóôéêÝò ôå÷íéêÝò ãéáôçí åðéóÞìáíóç ôùí óõóôçìáôéêþí óöáëìÜôùí äåíìðïñïýí íá õðÜñîïõí. Ç Üêñéôç, ëïéðüí, ÷ñÞóç ôùíìåôá-áíáëýóåùí ìðïñåß ìåñéêÝò öïñÝò íá äçìé-ïõñãÞóåé ëáíèáóìÝíá óõìðåñÜóìáôá. Ï áíôßëïãïò,âÝâáéá, õðïóôçñßæåé üôé áõôü ìðïñåß íá óõìâåß óåïðïéïäÞðïôå ôýðï Ýñåõíáò. Ïé óõóôçìáôéêÝòáíáóêïðÞóåéò, ìÜëéóôá, áðïôåëïýí Ýíá ìÝóï ãéá ôçíáíÜäåéîç áõôþí ôùí ðñïâëçìÜôùí.18 ¼ðùò ÝãñáøåÝíáò åðéäçìéïëüãïò, ìå êñéôéêÞ äéÜèåóç,19 ï ëüãïò ãéáôçí ýðáñîç ôùí óõóôçìáôéêþí áíáóêïðÞóåùí åßíáéðñïöáíÞò, ç ìÝèïäïò åßíáé ó÷åôéêÜ áðëÞ, áëëÜ ôááðïôåëÝóìáôá ðñÝðåé íá åñìçíåýïíôáé ìå ðïëýðñïóï÷Þ, åðåéäÞ ç áñ÷Þ, ðÜíù óôçí ïðïßá óôçñß-æïíôáé, áíôßêåéôáé óôç èåìåëéþäç áñ÷Þ ôçò åðéóôç-ìïíéêÞò ìåèüäïõ, ðïõ èÝëåé ôéò õðïèÝóåéò íá ðñïç-ãïýíôáé ôùí áðïôåëåóìÜôùí êáé ü÷é íá Ýðïíôáé.

Ð. ÓêáðéíÜêçòØõ÷éáôñéêü ÔìÞìá

ÉáôñéêÞ Ó÷ïëÞ, ÐáíåðéóôÞìéï Ïõáëßáò

1. ÃÅÑÌÅÍÇÓ ÁÅ. ÁíáóêïðÞóåùí áíáóêüðçóç. Áñ÷ Åëë Éáôñ 2000,17:232–236

2. MURLOW CD, COOK DJ, DAVIDOFF F. Systematic reviews: Criticallinks in the great chain of evidence. Ann Intern Med 1997, 126:389–391

3. MUIR GRAY J. Evidence based health care. How to make healthpolicy and management decisions . New York, Churchill Living-stone, 1997

4. PANAGIOTOPOULOS T, ANTONIADOU I, VALASSI-ADAM E. Increase incongenital rubella occurrence after immunisation in Greece: ret-rospective survey and systematic review. Br Med J 1999, 319:1462–1467

5. VAN HAASTREGT J, DIEDERIKS J, VAN ROSSUM E, DE WITTE L, CREBOLD-ER H. Effects of preventive home visits to elderly people living inthe community: systematic review. Br Med J 2000, 320:754–758

6. PIGNONE M, PHILLIPS C, MULROW C. Use of lipid lowering drugs forprimary prevention of coronary heart disease: meta-analysis ofrandomised trials. Br Med J 2000, 321:1–5

7. McKIBBON A. PDQ Evidence-based Principles and Practice. Hamil -ton, Ontario, BC Decker Inc, 1999:125–133

8. SPASOFF RA. Epidemiologic Methods for Health Policy . New York,Oxford University Press, 1999:128–131

9. MURLOW CD. Rationale for systematic reviews. Br Med J 1994,309:597–599

10. LAST JM (ed). A Dictionary of Epidemiology. 3rd ed. New York, Ox-ford University Press, 1995:128

11. ALTMAN DG. Practical Statistics for Medical Research . London,Chapman & Hall, 1991:455–460

12. STATA CORPORATION. Stata Version 4.0. Texas, Stata Corporation,College Station, 1995

13. SACKETT DL . Bias in analytical research. J Chronic Dis 1979, 32:51–63

14. LEWIS G, CHURCHILL R, HOTOPF M. Systematic reviews and meta-analysis. Psychol Med 1997, 27:3–7

15. EASTERBROOK PJ, BERLIN JA, GOPALAN R, MATTHEWS D. Publicationbias in clinical research. Lancet 1991, 337:867–872

16. HUNT DL, McKIBBON KA. Locating and appraising systematic reviews.Ann Intern Med 1997, 126:532–538

17. THOMPSON SG. Why sources of heterogeneity in meta-analysisshould be investigated? Br Med J 1994, 309:1351–1355

18. LAU J, IOANNIDIS JPA, SCHMID CH. Summing up evidence: one an -swer is not always enough. Lancet 1998, 351:123–127

19. WEST RR. A look at the statistical overview (or meta-analysis). J RColl Phys Lond 1993, 27:111–115