Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285...

22
Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία Σύνοψη Το παρόν κεφάλαιο εξετάζει την ανάγκη του τομέα της υγείας για συσσωρευμένη γνώση και εμπειρία. Οι εξελίξεις των Τεχνολογιών Πληροφοριών και Επικοινωνίας (ΤΠΕ) μπορούν να προσφέρουν λύσεις σε πολλά από αυτά τα θέματα. Γίνεται αναφορά στις τεχνολογίες, τα εργαλεία και τις μεθόδους που χρησιμοποιούνται στον τομέα των Big Data και Big Data Analytics, καθώς και ο συσχετισμός τους με το Cloud Computing. Παρουσιάζονται παραδείγματα και μελέτες περίπτωσης από τον πραγματικό κόσμο, τα οποία αναδεικνύουν την ανάγκη για τις συγκεκριμένες εφαρμογές και τα πολλαπλά οφέλη που μπορούν να αποκομιστούν. Τέλος, γίνεται εκτενής αναφορά στις έρευνες που διεξάγονται στον συγκεκριμένο χώρο, στο μέγεθος της αγοράς και τις προοπτικές για το μέλλον. Το τελευταίο τμήμα του κεφαλαίου απασχολείται με την Οπτική Αναλυτική (Visual Analytics). Η συλλογή του τεράστιου όγκου των δεδομένων στην υγεία σε συνδυασμό με την ποικιλομορφία τους αναδεικνύουν ένα σημαντικό πρόβλημα σχετικά με την κατάλληλη απεικόνιση των αποτελεσμάτων προκειμένου να είναι άμεσα κατανοητά και να βοηθούν τους ενδιαφερόμενους για την εξαγωγή πολύτιμων συμπερασμάτων. Ο τομέας της Οπτικής Αναλυτικής απασχολείται με αυτό ακριβώς το αντικείμενο. Ο αναγνώστης, στο τέλος του κεφαλαίου, θα είναι σε θέση να διακρίνει τις ευκαιρίες, τις προκλήσεις και τις προσεγγίσεις σε αυτούς τους τόσο πολλά υποσχόμενους τεχνολογικούς τομείς. Προαπαιτούμενη γνώση Δεν απαιτείται κάποια ιδιαίτερη γνώση. Παρόλα αυτά, κρίνεται σκόπιμο ο αναγνώστης να έχει παρακολουθήσει τα προηγούμενα κεφάλαια, προκειμένου να δύναται να αντιληφθεί την ωφελιμότητα των συγκεκριμένων τεχνολογιών και τις προκλήσεις του χώρου. 1. Εισαγωγή Ο τομέας της υγείας είναι εκείνος που υιοθετεί πρώτος, αλλά και οδηγεί τις τεχνολογικές εξελίξεις [1]. Όπως έχει αναφερθεί και σε προηγούμενα κεφάλαια, ο χώρος της υγείας έχει σημαντικά και ιδιαίτερα χαρακτηριστικά τα οποία τον διακρίνουν απαιτώντας ιδιαίτερη αντιμετώπιση στις προκλήσεις που θέτει, όπως για παράδειγμα, τα ευαίσθητα προσωπικά δεδομένα, τα θέματα ασφάλειας και διασφάλισης της ποιότητας των δεδομένων, κ.ά. Αναλογιζόμενοι την λειτουργία του συστήματος υγείας και ιδίως την καθημερινή λειτουργία των νοσηλευτικών ιδρυμάτων, μπορεί κανείς να διακρίνει επιμέρους χαρακτηριστικά που αρχικά περνούν απαρατήρητα. Ας πάρουμε για παράδειγμα, μια τυπική περίπτωση ενός πολίτη που αντιμετωπίζει ένα πρόβλημα υγείας. Αρχικά, θα αναζητήσει την συμβουλή από τον οικογενειακό του ιατρό, ο οποίος ανάλογα με τα κλινικά ευρήματα θα του προτείνει μια σειρά διαγνωστικών εξετάσεων και φαρμακευτικής αγωγής. Ο ασθενής θα οδηγηθεί επομένως σε ένα διαγνωστικό κέντρο ή σε ένα νοσοκομείο ή κλινική προκειμένου να εκτελέσει τις συγκεκριμένες εξετάσεις. Λαμβάνοντας τα αποτελέσματα, θα επιστρέψει στον ιατρό του και αν κριθεί απαραίτητο θα πρέπει να επισκεφτεί και ιατρό άλλης/ων ειδικότητας/ων με πιθανότητα διενέργειας και άλλων συμπληρωματικών εξετάσεων ή συμπληρωματικής αγωγής ή ακόμη και νοσηλείας (Εικόνα 9.1).

Transcript of Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285...

Page 1: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία

Σύνοψη Το παρόν κεφάλαιο εξετάζει την ανάγκη του τοµέα της υγείας για συσσωρευµένη γνώση και εµπειρία. Οι εξελίξεις των Τεχνολογιών Πληροφοριών και Επικοινωνίας (ΤΠΕ) µπορούν να προσφέρουν λύσεις σε πολλά από αυτά τα θέµατα. Γίνεται αναφορά στις τεχνολογίες, τα εργαλεία και τις µεθόδους που χρησιµοποιούνται στον τοµέα των Big Data και Big Data Analytics, καθώς και ο συσχετισµός τους µε το Cloud Computing. Παρουσιάζονται παραδείγµατα και µελέτες περίπτωσης από τον πραγµατικό κόσµο, τα οποία αναδεικνύουν την ανάγκη για τις συγκεκριµένες εφαρµογές και τα πολλαπλά οφέλη που µπορούν να αποκοµιστούν. Τέλος, γίνεται εκτενής αναφορά στις έρευνες που διεξάγονται στον συγκεκριµένο χώρο, στο µέγεθος της αγοράς και τις προοπτικές για το µέλλον. Το τελευταίο τµήµα του κεφαλαίου απασχολείται µε την Οπτική Αναλυτική (Visual Analytics). Η συλλογή του τεράστιου όγκου των δεδοµένων στην υγεία σε συνδυασµό µε την ποικιλοµορφία τους αναδεικνύουν ένα σηµαντικό πρόβληµα σχετικά µε την κατάλληλη απεικόνιση των αποτελεσµάτων προκειµένου να είναι άµεσα κατανοητά και να βοηθούν τους ενδιαφερόµενους για την εξαγωγή πολύτιµων συµπερασµάτων. Ο τοµέας της Οπτικής Αναλυτικής απασχολείται µε αυτό ακριβώς το αντικείµενο. Ο αναγνώστης, στο τέλος του κεφαλαίου, θα είναι σε θέση να διακρίνει τις ευκαιρίες, τις προκλήσεις και τις προσεγγίσεις σε αυτούς τους τόσο πολλά υποσχόµενους τεχνολογικούς τοµείς.

Προαπαιτούµενη γνώση Δεν απαιτείται κάποια ιδιαίτερη γνώση. Παρόλα αυτά, κρίνεται σκόπιµο ο αναγνώστης να έχει παρακολουθήσει τα προηγούµενα κεφάλαια, προκειµένου να δύναται να αντιληφθεί την ωφελιµότητα των συγκεκριµένων τεχνολογιών και τις προκλήσεις του χώρου.

1. Εισαγωγή Ο τοµέας της υγείας είναι εκείνος που υιοθετεί πρώτος, αλλά και οδηγεί τις τεχνολογικές εξελίξεις [1]. Όπως έχει αναφερθεί και σε προηγούµενα κεφάλαια, ο χώρος της υγείας έχει σηµαντικά και ιδιαίτερα χαρακτηριστικά τα οποία τον διακρίνουν απαιτώντας ιδιαίτερη αντιµετώπιση στις προκλήσεις που θέτει, όπως για παράδειγµα, τα ευαίσθητα προσωπικά δεδοµένα, τα θέµατα ασφάλειας και διασφάλισης της ποιότητας των δεδοµένων, κ.ά. Αναλογιζόµενοι την λειτουργία του συστήµατος υγείας και ιδίως την καθηµερινή λειτουργία των νοσηλευτικών ιδρυµάτων, µπορεί κανείς να διακρίνει επιµέρους χαρακτηριστικά που αρχικά περνούν απαρατήρητα. Ας πάρουµε για παράδειγµα, µια τυπική περίπτωση ενός πολίτη που αντιµετωπίζει ένα πρόβληµα υγείας. Αρχικά, θα αναζητήσει την συµβουλή από τον οικογενειακό του ιατρό, ο οποίος ανάλογα µε τα κλινικά ευρήµατα θα του προτείνει µια σειρά διαγνωστικών εξετάσεων και φαρµακευτικής αγωγής. Ο ασθενής θα οδηγηθεί εποµένως σε ένα διαγνωστικό κέντρο ή σε ένα νοσοκοµείο ή κλινική προκειµένου να εκτελέσει τις συγκεκριµένες εξετάσεις. Λαµβάνοντας τα αποτελέσµατα, θα επιστρέψει στον ιατρό του και αν κριθεί απαραίτητο θα πρέπει να επισκεφτεί και ιατρό άλλης/ων ειδικότητας/ων µε πιθανότητα διενέργειας και άλλων συµπληρωµατικών εξετάσεων ή συµπληρωµατικής αγωγής ή ακόµη και νοσηλείας (Εικόνα 9.1).

Page 2: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

Εικόνα 9.1 Ο συνήθης δρόµος αντιµετώπισης ενός προβλήµατος υγείας.

Το σενάριο που παρουσιάζεται στην Εικόνα 9.1 είναι πολύ πιθανόν να συµβεί αρκετές φορές στην ζωή ενός ανθρώπου. Ακολουθώντας πιο προσεκτικά την συγκεκριµένη πορεία και παρατηρώντας τα γεγονότα µε µεγαλύτερη λεπτοµέρεια, ανακύπτουν ενδιαφέροντα ευρήµατα τα οποία ξεφεύγουν αρχικά της αντίληψής µας ή απλά περνούν απαρατήρητα. Ας ξαναδούµε λίγο το σενάριο από την αρχή:

• Ο ασθενής πηγαίνει στον ιατρό, ο οποίος µε την σειρά του συµπληρώνει το ιστορικό του

ασθενή, τον εξετάζει κλινικά και καταγράφει όλες τις πληροφορίες (π.χ. ονοµατεπώνυµο ασθενή, οδό και περιοχή κατοικίας, ηλικία, ιατρικό ιστορικό, οικογενειακό ιστορικό, κλινικά ευρήµατα, διάγνωση, προτεινόµενη αγωγή, κ.λπ.).

• Στην συνέχεια ο ασθενής οδηγείται σε ένα διαγνωστικό κέντρο για την διεξαγωγή των εξετάσεων. Το διαγνωστικό κέντρο καταγράφει και πάλι τα δηµογραφικά στοιχεία του

Page 3: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

ασθενή, τον παραπέµποντα ιατρό, την πιθανή φαρµακευτική αγωγή του ασθενή, τυχόν αλλεργίες (αν σχετίζονται µε το είδος της εξέτασης), κ.ά.

• Ο ασθενής επιστρέφει στον ιατρό, ο οποίος µε την σειρά του αξιολογεί τις εξετάσεις και προτείνει συγκεκριµένη φαρµακευτική αγωγή ή/και παραπέµπει σε άλλη ειδικότητα ή για νοσηλεία (ανάλογα µε την περίπτωση).

• Στην απλούστερη περίπτωση, ο ασθενής πηγαίνει σε ένα φαρµακείο για να πάρει τα φάρµακα που του συνταγογράφησε ο ιατρός. Εκεί, ο φαρµακοποιός καταχωρεί στο σύστηµα την συνταγή µαζί µε τα στοιχεία του ασθενή και του παραδίδει τα φάρµακα.

• Εναλλακτικά, ο ασθενής επισκέπτεται ακόµη έναν ιατρό, άλλης ειδικότητας, προκειµένου να διερευνήσει περαιτέρω την περίπτωσή του. Η διαδικασία που ακολουθείται και εδώ είναι η ίδια µε την περίπτωση της επίσκεψης στον πρώτο ιατρό.

• Ανάλογα µε την σοβαρότητα της κατάστασης, ο ασθενής οδηγείται για νοσηλεία σε ένα νοσηλευτικό ίδρυµα. Εκεί, αφού δώσει τα απαιτούµενα στοιχεία του στο γραφείο κίνησης, εξετάζεται από ιατρούς της κατάλληλης ειδικότητας και στη συνέχεια οδηγείται στον όροφο νοσηλείας. Παράλληλα, διενεργούνται όλες οι απαιτούµενες εξετάσεις. Αφού ληφθούν τα αποτελέσµατα, αξιολογούνται από τους ιατρούς και χορηγείται η κατάλληλη αγωγή. Όταν βελτιωθεί η κατάσταση της νοσηλείας του, λαµβάνει το εξιτήριο και αποζηµιώνει το νοσηλευτικό ίδρυµα µε το αναλογούν ποσόν. Όλα τα έγγραφα σχετικά µε την νοσηλεία του δροµολογούνται στα κατάλληλα τµήµατα µέσα και έξω από το νοσοκοµείο (π.χ. αρχείο του νοσοκοµείου, ασφαλιστικός φορέας του ασθενή, κ.λπ).

Ο ανωτέρω δρόµος αντιµετώπισης µιας τυπικής ασθένειας µπορεί να ακολουθήσει ένα οποιοδήποτε µονοπάτι ανάλογα µε την περίπτωση του ασθενή (σοβαρότητα, κλινικά ευρήµατα, κ.ο.κ.). Έχοντας πλέον δώσει σηµασία στις λεπτοµέρειες κάθε βήµατος του ασθενή, ανακύπτουν σηµαντικά συµπεράσµατα. Κάθε φορέας ή επαγγελµατίας υγείας αναζητά, καταγράφει και διατηρεί αρχείο µε τα:

• δηµογραφικά στοιχεία του ασθενή (π.χ. ονοµατεπώνυµο, πατρώνυµο, τηλέφωνα επικοινωνίας, κατοικία, κ.ο.κ.),

• κλινικά ευρήµατα (κλινική εξέταση), • διαγνωστικά ευρήµατα (αποτελέσµατα πρόσφατων ή παλαιότερων εξετάσεων), • στοιχεία ασφάλισης (π.χ. ιδιωτική ασφάλιση, δηµόσια ασφάλιση, ανασφάλιστος, ιδιώτης), • ιατρικό ιστορικό, • οικογενειακό ιστορικό, • κοινωνικό ιστορικό.

Όλα τα ανωτέρω συµβαίνουν όµως κάθε φορά που ο ασθενής ακολουθεί ένα από τα µονοπάτια αντιµετώπισης της κατάστασης της υγείας του. Ας αναλογιστούµε τώρα τον χρόνο που δαπανάται από τον εργαζόµενο / επαγγελµατία υγείας για την καταγραφή ή αναζήτηση των συγκεκριµένων πληροφοριών από κάθε σηµείο µε το οποίο έρχεται σε επαφή ο ασθενής. Τέλος, ας προσπαθήσουµε να σκεφτούµε τον όγκο των δεδοµένων που πρέπει να αποθηκεύονται προκειµένου να έχουµε πρόσβαση στις επιθυµητές πληροφορίες. Πολλαπλασιάζοντας όλα αυτά επί τον αριθµό των επισκέψεων που πραγµατοποιούνται για κάθε έναν πολίτη επί τον όγκο των δεδοµένων που παράγονται σε κάθε επίσκεψη για το ίδιο σηµείο (π.χ. ιατρός, νοσηλευτικό ίδρυµα, διαγνωστικό κέντρο), προκύπτει ένα µοναδικό και απλό συµπέρασµα. Τα δεδοµένα είναι απίστευτα πολλά! Τόσα πολλά, που είναι πλέον αδύνατον να συγκεντρωθούν από έναν φορέα και να είναι εύκολα επεξεργάσιµα και διαχειρίσιµα. Χωρίς αυτά όµως είναι αδύνατη η βελτίωση στην παροχή υπηρεσιών υγείας. Χωρίς άµεση και εύκολη πρόσβαση στην επιθυµητή πληροφορία, είναι αδύνατη η επιθυµητή εξέλιξη της επιστήµης, η διεξαγωγή ερευνών, η ανεύρεση νέων θεραπειών και φαρµάκων, κ.ά. Τα δεδοµένα είναι αυτά που µας βοηθούν στην περαιτέρω καινοτοµία και πρόοδο. Η δε κατάλληλη οµαδοποίηση, σύγκριση και συσσώρευσή τους, ανάλογα µε την περίπτωση, επιτρέπει τη βέλτιστη το δυνατόν παροχή υπηρεσιών υγείας. Ο όγκος των δεδοµένων ξεπερνά εποµένως κάθε προηγούµενο και ο ρυθµός αύξησής τους είναι σχεδόν εκθετικός. Απαιτούνται λοιπόν νέες τεχνικές και τεχνολογίες για να µπορέσουµε να αποκοµίσουµε τα µέγιστα από αυτό τον πλούτο πληροφοριών και εν δυνάµει γνώσεων.

Page 4: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

Ο ψηφιακός κόσµος απαιτεί λύσεις βασισµένες σε δεδοµένα. Πρόσφατες επιχειρηµατικές προσπάθειες αποδεικνύουν το αληθές (βλέπε Facebook και Google). Η Κοινωνία της Πληροφορίας και η Κοινωνία της Γνώσης στην οποία ζούµε βασίζονται σε αυτό ακριβώς το πολύτιµο συστατικό, τα δεδοµένα (περισσότερες πληροφορίες σχετικά, δίνονται εκτενέστατα στα δύο πρώτα κεφάλαια του παρόντος συγγράµµατος). Οι τεχνολογίες των Big Data ήρθαν για να αντιµετωπίσουν ακριβώς αυτό το γεγονός, δηλαδή να απαντήσουν στην ανάγκη για έξυπνη και εύκολη «εκµετάλλευση» του χαοτικού όγκου δεδοµένων που υφίστανται σήµερα. Αν και έχουν δοθεί πολλοί ορισµοί για τον ορισµό των Big Data οι περισσότεροι από αυτούς συνηγορούν στην ύπαρξη των λεγόµενων τεσσάρων «V»:

• Volume (Όγκος). Ο τεράστιος όγκος δεδοµένων που παράγεται, αποθηκεύεται και

ανταλλάσσεται. • Velocity (Ταχύτητα). Η ανάγκη για συνεχή και επαναλαµβανόµενη ανάλυση σε πραγµατικό

χρόνο. • Variety (Ποικιλία). Τα δεδοµένα µπορεί να έχουν διαφορετική µορφή, ώστε ναείναι

δύσκολο να αντιµετωπιστούν µε ενιαίο τρόπο. • Veracity (Ακρίβεια). Θέµατα σχετικά µε την αβεβαιότητα και την εµπιστοσύνη των

δεδοµένων.

Η ανάγκη για νέους, έξυπνους τρόπους χειρισµού των δεδοµένων είναι πλέον επιτακτική. Ο χώρος της υγείας είναι ένας από αυτούς που παράγουν και καταναλώνουν τεράστιες ποσότητες πληροφοριών και δεδοµένων κάθε δευτερόλεπτο, ενώ η ανάγκη για την βέλτιστη χρησιµοποίησή τους για την εξαγωγή πολύτιµων συµπερασµάτων είναι αδιαµφισβήτητη. Ένας άλλος όρος που χρησιµοποιείται σήµερα, είναι αυτός των Big Data Analytics, ο οποίος αφορά ουσιαστικά την ανάγκη για εξαγωγή πολύτιµων συµπερασµάτων και προβλέψεων, µε στόχο την βελτίωση των διαδικασιών ενός οργανισµού και την λήψη αποφάσεων. Στο ίδιο µήκος κύµατος, οι Frost & Sullivan [2] εισήγαγαν την έννοια του Advanced Health Analytics. Σε σχέση µε τα προαναφερθέντα χαρακτηριστικά των δεδοµένων, µπορούµε να δώσουµε τον ακόλουθο ορισµό για τον χώρο της υγείας [3]:

• Volume (Όγκος). Ο όγκος των δοµηµένων και µη δοµηµένων δεδοµένων υγείας είναι τεράστιος και µεγαλώνει ακόµη περισσότερο αν µπορούσαµε να συλλέξουµε τα δεδοµένα από τους διαφορετικούς φορείς και επαγγελµατίες υγείας.

• Velocity (Ταχύτητα). Η ανάγκη για την ανάλυση των παραγόµενων δεδοµένων σε πραγµατικό χρόνο είναι επιτακτική. Απαιτούνται εποµένως νέοι αλγόριθµοι και προηγµένες τεχνικές ανάλυσης για την εξαγωγή πολύτιµων συµπερασµάτων σε πραγµατικό χρόνο.

• Variety (Ποικιλία). Τα δεδοµένα στην υγεία προέρχονται από πολλές και διαφορετικές πηγές, ενώ δεν είναι δυνατή η άµεση σύγκριση και χρησιµοποίησή τους. Περισσότερες λεπτοµέρειες αναφέρονται και στο κεφάλαιο 4 του παρόντος συγγράµµατος σχετικά µε τα πρότυπα και την διαλειτουργικότητα.

• Veracity (Ακρίβεια). Ο ευαίσθητος χαρακτήρας των δεδοµένων στην υγεία σε συνδυασµό µε την ανάγκη για ποιοτικά δεδοµένα, έχει άµεση σχέση µε την λήψη κρίσιµων αποφάσεων και την ποιότητα των παρεχόµενων υπηρεσιών υγείας. Το συγκεκριµένο χαρακτηριστικό αφορά το κατά πόσο µπορούµε ή όχι να εµπιστευτούµε τα συλλεχθέντα δεδοµένα και την πηγή προέλευσής τους, προκειµένου να προχωρήσουµε σε περαιτέρω επεξεργασία και ανάλυση.

Η ανάγκη για συσσωρευµένη γνώση στο χώρο της υγείας είναι σχεδόν επιβεβληµένη και ο µόνος τρόπος για να την διεκδικήσουµε είναι µέσω των νέων τεχνολογιών και επιτευγµάτων που προσφέρονται σήµερα απλόχερα. Τα Big Data φαίνεται να αποτελούν τη λύση σε αυτό το πρόβληµα, µέσω της δυνατότητας που παρέχουν για άµεση επεξεργασία και εξαγωγή συµπερασµάτων από την θάλασσα των δεδοµένων που υφίσταται, άσχετα µε τη µορφή και την πηγή τους.

Ένας ακόµη ενδιαφέρον τεχνολογικός κλάδος είναι αυτός του Cloud Computing ή αλλιώς Υπολογιστική Νέφους. Ουσιαστικά αφορά έναν εναλλακτικό τρόπο απόκτησης τεχνολογικών υπηρεσιών, υποδοµών και εφαρµογών. Μέσω του Cloud Computing είναι δυνατή η απόκτηση των επιθυµητών υποδοµών (π.χ.

Page 5: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

εξυπηρετητών και λογισµικού) µέσω του Internet ανάλογα µε τη χρήση/κίνηση. Με πιο απλά λόγια, αφορά τον διαµοιρασµό υποδοµών (υλικών και λογισµικού), ανάλογα µε τις ανάγκες του εκάστοτε χρήστη (π.χ. εταιρίας ή ατόµου). Οι υποδοµές αυτές είναι αποµακρυσµένα εγκατεστηµένες και ο πελάτης µπορεί να τις ενοικιάσει ανάλογα µε τις ανάγκες του. Με αυτό τον τρόπο εξοικονοµεί πόρους, ενώ ταυτόχρονα δεν ασχολείται και µε την συντήρηση και απαρχαίωση του εξοπλισµού, που θα έπρεπε σε διαφορετική περίπτωση να αγοράσει, ή την αγορά ακριβού λογισµικού. Ένα ακόµη θετικό στοιχείο είναι η δυνατότητα ανά πάσα στιγµή για άµεση κλιµάκωση των υποδοµών, όταν αυξάνονται οι ανάγκες του πελάτη. Ο πελάτης του Cloud Computing µπορεί εποµένως να ενοικιάσει υπηρεσίες και υποδοµές (εξυπηρετητές, αποθηκευτικό χώρο, κ.ο.κ.), ανάλογα µε τις ανάγκες του χωρίς να διαθέτει εξειδικευµένο τµήµα πληροφορικής και χωρίς να απασχολείται µε τα σχετιζόµενα θέµατα. Ο τρόπος αυτός αποδεικνύεται να είναι οικονοµικά αποδοτικός, ειδικά όταν οι απαιτήσεις µεγαλώνουν.

Το Cloud Computing έρχεται να δώσει λύση στις ανάγκες των Big Data, µιας και απαιτούνται σηµαντικά αυξηµένες δυνατότητες και πόροι (π.χ. υπολογιστική ισχύ, αποθηκευτικό χώρο, κ.ά.). Οι απεριόριστοι πόροι που προσφέρονται µέσω του Cloud Computing επιτρέπουν την κατανοµή του φόρτου εργασίας που απαιτούνται για τα Big Data, µε τρόπο ώστε να είναι δυνατή η σε πραγµατικό χρόνο επεξεργασία των τεράστιων όγκων των δεδοµένων. Το Cloud Computing επιβάλει τη χρησιµοποίηση νέων µεθόδων εκτέλεσης των εργασιών επεξεργασίας των δεδοµένων ή απόκρισης των συστηµάτων σε περίπτωση σφαλµάτων, κ.ο.κ., λόγω του διαµοιρασµού των εργασιών που εκτελούνται. Δεδοµένων αυτών των δυνατοτήτων, το Cloud Computing έχει µπει για τα καλά στο χώρο της υγείας. Οι τεχνολογίες του νέφους παρέχονται µε διάφορους τρόπους και µεθόδους, µε τα αναµενόµενα οικονοµικά οφέλη για τους πελάτες τους. Σε κάθε περίπτωση, θα πρέπει ο πελάτης να γνωρίζει τι ακριβώς θέλει να πετύχει προκειµένου να επιλέξει το ενδεδειγµένο µοντέλο του Cloud Computing. Τα τρία βασικά µοντέλα του Cloud Computing είναι τα ακόλουθα:

• Λογισµικό ως Υπηρεσία - Software-as-a-Service (SaaS): Οι επιθυµητές εφαρµογές

παρέχονται µε την µορφή υπηρεσίας και δεν απαιτείται η εγκατάστασή τους στους υπολογιστές του πελάτη. Ουσιαστικά πρόκειται για λογισµικό που χρησιµοποιείται µέσω του Internet και τρέχει σε κάποιο γνωστό φυλλοµετρητή (web browser). Η εφαρµογή τρέχει σε υποδοµές που ανήκουν στον πάροχο του SaaS και πωλούνται ως επί το πλείστον σε µηνιαία ή ετήσια βάση.

• Πλατφόρµα ως Υπηρεσία - Platform-as-a-Service (PaaS): Αναφέρεται σε µια πλατφόρµα ή περιβάλλον που παρέχεται στον πελάτη ως υπηρεσία προκειµένου να µπορεί να αναπτύξει και να διαχειριστεί δικές του εφαρµογές. Και σε αυτή την περίπτωση, ο πελάτης έχει πρόσβαση στις συγκεκριµένες εφαρµογές µέσω ενός απλού φυλλοµετρητή. Η πλατφόρµα αποτελείται από το απαιτούµενο λογισµικό (π.χ. λειτουργικό σύστηµα, άλλες ενδιάµεσες εφαρµογές, πρωτόκολλα επικοινωνίας, κ.ά.) που επιτρέπει στις εφαρµογές να τρέχουν στο νέφος. Τα θέµατα ασφάλειας, διαχείρισης, κλιµάκωσης των απαιτήσεων, κ.λπ., σε σχέση µε το PaaS απασχολούν µόνον τον πάροχο της υπηρεσίας και όχι τον πελάτη, ο οποίος πληρώνει µια συνδροµή ανάλογα µε τις απαιτήσεις του.

• Υποδοµή ως Υπηρεσία - Infrastructure-as-a-Service (IaaS): Το συγκεκριµένο µοντέλο παρέχει πρόσβαση σε υποδοµές σε ένα εικονικό περιβάλλον µέσω του δικτύου (π.χ. µέσω του Internet). Οι υποδοµές αφορούν για παράδειγµα, εξυπηρετητές, άλλο υλικό (π.χ. διάθεση bandwidth, IP διευθύνσεων), κ.ά. Οι πελάτες και πάλι πληρώνουν ανάλογα µε τη χρήση και τους πόρους που χρησιµοποιούν ή ενοικιάζουν. Ένα σηµαντικό πλεονέκτηµα είναι πως υπάρχει η δυνατότητα κλιµάκωσης των υποδοµών ανά πάσα στιγµή ανάλογα µε τις ανάγκες του πελάτη. Οι υλικές υποδοµές (π.χ. εξυπηρετητές) µπορεί να βρίσκονται σε διαφορετικά κέντρα, όπου ο πάροχος είναι υπεύθυνος για την συντήρηση και ορθή λειτουργία τους. Με αυτό τον τρόπο δεν απαιτούνται έξοδα συντήρησης και διαχείρισης των υποδοµών από τον πελάτη του IaaS.

Όπως γίνεται εύκολα αντιληπτό από τα προαναφερθέντα, οι τεχνολογίες Μεγάλων δεδοµένων (Big Data) και Υπολογιστικού Νέφους (Cloud Computing) συνεργάζονται άµεσα προκειµένου να επιτύχει κανείς το επιθυµητό αποτέλεσµα, τόσο στον τοµέα της υγείας όσο και σε άλλους τοµείς.

Page 6: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

Για την απόκτηση µιας πιο ολοκληρωµένης εικόνας και τη σύνδεση των τεχνολογιών αυτών µε την πράξη, ακολουθεί η παρουσίαση κάποιων σηµαντικών προσπαθειών στο χώρο της υγείας που εκµεταλλεύονται τις συγκεκριµένες τεχνολογίες.

2. Τεχνολογίες και εφαρµογές Big Data & Cloud Computing στην Υγεία Οι ραγδαίες εξελίξεις στην τεχνολογία έχουν επιτρέψει την υλοποίηση εφαρµογών και καινοτοµιών που υποβοηθούν σηµαντικά την διεξαγωγή ερευνών σε κλίµακες που µέχρι πρότινος ήταν αδύνατον να διεξαχθούν. Το Υπολογιστικό Νέφος (Cloud Computing) και τα Μεγάλα Δεδοµένα (Big Data) ανήκουν σε αυτή την κατηγορία. Σύµφωνα µε έγκυρες µελέτες [2], ο χώρος της υγείας εµφανίζει µια µεγάλη αγορά και δυναµική που σχετίζεται µε την ανάλυση των παραγόµενων δεδοµένων. Για παράδειγµα, στις ΗΠΑ, το 2016 αναµένεται το 95% των νοσοκοµείων να χρησιµοποιεί Ηλεκτρονικούς Φακέλους Υγείας, που αντιστοιχεί σε µια αύξηση της τάξης του 171% σε σχέση µε το 2011. Αυτό µε την σειρά του, οδηγεί σε µια ολοένα και αυξανόµενη ανάγκη για υιοθέτηση λύσεων που µπορούν να επεξεργάζονται και να αναλύουν τα παραγόµενα δεδοµένα υγείας σε πραγµατικό χρόνο. Εκτιµάται πως το 2016 το 50% των νοσοκοµείων στις ΗΠΑ θα έχει υλοποιήσει τέτοιου είδους λύσεις και τεχνολογίες (το 2011 το αντίστοιχο ποσοστό ήταν 10%), που αντιστοιχεί σε αύξηση κατά 400%. Ταυτόχρονα, οι επενδύσεις σε νέες τεχνολογίες στον τοµέα της υγείας αυξάνονται συνεχώς [4]. Σύµφωνα µε µελέτη [5], ο αριθµός των επενδύσεων από επιχειρηµατικά κεφάλαια (Venture Capitals) έφτασε τις 104 στο πρώτο τρίµηνο του 2013 από 51 που ήταν το προηγούµενο τρίµηνο, µε άντληση 493 εκατοµµυρίων δολαρίων σε σύγκριση µε τα 1,2 δις δολάρια που είχαν δαπανηθεί όλο το προηγούµενο έτος. Το µεγαλύτερο πλήθος των επιχειρηµατικών κεφαλαίων αφορούσε εφαρµογές κινητής υγείας (m-Health), τηλεϋγείας, αξιολόγησης υπηρεσιών υγείας, κ.ά.

Η ολοένα και µεγαλύτερη υιοθέτηση τεχνολογικών λύσεων στο χώρο της υγείας, όπως οι ΗΦΥ, συνοδεύεται από την συλλογή όλο και περισσότερων ψηφιακών δεδοµένων και πληροφοριών σε πληθώρα µορφών και από διάσπαρτες και ετερογενείς πολλές φορές πηγές. Τα παραδοσιακά τεχνολογικά εργαλεία δεν µπορούν να αντιµετωπίσουν πλέον αυτό τον όγκο των δεδοµένων και να ανταποκριθούν στις απαιτήσεις της εποχής. Αναδεικνύεται εποµένως µια τεράστια αγορά, µε επίκεντρο λύσεις που εστιάζουν στον τελικό χρήστη/πελάτη, χρησιµοποιώντας τεχνολογίες Big Data για να εκµεταλλευτούν στο έπακρο τις πολύτιµες γνώσεις που «κρύβονται» στα παραγόµενα και αποθηκευµένα δεδοµένα του χώρου της υγείας, και η οποία µπορεί να αναδειχθεί µόνον µε την κατάλληλη επεξεργασία, το συνδυασµό και τη σύγκρισή των. Προηγµένες τεχνικές ανάλυσης µπορούν εποµένως να βοηθήσουν στους περισσότερους τοµείς του χώρου (π.χ. µείωση του κόστους λειτουργίας, βελτίωση των υπηρεσιών, ανακάλυψη νέων θεραπειών, κ.ο.κ.). Οι απαιτήσεις φυσικά σε αποθηκευτικό χώρο, σε υπολογιστική ισχύ, σε µνήµη, σε εξειδικευµένο λογισµικό, κ.ά., είναι προαπαιτούµενα για να µπορέσει κανείς να φέρει το επιθυµητό αποτέλεσµα. Η συνεργασία µεταξύ επιστηµόνων και ερευνητών που βρίσκονται σε άλλα σηµεία και ο συνδυασµός των ευρηµάτων τους είναι πλέον εφικτός. Για παράδειγµα, το GÉANT αποτελεί το µεγαλύτερο δίκτυο επικοινωνίας για εκπαιδευτικούς και ερευνητές και τρέχει πάνω από ένα δίκτυο µε ταχύτητα πολλών Gigabits. Το συγκεκριµένο δίκτυο ήδη συνδέει 34 εθνικά εκπαιδευτικά και ερευνητικά δίκτυα (National Research and Education Networks-NRENs) µε ταχύτητες που φτάνουν τα 500 Gigabits/sec και χρησιµοποιείται από 50 εκατοµµύρια χρήστες σε 10.000 ινστιτούτα στην Ευρώπη [6]. Στο ίδιο µήκος κύµατος, το δίκτυο EGEE (Enabling Grids for E-sciencE) χρησιµοποιεί 80.000 υπολογιστές σε 300 πόλεις σε 50 χώρες. Η ανάγκη για κατάλληλη πρόσβαση στα αποµακρυσµένα πολλές φορές δεδοµένα οδήγησε την Ευρώπη το 2002 να δηµιουργήσει το ESFRI (European Strategy Forum on Research Infrastructures), για λογαριασµό του Ευρωπαϊκού Συµβουλίου, προκειµένου να αναπτύξει την διεθνή συνεργασία και την διασύνδεση των επιστηµόνων σε Ευρωπαϊκό επίπεδο. Αρχικός σκοπός του ήταν να επιτύχει αποδόσεις της τάξης του peta-flop (αφορά την ικανότητα ενός υπολογιστή να εκτελέσει ένα τετράκις εκατοµµύρια ή αλλιώς 1015 πράξεις κινητής υποδιαστολής ανά δευτερόλεπτο) µέχρι το 2010 και να φτάσει τα 1018 (exa-flop) πράξεις µέχρι το 2020. Από τότε, οι τεχνολογικές εξελίξεις έχουν καταφέρει να δηµιουργήσουν τους λεγόµενους υπερ-υπολογιστές ή supercomputers [7].

Η αγορά των Big Data είναι συνεχώς αυξανόµενη [2, 8, 9]. Πολλές είναι πλέον οι εταιρίες που απασχολούνται στον συγκεκριµένο χώρο και στον ιδιαίτερο τοµέα της ανάλυσης δεδοµένων υγείας. Ο χώρος των Big Data σχετίζεται, όπως γίνεται κατανοητό, τόσο µε υποδοµές όσο και µε τεχνικές και µεθοδολογίες ανάλυσης [10] (π.χ. υποδοµές αποθήκευσης δεδοµένων και τεχνικές παρακολούθησης και διαχείρισής των).

Page 7: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

Με την προϋπόθεση της ύπαρξης των προαναφερθέντων στοιχείων, εφαρµόζονται στη συνέχεια εξειδικευµένα εργαλεία και τεχνολογίες ανάλυσης των Μεγάλων Δεδοµένων (Big Data) για την εξόρυξη των πολύτιµων γνώσεων και προβλέψεων. Στη συνέχεια, οι προβλέψεις υιοθετούνται στο σύστηµα επιχειρηµατικής ευφυΐας του οργανισµού µε τη χρήση των κατάλληλων εφαρµογών. Είναι απαιτούµενο φυσικά, το περιβάλλον των Big Data να ενταχθεί κατάλληλα στις υποδοµές της επιχειρηµατικής ευφυΐας του οργανισµού. 2.1 Εργαλεία και προϊόντα Big Data & Cloud Computing Η επιλογή µιας συγκεκριµένης λύσης δεν είναι αυτονόητη, µιας και κάθε µία παρουσιάζει κάποια πλεονεκτήµατα και µειονεκτήµατα. Όπως και στην υπόλοιπη βιοµηχανία λογισµικού, ο τοµέας των Big Data έχει δύο κύριες διαδροµές για να ακολουθήσει κανείς, την λύση του ανοικτού κώδικα ή την εµπορική λύση. Ακολουθεί µια σύντοµη παρουσίαση των σηµαντικότερων λύσεων που παρέχονται σήµερα.

Η εταιρία ΙΒΜ παρέχει την πλατφόρµα Info Sphere, η οποία εµπεριέχει τα ακόλουθα βασικά προϊόντα: (α) το Hadoop, το οποίο µπορεί και επεξεργάζεται και αναλύει όλων των τύπων τα δεδοµένα τα οποία µπορεί να βρίσκονται σε συµπλέγµατα εξυπηρετητών (server clusters), (β) τρόπο αποθήκευσης δεδοµένων (data warehouse) για βελτιωµένη αναζήτηση βάσει της λειτουργίας της επιχείρησης και (γ) εξειδικευµένο λογισµικό για ανάλυση τεράστιου όγκου δεδοµένων σε πραγµατικό χρόνο. Περιλαµβάνει επίσης, υποστηρικτικές υπηρεσίες και εφαρµογές (π.χ. εργαλεία διαχείρισης του συστήµατος, περιβάλλον ανάπτυξης, κα) και εργαλεία επιχειρηµατικής ευφυΐας και ανάλυσης [11]. Οι λύσεις ανοικτού κώδικα έχουν από την άλλη κάποια πλεονεκτήµατα αλλά και µειονεκτήµατα. Για παράδειγµα, ενώ επιτρέπουν στους χρήστες να χρησιµοποιούν όποιο εργαλείο θέλουν για την ανάλυση των δεδοµένων, απαιτείται ιδιαίτερη προσπάθεια και χρόνος για να µπορέσει κάποιος να τις κάνει να λειτουργήσουν.

Η τελική πλατφόρµα που θα επιλεγεί, σε κάθε περίπτωση, θα πρέπει να µπορεί να χειρίζεται την εισαγωγή, την επεξεργασία, την αποθήκευση και την αναζήτηση των δεδοµένων και να παρέχει δυνατότητες ανάλυσής των. Η πλατφόρµα Apache Hadoop ήταν πρωτοπόρος σε αυτή την κατηγορία και την ακολούθησαν άλλες NoSQL βάσεις δεδοµένων όπως η Cassandra και η MongoDB που µπορούν να χειριστούν τεράστιες ποσότητες δεδοµένων. Το Apache Hadoop αποτελεί ουσιαστικά ένα πλαίσιο ανοικτού κώδικα που επιτρέπει την κατανεµηµένη επεξεργασία µεγάλου όγκου δεδοµένων, που βρίσκονται σε συµπλέγµατα εξυπηρετητών και υποστηρίζει εφαρµογές που µπορούν και αναλύουν xetabyte δεδοµένων (τόσο δοµηµένων όσο και αδόµητων). H πλατφόρµα Red Hat Enterprise Linux περιλαµβάνει τρόπο αποθήκευσης, µια ενδιάµεση εφαρµογή και ένα υβριδικό νέφος (το OpenStack) που επιτρέπουν την σύλληψη, επεξεργασία και ενσωµάτωση των µεγάλων δεδοµένων (big data). Η εταιρία Cisco, έχει δηµιουργήσει την πλατφόρµα Cisco Common Big Data Platform, που συνδυάζει τα big data µε παραδοσιακές εφαρµογές και συστήµατα και βασίζεται στο Cisco’s Unified Computing System. Η συγκεκριµένη πλατφόρµα διαθέτει δυνατότητες επεξεργασίας, δικτύωσης και αποθήκευσης, ενώ µπορεί και συνεργάζεται µε πληθώρα εµπορικών προϊόντων (π.χ. Datasta, Hortonworks, Cloudera, Oracle, SAP Hanna, Intel και Pivotal). Οι 10Gen, Cloudera και Amazon ήταν οι πρώτες πλατφόρµες Big Data που υποστήριζαν το Apache Hadoop και τεχνολογίες για µη σχεσιακές βάσεις δεδοµένων (NoSQL), ενώ πρόσφατα εµφανίστηκαν και άλλες, όπως οι Amazon, DataStax, Neo Technologies, Hortonworks, Platfora, 10Gen και CouchBase. Αυτές είναι οι κυριότερες που υποστηρίζουν λύσεις NoSQL. Κάποια παραδείγµατα NoSQL λύσεων είναι οι MongoDB, Neo4j, CouchBase, Cassandra και DynamoDB. Οι Platfora, Splunk, Karmasphere, Hadapt και Datameer είναι κάποιες ακόµη ολοκληρωµένες λύσεις για Big Data. Στη συνέχεια, παρουσιάζονται συνοπτικά κάποιες από τις πιο διαδεδοµένες πλατφόρµες και τεχνολογικές λύσεις για Βig Data.

Η 10Gen παρέχει µια από τις κυρίαρχες µη σχεσιακές βάσεις δεδοµένων, την MongoDB, η οποία είναι ανοικτού κώδικα βάση δεδοµένων, βασισµένη σε έγγραφα (document database) και µπορεί να συνδυαστεί άψογα µε τη χρήση τεχνολογιών JSON (Java Script Object Notation), XML, κ.ά. Σύµφωνα µε τα όσα υποστηρίζει η ίδια η εταιρία, η MongoDB είναι ευέλικτη, εύκολη στη χρήση, ενώ παρέχει υψηλές αποδόσεις, διαθεσιµότητα και αυτόµατη κλιµάκωση [12]. Μεταξύ άλλων σηµαντικών χαρακτηριστικών, διαθέτει την δυνατότητα αναζήτησης σε κείµενα, σύνδεσης µε το Hadoop, κ.ά. Η CouchBase [13] χρησιµοποιεί ένα ευέλικτο µοντέλο JSON, ώστε οι χρήστες της να µπορούν να διαµορφώσουν τις εφαρµογές τους χωρίς τους

Page 8: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

περιορισµούς ενός συγκεκριµένου σχήµατος βάσης δεδοµένων. Επίσης, έχει υψηλές ταχύτητες ανάγνωσης και εγγραφής, εύκολη κλιµάκωση, κ.ά., ενώ µπορεί και εξυπηρετεί πολλούς ταυτόχρονους χρήστες µε λιγότερους εξυπηρετητές και διαµοιράζει τον φόρτο και τα δεδοµένα εξίσου σε όλους τους διαθέσιµους εξυπηρετητές. Μια άλλη γνωστή εταιρία, η Amazon, λόγω καταρχάς των δικών της αυξηµένων αναγκών, προσφέρει σηµαντικές λύσεις για big data µέσω του προϊόντος Elastic MapReduce (EMR), το οποίο βασίζεται και αυτό στο Hadoop. Μέσω των Amazon Web Services (AWS), µπορεί κανείς να χρησιµοποιήσει το MapR M7 πάνω από την πλατφόρµα EMR, ενώ η εταιρία ανέπτυξε και δύο ακόµη υπηρεσίες (την NoSQL βάση δεδοµένων Amazon DynamoDB και µια υπηρεσία διαχείρισης βάσεων δεδοµένων, την Amazon RedShift). Το Amazon EMR µπορεί και συνεργάζεται µε το Hadoop µέσω του AWS Cloud. To M7 κάνει εφικτή την εύκολη κλιµάκωση, ενώ η πλατφόρµα MapR επιτρέπει υψηλές ταχύτητες πρόσβασης στο Hadoop και σε άλλες NoSQL βάσεις δεδοµένων. Το Amazon Redshift αποτελεί µια υπηρεσία διαχείρισης βάσης δεδοµένων από κάποιες εκατοντάδες gigabytes µέχρι και κάποια petabytes, µε στόχο την ανάλυση των δεδοµένων της επιχείρησης µέσω των υπαρχόντων εργαλείων επιχειρηµατικής ευφυΐας. Τέλος, το Elastic Compute Cloud (Amazon EC2) είναι ακόµη µια υπηρεσία που προσφέρει η εταιρία για την άµεση αλλαγή του απαιτούµενου µεγέθους της υπολογιστικής ισχύς στο νέφος [14]. Το Cloudera είναι από τις κυρίαρχες λύσεις για το Apache Hadoop [15]. Η εταιρία προσφέρει το προϊόν Impala για βελτιωµένη ταχύτητα επεξεργασίας. Το Cloudera Impala είναι µια µηχανή αναζήτησης σε πραγµατικό χρόνο που επιτρέπει στους χρήστες να αναζητούν δεδοµένα αποθηκευµένα σε Hadoop Distributed File System (HDFS), καθώς και σε πίνακες βάσης δεδοµένων Apache HBase µέσα σε ελάχιστα δευτερόλεπτα, µέσω µιας εύχρηστης διεπαφής µε χρήση SQL ερωτηµάτων. Η έκδοση Enterprise Cloudera [16] προσφέρει µεταξύ άλλων και επιλογή για διασύνδεση µέσω ODBC (Open Database Connectivity)/JDBC (Java Database Connectivity). H Datameer προσφέρει και αυτή λύσεις για το Hadoop. Χρησιµοποιεί ένα φιλικό περιβάλλον µε φύλλα εργασίας (spreadsheet-style) για την ανάλυση των δεδοµένων, καθώς και ένα άλλο για την δηµιουργία εικονική απεικόνιση των δεδοµένων και των αποτελεσµάτων της ανάλυσης [17]. Η DataStax προωθεί την ανοικτού κώδικα NoSQL βάση δεδοµένων Apache Cassandra ως εναλλακτική της Oracle. Μπορεί και διαχειρίζεται µεγάλο όγκο από δοµηµένα, ηµι-δοµηµένα και µη δοµηµένα δεδοµένα που βρίσκονται σε διαφορετικά υπολογιστικά κέντρα (data centers) και στο νέφος. Η έκδοση DataStax Enterprise µπορεί να συνδυάζει το Apache Cassandra µε τις δυνατότητες ανάλυσης του Apache Hadoop και την αναζήτηση µέσω του Apache Solr για ακόµη καλύτερα αποτελέσµατα [18]. Η Hadapt παρέχει την πλατφόρµα Adaptive Analytical Platform προκειµένου να διευκολύνει τη χρήση SQL στο Apache Hadoop. Στην έκδοση Hadapt 2.0, προσφέρει το Hadapt Interactive Query για ανάλυση βασισµένη σε SQL, το Hadapt Development Kit (HDK) για δηµιουργία προσαρµοσµένης ανάλυσης, καθώς και την επιλογή σύνδεσης µε το λογισµικό Tableau [19] για την κατάλληλη απεικόνιση των αποτελεσµάτων ανάλυσης (visual analytics) [20]. Η εταιρία Hortonworks αποτελεί έναν τεχνοβλαστό της γνωστής εταιρίας αναζήτησης στο Διαδίκτυο Yahoo! και προσφέρει µια ανοικτού κώδικα πλατφόρµα, την Hortonworks Data Platform (HDP), η οποία βασίζεται και αυτή στο Apache Hadoop. Η έκδοση HDP 2.0 περιλαµβάνει όλες τις υπηρεσίες προκειµένου να µπορεί κάποιος να δηµιουργήσει µια λύση βασισµένη στο Hadoop, ενώ η τελευταία έκδοση δίνει την δυνατότητα συνεργασίας και µε Microsoft Windows Server [21]. Η Karmasphere έχει αναπτύξει µια πλατφόρµα µε το ίδιο όνοµα για την ανάλυση µεγάλου όγκου δεδοµένων, την δηµιουργία αναφορών και την απεικόνισή τους βασισµένη στο Hadoop. Μπορεί επίσης να συνεργάζεται µε τα Amazon Web Services και Rackspace, ενώ υποστηρίζει όλες τις επιλογές για το Ηadoop (π.χ. Cloudera, Hortonworks και MapR). Προσφέρει επίσης ένα γραφικό περιβάλλον για προγραµµατιστές (το Karmasphere Studio) και ένα περιβάλλον συνεργασίας για αναλυτές δεδοµένων (το Karmasphere Analyst) µε βάση πάντα το Hadoop [22]. Η MapR προωθεί το προϊόν MapR M7, µια λύση για εφαρµογές NoSQL και φυσικά και για το Apache Hadoop. Η Neo Technology προωθεί το προϊόν Neo4j [23], µια ανοικτού τύπου βάση δεδοµένων γράφων (graph database). Με αυτό τον τρόπο είναι δυνατή η αποθήκευση διασυνδεδεµένων δεδοµένων που δεν είναι αµιγώς ιεραρχικά, ενώ επιτρέπει την βελτιωµένη απεικόνιση πραγµατικών καταστάσεων (π.χ. κοινωνική δικτύωση, κ.ά.). Το Neo4j χρησιµοποιείται επίσης για την διαχείριση και αναζήτηση σε κοινωνικούς γράφους και σε εφαρµογές και συστήµατα προτιµήσεων (recommendation systems). Η Platfora προωθεί µε την σειρά της τη νέα πλατφόρµα Platfora Big Data Analytics 3.0, που βασίζεται στο Hadoop. Η συγκεκριµένη λύση χρησιµοποιεί το Platfora Event Series Analytics για την ανίχνευση συµπεριφορών και ενεργειών ανεξάρτητα από το χρησιµοποιούµενο µέσον (π.χ. αριθµός web clicks, πρόσβαση σε εφαρµογές για κινητά, κ.ά.). Η Platfora Iterative Segmentation µπορεί µε τη σειρά της και δηµιουργεί τοµείς πελατών σύµφωνα µε τη συµπεριφορά τους (π.χ. µοτίβα επισκέψεων σε κάποια ιστοσελίδα ή tweets πριν πραγµατοποιηθεί µια αγορά, ανάλογα µε τα δηµογραφικά

Page 9: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

τους στοιχεία, κ.λπ.), δίνοντας έτσι την απαιτούµενη πληροφορία στην επιχείρηση. Η Platfora Entity-Centric Data Catalog δίνει την δυνατότητα οργάνωσης των δεδοµένων σε σχέση µε µια οντότητα (π.χ. πελάτες, προϊόντα, κ.ο.κ.), ενώ παρέχει πρόσβαση στην ανάλυσή τους, στους τοµείς που διαχωρίζονται και στα πρωτογενή δεδοµένα. Η Platfora Dynamic Lenses επιτρέπει την πρόσβαση στα δεδοµένα που έχουν αποθηκευτεί στο Hadoop, ενώ τα οργανώνει µε στόχο την πιο βελτιωµένη δοµή τους για ανάλυση [24]. Η Splunk παρέχει ένα οµώνυµο λογισµικό για την αναζήτηση, παρακολούθηση και ανάλυση των big data, µέσω ενός εύχρηστου περιβάλλοντος βασισµένο στο web. Η Splunk ανέπτυξε επίσης την Hunk για την αναγνώριση και εξεύρεση ανωµαλιών σε terabytes ή petabytes δεδοµένων στο Hadoop, χωρίς την ανάγκη για εξειδικευµένες δεξιότητες από τον χρήστη ή συγκεκριµένου σχήµατος βάση δεδοµένων, κ.λπ.

2.2 Εφαρµογές και ερευνητικά έργα Για την καλύτερη κατανόηση των δυνατοτήτων που προσφέρουν οι τεχνολογίες των Μεγάλων Δεδοµένων (Big Data) ή/και του Υπολογιστικού Νέφους (Cloud Computing) στο χώρο της υγείας, ακολουθεί η παρουσίαση κάποιων ενδεικτικών παραδειγµάτων και ερευνητικών έργων. Ο κύριος στόχος των περισσότερων εφαρµογών και έργων είναι η «ανακάλυψη» σηµαντικών πληροφοριών που µπορούν να εξαχθούν από τον τεράστιο όγκο των συλλεχθέντων και συνεχώς παραγόµενων δεδοµένων στην υγεία. Τα δεδοµένα αυτά θα µπορούσαν να δώσουν πολύτιµες πληροφορίες προκειµένου να προχωρήσουν οι έρευνες ή για να βελτιώσει την αποδοτικότητά του, τα οικονοµικά του και τις υπηρεσίες του ένας οργανισµός υγείας. Ο τεράστιος συγκεντρωµένος όγκος αποτελεί όµως µια πραγµατική πρόκληση από πολλές πλευρές (αποθήκευσης, επεξεργασίας, αναζήτησης, εξόρυξης γνώσης, κ.ο.κ.). Ταυτόχρονα, οι διαφορετικοί εµπλεκόµενοι (π.χ. µέτοχοι, ιατρικό προσωπικό, νοσηλευτικό προσωπικό, διοικητικό προσωπικό, υπουργείο υγείας, κ.λπ.) αναζητούν στα ίδια τα δεδοµένα διαφορετικές πληροφορίες.

Το πρόγραµµα Big Data to Knowledge (BD2K) του Εθνικού Ινστιτούτου Υγείας (National Institute of Health - NIH) των ΗΠΑ χρησιµοποιεί τις τεχνολογίες των big data για να εκµεταλλευτεί τα δεδοµένα από διαφορετικούς φορείς (κυβερνητικούς και ιδιωτικούς) για έρευνες στον τοµέα της βιοϊατρικής. Στόχος του έργου είναι, µεταξύ άλλων, να αναπτύξει µεθόδους, λογισµικό και εργαλεία, που θα βοηθήσουν στην χρήση του τεράστιου όγκου των παραγόµενων δεδοµένων [25]. Οι προκλήσεις έγκεινται στην διαφορετική µορφή των δεδοµένων, των τρόπων αποθήκευσής των, το γεγονός πως προέρχονται από διαφορετικές πηγές, κ.ά. Η πιθανότητα όµως της χρήσης τους, ανεξάρτητα από όλα τα προαναφερθέντα χαρακτηριστικά, θα ήταν κάτι το οποίο θα επέτρεπε την πρόοδο των ερευνών στο χώρο. Για το σκοπό αυτό, στα πλαίσια του προγράµµατος BD2K, δηµιουργήθηκε µια κοινοπραξία από κέντρα αριστείας (centers of excellence), η οποία προωθεί την ανάπτυξη εργαλείων και λύσεων που θα µπορούν χρησιµοποιηθούν από την ευρύτερη κοινότητα της βιοϊατρικής έρευνας, ξεπερνώντας τα σηµερινά εµπόδια (π.χ. χρήση προτύπων, µεταδεδοµένων, πολιτικές οργάνωσης, διαχείρισης και διαµοίρασης των δεδοµένων, κ.ά.). Ο απώτερος στόχος του έργου είναι:

• να παρέχει πρόσβαση σε δεδοµένα του χώρου της βιοϊατρικής, • να αναπτύξει αλγόριθµους και εργαλεία για την επεξεργασία, αποθήκευση, ανάλυση,

απεικόνιση και ενσωµάτωση των δεδοµένων, • να δηµιουργήσει κατάλληλους µηχανισµούς ώστε να προστατεύονται τα πνευµατικά

δικαιώµατα και η ιδιωτικότητα, • να δηµιουργήσει ικανούς ερευνητές στο πεδίο των Big Data προκειµένου να βοηθήσουν µε

την σειρά τους στην καλύτερη ανάλυση και επεξεργασία τους.

Ο οργανισµός tranSMART Foundation είναι ένας µη κερδοσκοπικός οργανισµός που προσφέρει την ανοικτού κώδικα οµώνυµη πλατφόρµα διαχείρισης γνώσης tranSMART [26]. Αναπτύχθηκε από την συνεργασία προγραµµατιστών και ιατρών από 20 διαφορετικούς οργανισµούς και παρέχει εργαλεία για την διαχείριση δεδοµένων διαφορετικών τύπων (χηµικών, βιολογικών και «οmics») που µπορεί να προέρχονται από διαφορετικές πηγές. Ουσιαστικά, βοηθά τους επιστήµονες να διερευνήσουν επιστηµονικές υποθέσεις και ερωτήµατα, εξετάζοντας την σχέση µεταξύ γενετικών και φαινοτυπικών δεδοµένων για οµάδες ασθενών, και να αξιολογήσουν τα αποτελέσµατά τους σε σχέση µε την δηµοσιευµένη βιβλιογραφία. Η πλατφόρµα σχεδιάστηκε αρχικά από την εταιρία Johnson & Johnson, ενώ στη συνέχεια συµµετείχαν και άλλες εταιρίες (όπως η Pfizer, η Sanofi, κ.ά.) για να εξυπηρετεί τις ανάγκες των βασικών επιστηµόνων, κλινικών

Page 10: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

επιστηµόνων, φαρµακοποιών, τοξικολόγων και άλλων, που εµπλέκονται στην ανακάλυψη νέων θεραπευτικών και διαγνωστικών µεθόδων, ώστε να µπορούν:

• να αναπτύξουν, δοκιµάσουν και βελτιώσουν τις ερευνητικές τους υποθέσεις, • να αναζητήσουν σύνολα δεδοµένων κατάλληλα για τις δοκιµές τους (π.χ. πιθανούς στόχους

των φαρµάκων ή των βιοδεικτών που εξετάζουν, κ.ά.), • να συγκρίνουν τα δεδοµένα από πρωτεοµικές (proteomics), µεταβολοµικές (metabolomics)

και άλλων µεταβολιτών (omics) µελέτες, • να συγκρίνουν γονιδιακά µοντέλα σε υγιή και νοσούντα άτοµα και δείγµατα ιστών, • να ερευνήσουν τις συσχετίσεις µεταξύ γονοτύπου και φαινοτύπου σε δεδοµένα κλινικών

δοκιµών, • να εξορύξουν προ-κλινικά δεδοµένα για γνώσεις σχετικά µε τη βιολογία της ανθρώπινης

ασθένειας, • να µελετήσουν γενετικούς και περιβαλλοντικούς παράγοντες που εµπλέκονται στην

ανθρώπινη νόσο, • να οπτικοποιήσουν κατάλληλα τα δεδοµένα, • να διαστρωµατοποιήσουν τα κλινικά δεδοµένα σε µοριακούς υπο-τύπους µιας συγκεκριµένης

ασθένειας, • να συνεργαστούν µε την ακαδηµαϊκή κοινότητα και τις εταιρίες που διεξάγουν παρόµοιες ή

σχετικές έρευνες.

Για την επίτευξη των ανωτέρω, η πλατφόρµα προσφέρει ένα κατάλληλο λογισµικό βασισµένο στο web και µια διεπαφή προγραµµατισµού εφαρµογών (ΑPI - Application Programming Interface), προκειµένου να δύναται η σύνδεση µε εξωτερικά πακέτα λογισµικού, όπως το Genome Browser, το R (για στατιστική ανάλυση) και το Spotfire (για οπτικοποίηση και ανάλυση των δεδοµένων).

Το ερευνητικό κέντρο Institute for Health Metrics and Evaluation (IHME) του University of Washington των ΗΠΑ, ανέπτυξε έναν κατάλογο δεδοµένων µε το όνοµα Global Health Data Exchange (GHDx). Στόχος του GHDx είναι η συλλογή µεγάλου όγκου δεδοµένων υγείας από διαφορετικές πηγές από όλο τον κόσµο, προκειµένου οποιοσδήποτε ενδιαφέρεται για θέµατα παγκόσµιας υγείας να µπορεί να ανατρέξει, να βρει ή/και να µοιραστεί σηµαντικές πληροφορίες [27]. Στα πλαίσια του έργου, συγκεντρώνει µετρήσεις δεδοµένων υγείας από ποικίλες πηγές, από µελέτες, από βάσεις δεδοµένων για ασθένειες, από φακέλους νοσοκοµείων, κ.ο.κ., ώστε να είναι δυνατή η αποτίµηση στρατηγικών, η µέτρηση της κατάστασης της υγείας, η αποδοτικότητα των συστηµάτων υγείας, κ.ά. Οι πληροφορίες αυτές είναι ανοικτές προς όλους τους ενδιαφερόµενους. Η τρέχουσα έκδοση του GHDx χρησιµοποιεί ένα ανοικτού κώδικα λογισµικού διαχείρισης περιεχοµένου (το Drupal 7 [28]) και την µηχανή αναζήτησης Apache SOLR [29].

Το National Human Genome Research Institute (NHGRI) χρηµατοδοτεί έρευνες µεγάλης κλίµακας στις ΗΠΑ, που σχετίζονται µε την εξεύρεση σηµαντικών γονιδιωµατικών πληροφοριών. Το NHGRI µαζί µε το LSAC (Large-Scale Genome Sequencing and Analysis Centers) συντονίζουν κάποια ακόµη ερευνητικά κέντρα που εργάζονται στον συγκεκριµένο τοµέα. Απώτερος στόχος είναι να παρέχουν δεδοµένα µεγάλης κλίµακας, τα οποία θα βοηθήσουν σε πολλούς και διαφορετικούς τοµείς την ερευνητική κοινότητα στον τοµέα της βιοϊατρικής. Για παράδειγµα, την ανακάλυψη µεταλλάξεων που σχετίζονται µε τον καρκίνο ή που χαρακτηρίζουν σύνθετες ασθένειες, ενώ παράλληλα θα βοηθήσουν στην αναζήτηση νέων ερωτηµάτων όσον αφορά την διαφοροποίηση των γονιδιωµάτων σε σχέση µε την βιολογία και τις ασθένειες, κ.ά. Επίσης, οι συµµετέχοντες έχουν την δυνατότητα, εκτός του όγκου των δεδοµένων που παρέχονται, να υιοθετήσουν νέες µεθόδους που προκύπτουν από τις τεχνολογικές εξελίξεις ή που απαιτούνται για την συνέχιση της έρευνας της γονιδιωµατικής αλληλουχίας (genome sequencing). Για αυτό το λόγο έχει αναπτύξει το πρόγραµµα Genome Sequencing Program (GSP) που βοηθά, µεταξύ άλλων, στην ανάπτυξη προτύπων και βέλτιστων πρακτικών, κ.ά. Ένα από τα πιο γνωστά οφέλη από την σε µεγάλη κλίµακα έρευνα στα πλαίσια του προγράµµατος, είναι η µείωση στα κόστη που σχετίζονται µε την αλληλουχία του DNA (DNA sequencing costs). Σύµφωνα µε τον [30], τα κόστη για την εύρεση της αλληλουχίας ενός γονιδιώµατος έφταναν τα 10.000 δολάρια περίπου (για το έτος 2001), παράγοντας περί τα 100GB συµπιεσµένα δεδοµένα. Χρησιµοποιώντας όµως το Apache Hadoop, τα συγκεκριµένα κόστη έφτασαν να είναι λιγότερα από 100 δολάρια [31]. Είναι

Page 11: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

ξεκάθαρα εποµένως τα οφέλη (π.χ. µείωση κόστους, εξισορρόπηση της σχέσης κόστους και ποιότητας, κ.λπ.) από τη χρήση των νέων τεχνολογιών, όπως τα Big Data.

Το Healthx παρέχει λύσεις σε διαδικτυακό (web-based) περιβάλλον, βασισµένες σε υπολογιστικό νέφος, για εγγραφές, διαχείριση απαιτήσεων και άλλα θέµατα επιχειρηµατικής ευφυΐας εταιριών του χώρου της υγείας [32]. Μεταξύ των πελατών της εταιρίας συγκαταλέγονται σηµαντικοί φορείς, όπως το Medicare, το Medicaid, κ.ά. Η πλατφόρµα του Healthx µπορεί και µετατρέπει κατάλληλα τα δεδοµένα (π.χ. απαιτήσεις, πληροφορίες συνταγογράφησης, ιατρούς, πληρωµές, κ.ά.) που µπορεί να προέρχονται από ανόµοια συστήµατα, προκειµένου να εισαχθούν και να εµφανιστούν στην δικτυακή πύλη, χρησιµοποιώντας το Apache Cassandra µε το Hadoop.

Μια εταιρία τεχνοβλαστός (spinoff) του Cleveland Clinic των ΗΠΑ, η Explorys, ασχολείται µε την χρησιµοποίηση των Big Data για την βελτίωση των υπηρεσιών υγείας, προφέροντας µια πλατφόρµα διαχείρισης της αποδοτικότητας βασισµένη στο υπολογιστικό νέφος, η οποία συνοδεύεται από µια από τις µεγαλύτερες βάσεις δεδοµένων παγκοσµίως [33]. Η συγκεκριµένη βάση δεδοµένων εµπεριέχει πληροφορίες σχετικά µε ιατρικά οργανωτικά και οικονοµικά δεδοµένα από διαφορετικές πηγές. Η πλατφόρµα Explorys EPM (Enterprise Performance Management) Suite αποτελεί επί τοις ουσίας µια λύση Software-as-a-Service (SaaS) βασισµένη στο Cloudera, ώστε να διευκολύνει την ταχεία διαχείριση, τη µέτρηση των επιδόσεων και την αποτελεσµατική εµπλοκή και ευαισθητοποίηση των ασθενών και των παρόχων. Στους πελάτες της συγκαταλέγονται 14 ολοκληρωµένα συστήµατα υγειονοµικής περίθαλψης, όπως αυτό του ίδιου του Cleveland Clinic, του Trinity Health, του Medstar, του Catholic Health Partners, κ.ά. Η εταιρεία επιτρέπει στους παρόχους να διερευνήσουν πληθυσµούς ασθενών και συστηµάτων φροντίδας υγείας προκειµένου να εντοπίσουν τάσεις ασθενειών, να µετρήσουν την αποδοτικότητά τους, κ.λπ. Ένα παράδειγµα από τη χρήση της αποτελεί η συνεργασία µε το Catholic Health Partners στο Cincinnati των ΗΠΑ, όπου το Explorys συνέβαλε στην αύξηση των ποσοστών εµβολιασµού πνευµονίας κατά 14%, στην παρακολούθηση του καρκίνου του µαστού κατά 13% και στην αύξηση των ελέγχων για HbA1c των διαβητικών κατά 3%. Μια άλλη µελέτη [34] αναφέρει ότι χρησιµοποιώντας τα κατάλληλα τεχνολογικά εργαλεία πληροφορικής και δεδοµένα από τους ΗΦΥ είναι δυνατή η διενέργεια πολύ µεγάλης κλίµακας µελετών µε ελάχιστους πόρους. Η συγκεκριµένη έρευνα χρησιµοποιεί την προσφερόµενη λύση του Explorys, αναζητώντας πληροφορίες σε 959.030 φακέλους ασθενών από διαφορετικές πηγές, και επέτρεψε στους ιατρούς, µόλις σε πέντε ηµέρες περίπου να εντοπίσουν αυτούς µε υψηλό κίνδυνο για θρόµβο στα αγγεία και τους πνεύµονες, όταν η ίδια έρευνα θα έπαιρνε αρκετά χρόνια µε τις παραδοσιακές τεχνολογίες και µεθόδους.

Η Humedica παρέχει µια λύση βασισµένη στο υπολογιστικό νέφος για εταιρίες στο χώρο της υγείας προκειµένου να λαµβάνουν καλύτερες αποφάσεις µέσω της γνώσης και των πληροφοριών που προέρχεται από διάσπαρτα αδόµητα πολλές φορές δεδοµένα. Διαθέτει µια από τις πλέον ολοκληρωµένες κλινικές βάσεις δεδοµένων µε δεδοµένα από 25 εκατοµµύρια ασθενείς από 30 πολιτείες των ΗΠΑ [35]. Έτσι είναι δυνατή η αναδροµική ανάλυση και η σύγκριση µε έναν µεγάλο δείγµα πληθυσµού, το οποίο καλύπτει τις περισσότερες περιοχές ενδιαφέροντος, όπως εξωτερικούς και εσωτερικούς ασθενείς. Η Humedica συλλέγει κλινικά δεδοµένα σε σχέση µε φάρµακα, αποτελέσµατα εξετάσεων, δηµογραφικά στοιχεία, επισκέψεις σε νοσοκοµεία, σηµειώσεις ιατρών, κ.ά. Δύο σηµαντικοί φορείς, το Cornerstone Health Care (αποτελούµενο από 300 ιατρούς και άλλους επαγγελµατίες υγείας από 80 περιοχές στην North Carolina) και το Mid-Hudson Medical Group χρησιµοποιούν την συγκεκριµένη πλατφόρµα προκειµένου να λαµβάνουν πιο έγκυρες αποφάσεις. Το Cornerstone Health Care προσπαθεί να πιστοποιηθεί από την αρµόδια επιτροπή διασφάλισης ποιότητας (National Committee for Quality Assurance - NCQA) για την κατ’ οίκον φροντίδα. Στα πλαίσια αυτά χρησιµοποιεί την πλατφόρµα Humedica MinedShare για ανάλυση του όγκου των δεδοµένων προκειµένου να ανιχνεύσει τους ασθενείς µε κίνδυνο διαβήτη και να προσδιορίσει την κλινική οµάδα για περαιτέρω παρακολούθηση. Το Mid-Hudson Medical Group, είναι µια δοµή µε 125 ιατρούς στη Νέα Υόρκη, όπου προσφέρει υπηρεσίες φροντίδας υγείας στους ασθενείς µε επικεφαλή έναν προσωπικό ιατρό για κάθε ασθενή, ο οποίος παρέχει συνεχή και συντονισµένη φροντίδα καθ’ όλη τη διάρκεια της ζωής του ασθενούς σε συνεργασία µε τους συναδέλφους του. Για να βελτιώσει όµως τις υπηρεσίες της κατ’ οίκον φροντίδας, το Mid-Hudson χρειάζεται περισσότερες πληροφορίες, ώστε να µπορεί να συγκρίνει τις πρακτικές του και τα αποτελέσµατά του σε σχέση µε τις βέλτιστες πρακτικές. Για το σκοπό αυτό, χρησιµοποιεί το Humedica MinedShare, ώστε να υποστηρίξει την διαχείριση της υγείας του πληθυσµού του και να βελτιώνει συνεχώς την ποιότητα και το κόστος. Μέσω αυτού του συστήµατος, πέτυχε τελικά να εξάγει δεδοµένα για τους

Page 12: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

διαβητικούς ασθενείς και να καθορίσει ποιοι ασθενείς είχαν HgA1c πάνω από 7% κατά την τελευταία επίσκεψη και οι οποίοι δεν είχαν επισκεφτεί κάποιον ιατρό για τους τελευταίους 12 µήνες. Έτσι, κατάφερε να αποκτήσει πιστοποίηση σε επίπεδο 3 από την αρµόδια επιτροπή (NCQA).

To University of Pittsburgh Medical Center (UPMC) επένδυσε 100 εκατοµµύρια δολάρια για την δηµιουργία µιας βάσης δεδοµένων η οποία συγκεντρώνει περί τα 3,2 petabytes δεδοµένα από 200 διαφορετικές πηγές, µεταξύ των οποίων συγκαταλέγονται και το ίδιο το UPMC, το UPMC Health Plan, κ.ά. [36]. Για την εκµετάλλευση αυτών των δεδοµένων χρησιµοποιεί την πλατφόρµα Oracle Exadata Database Machine, την Oracle Enterprise Healthcare Analytics, το Oracle Health Sciences Network, το Oracle Fusion Analytics και άλλα εργαλεία της Oracle. Για την επιχειρηµατική ευφυΐα και την διαχείριση των οικονοµικών δεδοµένων χρησιµοποιεί το λογισµικό Cognos της IBM, ενώ για την ενσωµάτωση των δεδοµένων την πλατφόρµα της Informatica και για την διαλειτουργικότητα µεταξύ φακέλων υγείας και την ανταλλαγή πληροφοριών την πλατφόρµα dbMotion. Ένας βασικός στόχος της προσπάθειας αυτής, είναι οι ασθενείς µε προβλήµατα στους νεφρούς που µπορεί να οδηγήσουν σε νεφρική ανεπάρκεια. Για το σκοπό αυτό παρακολουθεί τα εργαστηριακά αποτελέσµατα και τις πιθανές αλλαγές στις µετρήσεις τους. Παράλληλα, εστιάζεται και σε ασθενείς µε καρκίνο του µαστού προσπαθώντας να διερευνήσει την καλύτερη δυνατή εξατοµικευµένη θεραπεία ανάλογα µε τις γενετικές και κλινικές πληροφορίες του ασθενή. Αυτό επιτυγχάνεται µε τη χρήση των κατάλληλων εργαλείων ανάλυσης των δεδοµένων που έχουν συλλεχθεί.

Το University of California εργάζεται σε ένα έργο, µε προϋπολογισµό 10,5 εκατοµµύρια δολάρια, σχετικά µε γενετικές πληροφορίες για τον καρκίνο, προκειµένου να βοηθήσει τους επιστήµονες να αναγνωρίσουν καρκινικά µόρια. Το University of Ontario Institute of Technology (UOIT) χρησιµοποιεί την πλατφόρµα της IBM για τα big data προκειµένου να συλλέξει και να αναλύει σε πραγµατικό χρόνο δεδοµένα από ιατρικά µηχανήµατα, να παράγει µηνύµατα στο προσωπικό του νοσοκοµείου για πιθανά προβλήµατα υγείας, προτού ακόµα οι ασθενείς εκδηλώσουν κλινικά συµπτώµατα της ασθένειας, κ.ά. Το Harvard Medical School χρησιµοποιεί την πλατφόρµα της IBM για τα big data για µελέτες σε σχέση µε την αποτελεσµατικότητα των φαρµάκων και την ασφάλειά τους. Μια ακόµη συνεργασία του Memorial Sloan-Kettering Cancer Center (MSKCC) της Νέας Υόρκης µε την IBM, εκµεταλλεύεται τον υπερ-υπολογιστή Watson της τελευταίας, προκειµένου να αναλύει τα big data ώστε να βοηθήσει τους ογκολόγους του κέντρου να παρέχουν τις βέλτιστες δυνατές υπηρεσίες φροντίδας υγείας προς τους ασθενείς τους. Ο συγκεκριµένος υπερ-υπολογιστής έχει µεγάλη υπολογιστική ισχύ και παρέχει την δυνατότητα ανάλυσης εκατοµµυρίων σελίδων αδόµητων κειµένων από φακέλους ασθενών, από την βιβλιογραφία, κ.ο.κ., προκειµένου να παρέχει τις δυνατόν καλύτερες απαντήσεις σε ερωτήµατα και αναζητήσεις σχετικά µε την θεραπεία ασθενών. Μπορεί επίσης να κατανοεί τον φυσικό λόγο των κλινικών ερωτήσεων και να τον συσχετίζει µε το θεωρητικό υπόβαθρο, χρησιµοποιώντας εξελιγµένες τεχνικές και αλγορίθµους. Απώτερος στόχος της προσπάθειας είναι η δηµιουργία ενός ευφυούς συστήµατος, το οποίο θα προτείνει συγκεκριµένα διαγνωστικά τεστ και θεραπείες ανάλογα µε την πάθηση και τον ασθενή. Το University of Texas MD Anderson Cancer Center χρησιµοποιεί και αυτό τον Watson για να βοηθάει τους κλινικούς ιατρούς να ανακαλύπτουν πολύτιµες πληροφορίες και γνώσεις από την βάση δεδοµένων του ίδιου του νοσοκοµείου και άλλων ερευνητικών προσπαθειών.

Μια πληθώρα από ερευνητικά έργα χρηµατοδοτούνται επίσης από την Ευρωπαϊκή Επιτροπή. Για παράδειγµα, το έργο NEWMEDS-Novel Methods leading to New Medications in Depression and Schizophrenia ερευνά νέες µεθόδους για την ανάπτυξη φαρµάκων για την σχιζοφρένεια και την κατάθλιψη [37]. Για το σκοπό αυτό αναπτύσσει νέα µοντέλα σε ζώα χρησιµοποιώντας κατάλληλα τεστ και καταγραφές από τον εγκέφαλό τους, ενώ παράλληλα ερευνά τεχνικές ανάλυσης για την εφαρµογή PET και fMRI, καθώς και τις τελευταίες εξελίξεις από τον τοµέα της γενετικής (π.χ. αντιγραφή, αποκοπή ή αλλαγή γονιδίων) σε σχέση µε τις αντιδράσεις των γονιδίων σε διάφορα φάρµακα. Η κοινοπραξία του έργου αποτελείται από ακαδηµαϊκούς φορείς (π.χ. King’s College London, Karolinska Institutet, University of Cambridge, Central Institute of Mental Health-Mannheim, Instituto de Investigaciones Biomedicas de Barcelona, University of Manchester, Bar Ilan University) και πολύ γνωστές εταιρίες, όπως η AstraZeneca, η Eli Lilly, η Janssen Pharmaceutica, η Lundbeck A/S, η Novartis, η Orion, η Pfizer, η Roche, η Servier και η Abbott.

Το ερευνητικό έργο PharmaCog, µε προϋπολογισµό 27,7 εκατοµµύρια ευρώ, χρησιµοποιεί τα big data για την επιτάχυνση της ανακάλυψης νέων φαρµάκων για το Alzheimer [38]. Η American Society of Clinical Oncology τρέχει το έργο CancerLinQ για την συλλογή γνώσεων στον τοµέα του καρκίνου. Το CancerLinQ

Page 13: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

είναι ένα δίκτυο υπολογιστών που προσπαθεί να αποκρυπτογραφήσει σηµαντικό όγκο δεδοµένων από φακέλους ασθενών που βρίσκονται σε διαφορετικούς εξυπηρετητές και αρχεία και αναµένεται να χρηµατοδοτηθεί µε περί τα 80 εκατοµµύρια δολάρια στα επόµενα πέντε χρόνια.

Μια συνεργασία των National Institute of Health (NIH), IBM Research, Sutter Health και Geisinger Health System, αναπτύσσει νέες µεθόδους για την πρώιµη διάγνωση καρδιακών παθήσεων, εκµεταλλευόµενο τις τελευταίες εξελίξεις στην ανάλυση δεδοµένων. Σκοπός είναι να εξευρεθούν οικονοµικά αποδοτικές λύσεις, που θα µπορούν να χρησιµοποιηθούν στην πρωτοβάθµια φροντίδα υγείας, σε συνδυασµό µε τα δεδοµένα από τους φακέλους των ασθενών.

Το Stanford University µε την εταιρία SAP και το National Center for Tumor Diseases in Heidelberg, χρησιµοποιούν την πλατφόρµα HANA Healthcare Platform της SAP προκειµένου να παρέχουν στους ενδιαφερόµενους βιολογικά, κλινικά και σχετικά µε τον τρόπο ζωής δεδοµένα µε στόχο την παροχή εξατοµικευµένων υπηρεσιών υγείας. Η ίδια πλατφόρµα χρησιµοποιείται και από το Stanford School of Medicine για ανάλυση σε πραγµατικό χρόνο δεδοµένων, προκειµένου να ανακαλυφθούν παραλλαγές σε γενετικό υλικό που µπορεί να επηρεάζουν την υγεία του πληθυσµού. Το έργο στοχεύει στον αυτισµό ή Διάχυτη Αναπτυξιακή Διαταραχή (ΔΑΔ) και σε καρδιαγγειακές ασθένειες.

Το DC-NET, ένα δίκτυο στην πολιτεία της Columbia, µαζί µε δύο φορείς του George Washington University (το Capital Area Advanced Research & Education Network (CAAREN) και το Medical Center’s Division of Genomic Medicine), ερευνούν θέµατα και τεχνικές για την ανάλυση της αλληλουχίας του γονιδιώµατος, µέσω της εκµετάλλευσης των αποθηκευµένων δεδοµένων της τάξης των terabytes που διαθέτουν.

Μια ακόµη προσπάθεια ερευνά τη χρήση των big data, προκειµένου να προβλέπει έγκαιρα πανδηµίες προτού καν συµβούν. Για το σκοπό αυτό το Office of Science and Technology Policy’s (OSTP) προωθεί συνεργασίες µεταξύ κυβερνητικών φορέων, της ακαδηµαϊκής κοινότητας, εταιριών, κ.ο.κ., ώστε µε τη χρήση των κατάλληλων τεχνολογιών (π.χ. αισθητήρων) και δικτύων παρατήρησης, να δύναται να συνδυάζει τα συλλεχθέντα δεδοµένα, προκειµένου να χρησιµοποιεί στη συνέχεια κατάλληλες τεχνικές για την ανάλυσή τους.

Τέλος, προς την γενικότερη κατεύθυνση και προς εκµετάλλευση της διάσπαρτα διάχυτης γνώσης, οι MedRed και BT εργάζονται για να δηµιουργήσουν το MedRed BT Health Cloud (MBHC), ώστε να διευκολύνουν την ενσωµάτωση και διάχυση ανοικτών δεδοµένων υγείας.

3. Visual Analytics Η συλλογή του τεράστιου όγκου των δεδοµένων στην υγεία σε συνδυασµό µε την ποικιλοµορφία τους και τις ιδιαιτερότητες που αναφέρθηκαν στις προηγούµενες ενότητες, αναδεικνύουν ένα ακόµη σηµαντικό πρόβληµα στην επεξεργασία τους. Το πρόβληµα αυτό αφορά την κατάλληλη απεικόνιση των αποτελεσµάτων προκειµένου να είναι άµεσα κατανοητά και να βοηθούν τους ενδιαφερόµενους για την εξαγωγή των πολύτιµων συµπερασµάτων. Ο τοµέας της Οπτικής Αναλυτικής ή Visual Analytics απασχολείται µε αυτό ακριβώς το αντικείµενο, ήτοι την ορθή παρουσίαση των αποτελεσµάτων από την επεξεργασία και ανάλυση τεράστιου όγκου δεδοµένων. Ουσιαστικά αφορά την αναλυτική συλλογιστική η οποία διευκολύνεται από προηγµένες γραφικές διεπαφές µε αυξηµένη αλληλεπίδραση [39]. Ενώ η δυνατότητα συλλογής και αποθήκευσης δεδοµένων αυξάνεται ραγδαία η εκµετάλλευση και η ανάλυση των τεράστιων όγκων δεδοµένων έχουν καταστεί εξαιρετικά δύσκολες. Αυτό το κενό οδηγεί σε νέες προκλήσεις στην αναλυτική διαδικασία, καθώς οι αναλυτές, οι υπεύθυνοι για λήψη αποφάσεων, κ.ά., εξαρτώνται άµεσα από την γνώση που είναι κρυµµένη στα δεδοµένα. Ο τοµέας της οπτικής αναλυτικής απασχολείται συστηµατικά µε την επεξεργασία αυτών των µαζικών, ετερογενών και δυναµικών όγκων πληροφορίας ενσωµατώνοντας στην αναλυτική διαδικασία την ανθρώπινη κρίση µε την βοήθεια οπτικών αναπαραστάσεων και τεχνικών αλληλεπίδρασης. Τα εργαλεία και οι τεχνικές της οπτικοποίησης (visualization), δηλαδή της απλής οπτικής αναπαράστασης δεδοµένων υστερούν σήµερα συγκριτικά µε τους µεγάλους όγκους δεδοµένων και τις πολύπλοκες δοµές. Αυτό συµβαίνει διότι το βασικό εργαλείο ανάλυσης στην οπτική εξερεύνηση και ανάλυση είναι το ανθρώπινο µυαλό. Ο στόχος του ανθρώπινου µυαλού είναι η αντίληψη και η ανεύρεση της σχετικής

Page 14: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

πληροφορίας, «η ανίχνευση των αναµενόµενων και η ανακάλυψη των απροσδόκητων», ενώ ο στόχος της οπτικοποίησης, όπως έχει οριστεί, είναι «να καταστήσει την πληροφορία αντιληπτή στο µυαλό ή τη φαντασία». Το ανθρώπινο µυαλό όµως έχει φυσικούς περιορισµούς ως προς το µέγεθος της πληροφορίας που µπορεί να αντιληφθεί αποτελεσµατικά. Εποµένως, είναι συχνά αδύνατον να οπτικοποιήσουµε όλα τα δεδοµένα που χρειάζονται να αναλυθούν σε τέτοιο βαθµό, που ο αναλυτής να µπορέσει να τα αντιληφθεί, χωρίς να επέλθουν ουσιαστικές απώλειες. Ένα παράδειγµα εφαρµογής της οπτικής αναλυτικής στο χώρο της υγείας παρουσιάζεται στην Εικόνα 9.2 και 9.3.

Εικόνα 9.2 Visual Analytics (photo: από την πλατφόρµα της εταιρίας Information Builders).

Page 15: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

Εικόνα 9.3 Visual Analytics (photo: από την πλατφόρµα της εταιρίας SAS).

Μέσω της οπτικής αναλυτικής διευκολύνεται η αντιµετώπιση προβληµάτων που εµπεριέχουν υπερβολικό όγκο πληροφοριών και µεταβλητών, όπου ο ανθρώπινος νους να είναι εξαιρετικά δύσκολο να τα διαχειριστεί [40]. Για αυτό τον σκοπό συνδυάζουν κατάλληλες απεικονίσεις (δοµηµένων και µη δοµηµένων δεδοµένων, οποιουδήποτε τύπου δεδοµένων) µε τις ανάλογες διαδικασίες ανάλυσης (π.χ. στατιστική επεξεργασία, τεχνικές εξόρυξης δεδοµένων, κ.ά.), ώστε να διευκολύνεται η κατανόηση των αποτελεσµάτων, η εξαγωγή συµπερασµάτων, ο σχεδιασµός και η λήψη αποφάσεων. Η άµεση κατανόηση της παρελθούσας και τρέχουσας κατάστασης, σε συνδυασµό µε την παρακολούθηση των τάσεων και των επιλογών για το µέλλον και την ανίχνευση σηµαντικών σηµείων ή κινδύνων εξυπηρετεί την ανθρώπινη κρίση χωρίς την ανάγκη για χρονοβόρες διαδικασίες και αναλύσεις. Πρόσφατα προέκυψαν νέες τάσεις από την οπτική αναλυτική µεταξύ των οποίων η πιο σηµαντική είναι η ανάµειξη των τεχνικών οπτικοποίησης µε άλλες περιοχές όπως οι επιστήµες της γνώσης και της αντίληψης (cognitive and perceptual sciences), η στατιστική ανάλυση (statistical analysis), τα µαθηµατικά, η αναπαράσταση της γνώσης (knowledge representation), η εξόρυξη δεδοµένων (data mining) και τα συστήµατα γεωγραφικής πληροφορίας (Geographic Information Systems – GIS).

Στα πλαίσια αυτά, εµφανίζονται ολοένα και περισσότερες εφαρµογές οπτικής αναλυτικής στο χώρο της υγείας προκειµένου να εξυπηρετήσουν την ανάγκη για εκµετάλλευση των κλινικών βάσεων δεδοµένων και των big data. Οι West et al. [41] αναλύουν σε µια εκτενή επισκόπηση της βιβλιογραφίας τις τεχνικές απεικόνισης από το 1996 έως το 2013 προκειµένου να ανιχνεύσουν καινοτόµες προσεγγίσεις στην απεικόνιση πληροφοριών από ηλεκτρονικούς φακέλους υγείας για εξόρυξη γνώσης. Οι Shneiderman et al. [42] αναλύουν το πώς οι νέες µέθοδοι της οπτικής αναλυτικής µπορούν να βοηθήσουν τον χώρο της υγείας, παρουσιάζοντας ως παράδειγµα την εφαρµογή EventFlow του Oracle Health Sciences Institute που βοηθά στις έρευνες το

Page 16: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

University of Maryland προκειµένου να αναλύσουν εκατοµµύρια ηλεκτρονικών φακέλων υγείας. Οι Klimov et al. [43] µελετούν τεχνικές visual analytics για την διερεύνηση µοτίβων που µπορούν να προβλέψουν την νεφρική ανεπάρκεια σε ασθενείς µε διαβήτη τύπου ΙΙ. Οι Kamal et al. [44] υπερθεµατίζουν στον συνδυασµό των big data µε την οπτική αναλυτική ως καταλυτικό µέσον για την επιτυχή παροχή υπηρεσιών υγείας µε βελτιωµένα αποτελέσµατα και µειωµένα κόστη, ενώ οι Vaitsis et al. [45] αναφέρονται στη χρήση της οπτικής αναλυτικής για την ενίσχυση της εκπαίδευσης στην υγεία.

Η οπτική αναλυτική δεν είναι µία απλή οπτική αναπαράσταση των δεδοµένων αλλά µπορεί να θεωρηθεί µία ολοκληρωµένη προσέγγιση συνδυάζοντας την οπτική αναπαράσταση (visualization), τους ανθρώπινους παράγοντες (human factors) και την ανάλυση των δεδοµένων (data analysis). Σχετικά µε το πεδίο της οπτικής αναπαράστασης η οπτική αναλυτική ενσωµατώνει την µεθοδολογία από την αναλυτική της πληροφορίας (information analytics), την αναλυτική γεωχωρικών δεδοµένων (geospatial analytics) και την αναλυτική επιστηµονικών δεδοµένων (scientific analytics). Οι ανθρώπινοι παράγοντες όπως η αλληλεπίδραση (interaction), η γνώση (cognition), η αντίληψη (perception), η συνεργασία (collaboration), η παραγωγή (production), η παρουσίαση (presentation) και η διάχυση (dissemination) αποτελούν ένα ρόλο κλειδί τόσο στην επικοινωνία µεταξύ ανθρώπου και µηχανής όσο και στην διαδικασία της λήψης αποφάσεων. Σε αυτό το πλαίσιο ο όρος παραγωγή (production) ορίζεται σαν την δηµιουργία υλικών που συνοψίζουν τα αποτελέσµατα της αναλυτικής προσπάθειας, ο όρος παρουσίαση (presentation) είναι η συσκευασία αυτών των υλικών µε τέτοιο τρόπο που να βοηθά το ακροατήριο στην κατανόηση των αναλυτικών αποτελεσµάτων, χρησιµοποιώντας κατανοητή ορολογία και ο όρος διάχυση (dissemination) είναι η διεργασία της διανοµής αυτής της πληροφορίας µε το ακροατήριο (χρήστες). Τέλος, σχετικά µε το πεδίο της ανάλυσης των δεδοµένων η οπτική αναλυτική επωφελείται από τις µεθοδολογίες που έχουν αναπτυχθεί στα πεδία της διαχείρισης δεδοµένων (data management), της αναπαράστασης της γνώσης (knowledge representation), της ανακάλυψης της γνώσης (knowledge discovery) και της αναλυτικής στατιστικής (statistical analytics). Η διαδικασία της οπτικής αναλυτικής περιλαµβάνει την εφαρµογή µεθόδων αυτόµατης ανάλυσης πριν και µετά τη χρήση της διαδραστικής οπτικής αναπαράστασης των δεδοµένων. Αυτό οφείλεται κατ’ αρχάς στο γεγονός ότι τα παρόντα και ειδικά τα µελλοντικά σύνολα δεδοµένων είναι αφενός µεν πολύπλοκα και αφετέρου πολύ µεγάλα σε µέγεθος για να αναπαρασταθούν γραφικά.

Η οπτική ανάλυση δεδοµένων είναι µία διαδραστική διεργασία, που περιλαµβάνει την συλλογή της πληροφορίας, την επεξεργασία των δεδοµένων, την αναπαράσταση της γνώσης, την αλληλεπίδραση χρήστη-υπολογιστή και την λήψη αποφάσεων. Ο απώτερος σκοπός της είναι ο εντοπισµός του προβλήµατος ή της ιδέας που περιγράφεται σε ένα τεράστιο όγκο επιστηµονικών ή επιχειρηµατικών δεδοµένων, προερχόµενα συνήθως από ετερογενείς πηγές. Για την επίτευξη αυτού του σκοπού, η οπτική αναλυτική συνδυάζει τα πλεονεκτήµατα των υπολογιστών µε τη δύναµη της ανθρώπινης διανόησης. Ενώ µέθοδοι όπως η ανακάλυψη γνώσεων στις βάσεις δεδοµένων, η στατιστική και τα µαθηµατικά είναι η κινητήρια δύναµη στην αυτοµατοποιηµένη ανάλυση, οι δυνατότητες της σύλληψης, της συσχέτισης και του συµπεράσµατος, καθιστούν την οπτική αναλυτική ένα πολλά υποσχόµενο πεδίο έρευνας.

4. Συµπεράσµατα Όπως γίνεται αντιληπτό από τα όσα αναλύονται στις προηγούµενες ενότητες του παρόντος κεφαλαίου, οι τεχνολογίες των Big Data και Cloud Computing εµφανίζουν σηµαντικά πλεονεκτήµατα και δίνουν λύσεις σε µέχρι πρότινος άλυτα θέµατα, ενώ ταυτόχρονα ενισχύουν σηµαντικά τις ερευνητικές προσπάθειες των διαφόρων επιστηµόνων. Στον κλάδο της υγείας οι εφαρµογές είναι ήδη αρκετές και η ανάγκη για υιοθέτηση τέτοιων τεχνολογιών είναι πραγµατικά µεγάλη, µιας και τα δεδοµένα είναι υπερβολικά πολλά και µόνον µε τέτοιες τεχνολογίες δύναται κανείς να µπορέσει να εξορύξει την επιθυµητή γνώση που εµπεριέχουν.

Οι ίδιες οι τεχνολογίες του Cloud Computing και των Big Data ωθούν από την πλευρά τους τις εξελίξεις µιας και ανοίγουν νέους ορίζοντες για έρευνες µε πολλές νέες δυνατότητες. Στον τοµέα της υγείας, αναµένονται επενδύσεις σε cloud computing της τάξης των 9,48 δις δολαρίων το 2020 από 3,73 δις δολάρια που ανέρχονταν το 2015 [46]. Ταυτόχρονα, η παγκόσµια αγορά για ανάλυση δεδοµένων υγείας αναµένεται να φτάσει τα 18,7 δις δολάρια το 2020 από τα 5,8 δις δολάρια που ήταν το 2015. Παράγοντες όπως η ανάγκη για περαιτέρω µείωση των εξόδων υγείας, η χρήση κινήτρων για ουσιαστική χρήση των πόρων, η τεχνολογία των

Page 17: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

big data και η αύξηση των επενδύσεων στον τοµέα, ενισχύουν ακόµη περισσότερο την αγορά της ανάλυσης των δεδοµένων υγείας. Ταυτόχρονα όµως, το κενό µεταξύ πληρωτών (π.χ. ασφαλιστικών ταµείων, κ.λπ.) και παρόχων (π.χ. νοσοκοµεία, κ.λπ.), τα υψηλά ακόµη κόστη για ανάλυση δεδοµένων και η έλλειψη προσωπικού µε τις απαιτούµενες δεξιότητες, αντιστέκονται σε αυτή την αύξηση της συγκεκριµένης αγοράς [47]. Η χρήση των µεγάλων δεδοµένων (big data) στο χώρο της υγείας µπορεί να βοηθήσει πραγµατικά τον τοµέα της υγείας. Πιο συγκεκριµένα, η χρήση των νέων τεχνικών ανάλυσης (big data analytics) των συλλεχθέντων δεδοµένων µπορεί:

• να βελτιώσει την ποιότητα των παρεχόµενων υπηρεσιών υγείας·

o όλοι οι εµπλεκόµενοι (ασθενείς και επαγγελµατίες υγείας) µπορούν να έχουν πρόσβαση στην επιθυµητή γνώση ώστε να λαµβάνουν καλύτερες αποφάσεις,

o οι ασθενείς θα µπορούν να ενεργούν έγκαιρα και να αλλάζουν τον τρόπο ζωής τους ώστε να αποφευχθούν τυχόν σηµαντικά προβλήµατα υγείας,

o η συλλογή των δεδοµένων από διαφορετικές πηγές µε ένα οµοιόµορφο και συγκρίσιµο τρόπο µπορεί να παρέχει σηµαντικές γνώσεις σχετικά µε την εξάπλωση των ασθενειών, κ.ά.,

o η ικανότητα εξόρυξης δεδοµένων από διαφορετικές πηγές ενισχύει την έρευνα για την εύρεση νέων θεραπειών,

o οι πάροχοι θα µπορούν να εντοπίζουν πληθυσµούς υψηλού κινδύνου και να προσφέρουν τις απαιτούµενες υπηρεσίες πρόληψης,

o θα υπάρχει µεγαλύτερη ικανοποίηση των ασθενών, o δίνει την δυνατότητα για παροχή εξατοµικευµένων υπηρεσιών φροντίδας υγείας, ενώ

διευκολύνει σηµαντικά τον σχεδιασµό νέων φαρµάκων και την διεξαγωγή των απαιτούµενων κλινικών δοκιµών·

• να βελτιώσει την αποτελεσµατικότητα και την παραγωγικότητα· o µείωση του κόστους της υγειονοµικής περίθαλψης, εντοπίζοντας τις πηγές που

δηµιουργούν ανεξέλεγκτες ή υψηλές δαπάνες, o παρακολούθηση των πόρων (π.χ. φάρµακα, αναλώσιµα κ.λπ.) που καταναλώνονται, o επιτρέπει την σύγκριση της παραγωγικότητας και της αποτελεσµατικότητας των

επαγγελµατιών του τοµέα σε σχέση µε άλλους συναδέλφους τους, o βοηθά στον εντοπισµό τυχόν αντιφάσεων στον τρόπο παροχής της περίθαλψης, o επιτρέπει την ιατρική βασισµένη σε γεγονότα (evidence-based medicine), o ξεπερνά το πρόβληµα της έλλειψης διαλειτουργικότητας, o µειώνει τα έξοδα προµηθειών µέσω της υιοθέτησης της βέλτιστης στρατηγικής, o βελτιστοποιεί τον σχεδιασµό σε επίπεδο πολιτικής υγείας, όπως οι ανάγκες για

ανθρώπινο δυναµικό, κ.λπ.

Η αυξανόµενη υιοθέτηση των ηλεκτρονικών φακέλων υγείας, των PACS, των LIS, κ.λπ., από τους παρόχους υπηρεσιών υγείας, προωθεί την ψηφιακή συλλογή των δεδοµένων στο χώρο. Οι τεχνικές ανάλυσης των big data φαίνεται να µπορούν να βελτιώσουν το χαοτικό περιβάλλον της υγείας. Ταυτόχρονα, η νέα τάση για «ανοικτά δεδοµένα» που αναπτύσσεται, ανοίγει νέους ορίζοντες. Ως «ανοικτά δεδοµένα» ορίζονται τα δεδοµένα που είναι διαθέσιµα στο κοινό, χωρίς κόστος, προκειµένου να τα χρησιµοποιήσει όπως νοµίζει, να τα αναδηµοσιεύσει χωρίς προβλήµατα πνευµατικής ιδιοκτησίας, κ.λπ. [48]. Φυσικά, οι προκλήσεις είναι πολλές (νοµικές, τεχνικές, κοινωνικές, κ.ά.), τα οφέλη ωστόσο είναι σηµαντικά για τους πολίτες, τους ασθενείς και το σύστηµα υγείας.

Τα ολοένα και αυξανόµενα κόστη για την παροχή υπηρεσιών υγείας, συνοδευόµενα από την γήρανση του πληθυσµού, αποτελούν σηµαντικούς σκοπέλους για το µέλλον της υγείας σε παγκόσµιο επίπεδο [49]. Η Ευρώπη θα είναι από τις πρώτες που θα αντιµετωπίσουν τις συγκεκριµένες δυσκολίες (το 21% του πληθυσµού θα είναι µεγαλύτεροι από 60 ετών το 2050). Οι νέες τεχνολογικές εφαρµογές, όπως η mHealth, η τηλεϊατρική, κ.λπ., επιτρέπουν την καλύτερη αντιµετώπιση των ανωτέρω παραγόντων, αλλά και των ολοένα αυξανόµενων χρόνιων ασθενειών και του τρόπου ζωής που ακολουθεί ο σύγχρονος άνθρωπος (π.χ. κάπνισµα, ελάχιστη φυσική δραστηριότητα, κ.λπ.). Αυτό όµως οδηγεί στην παραγωγή και συλλογή ακόµη περισσότερων δεδοµένων (από αισθητήρια, από την παρακολούθηση ασθενών κατ’ οίκον ή εν κινήσει,

Page 18: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

κ.ο.κ.). Η ικανότητα εποµένως ανάλυσης αυτού του τεράστιου πραγµατικά όγκου δεδοµένων, αποτελεί µοναδική ευκαιρία για πρόοδο. Σύµφωνα µε µια µελέτη [8], ο όγκος των δεδοµένων αναµένεται να φτάσει τα 35 zettabytes το 2020, κάτι που σηµαίνει 44 φορές µεγαλύτερος από το 2009.

Ζούµε στην εποχή των δεδοµένων, όπου απίστευτα µεγάλες ποσότητες από αυτά παράγονται κάθε δευτερόλεπτο γύρω µας. Η δυνατότητα σύγκρισης και ανάλυσής των, θα µπορούσε να δώσει µεγάλη ώθηση στις καινοτοµίες σε κάθε κλάδο. Η σηµαντικότητά τους γίνεται άµεσα αντιληπτή και από τις πρωτοβουλίες των χωρών. Για παράδειγµα, οι ΗΠΑ προωθούν πληθώρα έργων στον τοµέα των big data, τόσο στον ιδιωτικό όσο και στον δηµόσιο τοµέα, µέσω του White House Office of Science and Technology Policy (OSTP) [50] και του Networking and Information Technology R&D program (NITRD) [51]. Στα ίδια πλαίσια, πραγµατοποιήθηκε και η εκδήλωση µε τίτλο “Data to Knowledge Action” [52] η οποία αφορούσε την εκµετάλλευση των δεδοµένων σε διαφορετικούς χώρους (την υγεία, την οικονοµία, κ.ο.κ.) µε επενδύσεις της τάξης των 200 εκατοµµυρίων δολαρίων, ως επακόλουθο του Obama Administration's Big Data Initiative που ξεκίνησε το 2012. Στο ίδιο µήκος κύµατος, η Ευρωπαϊκή Ένωση προωθεί καλύτερους µηχανισµούς εκµετάλλευσης των δεδοµένων της υγείας µε την έκδοση οδηγιών και συστάσεων για την βελτίωση της ποιότητας και την πρόσβαση στις πληροφορίες υγείας [53].

Η ανάγκη για αξιοποίηση των διάσπαρτων πληροφοριών είναι πασιφανής. Τα προβλήµατα όµως είναι εξίσου έκδηλα. Για παράδειγµα, θέµατα ιδιωτικότητας, προστασίας προσωπικών δεδοµένων, διαλειτουργικότητας συστηµάτων, ετερογένειας των δεδοµένων, κ.ά. Όσο επίσης αυξάνει ο όγκος των δεδοµένων τόσο πιο δύσκολο είναι να τα αντιµετωπίσει κανείς κατάλληλα. Σύµφωνα µε τους κανονισµούς των HIPAA (Health Information Portability and Accountability Act) και HITECH (Health Information Technology for Economic and Clinical Health), κάθε πάροχος υπηρεσιών υγείας θα πρέπει να διαλέγει πολύ προσεκτικά τους συνεργάτες του, όπως για παράδειγµα τους παρόχους υπηρεσιών υπολογιστικού νέφους. Οι πάροχοι υπηρεσιών υπολογιστικού νέφους θα πρέπει επίσης να υπογράφουν ένα συµφωνητικό σύµφωνα µε τις οδηγίες των HIPAA-HITECH, προκειµένου να διασφαλίζεται η ορθή αντιµετώπιση των δεδοµένων υγείας. Οι ενέργειες και οδηγίες των HIPPA-HITECH αφορούν, µεταξύ άλλων, τα θέµατα των ευαίσθητων δεδοµένων του χώρου της υγείας. Λόγω της σηµαντικότητας της χρήσης των παραγόµενων δεδοµένων, στις ΗΠΑ δίνονται οικονοµικά κίνητρα για την ορθή χρήση της τεχνολογίας (π.χ. χρήση ηλεκτρονικών φακέλων υγείας, κ.ά.) [54]. Για το λόγο αυτό, πολλοί πάροχοι υπηρεσιών υγείας στρέφονται στη χρήση τεχνολογιών υπολογιστικού νέφους προκειµένου να µπορούν να αποθηκεύουν τα δεδοµένα τους αποµακρυσµένα και να πληρώνουν ανάλογα τη χρήση, χωρίς τα προβλήµατα συντήρησης, αγοράς, απαξίωσης εξοπλισµού, κ.ο.κ. Θα πρέπει όµως, σε κάθε περίπτωση, να διασφαλίζεται πως τα δεδοµένα είναι ασφαλή και διαχειρίζονται µε τον τρόπο που προστάζει η HIPAA [55] και η HITECH Act. Το Department of Health and Human Services των ΗΠΑ, δίνοντας έµφαση σε αυτά τα θέµατα, εξέδωσε µια νέα τροποποίηση σχετικά µε τα θέµατα ασφάλειας και ιδιωτικότητας για τα δεδοµένα της υγείας [56]. Η πιο διαδεδοµένη εφαρµογή του Cloud Computing στην υγεία βασίζεται στο µοντέλο SaaS (Software as a Service), το οποίο έχουν υιοθετήσει αρκετά σηµαντικές εταιρίες του χώρου, όπως η GE Healthcare και η Agfa Healthcare από την Ευρώπη και οι CareCloud, Carestream Health και Merge Healthcare από τις ΗΠΑ.

Για την αντιµετώπιση των σύγχρονων προκλήσεων στο χώρο της υγείας απαιτούνται ριζικές αλλαγές σε χάραξη στρατηγικής, πολιτικής υγείας, µε την ταυτόχρονη υιοθέτηση των τελευταίων τεχνολογικών λύσεων. Η ενδυνάµωση των ασθενών και η συµµετοχή τους στην διατήρηση της υγείας τους είναι εξαιρετικά σηµαντική. Η παρακολούθηση υγειών πολιτών και ασθενών σε πραγµατικό χρόνο, µπορεί να επιτρέψει την βελτίωση των παρεχόµενων υπηρεσιών φροντίδας υγείας µε την ταυτόχρονη µείωση των εξόδων για το ίδιο το σύστηµα υγείας. Οι τεχνολογίες (π.χ. τηλεϊατρική, mHealth, κ.ά.) επιτρέπουν πλέον την υπερπήδηση του φράγµατος του χώρου και του χρόνου. Οι πληροφορίες θα πρέπει να ακολουθούν τον ασθενή όπου και αν βρίσκεται. Η παροχή εξατοµικευµένης φροντίδας έγκειται κατά βάση στις διαθέσιµες πληροφορίες, ενώ η δηµιουργία νέων θεραπειών και φαρµάκων βασίζονται στην µελέτη των διαθέσιµων, αλλά διάσπαρτων και ετερογενών δεδοµένων υγείας. Η εφαρµογή εποµένως τεχνικών και τεχνολογιών Big Data µπορεί να αποτελέσει το κλειδί για το επόµενο µεγάλο βήµα. Ο συνδυασµός Big Data και Cloud Computing µπορεί να µας φέρει ένα βήµα πιο κοντά στον επιθυµητό στόχο, µε πολλά οφέλη για όλους τους εµπλεκόµενους στο χώρο της υγείας (π.χ. ασφαλιστικά ταµεία, ασθενείς, επαγγελµατίες υγείας, κ.ο.κ.), αρκεί να υπάρχει ξεκάθαρη στρατηγική. Η πρόκληση είναι η ορθή χρήση των δεδοµένων χωρίς διαπραγµάτευση στην ποιότητα των παρεχόµενων υπηρεσιών και µε ασφαλή τρόπο.

Page 19: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

Βιβλιογραφικές Αναφορές Κεφαλαίου

[1] Ι. Κουµπούρος, Τεχνολογίες Πληροφοριών και Επικοινωνίας & Κοινωνία, Εκδόσεις Νέων Τεχνολογιών,

1η Έκδοση, ISBN: 978-960-6759-73-4, 2012, σσ. 816.

[2] Frost & Sullivan, “U.S. Hospital Health Data Analytics Market: Growing EHR Adoption Fuels A New Era in Analytics”, 2012. [Online]. Available: http://www.frost.com/c/10046/sublib/display-report.do?id=NA03-01-00-00-00. [Accessed: 18 November 2013].

[3] Y. Koumpouros, “Big Data in Healthcare” in Cloud Computing Applications for Quality Health Care Delivery, IGI Global Publishing, 2014, ISBN: 978-1-4666-6118-9.

[4] “Healthcare IT Q1 2013 Funding and M&A Report”, (n.d.), MERCOM Capital Group.

[5] K. Terry, “Health IT Startups Make VCs Swoon”, 2013. [Online]. Available: http://www.informationweek.com/healthcare/leadership/health-it-startups-make-vcs-swoon/240147655. [Accessed: 2 December 2013].

[6] GÉANT, (n.d.), [Online]. Available: http://www.geant.net. [Accessed: 5 December 2013].

[7] European Commission, ESFRI, In Research & Innovation Infrastructures. [Online]. Available: http://ec.europa.eu/research/infrastructures/index_en.cfm?pg=esfri. [Accessed: 1 December 2013].

[8] J. Manyika, M. Chui, B. Brown, J. Bughin, R. Dobbs, C. Roxburgh, et al. , Big data: The next frontier for innovation, competition, and productivity, McKinsey Global Institute. 2013, USA: McKinsey & Company.

[9] P. Groves, B. Kayyali, D. Knott, S.Van Kuiken, The 'big data' revolution in healthcare. Accelerating value and innovation, , 2013, USA: McKinsey & Company.

[10] NASSCOM, (2012), “Big Data. The Next Big Thing”, New Delhi - India: NASSCOM.

[11] IBM, (n.d.), “InfoSphere Platform”, [Online]. Available: http://www-01.ibm.com/software/data/infosphere/. [Accessed: 12 April 2015].

[12] Mongodb.com, “MongoDB, Inc. Homepage”, 2015. [Online]. Available: www.mongodb.com. [Accessed: 12 April 2015].

[13] Couchbase.com, “COUCHBASE, Homepage” 2015. [Online]. Available: www.couchbase.com. [Accessed: 12 April 2015].

[14] Aws.amazon.com, “Amazon Web Services, Inc. Homepage”, 2015. [Online]. Available: http://aws.amazon.com. [Accessed: 12 April 2015].

[15] Cloudera.com, “Cloudera, Inc. Homepage”, 2015. [Online]. Available: www.cloudera.com. [Accessed: 12 April 2015].

[16] Cloudera.com, “Cloudera Enterprise, Cloudera, Inc.”, 2015. [Online]. Available: http://www.cloudera.com/content/cloudera/en/products-and-services/cloudera-enterprise.html. [Accessed: 12 April 2015].

[17] Dtameer.com, “Datameer, Inc. Homepage” 2015. [Online]. Available: www.datameer.com. [Accessed: 12 April 2015].

[18] Datastax.com, “DataStax, Homepage” 2015. [Online]. Available: www.datastax.com. [Accessed: 12 April 2015].

[19] tableausoftware.com, “Tableau Software, Homepage”, 2015. [Online]. Available: www.tableausoftware.com. [Accessed: 12 April 2015].

Page 20: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

[20] Teradata, “Open Source Presto”. [Online]. Available: http://www.teradata.com/presto/. [Accessed: 12 April 2015].

[21] Hortonworks.com, “Hortonworks Inc. Homepage”, 2015. [Online]. Available: www.hortonworks.com. [Accessed: 12 April 2015].

[22] FICO® Big Data Analyzer, Overview, Fair Isaac Corporation, 2015, [Online]. Available: http://www.fico.com/en/products/fico-big-data-analyzer#overview. [Accessed: 17 March 2013].

[23] Neo4j.com, “Neo Technology, Inc. Homepage”, 2015. [Online]. Available: www.neo4j.com. [Accessed: 17 March 2013].

[24] Platfora.com, “Platfora, Inc. Homepage”, 2015. [Online]. Available: www.platfora.com. [Accessed: 17 March 2013].

[25] Big Data to Knowledge (BD2K), Data Science at NIH, 2015. [Online]. Available: http://bd2k.nih.gov. [Accessed: 17 March 2013].

[26] tranSMART Foundation. Homepage”, 2014. [Online]. Available: http://transmartfoundation.org. [Accessed: 12 April 2015].

[27] Ghdx.healthdata.org, “Global Health Data Exchange. Homepage”, 2015. [Online]. Available: http://ghdx.healthdata.org. [Accessed: 12 April 2015].

[28] Drupal.org. “Drupal 7”. [Online]. Available: https://drupal.org/drupal-7.0. [Accessed: 17 March 2013].

[29] Solr, “The Apache Software Foundation”, 2014. [Online]. Available: http://lucene.apache.org/solr/. [Accessed: 17 March 2013].

[30] K. Wetterstrand, “DNA Sequencing Costs”, In National Human Genome Research Institute, 2013. [Online]. Available: http://www.genome.gov/sequencingcosts/. [Accessed: 17 March 2013].

[31] Healthcare & Life Sciences, (n.d.), From Cloudera, Inc., [Online]. Available: http://www.cloudera.com/content/cloudera/en/solutions/industries/healthcare-life-sciences.html. [Accessed: 12 April 2015].

[32] Healthx.com, “HEALTHX, Homepage”, 2015. [Online]. Available: http://www.healthx.com. [Accessed: 12 April 2015].

[33] Explorys.com, “Explorys, Homepage”, 2015. [Online]. Available: https://www.explorys.com. [Accessed: 12 April 2015].

[34] D.C. Kaelber, W. Foster, J. Gilder, T.E. Love, A.K. Jain, “Patient characteristics associated with venous thromboembolic events: a cohort study using pooled electronic health record data”, Journal of the American Medical Informatics Association, Nov.-Dec., 2012, vol. 19, no. 6, pp. 965-972.

[35] Humedica.com, “Humedica, Inc. Homepage”, 2013.. [Online]. Available: http://www.humedica.com. [Accessed: 12 April 2015].

[36] UPMC, “UPMC’S ‘Big Data’ Technology Shows Promise in Breast Cancer Research”, (2013, June 19), 2015. [Online]. Available: http://www.upmc.com/media/newsreleases/2013/pages/upmc-big-data-tech-breast-cancer-research.aspx. [Accessed: 4 April 2015].

[37] Newmeds-europe.com, “The NEWMEDS Project, Homepage”, 2015. [Online]. Available: http://www.newmeds-europe.com. [Accessed: 4 April 2015].

[38] PharmaCog Project, “Innovative Medicines Initiative”, 2010 [Online]. Available: http://www.imi.europa.eu/content/pharma-cog. [Accessed: 17 March 2013].

[39] J.J. Thomas, K.A Cook, “A visual analytics agenda,” in Computer Graphics and Applications, IEEE, Jan.-Feb. 2006, vol.26, no.1, pp.10-13. [Online]. Available: doi: 10.1109/MCG.2006.5. [Accessed: 17 June 2015].

[40] G. Halford, R. Baker, J.E. McCredden, J.D. Bain,“How many variables can humans process?”, Psychological Science, 2005, Vol. 16, no. 1, pp.70–76.

Page 21: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

[41] V.L. West, D. Borland,W. Ed Hammond, “Innovative information visualization of electronic health record data: a systematic review”, Journal of the American Medical Informatics Association, 2015;22:330–339. [Online]. Available: doi:10.1136/amiajnl-2014-002955. [Accessed: 12 April 2015].

[42] B. Shneiderman, C. Plaisant, B.W. Hesse, “Improving Healthcare with Interactive Visualization”, Computer, May 2013, vol.46, no. 5, pp. 58-66. [Online]. Available: doi:10.1109/MC.2013.38. [Accessed: 4 April 2015].

[43] D. Klimov, A. Shknevsky, Y. Shahar , “Exploration of patterns predicting renal damage in diabetes type II patients using a visual temporal analysis laboratory.”, JAMIA, 2015, vol. 22, no. 2, pp.275–289.

[44] N. Kamal, S. Wiebe J.D.T. Engbers, M.D. Hill, “Big Data and Visual Analytics in Health and Medicine: From Pipe Dream to Reality”, J Health Med Informat., 2014, Vol. 5, pp. e125. [Online]. Available: doi:10.4172/2157-7420.1000e125. [Accessed: 17 March 2013].

[45] C. Vaitsis, G. Νilsson, N. Zary, “Big Data in Medical Informatics: Improving Education Through Visual Analytics”, in Studies in Health Technology and Informatics Series, Vol. 205: e-Health – For Continuity of Care, pp. 1163-1167. [Online]. Available: doi:10.3233/978-1-61499-432-9-1163. [Accessed: 2 December 2015].

[46] marketsandmarkets.com, “Healthcare Cloud Computing Market by Application (PACS, EMR, CPOE, RCM, Claims Management), Deployment (Private, Public), Service (SaaS, IaaS), Pricing (Pay as you go) & by End-User (Providers, Payers) - Analysis and Global Forecasts to 2020”, June 2015.

[47] marketsandmarkets.com, “Healthcare Analytics/Medical Analytics Market by Application (Clinical, PHM, Financial (RCM, Claim & Fraud), Supply Chain & HR), Type (Predictive), Delivery model (On-premise, Cloud), End-user (Payer, Hospital, Ambulatory, ACO) - Global Forecast to 2020”, July 2015.

[48] CORDIS, (n.d.), “Big data at your service”. In Digital agenda for Europe – European Commission. [Online]. Available: http://ec.europa.eu/digital-agenda/en/news/big-data-your-service. [Accessed: 17 March 2013].

[49] Department of Economic and Social Affairs, Population Division, “World Population Ageing: 1950-2050”, New York, 2001, USA: United Nations.

[50] The WHITE HOUSE, “Office of Science and Technology Policy”, 2015. [Online]. Available: www.whitehouse.gov/ostp. [Accessed: 6 May 2015].

[51] Subcommittee on Networking and Information Technology Research and Development, “The Networking and Information Technology Research and Development Program, Supplement to the President’s Budget. FY 2104”, May 2013, [Online]. Available: http://www.whitehouse.gov/sites/default/files/microsites/ostp/nitrd_fy14_budgetsup.pdf. [Accessed: 27 June 2015].

[52] the WHITE HOUSE, “Data to Knowledge to Action: Event Highlights Innovative Collaborations to Benefit Americans”, Office of Science and Technology Policy, Executive Office of the President, November 12, 2013. [Online]. Available: https://www.whitehouse.gov/sites/default/files/microsites/ostp/Data2Action%20Press%20Release.pdf. [Accessed on: 7 March 2015].

[53] European Commission, “Improving health reporting mechanisms”. In Public Health. 2013. [Online]. Available: http://ec.europa.eu/health/data_collection/tools/mechanisms/index_en.htm. [Accessed: 12 December 2013].

[54] HITECH Act. (n.d.), In HealthIT.gov. [Online]. Available: http://www.healthit.gov/policy-researchers-implementers/hitech-act-0. [Accessed: 2 May 2015].

[55] U.S. Department of Health & Human Services, Health Information Privacy”. [Online]. Available: http://www.hhs.gov/ocr/privacy/. [Accessed: 12 December 2014].

[56] Department of Health and Human Services, Modifications to the HIPAA Privacy, Security, Enforcement, and Breach Notification Rules Under the Health Information Technology for Economic and Clinical Health Act and the

Page 22: Κεφάλαιο 9 - Big Data & Cloud Computing στην Υγεία › bitstream › 11419 › 285 › ... · Το σενάριο που παρουσιάζεται στην Εικόνα

Genetic Information Nondiscrimination Act; Other Modifications to the HIPAA Rules; Final Rule, Federal Register, vol. 78, no. 17, Friday, January 25, 2013, Rules and Regulations, pp. 5566-5702.