Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Post on 26-Jan-2017

77 views 2 download

Transcript of Ανοιχτά Δεδομένα | Ρούτσης Φώτιος

Ανοικτά Δεδομένα

Εισαγωγικές ΈννοιεςΡούτσης Φώτιος

Attribution-ShareAlike 4.0 International

Ρούτσης Φώτης

routsis.gr

Οργανισμός Ανοικτών Τεχνολογιών ΕΕΛΛΑΚ

• Ιδρύθηκε το 2008• Μέλη

• 30 Ακαδημαϊκά Ιδρύματα,

Ερευνητικά Κέντρα και

Κοινωφελείς Οργανισμοί

ΕΕΛΛΑΚ

Ανάπτυξη και Προώθηση..

Ανοικτών ΠροτύπωνΑνοικτού ΛογισμικούΑνοικτού ΠεριεχομένουΑνοικτών ΔεδομένωνΑνοικτής ΔιακυβέρνησηςΑνοικτών Εκπαιδευτικών ΠηγώνΑδειών Creative CommonsΤεχνολογιών Ανοικτού Υλικού & Σχεδίων (open hardware & design)

ΕΕΛΛΑΚ

• Δουλεύουμε με το μοντέλο των έργων Ανοικτού

Λογισμικού• Εθελοντές, Συνεργασίες, Ομάδες Εργασίας• Σχεδιασμός, ανάπτυξη και υποστήριξη δράσεων που

αφορούν την ανοικτότητα

Πώς ;

ΕΕΛΛΑΚ

• Εκπαίδευση/Σεμινάρια για τα ανοιχτά δεδομένα• Εκδηλώσεις / Ημερίδες Ενημέρωσης• Προτάσεις Πολιτικής • Πιστοποίηση εκπαιδευτών & δεδομένων• Διεθνείς συνεργασίες: Open Data Institute

Ανοικτά Δεδομένα;

ΕΕΛΛΑΚ

Ιδρύθηκε από• Sir Tim Berners-Lee• Sir Nigel Shadbolt

Non Profit

65 Clifton Street, London, UK

“ We connect, equip and inspire people around the world to innovate with data. ”

Open Data InstituteInventor of the WWW

Open Data Institute

Ανοικτά ;

Ανοικτά Δεδομένα είναι Δεδομένα στα οποία ο καθένας μπορεί να έχει πρόσβαση, να τα χρησιμοποιήσει και τα διαμοιράσει.

- Open Data Institute- http://theodi.org/guide/what-open-data

Introduced in 2015

Ανοικτά Δεδομένα – Γιατί ;

Γιατί τώρα ;

• Νέα ατζέντα

• Πρότυπα και τεχνολογίες

• Βέλτιστες τακτικές και καθοδήγηση

by http://raconteur.net/

Δομημένη πληροφορία, αισθητήρες, συσκευές, ΙοΤ

25 Χρόνια

Το μέλλον ;

Τα τελευταία 25 χρόνια το διαδίκτυο (web of documents) απαριθμείται σε δισεκατομμύρια σελίδες. Ο ιστός των δεδομένων (web of data) θα

είναι κατά πολύ μεγαλύτερος.

Open Data Institute (2015) Open data means business: UK innovation across sectors and regions. London, UK. Available at http://theodi.org/open-data-means-business-uk-innovation-sectors-regions

Annual turnover €130bn 500K employees

Που κινούμαι ;

big data

Big Data

big data

(i) Η διαχείρισή τους απαιτεί ισχυρά εργαλεία και τεχνολογίες

(ii) .. Μεταφορικός όρος για να χαρακτηρίσει ένα δύσκολο πρόβλημα με δεδομένα

Τα έμαθα όλα ;

law and licensing

open datacertificates

open sourceopen standards

data quality

business modeltechnologies

big data

Τα Ανοικτά Δεδομένα που χρησιμοποιούμε θα πρέπει να φέρουν κατάλληλη άδεια χρήσης

Creative Commons

Public DomainOpen Database Licence

Γιατί άδεια χρήσης;

Οι άδειες χρήσης επιτρέπουν στον χρήστη να

κατανοεί με σαφήνεια ποιες ενέργειες και

εργασίες μπορεί να εκτελέσει στα δεδομένα

και τα μεταδεδομένα που συνοδεύουν.

https://thomaslevine.com/!/open-data-licensing/p2.png

Τα περισσότερα σετ δεδομένων δεν συνοδεύονται από άδεια χρήσης!

Ανοικτή Άδεια Χρήσης

Μια Ανοικτή Άδεια χρήσης επιτρέπει σε οποιονδήποτε να

έχει πρόσβαση, να χρησιμοποιήσει και να διαμοιράσει

δεδομένα, συμπεριλαμβανομένου εταιρίες που μπορούν να

το χρησιμοποιήσουν για εμπορικά προϊόντα και υπηρεσίες.

Οι Ανοικτές Άδειες ΧρήσηςΕπιτρέπουν• Την αναδημοσίευση των δεδομένων από τρίτους• Παραγωγή νέου περιεχομένου από τα δικά μας δεδομένα• Την παραγωγή χρήματος (εμπορική αξία) από υπηρεσίες που αξιοποιούν τα

δικά μας δεδομένα• Αναδημοσίευση περιεχομένου με χρέωση ποσού (fee)

Υποχρεώνουν • Οι χρήστες θα πρέπει να δηλώνουν την αρχική πηγή (Attribute) των

δεδομένων.• Οι χρήστες θα πρέπει να διανέμουν δεδομένα που παρήχθησαν από τη

επεξεργασία των αρχικών, με την ίδια άδεια χρήσης! (share alike)

Creative Commons

Έχουν αναπτυχθεί από την κοινότητα και δεν ελέγχονται από κάποια κεντρική αρχή.

Creative Commons

Τρία Επίπεδα- Public domain: CC0- Attribution: CC-by- attribution and share alike: CC-by-sa

Creative Commons BY- SA

Μορφότυπα!

Επεξεργασία ;

Έρευνες έχουν δείξει ότι ο καθαρισμός και προετοιμασία των δεδομένων για χρήση από τον καταναλωτή μπορεί να καταλάβει μέχρι και το 80% του συνολικού χρόνου !

Διατίθεται πληθώρα Open Source εργαλείων για τον καθαρισμό, την επεξεργασία και τη δημοσίευση δεδομένων.

Καθαρά & Μηχαναγνώσιμα Δεδομένα

Για την βέλτιστη δυνατή αξιοποίηση των Ανοικτών δεδομένων απαιτείται αυτά να είναι σε μηχαναγνώσιμη μορφή και καθαρά από διπλοεγγραφές και άσχετη πληροφορία

Μορφότυπος / format

Σαφώς προσδιορισμένο και προτυποποιημένο τρόπο κωδικοποίησης ψηφιακής πληροφορίας (για αποστολή ή για αποθήκευση σε αρχείο), έτσι ώστε ο παραλήπτης του μηνύματος να μπορεί να εξάγει την ορθή πληροφορία από αυτό.

Μορφές Ανοικτών Δεδομένων

Μορφότυπα (format) και τεχνολογίες Ανοικτών Δεδομένων ;

Αναγνωρίζετε

κάποια ;

Comma Seperated Values

CSV

eXtensible Markup Language

XML

JavaScript Object Notation

JSON

Resource Description Framework

RDF

SPARQL Queryable

Γεωγραφικά ΔεδομέναΓεωχωρικά Δεδομένα3διάστατες αναπαραστάσεις

KMLSHP

http://www.opengeospatial.org/standards/kml

Shapefile

5 starsΔιαθέσιμα στο διαδίκτυο σε οποιαδήποτε μορφή αλλά με Άδεια χρήσης Ανοικτών Δεδομένων

Διαθέσιμα σε μηχαναγνώσιμη μορφή (πχ excel αντί για σκαναρισμένο έγγραφο)

Χρήση ελεύθερου μορφότυπου (CSV αντί για excel)

χρήση URIs για την επισήμανση των δεδομένων μας (με τα URI να δίνουν πληροφορίες για τα δεδομένα μας)

Όλα τα παραπάνω συν τη διασύνδεση των δεδομένων μας με άλλα δεδομένα (linked data).

Δι@υγεια - API

Από τον Οκτώβριο 2010 αναρτώνται σε ένα σημείο στο διαδίκτυο όλες οι αποφάσεις πράξεων των κυβερνητικών και διοικητικών οργάνων (Νόμος 3861/2010)

https://diavgeia.gov.gr/

Ανοικτά Δεδομένα

Ν. 4305/2014 “Ανοικτή διάθεση και περαιτέρω χρήση εγγράφων, πληροφοριών και δεδομένων του δημόσιου τομέα..”

http://data.gov.gr

Open by Default !!

Tips – Export to CSV!

Tips – Κατάλληλα Δεδομένα

Τα ανοικτά δεδομένα προορίζονται για μηχανική επεξεργασία και δεν είναι απαραίτητο να είναι της ίδιας «εμφάνισης» με αυτά που προορίζονται για ανάγνωση από ανθρώπους.

Tips – Κατάλληλο Έγγραφο

Tips – Όχι τόσο..Κατάλληλο Έγγραφο

Tips – Σημεία προσοχής!

1. Αρχεία Open Format (csv, json, xml..)2. Σύντομοι περιγραφικοί τίτλοι στις ‘στήλες’3. Αποφεύγουμε ελληνικά ονόματα αρχείων4. Συνοδεύουμε αν χρειάζεται με ένα

σύντομο περιγραφικό κείμενο του τι περιέχει η κάθε στήλη και τι αφορά το σετ δεδομένων.

Case Study – Open Data

Ποιος ;

• Mastodon C• Open Health

Care UK

prescribinganalytics.com

Δεδομένα ;

• NHS Information Centre

• 11 εκατομμύρια εγγραφές συνταγών

Σκοπός ;

Θέλησαν να εντοπίσουν την αποτελεσματική η μη συνταγολόγηση φαρμάκων στατινών (statins) στο ΗΒ.

Γενόσημα VS Branded

Αποτέλεσμα ;

£200m θα μπορούσαν να «σωθούν» ..

Διαδικασία ;

H διαδικασία περιελάμβανε • τις συνταγές ανά χημική ουσία από το Σεπτ. 11• Τα γεωγραφικά διαμερίσματα του ΗΒ• Μαθηματική αναγωγή για την εκτίμηση του

κόστους των φαρμάκων.

Εύκολο ;

Κάθε μηνιαίο αρχείο με τις συνταγές που χρησιμοποίησαν ήταν τύπου .CSV και ήταν μεγέθους περίπου 500ΜΒ ..

https://github.com/MastodonC/nhs-prescription-analytics

Ευχαριστώ!

routsis.gr@froutsis