σε

Post on 06-Feb-2018

220 views 4 download

Transcript of σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Αρχές Δοµικής Βιοπληροφορικής Πρωτεϊνών(σε <100 διαφάνειες...)

Βασίλης ΠροµπονάςΕρευνητικό Εργαστήριο Βιοπληροφορικής

Τµήµα Βιολογικών ΕπιστηµώνΠανεπιστήµιο Κύπρου

email: vprobon@ucy.ac.cyWeb: http://troodos.biol.ucy.ac.cy

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΣΥΝΟΨΗ● Εισαγωγικά Στοιχεία – Βασικές έννοιες ● Τύποι Προγνωστικών Μεθόδων

– Πρόβληµα (π.χ. 2ταγής, φ-ψ, TM-τοπολ.)– Μέθοδος (Εµπειρικές, Στατιστικές, Μηχανικής

Μάθησης)● Ειδικά προβλήµατα:

– Αρχές Μεθόδων Comparative Modelling– Πρόβλεψη 2γους δοµής πρωτεϊνών– Τοπολογία Διαµεµβρανικών Πρωτεϊνών

● Συζήτηση ..

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΣΥΝΟΨΗ● Εισαγωγικά Στοιχεία – Βασικές έννοιες ● Τύποι Προγνωστικών Μεθόδων

– Πρόβληµα (π.χ. 2ταγής, φ-ψ, TM-τοπολ.)– Μέθοδος (Εµπειρικές, Στατιστικές, Μηχανικής

Μάθησης)● Ειδικά προβλήµατα:

– Αρχές Μεθόδων Comparative Modelling– Πρόβλεψη 2γους δοµής πρωτεϊνών– Τοπολογία Διαµεµβρανικών Πρωτεϊνών

● Συζήτηση ..

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Αλφαβητάρι (Μοριακής) Βιολογίας

● Γονιδίωµα/τα● Χρωµόσωµα/τα● Γονίδιο/α● Πρωτεΐνη/ες

Ορισµένες “λέξεις κλειδιά”

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ροή της Γενετικής πληροφορίας“Το Κεντρικό Δόγµα”

PROTEINPROTEIN

RNARNA

DNADNA

ΑντιγραφήReplication

ΜεταγραφήTranscription

ΜετάφρασηTranslation

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

...ACTGTCTGACCGGCAGCA...

...TGACAGACTGGCCGTCGT...

Το DNA αποθηκεύει πληροφορία…

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Οι πρωτεΐνες διεκπεραιώνουν τη “βρώµικη” δουλειά…

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρωτεΐνες● Συγκροτούνται από µία ή περισσότερες πολυπεπτιδικές αλυσίδες (οµο- ή ετερο-πολυµερή)

● Η Λειτουργική “Εργαλειοθήκη” κάθε κυττάρου

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρωτεϊνες: Η Λειτουργική “Εργαλειοθήκη” κάθε κυττάρου

● Ένζυµα (Enzymes)● Μεταφορά-Αποθήκευση

(Transport-Storage)● Κίνηση (Motion)● Δέσµευση ουσιών (Binding)● Μοριακή Αναγνώριση

(Molecular Recognition)● Μεταγωγή Σήµατος (Signal

Transduction)

● Δοµικές πρωτεΐνες (Structural Proteins)

● Παραγωγή Ενέργειας (Energy Production)

● Ρύθµιση Κυτταρικών Διεργασιών και Διαφοροποίηση (Cell Regulation and Differentiation)

● ... (...)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

...LSAFSFNRFETSSKMARYNLPCPRSLLAILS...

Οι πρωτεΐνες διεκπεραιώνουν τη “βρώµικη” δουλειά…

Image adapted from Petsko & Ringe, Protein structure and function

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πίσω στο “Κεντρικό Δόγµα”

Σχεδόν για όλες τις πρωτεΐνες

FunctionFunction

τρισδιάστατη Δοµήτρισδιάστατη Δοµή3D-structure3D-structure

ΑλληλουχίαΑλληλουχίαSequenceSequence

Καθορίζει

Καθορίζει • Glucose Uptake PathwayGlucose Uptake Pathway• Glycogen Synthesis PathwayGlycogen Synthesis Pathway• Formation of triglyceridesFormation of triglycerides

..VEQCCTSICSLYQL..

Ο Γενετικός κώδικας είναι εκφυλισµένος ΚΑΙ σε αυτότο επίπεδο

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Βασικές αρχές δοµής πρωτεϊνώνΑµινοξέα: Οι δοµικοί λίθοι

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Βασικές αρχές δοµής πρωτεϊνώνΑµινοξέα: Οι δοµικοί λίθοι (ΙΙ)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η δοµή των πρωτεϊνώνακολουθεί µια ιεραρχία● Πρωτοταγής

– Αµινοξική Ακολουθία● Δευτεροταγής

– Τοπικές διαµορφώσεις της πολυπεπτιδικής αλυσίδας

● Τριτοταγής– Τρισδιάστατο Δίπλωµα (Fold)

● Τεταρτοταγής– Αλληλεπιδράσεις πρωτεΐνης

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Αυτοτελή δοµικά στοιχεία(Structural Domains)

● Αυθύπαρκτες δοµικές οντότητες● Διακριτή οργάνωση● Ανεξάρτητες στο Δίπλωµα● Λειτουργική αυτοτέλεια

Όχι πάντα συνεχόµενα τµήµατα πολυπεπτιδικής αλυσίδας

Όχι πάντα από την ίδια πολυπεπτιδική αλυσίδα

!

!

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Protein Data Bank - PDB http://www.rcsb.org

● Εγγραφές: Αποτελέσµατα πειραµάτων προσδιορισµού πρωτεϊνικών δοµών– Μεµονωµένες πρωτεϊνικές υποµονάδες– Πρωτεϊνικά σύµπλοκα

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ανάπτυξη της PDB

Από: Bourne and Wu (2009)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Structural Classification of Proteins(SCOP) Murzin, et al., 1995.

http://scop.mrc-lmb.cam.ac.uk/scop/

● Ιεραρχική Ταξινόµηση που αντανακλά:– Εξελικτικές σχέσεις– Αρχές Πρωτεϊνικής Δοµής

● Με το ΜΑΤΙ!!

● Βασική οντότητα τα DOMAINS

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ιεραρχία της SCOP

● Family (Οικογένεια)● Superfamily (Υπερ-οικογένεια)● Fold (Δίπλωµα)● Class (Κατηγορία/Κλάση)

– Κατά κύριο λόγο εκφράζει το περιεχόµενο δευτεροταγούς δοµής

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Κύριες κατηγορίες διπλώµατος

all-α all-β

α+βα/β

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ιεραρχία της SCOP

● Family (Οικογένεια)● Superfamily (Υπερ-οικογένεια)● Fold (Δίπλωµα)

– Σηµαντική Δοµική Οµοιότητα● Κοινά κύρια στοιχεία δευτεροταγούς δοµής● Κοινή διευθέτηση● Κοινή τοπολογία διασυνδέσεων

– Η οµοιότητα οφείλεται στη φυσικοχηµεία των πρωτεϊνών και ΟΧΙ σε εξελικτική συσχέτιση

● Class (Κατηγορία/Κλάση)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ιεραρχία της SCOP

● Family (Οικογένεια)● Superfamily (Υπερ-οικογένεια)

– Πιθανή κοινή εξελικτική προέλευση– Χαµηλά επίπεδα οµοιότητας πρωτοταγούς δοµής– Κοινά δοµικά χαρακτηριστικά

● Fold (Δίπλωµα)● Class (Κατηγορία/Κλάση)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Είµαστε µια ωραία ΥΠΕΡοικογένεια ...

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ιεραρχία της SCOP

● Family (Οικογένεια)– Ξεκάθαρη εξελικτική σχέση– Καθορίζεται µε βάση 2 (εξελικτικά) κριτήρια

● Ανά δύο >30% ταυτόσηµα κατάλοιπα● Πολύ όµοιες δοµές και λειτουργίες

● Superfamily (Υπερ-οικογένεια)● Fold (Δίπλωµα)● Class (Κατηγορία/Κλάση)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Είµαστε µια ωραία οικογένεια ...

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Μια µατιά στην CATH [???]Orengo et al., 1997.

http://www.cathdb.info Homologous superfamily Topology Architecture Class

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πόσα (διαφορετικά) Domains??

Από: Bourne and Wu (2009)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

... µα τι είναι η δοµή??

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

voila!!

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΣΥΝΟΨΗ● Εισαγωγικά Στοιχεία – Βασικές έννοιες ● Τύποι Προγνωστικών Μεθόδων

– Πρόβληµα (π.χ. 2ταγής, φ-ψ, TM-τοπολ.)– Μέθοδος (Εµπειρικές, Στατιστικές, Μηχανικής

Μάθησης)● Ειδικά προβλήµατα:

– Αρχές Μεθόδων Comparative Modelling– Πρόβλεψη 2γους δοµής πρωτεϊνών– Τοπολογία Διαµεµβρανικών Πρωτεϊνών

● Συζήτηση ..

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Προγνωστικές Μέθοδοι??

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πίσω στο “Κεντρικό Δόγµα”

Σχεδόν για όλες τις πρωτεΐνες

FunctionFunction

τρισδιάστατη Δοµήτρισδιάστατη Δοµή3D-structure3D-structure

ΑλληλουχίαΑλληλουχίαSequenceSequence

Καθορίζει

Καθορίζει • Glucose Uptake PathwayGlucose Uptake Pathway• Glycogen Synthesis PathwayGlycogen Synthesis Pathway• Formation of triglyceridesFormation of triglycerides

..VEQCCTSICSLYQL..

Ο Γενετικός κώδικας είναι εκφυλισµένος ΚΑΙ σε αυτότο επίπεδο

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Προσοχή στο κενό ...● ΤΕΡΑΣΤΙΟΣ ΟΓΚΟΣ ΔΕΔΟΜΕΝΩΝ ΑΛΛΗΛΟΥΧΙΩΝ

● Γονιδιωµατική και µετα-Γονιδιωµατική Εποχή

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Προσοχή στο κενό ...● ΤΕΡΑΣΤΙΟΣ ΟΓΚΟΣ ΔΕΔΟΜΕΝΩΝ ΑΛΛΗΛΟΥΧΙΩΝ

● Γονιδιωµατική και µετα-Γονιδιωµατική Εποχή

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πειραµατικός Προσδιορισµός

● Επίπονη – Χρονοβόρα – Ακριβή Διαδικασία– Κρυσταλλογραφία ακτίνων-Χ– Μαγνητικός Πυρηνικός Συντονισµός– Ηλεκτρονική Μικροσκοπία

● Μέθοδοι Πρόβλεψης καλούνται να καλύψουν “ΤΟ ΚΕΝΟ”

● Τι προβλέψεις?

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

INPUT>X-factor hypothetical proteinSHTDIKVPDFSDYRRPEVLD STKSSKESSEARKGFSY

OUTPUT

Πρόβλεψη σε 3D

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρόγνωση της τρισδιάστατης πρωτεϊνικής δοµής

● Συγκριτική Προτυποποίηση – Comparative (Homology) Modeling

● Threading (“Αρµάθιασµα”, Fold Recognition, Inverse Protein Folding)

● Πρόγνωση από πρώτες αρχές (ab initio methods)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρόγνωση της δοµής πρωτεϊνών

● ΠΡΟΒΛΗΜΑ:– Έχω την ακολουθία µιας νέας πρωτεΐνης

● Ερωτήµατα– Γνωστό δίπλωµα ?

● ΝΑΙ: µπορώ να βρώ τις λεπτοµέρειες ?● ΟΧΙ: ποιο είναι τότε ?

● Γιατί µε απασχολεί όµως ??

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Γιατί??

● Περιέργεια!!● Γνώση 3D-δοµής

– Λειτουργία– Εξέλιξη– Ορθολογικός σχεδιασµός φαρµάκων– Σχεδιασµός & Μηχανική Πρωτεϊνών– Πρόβλεψη πρωτεϊνικών αλληλεπιδράσεων– ...

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Γιατί??

Από: Bourne and Wu (2009)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πώς όµως??Αµινοξική Ακολουθία... AKLYCMVHAAIL ...

ΟµολογίαΔοµική Αναλογία

ΕµπειρικήΓνώση Θεωρία Πειραµατικοί

Περιορισµοί

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

... είναι εφικτό ??● Τα καλά νέα:

– “Η θερµοδυναµική υπόθεση” (C. Anfinsen)

● Τα άσχηµα νέα:– Ο τρόπος δεν είναι πάντα προφανής– Δεν υπάρχει αναλυτική σχέση ακολουθίας-δοµής

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Συγκριτική προτυποποίηση(aka Comparative or Homology Modeling)

● Ξεκάθαρη σχέση µε προσδιορισµένη δοµή– Οµοιότητα στο επίπεδο της αλληλουχίας

● Βασικές Αρχές– Φυσικά η Θερµοδυναµική Υπόθεση– (Πολύ) όµοιες ακολουθίες αναµένουµε να διπλώνουν µε τον ίδιο τρόπο

– Η δοµή περισσότερο συντηρηµένη από ακολουθία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Συγκριτική προτυποποίηση(aka Comparative or Homology Modeling)

1.Εντοπισµός κατάλληλης δοµής-µήτρας (template) και αρχική στοίχιση (seq) [αν δεν βρω?]

2.Βελτίωση της στοίχισης (seq)3.Κατασκευή κύριας αλυσίδας4.Προτυποποίηση θηλιών5.Προτυποποίηση πλευρικών αλυσίδων6.Βελτιστοποίηση µοντέλου7.Επικύρωση µοντέλου

Σε κάθε βήµα υπάρχουν εναλλακτικοί τρόποι προσέγγισης

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

1. Εντοπισµός κατάλληλης δοµής-µήτρας (template) - στοίχιση● Βασιζόµαστε στις υπάρχουσες µεθοδολογίες

(DP, BLASTP, FASTA – µη βιάζεστε, στα επόµενα ...)

● Αναζήτηση έναντι των ακολουθιών εγγραφών της PDB

● Δυνητικά σε 2 βήµατα● Κρίσιµα σηµεία

– Επιλογή 1(??) δοµής-µήτρας [κριτήρια??]– Στοίχιση στο επίπεδο ακολουθίας

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

2. Βελτίωση της στοίχισης

● Δυναµικός προγραµµατισµός (δείτε επόµενα)– Μαθηµατικά βέλτιστη στοίχιση– Βιολογικά/Δοµικά??

● Πιθανή χρήση (επιπλέον) οµόλογων – profile alignment– multiple sequence alignment

● Αξιοποίηση δοµικών περιορισµών– Κανονικές δευτεροταγείς δοµές– Θηλιές

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

3. Κατασκευή κύριας αλυσίδας

● “Αντιγραφή” από τη δοµή-µήτρα● Αποφυγή λαθών εγγραφών PDB

– Εντοπισµός ● πχ PDBREPORT: http://swift.cmbi.ru.nl/gv/pdbreport/● επιλογή µήτρας µε τα λιγότερα σφάλµατα

● Χρήση πολλαπλών µητρών– Πλεονεκτικό: κάλυψη µεγαλύτερου τµήµατος της άγνωστης πρωτεΐνης

– Δεν είναι πάντα απλό ...

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

(Εντοπισµός πιθανών σφαλµάτων)

● Μικρές αποστάσεις ατόµων

● Ασυνήθιστα µήκη/γωνίες δεσµών

● Ασυνήθιστα διαστροφοµερή

● Missing atoms● ...

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

4. Προτυποποίηση θηλιών● Στοιχίσεις µε κενά

– Insertions => δεν υπάρχει δοµή για τη θηλιά– Deletions => πρέπει να ενωθούν µη διαδοχικά κατάλοιπα

● Απαιτούνται στεροδιαταξικές αλλαγές στην κύρια αλυσίδα της µήτρας– όχι σε κανονικές δευτεροταγείς δοµές– δεν είναι εύκολο να προβλεφθούν– υπάρχει εγγενές πρόβληµα ακόµη και χωρίς κενά

● επιφανειακές θηλιές => κρυσταλλογραφικές επαφές● µέγεθος πλευρικών αλυσίδων

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

4. Προτυποποίηση θηλιών (II)

● Δύο κύριες προσεγγίσεις– Knowledge based

● Αναζήτηση στην PDB για θηλιές µε τα ίδια άκρα● Αντιγραφή της στερεοδιάταξης

– Energy based● Χρησιµοποίηση ab initio τεχνικών (δείτε παρακάτω ??)● Ελαχιστοποίηση ενέργειας (Monte Carlo, Simulated

annealing)– Αποδοτικές µόνο για µικρές θηλιές (<10aa)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

5. Προτυποποίηση πλευρικών αλυσίδων

● Ύπαρξη διαστροφοµερών (rotamer)– Διαφορετικές στερεοδιατάξεις σχετικά µε την κύρια αλυσίδα

– Συχνά οµόλογες δοµές έχουν παρόµοιες χ1● Προτιµήσεις => rotamer libraries

– Επιρροή από γειτονικές πλευρικές αλυσίδες– Επιρροή στην κύρια αλυσίδα– Επιρροή από την κύρια αλυσίδα

● Απόδοση– Καλή στον υδρόφοβο πυρήνα– Μειωµένη σε επιφανειακά κατάλοιπα

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

6. Βελτιστοποίηση µοντέλου

Πρόβλεψη διαστροφοµερών

Πρόβλεψη επιπτώσεων στην κύρια αλυσίδα

+ αλλαγές

Σύγκλιση?

ΤΕΛΟΣ

Ενεργειακήελαχιστοποίηση

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

6. Βελτιστοποίηση µοντέλου (ΙΙ)

● Ελαχιστοποίηση ενέργειας– Στο σύνολο της δοµής!!!– Απαιτείται ακρίβεια στη συνάρτηση ενέργειας– Αποφυγή “ΧΟΝΤΡΩΝ” λαθών– Εισαγωγή µικρών (συχνά ανεπιθύµητων) λαθών

● Χρήση δοµικών περιορισµών● Χρήση µε φειδώ ...● Χρήση τεχνικών µοριακής δυναµικής

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

7. Επικύρωση µοντέλου● Εντοπισµός πιθανών λαθών

– Χρήση ενεργειακών υπολογισµών– Έλεγχος “κανονικότητας”

● µήκη δεσµών● (επίπεδες) γωνίες δεσµών● δίεδρες γωνίες● 3D κατανοµή πολικών/υδρόφοβων καταλοίπων● γεωµετρία ατοµικών επαφών

● Το πλήθος (και η σοβαρότητα) τους εξαρτάται● οµοιότητα σε επίπεδο ακολουθίας● σφάλµατα στη δοµή-µήτρα

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Συγκριτική προτυποποίηση:Επιδόσεις

● Πλεονεκτήµατα– Ταχύτητα– Ακρίβεια (RMSD 1-3Å)

● Μειονεκτήµατα– Ακρίβεια εξαρτώµενη της περιοχής (πχ θηλιές)– Εξαρτάται από την ποιότητα στοίχισης, µέγεθος

PDB, αντιπροσωπευτικού δείγµατος δοµών– Προβληµατική στο 'Twilight Zone', ORFans– Δε δίνει πληροφορία για το µηχανισµό διπλώµατος– Όχι και τόσο απλή διαδικασία τελικά :-(

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Εάν δε βρω κατάλληλη δοµή-µήτρα?

● ΑΤΥΧΗΣΕΣ!!!

● Ab initio και Fold recognition

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Προβλέψεις σε 1D-2D-2.5D

● Μικρότερη “ευκρίνεια”● Απλούστερες (??)● Χρήσιµες πληροφορίες● Σηµείο έναρξης για ab initio/threading (??)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

2D-2.5D ???● Πρόγνωση δευτεροταγούς δοµής σφαιρικών υδατοδιαλυτών πρωτεϊνών

● Πρόγνωση της τοπολογίας διαµεµβρανικών πρωτεϊνών

– α-ελικοειδείς διαµεµβρανικές πρωτεΐνες– διαµεµβρανικά β-βαρέλια

● Πρόγνωση πεπτιδίων-οδηγών● Πρόγνωση PTMs● Αλληλεπιδράσεις καταλοίπων● ...

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρόγνωση δευτεροταγούς δοµής σφαιρικών υδατοδιαλυτών

πρωτεϊνών● Ένα από τα πιο “δηµοφιλή” προβλήµατα δοµικής υπολογιστικής βιολογίας

● Ποικιλία Μεθοδολογικών Προσεγγίσεων– Εµπειρικές– Στατιστικές– Μηχανικής Μάθησης

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρόβληµα 1D

Adapted from: Zvelebil & Baum, 2008

The problem: An intermediate solution/representation:

Restating the problem:

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Καθορισµός Δευτεροταγούς Δοµής

Από: Bourne and Wu (2009)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Καθορισµός Δευτεροταγούς Δοµής: Λυµένο Πρόβληµα?

Από: Bourne and Wu (2009)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Στοιχεία Δευτεροταγούς Δοµής

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Σηµαντικά Επιτεύγµατα

● Χρήση Μεθόδων Μηχανικής Μάθησης (π.χ. ANNs, SVMs)

● Ενσωµάτωση εξελικτικής πληροφορίας (π.χ. πολλαπλές στοιχίσεις)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

● Μέτρα Ακρίβειας Πρόγνωσης– Για µια αλυσίδα Ν καταλοίπων– Ακρίβεια– Segment Overlap (SOV; Zemla et al., 1999)

Επαλήθευση των προγνώσεων

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

SOV???

Από: Zvelebil and Baum (2008)

Τροποποίηση από: Zemla et al., 1999

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές Βασισµένες σε Προτιµήσεις Αµινοξικών Καταλοίπων

Από: Bourne and Wu (2009)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές 1ης Γενιάς (ή µίας αλληλουχίας)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές “2ης Γενιάς” (ANNs)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές “2ης Γενιάς” (HMMs)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές “2ης Γενιάς” (SVMs)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Μην ξεχνάτε: Η ποιότητα εξαρτάται από το “στόχο”!!

Από: Zvelebil and Baum (2008)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Μην ξεχνάτε: Η ποιότητα εξαρτάται από το “στόχο”!!

Από: Zvelebil and Baum (2008)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Ανάλυση, Πρόβλεψη και Μοντελοποίηση της Δοµής Διαµεµβρανικών Πρωτεϊνών

Από: Bourne and Wu (2009)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Λίγη (προσωπική) ΙστορίαTopology prediction

Classification

Sequence AnalysisTools/Servers freely available at:http://biophysics.biol.uoa.gr/

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Ανάλυση, Πρόβλεψη και Μοντελοποίηση της Δοµής Διαµεµβρανικών Πρωτεϊνών

A simple (?) problem ...

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Ανάλυση, Πρόβλεψη και Μοντελοποίηση της Δοµής Διαµεµβρανικών Πρωτεϊνών

Promponas et al. (submitted).

A simple (?) problem ... And a solution ...

TM1TM1 TM2TM2 TM3TM3 TM4TM4 TM5TM5●Structural analysis of PDB polytopic TM entries●Instance based (kNN) classification scheme

http://troodos.biol.ucy.ac.cy/cgi-bin/kNNpredict_cgi

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η µέθοδος των κ-πλησιέστερων γειτόνων (kNN)

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές Ανάλυσης Σήµατος: Εφαρµογή στην πρόβλεψη της τοπολογίας διαµεµβρανικών β-

βαρελιών

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές Ανάλυσης Σήµατος: Εφαρµογή στην πρόβλεψη της τοπολογίας διαµεµβρανικών β-

βαρελιών

The spectral density ratio model

Transform Seq->TS

A proper distance

... and a clustering methodIoannou et al, BioSystems, 2010.

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Συζήτηση ...

Διαδικτυακές πηγέςProtein Data Bank http://www.rcsb.org

SCOP http://scop.mrc-lmb.cam.ac.uk/scop/ CATH http://www.cathdb.info

GOLD http://www.genomesonline.org/

Επιπλέον διδακτικό υλικό:

http://troodos.biol.ucy.ac.cy