σε

90
ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία Αρχές Δοµικής Βιοπληροφορικής Πρωτεϊνών (σε <100 διαφάνειες...) Βασίλης Προμπονάς Ερευνητικό Εργαστήριο Βιοπληροφορικής Τμήμα Βιολογικών Επιστημών Πανεπιστήμιο Κύπρου email: [email protected] Web: http://troodos.biol.ucy.ac.cy

Transcript of σε

Page 1: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Αρχές Δοµικής Βιοπληροφορικής Πρωτεϊνών(σε <100 διαφάνειες...)

Βασίλης ΠροµπονάςΕρευνητικό Εργαστήριο Βιοπληροφορικής

Τµήµα Βιολογικών ΕπιστηµώνΠανεπιστήµιο Κύπρου

email: [email protected]: http://troodos.biol.ucy.ac.cy

Page 2: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Page 3: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Page 4: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Page 5: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΣΥΝΟΨΗ● Εισαγωγικά Στοιχεία – Βασικές έννοιες ● Τύποι Προγνωστικών Μεθόδων

– Πρόβληµα (π.χ. 2ταγής, φ-ψ, TM-τοπολ.)– Μέθοδος (Εµπειρικές, Στατιστικές, Μηχανικής

Μάθησης)● Ειδικά προβλήµατα:

– Αρχές Μεθόδων Comparative Modelling– Πρόβλεψη 2γους δοµής πρωτεϊνών– Τοπολογία Διαµεµβρανικών Πρωτεϊνών

● Συζήτηση ..

Page 6: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΣΥΝΟΨΗ● Εισαγωγικά Στοιχεία – Βασικές έννοιες ● Τύποι Προγνωστικών Μεθόδων

– Πρόβληµα (π.χ. 2ταγής, φ-ψ, TM-τοπολ.)– Μέθοδος (Εµπειρικές, Στατιστικές, Μηχανικής

Μάθησης)● Ειδικά προβλήµατα:

– Αρχές Μεθόδων Comparative Modelling– Πρόβλεψη 2γους δοµής πρωτεϊνών– Τοπολογία Διαµεµβρανικών Πρωτεϊνών

● Συζήτηση ..

Page 7: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Αλφαβητάρι (Μοριακής) Βιολογίας

● Γονιδίωµα/τα● Χρωµόσωµα/τα● Γονίδιο/α● Πρωτεΐνη/ες

Ορισµένες “λέξεις κλειδιά”

Page 8: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ροή της Γενετικής πληροφορίας“Το Κεντρικό Δόγµα”

PROTEINPROTEIN

RNARNA

DNADNA

ΑντιγραφήReplication

ΜεταγραφήTranscription

ΜετάφρασηTranslation

Page 9: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

...ACTGTCTGACCGGCAGCA...

...TGACAGACTGGCCGTCGT...

Το DNA αποθηκεύει πληροφορία…

Page 10: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Οι πρωτεΐνες διεκπεραιώνουν τη “βρώµικη” δουλειά…

Page 11: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρωτεΐνες● Συγκροτούνται από µία ή περισσότερες πολυπεπτιδικές αλυσίδες (οµο- ή ετερο-πολυµερή)

● Η Λειτουργική “Εργαλειοθήκη” κάθε κυττάρου

Page 12: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρωτεϊνες: Η Λειτουργική “Εργαλειοθήκη” κάθε κυττάρου

● Ένζυµα (Enzymes)● Μεταφορά-Αποθήκευση

(Transport-Storage)● Κίνηση (Motion)● Δέσµευση ουσιών (Binding)● Μοριακή Αναγνώριση

(Molecular Recognition)● Μεταγωγή Σήµατος (Signal

Transduction)

● Δοµικές πρωτεΐνες (Structural Proteins)

● Παραγωγή Ενέργειας (Energy Production)

● Ρύθµιση Κυτταρικών Διεργασιών και Διαφοροποίηση (Cell Regulation and Differentiation)

● ... (...)

Page 13: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

...LSAFSFNRFETSSKMARYNLPCPRSLLAILS...

Οι πρωτεΐνες διεκπεραιώνουν τη “βρώµικη” δουλειά…

Image adapted from Petsko & Ringe, Protein structure and function

Page 14: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πίσω στο “Κεντρικό Δόγµα”

Σχεδόν για όλες τις πρωτεΐνες

FunctionFunction

τρισδιάστατη Δοµήτρισδιάστατη Δοµή3D-structure3D-structure

ΑλληλουχίαΑλληλουχίαSequenceSequence

Καθορίζει

Καθορίζει • Glucose Uptake PathwayGlucose Uptake Pathway• Glycogen Synthesis PathwayGlycogen Synthesis Pathway• Formation of triglyceridesFormation of triglycerides

..VEQCCTSICSLYQL..

Ο Γενετικός κώδικας είναι εκφυλισµένος ΚΑΙ σε αυτότο επίπεδο

Page 15: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Βασικές αρχές δοµής πρωτεϊνώνΑµινοξέα: Οι δοµικοί λίθοι

Page 16: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Βασικές αρχές δοµής πρωτεϊνώνΑµινοξέα: Οι δοµικοί λίθοι (ΙΙ)

Page 17: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η δοµή των πρωτεϊνώνακολουθεί µια ιεραρχία● Πρωτοταγής

– Αµινοξική Ακολουθία● Δευτεροταγής

– Τοπικές διαµορφώσεις της πολυπεπτιδικής αλυσίδας

● Τριτοταγής– Τρισδιάστατο Δίπλωµα (Fold)

● Τεταρτοταγής– Αλληλεπιδράσεις πρωτεΐνης

Page 18: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Αυτοτελή δοµικά στοιχεία(Structural Domains)

● Αυθύπαρκτες δοµικές οντότητες● Διακριτή οργάνωση● Ανεξάρτητες στο Δίπλωµα● Λειτουργική αυτοτέλεια

Όχι πάντα συνεχόµενα τµήµατα πολυπεπτιδικής αλυσίδας

Όχι πάντα από την ίδια πολυπεπτιδική αλυσίδα

!

!

Page 19: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Protein Data Bank - PDB http://www.rcsb.org

● Εγγραφές: Αποτελέσµατα πειραµάτων προσδιορισµού πρωτεϊνικών δοµών– Μεµονωµένες πρωτεϊνικές υποµονάδες– Πρωτεϊνικά σύµπλοκα

Page 20: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ανάπτυξη της PDB

Από: Bourne and Wu (2009)

Page 21: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Structural Classification of Proteins(SCOP) Murzin, et al., 1995.

http://scop.mrc-lmb.cam.ac.uk/scop/

● Ιεραρχική Ταξινόµηση που αντανακλά:– Εξελικτικές σχέσεις– Αρχές Πρωτεϊνικής Δοµής

● Με το ΜΑΤΙ!!

● Βασική οντότητα τα DOMAINS

Page 22: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ιεραρχία της SCOP

● Family (Οικογένεια)● Superfamily (Υπερ-οικογένεια)● Fold (Δίπλωµα)● Class (Κατηγορία/Κλάση)

– Κατά κύριο λόγο εκφράζει το περιεχόµενο δευτεροταγούς δοµής

Page 23: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Page 24: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Κύριες κατηγορίες διπλώµατος

all-α all-β

α+βα/β

Page 25: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ιεραρχία της SCOP

● Family (Οικογένεια)● Superfamily (Υπερ-οικογένεια)● Fold (Δίπλωµα)

– Σηµαντική Δοµική Οµοιότητα● Κοινά κύρια στοιχεία δευτεροταγούς δοµής● Κοινή διευθέτηση● Κοινή τοπολογία διασυνδέσεων

– Η οµοιότητα οφείλεται στη φυσικοχηµεία των πρωτεϊνών και ΟΧΙ σε εξελικτική συσχέτιση

● Class (Κατηγορία/Κλάση)

Page 26: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Page 27: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ιεραρχία της SCOP

● Family (Οικογένεια)● Superfamily (Υπερ-οικογένεια)

– Πιθανή κοινή εξελικτική προέλευση– Χαµηλά επίπεδα οµοιότητας πρωτοταγούς δοµής– Κοινά δοµικά χαρακτηριστικά

● Fold (Δίπλωµα)● Class (Κατηγορία/Κλάση)

Page 28: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Είµαστε µια ωραία ΥΠΕΡοικογένεια ...

Page 29: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η ιεραρχία της SCOP

● Family (Οικογένεια)– Ξεκάθαρη εξελικτική σχέση– Καθορίζεται µε βάση 2 (εξελικτικά) κριτήρια

● Ανά δύο >30% ταυτόσηµα κατάλοιπα● Πολύ όµοιες δοµές και λειτουργίες

● Superfamily (Υπερ-οικογένεια)● Fold (Δίπλωµα)● Class (Κατηγορία/Κλάση)

Page 30: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Είµαστε µια ωραία οικογένεια ...

Page 31: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Μια µατιά στην CATH [???]Orengo et al., 1997.

http://www.cathdb.info Homologous superfamily Topology Architecture Class

Page 32: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πόσα (διαφορετικά) Domains??

Από: Bourne and Wu (2009)

Page 33: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

... µα τι είναι η δοµή??

Page 34: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

voila!!

Page 35: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

ΣΥΝΟΨΗ● Εισαγωγικά Στοιχεία – Βασικές έννοιες ● Τύποι Προγνωστικών Μεθόδων

– Πρόβληµα (π.χ. 2ταγής, φ-ψ, TM-τοπολ.)– Μέθοδος (Εµπειρικές, Στατιστικές, Μηχανικής

Μάθησης)● Ειδικά προβλήµατα:

– Αρχές Μεθόδων Comparative Modelling– Πρόβλεψη 2γους δοµής πρωτεϊνών– Τοπολογία Διαµεµβρανικών Πρωτεϊνών

● Συζήτηση ..

Page 36: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Προγνωστικές Μέθοδοι??

Page 37: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πίσω στο “Κεντρικό Δόγµα”

Σχεδόν για όλες τις πρωτεΐνες

FunctionFunction

τρισδιάστατη Δοµήτρισδιάστατη Δοµή3D-structure3D-structure

ΑλληλουχίαΑλληλουχίαSequenceSequence

Καθορίζει

Καθορίζει • Glucose Uptake PathwayGlucose Uptake Pathway• Glycogen Synthesis PathwayGlycogen Synthesis Pathway• Formation of triglyceridesFormation of triglycerides

..VEQCCTSICSLYQL..

Ο Γενετικός κώδικας είναι εκφυλισµένος ΚΑΙ σε αυτότο επίπεδο

Page 38: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Προσοχή στο κενό ...● ΤΕΡΑΣΤΙΟΣ ΟΓΚΟΣ ΔΕΔΟΜΕΝΩΝ ΑΛΛΗΛΟΥΧΙΩΝ

● Γονιδιωµατική και µετα-Γονιδιωµατική Εποχή

Page 39: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Προσοχή στο κενό ...● ΤΕΡΑΣΤΙΟΣ ΟΓΚΟΣ ΔΕΔΟΜΕΝΩΝ ΑΛΛΗΛΟΥΧΙΩΝ

● Γονιδιωµατική και µετα-Γονιδιωµατική Εποχή

Page 40: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πειραµατικός Προσδιορισµός

● Επίπονη – Χρονοβόρα – Ακριβή Διαδικασία– Κρυσταλλογραφία ακτίνων-Χ– Μαγνητικός Πυρηνικός Συντονισµός– Ηλεκτρονική Μικροσκοπία

● Μέθοδοι Πρόβλεψης καλούνται να καλύψουν “ΤΟ ΚΕΝΟ”

● Τι προβλέψεις?

Page 41: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

INPUT>X-factor hypothetical proteinSHTDIKVPDFSDYRRPEVLD STKSSKESSEARKGFSY

OUTPUT

Πρόβλεψη σε 3D

Page 42: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρόγνωση της τρισδιάστατης πρωτεϊνικής δοµής

● Συγκριτική Προτυποποίηση – Comparative (Homology) Modeling

● Threading (“Αρµάθιασµα”, Fold Recognition, Inverse Protein Folding)

● Πρόγνωση από πρώτες αρχές (ab initio methods)

Page 43: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρόγνωση της δοµής πρωτεϊνών

● ΠΡΟΒΛΗΜΑ:– Έχω την ακολουθία µιας νέας πρωτεΐνης

● Ερωτήµατα– Γνωστό δίπλωµα ?

● ΝΑΙ: µπορώ να βρώ τις λεπτοµέρειες ?● ΟΧΙ: ποιο είναι τότε ?

● Γιατί µε απασχολεί όµως ??

Page 44: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Γιατί??

● Περιέργεια!!● Γνώση 3D-δοµής

– Λειτουργία– Εξέλιξη– Ορθολογικός σχεδιασµός φαρµάκων– Σχεδιασµός & Μηχανική Πρωτεϊνών– Πρόβλεψη πρωτεϊνικών αλληλεπιδράσεων– ...

Page 45: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Γιατί??

Από: Bourne and Wu (2009)

Page 46: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πώς όµως??Αµινοξική Ακολουθία... AKLYCMVHAAIL ...

ΟµολογίαΔοµική Αναλογία

ΕµπειρικήΓνώση Θεωρία Πειραµατικοί

Περιορισµοί

Page 47: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

... είναι εφικτό ??● Τα καλά νέα:

– “Η θερµοδυναµική υπόθεση” (C. Anfinsen)

● Τα άσχηµα νέα:– Ο τρόπος δεν είναι πάντα προφανής– Δεν υπάρχει αναλυτική σχέση ακολουθίας-δοµής

Page 48: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Συγκριτική προτυποποίηση(aka Comparative or Homology Modeling)

● Ξεκάθαρη σχέση µε προσδιορισµένη δοµή– Οµοιότητα στο επίπεδο της αλληλουχίας

● Βασικές Αρχές– Φυσικά η Θερµοδυναµική Υπόθεση– (Πολύ) όµοιες ακολουθίες αναµένουµε να διπλώνουν µε τον ίδιο τρόπο

– Η δοµή περισσότερο συντηρηµένη από ακολουθία

Page 49: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Συγκριτική προτυποποίηση(aka Comparative or Homology Modeling)

1.Εντοπισµός κατάλληλης δοµής-µήτρας (template) και αρχική στοίχιση (seq) [αν δεν βρω?]

2.Βελτίωση της στοίχισης (seq)3.Κατασκευή κύριας αλυσίδας4.Προτυποποίηση θηλιών5.Προτυποποίηση πλευρικών αλυσίδων6.Βελτιστοποίηση µοντέλου7.Επικύρωση µοντέλου

Σε κάθε βήµα υπάρχουν εναλλακτικοί τρόποι προσέγγισης

Page 50: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Page 51: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

1. Εντοπισµός κατάλληλης δοµής-µήτρας (template) - στοίχιση● Βασιζόµαστε στις υπάρχουσες µεθοδολογίες

(DP, BLASTP, FASTA – µη βιάζεστε, στα επόµενα ...)

● Αναζήτηση έναντι των ακολουθιών εγγραφών της PDB

● Δυνητικά σε 2 βήµατα● Κρίσιµα σηµεία

– Επιλογή 1(??) δοµής-µήτρας [κριτήρια??]– Στοίχιση στο επίπεδο ακολουθίας

Page 52: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Page 53: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Page 54: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

2. Βελτίωση της στοίχισης

● Δυναµικός προγραµµατισµός (δείτε επόµενα)– Μαθηµατικά βέλτιστη στοίχιση– Βιολογικά/Δοµικά??

● Πιθανή χρήση (επιπλέον) οµόλογων – profile alignment– multiple sequence alignment

● Αξιοποίηση δοµικών περιορισµών– Κανονικές δευτεροταγείς δοµές– Θηλιές

Page 55: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Page 56: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

3. Κατασκευή κύριας αλυσίδας

● “Αντιγραφή” από τη δοµή-µήτρα● Αποφυγή λαθών εγγραφών PDB

– Εντοπισµός ● πχ PDBREPORT: http://swift.cmbi.ru.nl/gv/pdbreport/● επιλογή µήτρας µε τα λιγότερα σφάλµατα

● Χρήση πολλαπλών µητρών– Πλεονεκτικό: κάλυψη µεγαλύτερου τµήµατος της άγνωστης πρωτεΐνης

– Δεν είναι πάντα απλό ...

Page 57: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

(Εντοπισµός πιθανών σφαλµάτων)

● Μικρές αποστάσεις ατόµων

● Ασυνήθιστα µήκη/γωνίες δεσµών

● Ασυνήθιστα διαστροφοµερή

● Missing atoms● ...

Page 58: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

4. Προτυποποίηση θηλιών● Στοιχίσεις µε κενά

– Insertions => δεν υπάρχει δοµή για τη θηλιά– Deletions => πρέπει να ενωθούν µη διαδοχικά κατάλοιπα

● Απαιτούνται στεροδιαταξικές αλλαγές στην κύρια αλυσίδα της µήτρας– όχι σε κανονικές δευτεροταγείς δοµές– δεν είναι εύκολο να προβλεφθούν– υπάρχει εγγενές πρόβληµα ακόµη και χωρίς κενά

● επιφανειακές θηλιές => κρυσταλλογραφικές επαφές● µέγεθος πλευρικών αλυσίδων

Page 59: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

4. Προτυποποίηση θηλιών (II)

● Δύο κύριες προσεγγίσεις– Knowledge based

● Αναζήτηση στην PDB για θηλιές µε τα ίδια άκρα● Αντιγραφή της στερεοδιάταξης

– Energy based● Χρησιµοποίηση ab initio τεχνικών (δείτε παρακάτω ??)● Ελαχιστοποίηση ενέργειας (Monte Carlo, Simulated

annealing)– Αποδοτικές µόνο για µικρές θηλιές (<10aa)

Page 60: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

5. Προτυποποίηση πλευρικών αλυσίδων

● Ύπαρξη διαστροφοµερών (rotamer)– Διαφορετικές στερεοδιατάξεις σχετικά µε την κύρια αλυσίδα

– Συχνά οµόλογες δοµές έχουν παρόµοιες χ1● Προτιµήσεις => rotamer libraries

– Επιρροή από γειτονικές πλευρικές αλυσίδες– Επιρροή στην κύρια αλυσίδα– Επιρροή από την κύρια αλυσίδα

● Απόδοση– Καλή στον υδρόφοβο πυρήνα– Μειωµένη σε επιφανειακά κατάλοιπα

Page 61: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

6. Βελτιστοποίηση µοντέλου

Πρόβλεψη διαστροφοµερών

Πρόβλεψη επιπτώσεων στην κύρια αλυσίδα

+ αλλαγές

Σύγκλιση?

ΤΕΛΟΣ

Ενεργειακήελαχιστοποίηση

Page 62: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

6. Βελτιστοποίηση µοντέλου (ΙΙ)

● Ελαχιστοποίηση ενέργειας– Στο σύνολο της δοµής!!!– Απαιτείται ακρίβεια στη συνάρτηση ενέργειας– Αποφυγή “ΧΟΝΤΡΩΝ” λαθών– Εισαγωγή µικρών (συχνά ανεπιθύµητων) λαθών

● Χρήση δοµικών περιορισµών● Χρήση µε φειδώ ...● Χρήση τεχνικών µοριακής δυναµικής

Page 63: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

7. Επικύρωση µοντέλου● Εντοπισµός πιθανών λαθών

– Χρήση ενεργειακών υπολογισµών– Έλεγχος “κανονικότητας”

● µήκη δεσµών● (επίπεδες) γωνίες δεσµών● δίεδρες γωνίες● 3D κατανοµή πολικών/υδρόφοβων καταλοίπων● γεωµετρία ατοµικών επαφών

● Το πλήθος (και η σοβαρότητα) τους εξαρτάται● οµοιότητα σε επίπεδο ακολουθίας● σφάλµατα στη δοµή-µήτρα

Page 64: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Συγκριτική προτυποποίηση:Επιδόσεις

● Πλεονεκτήµατα– Ταχύτητα– Ακρίβεια (RMSD 1-3Å)

● Μειονεκτήµατα– Ακρίβεια εξαρτώµενη της περιοχής (πχ θηλιές)– Εξαρτάται από την ποιότητα στοίχισης, µέγεθος

PDB, αντιπροσωπευτικού δείγµατος δοµών– Προβληµατική στο 'Twilight Zone', ORFans– Δε δίνει πληροφορία για το µηχανισµό διπλώµατος– Όχι και τόσο απλή διαδικασία τελικά :-(

Page 65: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Εάν δε βρω κατάλληλη δοµή-µήτρα?

● ΑΤΥΧΗΣΕΣ!!!

● Ab initio και Fold recognition

Page 66: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Προβλέψεις σε 1D-2D-2.5D

● Μικρότερη “ευκρίνεια”● Απλούστερες (??)● Χρήσιµες πληροφορίες● Σηµείο έναρξης για ab initio/threading (??)

Page 67: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

2D-2.5D ???● Πρόγνωση δευτεροταγούς δοµής σφαιρικών υδατοδιαλυτών πρωτεϊνών

● Πρόγνωση της τοπολογίας διαµεµβρανικών πρωτεϊνών

– α-ελικοειδείς διαµεµβρανικές πρωτεΐνες– διαµεµβρανικά β-βαρέλια

● Πρόγνωση πεπτιδίων-οδηγών● Πρόγνωση PTMs● Αλληλεπιδράσεις καταλοίπων● ...

Page 68: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρόγνωση δευτεροταγούς δοµής σφαιρικών υδατοδιαλυτών

πρωτεϊνών● Ένα από τα πιο “δηµοφιλή” προβλήµατα δοµικής υπολογιστικής βιολογίας

● Ποικιλία Μεθοδολογικών Προσεγγίσεων– Εµπειρικές– Στατιστικές– Μηχανικής Μάθησης

Page 69: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Πρόβληµα 1D

Adapted from: Zvelebil & Baum, 2008

The problem: An intermediate solution/representation:

Restating the problem:

Page 70: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Καθορισµός Δευτεροταγούς Δοµής

Από: Bourne and Wu (2009)

Page 71: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Καθορισµός Δευτεροταγούς Δοµής: Λυµένο Πρόβληµα?

Από: Bourne and Wu (2009)

Page 72: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Στοιχεία Δευτεροταγούς Δοµής

Page 73: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Σηµαντικά Επιτεύγµατα

● Χρήση Μεθόδων Μηχανικής Μάθησης (π.χ. ANNs, SVMs)

● Ενσωµάτωση εξελικτικής πληροφορίας (π.χ. πολλαπλές στοιχίσεις)

Page 74: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

● Μέτρα Ακρίβειας Πρόγνωσης– Για µια αλυσίδα Ν καταλοίπων– Ακρίβεια– Segment Overlap (SOV; Zemla et al., 1999)

Επαλήθευση των προγνώσεων

Page 75: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

SOV???

Από: Zvelebil and Baum (2008)

Τροποποίηση από: Zemla et al., 1999

Page 76: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές Βασισµένες σε Προτιµήσεις Αµινοξικών Καταλοίπων

Από: Bourne and Wu (2009)

Page 77: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές 1ης Γενιάς (ή µίας αλληλουχίας)

Page 78: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές “2ης Γενιάς” (ANNs)

Page 79: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές “2ης Γενιάς” (HMMs)

Page 80: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές “2ης Γενιάς” (SVMs)

Page 81: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Μην ξεχνάτε: Η ποιότητα εξαρτάται από το “στόχο”!!

Από: Zvelebil and Baum (2008)

Page 82: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Μην ξεχνάτε: Η ποιότητα εξαρτάται από το “στόχο”!!

Από: Zvelebil and Baum (2008)

Page 83: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Ανάλυση, Πρόβλεψη και Μοντελοποίηση της Δοµής Διαµεµβρανικών Πρωτεϊνών

Από: Bourne and Wu (2009)

Page 84: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Λίγη (προσωπική) ΙστορίαTopology prediction

Classification

Sequence AnalysisTools/Servers freely available at:http://biophysics.biol.uoa.gr/

Page 85: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Ανάλυση, Πρόβλεψη και Μοντελοποίηση της Δοµής Διαµεµβρανικών Πρωτεϊνών

A simple (?) problem ...

Page 86: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Ανάλυση, Πρόβλεψη και Μοντελοποίηση της Δοµής Διαµεµβρανικών Πρωτεϊνών

Promponas et al. (submitted).

A simple (?) problem ... And a solution ...

TM1TM1 TM2TM2 TM3TM3 TM4TM4 TM5TM5●Structural analysis of PDB polytopic TM entries●Instance based (kNN) classification scheme

http://troodos.biol.ucy.ac.cy/cgi-bin/kNNpredict_cgi

Page 87: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Η µέθοδος των κ-πλησιέστερων γειτόνων (kNN)

Page 88: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές Ανάλυσης Σήµατος: Εφαρµογή στην πρόβλεψη της τοπολογίας διαµεµβρανικών β-

βαρελιών

Page 89: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Τεχνικές Ανάλυσης Σήµατος: Εφαρµογή στην πρόβλεψη της τοπολογίας διαµεµβρανικών β-

βαρελιών

The spectral density ratio model

Transform Seq->TS

A proper distance

... and a clustering methodIoannou et al, BioSystems, 2010.

Page 90: σε

ΒΙΟ 230 – Εισαγωγή στην Υπολογιστική Βιολογία

Συζήτηση ...

Διαδικτυακές πηγέςProtein Data Bank http://www.rcsb.org

SCOP http://scop.mrc-lmb.cam.ac.uk/scop/ CATH http://www.cathdb.info

GOLD http://www.genomesonline.org/

Επιπλέον διδακτικό υλικό:

http://troodos.biol.ucy.ac.cy