Bioinformática: desde las proteínas mitocondriales a la genómica
-
Upload
m-gonzalo-claros -
Category
Science
-
view
219 -
download
1
description
Transcript of Bioinformática: desde las proteínas mitocondriales a la genómica
Bioinformática: desde las proteínas mitocondriales a la genómica
M. Gonzalo Claros Díaz
Departamento de Biología Molecular y Bioquímica
Instituto Andaluz de Biotecnología
Universidad de Málaga
80%α-amilasas
Maltasas
Invertasas
Glucoamilasas
Todo empezó con una amilasa...
AMY1-3SWA2ALP1SWA1
DtAMYB
BmAMYBcAMYBlCGTBmCGT
KpCGT
DtAMYCPPAPPAWhAMY
Unión de sustrato
Unión de Calcio
EWW RYQ
AYHGYWAYHGYWAYHGYWAYHGYWGYHGYWSYHKYDYHGYW
SYHGYW
R3
SYHGYDSYHGYD
AAYHGYW
SPEGYL
V
LMVDDVTNHLMVDIVTNHLMVDIVTNHLMVDV ANH
IIIDFAPNHQ HPLRP
R5
IYVDAVINH
LMVDYAPNHVIMDLVVNHVVIDFAPNH
IILD PNHVFIILDLVVNH
CVADIVINH
IK
R
Q
FRLDAA M
IRFDAVK YIRVDAVKHMIRVDAVKHM
L IDSAKHVLRIDSAKHVLRIDSAKHVLRIDTVKHV
R7b
FRLDASKHMWRLDFAKGY
FRLDAALHIIRIDAIKHM
YRM DHA
FFFFGEWFGA
TFYFGEIVET
VYNLGEVYQGVYSVGEVFQGVYLLGEVYDG
VFTFGEWFLGVFTFGEWFLG
R8
PFIFQEVIDLAFVVGELYDR
VFTFGEWYLG
VYCIGEVLDG
VYLTGEVWD
VYLVGEVWDN
FIDNHDMDRFFIDNHDMDRF
FVENHDNPRF
FIENHDQVRF
FVDNHDNQRGTFIDNHDTGS
R9
FIENHDQPRLFVENHDNERF
FMDNHDMARIFLTNHDQNRVFLDNHDMDRF
FLENHDSNRFFLRNHDQVRV
Residuos catalíticos
5 motivos son importantes para la función
… que además conserva la estructura secundaria
PPA (cristal)
PPAAMY1-3
SWA2
ALP1
AMY1
Aß5 Aα5 Aß6 Aα6 Aß7 Aα7 Aß8 Aα8Aα6' Cß1 Cß2 Cß3 Cß4 Cß5 Cß6 Cß7 Cß8
R8 R9 R10
PPA (cristal)
PPAAMY1-3
SWA2
ALP1
AMY1
Aß1 Aα1 Aß2 Aα2 Aß3 Aα3 Aß4 Aα4Bß1Bß2 Bß3Bß4 Bß5 Bß6Bß7
Bß1 Bß2 Bß3
R1 R2 R3 R4 R5 R6 R7
hélice α
hoja ß
Claros et al (1993) Curr. Genet. 24: 75-83
Predicción bioinformática completa de las α-amilasas
DOMINIO C
(ß antiparalelas)
DOMINIO B
(ß paralelas)
DOMINIO A
catalítico
(barril a/ß)PE
PTID
O S
EÑ
AL
DOMINIO CDOMINIO B
DOMINIO A
Claros et al (1993) Curr. Genet. 24: 75-83
¿Por qué tienen genoma las mitocondrias?
Núcleo
Mitocondria
Cytb
Cox1ATP*
COX* Relocalización de los genes mitocondriales en
el núcleo
Importación de las proteínas mitocondriales codificadas
en el núcleo
Contenido génico de las mitocondrias de las algas
Funes et al (2002) Recent research
developments in human mitochondrial
myopathies. Research SignPost
Vías de importación de proteínas mitocondrialesMitocondrias
de los animales
Mitocondrias de
los vegetales
Lister et al (2005) Mol Membr Biol 22(1-2): 87-100
Hipótesis para el mantenimiento del genoma
Las proteínas muy hidrófobas no se pueden importar
Objetivos:
Desarrollar un método in vivo para estudiar la importación
Establecer las limitaciones del sistema de importación
La proteína quiméricaPresecuencia mitocondrial: Fo9
• Dirige correctamente una proteína a la mitocondria de levaduras
• Es capaz de translocar una proteína con dos dominios muy hidrófobos
• Duplicada es aún más eficiente
Proteína delatora: madurasa bI4• Codificada por el intrón 4 del citocromo b
• Controla el ayuste de los intrones 5 de cytb y cox1
• Es muy sensible in vivo
• Hay una batería de mutantes disponible
• Fácil de rastrear por fenotipo
Citocromo b (cytb)• En el genoma mitocondrial de todos los organismos estudiados
• Muy hidrófoba
• Inconveniente— Código genético diferente
— No hay consenso sobre el número de dominios transmembranarios
El sistema experimental in vivoNúcleo
mRNA
Mitocondria
mRNA (gly+)
pre-mRNA (gly-)
Gen quimérico
Proteína quimérica
Péptido de tránsito
Proteína delatora
Fragmentos citocromo b
Claros et al (1996) Methods Enzymol 264: 389
¿Cuántos dominios transmembranarios tiene el cyt b?
6004002000
-4
-2
0
2
100 300 500 700
<H
>17
(kc
al/
resi
due
)
Aminoácidos
1 2 3 4 5 6 7 8
S 12345678 M
ATGNcoI BglII
Algoritmo de dominios transmembranarios
Para el citocromo b no valen los algorimos al uso
No era posible predecir la topología
Colaboración con Dr. Gunnar von Heijne (Universidad de Estocolmo)
para mejorar TopPred
• Ponderación piramidal de los dominios transmembranarios
— El centro del dominio es más importante que los bordes
• La composición de las regiones intermembranarias define la topología
TopPred II
• Adaptado a eucariotas y procariotas
• Interfaz gráfico para interpretar la topología
— Más escalas de hidrofobia
— Personalización de los parámetros
— Representación gráfica de las topologías, los perfiles de hidrofobia, etc.
• Topologías ordenadas por probabilidad
• 98% acierto en procariotas
• 83% acierto en eucariotas.
Claros y von Heijne (1994) Comput Applic Biosci 10(6): 685-686
Estructura transmembranaria del cytb
1 2 3 4 5 6 7 8
Dominios transmembranarios Topología
NC
∆Ψ+
∆Ψ -
1 2 3 4 5 6 7 8
Claros et al (1995) Eur J Biochem 241: 779-786
Uso de TopPred II
Versión para OS Classic
Ejecutable en la web:• http://bioweb.pasteur.fr/seqanal/interfaces/toppred.html
Paquete Biok (Inst. Pasteur)
Competidores actuales de TopPred II
Sadovskaya et al (2006) J. Bioinf. Comp. Biol. 4(5): 1033-1056
TopPred II sigue siendo suficientemente fiable
Sadovskaya et al (2006) J. Bioinf. Comp. Biol. 4(5): 1033-1056
TopPred II está en el centro de la tabla, y no muy alejado de los algoritmos
basados en redes neuronales y HMM
Las proteínas recombinantes pueden complementar los mutantes de respiración
MSM
0M
S0M
1M
S1M
MSM
0M S0M
1M S1M
MM -Leu (Glucosa) YEPG (Glicerol)
CON presecuenciaSIN presecuencia CON presecuenciaSIN presecuencia
Presencia de las proteínas quiméricas en la mitocondria
--
-+
++
--
-+
++
--
-+
++
S1tag S56tag Control
Triton X-100Pronase
S56tag
S1tag
56tag
1tag
ABF2 (HM)
28.5 kDa
17.4 kDa
15.3 kDa
Claros et al. (1995) Eur. J. Biochem. 228: 762-771
Importación de los fragmentos del citocromo b
MSM0M
S0M1M
S1MS12M
S123MS1234M
S12345MS56MS8M
S78MS678M
S12345678M
4.5 ± 0.317.5 ± 4.543.0 ± 3.6
∞
34.3 ± 2.55.1 ± 0.112.4 ± 0.5
∞
∞
Proteína recomb.
- ± ±+ + ++ + ++ + +- - -+ + +
+ + ++ + ++ + ++ + +- - -+ + +
4.4 ± 0.53.5 ± 0.23.6 ± 0.13.6 ± 0.1
∞
4.4 ± 0.2
Respiración (crecimiento en glicerol)
CW05 CW02
Tiempo gener (h)18 30 37 18 30 37Temperatura (°C)
- + +- - -- - -- - -- - -- ± ±- ± -- - -- - -
+ + ++ + ±± + -- - -± + -+ + ++ + ±- - -- - -
Claros et al. (1995) Eur. J. Biochem. 228: 762-771
MitoProt 1.0: predicción empírica de las proteínas mitocondriales
Variables caculadas a sobre la secuencia de tránsito mitocondrial
• CoefTot , Coef20: composición de aminoácidos
• ZoneTo: Número máximo de residuos N-terminales para presecuencia
• CleavSite: Sitio de corte de la peptidasa señal mitocondrial.
• KR: Número de residuos básicos
• DE: Número de residuos ácidos
• µH∂: medida de la anfipatía y la estructura en hélice α
• Hmax∂: medida del lado más hidrófobo de una hélice α
Variables calculadas sobre la secuencia completa
• ChDiff: Carga total. ChDiff > 0
• H17: Segmento más hidrófobo de 17 aa de longitud.
• MesoH: Mesohidrofobia (proximidad de los dominios transmembranarios)
Uso de diferentes escalas de hidrofobia para los aminoácidos
Claros (1995) Comput Applic Biosci 11: 441-447
Análisis manual con MitoProt 1.0
0 10 20 30 40 500
1
2
3
4
5
6
7
8
9
10
11
12
13
Amino Acid Position
∂ = 95°
∂ = 75°
µH
Ax
x
E
GHI
Jx
1 2 3 4 5 6 7 8 9 10
Maximal Hydrophobiciy
A -> ∂ = 65°
B -> ∂ = 70°
C -> ∂ = 75°
D -> ∂ = 80°
E -> ∂ = 85°
F -> ∂ = 90°
G -> ∂ = 95°
H -> ∂ = 100°
I -> ∂ = 105°
J -> ∂ = 110°
K -> ∂ = 115°
90% 95% %Arg (13.5) = 10.0 OK OK %Ala (14.1) = 4.0 BAD BAD %Ser (11.2) = 4.0 BAD BAD %Leu (12.2) = 8.0 OK OK
90% 95% %Arg (13.5) = 9.5 OK OK %Ala (14.1) = 9.5 OK OK %Ser (11.2) = 4.8 OK OK %Leu (12.2) = 9.5 OK OK
-2 -1 0 1 2
0
1
2
3
H17
Mesohydrophobicity
CFor residues from 1 to 50
For residues from 1 to 21
A
B
Claros (1995) Comput Applic Biosci 11: 441-447
La hidrofobia local y la mesohidrofobia limitan la importación de las proteínas mitocondriales
11
11
Mesohidrofobia (kJ)
210-1-2
5
7
9
5
7
9
S123M
S1-4MS78M
S56M S1-8M
Fo8
COX1CYTbFo
9
COX10
Fo9 N.crassa
840-4-8
Br
NNT
R+
R±
R–
SN
MN
MM
ATM1
Hid
rofo
bia
loca
l (K
J/re
siduo
)S1-5M
S678M
Proteínas
mitocondriales de
las levaduras
Construcciones
quiméricas
Claros et al. (1995) Eur. J. Biochem. 228: 762-771
MitoProt II: algoritmo predictor para las proteínas mitocondriales
Secuencias: base de datos SWISS-PROT
Clasificación:
• Destino mitocondrial y no-mitocondrial
• Destino mitocondrial/cloroplastídico frente al resto
• Presencia de secuencia de tránsito mitocondrial
• Entrenamiento: 13 039
• Test: 1 664
Método: análisis discriminante
• Computar una función discriminante lineal ƒg(O)
— O: un secuencia;
— g: proteína mitocondrial
• 47 variables
�
P(O /g) = e−0.5 fg (O )
e−0.5 fi (O )
i
∑
Claros y Vincens (1996) Eur J Biochem 241: 779-786
Predicción
SwissProt versión 31 SwissProt actualiz.
NO Mitocondrial
MITOCONDRIAL
Grupo
mitocondrial
19.60% (119)
80.40% (488)
Otras
localizaciones
88.67% (11023)
11.33% (1409)
24.53% (13)
75.47% (40)
88.90% (1405)
11.10% (206)
Fiabilidad de MitoProt II
13.039 secuencias 1.664 secuencias
Entrenamiento Verificación
Discriminación entre mitocondrial y no-mitocondrial
Grupo
mitocondrial
Otras
localizaciones
Claros y Vincens (1996) Eur J Biochem 241: 779-786
Fiabilidad de MitoProt II
Predicción de proteínas organulares
(cloroplasto y mitocondria) Predicción de proteínas mitocondriales
Claros y Vincens (1996) Eur J Biochem 241: 779-786
Fiabilidad de MitoProt II
Predicción
Grupo mitocondrial Grupo NO mitocondrial
Entrenamiento VerificaciónIncluye
proteínas
cloroplast.
Excluye
proteínas
cloroplast.
NO Mitocondrial 8.77% (7) 5.31% (2) 76.28% (101) 84.25% (87)
Mitocondrial 91.23% 94.69% 23.72% 15.75%
Posible 38.61% (31) 45.92% (18) 16.48% (21) 11.15% (11)
Segura 52.62% (42) 48.77% (19) 7.24% (9) 4.60% (5)
Localiza las secuencias de tránsito mitocondrial
Claros y Vincens (1996) Eur J Biochem 241: 779-786
Características para que las proteínas se puedan importar en la mitocondria
Que la proteína no sea muy hidrófoba
• No debe tener los dominios hidrófobos muy cercanos
• No debe tener una hidrofobia local muy alta
Que presente la secuencia de tránsito N-terminal
• Anfipática
• Hélice α
Composición de aminoácidos
• de la presecuencia N-terminal
— Rica en Arg y Lys
— Ausencia de Asp y Glu
• de la proteína completa
— pI alto: carga total positiva
Aislamiento de genes que supriman el límite hidrófobo
100.000 transf(10X)Electroporación
Genoteca multicopia
YNG
YEPG
Replicación
S678M
gly-
S678M
gly+
Sup
El límite hidrófobo se puede suprimir
S678M
CDC36
S678M
SSN6
S678M
CDC36
S0M
Glicerol - + - - -+ + +Pronasa
S56tagS56tag
CDC36
S56tag
SSN6CDC36
Abf2p
56tag
S56tag
Corral-Debrinski et al (1999) Mol. Microbiol. 31: 1499-1511
PSE1 aumenta la importación de proteínas hidrófobas
Glucosa Glicerol
PSE1
PSE1-t
PSE1
PSE1-t
0,4 0,2 0,4 0,4 0,2 0,4 0,4 0,2 0,4 + - - + - - + - +
Cox2p
Abf2p
S56tag
56tag
PK (µg/ml)Trit. X-10022 kDa
14 kDa
28 kDa
20 kDa
Pse1-t Pse1Control
0,5
1
1,5
2
2,5
Pse1
Pse1-t
Control
56tag 56tag Abf2pAbf2p-PK +PK
Prote
ína/C
ox2p
56 M
S 56 M
Corral-Debrinski et al (1999) Mol. Microbiol. 31: 1499-1511
Modelo para la importación de las proteínas hidrófobas
S
MPPS
PK
S
S
Pse1p
PKRibosoma
Corral-Debrinski et al (1999) Mol. Microbiol. 31: 1499-1511
IM
OM
tag
Situación normal
Citoplasma
Matrizmitocondrial
TOM
TIM
+ Proteasa
TOM
TIM TIM
TOM
S
+ Pse1p + Proteasa
¿Terapia génica?
El modelo se valida con los cox3 de algas
0
1
2
3
-2 -1 0 1 2
ABC
DE FG
H
IJ
KLMNOR
Escala: GES
Mesohidrofobia
PQ
Hidr
ofob
ia lo
cal
A ¬ Aegilops
B ¬ Candida
C ¬ Chrondrus
D ¬ Hel iantus
E ¬ Magnolia
F ¬ Zea mays
G ¬ Oenothera
H ¬ Pilayella
I ¬ Prototheca
J ¬ Graci lariopsis
K ¬ Oriza sativa
L ¬ Schizosaccharomyces
M ¬ Glicyne
N ¬ Vicia fabaO ¬ Triticum
¬ Chlamydomonas
¬ Polytomella
R ¬ Homo sapiens
P
Q
Ps-Cox3Cr-Cox3
MTSL
1-211-18
32-5432-54
Preseq 2ª señalP(DFM)
0,70,68
Chlamydomonas y Polytomella son las únicas algas con un cox3 (7 TM) nuclear
Pérez-Martínez et al (2000) J Biol Chem 275(39): 30144-30152
Dominios transmembranarios de Cox3p
Amino Acid Position
TopPred II
0 100 200
Bovine
Paracoccus
I II III IV V VI VII
-2
-1
0
1
2Polytomella
-2
-1
0
1
2
3Chlamydomonas
-2
-1
0
1
2
-2
-1
0
1
2
Pérez-Martínez et al (2000) J Biol Chem 275(39): 30144-30152
Funes et al (2002) Recent research developments in human
mitochondrial myopathies. Research SignPost, Mexico
<H17> media de las cox3 nucleares
<H17> media de las cox3 mitocondriales
Cox2p migrado de las algas respalda el modelo
Pérez-Martínez et al (2001) J. Biol. Chem. 276(14): 11302-11309
Funes et al (2002) Recent research developments in human
mitochondrial myopathies. Research SignPost, Mexico
Cox2p «en migración» también respalda el modelo en las plantas
Mitocondrial
Nuclear
Daley et al (2002) Proc Natl. Acad Sci USA 99(16): 10510-10515
ATP6: topología (TopPred) e importabilidad (MitoProt)
Funes et al (2002) J. Biol. Chem. 277(8): 6051-6058
<H17> media de las cox3 mitocondriales<H17> media de las cox3 nucleares
Cytf y subunidad IV verifican el modelo en cloroplastos
Santillán-Torres et al (2003) Biochim. Biophys. Acta 1064: 180-189
Cytƒ, sub IV y cyt b6 forman juntos el complejo cyt bf
• Cyt b6 es homólogo al N-terminal del cyt b mitocondrial
• Sub IV es homólogo al C-terminal del cyt b mitocondrial
• Los tres genes se suelen localizar en el cloroplasto
En Euglena, cyt f y sub IV están codificadas en el núcleo• Han adquirido una secuencia de tránsito triple para localizarse en el
cloroplasto
— Primero un péptido señal para los microsomas (3ª membrana)
— Segundo una secuencia de tránsito cloroplastídica
— Tercero una señal de localización tilacoidal
En el cloroplasto hay más proteínas importables
Todavía hay muchas proteínas poco hidrófobas que se podrían codificar en el núcleo
Santillán-Torres et al (2003) Biochim. Biophys. Acta 1064: 180-189
MitoProt II frente a otros algorimos similares
Jiang et al (2005) Mol. Cell Proteom. 4(1): 12-34
Con datos
experimentales
Gabaldón (2006) Am J Physiol Cell Physiol
291: C1121-C1128
Con datos reales
Ejecución de MitoProt IIPrograma para OS Classic y unix
P�ágina web (MitoP2)• http://mips.gsf.de/cgi-bin/proj/medgen/mitofilter
• http://ihg.gsf.de/ihg/mitoprot.html
Prokish et al (2006) Nucl. Acids
Res. 34: D705-711
Transporte de glutamina en el ciclo GS/GOGAT en pino
GLN2-OG
GLU
CLOROPLASTOCITOSOL
NH4+ GLU
ATP
GS 1
GLN
Fd red
GOGAT
Fd ox
GLU
ADP
GLU
2-OG
Mal Mal
Transporte de glutamina en el ciclo GS/GOGAT en pino
GLN2-OG
GLU
CLOROPLASTOCITOSOL
NH4+ GLU
ATP
GS 1
GLN
Fd red
GOGAT
Fd ox
GLU
ADP
GLU
2-OG
Mal Mal
Ensayo de importación de glutamina
Percoll 7% + [3H]Gln
Cloroplastos enteros
Precargar con metabolito frío
[3H]Gln
Lavado
Centrifugar y contar cpm en la fase inferior
Características del translocador Gln/Glu
0
25
50
75
100
Gln Glu Mal 2-OG Asp
Gln tomadaGlu exportado
Metabolito
µm
ol/h
·mg
Chl
0 20 30
200
Km
300
Tom
a de
Gln
(µ
mol
·mg-1
·h-1)
[Glutamina] (mM)
100
10
GLN
GLU
GLN
GLU
Lines&Kinetics: un programa para facilitar los cálculos cinéticos
Claros y Cánovas (1998) Embnet.news 5.1
Herramientas bioinformáticas para la genómicaGenuma: un portal con herramientas bioinformáticas
• Almacenamiento de secuencias
• Limpieza de secuencias
• Anotación
• Ensamblaje
Instituto Nacional de Bioinformática
PreP: normalización y expresión diferencial
Portal GenUMA
Estrategia de GenUMA
SeqTrim
Falgueras et al (2007) Enviado a
publicar
http://castanea.ac.uma.es/genuma/seqtrim
Cómo funciona SeqTrim
Falgueras et al (2007) Enviado a publicar
Interfaz de SeqTrim
Ventajas de SeqTrim
Listo para analizar con alto rendimiento
Fácil de instalar
• Necesita BLAST, phred y librerías de BioPERL
Interfaz simple
• Uso de colores orientativos
Compatible
• Admite varios formatos de entrada y salida
• Se puede encadenar con otros programas de análisis
Versátil
• Configuración de parámetros personalizable
• Secuencias contaminantes personalizables
Colaboración entre biólogos e informáticos
Full-Lengther
Aparicio et al (2007) Enviado a publicar
http://castanea.ac.uma.es/genuma/full-lengther
Cómo funciona Full-Lengther
BLAST con hits BLAST sin hits
Aparicio et al (2007) Enviado a publicar
Analizar una(s) secuencia(s)
Análisis en detalle de cada secuencia
Aparicio et al (2007) Enviado a publicar
Nodo GNV5 «Bioinformática Integrada» del INB
Portal del INB: MOWServ
http://www.inab.org/MOWServClaros et al (2007) En preparaciónNavas-Delgado (2005) Bioinformatics 22: 106-111
Contenido del MOWServObjeto de entrada
Servicio ejecutadoObjeto de salida
Búsqueda rápida de servicios
Claros et al (2007) En preparación
Ejecución de los servicios
Interfaz uniforme
Se guardan las ejecuciones
Se puede seguir la evolución de la ejecución
Existen flujos de tareas • También se pueden definir otros nuevos
Navas-Delgado (2005) Bioinformatics 22: 106-111
Los flujos de tareas («workflows»)
Participantes
École Normale Supérieure (París, Francia)
Pierre Vincens
Javier Perea
Marisol Corral-Debrinski
Claude Jacq
Universidad de Estocolmo (Suecia)
Gunnar von Heijne
Laboratorio de Biología Molecular y Biotecnología de Árboles
David Pacheco Villalobos
Sara Díaz Moreno
Antonio J. Lara Aparicio
Rocío Bautista Moreno
Marisa Aguilar Muñoz
Francisco R. Cantón
Francisco M. Cánovas
Dpto Arquitectura de Computadores
Guillermo Pérez Trabado
Oswaldo Trelles Salazar
Victoria Martín Requena
Dpto Lenguajes y Ciencias de la Computación
Juan Falgueras Cano
José Aldana Montes
Ismael Navas-Delgado
M.ª Mar Rojano
Universidad de Málaga