Bioinformática: desde las proteínas mitocondriales a la genómica

63
Bioinformática: desde las proteínas mitocondriales a la genómica M. Gonzalo Claros Díaz Departamento de Biología Molecular y Bioquímica Instituto Andaluz de Biotecnología Universidad de Málaga

description

Un resumen de mi actividad científica relacionada con la bioinformática hasta 2007. Empezando por el estudio computarizado de las amilasas para llegar a la predicción de las proteínas mitocondriales, y luego pasar a comprobar el modelo en otros eucariotas unicelulares y mis primeros pinitos en genómica con SeqTrim y Full-Lengther y el incipiente GenUMA.

Transcript of Bioinformática: desde las proteínas mitocondriales a la genómica

Page 1: Bioinformática: desde las proteínas mitocondriales a la genómica

Bioinformática: desde las proteínas mitocondriales a la genómica

M. Gonzalo Claros Díaz

Departamento de Biología Molecular y Bioquímica

Instituto Andaluz de Biotecnología

Universidad de Málaga

Page 2: Bioinformática: desde las proteínas mitocondriales a la genómica

80%α-amilasas

Maltasas

Invertasas

Glucoamilasas

Todo empezó con una amilasa...

AMY1-3SWA2ALP1SWA1

DtAMYB

BmAMYBcAMYBlCGTBmCGT

KpCGT

DtAMYCPPAPPAWhAMY

Unión de sustrato

Unión de Calcio

EWW RYQ

AYHGYWAYHGYWAYHGYWAYHGYWGYHGYWSYHKYDYHGYW

SYHGYW

R3

SYHGYDSYHGYD

AAYHGYW

SPEGYL

V

LMVDDVTNHLMVDIVTNHLMVDIVTNHLMVDV ANH

IIIDFAPNHQ HPLRP

R5

IYVDAVINH

LMVDYAPNHVIMDLVVNHVVIDFAPNH

IILD PNHVFIILDLVVNH

CVADIVINH

IK

R

Q

FRLDAA M

IRFDAVK YIRVDAVKHMIRVDAVKHM

L IDSAKHVLRIDSAKHVLRIDSAKHVLRIDTVKHV

R7b

FRLDASKHMWRLDFAKGY

FRLDAALHIIRIDAIKHM

YRM DHA

FFFFGEWFGA

TFYFGEIVET

VYNLGEVYQGVYSVGEVFQGVYLLGEVYDG

VFTFGEWFLGVFTFGEWFLG

R8

PFIFQEVIDLAFVVGELYDR

VFTFGEWYLG

VYCIGEVLDG

VYLTGEVWD

VYLVGEVWDN

FIDNHDMDRFFIDNHDMDRF

FVENHDNPRF

FIENHDQVRF

FVDNHDNQRGTFIDNHDTGS

R9

FIENHDQPRLFVENHDNERF

FMDNHDMARIFLTNHDQNRVFLDNHDMDRF

FLENHDSNRFFLRNHDQVRV

Residuos catalíticos

5 motivos son importantes para la función

Page 3: Bioinformática: desde las proteínas mitocondriales a la genómica

… que además conserva la estructura secundaria

PPA (cristal)

PPAAMY1-3

SWA2

ALP1

AMY1

Aß5 Aα5 Aß6 Aα6 Aß7 Aα7 Aß8 Aα8Aα6' Cß1 Cß2 Cß3 Cß4 Cß5 Cß6 Cß7 Cß8

R8 R9 R10

PPA (cristal)

PPAAMY1-3

SWA2

ALP1

AMY1

Aß1 Aα1 Aß2 Aα2 Aß3 Aα3 Aß4 Aα4Bß1Bß2 Bß3Bß4 Bß5 Bß6Bß7

Bß1 Bß2 Bß3

R1 R2 R3 R4 R5 R6 R7

hélice α

hoja ß

Claros et al (1993) Curr. Genet. 24: 75-83

Page 4: Bioinformática: desde las proteínas mitocondriales a la genómica

Predicción bioinformática completa de las α-amilasas

DOMINIO C

(ß antiparalelas)

DOMINIO B

(ß paralelas)

DOMINIO A

catalítico

(barril a/ß)PE

PTID

O S

AL

DOMINIO CDOMINIO B

DOMINIO A

Claros et al (1993) Curr. Genet. 24: 75-83

Page 5: Bioinformática: desde las proteínas mitocondriales a la genómica

¿Por qué tienen genoma las mitocondrias?

Núcleo

Mitocondria

Cytb

Cox1ATP*

COX* Relocalización de los genes mitocondriales en

el núcleo

Importación de las proteínas mitocondriales codificadas

en el núcleo

Page 6: Bioinformática: desde las proteínas mitocondriales a la genómica

Contenido génico de las mitocondrias de las algas

Funes et al (2002) Recent research

developments in human mitochondrial

myopathies. Research SignPost

Page 7: Bioinformática: desde las proteínas mitocondriales a la genómica

Vías de importación de proteínas mitocondrialesMitocondrias

de los animales

Mitocondrias de

los vegetales

Lister et al (2005) Mol Membr Biol 22(1-2): 87-100

Page 8: Bioinformática: desde las proteínas mitocondriales a la genómica

Hipótesis para el mantenimiento del genoma

Las proteínas muy hidrófobas no se pueden importar

Objetivos:

Desarrollar un método in vivo para estudiar la importación

Establecer las limitaciones del sistema de importación

Page 9: Bioinformática: desde las proteínas mitocondriales a la genómica

La proteína quiméricaPresecuencia mitocondrial: Fo9

• Dirige correctamente una proteína a la mitocondria de levaduras

• Es capaz de translocar una proteína con dos dominios muy hidrófobos

• Duplicada es aún más eficiente

Proteína delatora: madurasa bI4• Codificada por el intrón 4 del citocromo b

• Controla el ayuste de los intrones 5 de cytb y cox1

• Es muy sensible in vivo

• Hay una batería de mutantes disponible

• Fácil de rastrear por fenotipo

Citocromo b (cytb)• En el genoma mitocondrial de todos los organismos estudiados

• Muy hidrófoba

• Inconveniente— Código genético diferente

— No hay consenso sobre el número de dominios transmembranarios

Page 10: Bioinformática: desde las proteínas mitocondriales a la genómica

El sistema experimental in vivoNúcleo

mRNA

Mitocondria

mRNA (gly+)

pre-mRNA (gly-)

Gen quimérico

Proteína quimérica

Péptido de tránsito

Proteína delatora

Fragmentos citocromo b

Claros et al (1996) Methods Enzymol 264: 389

Page 11: Bioinformática: desde las proteínas mitocondriales a la genómica

¿Cuántos dominios transmembranarios tiene el cyt b?

6004002000

-4

-2

0

2

100 300 500 700

<H

>17

(kc

al/

resi

due

)

Aminoácidos

1 2 3 4 5 6 7 8

S 12345678 M

ATGNcoI BglII

Page 12: Bioinformática: desde las proteínas mitocondriales a la genómica

Algoritmo de dominios transmembranarios

Para el citocromo b no valen los algorimos al uso

No era posible predecir la topología

Colaboración con Dr. Gunnar von Heijne (Universidad de Estocolmo)

para mejorar TopPred

• Ponderación piramidal de los dominios transmembranarios

— El centro del dominio es más importante que los bordes

• La composición de las regiones intermembranarias define la topología

TopPred II

• Adaptado a eucariotas y procariotas

• Interfaz gráfico para interpretar la topología

— Más escalas de hidrofobia

— Personalización de los parámetros

— Representación gráfica de las topologías, los perfiles de hidrofobia, etc.

• Topologías ordenadas por probabilidad

• 98% acierto en procariotas

• 83% acierto en eucariotas.

Claros y von Heijne (1994) Comput Applic Biosci 10(6): 685-686

Page 13: Bioinformática: desde las proteínas mitocondriales a la genómica

Estructura transmembranaria del cytb

1 2 3 4 5 6 7 8

Dominios transmembranarios Topología

NC

∆Ψ+

∆Ψ -

1 2 3 4 5 6 7 8

Claros et al (1995) Eur J Biochem 241: 779-786

Page 14: Bioinformática: desde las proteínas mitocondriales a la genómica

Uso de TopPred II

Versión para OS Classic

Ejecutable en la web:• http://bioweb.pasteur.fr/seqanal/interfaces/toppred.html

Paquete Biok (Inst. Pasteur)

Page 15: Bioinformática: desde las proteínas mitocondriales a la genómica

Competidores actuales de TopPred II

Sadovskaya et al (2006) J. Bioinf. Comp. Biol. 4(5): 1033-1056

Page 16: Bioinformática: desde las proteínas mitocondriales a la genómica

TopPred II sigue siendo suficientemente fiable

Sadovskaya et al (2006) J. Bioinf. Comp. Biol. 4(5): 1033-1056

TopPred II está en el centro de la tabla, y no muy alejado de los algoritmos

basados en redes neuronales y HMM

Page 17: Bioinformática: desde las proteínas mitocondriales a la genómica

Las proteínas recombinantes pueden complementar los mutantes de respiración

MSM

0M

S0M

1M

S1M

MSM

0M S0M

1M S1M

MM -Leu (Glucosa) YEPG (Glicerol)

CON presecuenciaSIN presecuencia CON presecuenciaSIN presecuencia

Page 18: Bioinformática: desde las proteínas mitocondriales a la genómica

Presencia de las proteínas quiméricas en la mitocondria

--

-+

++

--

-+

++

--

-+

++

S1tag S56tag Control

Triton X-100Pronase

S56tag

S1tag

56tag

1tag

ABF2 (HM)

28.5 kDa

17.4 kDa

15.3 kDa

Claros et al. (1995) Eur. J. Biochem. 228: 762-771

Page 19: Bioinformática: desde las proteínas mitocondriales a la genómica

Importación de los fragmentos del citocromo b

MSM0M

S0M1M

S1MS12M

S123MS1234M

S12345MS56MS8M

S78MS678M

S12345678M

4.5 ± 0.317.5 ± 4.543.0 ± 3.6

34.3 ± 2.55.1 ± 0.112.4 ± 0.5

Proteína recomb.

- ± ±+ + ++ + ++ + +- - -+ + +

+ + ++ + ++ + ++ + +- - -+ + +

4.4 ± 0.53.5 ± 0.23.6 ± 0.13.6 ± 0.1

4.4 ± 0.2

Respiración (crecimiento en glicerol)

CW05 CW02

Tiempo gener (h)18 30 37 18 30 37Temperatura (°C)

- + +- - -- - -- - -- - -- ± ±- ± -- - -- - -

+ + ++ + ±± + -- - -± + -+ + ++ + ±- - -- - -

Claros et al. (1995) Eur. J. Biochem. 228: 762-771

Page 20: Bioinformática: desde las proteínas mitocondriales a la genómica

MitoProt 1.0: predicción empírica de las proteínas mitocondriales

Variables caculadas a sobre la secuencia de tránsito mitocondrial

• CoefTot , Coef20: composición de aminoácidos

• ZoneTo: Número máximo de residuos N-terminales para presecuencia

• CleavSite: Sitio de corte de la peptidasa señal mitocondrial.

• KR: Número de residuos básicos

• DE: Número de residuos ácidos

• µH∂: medida de la anfipatía y la estructura en hélice α

• Hmax∂: medida del lado más hidrófobo de una hélice α

Variables calculadas sobre la secuencia completa

• ChDiff: Carga total. ChDiff > 0

• H17: Segmento más hidrófobo de 17 aa de longitud.

• MesoH: Mesohidrofobia (proximidad de los dominios transmembranarios)

Uso de diferentes escalas de hidrofobia para los aminoácidos

Claros (1995) Comput Applic Biosci 11: 441-447

Page 21: Bioinformática: desde las proteínas mitocondriales a la genómica

Análisis manual con MitoProt 1.0

0 10 20 30 40 500

1

2

3

4

5

6

7

8

9

10

11

12

13

Amino Acid Position

∂ = 95°

∂ = 75°

µH

Ax

x

E

GHI

Jx

1 2 3 4 5 6 7 8 9 10

Maximal Hydrophobiciy

A -> ∂ = 65°

B -> ∂ = 70°

C -> ∂ = 75°

D -> ∂ = 80°

E -> ∂ = 85°

F -> ∂ = 90°

G -> ∂ = 95°

H -> ∂ = 100°

I -> ∂ = 105°

J -> ∂ = 110°

K -> ∂ = 115°

90% 95% %Arg (13.5) = 10.0 OK OK %Ala (14.1) = 4.0 BAD BAD %Ser (11.2) = 4.0 BAD BAD %Leu (12.2) = 8.0 OK OK

90% 95% %Arg (13.5) = 9.5 OK OK %Ala (14.1) = 9.5 OK OK %Ser (11.2) = 4.8 OK OK %Leu (12.2) = 9.5 OK OK

-2 -1 0 1 2

0

1

2

3

H17

Mesohydrophobicity

CFor residues from 1 to 50

For residues from 1 to 21

A

B

Claros (1995) Comput Applic Biosci 11: 441-447

Page 22: Bioinformática: desde las proteínas mitocondriales a la genómica

La hidrofobia local y la mesohidrofobia limitan la importación de las proteínas mitocondriales

11

11

Mesohidrofobia (kJ)

210-1-2

5

7

9

5

7

9

S123M

S1-4MS78M

S56M S1-8M

Fo8

COX1CYTbFo

9

COX10

Fo9 N.crassa

840-4-8

Br

NNT

R+

R–

SN

MN

MM

ATM1

Hid

rofo

bia

loca

l (K

J/re

siduo

)S1-5M

S678M

Proteínas

mitocondriales de

las levaduras

Construcciones

quiméricas

Claros et al. (1995) Eur. J. Biochem. 228: 762-771

Page 23: Bioinformática: desde las proteínas mitocondriales a la genómica

MitoProt II: algoritmo predictor para las proteínas mitocondriales

Secuencias: base de datos SWISS-PROT

Clasificación:

• Destino mitocondrial y no-mitocondrial

• Destino mitocondrial/cloroplastídico frente al resto

• Presencia de secuencia de tránsito mitocondrial

• Entrenamiento: 13 039

• Test: 1 664

Método: análisis discriminante

• Computar una función discriminante lineal ƒg(O)

— O: un secuencia;

— g: proteína mitocondrial

• 47 variables

P(O /g) = e−0.5 fg (O )

e−0.5 fi (O )

i

Claros y Vincens (1996) Eur J Biochem 241: 779-786

Page 24: Bioinformática: desde las proteínas mitocondriales a la genómica

Predicción

SwissProt versión 31 SwissProt actualiz.

NO Mitocondrial

MITOCONDRIAL

Grupo

mitocondrial

19.60% (119)

80.40% (488)

Otras

localizaciones

88.67% (11023)

11.33% (1409)

24.53% (13)

75.47% (40)

88.90% (1405)

11.10% (206)

Fiabilidad de MitoProt II

13.039 secuencias 1.664 secuencias

Entrenamiento Verificación

Discriminación entre mitocondrial y no-mitocondrial

Grupo

mitocondrial

Otras

localizaciones

Claros y Vincens (1996) Eur J Biochem 241: 779-786

Page 25: Bioinformática: desde las proteínas mitocondriales a la genómica

Fiabilidad de MitoProt II

Predicción de proteínas organulares

(cloroplasto y mitocondria) Predicción de proteínas mitocondriales

Claros y Vincens (1996) Eur J Biochem 241: 779-786

Page 26: Bioinformática: desde las proteínas mitocondriales a la genómica

Fiabilidad de MitoProt II

Predicción

Grupo mitocondrial Grupo NO mitocondrial

Entrenamiento VerificaciónIncluye

proteínas

cloroplast.

Excluye

proteínas

cloroplast.

NO Mitocondrial 8.77% (7) 5.31% (2) 76.28% (101) 84.25% (87)

Mitocondrial 91.23% 94.69% 23.72% 15.75%

Posible 38.61% (31) 45.92% (18) 16.48% (21) 11.15% (11)

Segura 52.62% (42) 48.77% (19) 7.24% (9) 4.60% (5)

Localiza las secuencias de tránsito mitocondrial

Claros y Vincens (1996) Eur J Biochem 241: 779-786

Page 27: Bioinformática: desde las proteínas mitocondriales a la genómica

Características para que las proteínas se puedan importar en la mitocondria

Que la proteína no sea muy hidrófoba

• No debe tener los dominios hidrófobos muy cercanos

• No debe tener una hidrofobia local muy alta

Que presente la secuencia de tránsito N-terminal

• Anfipática

• Hélice α

Composición de aminoácidos

• de la presecuencia N-terminal

— Rica en Arg y Lys

— Ausencia de Asp y Glu

• de la proteína completa

— pI alto: carga total positiva

Page 28: Bioinformática: desde las proteínas mitocondriales a la genómica

Aislamiento de genes que supriman el límite hidrófobo

100.000 transf(10X)Electroporación

Genoteca multicopia

YNG

YEPG

Replicación

S678M

gly-

S678M

gly+

Sup

Page 29: Bioinformática: desde las proteínas mitocondriales a la genómica

El límite hidrófobo se puede suprimir

S678M

CDC36

S678M

SSN6

S678M

CDC36

S0M

Glicerol - + - - -+ + +Pronasa

S56tagS56tag

CDC36

S56tag

SSN6CDC36

Abf2p

56tag

S56tag

Corral-Debrinski et al (1999) Mol. Microbiol. 31: 1499-1511

Page 30: Bioinformática: desde las proteínas mitocondriales a la genómica

PSE1 aumenta la importación de proteínas hidrófobas

Glucosa Glicerol

PSE1

PSE1-t

PSE1

PSE1-t

0,4 0,2 0,4 0,4 0,2 0,4 0,4 0,2 0,4 + - - + - - + - +

Cox2p

Abf2p

S56tag

56tag

PK (µg/ml)Trit. X-10022 kDa

14 kDa

28 kDa

20 kDa

Pse1-t Pse1Control

0,5

1

1,5

2

2,5

Pse1

Pse1-t

Control

56tag 56tag Abf2pAbf2p-PK +PK

Prote

ína/C

ox2p

56 M

S 56 M

Corral-Debrinski et al (1999) Mol. Microbiol. 31: 1499-1511

Page 31: Bioinformática: desde las proteínas mitocondriales a la genómica

Modelo para la importación de las proteínas hidrófobas

S

MPPS

PK

S

S

Pse1p

PKRibosoma

Corral-Debrinski et al (1999) Mol. Microbiol. 31: 1499-1511

IM

OM

tag

Situación normal

Citoplasma

Matrizmitocondrial

TOM

TIM

+ Proteasa

TOM

TIM TIM

TOM

S

+ Pse1p + Proteasa

¿Terapia génica?

Page 32: Bioinformática: desde las proteínas mitocondriales a la genómica

El modelo se valida con los cox3 de algas

0

1

2

3

-2 -1 0 1 2

ABC

DE FG

H

IJ

KLMNOR

Escala: GES

Mesohidrofobia

PQ

Hidr

ofob

ia lo

cal

A ¬ Aegilops

B ¬ Candida

C ¬ Chrondrus

D ¬ Hel iantus

E ¬ Magnolia

F ¬ Zea mays

G ¬ Oenothera

H ¬ Pilayella

I ¬ Prototheca

J ¬ Graci lariopsis

K ¬ Oriza sativa

L ¬ Schizosaccharomyces

M ¬ Glicyne

N ¬ Vicia fabaO ¬ Triticum

¬ Chlamydomonas

¬ Polytomella

R ¬ Homo sapiens

P

Q

Ps-Cox3Cr-Cox3

MTSL

1-211-18

32-5432-54

Preseq 2ª señalP(DFM)

0,70,68

Chlamydomonas y Polytomella son las únicas algas con un cox3 (7 TM) nuclear

Pérez-Martínez et al (2000) J Biol Chem 275(39): 30144-30152

Page 33: Bioinformática: desde las proteínas mitocondriales a la genómica

Dominios transmembranarios de Cox3p

Amino Acid Position

TopPred II

0 100 200

Bovine

Paracoccus

I II III IV V VI VII

-2

-1

0

1

2Polytomella

-2

-1

0

1

2

3Chlamydomonas

-2

-1

0

1

2

-2

-1

0

1

2

Pérez-Martínez et al (2000) J Biol Chem 275(39): 30144-30152

Funes et al (2002) Recent research developments in human

mitochondrial myopathies. Research SignPost, Mexico

<H17> media de las cox3 nucleares

<H17> media de las cox3 mitocondriales

Page 34: Bioinformática: desde las proteínas mitocondriales a la genómica

Cox2p migrado de las algas respalda el modelo

Pérez-Martínez et al (2001) J. Biol. Chem. 276(14): 11302-11309

Funes et al (2002) Recent research developments in human

mitochondrial myopathies. Research SignPost, Mexico

Page 35: Bioinformática: desde las proteínas mitocondriales a la genómica

Cox2p «en migración» también respalda el modelo en las plantas

Mitocondrial

Nuclear

Daley et al (2002) Proc Natl. Acad Sci USA 99(16): 10510-10515

Page 36: Bioinformática: desde las proteínas mitocondriales a la genómica

ATP6: topología (TopPred) e importabilidad (MitoProt)

Funes et al (2002) J. Biol. Chem. 277(8): 6051-6058

<H17> media de las cox3 mitocondriales<H17> media de las cox3 nucleares

Page 37: Bioinformática: desde las proteínas mitocondriales a la genómica

Cytf y subunidad IV verifican el modelo en cloroplastos

Santillán-Torres et al (2003) Biochim. Biophys. Acta 1064: 180-189

Cytƒ, sub IV y cyt b6 forman juntos el complejo cyt bf

• Cyt b6 es homólogo al N-terminal del cyt b mitocondrial

• Sub IV es homólogo al C-terminal del cyt b mitocondrial

• Los tres genes se suelen localizar en el cloroplasto

En Euglena, cyt f y sub IV están codificadas en el núcleo• Han adquirido una secuencia de tránsito triple para localizarse en el

cloroplasto

— Primero un péptido señal para los microsomas (3ª membrana)

— Segundo una secuencia de tránsito cloroplastídica

— Tercero una señal de localización tilacoidal

Page 38: Bioinformática: desde las proteínas mitocondriales a la genómica

En el cloroplasto hay más proteínas importables

Todavía hay muchas proteínas poco hidrófobas que se podrían codificar en el núcleo

Santillán-Torres et al (2003) Biochim. Biophys. Acta 1064: 180-189

Page 39: Bioinformática: desde las proteínas mitocondriales a la genómica

MitoProt II frente a otros algorimos similares

Jiang et al (2005) Mol. Cell Proteom. 4(1): 12-34

Con datos

experimentales

Gabaldón (2006) Am J Physiol Cell Physiol

291: C1121-C1128

Con datos reales

Page 40: Bioinformática: desde las proteínas mitocondriales a la genómica

Ejecución de MitoProt IIPrograma para OS Classic y unix

P�ágina web (MitoP2)• http://mips.gsf.de/cgi-bin/proj/medgen/mitofilter

• http://ihg.gsf.de/ihg/mitoprot.html

Prokish et al (2006) Nucl. Acids

Res. 34: D705-711

Page 41: Bioinformática: desde las proteínas mitocondriales a la genómica

Transporte de glutamina en el ciclo GS/GOGAT en pino

GLN2-OG

GLU

CLOROPLASTOCITOSOL

NH4+ GLU

ATP

GS 1

GLN

Fd red

GOGAT

Fd ox

GLU

ADP

GLU

2-OG

Mal Mal

Page 42: Bioinformática: desde las proteínas mitocondriales a la genómica

Transporte de glutamina en el ciclo GS/GOGAT en pino

GLN2-OG

GLU

CLOROPLASTOCITOSOL

NH4+ GLU

ATP

GS 1

GLN

Fd red

GOGAT

Fd ox

GLU

ADP

GLU

2-OG

Mal Mal

Page 43: Bioinformática: desde las proteínas mitocondriales a la genómica

Ensayo de importación de glutamina

Percoll 7% + [3H]Gln

Cloroplastos enteros

Precargar con metabolito frío

[3H]Gln

Lavado

Centrifugar y contar cpm en la fase inferior

Page 44: Bioinformática: desde las proteínas mitocondriales a la genómica

Características del translocador Gln/Glu

0

25

50

75

100

Gln Glu Mal 2-OG Asp

Gln tomadaGlu exportado

Metabolito

µm

ol/h

·mg

Chl

0 20 30

200

Km

300

Tom

a de

Gln

mol

·mg-1

·h-1)

[Glutamina] (mM)

100

10

GLN

GLU

GLN

GLU

Page 45: Bioinformática: desde las proteínas mitocondriales a la genómica

Lines&Kinetics: un programa para facilitar los cálculos cinéticos

Claros y Cánovas (1998) Embnet.news 5.1

Page 46: Bioinformática: desde las proteínas mitocondriales a la genómica

Herramientas bioinformáticas para la genómicaGenuma: un portal con herramientas bioinformáticas

• Almacenamiento de secuencias

• Limpieza de secuencias

• Anotación

• Ensamblaje

Instituto Nacional de Bioinformática

PreP: normalización y expresión diferencial

Page 47: Bioinformática: desde las proteínas mitocondriales a la genómica

Portal GenUMA

Page 48: Bioinformática: desde las proteínas mitocondriales a la genómica

Estrategia de GenUMA

Page 49: Bioinformática: desde las proteínas mitocondriales a la genómica

SeqTrim

Falgueras et al (2007) Enviado a

publicar

http://castanea.ac.uma.es/genuma/seqtrim

Page 50: Bioinformática: desde las proteínas mitocondriales a la genómica

Cómo funciona SeqTrim

Falgueras et al (2007) Enviado a publicar

Page 51: Bioinformática: desde las proteínas mitocondriales a la genómica

Interfaz de SeqTrim

Page 52: Bioinformática: desde las proteínas mitocondriales a la genómica

Ventajas de SeqTrim

Listo para analizar con alto rendimiento

Fácil de instalar

• Necesita BLAST, phred y librerías de BioPERL

Interfaz simple

• Uso de colores orientativos

Compatible

• Admite varios formatos de entrada y salida

• Se puede encadenar con otros programas de análisis

Versátil

• Configuración de parámetros personalizable

• Secuencias contaminantes personalizables

Colaboración entre biólogos e informáticos

Page 53: Bioinformática: desde las proteínas mitocondriales a la genómica

Full-Lengther

Aparicio et al (2007) Enviado a publicar

http://castanea.ac.uma.es/genuma/full-lengther

Page 54: Bioinformática: desde las proteínas mitocondriales a la genómica

Cómo funciona Full-Lengther

BLAST con hits BLAST sin hits

Aparicio et al (2007) Enviado a publicar

Page 55: Bioinformática: desde las proteínas mitocondriales a la genómica

Analizar una(s) secuencia(s)

Page 56: Bioinformática: desde las proteínas mitocondriales a la genómica

Análisis en detalle de cada secuencia

Aparicio et al (2007) Enviado a publicar

Page 57: Bioinformática: desde las proteínas mitocondriales a la genómica

Nodo GNV5 «Bioinformática Integrada» del INB

Page 58: Bioinformática: desde las proteínas mitocondriales a la genómica

Portal del INB: MOWServ

http://www.inab.org/MOWServClaros et al (2007) En preparaciónNavas-Delgado (2005) Bioinformatics 22: 106-111

Page 59: Bioinformática: desde las proteínas mitocondriales a la genómica

Contenido del MOWServObjeto de entrada

Servicio ejecutadoObjeto de salida

Page 60: Bioinformática: desde las proteínas mitocondriales a la genómica

Búsqueda rápida de servicios

Claros et al (2007) En preparación

Page 61: Bioinformática: desde las proteínas mitocondriales a la genómica

Ejecución de los servicios

Interfaz uniforme

Se guardan las ejecuciones

Se puede seguir la evolución de la ejecución

Existen flujos de tareas • También se pueden definir otros nuevos

Navas-Delgado (2005) Bioinformatics 22: 106-111

Page 62: Bioinformática: desde las proteínas mitocondriales a la genómica

Los flujos de tareas («workflows»)

Page 63: Bioinformática: desde las proteínas mitocondriales a la genómica

Participantes

École Normale Supérieure (París, Francia)

Pierre Vincens

Javier Perea

Marisol Corral-Debrinski

Claude Jacq

Universidad de Estocolmo (Suecia)

Gunnar von Heijne

Laboratorio de Biología Molecular y Biotecnología de Árboles

David Pacheco Villalobos

Sara Díaz Moreno

Antonio J. Lara Aparicio

Rocío Bautista Moreno

Marisa Aguilar Muñoz

Francisco R. Cantón

Francisco M. Cánovas

Dpto Arquitectura de Computadores

Guillermo Pérez Trabado

Oswaldo Trelles Salazar

Victoria Martín Requena

Dpto Lenguajes y Ciencias de la Computación

Juan Falgueras Cano

José Aldana Montes

Ismael Navas-Delgado

M.ª Mar Rojano

Universidad de Málaga