IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

91
12 IDENTIFICACION Y LOCALIZACIN DE SECUENCIAS DE REGULACIN DE LA EXPRESIN DE LA FAMILIA DE GENES DE β-GLOBINA EN DIFERENTES ESPECIES NATALIA IVVON ACEVEDO LUNA PONTIFICIA UNIVERSIDAD JAVERIANA FACULTAD DE CIENCIAS CARRERA DE BIOLOGIA Bogota, D.C Junio, 2007

Transcript of IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

Page 1: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

12

IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE

REGULACIÓN DE LA EXPRESIÓN DE LA

FAMILIA DE GENES DE β-GLOBINA

EN DIFERENTES ESPECIES

NATALIA IVVON ACEVEDO LUNA

PONTIFICIA UNIVERSIDAD JAVERIANA

FACULTAD DE CIENCIAS

CARRERA DE BIOLOGIA

Bogota, D.C

Junio, 2007

Page 2: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

13

IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE

REGULACIÓN DE LA EXPRESIÓN DE LA

FAMILIA DE GENES DE β-GLOBINA

EN DIFERENTES ESPECIES

NATALIA IVVON ACEVEDO LUNA

TRABAJO DE GRADO

Presentado como requisito parcial

Para optar al titulo de

BIOLOGO

PONTIFICIA UNIVERSIDAD JAVERIANA

FACULTAD DE CIENCIAS

CARRERA DE BIOLOGIA

Bogota, D.C

Junio, 2007

Page 3: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

14

NOTA DE ADVERTENCIA

Articulo 23 de la Resolución No. 13 de Julio de 1946

�La Universidad no se hace responsable por los conceptos emitidos por sus alumnos

en sus trabajos de tesis. Solo velara por que no se publique nada contrario al dogma y

a la moral católica y por que las tesis no contengan ataques personales contra persona

alguna, antes bien se vea en ellas el anhelo de buscar la verdad y la justicia�

Page 4: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

15

IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE

REGULACIÓN DE LA EXPRESIÓN DE LA

FAMILIA DE GENES DE β-GLOBINA

EN DIFERENTES ESPECIES

NATALIA IVVON ACEVEDO LUNA

APROBADO

___________________________ __________________________

Leonardo Mariño Ramírez, Ph. D. Leonardo Lareo, Ph. D.

Director Asesor

____________________________ __________________________

Diana Alvarez, Ph.D. Carlos Manuel Estevez

Jurado Jurado

Page 5: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

16

IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE

REGULACIÓN DE LA EXPRESIÓN DE LA

FAMILIA DE GENES DE β-GLOBINA

EN DIFERENTES ESPECIES

NATALIA IVVON ACEVEDO LUNA

APROBADO

_______________________ _______________________

Ángela Umaña Muñoz Andrea Forero Ruiz

Decana Académica Directora Carrera de Biología

Facultad de Ciencias Básicas Facultad de Ciencias Básicas

Page 6: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

17

AGRADECIMIENTOS

Al Dr. Leonardo Mariño Ramírez, PhD. Por la dirección científica y la acertada

orientación de este proyecto. Además por brindarme la oportunidad de realizar la

pasantía en el �National Center for Biotechnology Information� NCBI/NLM/NIH

Al Dr. Leonardo Lareo, PhD. Por su respaldo y sugerencias para el buen desempeñó

del proyecto.

Al Dr. David Landsman, PhD. por el soporte durante la realización del proyecto en el

�National Center for Biotechnology Information� NCBI/NLM/NIH

Al �National Center for Biotechnology Information�. NCBI/NLM/NIH Bethesda, MD.

Estados Unidos.

Page 7: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

18

TABLA DE CONTENIDOS No.

1. INTRODUCCION

2. MARCO TEORICO Y REVISION DE LITERATURA

2.1. Regulación de la expresión génica

2.1.1. Secuencias cis de regulación

2.1.1.1. Promotores

2.1.1.1.1.Elementos Proximales de Regulación

2.1.1.2. �Enhancers�

2.1.1.3. Silenciadores

2.1.1.4. Aisladores

2.1.1.5. MARs/SASs

2.1.1.6. Elementos Aislantes

2.1.2. Factores de Transcripción

2.2. Cluster de genes de β-Globina

2.2.1. Evolución del cluster de los genes de β-Globina

2.2.2. Regulación de la expresión del cluster de genes de β-Globina

2.2.2.1. Locus de la región de control (LCR)

2.2.2.2. Regulación a través de modificaciones de la cromatina

2.2.2.3. Factores de transcripción propios de la expresión de los genes de β-

Globina

2.2.2.4. LCR y modificaciones de la cromatina

2.3. Evolución de los mecanismos de regulación del gen de β-Globina

3. FORMULACION DEL PROBLEMA Y JUSTIFICACION

3.1. Formulación del problema

3.2. Preguntas de la investigación

12

14

14

15

15

15

17

17

18

18

19

19

20

22

26

26

30

32

36

37

40

40

40

Page 8: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

19

3.3. Justificación de la investigación

4. OBJETIVOS

4.1. Objetivo general

4.2. Objetivos específicos

5. MATERIALES Y MÉTODOS

5.1. Métodos para alcanzar el primer objetivo específico

5.1.1. Secuencias de regulación del locus de β-globina

5.2. Métodos para alcanzar el segundo objetivo específico

5.2.1. Obtención de secuencias para alinear

5.2.2. Determinación de las coordenadas en el cromosoma

5.3. Métodos para alcanzar el tercer objetivo específico

5.3.1. Ubicación de los genes de β-globina en cada especie

5.4. Métodos para alcanzar el cuarto objetivo específico

5.4.1. Secuencias de regulación conservadas

5.4.2. Secuencias en formato FASTA

5.5. Métodos para alcanzar el quinto objetivo especifico

5.5.1. Agrupación de secuencias según factor de transcripción

6. RESULTADOS Y DISCUSIÓN

6.1. Colección de sitios de regulación

6.1.1. Factores de Transcripción

6.2. Patrón de conservación de los sitios de regulación colectados

6.3. Localización de los genes del cluster de β-globina en las diferentes especies

6.4. Ubicación de los sitios de regulación en el genoma de cada especie

41

42

42

42

42

44

44

47

47

48

49

49

51

51

52

54

54

54

54

55

56

58

63

Page 9: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

20

6.4.1. Conservación del orden en que se ubican los sitios de regulación

6.4.2. Locus de la Región de Control

6.4.3. Aisladores

7. CONCLUSION

8. RECOMENDACIONES

9. REFERENCIAS

10. ANEXOS

10.1 Anexo 1. Protocolo para determinar las coordenadas de las secuencias de

regulación conservadas en varias especies

10.2. Anexo 2: Protocolo para determinar las coordenadas de los genes de la

familia de β-globina en el genoma de cada especie incluida en el estudio

10.3. Anexo 3. Secuencias de regulación obtenidas a partir de la base de datos

TransFac®

10.4. Anexo 4. Sitios de regulación obtenidos a partir de la revisión

bibliográfica.

10.5. Anexo 5. Coordenadas de los sitios de regulación conservados en

diferentes especies

10.6. Anexo 6: Coordenadas de las secuencias colectadas según el factor de

transcripción que a estas se une

10.7. Anexo 7. Secuencias de regulación conservadas ordenadas de acuerdo a su

ubicación en el cluster de β-globina

10.8. Anexo 8. Secuencias en formato FASTA de los sitios de regulación

colectados.

72

76

79

81

84

85

92

92

98

103

105

107

110

113

117

Page 10: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

21

RESUMEN

La expresión de los genes de β-globina es específica a un tipo de tejido celular y a la

etapa del desarrollo. El mecanismo que controla la especificidad de la expresión de

cada gen del cluster requiere de elementos de regulación proximales y dístales, como

lo es el Locus de la Región de Control (LCR). A pesar de la gran cantidad de

información disponible acerca de la regulación de los genes de β-globina, aun hay

mucho por entender acerca del mecanismo que regula tal patrón de expresión. El

objetivo de este proyecto es determinar, a través de métodos computacionales, que tan

similares son los elementos de regulación del cluster de β-globina en diferentes

vertebrados. Se colectaron a través de la base de datos TransFac® y de revisión crítica

de la literatura, 122 secuencias de regulación del cluster de β-globina en diferentes

especies. Basándose en alineamientos de secuencias, se determinó el número de

secuencias posiblemente conservadas en humano, chimpancé, ratón, rata, perro y

pollo, así como las coordenadas para los sitios de regulación presentes en cada

especie. En el cluster de β-globina de los mamíferos se ubicaron los sitios

hipersensitivos HS2, HS3 y HS4, y en el del ave los sitios HS2 y HS4, los cuales no

muestran homología con los encontrados en los mamíferos. De forma similar, se

mapearon los genes de β-globina logrando así comparar la organización del cluster en

los mamíferos y el ave. Los datos colectados en este proyecto aportan la materia prima

para el estudio del patrón de evolución de los mecanismos de regulación de la

expresión de los genes de β-globina.

Page 11: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

22

ABSTRACT

The β-globin genes are expressed in a tissue and stage specific manner. The

mechanism controlling the stage specific expression of each gene of the cluster

requires both, proximal and distal elements as the Locus Control Region (LCR).

Despite the vast amount of information regarding the β-globin genes regulation, the

actual mechanism of regulation remains still unclear. This project aims to determine

how similar the β-globin gene regulatory elements are among some vertebrates. 122

transcription factor binding sequences from the β-globin cluster of different species

were collected using TransFac® data base and also from a bibliographic review. The

number of conserved sequences among human, chimp, mouse, rat, dog and chicken

were determined based on sequence alignments. The chromosome coordinates of each

regulatory site as well as of each gene were determined to locate them in the cluster on

each species under study. The location of the sites and genes enabled to establish a

comparison of their arrangement within the β-globin cluster. It was possible to

recognize the mammal conserved sites HS2, HS3, HS4 which are part of the LCR. On

the other hand, the HS2 and HS4 were located in the chicken cluster, but these sites

were not homologous to those of mammals. The comparison of the collected

sequences made possible to find a region in the mammals� cluster which may be

homologous to an enhancer described in chicken. The data collected in this project

represents the working material to establish the pattern of evolution of the β-globin

cluster regulatory mechanisms.

Page 12: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

23

1. INTRODUCCION

El advenimiento de proyectos de secuenciación de genomas completos ha hecho

posible conocer la secuencia de varios genomas eucariotas entre otros, S. cervisiae,

1997; C. elegans, 1999; D. melanogaster, 2000; humano, 2001; ratón, 2002; pollo,

2004 (el año hace referencia a la publicación del primer borrador de la secuencia). Lo

cual representa una gran cantidad de información de la cual aun hay mucho por

interpretar. Es por esto que el siguiente reto es predecir la función de cada uno de los

genes del genoma. Un acercamiento a dicho entendimiento se logra a través del

estudio de los mecanismos de regulación y cómo estos se han conservado a través del

tiempo. La realización de este proyecto aporta un acercamiento a la obtención de ese

conocimiento

Los mecanismos que gobiernan la regulación de la expresión específica, a un tipo

celular y a una etapa del desarrollo, del gen de la β-globina han sido ampliamente

estudiados, muchos de estos estudios han caracterizado varias secuencias de

regulación y los respectivos factores de transcripción que se unen a estas (Hardison, et

al, 1998; Hardison, 2001; King, et al, 2005; Dorschner, et al. 2004). Sin embargo, a

pesar de todo el conocimiento que hay acerca de la regulación transcripcional de la

expresión de los genes que codifican para β-globina, poco se conoce acerca de la

dinámica evolutiva que dio origen a esos mecanismos de regulación.

Este proyecto propone el primer paso en el estudio de la evolución del mecanismo de

regulación propio a la expresión de los genes de β-globina, mediante la colección y

ubicación de secuencias de regulación en este cluster en diferentes especies.

A través de la búsqueda en la base de datos TransFac® y en la literatura, se colectaron

las secuencias de unión a factores de transcripción dentro del cluster de β-globina y se

identificaron los posibles sitios conservados en las diferentes especies incluidas en el

Page 13: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

24

estudio (humano, chimpancé, ratón, rata, perro y pollo). Cada secuencia de regulación

conservada se ubico en el genoma de cada especie y así fue posible establecer

comparación de la organización del cluster en las diferentes especies. Así mismo, con

base en la ubicación de las secuencias de regulación se reconocieron regiones en el

cluster donde pueden localizarse más sitios de regulación aun no mapeados.

El reconocimiento de elementos de regulación dentro de las regiones de DNA no

codificante representa un reto por que se trata de secuencias muy cortas que se pueden

repetir al azar en el genoma y distinguir cuales de esas son funcionales en términos de

regulación, es una predicción cuyos criterios son difíciles de limitar (Mariño-Ramírez,

et al. 2004). Este proyecto, mediante la colección y ubicación de secuencias aporta las

bases para la posterior búsqueda de más elementos de regulación.

Así, los datos colectados en este proyecto permiten un acercamiento al escenario

general de la regulación del cluster de β-globina en diferentes especies al generar un

mapa con la ubicación de las secuencias de regulación respecto a la de los genes en el

cluster de cada especie, permitiendo reconocer las regiones en el cluster propensas a

contener elementos de regulación, así como patrones conservados en la organización

de las secuencias en el cluster.

De esta forma, se aporta la información que facilitará el uso de algoritmos

computacionales para la búsqueda de elementos de regulación así como para

determinar los motivos de regulación conservados a partir de las secuencias

colectadas. Siendo entonces la base a partir de la cual se puede estudiar el patrón de

evolución de los mecanismos de regulación de los genes de β-globina.

Page 14: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

25

2. MARCO TEORICO Y REVISION DE LITERATURA

2.1. Regulación de la expresión génica

Todas las células requieren un programa especial de regulación de la expresión de sus

genes. Programa que le permite a la célula tener unos genes activos mientras otros

están silenciados según los requerimientos en un determinado momento.

La iniciación de la trascripción es el paso más importante en la regulación de la

expresión de un gen. El control de la trascripción es un mecanismo donde participan

secuencias de acción cis y factores de transcripción. Las secuencias de acción cis

generalmente están en la región 5� del sitio de inicio de la trascripción aunque algunas

están corriente abajo o incluso dentro de la secuencia del gen (Levine y Tjian, 2003).

Estas secuencias son la región de reconocimiento para los factores de acción trans los

cuales se unen a las secuencias cis generando en el DNA modificaciones que pueden

activar o reprimir la transcripción de determinado gen. Generalmente, los mecanismos

de regulación de la expresión de un gen involucran varias secuencias cis y por tanto

varios factores de trascripción, la interacción entre dichos factores y de estos con las

secuencias cis hacen del proceso de regulación un complejo con múltiples opciones de

represión y activación (McClean, 1997).

En el proceso de regulación de la expresión de un gen interviene la expresión de otros

genes y sus secuencias cis y factores trans haciendo parte de una cascada de eventos

genéticos, dado que los factores de trascripción en si mismos también son objeto de

regulación (Struhl, 2001).

Page 15: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

26

2.1.1. Secuencias cis de regulación

2.1.1.1.Promotores

Los promotores son secuencias ubicadas en el lado 5� del sitio de inicio de la

transcripción, la función de estas secuencias es indicar donde esta el sitio a partir del

cual se inicia la transcripción. Algunas de las secuencias de promotores se han

conservado y son iguales en muchos genes, estas secuencias conservadas como la caja

TATA, el elemento BRE y el sitio INI hacen parte del promotor basal (Blackwood y

Kadonaga, 1998).

Corriente arriba al promotor basal, entre -50 a -200pb del sitio de inicio de la

transcripción, se localizan el promotor proximal el cual contiene varias secuencias a

las que se unen un subgrupo de factores de transcripción: SP1, CTF y CBF. Por otra

parte, la caja CAAT se ubica entre 50 a 130pb del sitio de inicio (McClean, 1997). A

la caja CAAT se une el factor de trascripción C/EBP del ingles �CAAT Box Enhancer

Binding Protein�.

En la combinación apropiada, los promotores pueden dirigir a la RNA polimerasa II

par el inicio de la transcripción.

2.1.1.1.1. Elementos Proximales de Regulación

Los elementos proximales hacen parte del promotor basal y son requeridos para la

correcta regulación espacio-temporal de un gen. Dentro de los elementos de

regulación proximal se incluyen la caja TATA, el sitio de reconocimiento de TFIID

(BRE), el iniciador (INR) y el promotor corriente abajo (DPE) (Wray, et al. 2003).

La caja TATA es una región rica en adeninas y timinas que se localiza a más o menos

a partir del nucleótido 30 corriente arriba del sitio de inicio de la transcripción. Este

Page 16: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

27

sitio es reconocido por la subunidad TBP (�TATA binding protein�) del complejo

TFIID. Inmediatamente corriente arriba de la caja TATA se encuentra el sitio BRE el

cual incrementa la afinidad de la proteína TFIID a la caja TATA al contener otro sitio

de reconocimiento para este complejo. El sitio iniciador INR es una secuencia

conservada que contiene el sitio de inicio de la transcripción, su función es dirigir la

iniciación de la transcripción. Finalmente el elemento DRE, se localiza a cerca de

30pb corriente abajo del sitio de inicio y es reconocido por el factor asociado a TBP

(Butler y Kadonaga, 2001; Levine y Tjian, 2003) (Figura 1)

Además del promotor basal y el proximal, la mayoría de genes contienen sitios de

unión proximales localizados en el extremo 5� del promotor. Los factores que se unen

a estos sitios pueden servir como elementos que atraen los �enhancers� dístales a los

promotores (Calhoun, et al. 2002).

Figura 1. Estructura general de un gen en un mamífero con la ubicación aproximada

de los sitios de regulación cis. (Tomada de Levine y Tjian, 2003)

Page 17: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

28

2.1.1.2. �Enhancers�

Los organismos eucariotas son capaces de expresar sus genes en respuesta a

condiciones ambientales y del desarrollo, mostrando patrones de expresión génica

complejos, diversos y a la vez precisos. Lo anterior sucede gracias a los �enhancers�,

secuencias de DNA relativamente cortas que contienen múltiples sitios de unión a

proteínas que activan la transcripción.

Así, los �enhancers� son secuencias que incrementan la tasa de transcripción de un

gen. Las regiones de control de la transcripción generalmente contienen varios

�enhancers� que pueden variar en tamaño desde 50pb hasta 1.5kb (Blackwood y

Kadonaga, 1998). Cada una de esas secuencias desarrolla una función específica

como la activación de un gen en un tipo celular determinado y en un estado particular

del desarrollo. Un gen, puede tener entonces varias de estas secuencias �enhancer�,

cada una de las cuales contribuye de forma tanto espacial como temporal a la

regulación de la expresión del gen.

Este tipo de secuencias de acción cis pueden localizarse tanto corriente arriba como

corriente abajo del gen y pueden actuar desde distancias tan amplias como ~50kb.

Debido a que actúan a grandes distancias del gen, generalmente requieren que el DNA

adquiera conformaciones en bucles (�loops�) lo cual acerca la proteína activadora,

unida al �enhancer� distal, a los complejos de proteínas asociados con el promotor.

Los �enhancers� generalmente activan la transcripción de forma específica al tejido,

es decir que inducen la transcripción de un gen en uno o algunos tipos celulares

(Blackwood y Kadonaga, 1998).

Page 18: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

29

2.1.1.3. Silenciadores

A los silenciadores se unen complejos de proteínas represoras interfiriendo con la

actividad del promotor de manera que reducen la expresión del gen. Los silenciadores

tienen una función antagonista con respecto a los �enhancers� y al igual que estos, los

silenciadores pueden actuar desde grandes distancias (Harju, et al, 2002).

2.1.1.4. Aisladores

Los aisladores son secuencias de DNA con sus respectivas proteínas de unión cuyo

rol es establecer o mantener los límites entre dominios de cromatina transcripcional.

Estas secuencias tienen un tamaño aproximado de 0.5 a 3kpb (Blackwood y

Kadonaga, 1998) y protegen el locus de la heterocromatina que lo rodea. Pueden

actuar como elementos que flanquean el dominio transcripcionalmente activo y

también pueden evitar la acetilación de las histonas (Harju, et al, 2002) haciendo más

difícil la unión de los factores de trascripción al DNA.

Existen dos tipos de aisladores, los que establecen dominios que separan promotores

de �enhancers� impidiendo su interacción (�enhancer-blocking�), y los que generan

una barrera que evita la extensión de la heterocromatina (�barrier insulators�). Los

aisladores de bloqueo de �enhancers� también protegen contra algunos tipos de

represores transcripcionales. Algunos aisladores pueden tener las dos funciones:

bloquear la actividad de los �enhancers� y generar barreras (West, et al. 2002;

Gaszner y Felsenfeld, 2006).

2.1.1.5.MARs/SASs

Estas son regiones de unión a matrices o regiones de unión a �scaffold�, promueven la

unión a la matriz nuclear generando la formación de bucles de DNA, la formación de

estos bucles puede alejar el locus de los efectos negativos de la cromatina alrededor.

Page 19: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

30

Así mismo, la unión a matrices puede facilitar la activación de la trascripción con la

formación de los �loops� de DNA acercando los elementos cis de regulación. De este

modo, los elementos MARs pueden ayudar en la interacción de secuencias cis de

regulación distantes y promotores (Harju, et al, 2002).

2.1.1.6. Elementos Aislantes

Estos elementos se pueden ubicar en diferentes posiciones dentro del locus y pueden

tener un rol restrictivo de la transcripción cuando se asocian a una proteína de unión al

DNA. Es posible que los elementos aislantes estén relacionados con mantener

constante el estado abierto o cerrado de la cromatina. Así mismo, también contienen

elementos de acción cis que previenen la acción negativa de cromatina externa al

dominio.

Los elementos aislantes se pueden ubicar tanto corriente arriba como corriente abajo

del locus de la β-globina, mas aun se pueden localizar dentro del locus, demarcando

la expresión regulada por una determinada etapa del desarrollo en un subdominio

(Harju, et al, 2002).

2.1.2. Factores de Transcripción

Los factores de transcripción son proteínas que se unen a las secuencias cis de

regulación de manera especifica. Estas proteínas funcionalmente tienen dos dominios

uno de los cuales es requerido para la unión al DNA y el otro para la activación de la

transcripción (Wray, et al. 2003).

Un gen puede estar regulado por varias secuencias de acción cis y por tanto ser objeto

de la influencia de varios factores de transcripción cuyos sitios de unión están

repartidos a lo largo del cromosoma. Algunos factores pueden estar restringidos a un

tipo celular determinado y operar únicamente durante etapas específicas del desarrollo.

Page 20: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

31

Por ejemplo GATA-1 es un factor de transcripción específico a los eritrocitos. GATA-

1 puede actuar como represor o activador dependiendo del contexto de su secuencia de

unión y de la interacción con otras proteínas. GATA-1 actúa como activador cuando

se une al promotor del gen γ-globina o como represor cuando se une al silenciador del

gen ε-globina. De esta forma, GATA-1 es requerido para determinar que gen se

expresa durante la maduración de los glóbulos rojos (Harju, et al. 2002; Welch, et al.

2004).

La transcripción eficiente requiere la combinación y la acción en sinergia de múltiples

factores, varias combinaciones diferentes de factores son capaces de activar la

transcripción. Como consecuencia puede haber un limitado número de factores de

transcripción que pueden organizarse en diferentes combinaciones cada una de las

cuales representa una forma biológicamente distinta de regular la expresión de un gen

(Struhl, 2001).

La capacidad de los factores de transcripción de unirse a una secuencia específica de

DNA la confiere el dominio de unión el cual hace parte del motivo estructural del

factor. Entre los motivos estructurales mas comunes están el homeodominio, �helix-

loop-helix� (HLH), �Zinc fingers�, �Leucine zipper� y �Winged Helix� (McClean,

1997). En general, una hélice alfa en el dominio de unión de un factor de

transcripción, interactúa con el surco mayor del DNA en la secuencia de unión. Los

factores de transcripción son proteínas que suelen tener un solo dominio de unión al

DNA y uno o más dominios de activación o represión a los cuales se podrían unir

otras proteínas (Lemon y Tjian, 2000).

2.2. Cluster de genes de β-Globina

En general en las aves y mamíferos, los genes que codifican las globinas están

agrupados en dos clusters en uno de los cuales se ubican los genes para α-globina y en

otro, en un cromosoma diferente, los de la β-globina.

Page 21: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

32

En los humanos, el cluster de los genes de la β-globina consiste en una familia de

cinco genes funcionales, un pseudo gen y un elemento distal de regulación ubicado

corriente arriba. Los cinco genes tienen un patrón de expresión específico al tejido y al

estado del desarrollo y se ubican espacialmente en el cromosoma 11 (70kb) en el

mismo orden en que se expresan durante ontogenia (Figura 2) (Harju, et al, 2002).

Figura 2. A. Estructura del cluster de genes de β-globina en humano. El locus consiste

en cinco genes funcionales y un pseudo gen. El orden de los genes en el cromosoma

coincide con el orden de su expresión durante el desarrollo. Corriente arriba a los

genes se encuentra el locus de la región de control, LCR, caracterizado por cinco sitios

hipersensibles. B. Patrón de expresión de los genes de β-globina. El eje �x� es la edad

del feto en semanas y el eje �y� la expresión del gen en porcentaje del total de globina

expresada. (Figura tomada de Harju, et al. 2002).

Page 22: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

33

El gen ε-globina se expresa en el saco embrionario donde ocurre la eritropoyesis

embrionaria o primitiva durante las seis primeras semanas de gestación en los

eritrocitos primitivos, los cuales son nucleados. Mientras el gen ε-globina se expresa,

los genes γ- y β-globina están silenciados. Así mismo, cuando la expresión de los

genes Gγ- Aγ-globina se activa en las células hematopoyeticas definitivas en el hígado

del feto, el gen ε-globina es silenciado. Finalmente, el gen β-globina, y el δ-globina,

se activan en la medula ósea y en el bazo, donde ocurre la eritropoyesis adulta

definitiva. Recíprocamente, al activarse β- y δ-globina, los genes γ-globina no se

expresan. En el adulto δ-globina se expresa en bajos niveles mientras que β-globina es

producida en abundancia (Harju, et al, 2002).

2.2.1. Evolución del cluster de los genes de β-Globina

Pocas proteínas han sido estudiadas en tantos organismos como lo han sido las

diferentes formas de globina (Hardison, 2001; Hardison y Miller, 1993; Wheeler, et al.

2001). La familia de las globinas ha sido estudiada fisiológicamente en bacterias,

hongos, plantas y animales y su rol varia desde catalizar la combinación de oxigeno y

oxido nítrico para formar nitrato en bacterias, levaduras e invertebrados, hasta el

transporte de oxigeno en la sangre en los vertebrados (Hardison, 1998). Esta diferencia

de funciones ilustra la adquisición de nuevos roles por parte de genes estructurales

preexistentes lo cual requiere cambios tanto en las secuencias que codifican como en

los elementos de regulación de los genes (Hardison, 1998).

La comparación de los genes de la β-globina en varias especies de mamíferos

placentarios ha permitido estimar que en la evolución de este cluster han ocurrido

eventos de duplicación de los genes a partir de un ancestro común hace

aproximadamente 450 millones de años. Según Wheeler y colaboradores (2001), estos

eventos de duplicación permitieron la evolución de las diferentes formas de globina de

acuerdo a los requerimientos de transporte de oxigeno en las diferentes etapas del

Page 23: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

34

εI εII ψβX βC εIII εIV ψβZ βA εV εVI ψβY βF

ε γ ψη δ β

ε Gγ Aγ ψη δ β

ε γ ψδ β

y bh0 bh1 bh2 bh3 b1 b2

0 140KB

desarrollo. Se ha postulado que dicho gen ancestral tenía 3 exones separados por dos

intrones (Hardison y Miller, 1993).

El cluster de β-globina incluye los genes ε, γ, ψ, δ y β sin embargo, las duplicaciones

en el cluster ocurrieron de manera independiente en los linajes de las aves y los

mamíferos. El proceso de duplicación y divergencia en los mamíferos ha generado los

cluster que se muestran en la figura 3 donde se ilustra la organización de los genes de

la β-globina en diferentes mamíferos. La distancia entre los genes es variable y en

muchos casos es resultado de la inserción de retrotransposones (Hardison y Miller,

1993).

Cabra (Capra hircus) Galago (Galago alleni) Humano (Homo sapiens) Conejo (Oryctolagus cuniculus) Ratón (Mus musculus)

Figura 3. Representación de los genes de β globina en diferentes mamíferos

orientación 5� a 3�. Las distancias son aproximadas. (Tomado de Hardison y Miller,

1993).

Page 24: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

35

En las aves, el cluster de la β-globina tiene una organización diferente a la del cluster

en los mamíferos placentarios teniendo dos genes embrionarios en los extremos del

locus y que codifican para ρ-globina y ε-globina, y dos genes para β-globina uno de

los cuales codifica para βH-globina y se expresa cuando el ave sale del huevo y otro

βA-globina se expresa en los glóbulos rojos del ave adulta (Hardison, 2001).

Según afirma Hardison, (2001), los clusters de la β-globina de estos dos taxa, aves y

mamíferos placentarios, se consideraban ortólogos debido a que en las aves es ρ-β-ε y

en los mamíferos placentarios es ε-γ-δ-β , por lo que se pensaba que provenían del

mismo cluster en el ultimo ancestro común entre las aves y los mamíferos. Sin

embargo, el descubrimiento del gen ω-globina en los marsupiales, hizo reconsiderar

esa idea orientándola a que el gen de los Eutheria ε-γ-δ-β sea descendiente de un

cluster diferente al que dio origen al cluster ρ-β-ε- globina de las aves.

El gen ω-globina, presente en los marsupiales, se expresa después del nacimiento.

Holland y colaboradores (1997) realizaron un estudio parcial de la secuencia de

aminoácidos en ω-globina indicando que esta proteína esta mas relacionada con la β-

globina de las aves que con la de los mamíferos placentarios y marsupiales.

Estudios mas recientes indican que el gen ω-globina forma un grupo hermano con los

genes ρ-β-ε-globina de las aves, al estar mas relacionado con los de este cluster en las

aves que con cualquier gen β-globina en mamíferos incluyendo los del marsupial. Así,

este grupo esta claramente separado de la β-globina en Eutheria y marsupiales.

Además, estos estudios muestran que el gen ω-globina esta ubicado en un cluster

diferente al de la β-globina (Wheeler, et al. 2001).

De esta forma los marsupiales tienen un gen ω-globina similar a los genes de β-

globina en las aves y además tienen el cluster de gen β-globina el cual es similar al de

los mamíferos placentarios. Es posible que ambos clusters (ω-globina y β-globina)

Page 25: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

36

hayan sido heredados de un ancestro común con las aves y los mamíferos. De haber

sido así, los genes de la β-globina de los mamíferos placentarios y las aves no serian

ortólogos, es decir no habrían evolucionado directamente a partir de un mismo gen

ancestral. Según esto, el cluster ancestral se debió duplicar antes de la divergencia de

aves y mamíferos y una ves duplicados uno de los cluster divergió para dar origen al

cluster de la β-globina ε-γ-δ-β- encontrado en los mamíferos placentarios y el cluster

ε-β de los marsupiales. Mientras que, la otra duplicación del cluster ancestral bebió dar

lugar al cluster ρ-β-ε de las aves, y al gen ω-globina de los marsupiales (Figura 4).

Figura 4. Modelo de evolución independiente de los cluster de β-globina en aves y

mamíferos. El diagrama muestra el cluster ancestral con los genes pβ (proto globina).

El modelo propone la duplicación del cluster ancestral para generar el ancestro de los

genes β-globina de los eutheria (eβ1 y eβ2) y el ancestro de los genes β-globina de las

aves (aβ1 y aβ2). La vía de evolución relacionada con los genes β-globina de

mamíferos placentarios se muestra en rojo y la relacionada con los genes β-globina de

las aves en azul. La duplicación de los genes esta indicada con círculos amarillos y la

separación de los genes por eventos de especiación esta señalada con rombos (Figura

tomada de Hardison, 2001).

Page 26: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

37

2.2.2. Regulación de la expresión del cluster de genes de β-Globina

La transcripción del complejo de genes β-globina es regulada por elementos

proximales y por un elemento distal conocido como el locus de la región de control,

LCR �Locus Control Region� además de las secuencias de acción cis antes enunciadas

y que son típicas de la regulación de expresión de un gen. La forma como es regulada

la expresión del gen involucra interacción de varias moléculas entre si y con sus sitios

de unión al DNA. Además, las modificaciones en la cromatina también puede alterar

el patrón de expresión del gen.

2.2.2.1. Locus de la región de control (LCR)

El locus de la región de control físicamente esta definido por la presencia de cinco

sitios hipersensibles (HS) a DNasa I localizados entre 2 y 22kb corriente arriba del

gen de la ε-globina (Figura 2) los sitios HS son susceptibles a digestión con DNasa I

debido a que en ellos hay disrupción del nucleosoma, esto permite que el DNA este

accesible para la trascripción y los factores de remodelación de la cromatina.

Contrario a la mayoría de las secuencias de regulación cis, LCR funciona a largas

distancias para activar la expresión del gen y mantener abierto el dominio de

cromatina del gen β-globina en los eritrocitos. (Harju, et al, 2002; Kim y Dean, 2004)

En la tabla 1. Se describe la actividad de cada sitio HS dentro de LCR.

Los primeros estudios en la regulación del locus de la β-globina sugieren una vía de

activación transcripcional que incluye la pre-activación del locus la cual es detectada

como un incremento en la susceptibilidad a la digestión con DNasa I. Una vez

preactivado el locus, los genes pueden ser activados. Este modelo que involucra

competencia transcripcional antes de la activación de la trascripción es reafirmado por

la acción de la región LCR en la regulación del locus de la β-globina. Puesto que LCR

actúa primero en el estado del desarrollo previo a la activación de los genes para ser

transcritos, dejando a los cinco genes del locus competentes pero transcripcionalmente

Page 27: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

38

inactivos. Una vez en dicho estado, cada gen es regulado por �enhancers� y represores

específicos a cada estado del desarrollo (Blackwood y Kadonaga, 1998).

Tabla 1. Actividad de cada región hipersensible dentro de LCR (Actividad observada

en ratones transgenicos) (Tomada de Harju y Colaboradores, 2002)

Sitio hipersensible Actividad

5�HS4

Activación de la trascripción

Expresión independiente de la posición

Expresión independiente del numero de copias

5�HS3

Activación de la trascripción

Expresión independiente de la posición cuando esta ligado al gen de la

β-globina

Expresión dependiente del numero de copias cuando esta ligado al gen

de la β-globina

Expresión dependiente de la posición cuando esta ligado al gen Aγ-

globina

Actividad de remodelación de la cromatina.

5�HS2

Actividad de �enhancer�

Expresión independiente de la posición.

Expresión dependiente del número de copias.

Tiene secuencias de caja E (sitios de unión para factores de

trascripción de dominio �Helix-loop-helix�)

Posee secuencias de unión a: GATA-1, NF-E2, Sp1, Ap-1, USF; todas

son necesarias para la actividad de �enhancer�.

La deleción de un sitio de unión a un factor de trascripción no impide

la expresión independiente de la posición.

No tiene actividad de �enhancer� por si mismo, requiere la presencia

de otros sitios LCR HS

5�HS1 No tiene actividad de activación de la trascripción

5�HS5 Tiene secuencias homologas a MARs y puede funcionar como

aislador.

Page 28: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

39

Estudios en el locus de β-globina en pollo han mostrado que el establecimiento del

estado competente se relaciona con un incremento de la acetilación de las histonas y

en la susceptibilidad a la digestión con DNasa I, eventos que están relacionados pues

la hiperacetilación de las histonas conlleva al desdoblamiento del DNA que a su vez

facilita la accesibilidad de factores al DNA (Factores como DNasa I o factores de

transcripción) (Blackwood y Kadonaga, 1998).

La función de la región LCR fue definida con base a estudios con transgenes. A partir

de dichos estudios se observo que los sitios HS actúan en sinergia para interactuar

directa o indirectamente con los elementos de regulación proximales al gen ejerciendo

la regulación apropiada. Así mismo se pudo observar que la función de LCR como

unidad puede depender de la orientación debido a que 5�HS5 tiene función de aislador,

si la secuencia LCR es invertida estaría aislando los genes del cluster de la interacción

con LCR y por tanto estaría silenciándolos (Harju, et al, 2002).

Choi y Engel, (1988) propusieron la hipótesis de competencia para explicar la forma

como el sitio LCR interactúa con los genes de la β-globina de acuerdo a la etapa del

desarrollo en aves. Dicha hipótesis afirma que los promotores de cada gen en el cluster

compiten por la interacción con el sitio LCR durante el desarrollo de forma que,

durante el estado embrionaria la disponibilidad de factores específicos a este estado

favorecen la interacción entre LCR y el gen ε-globina; mientras que en el estado

adulto, la presencia de factores específicos de la edad adulta favorecen la interacción

entre LCR y el gen β-globina. Además de la competencia entre los promotores para el

cambio de gen que se expresa en determinado momento del desarrollo, en el caso de

los mamíferos, el orden normal de los genes en el locus de β-globina también

desempeña un rol importante en la temporalidad de la expresión de los genes (Enver,

et al. 1990). Así, el contexto del locus (orden de los genes en el cluster) y los factores

de transcripción que influyen en la interacción entre LCR y los genes de β-globina

actúan en sinergia para regular la expresión de los genes durante el desarrollo

(Tanimoto, et al. 1999; Ryan, et al. 2000).

Page 29: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

40

De otra forma, en el promotor distal del gen ε-globina hay un silenciador el cual

controla la represión autónoma de la expresión del gen ε-globina durante el estadio

fetal y la vida adulta. Algunos estudios mutacionales en ratones sugieren que este

silenciador contiene secuencias importantes para la activación del transgen γ-globina

durante el estado embrionario del ratón. Otros elementos asociados a este silenciador

son repeticiones directas (DR) proximales al promotor ε-globina a las cuales se unen

proteínas eritroides definitivas (DRED) esta unión interfiere con un factor de unión al

promotor llamado �Kruppel-like� factor (EKLF) De esta forma, el silenciador detiene

la expresión del gen ε-globina (Harju, et al, 2002).

Es claro que LCR tiene un rol en la expresión de los genes de β-globina sin embargo,

aun no es claro el mecanismo por el cual el sitio LCR interactúa con los genes de la

globina Harju y colaboradores (2002) así como Li y colaboradores (2002) enuncian

cuatro posibles formas de interacción, estas son:

• Modelo �Loop�

Este modelo sugiere que las regiones 5�HS se doblan formando un complejo en cuyo

centro están los sitios HS activos a los cuales se unen los factores de transcripción,

además también están las secuencias flanqueantes limitando dicho complejo. Esta

estructura se acerca al promotor proximal, mediante un loop en el DNA, llevando

consigo los factores de trascripción de modo que puedan interactuar con el complejo

de trascripción unido al promotor activando así la expresión del gen.

• Modelo �Tracking�

Este modelo propone que los factores y co-factores de transcripción se unen a las

secuencias LCR formando un complejo de activación que migra linealmente sobre el

DNA hasta encontrarse con la maquinaria de transcripción sobre el promotor,

activando así la transcripción.

Page 30: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

41

• Modelo de migración facilitada

Este modelo combina aspectos del modelo �loop� y del modelo �tracking�. Los

factores de transcripción se unen a las secuencias 5�HS del LCR y este complejo

migra a lo largo de la cromatina hasta que encuentra el promotor momento en el que

se forma un �loop� estable para asegurar la interacción entre el promotor y las

proteínas unidas a los sitios 5�HS.

• Modelo de enlace

Sugiere que hay unión de factores de manera secuencial con proteínas facilitadotas a

través del locus las cuales ayudan a definir el dominio transcipcional. Los factores de

transcripción unidos a los promotores y los sitios HS se ponen en contacto a través de

una cadena de factores facilitadotes, los cuales no se unen al DNA.

2.2.2.2. Regulación de la expresión del gen a través de modificaciones de la

cromatina

Las modificaciones en la cromatina tienen un rol importante en el control de la

transcripción (Mariño-Ramírez, et al, 2005). Los cambios generales de la cromatina

como acetilación, fosforilación y metilación tienen un efecto en la activación de un

locus:

• Acetilación

La acetilación ocurre en las histonas y varía de acuerdo a la fase del ciclo celular. Al

ocurrir en las histonas, la acetilación genera disrupción del contacto del DNA con el

nucleosoma permitiendo a los factores de transcripción acceder al DNA y activar la

expresión de un gen. De esta forma, la hiperacetilación esta asociada con la activación

de la transcripción de un locus. Los factores que influyen en la acetilación de la

Page 31: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

42

cromatina del locus de la β -globina pueden ser puntos importantes de control de la

expresión del gen. Por ejemplo, La acetilación en la histona H4 induce la formación

del complejo de preiniciación de la transcripción con el factor TFIID, el factor de

trascripción NF-E2, propio de los eritrocitos, se unen a TFIID haciendo posible la

activación del gen. De esta forma, la acetilación puede servir como un indicador de la

actividad transcripcional en el locus del gen de la β �globina (Harju, et al. 2002).

• Fosforilación

El efecto de la fosforilación de la cromatina en la regulación de la expresión de un gen

es similar al de la acetilación. La fosforilación de la histona H3 interrumpe la

interacción DNA-nucleosoma incrementando la accesibilidad de factores de

transcripción al DNA. Las vías PAPkinasa y p38, las cuales son inducidas en respuesta

a estrés, activan la fosforilación de H3 (Harju, et al. 2002).

• CpG Metilación

Contrario al efecto en la iniciación de la trascripción que tienen la acetilación y la

fosforilación de la cromatina, la metilación actúa como una barrera a la formación del

complejo de preiniciación de la transcripción y a la accesibilidad de los factores de

transcripción al DNA. La metilación no afecta la conformación del nucleosoma. Las

áreas activas de la cromatina generalmente no están metiladas y la metilación de las

islas CpG en regiones de promotores están asociadas con pérdida de la

hipersuceptibilidad a DNasa-I (Harju, et al. 2002).

• Complejos de remodelación de la cromatina

SWI/SNF: Están relacionados con regulación de la estructura de la cromatina y

transcripción mediante la movilización de nucleosomas por el rompimiento y

reestablecimiento de contactos entre el DNA y las histonas.

Page 32: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

43

PYR: Este complejo se une a secuencias de DNA ricas en pirimidinas entre los genes

y- y δ-globinas. La unión depende tanto de la secuencia como del tamaño de esta. El

complejo PYR se puede unir a los elementos aislantes de los genes ε-γ-δ-β-globina

influyendo en el cambio de la estructura de la cromatina en el locus durante el cambio

de γ a β-globina.

HATs: Histona acetil transferasas. Transfieren grupos acetil a lisinas específicas en

las proteínas reduciendo la carga positiva en ellas por tanto disminuyendo la unión de

estas proteínas al DNA, cargado negativamente. Sin embargo, la acetilación del factor

GATA-1 cambia la conformación de la proteína e incrementa su capacidad de unión al

DNA (Harju, et al. 2002).

2.2.2.3. Factores de transcripción propios de la expresión de los genes de β-

Globina

Se han descrito y caracterizado varios factores de trascripción que controlan la

expresión del gen de la β -globina. Estos factores forman una red de interacciones

proteína-proteína, proteína-DNA, con los promotores, con las regiones HSs de LCR y

con otras regiones ínter génicas de acción �cis. En la tabla 2 se recopila dicha

información con base a la revisión de Harju y colaboradores (2002).

Page 33: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

44

Tab

la 2

. Fa

ctor

es d

e tra

nscr

ipci

ón q

ue in

terv

iene

n en

la re

gula

ción

de

la e

xpre

sión

de lo

s

gene

s de β-

glo

bina

Page 34: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

45

Fact

or

Dom

inio

Si

tios d

e un

ión

Mec

anis

mo

Func

ión

NF-

E2

Car

acte

rizad

o en

hu

man

o (T

albo

t, et

al.

1990

; N

ey, e

t al.

1990

) y

en

rató

n (C

han,

et

al. 1

993)

Het

erod

imer

o

Leuc

ine

zipp

er

Tien

e do

s su

buni

dade

s m

af

p45

y p1

8.

Las s

ubun

idad

es s

e un

en c

omo

hom

odim

eros

o

hete

rodi

mer

os a

M

AR

Es q

ue so

n sit

ios

de re

cono

cim

ient

o pa

ra

prot

eína

s maf

El p

oten

cial

de

activ

ació

n de

l com

plej

o N

F-E2

es

mod

ulad

o po

r la

inte

racc

ión

de la

su

buni

dad

p45

con

dife

rent

es su

buni

dade

s m

af

lo q

ue re

sulta

en

dife

rent

e es

peci

ficid

ad d

e la

re

gula

ción

.

La u

nión

de

NF-

E2 a

sitio

s M

AR

E de

ntro

de

LCR

del

ge

n de

la β

-glo

bina

es

nece

saria

par

a la

act

ivac

ión

de la

tras

crip

ción

y p

ara

la

form

ació

n de

sitio

s HSs

de

ntro

de

LCR

.

GA

TA

-1

Des

crito

en

hum

ano

(Mer

ika

y O

rkin

, 19

93)

GA

TA z

inc-

finge

r que

se

cara

cter

iza

por

pode

rse

unir

a la

re

gión

con

sens

o W

GA

TAR

Se u

ne a

los p

rom

otor

es

de lo

s ge

nes d

e la

β

glob

ina

y a

los s

itios

5�

HS1

al 5

.

Func

iona

com

o ac

tivad

or o

re

pres

or d

epen

dien

do d

el

cont

exto

de

la se

cuen

cia

de

unió

n y

de su

s in

tera

ccio

nes c

on o

tras

prot

eína

s.

Inte

ract

úa c

on o

tros

fact

ores

de

trans

crip

ción

co

mo

SP-1

y E

KLF

Es re

quer

ido

para

el c

ambi

o de

act

ivac

ión

de g

enes

de

la

glob

ina

en la

mad

urac

ión

ce

lula

r. A

ctúa

com

o un

act

ivad

or

cuan

do e

sta

unid

o al

pr

omot

or d

e ge

n de

la γ

-gl

obin

a

Act

úa c

omo

sile

ncia

dor

cuan

do s

e un

e al

sile

ncia

dor

de ε

-glo

bina

en

la p

rese

ncia

de

l fac

tor Y

Y1.

G

AT

A-2

D

escr

ito e

n hu

man

o (D

orfm

an, e

t al.

1992

)

GA

TA z

inc-

finge

r

Se e

xpre

sa e

n m

ayor

ca

ntid

ad e

n la

s cél

ulas

pr

ecur

sora

s de

hem

atop

oyes

is te

mpr

ana.

Esen

cial

par

a he

mat

opoy

esis

embr

ioni

ca.

Impo

rtant

e pa

ra la

di

fere

ncia

ción

de

eritr

ocito

s

FOG

C

arac

teriz

ado

en

Rat

ón (T

sang

, et a

l. 19

97)

Tien

e nu

eve

zinc

-fin

gers

Se u

ne a

GA

TA-1

N

o tie

ne s

itio

de u

nión

en

el D

NA

Se c

o-ex

pres

a co

n G

ATA

-1

en lo

s erit

roci

tos d

uran

te

el d

esar

rollo

em

brio

nario

Fu

nció

n en

hem

atop

oyes

is.

EK

FL

Car

acte

rizad

o en

hu

man

o. (W

ijger

de,

et a

l, 1

996)

Zinc

-fin

ger

Se u

ne c

on a

lta a

finid

ad

al e

lem

ento

CA

CC

C

loca

lizad

o a

-90

con

resp

ecto

al s

itio

de

inic

io d

e la

tra

scrip

ción

.

Se u

ne a

la c

aja

CA

CC

C co

n m

ayor

afin

idad

en

el

prom

otor

del

gen

β-

glob

ina

que

en e

l del

γ-

glob

ina,

sugi

riend

o qu

e es

ta in

volu

crad

o en

la

activ

ació

n de

l pro

mot

or

del g

en d

e la

glo

bina

ad

ulta

. EK

FL ll

eva

el c

ompl

ejo

de

repr

esió

n m

SIN

3a/H

DA

C

a la

regi

ón d

el g

en ε

-gl

obin

a.

Act

iva

el p

rom

otor

del

gen

de

la β

-glo

bina

. Es

timul

a la

form

ació

n de

5�

HS3

. Es

ta im

plic

ado

en e

l cam

bio

de g

lobi

na fe

tal a

glo

bina

ad

ulta

. A

usen

cia

de E

KFL

con

lleva

a

la p

erdi

da to

tal d

e lo

s siti

os

HS

en e

l pro

mot

or d

e β

-gl

obin

a y

a la

per

dida

del

sit

io 5

�HS3

de

LCR

.

CK

II

Ei

No

tiene

uni

ón a

l DN

A.

Fosf

orila

EK

FL

incr

emen

tand

o su

M

odifi

ca la

act

ivid

ad d

e va

rias p

rote

ínas

.

Page 35: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

46

Page 36: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

47

2.2.2.4.LCR y modificaciones de la cromatina

La cromatina ejerce control sobre la expresión genética adquiriendo la conformación

�abierta� o �cerrada�. La cromatina abierta, generalmente esta hiperacetilada y es

susceptible a DNasaI contrario a lo que sucede en la cromatina cerrada.

La acción que desempeña LCR en las modificaciones de la cromatina ha sido

estudiada a partir de mutaciones que ocurren naturalmente dentro del locus humano de

la β-globina y a partir de experimentos en los que utilizan ratones con transgenes de la

β-globina localizados ectópicamente, demostrando que LCR tiene un rol en la

remodelación de la cromatina.

Forrester y colaboradores (1990) ponen en evidencia el rol de LCR en modular la

estructura de la cromatina del locus de la β-globina en ciertas mutaciones propias de

la enfermedad humana talasemia. La talasemia hispana es causada por una deleción de

35kb incluyendo los 22kb de la región LCR. En los individuos con esta mutación la

cromatina del locus de la β-globina tiene conformación cerrada, resistente a digestión

con DNasa I y transcripcionalmente inactiva, demostrando, que la región LCR tiene

función para abrir la cromatina además de su rol directo en la activación del gen de la

globina.

Sin embargo, experimentos en ratón con el transgen y en líneas celulares (Epner, et al.

1998) sugieren que LCR no es necesario para establecer la conformación abierta de la

cromatina del locus y que funciona primordialmente como �enhancer� en la activación

de la transcripción de los genes de la globina. Lo anterior sugiere que LCR puede

participar en la activación transcripcional en un dominio abierto llevando factores de

trascripción adicionales a través de la interacción con el complejo transcripcional ya

formado.

Page 37: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

48

Harju y colaboradores (2002) afirman que la contradicción en los estudios en

mutaciones en talasemias con los realizados en líneas celulares y ratones puede

deberse a diferencias en el tamaño de la deleción.

2.3. Evolución de los mecanismos de regulación de los genes de β-Globina

La forma como han divergido los clusters de la β-globina en los diferentes linajes tiene

una implicación directa en la forma como se regula la expresión del gen en cada uno

de estas.

Debido a que tanto en aves como en mamíferos los clusters de β-globina comparten

varias características de los elementos de regulación, se podría asumir que estos

controles del sistema de regulación se generaron antes de la divergencia entre

mamíferos y aves (Figura 4) por lo que las funciones de regulación de la expresión del

cluster tales como activar la trascripción, abrir el dominio y aislamiento se

encontrarían tanto en mamíferos placentarios como en aves. En los dos grupos, la

expresión de los genes es controlada tanto por elementos dístales (LCR) como

proximales. En las aves, por ejemplo, se describió un aislador en el extremo 5� (HS4)

que bloquea la actividad del �enhancer� (Chung, et al. 1997), un elemento similar ha

sido descrito en los mamíferos, el sitio hipersensitivo 5� HS5, el cual podría ser

homologo al aislador en aves, (Tanimoto, et al. 2003; Farrel, et al. 2002). Sin

embargo, estas características comunes a la regulación de los genes de β-globina en

aves y mamíferos no se ven reflejadas en las comparaciones de las secuencias del

DNA de los clusters (Hardison, 1998). Una investigación mas profunda en las

secuencias que rodean el cluster de la β-globina podría aclarar si el aislador es una

adaptación única para este locus en aves o si el sitio HS5 representa un elemento

homologo en mamíferos (Hardison, 2001).

Se han encontrado corriente arriba del gen ε-β- globina de los marsupiales secuencias

homologas al locus de la región de control LCR de β-globina presente en mamíferos

Page 38: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

49

placentarios. Por otro lado, en el cluster del pollo se ha localizado un �enhancer�entre

los genes βA� y ε -globina. En ratones transgenicos esta secuencia �enhancer� imita la

acción del LCR a pesar de ser mas pequeña y de estar en un sitio diferente comparado

con el sitio de LCR en los mamíferos (Hardison, 2001). De existir un ancestro común

entre los �enhancers� en el cluster de β-globina en el pollo y los que se encuentran

dentro de la región LCR del cluster de los mamíferos, se esperaría que las secuencias

de DNA se hubieran conservado. Sin embargo, estudios realizados por Reitman y

colaboradores (1993) y por Hardison (1998) indican que los alineamientos de las

secuencias de regulación en los genes ρ-β-ε- globina de pollo y el gen β-globina de

humano no encuentran sitios apareables significativos a pesar de que estas secuencias

comparten sitios de unión a factores de transcripción. Por lo tanto, o bien los

elementos de regulación cis comparten un ancestro común pero han divergido tanto

que no es posible alinearlos o han aparecido independientemente en cada grupo

(evolución convergente) (Wheeler, et al. 2001; Hardison, 2001). Sin embargo, la

diferencia en las secuencias de regulación no representa que el mecanismo haya

tenido origen en ancestros diferentes; es decir que, los genes ortólogos no

necesariamente tendrán mecanismos de regulación conservados (Tanay, et al. 2005).

Debido a que las secuencias de regulación son cortas y degeneradas, pueden ocurrir

variaciones en estas manteniéndose los sitios de unión a factores de trascripción

comunes. Este hecho permite un escenario de evolución diferente para las secuencias

de regulación, escenario en donde es posible que nuevos patrones de expresión

coexistan temporalmente con patrones ancestrales. Esta redundancia temporal hace

posible las modificaciones graduales que ultimadamente generan nuevos mecanismos

de regulación (Tanay, et al. 2005). De otra forma, Mariño-Ramírez y colaboradores

(2006) postulan el modelo de evolución �circuitous evolution� para el mecanismo de

regulación de las histonas, el cual difiere de la evolución convergente y sugiere que al

divergir de un mecanismo de regulación ancestral, presente en el ultimo ancestro

común, el patrón de expresión de las proteínas se conserva mientras que los

mecanismos de regulación cambian drásticamente. Este modelo de evolución descrito

Page 39: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

50

en histonas podría observarse también en la regulación de los genes de β-globina,

puesto en estos se ha conservado el patrón de expresión de acuerdo a la etapa del

desarrollo pero los elementos de regulación aparentemente han divergido, pues en

estos no hay secuencias homologas.

Aun hay mucho por conocer respecto a la conservación de secuencias de elementos de

regulación del gen de la β-globina. En los estudios de evolución de secuencias de

regulación, se ha notado que para muchos genes aunque se conserven las secuencias

de las proteínas que codifican no se conservan los mecanismos de regulación

transcripcional (Jensen, et al. 2006). Así mismo, se ha estimado que la tasa de

evolución de los elementos de regulación es diferente de la de las secuencias

codificantes, esto debido a la �flexiblilidad� de estas secuencias que permiten

sustituciones nucleotídicas sin alterar su función. Como resultado, el numero total de

cambios en las secuencias de regulación es mayor que en las secuencias codificadoras

y menor que en los intrones y otras secuencias intergénicas sin función reguladora

(Wray, et al. 2003). Jensen y colaboradores (2006) indican que los cambios en los

mecanismos de regulación se pueden dar en el orden de solo 100 millones de años

implicando que los modelos de regulación pueden diferir considerablemente entre

grupos que han divergido más tiempo.

Hardison (1998) indica que la divergencia del cluster de β-globina entre aves y

mamíferos sucedió hace aproximadamente 250 millones de años, por tanto, según el

postulado de Jensen y colaboradores (2006), no es sorprendente encontrar que en las

regiones de regulación para este cluster, en aves y mamíferos, no se observen

alineamientos significativos.

Page 40: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

51

3. FORMULACION DEL PROBLEMA Y JUSTIFICACION

3.1. Formulación del problema

Los genes que codifican para las globinas están presentes en contextos genómicos

diferentes por lo que es de esperarse que presenten diferencias en los mecanismos de

regulación. Algunos estudios han comparado la organización de los genes del locus

de la β-globina en diferentes especies indicando que el gen podría ser parálogo en

algunos de los linajes, es decir que el análisis filogenético muestra que no siempre los

genes son descendientes de un gen ancestral común, como es el caso en las aves y los

mamíferos (Hardison, 2001).

Las secuencias codificantes de los genes de la β-globina así como en sus elementos de

regulación de la transcripción son el material para estudiar los patrones de evolución

de la familia génica y de los mecanismos de regulación de la misma, así, buscar dichas

secuencias es la materia prima para empezar a definir las diferencias en los

mecanismos de regulación de la expresión de esta familia génica.

3.2. Preguntas de la investigación

Este proyecto se aproxima a la respuesta de las siguientes preguntas:

• Cuántas secuencias de regulación de la expresión de los genes que codifican

para la β-globina se han conservado en diferentes especies de mamíferos y,

cuales factores de transcripción se unen a dichas secuencias?

• Se ha conservado el locus de la región de control (LCR) en estas especies?

• Que tantas de estas secuencias de regulación se han conservado entre las aves y

los mamíferos?

Page 41: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

52

Se entiende por secuencias conservadas cuando estas se pueden alinear, es decir que el

orden de las bases coincide, asumiendo así que dichas secuencias desempeñan un rol

similar en las diferentes especies que las poseen.

3.3. Justificación de la investigación

El estudio de las secuencias de regulación del gen de la β-globina en diferentes

especies permitirá establecer patrones de evolución de los mecanismos de regulación

de la expresión de este gen.

Una de las características importantes en el mecanismo de regulación de este gen en

particular es que de este depende el cambio de la globina que se expresa según el

estado del desarrollo del organismo. Muchos estudios han tratado de interpretar los

factores que gobiernan la activación y represión de genes de un estado a otro del

desarrollo. El entendimiento de este proceso podría ser útil en la búsqueda de posibles

tratamientos a enfermedades como la anemia falciforme y la talasemia, que son dos

de las enfermedades hematopoyeticas mas comunes (Harju, et al, 2002).

Este proyecto es el primer paso hacia el estudio de los patrones evolutivos que han

dado lugar a los diferentes mecanismos de regulación de la expresión del gen de la β-

globina. Al colectar y ubicar las secuencias reportadas como sitios de unión a

factores de transcripción y las secuencias que han sido descritas como promotores,

�enhancers� o aisladores del locus de la β-globina se aporta la materia prima para

futuros estudios que permitan inferir los patrones que gobiernan la regulación de esta

familia de genes y establecer cómo dichos mecanismos han cambiado a través de la

evolución.

Page 42: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

53

4. OBJETIVOS

4.1. Objetivo general

Identificar y localizar en el cluster las regiones de regulación de la expresión de la

familia de genes de β-globina en diferentes especies.

4.2. Objetivos específicos

I. Localizar la región genómica donde se ubica el locus de la β-globina en cada

especie incluida en el estudio y ubicar en los genomas de estas especies, las

secuencias de regulación que se encuentran conservadas.

II. Determinar cuales de las secuencias de regulación se encuentran conservadas

en otras especies.

III. Identificar cuales son los factores de transcripción que intervienen en la

regulación de la expresión de la familia de genes de β-globina.

5. MATERIALES Y MÉTODOS

En la figura 5 se resumen los métodos propuestos para alcanzar los objetivos.

Page 43: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

54

Búsqueda de secuencias de regulación del grupo de genes de β-globina en varias especies

Búsqueda de secuencias reportadas en la Base de Datos TransFac®

Localización de secuencias de regulación en el genoma de diferentes especies

Generar Tabla de datos: Numero de accesión a la secuencia, coordenadas de la secuencia, factor de transcripción que se une, cromosoma, especie, enlace a artículo en Pubmed

Alineamiento del fragmento de DNA de ~1000bp en el genoma de la especie en la cual la secuencia de regulación había sido descrita

Ubicación de la secuencias de regulación.(Coordenadas en el cromosoma).

Búsqueda de secuencias conservadas

Humano, Chimpancé, Ratón, Rata, Perro y Pollo.

Generar archivo de texto en formato FASTA con las secuencias de regulación conservadas.

Ubicar cada gen de β globina en el genoma de varias especies

ENCODE Project: Anotaciones en el genoma (RefSequences)

Búsqueda de secuencias homologas a las reportadas en ENCODE

Blat con la secuencia de la proteína o predicciones de genes en HomoloGene cuando no hay Refseq.

Mapear el Locus Control Región (LCR) y otras regiones de regulación del grupo de genes de β globina reportadas en artículos.

Localización de los sitios hipersensitivos caracterizados por High-throughput (Dorschner et al.2004)

Localización de secuencias de regulación descritas experimentalmente.

Búsqueda de secuencias conservadas entre los sitios reportados en la literatura y descritos experimentalmente, usando la herramienta BLAT en el �UCSC Browser�

Ubicación de las secuencias de regulación conservadas de acuerdo a las coordenadas en el cromosoma.

Generar un mapa del cromosoma donde se ubica la familia de genes de β globina en cada especie ubicando también las secuencias de regulación y los sitios hipersensitivos (LCR).

Flanquear las secuencias de regulación reportadas en TransFac

Figura 5. Diagrama general de los métodos a seguir para alcanzar los objetivos

propuestos. Los recuadros rosados muestran el objetivo de la actividad y los recuadros

azules muestran los resultados esperados e indicadores. Ver protocolos 1 y 2 en

anexos.

Page 44: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

55

5.1. Métodos para alcanzar el primer objetivo específico

5.1.1. Secuencias de regulación del locus de la β- globina

Se accedió a las secuencias de regulación del locus de la β- globina a través de la base

de datos TransFac® en la cual se encuentra información de factores de transcripción,

sus secuencias de unión y los genes que regulan. Los datos encontrados en TransFac®

tienen respaldo experimental (Matys, et al. 2006) por tanto, por cada dato allí

almacenado hay una o varias citas bibliográficas en las que se describe la

aproximación experimental a cada factor de trascripción y su sitio de unión. Al

compilar y organizar toda la información publicada acerca de la regulación de la

transcripción en eucariotas, esta base de datos pone a disposición gran cantidad de

información que es susceptible de análisis y predicciones computacionales. A Octubre

de 2006 se encontraban en TransFac® 6133 registros sobre factores de transcripción,

de los cuales 1040 han sido descritos experimentalmente en humano y 765 en ratón,

por nombrar solo algunos (Matys, et al. 2006). El acceso a la base de datos en línea es

libre a través de: http://www.gene-regulation.com/pub/databases.html Sin embargo,

para la realización de este proyecto se accedió a TransFac Professional® a través de

membresía del National Center for Biotechnologic Information (NCBI) en

http://www.biobase.de/cgi-bin/biobase/transfac/start.cgi.

Los datos en TransFac® están almacenados en tres tablas: FACTOR, SITE y GENE

(Matys, et al. 2006), la búsqueda se realizó en la tabla GENE, de modo que esta se

limitó a los factores de trascripción reportados para los genes que codifican para

globinas (Figura 6). De la interfase de resultados solo se recopilaron datos de aquellos

factores de transcripción que estuvieran relacionados con los genes que codifican para

proteínas β- globina.

Page 45: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

56

Figura 6. Interfase de resultados en la base de datos TransFac® al someter a

búsqueda �Globin� en la tabla GENE de dicha base. http://www.biobase.de/cgi-

bin/biobase/transfac/start.cgi

Por cada secuencia de unión a un factor de transcripción se obtuvo en la base de datos

la siguiente información: Número de accesión en TransFac®; descripción, la cual hace

referencia al gen que esta siendo regulado; especie en la que el sitio de regulación fue

caracterizado; número de accesión a la secuencia de un fragmento de DNA

caracterizado para determinar experimentalmente el sitio donde se une el factor de

trascripción; coordenadas de la ubicación de la secuencia de regulación en dicho

fragmento; número de accesión a articulo en Pubmed; nombre del factor de

transcripción que se une a la secuencia; región en la que se ubica la secuencia (sitio

hipersensitivo, �enhancer� o promotor) y la secuencia del sitio de regulación (Figura

7).

A partir de la información obtenida en la base TransFac® fue posible localizar las

secuencias en el genoma de las especies así como realizar alineamientos para

determinar cuales de estas secuencias se encuentran conservadas en otras especies.

Page 46: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

57

De otro modo, se realizó una revisión bibliográfica acerca del locus de la región de

control, �enhancers� y promotores del grupo de genes de β-globina. Algunos artículos

incluían número de accesión a secuencias y coordenadas de las mismas, datos

necesarios para poder ubicar dichas secuencias en el genoma de la especie en la que

había sido caracterizada.

Figura 7. Interfase de información del numero de accesión R01943 de TransFac®. El

número V00409 es la accesión a la secuencia caracterizada para localizar la región de

control. Las coordenadas (286:293) hacen referencia a la ubicación de la secuencia

GGCTGGGG la cual es el sitio de unión al factor de transcripción TFIID.

http://www.biobase.de/cgi-bin/biobase/transfac/start.cgi

Page 47: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

58

5.2. Métodos para alcanzar el segundo objetivo específico

5.2.1. Obtención de secuencias para alinear

Con el fin de ubicar cada secuencia de regulación en el genoma de la especie en la

cual fue caracterizada, se hicieron alineamientos utilizando la herramienta BLAT

(Kent, 2002) disponible en �UCSC genome browser� en http://genome.ucsc.edu.

BLAT esta diseñado para alinear rápidamente secuencias de 40pb o más con un 95%

de similitud. En el alineamiento de secuencias de DNA con BLAT, la secuencia

sometida es contrastada con la secuencia de todo un genoma. Para que BLAT alinee

la secuencia con la del genoma es necesario que un mínimo de 11 pares de bases

consecutivas coincidan (Kent, 2002).

Las secuencias de regulación varían entre 5 a 20pb aproximadamente. Si fuera posible

alinear un fragmento de este tamaño con la secuencia de un genoma se obtendrían

múltiples sitos donde coincide la secuencia del fragmento con la del genoma. Por lo

anterior y para cumplir con los requerimientos de la herramienta BLAT (someter

secuencias de mínimo 40pb) fue necesario incluir en el alineamiento el DNA que

flanquea las secuencias de regulación. De modo que, cada secuencia de regulación fue

flanqueada con 500pb a lado y lado. Al usar fragmentos de 1010pb aproximadamente

se logra un alineamiento especifico reduciendo la posibilidad de obtener falsos

positivos.

Así, los fragmentos a alinear se obtuvieron a partir de las coordenadas de las

secuencias reportadas en TransFac®, usando el numero accesión de cada secuencia en

la interfase de �Entrez Nucleotide� que ofrece NCBI en http://www.ncbi.nlm.nih.gov.

�Entrez Nucleotide� es una base de datos de secuencias de DNA sometidas por

múltiples fuentes incluyendo GeneBank, RefSeq y PDB. La interfase �Sequence

viewer� de �Entrez Nucleotide� permite ver la secuencia en formato FASTA y

delimitar la extensión de la misma utilizando coordenadas. Por ejemplo, una de las

Page 48: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

59

secuencias reportadas en TransFac® (número de accesión U01317) comprende mas de

60000pb, dentro de esta secuencia el sitio de unión a un factor de transcripción se

encuentra desde el nucleótido 4611 al 4615 (coordenadas reportadas en TransFac

4611:4615) lo cual representa una secuencia de regulación de 5 pares de bases. Para

obtener esta secuencia flanqueada, como se requiere, se resta al primer número de la

coordenada tanto como se quiera extender la secuencia corriente arriba y se suma al

segundo numero en la coordenada tanto como se quiera extender corriente abajo. Para

este caso especifico para flanquear la secuencia de regulación por 500 pares de bases a

lado y lado, en la ventana �Sequence viewer� se someten las coordenadas 4111 a 5115,

4111 que resulta de restar 500 al primer número de las coordenadas, y 5115 de sumar

corriente abajo 500pb en la segunda coordenada. Así la interfase de �Entrez

Nucleotide� mostrara en formato FASTA una secuencia de 1005pb del fragmento de

más de 60000pb. La secuencia de 1005pb será la que se someta a alineamiento contra

el genoma en el cual la secuencia fue caracterizada, para este ejemplo, contra el

genoma del humano (Ver Anexo 1: Protocolo para determinar las coordenadas de las

secuencias de regulación conservadas en varias especies).

5.2.2. Determinación de las coordenadas en cromosoma

Una vez obtenida la secuencia en formato FASTA del fragmento de ~1000 pb el

siguiente paso es alinearla en el genoma de la especie correspondiente, para esto la

secuencia se debe copiar en la interfase de la herramienta BLAT en UCSC �Genome

Browser� allí se debe seleccionar el genoma en el que se desea buscar la secuencia

además de indicar el ensamble a usar según la especie. En la tabla 3 se indica el

ensamble usado en cada especie incluida en este estudio.

Page 49: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

60

Tabla 3. Lista de ensambles de genomas usados para ubicar las secuencias de

regulación en el respectivo cromosoma de cada especie.

Especie Cromosoma Ensamble del Genoma

Humano 11 hg18 (Mar2006) Chimpancé 11 panTro2 (Mar2006) Ratón 7 mm8 (Feb2006) Rata 1 rn4 (Nov2004) Perro 21 canFam2 (May2005) Pollo 1 galGal3 (May2006)

Al someter las secuencias al alineamiento se obtiene una lista de resultados ordenados

de acuerdo al porcentaje de similitud. Esta interfase de resultados muestra, además del

porcentaje de similitud, el tamaño del fragmento que pudo ser alineado, es importante

tener en cuenta desde que nucleótido fue encontrada la secuencia y de esto depende el

cálculo de las coordenadas de la secuencia de regulación. En el caso ideal, el

fragmento sometido es alienado en su totalidad entonces, para calcular las

coordenadas del sitio de regulación, a la primera coordenada se suman 500, o la

cantidad de pares de bases que hayan sido agregadas al flanquear la secuencia,

haciendo esto, se esta retirando el fragmento que flaqueaba la secuencia corriente

arriba, de forma similar, a la segunda coordenada se debe restar 500 o el numero de

pares de bases que corresponden a la región que flanquea la secuencia de interés. De

esta forma se determinaron las coordenadas de cada sitio de regulación (Figura 8). El

mismo procedimiento se realizó con las secuencias reportadas en artículos donde

incluían el número de accesión a la secuencia y las coordenadas.

5.3. Métodos para alcanzar el tercer objetivo especifico

5.3.1. Ubicación de los genes de β-globina en cada especie

Cada sitio de regulación colectado fue localizado en un diagrama del cromosoma de

cada especie. Para entender mejor la posición de estos sitios respecto a la de cada gen

de la familia de genes de β globina, fue necesario primero ubicar las coordenadas de

Page 50: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

61

Cromosoma

Fragmento donde se encuentra la secuencia de regulación según numero de accesión reportado en TransFac

2 Flanquear la secuencia de interés extendiendo las coordenadas 500 pb a

3 Obtener la secuencia del fragmento de interés más la

5

4Alinear el fragmento con la secuencia de interés en el genoma de la especie donde fue caracterizada.

5

5Al alinear se determinan las coordenadas a las que corresponde el fragmento en el cromosoma.

6

4

3

122

-500 +500

+500 -500

Localización de la secuencia de interés según coordenadas locales a un determinado fragmento de DNA

1

6Calcular las coordenadas de la secuencia de interés a partir de las coordenadas del fragmento alineado

estos genes en cada especie bajo estudio. Para este fin se consultaron las anotaciones

en �UCSC ENCODE Project� para humano, chimpancé, ratón y pollo, cuyos genomas

tienen varios genes anotados (Figura 9). Posteriormente, para localizar los genes en el

genoma de rata y perro se realizaron alineamientos BLAT con la secuencia de la

proteína codificada por cada gen en humano, buscando con esto el sitio homologo en

el otros genomas. Además de los alineamientos BLAT usando las secuencias de las

proteínas, se consulto el enlace HomoloGene para cada gen β globina anotado en

humano. HomoloGene es un sistema automático para la detección de homólogos entre

los genes anotados en varios genomas eucariotas completamente secuenciados, esta

herramienta esta disponible en la interfase de �Entrez Nucleotide� y a partir de la

predicción computacional muestra donde se ubicaría en otras especies el gen

homologo al que esta siendo consultado. HomoloGene esta disponible en línea en:

http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=homologene.

Figura 8. Diagrama general de los métodos para determinar las coordenadas de las

secuencias de regulación.

Page 51: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

62

De esta forma, con base en las anotaciones genómicas en �UCSC ENCODE Project�,

los alineamientos recíprocos de las secuencias de las proteínas y las predicciones de

HomoloGene, se pudo determinar la ubicación de cada gen del grupo de genes de β-

globina en cada especie bajo estudio (Ver Anexo 2: Protocolo para la ubicar los genes

de la familia de β-globina en el genoma de cada especie incluida en el estudio).

Figura 9. Interfase �UCSC ENCODE Project� de la región ENm009 que corresponde

a la familia de genes de la β-globina. Se muestran los genes HBE1, HBG2, HBG1,

HBD y HBB, que corresponden a ε-Gγ-Aγ-δ-β-globina respectivamente.

5.4. Métodos para alcanzar el cuarto objetivo específico

5.4.1. Secuencias de regulación conservadas

Usando la herramienta �Genome Browser� de USCS http://genome.ucsc.edu es posible

conocer si la secuencia de regulación se encuentra conservada en otras especies. Para

este fin se activa la opción �conservation�, seleccionando �Full� en esta entrada bajo

�Comparative Genomics� en la interfase �Genome Browser� (Figura10) habiendo

activado esta opción, al someter las coordenadas de la secuencia de regulación este

�Browser� realizara un alineamiento múltiple de la secuencia en el genoma de varias

especies y mostrara en cuales ha logrado alinearla asumiendo con esto que la

secuencia se ha conservado en ellas presentando una función similar.

Page 52: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

63

Una vez sometidas las coordenadas de la secuencia de regulación, si esta se ha

conservado en otras especies se obtiene una lista de las especies donde se pudo alinear

la secuencia y frente a cada especie la secuencia encontrada (Ver Anexo 1 paso 7),

para ampliar la información y acceder a las coordenadas de la secuencia en cada

especie se hace clic en la lista de secuencias conservadas con lo cual se abre una nueva

interfase que ofrece un enlace para cada secuencia en �Genome Browser� de donde se

obtienen las coordenadas para esa secuencia en cada especie donde se encontró

conservada (Ver Anexo 1 paso 8 y 9).

Figura 10. Sección de la interfase �Genome Browser� donde se activa la opción para

acceder a la información sobre conservación. http://genome.ucsc.edu

5.4.2. Secuencias en formato FASTA

A partir de los datos obtenidos en la base de datos TransFac® se accedió a varias

secuencias de regulación y se ubicaron en el genoma de la especie en donde dichos

sitios habían sido caracterizados, luego se determinó cuales de las secuencias se han

conservado en otras especies. El siguiente paso fue colectar las secuencias en formato

FASTA de modo que puedan luego ser agrupadas según el factor de transcripción que

se une a estas y establecer comparaciones.

Page 53: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

64

Con el fin de obtener las secuencias en formato FASTA, estando en la interfase de el

alineamiento múltiple en especies que tienen la secuencia conservada, se hace clic en

D que hace referencia a DNA, al hacer esto se abre una nueva interfase que muestra

las coordenadas donde se localiza la secuencia en la especie y la secuencia de

nucleótidos en el formato deseado (Figura 11). Cada secuencia fue copiada en un

archivo de texto.

Figura 11 A. Interfase del alineamiento múltiple bajo la opción de conservación en

�USCS Genome Browser� Al hacer clic en la D para cada especie en la lista, se

obtienen las coordenadas homologas a las del humano en las otras especies.

B. Interfase para acceder al DNA a partir del alineamiento múltiple. Los corchetes y el

texto azul no hacen parte de la interfase http://genome.ucsc.edu.

A

Coordenadas en el genoma del ratón que corresponden al sitio de regulación homologo al de las coordenadas en el humano.

B

Page 54: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

65

5.5. Métodos para alcanzar el quinto objetivo específico

5.5.1. Agrupación de secuencias según factor de transcripción

Una vez obtenidas todas las secuencias de regulación en las diferentes especies estas

secuencias se clasificaron según el factor de transcripción que a estas se une.

Posteriormente, se crea un archivo de texto por cada factor de transcripción, cada

archivo contiene las secuencias de unión para un factor de transcripción determinado.

Se genera también una tabla donde se recopilan las coordenadas organizadas según el

factor de transcripción que se une y finalmente se genero una lista de factores de

transcripción que intervienen en la regulación de la familia de genes de β-globina.

6. RESULTADOS Y DISCUSIÓN

6.1. Colección de sitios de regulación

Se colectaron 84 sitios de regulación a partir de la base de datos TransFac®, de esas

84 secuencias, 31 fueron descritas experimentalmente en humano, 24 en ratón, 25 en

pollo y 4 en pato, estas ultimas 4 secuencias no fueron incluidas en el estudio debido a

que no hay secuencia completa del genoma del pato por tanto no era posible

determinar coordenadas en este genoma para estas secuencias. Los números de acceso

y la información pertinente a estos sitios de regulación se encuentran en el anexo 3

(Sitios de regulación obtenidas a partir de la base de datos TransFac®). Las secuencias

de los sitios colectados se registran en el anexo 8 (Secuencias en formato FASTA de

los sitios de regulación colectados).

De otra forma, a partir de la revisión bibliográfica se encontró información sobre

múltiples sitios de regulación caracterizados en humano, ratón y pollo, pero de la

descripción de estos sitios solo fue posible localizar aquellos en donde el artículo

incluía además del número de accesión a la secuencia, las coordenadas para su

Page 55: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

66

ubicación. Así, a partir de la revisión bibliográfica, se mapearon 37 secuencias

caracterizadas en humano y 5 en pollo, y de estas se determinó cuales se han

conservado en las otras especies bajo estudio (humano, chimpancé, ratón, rata, perro,

pollo) la información de estos sitios se encuentra en el anexo 4 (Sitios de regulación

obtenidos a partir de la revisión bibliográfica)

6.1.1. Factores de transcripción

Del total de sitios de regulación colectados hay secuencias de unión a 24 factores de

transcripción. En el anexo 7 se organizan las coordenadas de los sitios colectados de

acuerdo al factor de transcripción que se une a estos. En la tabla 4 se indica el número

de secuencias colectadas para cada factor de transcripción.

Según la revisión de Harju y colaboradores (2002) los factores de transcripción, FOG,

EKLF, CKII, FKLF, DRED, COUP-TFII (Tabla 2) son propios de la regulación de la

expresión del cluster de genes de β-globina pero en las secuencias colectadas en este

estudio, no hay sitios para la unión a estos factores. Esto indica que a pesar de que han

sido identificados los factores de transcripción que intervienen en la regulación del

cluster, aun hace falta información para la localización de sus secuencias de unión en

los genomas en donde han sido caracterizados.

Tabla 4. Número de secuencias colectadas por factor de transcripción

Factor de transcripción No. de secuencias Factor de transcripción No. de secuencias AP1 6 NF-E2 16 B1 14 NFI-CTF 3 B2 13 Nrf 5

BP1 19 Nrf1 6 BP2 17 Nrf2 6

CAC-Binding protein 15 POU2F1 7 CACC-Binding factor 12 PPUR 5

CACD 6 PPYR 5 C-Fos 5 Sp1 12 C-Jun 5 TBP 5 Cp2a 5 TFIID 14

GATA-1 140 MafG 5

Page 56: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

67

6.2. Patrón de conservación de los sitios de regulación colectados

Se colectaron un total de 122 sitios de regulación de los cuales 68 habían sido

caracterizados en humano, 24 en ratón y 30 en pollo. Se determinó si cada uno de

estos sitios estaba conservado en otras especies.

Los resultados de los alineamientos para cada sitio de regulación mostraron posibles

secuencias conservadas en diferentes especies, solo se incluyeron en el estudio

aquellas especies cuyos genomas han sido secuenciados completamente de modo que

se contara con la información suficiente para poder determinar si las coordenadas

donde cada secuencia de regulación estaba siendo alineada correspondía al sitio

genómico donde se ubica el cluster de la β-globina. Así por ejemplo, se encontró que

algunas secuencias estaban conservadas en zarigüeya y Xenopus, pero las coordenadas

donde se alineaban los sitios de regulación en estos genomas hacían referencia a

�scaffold� y no a un cromosoma definido. Por lo anterior, se incluyen en este estudio

las siguientes especies y no otras: humano, chimpancé, ratón, rata, perro y pollo.

El patrón de conservación de los sitios de regulación en las seis especies incluidas en

el estudio se recopila en la tabla 5.

La cantidad de datos obtenidos en mamíferos y aves varia drásticamente, de los sitios

de regulación obtenidos a través de TransFac® un promedio de 59 sitios fueron

colectados por cada mamífero mientras que en aves solo se obtuvieron 35 sitios en

total. Es de notar, sin embargo, que el locus de la β-globina ha sido ampliamente

caracterizado en ambos grupos, pero en las aves, solo se cuenta con secuencias

caracterizadas en pollo mientras que en mamíferos las hay en humano y en ratón.

Así, la diferencia en el número total de secuencias por especie además de mostrar que

existe una mayor disponibilidad de información del locus de β-globina en mamíferos,

pone en evidencia un patrón de conservación donde la mayoría de secuencias

caracterizadas en aves no están conservadas en mamíferos y viceversa.

Page 57: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

68

De las secuencias caracterizadas en humano y ratón la mayoría están conservadas en

los otros mamíferos incluidos en el estudio (Figura 12).

Tabla 5. Patrón de conservación de las secuencias colectadas.

Numero de secuencias conservadas en: Secuencias a partir de TransFac® Humano Chimpancé Ratón Rata Perro Pollo

Humano (31)

31 31 28 29 29 4

Ratón (24)

22 22 24 22 21 1

Pollo (30)

10 10 9 8 0 30

Sub. Total 63 63 61 59 50 35 Numero de secuencias conservadas en: Secuencias a parir de

Revisión literatura Humano Chimpancé Ratón Rata Perro Pollo Humano

(37)

37

37

30

28

26 1

Pollo (5)

0

0

0

0

0

5

Total de secuencias localizadad en cada

genoma

100

100

91

87

76

41

Numero de secuencias conservadas entre las especies bajo estudio

05

101520253035

Humano Ratón Pollo

Especie en la que se caracterizaron las secuencias de regulacion

Num

ero

de s

itios

pre

sent

es Sitios conservados en

Humano

Sitios conservados enChimpance

Sitios conservados enRaton

Sitios conservados enRata

Sitios conservados enPerro

Sitios conservados enPollo

Figura 12. Número de secuencias conservadas por especie. Es de notar que de las

secuencias caracterizadas en mamíferos muy pocas están presentes en el ave, así

mismo, de las caracterizadas en pollo pocas están conservadas en los mamíferos. En

esta grafica solo se incluyen las secuencias obtenidas a partir de TransFac.

Page 58: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

69

Existen varias secuencias disponibles del cluster de β-globina tanto en aves (pollo)

como en mamíferos (humano) y se conocen varias similitudes entre los clusters de

estos dos grupos. En ambos, aves y mamíferos, los genes de β-globina se expresan

únicamente en los eritrocitos y de forma especifica a la etapa del desarrollo. Solo en

los eritrocitos este cluster de genes se encuentra en un dominio de cromatina abierto.

Además, tanto en aves como en mamíferos, la expresión de los genes de β-globina es

controlada tanto por secuencias de regulación proximales como dístales. A pesar de

estas semejanzas, entre aves y mamíferos, en organización y regulación de este grupo

de genes, al comparar las secuencias completas de los clusters de β-globina en las dos

especies Reitman y colaboradores (1993) encontraron que las similitudes están

restringidas a las regiones codificantes en los genes. De forma similar, Hardison

(1998) realizó alineamientos de las secuencias de los genes de β-globina en humano y

pollo concluyendo que cada gen de β-globina en humano esta igualmente distanciado

de cualquier gen de β-globina en pollo, es decir, el gen ε-globina en humano no esta

mas cercanamente relacionado con el gen embrionario ε-globina de pollo que con el

gen de la edad adulta β-globina en pollo.

Estas diferencias observadas a nivel de las secuencias de los genes (Hardison, 1998) y

de las zonas intergénicas (Reitman, et al. 1993) concuerdan con lo observado con las

secuencias de regulación colectadas. La mayoría de las secuencias caracterizadas en

mamíferos no están presentes en pollo. Contrario a lo que se pensaba antes de la

secuenciación de los genes, Hardison (1998, 2001) y otros autores coinciden al afirmar

que los clusters de β-globina en aves y mamíferos son parálogos es decir que no

comparten el mismo gen ancestral.

6.3. Localización de los genes del cluster de β-globina en las diferentes especies

incluidas en el estudio

En humano hay cinco genes descritos en el cluster de genes de β-globina, en su orden

ε-γG-γA-δ-β corresponden a las anotaciones HBE1, HBG2, HBG1, HBD, HBB en

Page 59: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

70

�UCSC ENCODE Project� de estos cinco genes se localizaron cinco homólogos en

chimpancé HBE1, PanHBG1, HBG1, HBD, HBB, cuatro en ratón: hbb-y, hbb-bh1,

hbb-b1, hbb-b2 que corresponden en ese orden a los genes ε-γ-δ-β en humano. Por su

parte, en el genoma de la rata, con base en anotaciones genómicas y predicciones de

HomoloGene, se mapearon cinco genes: Hbe1, Hbe2 (predicción), Hbg1, MGC72973

beta-glo y Hbb los cuales son homólogos a los genes ε-γ-γ-δ-β en humano. En el caso

del perro, debido a que su genoma no esta tan bien anotado como los de las otras

especies incluidas en este estudio, no se encontraron secuencias de referencia para el

locus de β globina por lo que se ubicaron 5 genes con base en predicciones de la

herramienta HomoloGene, estos son: LOC485256, LOC485255, LOC609402,

LOC480704 y LOC476825 los cuales son homólogos a los genes ε-γ-β-β-β en

humano. Las coordenadas para cada uno de los genes en las diferentes especies se

encuentran en la tabla 6.

De acuerdo a las coordenadas obtenidas para cada gen, en los mamíferos todos los

genes se localizan cerca a las secuencias de regulación colectadas. Por el contrario, en

el cromosoma 1 del pollo se mapearon 6 genes, de los cuales tres son predicciones de

HomoloGene y se ubican cerca a las únicas cuatro secuencias de regulación que

habiendo sido descritas en mamíferos son homologas en pollo (Tabla 5). Los otros tres

genes son anotaciones en UCSC ENCODE Project, y estos se ubican en otra región

en el cromosoma 1, la cual coincide con el sitio donde se ubican todas las secuencias

de regulación caracterizadas en pollo.

La estructura típica de los genes de la familia de la β-globina es 2 intrones y tres

exones (Hardison y Miller, 1993), todos los genes mapeados en este estudio presentan

dicha estructura exceptuando las predicciones de HomoloGene en Perro y en pollo.

Otra diferencia para señalar es que en todos los mamíferos el cluster de β-globina se

encuentra en la cadena negativa mientras que en el pollo esta en la cadena positiva.

Page 60: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

71

Tab

la 6

. Coo

rden

adas

de

los g

enes

del

clu

ster

de β

glob

ina

en la

s es

peci

es in

clui

das

en e

l est

udio

. Se

regi

stra

el n

ombr

e ba

jo e

l cua

l se

encu

entra

la

anot

ació

n en

UC

SC E

NC

OD

E Pr

ojec

t, el

ens

ambl

aje

del

geno

ma

al c

ual

corr

espo

nden

las

coo

rden

adas

o s

i es

una

pr

edic

ción

de

Hom

oloG

ene,

así

com

o la

est

ruct

ura

del g

ene

(intro

nes y

exo

nes)

y su

sent

ido

en e

l cro

mos

oma

(cad

ena

-/+)

Es

peci

es

G

en

Hum

ano

Cr.

11

Chi

mp.

Chr

. 11

Rat

on C

hr.7

R

ata

Chr

. 1

Perr

o C

hr. 2

1 Po

llo C

hr.1

H

BE

1 (R

efS

eq M

ar20

06)

5246

156-

5247

949

2 In

trone

s / 3

Exo

nes

Min

us s

trand

HB

E1

(Ref

Seq

Mar

2006

) 50

7541

4-50

7720

9 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

Hbb

-y

(Ref

Seq

Feb

2006

) 10

3725

577-

1037

2702

8 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

Hbe

1 pr

edic

ted

(R

efS

eq N

ov20

04)

1616

5142

3-16

1652

702

2 In

trone

s / 3

Exo

nes

Min

us s

trand

LOC

4852

56

(Hom

oloG

ene)

31

3213

90-3

1331

274

4 In

trone

s / 5

Exo

nes

Min

us s

trand

HB

E1

(R

efS

eq M

ay20

06)

1994

3357

3-19

9434

763

2 In

trone

s / 3

Exo

nes

Plus

stra

nd

ε

PanH

BG

1 (R

efS

eq M

ar20

06)

5075

534-

5076

958

2 In

trone

s / 3

Exo

nes

Min

us s

trand

H

BE

1 (H

omol

oGen

e)

1881

2473

1-18

8127

250

3 In

trone

s / 3

Exo

nes

Plus

stra

nd

γG

HB

G2

(R

efS

eq M

ar20

06)

5230

997-

5232

587

2 In

trone

s / 3

Exo

nes

Min

us s

trand

Hbe

2 Pr

edic

ted

(Ref

Seq

Nov

2004

) 16

1647

652-

1616

4927

9 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

H

BG

2 (H

omol

oGen

e)

1881

3414

6-18

8137

740

4 In

trone

s / 5

Exo

nes

Plus

stra

nd

γ

A

HB

G1

(Ref

Seq

Mar

2006

) 5,

226,

078-

5,22

7,66

3 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

HB

G1

(Ref

Seq

Mar

2006

) 50

6025

5-50

6184

4 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

Hbb

-bh1

(R

efS

eq F

eb20

06)

1037

1545

9-10

3716

983

2 In

trone

s / 3

Exo

nes

Min

us s

trand

Hbg

1 (R

efS

eq N

ov20

04)

1616

4035

9-16

1641

737

2 In

trone

s / 3

Exo

nes

Min

us s

trand

LOC

4852

55

(Hom

oloG

ene)

31

3112

48-3

1316

056

3 In

trone

s / 4

Exo

nes

Min

us s

trand

LOC

4281

14 b

eta-

h (R

efS

eq M

ay20

06)

1994

3693

8-19

9438

081

2 In

trone

s / 3

Exo

nes

Plus

stra

nd

δ

HB

D

(Ref

Seq

Mar

2006

) 52

1063

5-52

1243

4 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

HB

D

(Ref

Seq

Mar

2006

) 50

3909

9-50

4089

6 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

Hbb

-b1

(Ref

Seq

Feb

2006

) 10

3686

347-

1036

8774

4 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

MG

C72

973

beta

-glo

(R

efS

eq N

ov20

04)

1615

9067

1-16

1598

127

2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

HB

B

(Ref

Seq

Mar

2006

) 52

0327

2-52

0487

7 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

HB

B

(Ref

Seq

Mar

2006

) 50

2937

4-50

3097

9 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

Hbb

-b2

(Ref

Seq

Feb

2006

) 10

3686

345-

1036

8772

4 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

Hbb

(R

efS

eq N

ov20

04)

1615

8485

8-16

1620

193

2 In

trone

s / 3

Exo

nes

Min

us s

trand

LOC

4807

84

(Hom

oloG

ene)

31

2993

85-3

1300

913

2 In

trone

s / 3

Exo

nes

Min

us s

trand

HB

B

(Ref

Seq

May

2006

) 19

9436

906-

1994

4199

9 2

Intro

nes

/ 3 E

xone

s Pl

us s

trand

LO

C60

9402

(H

omol

oGen

e)

3130

5498

-313

0724

4 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

HB

B

(Hom

oloG

ene)

18

8131

689-

1881

3339

2

2 In

trone

s / 3

Exo

nes

Plus

stra

nd

Β

LOC

4768

25 *

(H

omol

oGen

e)

3129

7094

-312

9835

5 2

Intro

nes

/ 3 E

xone

s M

inus

stra

nd

Page 61: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

72

En el humano la organización de los genes en el cromosoma coincide con el orden en

que se expresan durante el desarrollo (figura 2). Así, el primer gen en expresarse, el

gen ε-globina, se encuentra mas cerca al extremo 5� del cluster y el ultimo en

expresarse, β-globina mas cerca del extremo 3�. Hardison y Miller (1993) describen

que en todos los mamíferos el gen ε-globina se ubica hacia el extremo 5� del cluster y

solo se expresa en los glóbulos rojos embrionarios.

Hardison y Miller (1993) han estimado que en la evolución del cluster de genes de β-

globina, hubo una duplicación del gen γ-globina en los primates antropoides,

duplicación que coincide con la aparición de un nuevo patrón de expresión en este gen

γ el cual se expresa en la etapa fetal en los mamíferos antropoides mientras que en la

mayoría de especies la expresión del gen γ-globina esta limitada a la etapa

embrionaria. El surgimiento de este nuevo patrón de expresión en los genes γ-globina

coincide aproximadamente con la duplicación del gen la evolución de los primates.

Según lo anterior se esperaba encontrar dos genes gamma en humano y chimpancé, sin

embargo, solo un gen gamma fue localizado en chimpancé. Únicamente en rata se

encontró un gen homologo al HBG2 (γG�globina) de humano, mientras que en los

otros mamíferos y en pollo, solo se ubico un gen gamma que corresponde al homologo

al HBG1 (γA�globina) en humano.

Respecto al cluster de genes en rata, Okumura y colaboradores (2004) describen que

hay un alto grado de variación en este cluster en rata al compararlo con el de otros

mamíferos. El sistema de hemoglobina en la rata es extremadamente heterogéneo

(Satoh, et al. 1999). Se han descrito cuatro proteínas de β- globina en la rata adulta y

dos en la etapa fetal (ε1, ε3-globina). Así, la expresión de dos proteínas de globina en

el feto de la rata justifica la presencia de dos genes gamma en este genoma.

Alineamientos de las secuencias de DNA de los genes en rata muestran una alta

similitud entre los genes gamma (γ1-γ2) (8.6% de divergencia) (Satoh, et al. 1999), por

Page 62: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

73

lo anterior se puede sugerir que este gen surgió en rata a partir de una duplicación

como es el caso del humano.

Surge entonces la inquietud de por que en rata hay dos genes fetales, mientras que en

ratón solo hay uno, siendo la rata y el ratón dos especies cercanas evolutivamente. La

ausencia de duplicación del gen gamma en ratón se puede explicar con la expresión

temprana del gen β-globina en ratón. Hardison y Miller (1993) han descrito que este

gen se expresa en la etapa fetal en ratón, conejo y galago mientras que en el resto de

mamíferos su expresión se inicia en la etapa adulta. La expresión del gen beta durante

la etapa fetal en el ratón, justificaría la ausencia en este genoma de un segundo gen

gamma cuya expresión es fetal.

La expresión fetal del gen beta permite a Hardison y Miller (1993) inferir que el

estado ancestral del gen β-globina es iniciar su expresión en la etapa fetal y que el

aparecimiento del gen γ-globina y su expresión fetal en primates antropoides retardo la

expresión del gen β-globina hasta la etapa adulta en estas especies.

En el cluster de β-globina en pollo, se han descrito 4 genes: ρ-β-β-ε (Reitman, et al.

1993), en este estudio se localizaron seis genes, tres de los cuales son predicciones de

HomoloGene y se ubican en una región diferente a la de los genes que están anotados

en ENCODE. Reitman y colaboradores (1993) realizaron comparaciones de la

secuencia de los genes de β-globina en aves para deducir el esquema de su evolución.

Ellos determinaron que en aves el cluster de β-globina se formó a partir de tres

duplicaciones genéticas y por lo menos 4 conversiones. Los tres genes ubicados

corriente arriba de los genes anotados por ENCODE Project, tienen el orden reportado

en la literatura (ρ-β-β-ε) pero solo se ubico un gen β. De los genes mapeados, los tres

obtenidos a través de HomoloGene podrían ser resultado de una duplicación debido a

que cerca de estos genes se ubican secuencias de regulación conservadas y a que su

orden coincide con el descrito por Reitman y colaboradores (1993) sin embargo,

también podría tratarse de pseudo genes, debido a que son predicciones

Page 63: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

74

computacionales y a que están muy alejados del sitio donde se ubicaron las secuencias

de referencia de ENCODE. Además se localizaron 6 genes en pollo y, para esta

especie, solo se han reportado 4 genes.

6.4. Ubicación de los sitios de regulación en el genoma de cada especie

De acuerdo a la tabla 4, 100 sitios de regulación fueron ubicados en el genoma de

humano y chimpancé, 91 en ratón, 87 en rata, 76 en perro y 41 en pollo. El anexo 5,

muestra las coordenadas en cada especie para cada sitio de regulación. Las figuras 13,

14, 15, 16, 17 y 18 muestran el mapeo de estos sitios y de los genes del cluster de β-

globina en Humano, chimpancé, ratón, rata, perro y pollo respectivamente.

En la revisión bibliográfica varias de las secuencias obtenidas hacen referencia a los

sitios hipersensitivos a DNasa (HS) así como a los promotores y �enhancers�

proximales a los genes. Hay entonces, información redundante respecto a cada HS, a

los promotores y �enhancers� proximales (Tabla 7), y no hay coincidencia entre los

sitios caracterizados por Dorschner y colaboradores (2004) a través de �High

throughout put� y los caracterizados por los otros autores. Se considera que el margen

de error en el trabajo de Dorschner, et al. (2004) es mayor respecto a los otros estudios

citados; por tratarse de una caracterización sistematizada que abarca una gran

extensión de DNA (~300 Kb) mientras que, en las descripciones de los otros autores la

aproximación es experimental y solo hacia uno o dos sitios en particular. Por esta

razón, el mapa definitivo de los sitios de regulación seria sin incluir las regiones

caracterizadas a través de �High-throughput� de esta forma también se reduce la

redundancia de información.

Page 64: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

75

Figu

ra 1

3. D

iagr

ama

del c

lust

er d

e β-

glob

ina

en h

uman

o. L

os s

itios

des

crito

s en

hum

ano

se m

uest

ran

en ro

jo, e

n az

ul lo

s de

scrit

os e

nra

tón

y co

nser

vado

s en

hum

ano

y en

ver

de l

os s

itios

car

acte

rizad

os e

n po

llo y

pre

sent

es e

n hu

man

o. L

as r

egio

nes

de l

a re

visió

nbi

blio

gráf

ica

se m

uest

ran

sobr

e la

lín

ea d

el c

rom

osom

a en

neg

ro y

en

colo

res

que

son

igua

les

en t

odas

las

esp

ecie

s pa

ra d

enot

arho

mol

ogía

.

Page 65: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

76

Figu

ra 1

4. D

iagr

ama

del c

lust

er d

e β-

glob

ina

en C

him

panc

é. L

os s

itios

des

crito

s en

hum

ano

se m

uest

ran

en ro

jo, e

n az

ul lo

s des

crito

s en

rató

n y

en v

erde

los

sitio

s ca

ract

eriz

ados

en

pollo

y p

rese

ntes

en

chim

panc

é. L

as re

gion

es d

e la

rev

isió

n bi

blio

gráf

ica

se m

uest

ran

sobr

e la

líne

a de

l cro

mos

oma

en n

egro

y e

n co

lore

s que

son

igua

les e

n to

das l

as e

spec

ies p

ara

deno

tar h

omol

ogía

.

Page 66: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

77

Figu

ra 1

5. D

iagr

ama

del c

lust

er d

e β-

glob

ina

en R

atón

. Los

siti

os d

escr

itos

en ra

tón

se m

uest

ran

en a

zul,

los

desc

ritos

en

hum

ano

en

rojo

y e

n ve

rde

los

sitio

s ca

ract

eriz

ados

en

pollo

y p

rese

ntes

en

rató

n. L

as r

egio

nes

de la

rev

isió

n bi

blio

gráf

ica

se m

uest

ran

sobr

e la

lín

ea d

el c

rom

osom

a en

neg

ro y

en

colo

res q

ue so

n ig

uale

s en

toda

s las

esp

ecie

s par

a de

nota

r hom

olog

ía.

Page 67: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

78

Figu

ra 1

6. D

iagr

ama

del c

lust

er d

e β-

glob

ina

en R

ata.

Los

siti

os d

escr

itos

en h

uman

o se

mue

stra

n en

roj

o, e

n az

ul lo

s de

scrit

os e

n ra

tón

y en

ver

de lo

s sit

ios

cara

cter

izad

os e

n po

llo y

pre

sent

es e

n ra

ta. L

as r

egio

nes

de la

rev

isió

n bi

blio

gráf

ica

se m

uest

ran

sobr

e la

lín

ea d

el c

rom

osom

a en

neg

ro y

en

colo

res q

ue so

n ig

uale

s en

toda

s las

esp

ecie

s par

a de

nota

r hom

olog

ía.

Page 68: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

79

Figu

ra 1

7. D

iagr

ama

del c

lust

er d

e β-

glob

ina

en P

erro

. Los

siti

os d

escr

itos

en h

uman

o se

mue

stra

n en

roj

o, e

n az

ul lo

s de

scrit

os e

n ra

tón

y en

ver

de lo

s sit

ios

cara

cter

izad

os e

n po

llo y

pre

sent

es e

n pe

rro.

Las

regi

ones

de

la re

visió

n bi

blio

gráf

ica

se m

uest

ran

sobr

e la

lín

ea d

el c

rom

osom

a en

neg

ro y

en

colo

res q

ue so

n ig

uale

s en

toda

s las

esp

ecie

s par

a de

nota

r hom

olog

ía.

Page 69: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

80

Figu

ra 1

8. D

iagr

ama

del c

lust

er d

e β-

glob

ina

en P

ollo

. Los

siti

os d

escr

itos

en p

ollo

se

mue

stra

n en

ver

de, l

os d

escr

itos

en h

uman

o en

ro

jo y

en

verd

e lo

s siti

os c

arac

teriz

ados

en

hum

ano

y pr

esen

tes e

n po

llo. L

as re

gion

es d

e la

revi

sión

bib

liogr

áfic

a se

mue

stra

n so

bre

la

línea

del

cro

mos

oma

en n

egro

.

Page 70: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

81

Tabla 7. Número de secuencias colectadas y localizadas por región de regulación, a

través de la revisión bibliográfica.

Número de secuencias colectadas y ubicadas en el cluster

Región Humano Chimpancé Ratón Rata Perro Pollo

HS5 2 2 2 1 1 0

HS4 2 2 2 2 2 1

HS3 4 4 4 4 4 0

HS2 2 2 2 2 2 0

HS1 3 3 3 3 3 0

Proximal ε-globina

8 8 7 6 4 1

Proximal γ2-globina

4 4 2 2 2 1

Proximal γ1-globina

5 5 2 2 2 1

Proximal δ-globina

3 3 3 3 3 1

Proximal β-globina

2 2 2 2 2 1

3� HS1 1 1 0 0 1 0

De otra forma, las secuencias de regulación colectadas a través de TransFac® se

pueden agrupar según la ubicación de estas en el cluster de β-globina (Tabla 8).

Además, TransFac® señala para las secuencias caracterizadas en humano, cuales

hacen parte de los sitios hipersensitivos HS2, HS3 y HS4. Las coordenadas de estas

secuencias incluidas en un HS están dentro del rango de las coordenadas encontradas

para cada para sitio hipersensitivo accedido a través de la revisión bibliográfica

(exceptuando el trabajo de �High-throughput� de Dorschner, M. D. et al. 2004), por

tanto hay coincidencia entre la información de la revisión bibliográfica y la encontrada

en TransFac®.

Page 71: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

82

Tabla 8. Rango de coordenadas de las regiones de regulación determinadas según los

sitios a donde se ubican las secuencias colectadas a partir de TransFac®. No se

incluye el pollo por no tener conservadas la mayoría de las secuencias de estas

regiones. Región Coordenadas

Humano Coordenadas Chimpancé

Coordenadas Ratón

Coordenadas Rata

Coordenadas Perro

Corriente abajo HBB

5202483-5202696

5028585-5028798

103685209-103685418

161616569-161616652

31296253-31296466

Exon1 HBB 5204380-5204608

5030482-5030710

103687257-103687485

161619720-161619948

31297817-31298045

Exon 2 HBB 5204734-5204880

5030836-5030982

103687597-103687745

161620053-161620201

31298169-31298315

Intron 1 HBB

5203536-5204375

5029638-5030477

103686609-103687252

161619043-161619715

31297226-31297812

Intron2 HBB

5204608-5204734

5030710-5030836

103687485-103687597

161619948-161620053

31298045-31298169

Corriente arriba HBB

5204880-5205425

5030982-5031548

103687745-103688293

161620201-161620656

31298315-31298790

Entre HBD-HBG

5221423-5221562

5049901-5050040

103717008-103717110

161636424-161636526

31312716-31312819

HS2 5258443-5258643

5088758-5088966

103734793-103734989

161658818-161659019

31330572-31330777

HS3 5262510-5262723

5092796-5093004

103739657-103739851

161662195-161662389

31334571-31334765

HS4 5265500-5265617

5095786-5095903

103744085-103744201

161667373-161667484

31337106-31337204

Por otro lado, de los sitios de regulación caracterizados en pollo y obtenidos a través

de TransFac® (Números 57 a 80 en Anexo 3) siete secuencias son descritas como

parte del sitio hipersensitivo HS2 (Figura 18) pero ninguno de estos sitios se han

conservado en mamíferos, al igual que ninguno de los sitios caracterizados como parte

de HS en mamíferos se encuentra conservado en pollo. Por este motivo no es posible

estimar la concordancia entre las dos fuentes de datos (TransFac® y revisión

bibliográfica) en cuanto a LCR en pollo. Solo se puede afirmar, a través de esta

información, que el LCR de pollo y mamíferos no se encuentra conservado en por lo

menos esas siete secuencias caracterizadas en pollo que hacen parte del HS2 y no

están presentes en mamíferos así como, en las secuencias que conforman HS2, HS3,

HS4 en humano y no están presentes en pollo.

Page 72: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

83

6.4.1. Conservación del orden en que se ubican los sitios de regulación en cada

especie

Los sitios de unión a factores de transcripción generalmente están compuestos de 6 a

8pb (Hardison, R. C. 1998), en estos sitios tan cortos pueden ocurrir algunas

variaciones en su secuencia sin afectar la afinidad de la unión al factor de

transcripción. Así, un sitio de unión funcional puede estar formado de 6 nucleótidos

donde solo 4 coinciden en un alineamiento. Secuencias que cumplen este criterio

(alinear 4 de 6) ocurren al azar y con mucha frecuencia en toda la extensión de un

genoma haciendo difícil diferenciar sitios de unión funcionales de alineamientos al

azar, por esto, de un grupo de secuencias de regulación conservados en varias especies

es importante notar si el orden de estos sitios coincide, así como la distancia entre cada

sitio. En el anexo 7 se muestra el orden de los sitios de regulación conservados.

Al comparar el orden de los sitios de regulación (Anexo 7), se observa que en humano

y chimpancé la distribución de los sitios en el cluster es la mas conservada es decir

que estas dos especies comparten la mayoría de secuencias y estas mantienen en el

mismo orden, lo cual era de esperarse pues la similitud entre estos dos genomas es

muy alta. En cuanto a las secuencias conservadas entre humano, ratón y perro se

mantiene el mismo orden en la mayoría de estas. Sin embargo se observa

reorganización de los sitios de unión al factor de transcripción B1, caracterizados en

ratón, CACCC-binding factor y BP1, BP2, caracterizados en humano. De otra forma,

todos los sitios de unión a GATA-1 conservan el mismo orden en las tres especies e

incluso rata donde se presenta la mayor reorganización del orden de los sitios de

regulación lo cual puede deberse a que en esta especie el cluster ha tenido eventos de

duplicación y conversión (Okumura, S. et al. 2004; Satoh, H. et al. 1999) y se estima

que es un cluster heterogéneo respecto al mismo en las otras especies.

En cuanto a las cinco secuencias que siendo caracterizadas en humano y ratón están

conservadas en pollo hay reorganización de dos de estas en el pollo (Figura 19) y

Page 73: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

84

además de la diferencia en orden, en humano y en ratón estos sitios están rodeados de

otras secuencias de regulación que en pollo no están conservadas.

Figura 19. Orden de tres sitios de regulación presentes en Humano, chimpancé, ratón,

rata y pollo, A muestra el orden y la posición de los sitios en el cluster de β-globina en

mamíferos. B muestra la posición y orden de las tres secuencias de regulación en

Pollo. Nótese que además de la diferencia en orden la distancia entre las secuencias es

mayor en Pollo.

De otra forma, en el cluster de β-globina en pollo se ha caracterizado un elemento de

regulación que se ubica entre los genes ε- globina y β-globina, denominado �enhancer�

β/ε, este elemento esta equidistante a los dos genes y se ha reportado competencia

entre los promotores de los dos genes para interactuar con el �enhancer� (Reitman, M.

et al. 1993; Hardison R.C. 1998). Se cree que la interacción de este elemento de

regulación con uno u otro promotor determina que gen es transcrito en una

determinada etapa del desarrollo (Reitman, M. et al. 1993; Recillas-Targa, F. et al.

2002). Dentro de las secuencias de regulación colectadas a partir de TransFac, 10

sitios de regulación se ubican entre los genes ε- globina y β-globina, a estos se unen

los factores de transcripción TFIID, GATA-1, TBP, PPUR, NFI/CTF, PYR, Sp1,

CACCC-binding factor y BGp1-G, debido a su ubicación en el cluster de pollo, estas

secuencias de regulación podrían estar relacionadas con el �enhancer� β/ε. De estos 10

sitios, 9 están presentes en humano, 8 en chimpancé, 7 en ratón y 6 en rata,

conservando en todos el mismo orden que en pollo, a excepción de una secuencia en

humano. Por otro lado, en rata, se mantiene el orden, pero entre uno y otro sitio

0 200 400 600 800 1000bp

GATA-1BP1,BP2 CACCC Bf

β-globin

GATA-1 BP1,BP2CACCC Bf

0 2000 4000 6000 8000 10000bp

ε-globin γ-globin

A

B

Page 74: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

85

homologo a los del pollo, se ubican también otras secuencias de regulación homologas

a sitios caracterizados tanto en humano como en ratón pero en estas especies los sitios

no se ubican cerca a los caracterizados en pollo (Figura 20).

Figura 20. Conservación del orden de secuencias de regulación caracterizadas en

pollo (en pollo las secuencias están en la cadena positiva mientras que en mamíferos

están en la negativa, pero el orden 3� a 5� se mantiene). En humano se conservan 9 de

las cuales dos están en otra posición (sitio de unión a TFDII y NFI/CTF); en

chimpancé hay 8 secuencias conservadas, el sitio para TFIID que en humano estaba en

otra posición no esta conservado en chimpancé. En ratón hay 7 secuencias (se pierden

los sitios para TFDII y NFI/CTF) todas en el mismo orden respecto al pollo. En rata,

las secuencias que están conservadas con el pollo están en el mismo orden pero

rodeadas de otras secuencias caracterizadas en humano y ratón, secuencia que en

cuyas especias se ubican en otra región del cluster.

BP1, BP2

Sp1 GATA-1, TBP TFIID

PPYR CACCC-Binding factor

GATA-1 GATA-1

161,620,200 161,620,290 161,620,230

TFIID PPUR

Coordenadas en cromosoma 1 En Rata

199,436,650 199,436,750 199,436,850

Sp1

CACCC-Binding Factor

GATA-1, TBP TFIID

TFIID

NFI/CTF

PPYR

TFIIDPPURBGP1, G factor

Coordenadas en cromosoma 1 En Pollo

TFIID

5,221,400 5,221,450 5,221,500 5,421,550

CACCC- Binding factor

GATA-1, TBP TFIID

NFT/CTF

TFIID Sp1

PPUR

PPYR

Coordenadas en cromosoma 11 en Humano

5,049,900 5,049,950 5,050,000 5,050,050

TFIID

GATA-1, TBP TFIID

CACCC- Binding factor

NFT/CTF

Sp1

PPYR

TFIID

PPUR

Coordenadas en cromosoma 11 en Chimpancé

Coordenadas en cromosoma 7 En Ratón

103,717,100103,717,000

PPUR PPYR

Sp1

CACCC-Binding factor

GATA-1, TBP TFIID

TFDII

TFDII

Page 75: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

86

Además de que la mayoría de secuencias, que en pollo podrían estar haciendo parte

del �enhancer� β/ε, están conservadas en humano, chimpancé, ratón y rata

manteniendo el mismo orden, también hay homología en cuanto a la región en donde

se ubica el conjunto de secuencias (exceptuando en rata) así, mientras que en pollo el

�enhancer� β/ε se ubica entre los genes β- y ε-globina, en humano y chimpancé las

secuencias se ubican entre los genes γ1- y δ- globina y en ratón entre γ- y ε- globina,

esto se puede representar que en mamíferos existe un �enhancer� homologo al

�enhancer� β/ε descrito en pollo. Es de notar que, en los dos grupos (aves y

mamíferos) la región conservada se encuentra entre dos genes uno de expresión

embrionaria y otro de expresión adulta.

Contrario a lo observado al ubicar las secuencias conservadas entre mamíferos y pollo,

Hardison, R. C. (1998) reporta que al realizar alineamientos de secuencias largas del

cluster de β-globina en pollo y en mamíferos (humano y ratón) no hay similitudes

significativas en las regiones de promotores y en las de elementos de control distal. El

encuentra que ninguna porción del cluster de β-globina en humano se alinea con las

secuencias del �enhancer� β/ε, así como tampoco hay alineamientos con las secuencias

del LCR. Sin embargo, Hardison reconoce la dificultad de ajustar el criterio de

alineamiento a las características de las secuencias de regulación. Por esto, es posible

que las comparaciones realizadas por Hardison, R. C. (1998) no hayan detectado

homología donde si existía. Por otro lado, en este mismo estudio de Hardison, R. C.

(1998) se propone que en mamíferos la región homologa a el �enhancer� β/ε se ubica

en HS2 por encontrar allí dos sitios de unión a GATA-1 y AP1/NFE2, sitios que

también se han descrito en el �enhancer� β/ε. Sin embargo, es necesario considerar que

la presencia de sitios de unión a dos factores de transcripción comunes no es

concluyente para determinar que dos regiones sean homologas especialmente cuando

secuencias de unión al factor de transcripción GATA-1 se encuentran varias veces en

toda la extensión del cluster.

Page 76: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

87

Por lo anterior tiene mas soporte concluir que, de existir un sitio homologo en

mamíferos al �enhancer� β/ε de pollo, este se ubique entre dos genes del cluster y no

en un sitio hipersensitivo, y además que su homología no este restringida a los sitios

de unión sino también al orden de estos en el cluster. Así pues, según los resultados

obtenidos, se propone que, el �enhancer� β/ε caracterizado en pollo, tiene un posible

sitio homologo en los mamíferos en donde no solo se han conservado los sitios de

unión sino su orden y su ubicación en el cluster.

Estudios de Wheeler, D. y colaboradores (2001) donde los alineamientos de

secuencias del cluster de β-globina en pollo y mamíferos no muestran similitud

significativa aunque estos compartan sitios de unión a factores de transcripción

comunes, sugieren que los elementos de regulación del cluster de β-globina en

mamíferos y aves pueden compartir un ancestro común que ha divergido tanto que los

alineamientos de secuencias no alcanzan a detectar similitudes o que, por el contrario,

han aparecido independientemente en cada grupo implicando con esto la evolución

convergente de elementos de regulación en estos dos grupos.

6.4.2. Locus de la región de control

El locus de la región de control (LCR) se define operacionalmente por su capacidad de

inducir la expresión de la familia de genes de β-globina de manera especifica al tejido.

El LCR del cluster de β-globina en humano se localiza entre 6 a 22kb en el extremo

5� del primer gen del cluster (ε-globina) y consiste en cinco sitios hipersensitivos a

DNasa I (HS), los sitios HS 1 a 4 se forman únicamente en glóbulos rojos mientras

que HS5 se encuentra en varios linajes celulares (Li, Q. et al. 2002). En ausencia del

LCR la trascripción del gen humano β-globina es menos que el 1%. En experimentos

con ratones transgenicos donde incluyen en el cluster de β-globina sitios HS se ha

observado que se incrementa sustancialmente la expresión del gen beta, indicando que

LCR tiene una fuerte actividad de �enhancer� distal. Se ha descrito que dicha

Page 77: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

88

actividad del LCR en el cluster de β-globina reside en HS2, HS3 y HS4, mientras que

HS5 presenta características de aislador (Molete, J. M. et al. 2002; Hardison, R. C. et

al. 1997; Bender, M. A. et al. 2006; Farrel, C. M. et al. 2002).

De la totalidad de sitios de regulación colectados algunos hacen parte de sitios

hipersensitivos (según anotación en TransFac® y revisión bibliográfica) con lo cual

fue posible ubicar tres de estos sitios en mamíferos y dos en pollo. Así, se encuentra

que las regiones descritas en TransFac® como parte de los sitios hipersensitivos HS2,

HS3 y HS4 en humano están conservadas en los mamíferos del estudio pero no en

pollo. En humano, chimpancé, ratón, rata, perro las regiones HS se ubican en el mismo

orden siendo la mas 5� HS4, seguida de HS3 y HS2, también se mantienen

conservadas en su orden las secuencias de regulación que hacen parte de cada sitio

hipersensitivo.

En pollo se mapeo el sitio hipersensitivo HS2 con base en las descripciones de

TransFac para siete secuencias de regulación, y el sitio HS4 con base en la

caracterización de Chung, J. H. et al. (1997); y Recillas-Targa, F. et al. (2002)

ninguno de estos sitios se encontró conservado en mamífero.

Molete, J. M. y colaboradores (2002) describen que el centro funcional de cada sitio

hipersensitivo es un fragmento de 100pb, definido como cantidad mínima DNA

necesaria para conferirle funcionalidad al HS, esto con base en experimentos

realizados en ratones transgenicos donde incluyen fragmentos de HS midiendo en cada

caso la expresión de los genes del cluster. El tamaño promedio de los sitios

reconocidos en este estudio como hipersensitivos es 250pb.

Comparaciones de las secuencias de el LCR en mamíferos (Hardison, R. C. et al.

1997; Molete, J. M. et al. 2002) muestran que la conservación de los sitios HS no esta

confinada a los centros de ~100pb sino que se hay amplias regiones homologas entre

los sitios hipersensitivos. Esto sugiere que las secuencias entre los HS son necesarias

Page 78: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

89

para algún aspecto de la regulación ejercida por LCR y por eso dichos fragmentos de

DNA han sido conservados. En este orden de ideas Molete, J. M. y colaboradores

(2002) han propuesto que los centros HS interactúan en sinergia para incrementar la

expresión de los genes del cluster de β-globina y que para esta interacción son

necesarias las secuencias Inter.- HS. Molete, J. M. et al. (2002) sugiere que el DNA

entre los sitios hipersensitivos no ejerce función de regulación por si mismo, pero que

en este pueden encontrarse sitios de unión a factores de transcripción que son

necesarios para activar el funcionamiento de los HS, actuando todo el LCR como una

unidad integrada (�hollocomplex�).

Tabla 9. Sitios de unión a factores de transcripción reportados en la literatura y sitios

ubicados según las secuencias de regulación colectadas en este estudio.

Sitio hipersensitivo

Función Sitios de unión a factores de

trascripción

Sitios de unión ubicados según datos colectados

HS5

Aislador (Farrel et al, 2002)

CTCF, GATA-1, NF-E2 (Farrel et al, 2002;Li et al. 1999)

Ninguno

HS4

Activación de la transcripción (Molete et al. 2001)

GATA-1, AP1/NFE2 (Molete et al. 2001)

Cp2a

HS3

Activación de la transcripción conformación abierta de la cromatina

GATA-1, AP1/NFE2, YY1, EKLF (Molete et al. 2002; Shelton et al. 1997)

GATA-1, CAC-Binding protein, NF-E2

HS2

Actividad de �enhancer�

GATA-1, NF-E2, Sp1, AP-1, USF, EKLF (Harju et al. 2005)

GATA-1, AP-1,c-Fos, c-Jun, MafG, MafG:MafG, NF-E2, Nrf, Nrf1:MafG, Nrf2, Nrf2:MafG

HS1

No presenta actividad de activación de la transcripción

GATA-1 (Wheeler et al. 2005)

Ninguno

Page 79: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

90

A pesar de la posible ubicación de secuencias de regulación en las regiones entre los

sitios hipersensitivos, ninguno de los sitios de regulación colectados en este estudio se

localiza en esas regiones del cluster. Además, muchos de los sitios de unión reportados

para cada sitio hipersensitivo no se lograron ubicar en este estudio. En la revisión de la

literatura hay caracterizaciones de sitios de unión en los HS pero no hay números de

accesión a secuencias y coordenadas lo cual imposibilita la ubicación de dichos sitios.

En la tabla 9 se estable comparación entre los sitios ubicados y los reportados en la

literatura por cada sitio hipersensitivo en el LCR de mamíferos.

6.4.3. Aisladores

Los aisladores son secuencias de DNA que protegen el locus de elementos de

regulación de genes vecinos la regulación inapropiada de los genes dentro del locus.

Uno de los aisladores mejor caracterizado en vertebrados es el HS4 del LCR del

cluster de β-globina en aves. Este aislador cumple las dos funciones típicas asignadas

a este tipo de elementos: es una barrera en la cromatina y bloquea la actividad de

�enhancers� externos.

Chung, J. H. y colaboradores (1997) caracterizaron la región HS4 de 1.2kb en pollo,

encontrando que la funcionalidad del aislador estaba restringida a un centro de 250pb

y mapearon dentro de estas 250pb cuatro �footprints� para determinar que secuencias

de regulación se ubicaban allí. De esta forma caracterizaron el sitio de unión al factor

de transcripción CTCF el cual es conocido por presentar actividad de activación y

represión de la transcripción.

En este estudio con base a los números de accesión a las secuencias de los �Footprints�

caracterizados por Chung, J. H. y colaboradores (1997) (No. accesión U78775, Anexo

cuatro secuencias de regulación 118 a 122), se ubico el sitio de unión al factor CTCF

en pollo y se hicieron alineamientos con esta secuencia para buscar el sitio homologo

en mamíferos. Los resultados de BLAT no mostraron algún alineamiento significativo

Page 80: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

91

de esta secuencia (�Footprint� II) con los genomas de mamíferos. Es posible que el

cluster de β-globina en mamíferos y aves haya divergido tanto que el alineamiento no

reconozca el sitio homologo a HS4 de pollo en mamíferos.

Por otro lado, Farrel, C. M. y colaboradores (2002) caracterizaron el sitio de unión al

factor de transcripción CTCF en humano y ratón, encontrando que en mamíferos esta

secuencia de unión se ubica en el sitio hipersensitivo HS5. De manera similar

Tanimoto, K. et al. (2003) demostraron que HS5 en mamíferos presenta actividad de

aislador en el cluster de β-globina en mamíferos y que dicha actividad es dependiente

del sitio para el factor CTCF y es especifica al estado del desarrollo.

Tanto en los estudios de Farrel, C. M. et al (2002) y Tanimoto, K. y colaboradores

(2003) se considera que la región HS5 en mamíferos es ortóloga a la HS4 en aves. Sin

embargo, de las secuencias colectadas en este estudio, ninguno de los sitios ubicados

en HS5 en mamíferos esta conservado en pollo y, como se menciono antes, la

secuencia de HS4 de pollo no se alinea a ninguna región del cluster en mamíferos. Es

posible que en los dos grupos se hubiera adquirido un elemento aislante por

convergencia o que, por el contrario, las regiones si sean ortólogas pero que las

secuencias hayan divergido mucho. Teniendo en cuenta que CTCF es una proteína

altamente conservada y que se une a una amplia variedad de secuencias (Farrel, C. M.

et al. 2002), la divergencia de las secuencias de los aislantes a partir de una secuencia

común no impediría que se mantuviera la funcionalidad de la región, pues CTCF

adquirió la posibilidad de unirse a varias secuencias.

De todas las secuencias colectadas, es de notar que ninguna se ubica hacia el extremo

3� del cluster a pesar de que se han caracterizado aisladores en la región 3� del locus,

3�HS1 y 3�HS en mamíferos y en aves respectivamente. En mamíferos el aislador

3�HS1 no tiene actividad �enhancer� pero es responsable de atenuar la expresión de γ-

globina en humano. 3�HS1 también tiene sitio de unión a CTCF tanto en humano

como en ratón. Por otro lado, en pollo 3�HS y 5�HS4 coinciden con los limites

Page 81: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

92

estructurales del cluster, es decir mas allá de los aisladores hay diferencia en el estado

de metilación o acetilación de la cromatina respecto a este dentro del locus. Contrario

a lo observado en aves, en mamíferos, el estado estructural de la cromatina no cambia

aun en regiones alejadas de los sitios 5�HS5 y 3�HS1, por lo que se ha sugerido la

posible existencia de secuencias de regulación en zonas mas allá de los aisladores o

incluso la presencia de aisladores ubicados mas corriente arriba y corriente abajo en

cada extremo del cluster (Farrel, C. M. et al. 2002; Molete, J. M. et al. 2001, Molete,

J. M et al. 2002; Bender, M. A. et al. 2006).

En general la única característica que comparten los dos grupos a este respecto es la

presencia del sitio de unión a CTCF (Farrel, C. M. et al. 2002), sin embargo, a partir

de esta similitud los aisladores HS5 de mamífero y HS4 en pollo han sido

considerados secuencias ortólogas (Farrel, C. M. et al. 2002; Molete, J. M. et al. 2002)

cuando posiblemente han sido adquiridas por convergencia, pues que son mas las

diferencias entre estas regiones de los dos clusters que las similitudes.

7. CONCLUSIONES

Teniendo en cuenta que este estudio es la primera aproximación a la comparación de

secuencias de regulación del cluster de β-globina en humano, chimpancé, ratón, rata,

perro y pollo, la información colectada aquí permite obtener una idea general de la

organización del cluster en estas especias logrando un acercamiento al posible patrón

de conservación de los mecanismos de regulación de este cluster de genes.

Se colecto información respecto a las secuencias de unión y su ubicación en el cluster

de β-globina en aves y mamíferos, de 24 factores de transcripción que intervienen en

la regulación de estos genes. Sin embargo, no se colectaron secuencias para algunos

factores que han sido identificados en la regulación de genes de β-globina y a pesar de

que para algunos de estos factores de transcripción se hayan caracterizado sus

secuencias de unión, aun hace falta información para poder determinar el sitio en el

Page 82: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

93

cluster a donde se unen. Esto representa que de la gran cantidad de información

disponible respecto a regulación de este cluster, solo de un porcentaje se pueden

extraer secuencias y estimar coordenadas de sitios de regulación.

Respecto al patrón de conservación de los sitios de regulación colectados, estudios

previos indican que no hay alineamientos representativos entre las secuencias no

codificantes del cluster de β-globina en mamíferos y aves, grupos que divergieron

hace aproximadamente 250 millones de años (Hardison, R. C. 1998). Sin embargo, la

colección de datos de este trabajo muestra que si bien la mayoría de secuencias de

regulación no se encuentran conservadas entre los dos grupos, la regulación de este

cluster de genes en ambos grupos involucra elementos de regulación similares. Se

reconocen dos elementos comunes en la regulación de este cluster en aves y

mamíferos: la presencia de aisladores con sitio de unión al factor CTCF en ambos

extremos del cluster. Y la presencia en mamíferos de un posible sitio homologo al

�enhancer� β/ε de pollo.

Estos dos elementos comunes encontrados en pollo y mamíferos llevan a concluir que

es posible que entre estos dos grupos existan más similitudes en los elementos de

regulación, pero probablemente los criterios establecidos en la búsqueda mediante

comparación de secuencias no permita detectarlas. Es probable que si se comparan las

secuencias del cluster de los dos grupos sometiendo el alineamiento por regiones no

tan extensas, se reconozcan homologías antes no detectadas debido a que estas se

pueden encontrar restringidas a fragmentos cortos en el cluster, mientras que toda la

extensión del cluster, como un todo, haya divergido.

En cuanto a la organización de los genes y de los sitios de regulación en el cluster de

β-globina en los mamíferos, se puede concluir que se observa mayor variación en el

cluster de rata. En este cluster pudo haber duplicación del gen gamma, evento que ha

sido descrito en primates antropoides y que se ha relacionado con un cambio en el

patrón de expresión de los genes. Cambio que, según la revisión bibliográfica también

Page 83: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

94

sucedió en el cluster de rata lo cual justificaría la posible duplicación. Además de la

presencia de dos genes gamma en el cluster de rata, también la distribución de los

sitios de regulación que se ubican entre los genes del cluster es diferente. A pesar de

que mantiene el orden de las secuencias, en rata la mayoría de estas se ubican

corriente arriba del gen beta, mientras que en los otros mamíferos esos sitios de

regulación se ubican entre los genes β-δ-γ

Los resultados muestran que entre perro y pollo no se comparte ninguna secuencia de

regulación, esto puede deberse a que el genoma del perro no se encuentra tan bien

anotado como el genoma de los otros mamíferos incluidos en este estudio, es posible

que en perro como en los otros mamíferos, estas secuencias de regulación si se

encuentren pero que estén pero que coincidan con polimorfismos o con �gaps� en la

secuencia y por tal motivo no hayan sido alienadas.

También se concluye que la colección de secuencias de regulación del cluster de β-

globina permitió identificar en todos los mamíferos incluidos en el estudio los sitios

HS4, HS3 y HS2 a partir de secuencias caracterizadas en humano, estableciendo que

el LCR se encuentra conservado en este grupo. Además, es posible que haya

secuencias de regulación en las regiones entre los sitios hipersensitivos, pues según

Farrel, C. M. et al. (2002) y Molete, J. M. et al. (2002), estas regiones han sido

conservadas y se cree que intervienen en la interacción de los sitios HS permitiendo

que estos actúen en sinergia.

En cuanto a los elementos aislantes, se reconoce que en mamíferos el sitio

hipersensitivo 5�HS5 es homologo al sitio HS4 en pollo el cual ha sido ampliamente

caracterizado como aislador. Sin embargo, HS5 no fue ubicado en mamíferos así

como tampoco el sitio de unión al factor CTCF el cual lo caracteriza como elemento

aislador.

Page 84: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

95

Es posible que en mamíferos haya secuencias de regulación mas allá del sitio

hipersensitivo HS5, debido a que este no coincide con los limites estructurales de la

cromatina, lo cual si sucede en pollo en donde el elemento aislante HS4 coincide con

cambio en la conformación de la cromatina.

Finalmente, las secuencias colectadas en este trabajo permiten determinar dentro del

cluster de β-globina las regiones de DNA no codificante que se han conservado en los

mamíferos y pollo así como reconocer los factores de transcripción que se unen a esas

secuencias conservadas esta información será útil para futuros estudios.

8. RECOMENDACIONES

Las secuencias colectadas permiten identificar, en el cluster de β- globina, algunas

regiones de DNA no codificante que presentan similitud entre las diferentes especies,

esto representa el primer paso en el estudio de la comparación de los patrones de

regulación de la expresión de los genes de este cluster. Se propone que las secuencias

de estas regiones sean sometidas a análisis computacional para la búsqueda de más

motivos de regulación. Las secuencias de DNA reconocidos por los factores de

transcripción son generalmente cortos y degenerados, por lo que su identificación con

algoritmos computacionales ha representado un reto; al haber limitado las regiones en

donde se pueden encontrar con mas frecuencias estos motivos y habiendo determinado

los motivos de los factores de transcripción se facilitara la búsqueda de mas sitios de

regulación en el cluster de beta globina.

Se propone también determinar el motivo consenso a cada factor de transcripción

cuyas secuencias de unión se colectaron en este trabajo, con el fin de determinar el

motivo más común de unión a cada factor de transcripción y usarlos en la búsqueda

de más sitios de regulación en el cluster de β-globina.

Page 85: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

96

Debido a que según la revisión bibliográfica, las comparaciones de secuencias en

mamíferos muestran que hay alineamientos significativos mucho mas allá de los

limites del cluster, y debido a que este se encuentra en un dominio de cromatina

abierto en mamíferos, se propone buscar motivos de regulación en fragmentos de

DNA mas allá del sitio hipersensitivo 5� HS5 y 3�HS1 puesto que es posible que en

estas regiones se encuentre un elemento otro elemento aislante, además de mas sitios

de regulación. Así mismo, se propone buscar por medio de algoritmos

computacionales secuencias de regulación en las regiones de DNA entre los sitios

hipersensitivos debido que estas regiones se han conservado y existe la posibilidad de

que en ellas haya motivos de regulación.

En general son pocas las similitudes encontradas entre aves y mamíferos. Sin

embargo, se propone realizar alineamientos de la región que corresponde al

�enhancer� β/ε en pollo contra las secuencias de las regiones donde el elemento

homologo a este se pueda ubicar en mamíferos. Así mismo, se propone realizar el

mismo procedimiento con las secuencias de los sitios hipersensitivos caracterizados en

pollo y en mamíferos.

9. REFERENCIAS

Asano, H., Li, X. S., Stamatoyannopoulos, G. 1999. FKLF, a novel Kruppel-like factor that activates human embryonic and fetal β-like globin genes. Mol Cell Biol. 19:3571-3579 Blackwood, E. M., Kadonaga, J. T. 1998. Going the Distances: A current View of Enhancer Action. Science 281:60-63 Bender, M. A., Byron, R., Ragoczy, T., Telling, A., Bulger, M., Groudine, M. 2006. Flanking HS-62.5 and 3�HS1, and regions upstream of the LCR, are not required for β-globin transcription. Blood. 108 ( 4):1395-1401 Bulger, M., Schubeler, D., Bender, M. A., Hamilton, J., Farrell, C. M., Hardison, R. C., Groudine, M. 2003. A complex chromatin "landscape" revealed by patterns of nuclease sensitivity and histone modification within the mouse -globin locus. Mol. Cell. Biol. 23:5234�5244.

Page 86: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

97

Butler, J. E., Kadonaga, J. T. 2001. Enhancer-promoter specificity mediated by DPE or TATA core promoter motifs. Genes Dev.(15):2515�2519.

Calhoun, V. C., Stathopoulos, A., Levine, M. 2002, Promoter-proximal tethering elements regulate enhancer-promoter specificity in the Drosophila Antennapedia complex. Proc Natl Acad Sci USA. 99:9243�9247

Chan, J. Y., Han, X. L., Kan, Y. W. 1993. Cloning of Nrf1, an NF-E2-related transcription factor, by genetic selection in yeast. Proc Natl Acad Sci. USA. 90:11371-11375 Choi, O. R., Engel, J. D. 1988. Developmental regulation of β-globin gene switching. Cell. 55:17-26 Chung, J. H., Bell A. C., Felsenfeld G. 1997. Characterization of the chicken β-globin insulator. Proc. Natl. Acad. Sci USA 94:575-580 Dorfman, D. M., Wilson, D. B., Bruns, G. A., Orkin, S. H. 1992. Human transcription factor GATA-2. Evidence for regulation of preproendothelin-1 gene expression in endothelial cells. J. Biol Chem. 267:1279-1285 Dorschner, M. D., Hawrylcz, M., Humbert, R., Wallace, J. C., Shafer, A., Kawamoto, J., Mack, J., Hall, R., Goldy, J., Sabo, P. J., Kohli, A., Li, Q., McArthur, M., Stamatoyannopoulos, J. A. 2004. High-throughput localization of functional elements by quantitative chromatin profiling. Nature Methods 1(3): 219-225. Enver, T., Raich, N., Ebens, A. J., Papayannopoulou, T., Costantini, F., Stamatoyannopoulos, G. 1990. Developmental regulation of human fetal-to-adult globin gene switching in transgenic mice. Nature. 344(6264):309-313 Epner, E., Reik, A., Cimbora, D., Telling , A., Bender, M. A., Fiering, S., Enver, T., Martin, D. I., Kennedy, M., Keller, G., croudine, M. 1998. The β-globin LCR is not necessary for an open chromatin structure or developmentally regulated transcription of the native mouse β-globin locus. Mol Cell Biol. 2:447-455 Farrel, C. M., West, A. G., Felsenfeld, G. 2002. Conserved CTCF Insulator Elements Flank the Mouse and Human β-Globin Loci. Mol Cell Biol. 22(11):3820-3831 Filipe, A., Li, Q., Deveaux, S., Godin, I., Romeo, P. H., Stamatoyannopoulos, G., Mignotte, V. 1999. Regulation of embryonic/fetal globin genes by nuclear hormone receptors: a novel perspective on hemoglobin switching. EMBO J. 18:687-697

Page 87: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

98

Forrester, W. C., Epner, A., Driscoll, M. C., Enver, T., Brice, M., Papayannopoulou, T., Groudine, M. 1990. A deletion of the human β-globin locus activation region causes a major alteration in chromatin structure and replication across the entire β-globin locus. Genes Dev. 4:1637-1649 Fraser, P., Hurst, J., Collis, P., and Grosveld, F. 1990. DNase I hypersensitive sites 1, 2 and 3 of the human β-globin dominant control region direct position-independent expression. Nucleic Acids Res. 18: 3503�3508 Gaszner, M., Felsenfeld, G. 2006. Insulators: exploiting transcriptional and epigenetic mechanisms. Nat. Rev. Genet. 7(9):703-13. Hardison, R. C., Miller, W., 1993. Use of long sequence alignments to study the evolution and regulation of mammalian globin gene clusters. Mol Biol Evol. 10(1):73-102 Hardison, R. C. 1998. Hemoglobins from Bacteria to Man: Evolution of Different Patterns of Gene Expression. Journal of Experimental Biology. 201: 1099-1117 Hardison, R. C. 2001. New views of evolution and regulation of vertebrate beta-like globin gene clusters from an orphaned gene in marsupials. Proc. Natl. Acad. Sci. USA. 98:1327-1329 Harju, S., McQueen, K. J., Peterson, K. R. 2002 Minireview: Chromatin Structure and Control of β-like Globin Gene Switching. Experimental Biology and Medicine 227(9):683-700.

Holland, R. A., Gooley, A. A. 1997. Characterization of the embryonic globin chains of the marsupial Tammar wallaby, Macropus eugenii. 2nd. Eur J Biochem. (248):864�871

Holland, R. A., Gooley, A. A., Hope, R. M. 1998. Embryonic globins of the marsupial the Tammar Wallaby (Macropus eugenii): bird like and mammal like. Clin Exp Pharmacol Physiol. (25):740�744. Jane, S. M., Ney, P. A., Vanin, E. F., Gumucio, D. L., Niehuis, A. W. 1992. Identification of a stage selector element in the human γ-globin gene promoter that fosters preferential interaction with the 5� HS2 enhancer when in competition with the β-promoter. EMBO J. 11:2961-2969 Jensen, L. J., Jensen, T. S., de Lichtenberg, U., Brunak, S., Bork, P. 2006. Co-evolution of transcriptional and post-translational cell-cycle regulation. Nature. 443(7111):594-597

Page 88: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

99

Kent, W. J. 2002. BLAT--the BLAST-like alignment tool. Genome Res. 12(4):656-664. Kim, A., Dean, A. 2004. Developmental stage differences in Chromatin sub domains of β-globin locus. Proc. Natl. Acad. Sci USA 101(10):7028-7033 King, D. D., Taylor J., Elnitski, L., Chiaromonte, F., Miller, W., Hardison, R. C. 2005. Evaluation of regulatory potential and conservation scores for detecting cis-regulatory modules in aligned mammalian genome sequences. Genome Res. 15:1051-1060 Kuhn, R. M., Karolchik, D., Zweig, A. S., Trumbower, H., Thomas, D. J., Thakkapallayil, A., Sugnet, C. W., Stanke, M., Smith, K. E., Siepel, A., Rosenbloom, K. R., Rhead, B., Raney, B. J., Pohl, A., Pederson, J. S., Hsu, F., Hinrichs, A. S., Harte, R. A., Diekhans, M., Clawson, H., Bejerano, G., Barber, G. P., Baertsch, R., Haussler, D., Kent, W. J. .2006. The UCSC genome browser database: Update 2007. Nucleic Acids Res. 00(Data base issue):D1-D6 Lam, L. T., Bresnick, E. H. 1996. A Novel DNA-Binding protein, HS2NF5, interacts with a functionally important sequence of the human β-globin locus control region. J. Biol. Chem. 271:32421-32429 Lemon, B. and Tjian, R. 2000. Orchestrated response: A symphony of transcription factors for gene control. Genes y Dev. (14): 2551-2569. Levine, M., Tjian, R., 2003. Transcription regulation and animal diversity. Nature. 424(6945):147-51 Li, J., Noguchi, C., Miller, W., Hardison, R. C., Schechter, A. 1998. Multiple regulatory elements in the 5'-flanking sequence of the human -globin gene. J. Biol. Chem. 273:10202�10209 Li, Q., Zhang, M., Han, H., Rohde, A., Stamatoyannopoulos, G. 2002. Evidence that DNase I hypersensitive site 5 of the human beta-globin locus control region functions as a chromosomal insulator in transgenic mice. Nucleic Acids Res. 30:2484-2491 Li, Q., Peterson, K. R., Fang, X., Stamatoyannopoulos, G. 2002.Locus Control Regions. Blood, (100): 3077-3086 Mariño-Ramírez, L., Jordan, I. K., Landsman, D. 2006. Multiple independent evolutionary solutions to core histone gene regulation. Genome Biol. 7(12):R122 Mariño-Ramírez, L., Kann, M. G., Shoemaker, B. A., Landsman, D. 2005. Histone structure and nucleosome stability. Expert Rev. Proteomics (5):719-29

Page 89: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

100

Mariño-Ramírez, L., Spouge, J. L., Kanga, G. C., Landsman, D. 2004. Statistical analysis of over-represented words in human promoter sequences. Nucleic Acids Res. 32(3):949-958 Matys, V., Kel-Margoulis, O. V., Fricke, E., Liebich, I., Land, S., Barre-Dirrie, A., Reuter, I., Chekmenev, D., Krull, M., Hornischer, K., Voss, N., Stegmaier, P., Lewicki-Potapov, B., Saxel, H., Kel, A. E., Wingender, E. 2006. TRANSFAC® and its module TRANSCompel®: Transcriptional gene regulation in eukaryotes. Nucleic Acids Res. 34 (Data base issue): D108-D110 McClean, P. 1997. Control of Gene Expression In Eukaryotas [En linea]: Plcs: Intermediate Genetics.http://www.ndsu.nodak.edu/instruct/mcclean/ [Consultada 30 de septiembre de 2006] Merika, M., Orkin, S. H. 1993. DNA Binding specificity of GATA family transcription factors. Mol Cell Biol. 13:3999-4010 Molete, J. M., Petrykowska, H., Bouhassira, E. E., Feng, Y., Miller, W., Hardison, R. C., 2001. Sequences Flanking Hypersensitive Sites of the β globin Locus Control Region are required for Synergistic Enhancement. Mol Cell Biol. 21(9):2969-2980 Molete, J. M., Petrykowska, H., Sigg, M., Miller, W., Hardison, R. C. 2002. Functional and binding studies of HS3.2 of the beta-globin locus control region. Gene (283): 185-197 Ney, P. A., Sorrentino, B. P., Mc Donagh, K. T., Nienhuis, A. W. 1990. Tandem AP-1-Binding sites within the human β-globin dominant control region functions as an inducible enhancer in erythroid cells. Gene Dev. 4:993-1006 Okumura S., Fujii, H., Inokuchi, N., Watanabe, M., Nishino, T., Okasaki, T. 2004. Molecular cloning and characterization of three adult rat β-globin gene promoters. Biochimica et biophysica Acta (1678):145-149 Ouyang, L., Chen, X., Bieker, J. J. 1998. Regulation of Erythroid Kruppel-like factor (EKLF) transcriptional activity by phosphorilation of a protein kinase II site within its interaction domain. J. Biol. Chem. 273:23019-23025 Raich, N., Clegg, C. H., Grofti, J., Romeo, P. H., Stamatoyannopoulos, G. 1995. GATA-1 and YY1 are developmental repressors of the human ε-globin gene. EMBO J. 14:801-809 Recillas-Targa, F., Pikaart, M. J., Burgess-Beusse, B., Bell, A. C., Litt, M. D, West, A. G., Gaszner, M., Felsenfeld, G. 2002. Position-effect protection and enhancer blocking

Page 90: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

101

by the chicken beta-globin insulator are separable activities. Proc Natl Acad Sci U S A. 99(10):6883-6888. Reitman, M., Grasso, J. A., Blumentahl, R., Lewit, P. 1993. Primary sequence, evolution, and repetitive elements of the Gallus gallus (chicken) beta-globin cluster. Genomics. 18:616�626. Ryan, T. M., Sun, C. W., Ren, J., Townes, T. M. 2000. Human gamma-globin gene promoter element regulates human beta-globin gene developmental specificity. Nucleic Acids Res. 28(14):2736-2740. Satoh, H., Inokuchi, N., Nagae, Y., Okasaki, T. 1999. Organization, structure and evolution of the Nonadult rat β-globin gene cluster. J. Mol. Evol. 49:122-129 Stamatoyannopoulos, G., Josephson, B., Zhang, J. U., and Li, Q. 1993. Developmental regulation of human -globin gene in transgenic mice. Mol. Cell. Biol. 13:7636�7644 Struhl, K. 2001. Perspectives: Gene Regulation. A paradigm for Precision. Science 293: 1054-1055 Talbot, D., Philpsen, S., Fraser, P., Grosveld, F. 1990 Detailed Analysis of the site 3 region of the human β-globin dominant control region. EMBO J. 9: 2169-2177 Tanay, A., Regev, A., Shamir, R. 2005. Conservation and evolvability in regulatory networks: the evolution of ribosomal regulation in yeast. Proc Natl Acad Sci. USA. 102(20):7203-7208 Tang, D. C., Ebb, D., Hardison, R. C., and Rodgers, G. P. 1997. Restoration of the CCAAT box and insertion of the CACCC motif activate d-globin gene expression. Blood 90:421�427. Tanimoto, K., Sugiera, A., Omori, A., Felsenfeld, G., Ángel, J. D., Fukamizu, A. 2003. Human β- globin Locus Control region HS5 Contains CTCF- and Developmental Stage-Dependent Enhancer-Blocking Activity in Erythroid Cells. Mol. Cell Biol. 23(24):8946- 8952 Tanimoto K., Liu, Q., Bungert, J. and Engel, J. D. 1999. Effects of altered gene order or orientation of the locus control region on human beta-globin gene expression in mice. Nature. (398):344�348 Tanimoto, K., Liu, Q., Grosveld, F., Bungert, J., Engel, J. D. 2000. Context-dependent EKLF responsiveness defines the developmental specificity of the human ε-globin gene in erythroid cells of YAC transgenic mice. Gene Dev. 14:2778-2794

Page 91: IDENTIFICACION Y LOCALIZACIÓN DE SECUENCIAS DE …

102

Tsang, A. P., Visvader, J. E., Turner, C. A., Fujiwara, Y., Yu, C., Weiss, M. J., Crossley, M., Orkin, S.H. 1997. FOG, a multiple zinc finger protein , acts as cofactor for transcription factor GATA-1 in erythroid and megakaryocytic differentiation. Cell. 90:109-119

Welch, J., Waltts, J. A., Vakoc, C. R., Yao, Y., Wang, H., Hardison, R. C., Blobel, G. A., Chodosh, L. A., Weiss, M. J. 2004. Global regulation of Erythroid gene expression by transcription factor GATA-1. BLOOD. 104(10):3136-3147

West, A. G., Gaszner, M., Felsenfeld, G. (2002) Insulators: Many functions, many mechanisms. Genes Dev. (16):271�288 Wheeler, D., Hope, R., Cooper, S. B., Dolman, G., Webb, G. C., Bottema, C. D., Gooley, A. A., Goodman, M., Holland R. A.. 2001. An orphaned mammalian beta-globin gene of ancient evolutionary origin. Proc Natl Acad Sci USA. 98:1101-1106 Wijgerde, M., Gribnau, J., Nuez, B., Philpsen, S., Grosveld, F., Fraser, P. 1996. The role of EKLF in Human β-globin gene competition. Genes Dev. 10:2894-2902 Wray, G. A., Hahn, M. W., Abouheif, E., Balhoff, J. P., Pizer, M., Rockman, M. V., Romano, L.A. 2003. The Evolution of Transcriptional Regulation in Eukaryotes. Mol Biol Evol. 20(9):1377-1419. Wright, S., Rosenthal, A., Flavell, R., Grosveld, F. 1984. DNA sequences required for regulated expression of -globin genes in murine erythroleukemia cells. Cell. 38:265�273 Yu, C. Y., Motamed, K., Chen, J., Bailey, A.D., Shen, C. K. J. 1991. The CACC box upstream of human embryonic globin gene binds Sp1 and is a functional promoter element in vitro and in vivo. J. Biol. Chem. 266:8907�8915 Zhou, W., Clouston, D. R., Wang, X., Cerruti, L., Cunningham, J. M., Jane, S. M. 2000. Induction of Human fetal globin gene expression by a novel erythroid factor, NF-E4. Mol Cell Biol. 20:7662-7672