Estudo da diversidade comEstudo da diversidade com ... · estudo do DNA por sequenciação...
Transcript of Estudo da diversidade comEstudo da diversidade com ... · estudo do DNA por sequenciação...
Estudo da diversidade comEstudo da diversidade com sequências de DNAq
estudo do DNA por sequenciação
extracção de DNAextracção de DNA
PCR do fragmento desejado
sequenciação
estudo do DNA por sequenciação
sequenciação
1 2 3
indivíduo A
1 3
indivíduo A
indivíduo B
indivíduo C
Alguns índices de diversidade:Alguns índices de diversidade:
π (diversidade nucleotídica):Número médio de diferenças (por site) entre duas sequências retiradas ao acasoNúmero médio de diferenças (por site) entre duas sequências retiradas ao acasode uma amostra.
H (diversidade haplotípica):Probabilidade de, retirando aleatoriamente dois haplótipos de uma amostra, estesserem diferentes
S (número de sítios variáveis)S (número de sítios variáveis)
θ (population mutation parameter)Nível esperado de variabilidade assumindo equilíbrio entre mutação e deriva eausência de selecção. Estabelece uma relação entre o efectivo populacional e ataxa de mutação.
θ = 4Neμ autossomasθ 4Neμ autossomasθ = 3Neμ cromossoma Xθ = Neμ cromossoma Y, mitocondrial
E d ó i d l l i dif i dEm vez de uma só maneira de o calcular, existem diferentes estimadores que aproximam este valor (exemplo: θ de Watterson (1975)). Usa-se este valor para estimar o Ne.
PROGRAMAS QUE CALCULAM PARÂMETROS DE DIVERSIDADE
DNAsp
Arlequin
SITESSITES
‐ A diversidade diminui nas populações mais a norte.
0.8
Hd
0.6
0.7
0.4
0.5
Hd
0.2
0.3
0
0.1
0 2 4 6 8 10 12 14
Construção de redes deConstrução de redes de haplótiposp p
3 52 41
A
3 52 41
3 5A B
3 5
3 52 41
C
3 52
A B3 5
3 52 41
C
3 52
A B
D
3 5
1D
E4
3 52 41
C
3 52
4
A B
D
3 5
1D
E4
3 52 41
C
3 52
4
1
A B
D
F3 5
12 D
E4
3 52 41
C
3 52
4
1
A
D
F B, G3 5
12 D
E4
3 52 41
C, H
3 52
4
1
A
D
F B, G3 5
12 D
Softwares que fazem redes de haplótipos:Softwares que fazem redes de haplótipos:
-Networket o-TCS-(Arlequin)…
( ét d dif t )(usam métodos diferentes)
h25
h24h19
h20h21
h26
h16h28
h24
h23
N t
h30
h22
h14h11 h29
h18
h17
h27
h15
NorteSul
h30
h4h1
h9h13
h10
h14h11 h29h17
h8
10
9
BU
Rede de haplótipos
h3
h7 h2
h4h12
h5
haplótipos
(700bp )h1h6Distribuição geográfica
dos grupos
Pi
0 008
0.009
0.01
0.006
0.007
0.008
B
0.003
0.004
0.005Pi
Buçaco
0
0.001
0.002
0 2 4 6 8 10 12 14
Subestruturação ao nível de çsequências do DNA
Distância entre populaçõesDistância entre populações
Dxy: distância média entre elementos dos dois grupos.
Da: distância média entre elementos dos dois grupos, corrigida para a distância observada dentro de cada grupo.
Grupo 1 Grupo 2
ResultadosResultados
Dxy = 1,268%Da =0,996%Nº de posições fixas 6Nº de posições fixas = 6
Etc. etc.
RecapitulandoRecapitulando…
‐ Calculámos diferentes índices de diversidade para populações de C. lusitanica
‐ Verificámos que, tal como nos marcadores nucleares, a diversidade diminui nas populações mais a norte.
0 8
Hd
0.5
0.6
0.7
0.8
0.1
0.2
0.3
0.4Hd
0
0 2 4 6 8 10 12 14
‐ Verificámos que existem dois grandes grupos de‐ Verificámos que existem dois grandes grupos de haplótipos que ocupam áreas geográficas diferentes.
h25
h24h19
h20h21
h26
h16h28
h23
Norte
h30
h22
h14h11 h29
h18
h17
h27
h15
9
NorteSul
h3 h4h1
h9h13
h10h8
10
9
BU
Rede de haplótipos
h3
h7 h2
2
h5
ã áhaplótipos
(700bp )h1h6Distribuição geográfica
dos grupos
0 01
Pi
0.007
0.008
0.009
0.01
B
0.003
0.004
0.005
0.006
Pi
Buçaco
0
0.001
0.002
0 2 4 6 8 10 12 14
‐ Iniciámos ainda a análise de subestruturação‐ Iniciámos ainda a análise de subestruturação calculando a distância genética entre os grupos.
Subestruturação ao nível de çsequências do DNA
Diferenciação entre populações
Pop 1
As estatísticas F (Fst, Fit, Fis) foram desenvolvidas a pensar em dados alélicos (como proteínas), mas podemos fazer um paralelo com sequências de DNA.
Existem diversas medidas análogas ao Fst para sequências de DNA. Algumas incorporam informação
Pop 2
sobre o número de mutações (distância) entre alelos (ex. Fst de Hudson et al. (1992)), outras contemplam apenas frequências (como as medidas “clássicas”).
Pop 2
No fundo, o que estes valores nos medem é a proporção de variação que está entre as unidades que consideramos (ex populações) por oposição à proporção que está(ex. populações) por oposição à proporção que está dentro dessas unidades.
O DNAsp e o Arlequin calculam nos estes valores de FstO DNAsp e o Arlequin calculam-nos estes valores de Fst (mas para isto temos primeiro de definir populações).
Diferenciação entre populações
E se quisermos pensar a mais do que um nível?
Qual a % de variação explicada por diferenças:
q p q
Pop 1 Pop 3 diferenças:
entre grupos?entre populações dentro de cada grupo?
Grupo 2Grupo 1AMOVA – analysis of molecular variance (E coffier et al 1992)
entre populações dentro de cada grupo?dentro das populações?
Pop 2 Pop 4
Grupo 2Grupo 1 (Excoffier et al. 1992)
Pode ser feita não só para sequências de DNA mas também para outros dadosDNA mas também para outros dados (proteínas, microssatélites, etc.).
Software ArlequinSoftware Arlequin
Diferenciação entre populações
E se quisermos pensar a mais do que um nível?
Qual a % de variação explicada por diferenças:
q p q
Pop 1 Pop 3 diferenças:
entre grupos?entre populações dentro de cada grupo?
Grupo 1 AMOVA – analysis of molecular variance (E coffier et al 1992)
entre populações dentro de cada grupo?dentro das populações?
Pop 2 Pop 4
(Excoffier et al. 1992)
Pode ser feita não só para sequências de DNA mas também para outros dados
Grupo 2
DNA mas também para outros dados (proteínas, microssatélites, etc.).
Software ArlequinGrupo 2 Software Arlequin
Diferenciação entre populações
Output do Arlequin:
-% de variação em cada nível hierárquico
- índices de fixação
í i d i ifi â i- níveis de significância determinados por permutações
ResultadosResultados
AMOVA norte vs. sul(ignorando a população do Buçaco):
‐ % variação entre grupos: 77,91%‐ % variação entre pops dentro dos grupos: 12,07%‐% variação dentro das pops: 10,02%
(todos os valores estimados para os índices)de fixação são significativos)