Beruflich Dokumente
Kultur Dokumente
Medidas de la diversidad
gentica
Derechos de Autor: IPGRI y Cornell University, 2004
Medidas de diversidad 1
Contenido
f Anlisis bsico de la diversidad gentica
f Tipos de variables
f Cuantificacin de la diversidad gentica:
Medidas de la diversidad gentica dentro de una
poblacin
Medidas de la diversidad gentica entre
poblaciones
f Apndices
Medidas de diversidad 2
m
D a
a r
t c
o a
s d
o
d r
e e
s
1
1
0
1
0
1
1
0
0
1
0
0
1
0
Individuos
1
1
0
0
0
1
1
0
1
0
0
1
1
1
0
1
0
0
1
0
1
1
1
0
1
0
0
1
02
03
04
05
01
02
0.56
03
0.33
0.33
04
0.47
0.26
0.50
05
0.32
0.43
0.37
0.28
06
0.33
0.56
0.56
0.37
0.46
06
Ind5
Ind3
Ind6
Ind4
Ind2
Ind1
Medidas de diversidad 3
2.
3.
Tipos of variables
f Cualitativas. Se refieren a caracteres o
cualidades, y son binarias o categricas:
Binarias, cuando reciben solamente dos valores:
presente (1) o ausente (0)
Categricas, cuando reciben un valor entre varias
posibilidades y pueden ser ordinales o nominales:
Ordinales: categoras que tienen un orden
Nominales: categoras que no tienen relacin
entre s
Medidas de diversidad 4
Medidas de diversidad 5
Pj = q 0.99
Medidas de diversidad 6
Donde,
Pj = tasa de polimorfismo
q = frecuencia allica
Esta medida proporciona el criterio para determinar si un gen presenta
variacin.
Su clculo se hace por observacin directa respecto a si se cumple la
definicin o no se cumple.
La medida puede usarse con marcadores codominantes y, de manera muy
restrictiva, con marcadores dominantes, debido a que la estimacin basada
en los marcadores dominantes presentara una tendencia al sesgo inferior al
nmero real.
Por lo general, un gen polimrfico es aquel para el cual el alelo ms comn tiene
una frecuencia de menos de 0.95. Los alelos raros o poco comunes se definen
como aquellos cuyas frecuencias son menores a 0.005. El lmite de la frecuencia
allica, que se fija en 0.95 ( 0.99) es arbitrario, y su objetivo es ayudar a
identificar aquellos genes en los cuales es comn la variacin allica.
Referencia
Cavalli-Sforza, L. L. y W. F. Bodmer. 1981. Gentica de las Poblaciones
Humanas. Ed. Omega, Barcelona.
P = npj/ntotal
Medidas de diversidad 7
Donde,
P = la proporcin de loci polimrficos
npj = el nmero de loci polimrficos
ntotal = el nmero total de loci
Expresa el porcentaje de loci variables en una poblacin.
Su clculo se basa en el conteo directo de los loci polimrficos y totales.
Puede usarse con marcadores codominantes y, de manera muy restrictiva,
con marcadores dominantes (ver la diapositiva anterior para la explicacin).
Medidas de diversidad 8
Para un gen dado en una muestra, esta medida indica cuntas variantes allicas
pueden encontrarse.
n = (1/K ) ni
i =1
Medidas de diversidad 9
Donde,
K = el nmero de loci
ni = el nmero de alelos detectados por locus
Esta medida brinda informacin complementaria a la informacin sobre
polimorfismo.
Requiere nicamente el conteo del nmero de alelos por locus y luego, el
clculo del promedio.
Se aplica mejor a marcadores codominantes, dado que los dominantes no
permiten la deteccin de todos los alelos.
Medidas de diversidad 10
Donde,
pi = frecuencia del i-simo alelo en un locus
h = 1 pi2 = heterocigosidad en un locus
Indica el nmero de alelos que se esperara en un locus, en cada
poblacin.
Se calcula invirtiendo la medida de la homocigosidad en un locus.
Puede utilizarse con datos de marcadores codominantes.
Su clculo puede verse afectado por el tamao de la muestra.
Esta medida de diversidad puede proporcionar informacin til para
establecer estrategias de colecta. Por ejemplo, estimamos el nmero
efectivo de alelos en una muestra. Luego, la comprobamos en una
muestra diferente o en toda la coleccin. Si la cifra obtenida la segunda
vez es menor que la primera, esto podra significar que nuestra estrategia
de colecta necesita revisin.
Poblacin 1
Poblacin 2
Individuo 1
A1 A1
B1 B1
C1 C1
A1 A1
B1 B3
C1 C1
Individuo 2
A1 A2
B1 B2
C2 C2
A1 A1
B2 B3
C1 C1
Individuo 3
A1 A1
B1 B1
C1 C3
A2 A2
B1 B4
C1 C1
Individuo 4
A1 A3
B1 B3
C2 C3
A2 A2
B1 B1
C1 C1
Individuo 5
A3 A3
B3 B3
C3 C3
A1 A2
B4 B4
C1 C1
0.60
0.60
0.30
0.50
0.40
1.00
0.10
0.10
0.30
0.50
0.10
0.00
0.30
0.30
0.40
0.20
0.00
Nmero de alelos
0.30
Heterocigosidad (h)
0.54
0.54
0.66
0.50
0.70
0.00
2.17
2.17
2.94
2.00
3.33
1.00
Medidas de diversidad 11
h j = 1 p 2 q2
hj = 1 pi2
H = jLhj/L
Medidas de diversidad 12
Donde,
hj = la heterocigosidad por locus
p y q = las frecuencias allicas
H = la heterocigosidad promedio para varios loci
L = el nmero total de loci
La heterocigosidad promedio esperada se calcula al restar de 1 las
frecuencias esperadas de homocigotos en un locus. La operacin se repite
para todos los loci y luego se saca el promedio.
Puede aplicarse con todos los marcadores, ya sean codominantes o
dominantes.
El valor calculado puede verse afectado por aquellos alelos presentes en
frecuencias mayores.
Vara de 0 a 1.
Se maximiza cuando hay muchos alelos cuyas frecuencias son iguales.
Debe analizarse un mnimo de 30 loci en 20 individuos por poblacin, para
reducir el riesgo de sesgo estadstico.
10
11 12
13 14
15 16
17
10
11 12 13 14
15 16
17 18
18
19 20
21
22
23 24
19
21
22
23
25 26
27
28
29
30
27 28 29
30
Gel
Locus A
Locus B
Locus C
Locus D
Locus E
Lectura
de datos
Locus A
Locus B
Locus C
Locus D
Locus E
20
24
25 26
1,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 0,1 0,1 0,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1
0,1 0,1 0,1 0,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 1,0 1,0 0,1 0,1 0,1 0,1 0,1 0,1 1,0
1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0
1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0
0,1 1,1 0,1 1,1 0,1 1,0 1,1 1,0 1,1 1,1 1,1 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 0,1 0,1 1,0
Medidas de diversidad 13
(contina en la siguiente)
En la mitad superior de esta diapositiva aparece un dibujo de un gel con un
marcador de tamao a la izquierda (M) y 30 individuos analizados con un marcador
codominante, que detect cinco loci (A, B, C, D y E). De estos loci, solamente tres
son polimrficos (A, B y E).
En la mitad inferior de la diapositiva aparecen los resultados de la lectura de
bandas, por individuo y por locus. Obsrvese que, para facilitar la presentacin, no
se ilustraron ms de dos alelos por locus. Aunque las bandas que pertenecen a los
loci C y D fueron registradas como (1,0) para todos los individuos, la lectura no
hubiera sido necesaria puesto que las bandas no dieron informacin de diversidad.
Los clculos se presentan en la siguiente diapositiva.
Frecuencia
allica
Anlisis de datos
Hi
Total
A1 A1
A1 A2
A2 A2
p2
2pq
q2
Individuos (no.)
24
30
P11 = 0.07
P12 = 0.13
P22 = 0.80
B1 B1
B1 B2
B2 B2
Total
p2
2pq
q2
Individuos (no.)
20
30
P11 = 0.23
P12 = 0.10
P22 = 0.67
E1 E1
E1 E2
E2 E2
Total
p2
2pq
q2
Genotipos
hj =
(1 - p2 - q2)
0.13
0.87
0.28
0.72
0.63
0.37
A
Frecuencia genotpica (obs.)
Genotipos
B
0.23
0.41
E
Individuos (no.)
Frecuencia genotpica (obs.)
15
30
P11 = 0.50
P12 = 0.27
P22 = 0.23
0.46
0.22
Medidas de diversidad 14
10
11 12
13 14
15 16
17
18
19 20
21
22
23 24
25 26
27
28
29
30
25 26
27 28 29
30
Locus A
Locus B
Locus C
Locus D
Locus E
Lectura
de datos
Locus A
Locus B
Locus C
Locus D
Locus E
10
11 12 13
14 15
16
17 18
19 20
21
22
23
24
Medidas de diversidad 15
(contina en la siguiente)
En la mitad superior de esta diapositiva aparece un dibujo de un gel (marcador de
tamao a la izquierda, M) con 30 individuos analizados con un marcador
dominante. Se identifican cinco loci (A, B, C, D y E), de los cuales tres estn
segregando (A, B y E), en tanto que los otros dos, C y D, son monomrficos.
En la mitad inferior de la diapositiva estn los resultados de la lectura de bandas,
por individuo y por locus. Como se trata de un marcador dominante, a las bandas
presentes se les asigna un 1 y a las ausentes un 0. La lectura de las bandas para
los loci C y D puede omitirse o bien atribuirles un 1 a todos, como aparece en la
diapositiva.
Los clculos figuran en la siguiente diapositiva.
Frecuencia
allica
Anlisis de datos
Genotipos
Aa
p2
Aa
aa
Total
2pq
q2
24
30
0.11
0.89
0.18
0.82
0.52
0.48
hj =
(1 - p2 q2)
Hi
A
Individuos (no.)
Frecuencia genotpica (obs.)
P2 = 0.80
Genotipos
BB
Bb
bb
Total
p2
2pq
q2
P1 = 0.20
10
20
30
P1 = 0.33
P2 = 0.67
Individuos (no.)
Frecuencia genotpica (obs.)
Genotipos
EE
Ee
ee
Total
p2
2pq
q2
23
30
P1 = 0.77
P2 = 0.23
Individuos (no.)
Frecuencia genotpica (obs.)
0.19
0.30
0.50
0.198
Medidas de diversidad 16
Medidas de diversidad 17
gST = 1 (hS/hT)
hS = diversidad de la poblacin
hT = diversidad total
Medidas de diversidad 18
Donde,
hS = (/( - 1)[1 (1/s)xij2 (ho/2)]
hT = 1 - [(1/s)xij]2 + (hS/s) (ho/2s)
= el promedio armnico de los tamaos de poblacin
s = el nmero de poblaciones
ho = la heterocigosidad promedio observada
xij = la frecuencia calculada del i-simo alelo en la j-sima poblacin
La frmula que aparece en la diapositiva provee una medida de la
diferenciacin en funcin de los alelos por locus, en dos poblaciones o ms.
Vara de 0 a 1. Podra obtenerse un valor negativo si se cometiera un error
en el muestreo o si se empleara un tipo de marcadores inapropiado.
Dada la complejidad de sus componentes, para su clculo se requieren
programas informticos especializados.
Puede utilizarse con marcadores codominantes y, con algunas restricciones,
con marcadores dominantes debido a que es una medida de la
heterocigosidad. Son necesarias varias generaciones para tener una
apreciacin razonable del valor real.
Clculo de gST
Genotipos
A1 A1
A1 A2
A2 A2
p2 + q2
Poblacin 1
20
30
50
0.35
0.65
0.545
Poblacin 2
10
20
70
0.20
0.80
0.680
Poblacin 3
60
10
30
0.65
0.35
0.545
s=3
= 33.33
Medidas de diversidad 19
DST
DST
Pob1
HS
Pob3
DST
HS
Medidas de diversidad 20
Donde,
HT = la diversidad gnica total = HS + DST
HS = la diversidad gnica dentro de una poblacin
DST = la diversidad entre poblaciones
(HT/HT) = (HS/HT) + (DST/HT) = 1
GST mide la proporcin de diversidad gnica que est distribuida entre las
poblaciones.
Debe tomarse una muestra de un nmero suficiente de loci.
Las ecuaciones son complejas y deben calcularse con programas
informticos especficos.
Por ejemplo, suponiendo que:
HT = 0.263
HS = 0.202
DST = 0.263 0.202 = 0.061
Entonces, GST = (DST/HT) 100 = (0.061/0.263) 100 = 23.19%, lo que significa
que, en esta especie, existe una diferenciacin del 23% entre las poblaciones.
Medidas de diversidad 21
Donde,
CT(K) = el aporte de K a la diversidad total
CS(K) = el aporte de K a la diversidad dentro de una poblacin
CST(K) = el aporte de K a la diversidad entre poblaciones
HT = la diversidad gnica total
HS = la diversidad gnica dentro de una poblacin
DST = la diversidad entre poblaciones
HT/K = la diversidad gnica total, despus de retirar la poblacin K
HS/K = la diversidad gnica dentro de una poblacin, despus de retirar la
poblacin K
DST/K = la diversidad gnica entre poblaciones, despus de retirar la
poblacin K
La medida permite cuantificar la variacin de la diversidad gnica total
cuando se introduce o se retira una poblacin de un sitio (por ejemplo, al
introducir una variedad nueva en el campo de un agricultor, como parte de un
programa de conservacin in situ).
Tambin sirve para medir el impacto ocasionado, en trminos de diversidad
gnica, por la prdida de una poblacin en un lugar dado.
Puede utilizarse nicamente con marcadores codominantes.
Estadsticos F (Wright)
La ecuacin para la estructura gentica de
poblaciones es:
(1 - FIT) = (1 FIS)(1 FST)
FIT = 1 (HI/HT)
FIS = 1 (HI/HS)
FST = 1 (HS/HT)
Derechos de Autor: IPGRI y Cornell University, 2004
Medidas de diversidad 22
Donde,
HT = la diversidad gnica total o la heterocigosidad esperada en la
poblacin total, estimada a partir de las frecuencias allicas combinadas
HI = la diversidad gnica dentro de una poblacin o la heterocigosidad
promedio observada en un grupo de poblaciones
HS = la heterocigosidad promedio esperada, estimada a partir de cada
subpoblacin
Los estadsticos F permiten el anlisis de estructura en poblaciones subdivididas.
Tambin puede emplearse para medir la distancia gentica entre las
subpoblaciones, un concepto que se fundamenta en la idea de que aquellas
subpoblaciones que no presentan apareamiento entre s tendrn frecuencias
allicas diferentes a las de la poblacin total.
La distancia gentica tambin provee una manera de medir la probabilidad de
encuentro entre alelos iguales (endogamia). Los ndices estadsticos involucrados
miden:
FIS = la deficiencia o el exceso de heterocigotos promedio en cada
poblacin
FST = el grado de diferenciacin gnica entre las poblaciones, en funcin
de las frecuencias allicas
FIT = la deficiencia o el exceso de heterocigotos promedio en un grupo de
poblaciones
de 0 a 0.05
de 0.05 a 0.15
de 0.15 a 0.25
>0.25
pequea
moderada
grande
muy grande
Medidas de diversidad 23
A1 A2
A2 A2
pi
qi
2piqi
0.40
0.30
0.30
0.55
0.45
0.4950
0.3939
0.60
0.20
0.20
0.70
0.30
0.4200
0.5238
HT
2(0.625)(0.375) = 0.4688
po
HI
qo
HS
Medidas de diversidad 24
(contina en la siguiente)
Esta diapositiva presenta un ejemplo de dos poblaciones y el anlisis de un locus
(A). Se calculan las frecuencias allicas (p y q), al igual que sus promedios.
Tambin se calculan las variables HT, HI y HS, y se utilizan para calcular los
estadsticos F. El anlisis muestra una diferenciacin baja en las frecuencias
allicas entre las dos poblaciones (FST). Podemos concluir que casi todo el dficit
de heterocigotos se debi al apareamiento no aleatorio dentro de las poblaciones
(FIS = 0.4536).
F = ndice de fijacin (primera columna a la derecha del cuadro), que es la
probabilidad de que los dos alelos de un individuo sean los mismos. Su clculo
debe hacerse slo con marcadores codominantes. Si se hace con marcadores
dominantes, el clculo puede resultar sesgado.
A1 A2
A2 A2
pi
qi
2piqi
0.25
0.50
0.25
0.50
0.50
0.500
0.0000
0.80
0.10
0.10
0.85
0.15
0.255
0.6078
HT
2(0.675)(0.325) = 0.4388
po
HI
qo
HS
Medidas de diversidad 25
Este es otro ejemplo para el cual se siguieron los mismos procedimientos que en la
diapositiva anterior. La diferenciacin en las frecuencias allicas entre las dos
poblaciones parece mayor (FST = 0.1397), con solo un efecto moderado del
apareamiento no aleatorio dentro de las poblaciones (FIS = 0.2053).
Medidas de diversidad 26
Los diferentes niveles jerrquicos de la diversidad gnica, estudiados por medio del
mtodo AMOVA, pueden abarcar:
1.
2.
3.
4.
5.
Un ejemplo de AMOVA
Ind.
Pob. 1
Pob. 2
Pob. 3
X...k
15
21
18
54
A1
A2
A1
A2
A1
A2
X...k2
225
441
324
990
Xi...k2
27
33
28
88
Xijk2
15
21
18
X...2
10
11
12
54
2916
Sca
0.6
CMa
0.3
SCb
11
CMb
0.26190476
SCw
10
CMw
0.22222222
13
14
A1 = 1
Presente
15
A1 = 0
Ausente
Medidas de diversidad 27
(contina en la siguiente)
En este cuadro, aparecen los datos obtenidos con 15 individuos de cada una de las tres
poblaciones, en un anlisis realizado con un marcador codominante. Mediante un anlisis
de varianza, estos datos nos permitirn calcular los estadsticos F.
El primer paso es convertir en variables binarias las bandas detectadas en los geles,
asignndoles un valor de 0 de 1. Luego, se calculan las sumas de las presencias (1) para
que podamos proceder con la suma de cuadrados. Se realizan primero los
clculos para una poblacin y se contina con las dems hasta completar (X...k). Tenemos i
= 15 individuos (efecto b), j = 2 alelos (efecto w), k = 3 poblaciones (efecto a).
Donde,
X...k es el resultado de la suma de todas las bandas presentes en los individuos
por poblacin
X...k2 es el resultado de elevar al cuadrado el nmero obtenido anteriormente
Xi...k2 es el resultado de sumar los cuadrados de la suma de alelos
presentes en cada individuo (por ejemplo, Indiv.1 en la Pob.1 ser (0 + 0)2 +
Indiv.2 en la Pob.1 (1 + 1)2 + Indiv. ...)
Xijk2 es la suma de cada valor al cuadrado
SC es la suma de los cuadrados para los efectos a, b y w
Un ejemplo para calcular SC:
SCa = X...k2/ij X...2/ijk = [990/(15 x 2)] - [2916/(15 x 2 x 3)] = 0.6
CM son los cuadrados medios para los efectos a, b y w
Un ejemplo para calcular CM: SCa/gla = 0.6/2 = 0.3, donde gla se refiere a los
grados de libertad para el efecto a (poblaciones).
gl
SC
CM
CME
w2
+ 2b2 + 2*15a2
Poblaciones
0.6
0.3
Indiv./poblacin
42
11
0.26190476
w2 + 2b2
Dentro de indiv.
45
10
0.22222222
w2
0.0012698
b2
0.0198413
w2
0.2222222
0.24333
FIT
0.086758
FIS
0.0819672
FST
0.0052185
(1 - FIT)
0.91324
(1 - FIS)(1 - FST)
0.91324
Medidas de diversidad 28
Donde,
FV = fuentes de variacin
gl = grados de libertad
SC = la suma de los cuadrados (ver diapositiva anterior)
CM = cuadrados medios (ver diapositiva anterior)
2 = varianza total calculada
CME = cuadrados medios esperados
w2 = 0.2222222
b2 = (CMb CMw)/2 = (0.26190476 0.22222222)/2 = 0.0198413
a2 = (CMa CMb)/2 15 = (0.3 0.26190476)/2 15 = 0.0012698
2 = w2 + b2 + a2 = 0.24333 (varianza total calculada)
En la diapositiva 22, ya se ha explicado la forma de calcular los estadsticos F.
Para este ejemplo en particular, sera de la siguiente manera:
FIT = (a2 + b2)/2 = (0.0012698 + 0.0198413)/0.24333 = 0.086758
FST = a2/2 = 0.0012698/0.24333 = 0.0052185
FIS = b2/(b2 + w2) = 0.0198413/(0.0198413 + 0.222222) = 0.0819672
La diferenciacin de las frecuencias allicas entre las tres poblaciones es muy baja
(FST = 0.0052185) y probablemente es un resultado de muchos apareamientos al
azar. Para sacar una conclusin, es necesario analizar un mayor nmero de loci.
Medidas de diversidad 29
Para realizar estos clculos, se parte del supuesto de que cada nucletido es un
locus.
Medidas de diversidad 30
Donde,
n = el nmero de secuencias analizadas en los individuos de la poblacin
Xi = la frecuencia estimada de la i-sima secuencia en la poblacin
Xj = la frecuencia calculada de la j-sima secuencia en la poblacin
ij = la proporcin de nucletidos diferentes entre las secuencias i y j
La medida brinda informacin acerca del grado de diversidad de nucletidos
entre varias secuencias, en una regin dada del genoma. Equivale a la
medida de la diversidad allica dentro de un locus.
Vara de 0 a 1 (0 < X < 1).
Entre los factores que limitan el uso de esta herramienta de anlisis estn los
siguientes:
Debe haber disponibilidad de secuencias genmicas parciales
La ecuacin slo puede aplicarse a datos haploides
Este parmetro da informacin acerca de las secuencias de nucletidos, y el
modelo supone la presencia de haplotipos (genotipos haploides). Aunque el
estudio se basa en individuos diploides, es necesario secuenciar cada copia del
genoma.
Frec. Xi
Sec1
5/10 = 0.5
Sec2
2/10 = 0.2
Sec3
1/10 = 0.1
Sec4
2/10 = 0.2
10
1,2 = 2/30, 1,3 = 4/30, 1,4 = 3/30, 2,3 = 4/30, 2,4 = 3/30, 3,4 = 5/30
= 10/(10 1)XiXjij
= (10/9)[0.5 0.2 (2/30) + 0.5 0.1 (4/30) + ... + 1 0.2 (5/30)]
= 0.037
Medidas de diversidad 31
Medidas de diversidad 32
Donde,
VXY = la divergencia entre las poblaciones X y Y
X = la diversidad de nucletidos en la poblacin X
dXY = la probabilidad de que dos nucletidos al azar, en las poblaciones
X y Y, sean diferentes
s = el nmero de poblaciones
La medida brinda informacin acerca del nivel de diferenciacin entre
secuencias de nucletidos en las poblaciones.
Requiere datos de secuencia en una muestra de individuos para cada
poblacin.
Necesita programas informticos especficos con atributos que permitan la
alineacin de secuencias, por ejemplo CLUSTAL W, MALIGN y PAUP*.
Medidas de diversidad 33
Fragmento 2
ADN
Indiv. 1
GACTGAATTCCACGGCACTGACGAATTCGAAGTGAATTCTTACTTAAGCTAGCCTGAATTCGATAC
CTGACTTAAGGTGCCGTGACTGCTTAAGCTTCACTTAAGAATGAATTCGATCGGACTTAAGCTATG
ADN
Indiv. 2
GACTGATTTCCACGGCACTGACGAATTCGAAGTGAATTCTTACTTAAGCTAGCCTGAATTCGATAC
CTGACTAAAGGTGCCGTGACTGCTTAAGCTTCACTTAAGAATGAATTCGATCGGACTTAAGCTATG
Fragmento 2
No existe sitio de
reconocimiento
para EcoRI
I1
I2
Fragmento 2
Fragmento 1
Gel
Medidas de diversidad 34
Medidas de diversidad 35
Donde,
r = el nmero de nucletidos de reconocimiento de una enzima de
restriccin
ln G = el logaritmo natural de la probabilidad de que no hubo substitucin
en el sitio de restriccin. Se calcula del siguiente modo:
G = F(3 2G)1/4
F = [Xi(Xin 1)]/[Xi(n 1)]
F = la proporcin de fragmentos compartidos
G = F1/4
n = el nmero de genotipos haploides en la poblacin
Xi = la frecuencia estimada del i-simo fragmento en la
poblacin
La medida estima la diversidad en los sitios de restriccin en una muestra,
porque depende de la secuencia de nucletidos de los sitios de
reconocimiento de una enzima de restriccin dada.
Suministra informacin acerca de la substitucin de nucletidos en los sitios
de restriccin. Vara de 0 a 1 (0 X 1).
Las ecuaciones anteriores pueden utilizarse con muestras haploides, ADNmt,
ADNcp o haplotipos.
Referencia
Karp, A., P. G. Isaac y D. S. Ingram. 1998. Molecular Tools for Screening
Biodiversity: Plants and Animals. Chapman & Hall, Londres.
Medidas de diversidad 36
Donde,
VXY = la divergencia o diferenciacin entre las poblaciones X y Y
X = la diversidad de la restriccin en la poblacin X
dXY = la diversidad de fragmentos entre dos poblaciones = (2/r)ln (GXY)
GXY = FXY(3 2GXY)1/4
G = FXY1/4
FXY = la proporcin de alelos compartidos entre las poblaciones X y Y
= (2XiXXiY)/((XiX + XiY))
XiX = la frecuencia calculada del fragmento i en la poblacin X
Si se utiliza con datos de RAPD, el valor de r es reemplazado por la longitud del cebador (r
= 10).
Se hacen, adems, ciertas suposiciones:
Que se emplean los cebadores apropiados
Que el polimorfismo originado por insercin o delecin es poco comn
Que los fragmentos de tamao similar en poblaciones diferentes pertenecen al mismo
locus
Que se deben identificar los fragmentos sin error
Los programas que ms se usan son RAPDISTANCE y RAPDIS.
Sec.
10
11
12
P
o
b
l
a
c
i
15
16
17
18
19
20
Frec. Xi
A2
5/20 = 0.25
A3
9/20 = 0.45
Sec.
10
11
12
13
14
15
16
17
18
19
20
Frec. Xi
A1
5/20 = 0.25
A2
13/20 = 0.65
A3
2/20 = 0.10
14
6/20 = 0.30
G = (0.0325)1/4 = 0.424591
X
13
A1
Medidas de diversidad 37
En cada poblacin, detectamos tres fragmentos de ADN, como resultado de una restriccin:
A1, A2 y A3.
La diversidad de nucletidos en las regiones analizadas es ms grande en la poblacin X (X
= 0.5392) que en la poblacin Y (Y = 0.2166); por tanto, X tiene mayor diversidad gnica que
Y.
Entre las poblaciones X y Y, la diferenciacin de nucletidos con base en los sitios de
restriccin es de 0.230766.
2[0.30*0.25+0.25*0.65+0.45*0.10]
F = (0.30+0.25)+ (0.25+0.65)+ (0.45+0.10) = 0.14125
1/4
GXY = 0.14125
= 0.613052
]1/ 4 = 0.163012
0.11337
0.11337 + 0.377905
= 0.230766
Medidas de diversidad 38
Segn las similitudes de los individuos, son posibles tres tipos de representacin de
la distancia (D):
D = 1 S, conocida como la distancia lineal porque asume que la relacin
con la similitud es lineal.
D = (1 S), conocida como la distancia cuadrtica porque asume que la
relacin con la similitud se ajusta a una funcin cuadrtica, de manera que
para volverla lineal es necesario calcular la raz cuadrada.
D = (1 S2), conocida como la distancia circular.
Linear
Lineal
Circular
Quadratic
Cuadrtic
a
0.6
0.4
0.2
1
0.8
0.8
Distancia
D is ta n c ia
D is ta n c ia
0.8
0.6
0.4
0.2
0.2
0.4
0.6
Similitud
0.8
0.4
0.2
0.6
0.2
0.4
0.6
Similitud
0.8
0
0
0.2
0.4
0.6
Similitud
0.8
Modelos de distancia
El clculo de la distancia o disimilitud se ajusta a
uno de estos dos modelos posibles:
Modelo de equilibrio
Modelo de desequilibrio
t
d
t+1
d1
t+1
d2
La distancia permanece
constante con el tiempo
(existe equilibrio entre
la migracin y la deriva gentica)
Medidas de diversidad 39
Distancia geomtrica
No considera los procesos evolutivos
Se basa solamente en las frecuencias allicas
Existe una relacin compleja entre la distancia y el tiempo de divergencia
Distancia gentica
No considera los procesos evolutivos
La distancia aumenta a partir del momento de separacin de una poblacin
ancestral
Requiere un modelo gentico de evolucin
Variables binarias
Variables cuantitativas
Tipos mixtos de variables
Nmero P de variables
Medidas de diversidad 40
(contina en la siguiente)
Al analizar datos moleculares, tratamos con variables binarias (1,0). Estas se
discutirn en las diapositivas que aparecen a continuacin.
En el Apndice 4, hay informacin adicional sobre aquellos casos en los cuales es
necesario utilizar tambin variables cuantitativas, tipos mixtos de variables y un
nmero diverso de variables. En el Apndice 5, se ha agregado un ejemplo sobre
cmo calcular las distancias geomtricas con variables cuantitativas. Para
consultar los Apndices 4 y 5, haga clic aqu.
Medidas de diversidad 41
10
11
12 13
14 15
16
10
11
12 13
14 15
16 17 18
Locus A
diploide
(2X)
Locus A
tetraploide
(4X)
Matriz
binaria
Medidas de diversidad 42
A
(2X)
A
(4X)
Genotipos
Frec. allica
Diploide
AA, Aa
aa
Total
p2 + 2pq
q2
No. de indiv.
14
18
P1 = 0.78
P2 = 0.22
Tetraploide
0.53
0.47
aaaa
Total
p4 + 4p3q + 6p2q2 +
4pq3
q4
No. de indiv.
14
18
P1 = 0.78
P2 = 0.22
0.31
0.69
Individuos
9 10 11
12 13
14
15
16 17 18
12
14
15
16 17 18
A2 A3
A1 A2
A2 A2
A3 A3
A1 A1
Locus A
diploide
(2X)
A1 A3
A3 A3 A3 A3
A1 A2 A3 A3
A1 A1 A2 A3
M
Matriz
binaria
diploide
A1 A2 A2 A3
A1 A1 A1 A1
Locus A
tetraploide
(4X)
7
I
D I
10
I
11
U O
13
(1,0,0) (1,0,1) (0,0,1) (1,0,1) (0,1,1) (1,0,0) (1,0,1) (0,0,1) (0,0,1) (0,1,0) (1,1,0) (0,0,1) (0,0,1) (0,0,1) (0,0,1) (0,1,1) (1,0,1) (0,0,1)
Medidas de diversidad 43
Genotipo
A1 A1
A1
A2
A1
A3
A2
A2
A2
A3
A3
A3
Tota
l
Frec. geno.
(esp.)
p2
2pq
2pr
q2
2qr
r2
Indiv. (no.)
18
Frec. geno.
(obs.)
P11 =
0.11
0.25
0.15
0.60
Autor
Expresin
S1
a/n
0.333
S2
Simpson
0.750
S3
Braun-Blanquet
0.500
S4
a/[a + (b + c)/2]
0.600
S5
Ochiai (1957)
0.612
S6
Kulczynski 2
(a/2)([1/(a+b)] + [1/(a+c)])
0.625
S7
a/(a + b + c)
0.429
S8
0.273
S9
Kulczynski 1 (1928)
a/(b + c)
0.750
S10
(a + d)/n
0.556
S11
0.385
S12
(a + d)/[a + d + (b + c)/2]
0.714
S13
(a + d)/(b + c)
1.250
Medidas de diversidad 44
Indiv.j
Indiv.i
a+
b
c+d
a+c
b+d
Donde,
n=a+b+c+d
En el cuadro de la diapositiva, observamos que:
Los ndices S1 a S9 dan valor solamente a la presencia de informacin
Los ndices S10 a S13 dan valor tanto a la presencia de informacin
como a su ausencia
A continuacin, discutiremos tres ndices (los que aparecen en rojo en la
diapositiva): Concordancia Simple (S10), Jaccard (S7) y Nei-Li (S4).
Medidas de diversidad 45
Medidas de diversidad 46
DXY = ln (IXY)
f Se basa en el concepto de identidad gentica
(IXY):
Ixy =
Jxy
(JxJy)
Medidas de diversidad 47
(contina en la siguiente)
Donde,
JX = la homocigosidad promedio en la poblacin X
JY = la homocigosidad promedio en la poblacin Y
JXY = la homocigosidad promedio entre poblaciones
De manera que,
IXY = 1, si dos poblaciones tienen las mismas frecuencias allicas en
todos los loci muestreados
IXY = 0, si dos poblaciones no comparten las mismas frecuencias allicas
en todos los loci muestreados
El valor de DXY vara de 0 (donde las poblaciones tienen frecuencias allicas
idnticas) a infinito (, donde las poblaciones no comparten ningn alelo).
Asume que la tasa de substitucin por locus es igual entre todos los loci y las
poblaciones.
Esta distancia calcula las diferencias de codones por locus entre dos
poblaciones.
Alelos
Frecuencias allicas
Poblacin 1
Poblacin 2
Poblacin 3
A1
0.80
0.74
0.65
A2
0.20
0.26
0.35
hijk
0.3200
0.3848
0.4550
B1
0.86
0.81
1.00
B2
0.01
0.10
0.00
B3
0.13
0.09
0.00
hijk
0.2434
0.3258
0.0000
D1
0.00
1.00
0.30
D2
1.00
0.00
0.70
hijk
0.0000
0.00
0.4200
Heterocigosidad promedio
Hi
0.0433
0.0547
0.0673
Homocigosidad promedio
Ji
0.9567
0.9453
0.9327
Jii
J1,2 = 0.8733
J1,3 = 0.9346
J2,3 = 0.8986
Identidad gentica
Iii
I1,2 = 0.9183
I1,3 = 0.9894
I2,3 = 0.9570
Distancia gentica
Dii
D1,2 = 0.0852
D1,3 = 0.0107
D2,3 = 0.0440
Medidas de diversidad 48
Swi =
2
2
i<i' (aii ai' i' )
2n(2n 1)
Medidas de diversidad 49
Donde,
aij = tamao del alelo de la i-sima copia (i = 1, 2, , 2n) en la j-sima
poblacin (j = 1, 2, , ds)
n = nmero de individuos en la muestra
Existen dos aspectos que se deben tener en cuenta:
El clculo de la distancia entre dos alelos es una transformacin del
nmero de repeticiones.
Una de las dificultades en el uso de las SSR para estimar distancias
genticas es que su tasa de mutacin es alta.
SB =
2
2
(a
ij a i' j' )
j
<
j'
i
<
i'
(2n)2d s(ds 1)
Medidas de diversidad 50
=
S
2n - 1
2n(ds 1)
Sw +
SB
(2nds 1)
(2nds 1)
No jerrquica
Superpuesta
Derechos de Autor: IPGRI y Cornell University, 2004
Medidas de diversidad 51
Referencia
Garca, J. A., M. C. Duque, J. Tohme, S. Xu y M. Levy. 1995. SAS for Classification
Analysis; Agrobiotecnology Course, October 1995. Documento de Trabajo.
Centro Internacional de Agricultura Tropical (CIAT), Cali, Colombia.
Clasificacin fentica
f Muestra las relaciones entre las muestras
mediante el uso de un ndice de similitud
f Se selecciona un mtodo de agrupacin o
distancia, de manera que se pueda trazar un
diagrama de rbol (dendrograma) o un
fenograma (si la matriz de similitud contiene
datos fenotpicos)
1
Medidas de diversidad 52
Mtodos de agrupacin
f Pasos a seguir:
Se define la cercana
Se estima cada agrupacin, segn la distancia
Se conforman las ramas del dendrograma en cada
ciclo
Medidas de diversidad 53
Ligamiento simple
f O vecino ms cercano
f Minimiza la distancia entre grupos al tomar la
distancia al vecino con el que presenta mayor
similitud
f Funciona con grupos uniformes y compactos,
pero se afecta con los individuos distantes.
Esto resulta inconveniente cuando hay grupos
diferentes que no estn bien distribuidos en el
espacio
d(1,2)
Grupo 1
Medidas de diversidad 54
0.30
0.43 0.35
(3)
(2)
C
C
ADB
0.35
ADB
AD
0.35
AD
0.30
0.40
(4)
0.10
0.0
D
B
C
Derechos de Autor: IPGRI y Cornell University, 2004
Medidas de diversidad 55
Ligamiento completo
f O vecino ms lejano
f Minimiza la distancia entre grupos al tomar la
distancia al individuo con el que presenta menor
similitud
f Funciona bien con grupos uniformes y
compactos pero, nuevamente, recibe influencia
de los individuos distantes
d(1,2)
Grupo 2
Medidas de diversidad 56
0.30
0.43 0.35
0.28 0.60
0.40
(2)
(3)
AC
DB
0.40
0.43
BD
0.30
0.40
BD
(4)
AC
DB
B
D
A
C
Medidas de diversidad 57
Ligamiento promedio
f O mtodo de agrupamiento de pares no
ponderados usando la media aritmtica
(UPGMA)
f Minimiza la distancia entre grupos, al tomar la
distancia promedio de todos los pares entre los
individuos de la muestra
f Mtodo ms empleado
d(1i,2j) = distancia promedio
entre UTOi y UTOj de los
grupos 1 y 2
Grupo 1
Grupo 2
Medidas de diversidad 58
A
A
0.30
0.43
0.35
0.28
0.60
0.40
BC
AD
BC
AD
0.42
(2)
(3)
0.35
AD 0.45
AD
0
0.415
(4)
0.5
0.4
0.3
0.2
0.1
0.0
A
D
B
C
Medidas de diversidad 59
Medidas de diversidad 60
f Validacin externa
f Validacin interna
f Validacin relativa
f Bootstrapping (Mtodo de remuestreo)
Medidas de diversidad 61
Validacin externa:
Se compara la matriz de distancia con otra informacin que no se haya
usado en los clculos de agrupacin (por ejemplo, la genealoga).
Validacin interna:
Esta tcnica cuantifica la distorsin debida al mtodo de agrupacin
empleado. Elabora una nueva matriz de similitud o distancia, la matriz
cofentica, directamente a partir del dendrograma. Se calcula la validacin
mediante un coeficiente de correlacin entre los datos de similitud o
distancia a partir de la matriz original y los de la nueva matriz cofentica.
Al finalizar el ejercicio de agrupacin, se evala si se mantienen o no las
distancias originales (Sokal y Rohlf, 1994).
Validacin relativa:
Se compara la similitud entre mtodos.
Bootstrapping:
Es un mtodo de remuestreo con reemplazo, con la misma matriz de
datos. Permite el clculo de las desviaciones estndar y varianzas, y es
til para aquellas situaciones en las cuales el nmero de muestras o los
recursos (por ejemplo, el tiempo, el presupuesto) son limitados.
A continuacin, se presentan ejemplos de la aplicacin de los mtodos de
correlacin cofentica y bootstrapping.
Referencia
Sokal, R. y J. Rohlf. 1994. Biometry: The Principles and Practice of Statistics in
Biological Research (3rd edn). Freeman & Co, NY.
D
Dendrograma
0.30
0.43
0.35
0.28
0.60
0.40
0
A
Correlacin cofentica =
0.5557
0.43
0.43
0.35
0.28
0.43
0.43
C
0.43 0.35 0.28
Matriz cofentica
Medidas de diversidad 62
A
C
P1
P2
P3
P4
(2)
D
E
Gel
P1
P2
P3
P4
L1
L2
L3
L4
L5
Matriz de datos
(3)
P1
P2
P3
P1
P2
0.400
P3
0.600
0.400
P4
0.400
0.200
0.400
P4
Matriz de similitud
Medidas de diversidad 63
(contina en la siguiente)
En el gel que aparece en la esquina superior izquierda, hay 4 individuos (Pi) y
5 loci (Lj). Vamos a suponer que realizamos la validacin en tres muestras con
reemplazo.
En primer lugar, registramos los datos de los marcadores en los individuos (matriz
de datos) y, a continuacin, calculamos la similitud promedio (concordancia simple)
y su intervalo.
P2
P3
P4
P1
P2
0.267 0.115
P3
0.600 0.000
0.400 0.200
P4
0.533 0.115
0.200 0.000
0.400 0.200
0.25
0.44
0.63
0.81
1.00
0.11
0.33
0.56
0.78
1.00
Medidas de diversidad 64
Para cada individuo, se toma el valor para cada locus, uno por uno, con reemplazo
y se elabora una muestra de igual tamao al nmero de loci. Existe la posibilidad
de que se seleccione un locus una o ms veces. Para el ejemplo:
M1: L1 L1 L2 L3 L5 (no sali el locus L4 )
M2: L1 L2 L3 L4 L3
M3: L3 L1 L5 L2 L4
En cada muestra, se calcula una matriz de similitud.
Se calculan las similitudes promedio y sus desviaciones estndar para cada par de
individuos (1 y 2, 1 y 3, 2 y 3, y as sucesivamente), y se elabora la matriz de
similitud promedio.
Se construye un nuevo dendrograma, empleando la matriz de similitud promedio.
Para situaciones reales, deben generarse ms de 100 muestras de reemplazo.
Medidas de diversidad 65
Medidas de diversidad 66
En resumen
f El anlisis de la diversidad gentica y estructura
de poblaciones comprende:
La cuantificacin de la diversidad y las relaciones
entre y dentro de poblaciones e individuos
La visualizacin de las relaciones
Medidas de diversidad 67
Medidas de diversidad 68
Referencias
Cavalli-Sforza, L.L. y W.F. Bodmer. 1981. Gentica de las Poblaciones Humanas.
Ed. Omega, Barcelona.
Garca, J.A., M.C. Duque, J. Tohme, S. Xu y M. Levy. 1995. SAS for Classification
Analysis: Agrobiotecnology Course, October 1995. Documento de Trabajo.
Centro Internacional de Agricultura Tropical (CIAT), Cali, Colombia.
Gauch, H.G., Jr. 1982. Multivariate Analysis and Community Structure. Cambridge
University Press, Reino Unido.
Karp, A., P.G. Isaac y D.S. Ingram. 1998. Molecular Tools for Screening
Biodiversity: Plants and Animals. Chapman & Hall, Londres.
Lynch, M. y B.G. Milligan. 1994. Analysis of population genetic structure with RAPD
markers. Mol. Ecol. 3:91-99.
Sokal, R. y J. Rohlf. 1994. Biometry: The Principles and Practice of Statistics in
Biological Research (3rd edn.). Freeman & Co, NY.
A continuacin
Medidas de diversidad 69
Apndices
Apndice 2. Anlisis de la varianza molecular: Ejemplo 1
Apndice 3. Anlisis de la varianza molecular: Ejemplo 2
Apndice 4. Distancia geomtrica
Apndice 5. Transformacin de datos a partir de variables cuantitativas: Un
ejemplo
Apndice 6. Aplicacin del coeficiente de concordancia simple a los caracteres
morfolgicos (variables categricas)
Apndice 7. Clculo de la distancia gentica de Nei
Apndice 8. Similitudes morfolgicas y moleculares
Apndice 2 de:
Yki(j)
A(k)
Bk(i)
Wki(j)
n
Fuente de variacin
gl
SC
Entre problaciones
(k 1)
Entre individuos/pobl.
k(i 1)
Dentro de individuos
2
2
ki(j 1) Xijk Xi...k /j CMw
Total
kij 1
CM
CME
CMa
w + 22b + 2n2a
Xi...k2/j ...k2/ij
CMb
2w + 22b
2w
Xijk2 X2/ijk
2b = (FIT FST)2
FST = 2a/2
2w = (1 FIT)2
2 = 2w + 2b + 2a
Donde,
a
2
b
2
w
2
Apndice 3 de:
Fuente de variacin
gl
CM
CME
l1
CMr
l(k 1)
CMa
2w + 22b + 2n2a
Entre indiv./pobl./regiones
Ik(i 1)
CMb
2w + 22b
Dentro de individuos
lki(j 1)
CMw
2w
Entre regiones
Total
Varianza total (%)
2 = 2r + 2w + 2b + 2a
Ikij 1
%2r = (2r/2) 100
Apndice 4 de:
Xijstand =
Xij - Xi
si
Donde,
Xij = el valor del i-simo carcter en el j-simo individuo
Xi = el promedio para el i-simo carcter
si = la desviacin estndar para el i-simo carcter
Nmero P de variables
Si hay un nmero P de variables, el valor de la distancia para que se vuelva
independiente del nmero de variables, como se muestra a continuacin:
(Xik - Xjk)
k
k
dij2 =
P
Referencia
Sokal, R. 1961. Distance as a measure of taxonomic similarity. Syst. Zool.
10(2):40-51.
Apndice 5 de:
Mestand = m -m/
Despus de la estandarizacin, se pierden las unidades de medida.
m
Mestand
gestand
estand
Individuo 1
1.50
0.35
0.02
0.00
80.00
-0.15
Individuo 2
1.20
-1.41
0.03
1.00
70.00
-1.32
Individuo 3
1.45
0.06
0.01
-1.00
90.00
1.02
Individuo 4
1.60
0.94
0.02
0.00
85.00
0.44
Promedio (Xi)
1.44
0.02
81.25
Desviacin (si)
0.17
0.01
8.54
2 1/2
2 1/2
2 1/2
d11 = 0
d22 = 0
d33 = 0
d44 = 0
Despus de obtener las distancias dos a dos, procedemos a encontrar los grupos
utilizando el mtodo UPGMA (para ms detalles, ver diapositivas 58 y 59 del
mdulo).
I2
I3
I1
I2
2.34
I3
1.57
3.41
I4
0.83
3.10
1.45
I4
I1,4
I1,4
I2
2.72
I3
1.51
3.41
I3
Observamos ahora que la distancia ms corta est entre I1,4 y I3. En un nuevo
ciclo, se elabora una nueva matriz, agrupando el Individuo2 con el grupo I(1,4)3 y
calculando la distancia combinada d((1,4)3)2 = 3.07.
I1,4(3)
I1,4(3)
I2
3.07
I2
Con base en los resultados que aparecen arriba, podemos proceder a trazar el
dendrograma, relacionando los cuatro individuos del ejemplo:
3.00
2.00
1.50
1.00
0.0
Apndice 6 de:
Carcter 2
Carcter 3
UTO 1
UTO 2
UTO 3
UTO 4
Carcter 1
(cdigo binario)
Carcter 2
(cdigo binario)
Carcter 3
(cdigo binario)
UTO 2
UTO 3
UTO 4
UTO 1 vs. 3
UTO 1 vs. 4
a=1
b=2
a=0
b=3
a=0
b=3
c=2
d=4
c=3
d=3
c=3
d=3
UTO 2 vs. 3
UTO 2 vs. 4
UTO 3 vs. 4
a=0
b=3
a=1
b=2
a=1
b=2
c=3
d=3
c=2
d=4
c=2
d=4
Ahora, podemos proceder con el mtodo para encontrar los grupos y dibujar el
fenograma correspondiente:
O1
O2
O3
O1
O2
0.56
O3
0.33
0.33
O4
0.33
0.56
0.56
O4
Fenograma
1
0.25
0.44
0.63
Coeficiente
0.81
1.00
Apndice 7 de:
P2
P3
P1
P2
0.0852
P3
0.0107
0.0440
P1,3
P1,3
P2
0.0646
P2
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.0
1
3
2
Apndice 8 de:
Individuo1
ADN
3
7
9
11
1 2
10
12
3
7
9
11
Individuo3
7+8
10
12
3+4
9 + 10
11
Digamos que tenemos tres rosas individuales (1, 2, 3). Morfolgicamente, los
nmeros 2 y 3 se parecen, en tanto que el nmero 1 se ve diferente.
Si observamos los fragmentos de ADN, generados supuestamente con un
marcador molecular, vemos que los individuos 2 y 3 parecen ser ms similares.
Entonces, qu sucedi? Esto apunta a la importancia de estudiar la diversidad
gentica en todos los niveles posibles. La combinacin de informacin
procedente de diferentes tipos de marcadores es decir, los de los genes
funcionales y aquellos que muestran polimorfismo en regiones genmicas
proveer la mejor aproximacin posible al conocimiento sobre la variacin
gentica presente. Se aplicara el mismo principio si pudiramos combinar datos
morfolgicos y moleculares.
En este Apndice sealamos el tipo de errores en que podemos incurrir si las
conclusiones se basan solamente en un tipo de datos de marcadores.
12
Indiv. 1
Indiv. 2
b=1
c=2
d=3
Indiv. 1
21
c=3
d=2
Indiv. 2
b=8
c=4
d=0
12
11
10
b=6
a=5
7+8
a=6
Indiv. 3
9+10
a = 11
Indiv. 3
J1,2 =
3+4
22
11
6
5
= 0.786 J1, 3 =
= 0.400 J2, 3 =
= 0.294
11 + 1 + 2
6+6+3
5+8+4
Con base en el perfil de bandas de ADN obtenido en el gel para los tres
individuos, se calculan las distancias dos a dos, utilizando el coeficiente de
Jaccard:
J =
a
a + b + c
0.400
0.294
Ind12
Ind12
0.786
Ind3
Ind3
Ind1
Ind2
Ind2
Ind3
Ind1
0.347
1,2, =
=
S1,2,3
S
3
Ind3
,3
1,3++S
S
S1,3
S22,3
==0.34
0.347
2
2
0.0
Dendrograma
molecular
0.2
0.4
0.6
0.8
1.0
Ind1
Ind2
Ind3
Dendrograma
morfolgico
0.0
1.0
IInd
Ind11
Ind2
Ind3
Indiv. 1
Indiv. 2
Indiv. 1
a = 11
b=2
c=2
d=3
Indiv. 3
Indiv. 2
a=6
b=7
c=3
d=2
Indiv. 3
a=6
b=8
c=4
d=0
Ind.1
Ind.2
Ind.3
9+10
7+8
12
11
10
2
21
3+4
1
22
11
6
6
= 0.733 J1,3 =
= 0.375 J2,3 =
= 0.333
11 + 2 + 2
6+7+3
6 +8+ 4
Ind1
Ind1
Ind2
1
0.733
0.375
Ind2
Ind3
Ind3
1
0.333
Ind3 Ind12
J1,2 =
Ind12
1
0.554
S(1,2)3 =
0.0
0.2
0.4
0.6
0.8
Ind3
S1,3 + S2,3
= 0.554
2
1.0
Ind2
Ind3
Ind1
El dendrograma combinado
indica distancias de agrupacin
que difieren del dendrograma
molecular y del dendrograma
morfolgico, considerados por
separado. En consecuencia,
podemos asumir que la
informacin provista al combinar
los datos est ms cerca de la
realidad de la situacin.
Apndice 9 de:
MEGA2
Kumar, S., K. Tamura, I.B. Jakobsen y M. Nei. 2001. MEGA2: Molecular
Evolutionary Genetics Analysis software. Bioinformatics 17(12):1244-1245.
NTSYSpc
Rohlf, F.J. 2002. NTSYS pc: Numerical Taxonomy System, Version 2.1. Exeter
Publishing, Setauket, NY.
PAUP*
Swofford, D.L. 2002. PAUP*: Phylogenetic Analysis Using Parsimony (*and Other
Methods), Versin 4. Sinauer Associates, Sunderland, MA.
PHYLIP
Felsenstein, J. 1993. PHYLIP (Phylogeny Inference Package), Versin 3.5c.
Distribuido por el autor.
POPGENE
Yeh, F.C., R.C. Yang, T.B.J. Boyle, Z.H. Ye y J.X. Mao. 1997. POPGENE, the
User-Friendly Shareware for Population Genetic Analysis. Centro de Biologa
Molecular y Biotecnologa, Universidad de Alberta, Canad.
PowerMarker
Liu, J. 2003. PowerMarker: New Genetic Data Analysis Software, Versin 1.0.
Programa distribuido por el autor en forma gratuita en la Internet en
<http://www.powermarker.net>
SITES
Hey, J y J. Wakeley. 1997. A coalescent estimator of the population
recombination rate. Genetics 145:833-846.
structure
Pritchard, J.K., M. Stephens y P. Donnelly. 2000. Inference of population
structure using multilocus genotype data. Genetics 155:945-959.
TFPGA
Miller, M.P. 1997. Tools for Population Genetic Analysis (TFPGA), 1.3: A
Windows Program for the Analysis of Allozyme and Molecular Population
Genetic Data. Distribuido por el autor.