Sie sind auf Seite 1von 13

INDICE

Programa para calcular ndices de similitud a partir de matrices de presencia-ausencia

Miguel Murgua

INDICE
Programa para calcular ndices de similitud a partir de matrices de presencia-ausencia Miguel Murgua

Una publicacin de:

ABACo, A.C. D.R. 1990-1998. Asociacin de Bilogos Amigos de la Computacin, A.C. Av. San Jernimo 507. Col. San Jernimo Ldice Mxico, D.F. 10200 Tel. y Fax 5668 4660 abaco@att.net.mx www.abacoac.org

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

Contenido

1. Introduccin Indices de similitud como herramienta metodolgica en Biologa Taxonoma numrica e ndices de similitud Biogeografa cuantitativa e ndices de similitud

2. El programa INDICE Requerimientos para su uso Formatos de las matrices de datos Ejecutando el programa Formato de la matriz de resultados

3. Frmulas de los ndices que calcula el programa

4. Bibliografa

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

1. Introduccin

El programa INDICE es un programa que calcula una matriz de similitud a partir de una matriz de datos de presencia-ausencia. Las opciones se seleccionan mediante mens de barras, navegables con las teclas del cursor. El programa est diseado para que opere en computadoras PC compatibles y tiene requerimientos muy bsicos de recursos de memoria y disco.

ndices de similitud como herramienta metodolgica en Biologa Con mucha frecuencia, los ndices de similitud se utilizan en Biologa para comparar grupos de organismos (taxa) o para comparar regiones geogrficas. El primer caso cae dentro del mbito de la taxonoma numrica, como un paso previo a la generacin de fenogramas. El segundo caso cae dentro del mbito de la biogeografa cuantitativa, rea en la que se han desarrollado mtodos numricos para clasificar reas geogrficas de acuerdo a los organismos que las habitan.

Taxonoma numrica e ndices de similitud La taxonoma numrica es una metodologa para hacer operativos los principios de la fentica, es decir, apoya en la realizacin de los clculos necesarios para proponer clasificaciones de los organismos. Una obra clsica sobre taxonoma numrica es la de Sneath y Sokal (1973); una descripcin general de los objetivos y mtodos de la taxonoma numrica se encuentra en Kohlmann (1990). Una de las primeras etapas de la metodologa feneticista es el clculo de los ndices de similitud entre cada par de elementos a clasificar, llamados OTUs (unidades taxonmicas operativas, por sus siglas en ingls). Esa comparacin se realiza a partir de la informacin contenida en una matriz de datos, en donde se registra la presencia o ausencia de los estados de carcter de cada taxon. Los ndices de similitud obtenidos para cada par de taxa se registran a su vez en otra matriz: la matriz de similitud. La matriz de similitud tambin es analizada aplicando algoritmos definidos para generar un fenograma, por ejemplo, aplicando mtodos de agrupamiento.
INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia 4

Un resumen bibliogrfico donde se pueden consultar referencias que han producido fenogramas a partir de una matriz de similitud puede obtenerse de Baum et al. (1984).

Biogeografa cuantitativa e ndices de similitud Los ndices de similitud tambin son una herramienta muy recurrida para el anlisis de la distribucin espacial de los organismos. Anlogamente a las OTUs (por las iniciales en ingls de unidades taxonmicas operativas), en biogeografa se definen las OGUs (por las iniciales en ingls de unidades geogrficas operativas), que en este caso son las reas geogrficas a comparar. La comparacin entre las reas se realiza mediante la matriz de presencia-ausencia de cada taxn en las reas; as, los taxa desempean el papel de los caracteres en la taxonoma numrica. Tambin, como resultado del anlisis se produce una matriz de similitudes, ahora entre las OGUs. De manera anloga a la taxonoma numrica, la matriz de similitud puede analizarse para producir un fenograma de reas. Un ejemplo de este tipo de metodologas se puede consultar en Villarreal et al. (1996) y para una descripcin del mtodo puede consultarse a Crovello (1981) o Birks (1987).

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

2. El programa INDICE

En esta seccin se explican algunos aspectos tcnicos del programa, como los requerimientos para su operacin, la forma de ejecutarlo y los formatos de los datos de entrada y de los resultados.

Requerimientos para su uso El programa puede correr en cualquier computadora PC compatible (XT, AT, 486 o Pentium) y tiene requerimientos muy bsicos: puede ser ejecutado desde el disco compacto o, si se prefiere, desde el disco duro. Para copiar el programa INDICE del disco compacto desde la unidad E al disco duro, ejecute el archivo INSTALA desde el prompt de MS-DOS:

C:\e:instala

lo cual har que se copien los archivos de INDICE al directorio INDICE en el disco duro.

Formato de las matrices de datos La matriz debe estar en un archivo ASCII. En el primer rengln el nmero de columnas (OTUs o taxa para un anlisis taxonmico y OGUs o reas para anlisis biogeogrfico) seguido del nmero de renglones (estados de carcter para anlisis taxonmico o taxa para anlisis biogeogrfico). En los subsecuentes renglones se escriben los datos presencia-ausencia, indicando presencia con 1 y ausencia con 0. Por ejemplo, el archivo EJEMPLO.MAT contiene: 4 1 1 1 1 1 5 1 1 1 1 1 1 0 0 0 0 1 1 0 0 0

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

lo cual indica que es una matriz de cuatro OGUs por cinco taxa. El tamao mximo permitido de la matriz es 40 columnas por 400 renglones. Las matrices de datos pueden capturarse en un editor de ASCII, por ejemplo el programa WordPad o Bloc de Notas que vienen incluidos en el sistema operativo Windows, o bien capturarla en Word y almacenarla como archivo de tipo texto.

Ejecutando el programa Cuando se ejecuta el programa mediante el comando: C:\INDICEindice se presenta el men que se ilustra en la Figura 1.

INDICE
Formato de la matriz de datos Leer matriz: NO HAY MATRIZ EN MEMEORIA Ver matriz Calcular ndices Terminar

Figura 1. Men principal del programa INDICE.

La opcin Formato de la matriz de datos despliega una breve explicacin de la forma en que debe estar capturada la informacin en el archivo de la matriz a analizar. La opcin Leer matriz se especifica el nombre del archivo que contiene os datos. Despus de leer la matriz de datos puede someterse al clculo de los ndice de similitud. En la opcin Ver matriz despliega en la pantalla la matriz que se encuentra actualmente en memoria. La opcin Calcular ndices presenta un submen (figura 2) en el que el usuario puede elegir el ndice a calcular.

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

Formato de la matriz de resultados El programa reporta una matriz de resultados que puede ser vista en la pantalla, impresa o almacenada en un archivo. En esa matriz se indica el ndice con el que fue calculada y en el encabezado se numeran las unidades comparadas, es decir las columnas de la matriz de datos analizada. Cada rengln representa a cada una de las columnas de la matriz analizada. De esta manera, la diagonal de la matriz resultado es el ndice que resulta de la comparacin de las columnas consigo mismas, y por lo tanto, los valores de la diagonal son iguales a la unidad. En la figura 3 se muestra el resultado del programa INDICE al comparar cada columna de la matriz EJEMPLO.MAT usando el ndice de Jaccard.

INDICE: Calcular ndices


Calcular Braun-Blanquet Calcular Fager Calcular Jaccard Calcular Kulezynski 1 Calcular Kulezynski 2 Calcular Otsuka Calcular Radio de Correlacin Calcular Simpson Calcular Sorensen-Dice Men principal

Figura 2. Men para eleccin del ndice.

Indice de Jaccard: ---------------------------------------1 2 3 4 ---------------------------------------1.00 1.00 1.00 0.20 0.20 1.00 0.40 0.40 0.50 1.00 ---------------------------------------Figura 3. Matriz de similitud calculada por el programa INDICE.

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

3. Frmulas de los ndices que calcula el programa

A continuacin se enuncian las frmulas de los ndices que el programa calcula. Una explicacin del significado de cada frmula y comparaciones entre ellas se puede consultar en Crisci y Lpez (1983), Hublek (1982) o Snchez y Lpez (1988).

Notacin usada Para la descripcin de las frmulas se utiliza notacin de conjuntos, as, las frmulas hacen referencia a la comparacin entre dos conjuntos A y B y se utilizan las siguientes operaciones: AB AB |A| AC max(A, B) min(A, B) Interseccin. Elementos en comn en A y B. Unin. Elementos que se encuentran en A o en B. Cardinalidad. Nmero de elementos en un conjunto. Complemento. Elementos del universo que no estn en A. Funcin: mximo de dos valores enteros. Funcin: mnimo de dos valores enteros.

Frmulas

Baroni-Urbani-Buser sqrt( |A B| x |(A B)c| ) x |A B| ------------------------------------------sqrt( |A B| x |(A B)c| ) x |A B|

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

Braun-Blanquet |A B| -----------------max( |A|, |B| )

Fager |A B| ---------------------------------------( |A| x |B| ) - x max( |A|, |B| )

Jaccard |A B| -------------|A B|

Kulezynski 1 |A B| ---------------------|A B| - |A B|

Kulezynski 2 |A B| x |A B| ---------------------2 x ( |A| x |B| )

Ochiai |A B| --------------( |A| x |B| )

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

10

Radio de correlacin |A B| -------------|A| x |B| Simpson |A B| -----------------min( |A|, |B| )

Sorensen-Dice 2 x |A B| -------------|A| + |B|

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

11

4. Bibliografa

Baum, B.C., T. Duncan y R.B. Phylips. 1984 A bibliography of numerical phenetic studies in systematic botany. Ann. Missouri Bot. Gard. 71: 1044-1060.

Birks, H.J.B. 1987 Recent methodological development in descriptive biogeography. Ann.Zool.Fennici. 24: 165-178.

Crisci, J.V. y Lpez, M.F. 1983 Introduccin a la teora y prctica de la taxonoma numrica. OEA. Washington, D.C.

Crovello, Th.J. 1981 Quantitative Biogeography: an overview. Taxon. 30: 563-575.

Hublek, Z. 1982 Coeficients of association and similarity, based on binary (presence-absence) data: an evaluation. Biol. Rev. 87: 669-689.

Kohlmann, B. 1994 Algunos aspectos de la taxonoma numrica y sus usos en Mxico. En: Llorente, J. e I. Luna (compiladores.). 1994. Taxonoma Biolgica, un libro de texto universitario. UNAM-Fondo de Cultura Econmica. 656 p.

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

12

Snchez, O. y Lpez, G. 1988 Theoretical analysis of some indices of similarity as applied to biogeography. Folia Entom. Mex. 75: 119-145.

Sneath, P.H.A. y Sokal, R.R. 1973 Numerical Taxonomy. The principles and practice of numerical classification. Freeman, San Francisco, Ca.

Villarreal, J.A., Valds, J. y Villaseor, J.L. 1996 Corologa de las asterceas de Coahuila, Mxico. Acta Botnica Mexicana 36: 29-42.

INDICE Programa para calcular indices de similitud a partir de matrices de presencia-ausencia

13

Das könnte Ihnen auch gefallen