Sie sind auf Seite 1von 5

EDIDAS DE ASOCIACIN PARA DATOS NOMINALES

El botn Estadsticos permite calcular las medidas de asociacin ms utilizadas para variables nominales
y ordinales. Por defecto no hay ninguna opcin activada.

Algunos de los estadsticos que recoge este cuadro de dilogo son:


1. Chi-cuadrado,

con esta opcin se obtienen los estadsticos:

(donde nij y eij son las frecuencias absoluta obse

Chi-cuadrado de Pearson:
esperada, respectivamente). Si la tabla es

2x2, el estadstico

se

puede

calcular

mediante

la e

(donde ni. y nj. son las frecuencias marginales por filas y column

abreviada

estadstico es fiable nicamente cuando por lo menos el 80% de las frecuencias esperadas son mayores que 5.

Correccin de continuidad (de Yates):en las tablas 2x2 corrige el error que se comete al calcular el estads
cuadrado de Pearson debido a la aproximacin de una distribucin discreta por una continua. El estadstico c

es

Contraste

Prueba exacta de Fisher:si la tabla es 2x2 y los totales marginales se consideran fijos, la probabilidad e

de

la

razn

de

verosimilitud:se

basa

obtener la tabla analizada bajo el supuesto de independencia es:

en

el

estadstico

que

se

calcula

Si la variable es Nominal los estadsticos que se pueden calcular son los siguientes:

2. Coeficiente de Contingencia de Pearson: se define como


medida de asociacin no se ve afectada por el tamao de la muestra y est

Esta

acotada,
Si las variables son independientes se tiene C=0, pero en caso de
asociacin perfecta nunca alcanza el valor 1. Para tablas cuadradas RxR se puede
calcular la cota superior que es

; en tal caso

3. Phi y V de Cramer:

El coeficiente Phi es
Este coeficiente toma el valor 0 en caso
de independencia, pero su valor mximo depende de las dimensiones de la tabla;
para tablas superiores a 2xJ o Ix2 el coeficiente
mayores que 1.

puede tomar valores

El coeficiente V de Cramer se calcula tambin en funcin de

(donde k =mn(I,J)) y siempre est acotado entre 0 y 1 (sea cual sea la


dimensin de la tabla). Para tablas 2xJ o Ix2 el valor de V coincide con el de

4. Lambda: Incluye la
simtrica y asimtrica y la de Goodman y Kruskal. Ambas
medidas se basan en la reduccin proporcional del error de prediccin cuando se
utilizan los valores de la variable independiente para predecir los de la dependiente.

El coeficiente

- Si la

de Kruskal se calcula:

es la variable dependiente:

donde fmj es la frecuencia relativa conjunta mxima correspondiente a la columna jsima y


. es la frecuencia relativa marginal mxima de
. El valor de este
estadstico, acotado entre 0 y 1, indica en cuanto se reduce la incertidumbre de la
variable

cuando se dispone de informacin sobre el comportamiento de

- De forma anloga se calcula

- Si no se puede determinar cual de las dos variables es la dependiente y cual la independiente se


calcula el coeficiente

El valor de

Un valor

simtrica como:

simtrica est comprendido entre

igual a 0 indica que la informacin acerca de la variable independiente no ayuda en

absoluto a predecir los valores de la variable dependiente; mientras que un valor

igual a 1 indica

asociacin predictiva perfecta entre las variables.

La de Goodman y Kruskal indica la reduccin en el error de clasificacin de


los elementos para una de las variables (dependiente) cuando se tiene
informacin sobre el comportamiento de la otra (independiente). Si
es la
variable dependiente, se calcula:

siendo

TMCSI=total de elementos mal clasificados sin informacin acerca de

TMCCI=total de elementos mal clasificados con informacin acerca de


La
se define de manera anloga.
5. Coeficiente de incertidumbre, U: mide la reduccin proporcional del error cuando los valores de una
variable se emplean para predecir valores de la otra.

En el cuadro Nominal por intervalo se encuentra el estadstico:

6. Eta: Este coficiente es apropiado cuando la variable dependiente se mide en una escala de intervalo,
mientras que la independiente es una variable nominal. El programa muestra dos valores de Eta segn
se considere que la variable medida en una escala de intervalo est en las filas o en las columnas.

1. Bioestadstica Prueba Chi-cuadrado

2. Objetivos del tema Chi-cuadrado Conocer en que ocasiones se aplica esta prueba.
Saber aplicarla e interpretarla Criterio de rechazo Ejemplos
3. Contexto
4. Prueba de Asociacin: Chi cuadrado 2 Mide la relacin entre dos variables
nominales. Compara las frecuencias observadas con el modelo terico-matemtico
Chi cuadrado (=frecuencias esperadas). (freq observadas - esperadas) 2 (O - E) 2 2 =
= freq esperadas E Medicin: escala nominal (datos cualitativos): s/no

Responde a tratamiento/no responde a tratamiento nunca/a veces/siempre


Sobrevivi/no sobrevivi Cada caso (=persona) es contado slo 1 vez.
5. Distribucin chi-cuadrado 2 Cuando se analizan los resultados de una posible
relacin, se necesita conocer si los resultados obtenidos se desvan significativamente
de los resultados esperados. La prueba de Chi-cuadrado se usa para comparar los
resultados observados de los resultados esperados por una hiptesis y si la desviacin
obtenida no es significativa y puede atribuirse al azar o es significativa y otras variables
diferentes al azar estn influyendo en nuestros resultados.
6. Distribucin chi-cuadrado 2-Nunca adopta valores menores de 0-Es asimtrica
positiva.-Es en realidad una familia de curvas, en funcin de losllamados grados de
libertad. Es decir, hay una distribucinchi-cuadrado con 1 gl, una distribucin chicuadrado con 2 gl,etc. (Nota: Los grados de libertad son siempre
nmerospositivos)Grados de libertad df = n 1 ; donde n es el # de posibles
combinaciones.-A medida que aumentan los grados de libertad, ladistribucin se hace
ms y ms simtrica.
7. Prueba chi-cuadrado 2Prueba 2 como medida de relacin: El caso de
independencia de dosvariables cualitativasLa hiptesis nula ser que ambas variables
sean independientesLas frecuencias empricas (observadas) son las que tenemos en la
tabla decontingencia. Ahora bien, cmo calcular las frecuencias tericas (esperadas)?
Loveremos en un minuto Bajo la hiptesis nula (ambas variables independientes), dicho
estadgrafo sigue una distribucin chi-cuadrado con (num_filas-1)*(num_columnas-1)
grados de libertad
8. Prueba chi-cuadrado 2La independencia de dos variables consiste en quela
distribucin de una de las variables es similar seacual sea el nivel que examinemos de
la otra. Esto setraduce en una tabla de contingencia en que lasfrecuencias de las filas (y
las columnas) sonaproximadamente proporcionales. Posiblemente seams cmodo
reconocerlo usando en la tabla decontingencias los porcentajes por filas (o columnas)
yobservando si estos son similares. Sin embargo, lainformacin que se ingresa a la
tabla estarelacionada con la frecuencia de presentacin delevento.
9. Prueba chi-cuadrado 2La prueba de independencia ji-cuadrado (chi-cuadrado)
contrasta la hiptesis de que las variablesson independientes, frente a la hiptesis
alternativade que una variable se distribuye de modo diferentepara diversos niveles de
la otra.
10. Prueba chi-cuadrado 2Observe la siguiente tabla, en la que en un estudiocon
escolares de 10 a 12 aos se les pregunt a qudaban ms prioridad de entre tres
posibilidades:Tener buenas notas, destacar en los deportes o serpopular entre los
compaeros. Tabla de contingencia Sexo * Prioridad Recuento Total Prioridad Deportes
Notas Popular Sexo Nia 17 101 75 193 Nio 51 95 38 184 Total 68 196 113 377
11. Prueba chi-cuadrado 2Observe la siguiente grfico
12. Prueba chi-cuadrado 2Si prestamos atencin a la distribucin de lasprioridades en
porcentajes para cada sexo, tal vez ladiferencia sea ms evidente:
13. Prueba chi-cuadrado 2La prueba de chi-cuadrado contrasta si lasdiferencias
observadas entre los dos grupos sonatribuibles al azar. En este caso, despus de
queusted haga el ejercicio se dar cuenta que se obtieneuna significacin cercana al
0%, con lo que para alnivel de significacin habitual del 5%, se rechaza lahiptesis de
independencia de las prioridades de losestudiantes y el sexo (las preferencias no
sedistribuyen del mismo modo entre chicos y chicas). Oque las preferencias podran
estar relacionadas conel sexo.
14. Usos y aplicacionesTablas de contingencia
15. Limitaciones de la prueba de chi-cuadrado 2El contraste de independencia tiene
muy pocaslimitaciones, aunque es conveniente hacer algunasobservaciones:
16. Limitaciones de la prueba de chi-cuadrado 2Para contrastar la independencia se
suele usar el estadgrafochi-cuadrado. Su clculo se basa en calcular la diferencia
entrelas observaciones observadas para cada par de modalidadesde las variables, y las
que seran de esperar en caso de que sesatisficiese la condicin de independencia.
Para que se puedaconsiderar correcta la significacin calculada por la prueba, sedebe
cumplir que las frecuencias esperadas no sean muypequeas (inferiores a 5) ms que

en unas pocas celdas. Si esen muchas celdas donde esto ocurre (ms del 20%
porejemplo) se debe usar una prueba que no incluyaaproximaciones, como la prueba
exacta de Fisher. Esta laofrece cualquier programa como opcin cuando se hace
estetipo de contrastes.
17. Limitaciones de la prueba de chi-cuadrado 2Si las muestras son muy grandes, la
prueba deindependencia dar resultados significativos inclusodonde, posiblemente,
consideremos que lasdiferencias no sean en realidad clnicamenteinteresantes.
18. Limitaciones de la prueba de chi-cuadrado 2Si una de las variables es numrica u
ordinal,posiblemente queramos hacer algo ms quecontrastar la simple independencia.
Lo aconsejable esusar pruebas de tipo t-student, andeva u otra pruebaestadstica.
19. Limitaciones de la prueba de chi-cuadrado 2El contraste de chi-cuadrado sirve para
contrastar laindependencia. No hay que considerarla como unamedida de la asociacin
entre variables. Si buscamosestudiar la asociacin de variables tenemos otrosmtodos
a nuestra disposicin como la regresinlineal o la logstica que esta incluida en la
tablaresumen de pruebas estadsticas pero que no se veren este curso.
20. Limitaciones de la prueba de chi-cuadrado 2Ejemplo: Se tienen datos demogrficos
de ms de130.000 individuos. De ellos se conoce la edad y elnivel de estudios. Se
desea contrastar si el nivel deestudios de la poblacin es similar para los individuosde
diferentes edades. La sospecha es que en losindividuos ms jvenes, el nivel de
estudios essuperior. Seguramente una prueba ANDEVA o unmodelo de regresin
seran ms convenientes

Das könnte Ihnen auch gefallen