Sie sind auf Seite 1von 11

PRUEBAS DE ASOCIACION

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

COEFICIENTE DE CONTINGENCIA : C

Esta prueba no paramétrica se usa para datos nominales u ordinales


clasificados en cuadros de contingencia de tablas r x k.

El coeficiente de contingencia determina el grado de asociación


existente entre las variables en estudio, comparando varios grupos o
categorías.

Al observar en la muestra una correlación entre dos atributos, tal vez


queramos determinar si es aceptable concluir que están asociados en
la población representada por la muestra.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

1
Hipótesis a contrastar:

H0 : No existen factores de correlación en la población (el valor observado de


la medida de asociación en la muestra pudo haber surgido al azar en
una muestra
t aleatoria
l t i ded una población
bl ió en lla que llas variables
i bl no están

correlacionadas).

H1: Existe factores de correlación en la población (el valor observado de la


medida de asociación en la muestra no se debe a factores aleatorios, si
no que representa una relación de asociación genuina de las variables
en la población).

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Pasos para calcular el coeficiente de contingencia:

1) Ordenar las frecuencias observadas en una tabla de contingencia r x k,


donde r el número de categorías en la que una variable es calificada (fila) y k
es el número de categorías en la que la otra variable es calificada (columna).

2) Se determinan las frecuencias esperadas para cada celda conforme H0 para


la b χ2, con ell producto
l prueba d d las
de l dos
d marginales
i l comunes a la
l celda
ld que
a su vez se divide entre N (N: total de casos).

Si más del 20% de las celdas tienen frecuencias esperadas menores a 5, o


si una celda tiene frecuencia esperada menor a 1, se combinan las
categorías para incrementar dichas frecuencias.

3) Calculamos el estadístico χ2 para los datos bajo la formula:

r k ( O ij − e ij ) 2
χ =
2
c ∑∑
i j e ij
≈ χ α2 , ( r −1 )*( k −1 )

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

2
4) Con el valor obtenido de χc2 se calcula el valor de C, de la siguiente forma:

χ c2
C=
N + χ c2
N: Tamaño de la muestra

Prueba de significación del Coeficiente de contingencia:

Para probar si el valor observado de “C” indica que hay una asociación entre
las variables de la población muestreada (rechazar H0), vamos a comparar el
valor del estadístico χc2 con la χ2tabla ((r-1)x(k-1);α
) ( ) bajo un nivel de significancia
α, donde, si:

χ2 ≥ χ2tabla (k-1)x(r-1);α rechazamos H0

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Limitaciones del Coeficiente de contingencia:

El coeficiente de contingencias se rige por las mismas reglas de la correlación y las


mediciones de índice correspondiente, pasando por el cero, donde este último
significa no correlación entre las variables estudiadas y 1 como correlación máxima.

El coeficiente de contingencia “C” puede asumir valores en el intervalo [0,1).

Una de las limitaciones del coeficiente de contingencia “C” es que puede ser “cero”,
pero no alcanza la unidad, limitante que desfavorece la prueba, pues el limite superior
(máximo valor que alcanzará) el índice de asociación (“C”) esta en función de las
categorías.

Cuando k=r, el límite superior para “C” alcanzará su máximo valor:

k −1
Cmáximo = k: número de categorías
g o dimensión mínima
k
Por ejemplo:

- Para una tabla 2 x 2 : 2−1 1


C máximo = = = 0 .707
2 2

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

3
Resulta problemático que el límite superior del coeficiente de contingencia “C”
sea dependiente del número de las dimensiones observadas, es decir:

⎡ j −1 ⎤
C ∈ ⎢0, ⎥ donde : j=mín { r , k}
⎣ j ⎦

Coeficiente de contingencia corregido de Pawlik


Para poder excluir, el efecto que produce el tamaño de la muestra, así como
también la influencia de las dimensiones de las tablas de contingencia
consideradas sobre el límite superior del coeficiente y asegurar así la
comparabilidad de los resultados, se utiliza con frecuencia el coeficiente de
contingencia corregido:

c c j
C corregido = = =c ; donde 0 ≤ C corregido < 1
cmax imo j −1 j −1
j

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Aplicativo:

Un investigador desea determinar si existe asociación entre el grado de estrés


en 167 estudiantes de la FIECS y sus condiciones socioeconómicas. Las
observaciones se presentan en el siguiente cuadro:

Frecuencia y ausencia de estrés.

Considerar para la prueba un nivel de significancia del 5%

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

4
Solución:

Planteamiento de Hipótesis:

Ho : No existe asociación entre el grado de estrés en los estudiantes FIECS


y sus condiciones socioeconómicas en la p población de donde se extrajo
j la
muestra.

H1 : Existe asociación entre el grado de estrés en los estudiantes FIECS y


sus condiciones socioeconómicas en la población de donde se extrajo la
muestra.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Calculamos el valor del estadístico χ2 :

Condición Con Sin


socioeconómica estrés estrés Total
del grupo
Alta 15 25 40
23 17
Media 20 32 52
30 27
Baja 60 15 75
43 32
Total 95 72 167

r k ( O ij − e ij ) 2
χ 2
= ∑ ∑
i j e ij
≈ χ α2 , ( r − 1 )*( k −1)

(15 − 23 ) 2 ( 25 − 17 ) 2 ( 20 − 30 ) 2 ( 32 − 27 ) 2 (60 − 43 ) 2 (15 − 32 ) 2


χ2 = + + + + + = 29 .68
23 17 30 27 43 32

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

5
χ2 = 29.68
Calculamos el coeficiente de contingencia “C”:

χ2 29.68
C= Reemplazando: C= = 0.388
N + χ2 167 + 29.68

La decisión de aceptar o rechazar la hipótesis se establece mediante el valor de


χ2= 29.68 comparado con la

χ2tabla,(2-1)x(3-1);0.05 = χ2tabla(2 g.l.);o.o5=5.99

Comparando ambos valores decidimos rechazar H0 con un nivel de significación


del 5%.

Entonces con un nivel de significancia del 0.05, concluimos que la asociación


existente entre el grado de estrés y la condición socioeconómica existe a nivel de
la población que representa la muestra. Siendo el valor del coeficiente de
contingencia en la muestra de 0.388.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN (rs)

El rs nos permite medir la correlación o asociación de dos variables y es aplicable


cuando las mediciones se realizan en una escala ordinal, aprovechando la
clasificación por rangos, de manera que los objetos o individuos en estudio
puedan colocarse en dos series ordenadas.

El coeficiente de Correlación de Spearman esta basada en rangos asignados a las


diferencias para un conjunto dado de datos asociados en pareja {(xi,yi); i=1,2,…n},
a fin de calcular las diferencias se ordenan las X entre sí misma y también las Y,
ambas de mayor a menor a fin de asignarles los rangos correspondientes sin
descuidar identificar a que individuo u objeto se encuentra asociado la
observación. Las magnitudes de las diferencias (di) nos dan una idea de cuan
estrecha es la relación entre las variables en la muestra.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

6
Hipótesis a contrastar:

H0 : Las dos variables en estudio no están asociadas en la población de la


que se extrajo la muestra.

H1: Existe asociación entre las variables en estudio en la población.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Pasos para calcular el coeficiente de correlación de rangos de Spearman (rs):

1) Ordenar las observaciones en la variable X de 1 a N y las observaciones en


la variable Y de 1 a N.

2) Se elabora la lista de los N sujetos, con cada uno de los rangos de los
j
sujetos en la variables X y su rango
g en la variable Y jjunto a su anotación.

3) Se determina el valor de di para cada uno de los sujetos, sustrayendo su


rango Y de su rango X. Se eleva al cuadrado este valor para determinar las
di2 de cada sujeto. Se suman las di2 de los N casos para determinar Σdi2.

4) Calculamos el valor del coeficiente de rangos de Spearman (rs) aplicando


la formula:

N
6 ∑ d i2 Donde:
N = tamaño de la muestra expresada
i =1
rs = 1 − en parejas de rangos de las variables.
N 3
− N

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

7
Para el Caso de Observaciones Ligadas:
Cuando ocurren un alto número de observaciones ligadas (empates) que
representa un porcentaje significativo de la muestra, se incorporará un factor de
corrección, en base a la cuenta de ligas o empates (tanto en la variable “X” como
en la variable “y”): 3
t −t
Ti =
12
Donde “t” es el número de observaciones ligadas o empatadas en un rango
dado (tamaño de cada grupo ligado).

Entonces para un caso considerable de ligas usaremos la siguiente formula


para el calculo de rs :
rs = ∑
x2 + ∑ y2 − ∑ d 2
2 ∑ x2∑ y2

N3− N
Donde : ∑ x2 =
12
− ∑ Tx Donde:
N = tamaño de la muestra
N3− N
∑ y2 =
12
− ∑ Ty expresada en parejas de rangos
de las variables.
INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Prueba de significación del Coeficiente de correlación de Spearman :

Para probar si el valor observado de “rs” indica que hay una asociación entre las
variables de la población muestreada (rechazar H0), vamos a comparar el valor
obtenido para el rs,

a)Caso para N de 4 a 1010, los valores críticos de rs en los niveles de significación


α (0.05 y 0.01) “p” aparece en tablas, donde : rechazamos H0 si:

p<α

b) Caso N ≥ 10 y un nivel de significancia α, se usará el siguiente estadístico de


prueba:

N −2
t = rs ≈ t ( N − 2 ) g .l .
1 − rs2

Donde, rechazaremos H0, si:

t ≥ ttabla (N-2)g.l;α
INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

8
Aplicativo:

Un investigador está interesado en conocer si el desarrollo mental de un niño


esta asociado a la educación formal de su madre. De esta manera, obtiene
la calificación de desarrollo mental en la escala de Gesell de ocho niños
elegidos aleatoriamente y se informa del grado de escolaridad de las
madres.
madres

Desarrollo mental de algunos niños y escolaridad de las madres.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Solución:

H0 : La asociación entre las variables de educación formal de la madre y el


desarrollo mental de los hijos no es significativa, no hay correlación.

H1 : El desarrollo mental de los hijos es una variable dependiente de la


educación formal de la madre; por lo tanto, existe una correlación
significativa.

Realizaremos la prueba bajo un α=0.05

Las observaciones de cada variable se deben ordenar en rangos, así como


obtener las diferencias entre los rangos,
rangos efectuar la sumatoria y elevarla al
cuadrado

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

9
Ordenando separadamente las observaciones:

Calificación
del
Individuo Escolaridad de la Madre (X) desarrollo
mental de
los niños (Y)
1 Primero de secundaria 90
2 Primero de primaria 87
3 Profesional 89
4 Sexto de primaria 80
5 Tercero de secundaria 85
6 Tercero de primaria 84
7 Anafalbeto 75
8 Preparatoria 91

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Ordenando separadamente las observaciones:

Individ Escolaridad de la Rix Indivi Calificación del desarrollo Riy


uo Madre (X) (rango) duo mental de los niños (Y) (rango)
1 Primero de 5
1 90 7
secundaria
2 Primero de primaria 2 2 87 5

3 Profesional 8 3 89 6
4 Sexto de primaria 4 4 80 2
5 Tercero de 6 5 85 4
secundaria
6 84 3
6 Tercero de primaria 3
7 75 1
7 Anafalbeto 1
8 91 8
8 Preparatoria 7

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

10
Reagrupando nuevamente y considerando solo los rangos:

Calificación
Escolaridad de la del desarrollo
Individuo di di2
Madre (X) mental de los
niños (Y)
1 5 7 -2 4
2 2 5 -3 9
3 8 6 2 4
4 4 2 2 4
5 6 4 2 4
6 3 3 0 0
7 1 1 0 0
8 7 8 1 1
N=8
N 8 26

Calculo de rs de Spearman:
N
6 ( ∑ d i2 )
6 ( 26 ) 156
rs = 1 − i =1
= 1− = 1− = 0 . 69
N3−N 83 − 8 504

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

Luego para N=8 y un rs = 0.69,

Tenemos el p-valor de la tabla


de valores críticos para la
correlación de rangos de
Spearman, siendo el valor mas
próximo
ó i a rs ell valor
l ded 0.643,
0 643
siendo el p=0.10.

Luego comparando dicho valor con el α=0.05, observamos que “p” es mayor,
por lo tanto no rechazamos H0.

Por lo que concluimos con un nivel de significancia de 0.05 que no existe


asociación entre la educación
ed cación formal de la madre y el desarrollo mental de
sus hijos.

El coeficiente de correlación de rango de Spearman entre dichas variables


en la muestra es de 0.69.

INFERENCIA ESTADISTICA NO PARAMETRICA LIC. RITA GUZMAN LOPEZ

11

Das könnte Ihnen auch gefallen