Sie sind auf Seite 1von 54

GoBack

Descripción de tablas de contingencia

Guillermo Ayala Gallego


Universidad de Valencia

15 de octubre de 2008

1 / 40
Un ejemplo
Probabilidad y
tablas de
contingencia
Distribución
conjunta y tabla de
contingencia
Distribución
condicional
Independencia y
Probabilidad y tablas de homogeneidad
Tablas de
contingencia
contingencia Tablas de
contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

2 / 40
Distribución conjunta y tabla de contingencia

X e Y dos variables categóricas con I y J categorı́as.


Un sujeto puede venir clasificado en una de I × J categorı́as.
Dada una muestra podemos construir la siguiente tabla donde
consideramos X= toma aspirina o placebo (I = 2) e Y = sufre
ataque cardı́aco o no (J = 2).

Ataque fatal Ataque no fatal No ataque


Placebo 18 171 10845
Aspirina 5 99 10933

Esta tabla recibe el nombre de tabla de contingencia o tabla de


clasificación cruzada.

3 / 40
Su distribución conjunta viene dada por Probabilidad y
tablas de
contingencia
Distribución
πij = P (X = i, Y = j), conjunta y tabla de
contingencia
Distribución
condicional
con i = 1, . . . , I y j = 1, . . . , J. Independencia y
homogeneidad
Las distribuciones marginales son Tablas de
contingencia
Tablas de
J
X J
X contingencia
Sensibilidad y
πi+ = P (X = i) = P (X = i, Y = j) = πij especificidad
Tipo de muestreo
j=1 j=1 Tipo de muestreo:
verosimilitud
Un ejemplo
I
X I
X Comparación de dos
π+j = P (Y = j) = P (X = i, Y = j) = πij proporciones

i=1 i=1 Asociación parcial


en tablas 2 × 2
estratificadas

Tablas I × J

4 / 40
Distribución condicional

Habitualmente una variable, por ejemplo Y , es Probabilidad y


tablas de
contingencia
una variable respuesta y la otra, X es explicativa o Distribución
predictora. conjunta y tabla de
contingencia
En esta situación no tiene sentido hablar de Distribución
condicional
Independencia y
distribución conjunta. homogeneidad

Distribución condicionada de Y a X Tablas de


contingencia
Tablas de
πij contingencia
P (Y = j|X = i) = πj|i = Sensibilidad y
πi+ especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

5 / 40
Independencia y homogeneidad

Son independientes si Probabilidad y


tablas de
contingencia
Distribución
πij = πi+ π+j . conjunta y tabla de
contingencia
Distribución
condicional
En particular, la condicionada es igual a la Independencia y
homogeneidad
marginal. Tablas de
contingencia
Tablas de
πj|i = π+j con j = 1, . . . , J. contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Si X e Y son variables respuesta entonces Un ejemplo

hablamos de independencia. Comparación de dos


proporciones
Si Y es respuesta y X explicativa hablamos de Asociación parcial
homogeneidad. en tablas 2 × 2
estratificadas

Tablas I × J

6 / 40
Tablas de contingencia

Probabilidad y
Test positivo Test negativo Total tablas de
contingencia
Enfermo n11 n11 n1+ Distribución
conjunta y tabla de
No enfermo n21 n22 n2+ contingencia
Distribución
Total n+1 n+2 n condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
Distribución conjunta estimada. contingencia
π̂ij Test positivo Test negativo Total Sensibilidad y
especificidad
Enfermo n11 /n n11 /n n1+ /n Tipo de muestreo
Tipo de muestreo:
No enfermo n21 /n n22 /n n2+ /n verosimilitud
Un ejemplo
Total n+1 /n n+2 /n 1 Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

7 / 40
Tablas de contingencia

Probabilidad y
Test positivo Test negativo Total tablas de
contingencia
Enfermo n11 n11 n1+ Distribución
conjunta y tabla de
No enfermo n21 n22 n2+ contingencia
Distribución
Total n+1 n+2 n condicional
Independencia y
homogeneidad
Tablas de
contingencia
Tablas de
π̂j|i Test positivo Test negativo Total contingencia
Sensibilidad y
Enfermo n11 /n1+ n11 /n1+ 1 especificidad
Tipo de muestreo
No enfermo n21 /n2+ n22 /n2+ 1 Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

8 / 40
Sensibilidad y especificidad

Probabilidad y
π̂j|i Test positivo Test negativo Total tablas de
contingencia
Enfermo n11 /n1+ n11 /n1+ 1 Distribución
conjunta y tabla de
No enfermo n21 /n2+ n22 /n2+ 1 contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
Un ejemplo: en filas indicamos si tiene o no cáncer y contingencia
Tablas de
en columnas el resultado del test. contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
π̂j|i Test positivo Test negativo Total verosimilitud
Un ejemplo
Enfermo 0,82 0,18 1
Comparación de dos
No enfermo 0,01 0,99 1 proporciones
Asociación parcial
Sensibilidad Proporción de enfermos en tablas 2 × 2
estratificadas
correctamente diagnósticados. Tablas I × J

π1|1 = P (Y = 1|X = 1). 9 / 40


Sensibilidad y especificidad

Probabilidad y
π̂j|i Test positivo Test negativo Total tablas de
contingencia
Enfermo n11 /n1+ n11 /n1+ 1 Distribución
conjunta y tabla de
No enfermo n21 /n2+ n22 /n2+ 1 contingencia
Distribución
condicional
Independencia y
homogeneidad
Tablas de
Un ejemplo: en filas indicamos si tiene o no cáncer y contingencia
Tablas de
en columnas el resultado del test. contingencia
Sensibilidad y
especificidad
Tipo de muestreo
Tipo de muestreo:
π̂j|i Test positivo Test negativo Total verosimilitud
Un ejemplo
Enfermo 0,82 0,18 1
Comparación de dos
No enfermo 0,01 0,99 1 proporciones
Asociación parcial
Sensibilidad Proporción de enfermos en tablas 2 × 2
estratificadas
correctamente diagnósticados. Tablas I × J

π1|1 = P (Y = 1|X = 1). 9 / 40


Tipo de muestreo

¿Cómo hemos obtenido la muestra? Probabilidad y


tablas de
contingencia
Muestreo de Poisson: Los conteos Yij son Distribución
conjunta y tabla de
variables Poisson independientes con medias µij . contingencia
Distribución
Muestreo multinomial: Fijamos el tamaño total condicional
Independencia y
n pero no los totales de fila y columna. homogeneidad
Tablas de
Muestreo multinomial independiente: contingencia
Tablas de
Fijamos los totales de fila considerando Y como contingencia
Sensibilidad y
variable respuesta y X como explicativa. especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Un ejemplo
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

10 / 40
Tipo de muestreo: verosimilitud

Probabilidad y
Muestreo de Poisson tablas de
contingencia
ijn Distribución
YY µij conjunta y tabla de
e−µij contingencia

i j
nij ! Distribución
condicional
Independencia y
homogeneidad
Muestreo multinomial Tablas de
contingencia
Tablas de
n! YY nij contingencia
Q Q πij . Sensibilidad y

i j nij ! i j
especificidad
Tipo de muestreo
Tipo de muestreo:
verosimilitud
Muestreo multinomial independiente Un ejemplo
Comparación de dos
Y ni+ ! Y n proporciones

Q πj|iij . Asociación parcial

j nij ! j
en tablas 2 × 2
i estratificadas

Tablas I × J

11 / 40
Un ejemplo

Accidente mortal Accidente no mortal


Con cinturón
Sin cinturón
Vamos a recoger todos los accidentes del próximo mes. No
fijamos el número total. Muestreo de Poisson.
Tomamos un muestra aleatoria de 200 accidentes que tuvieron
lugar el mes pasado. Fijamos el tamaño total de la muestra.
Muestreo multinomial.
Tomamos una muestra de 100 accidentes donde hubo muertos y
otros 100 en los que no hubo muertos. Fijamos los totales de
columna. Muestreo multinomial (binomial aquı́) independiente.

12 / 40
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?

Comparación de dos proporciones Odds y odds ratio

Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

13 / 40
Comparación de dos proporciones

Muchos estudios se diseñan para comparar grupos Probabilidad y


tablas de
contingencia
basándonos en una respuesta binaria, Y .
Comparación de dos
Con dos grupos tenemos una tabla de proporciones
Comparación de dos
contingencia 2 × 2. proporciones
¿Cómo
comparamos?
Odds y odds ratio

Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

14 / 40
Comparación de dos proporciones

Muchos estudios se diseñan para comparar grupos Probabilidad y


tablas de
contingencia
basándonos en una respuesta binaria, Y .
Comparación de dos
Con dos grupos tenemos una tabla de proporciones
Comparación de dos
contingencia 2 × 2. proporciones
¿Cómo
comparamos?
Odds y odds ratio

Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

14 / 40
Comparación de dos proporciones

Muchos estudios se diseñan para comparar grupos Probabilidad y


tablas de
contingencia
basándonos en una respuesta binaria, Y .
Comparación de dos
Con dos grupos tenemos una tabla de proporciones
Comparación de dos
contingencia 2 × 2. proporciones
¿Cómo
comparamos?
Odds y odds ratio

Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

14 / 40
Comparación de dos proporciones

Muchos estudios se diseñan para comparar grupos Probabilidad y


tablas de
contingencia
basándonos en una respuesta binaria, Y .
Comparación de dos
Con dos grupos tenemos una tabla de proporciones
Comparación de dos
contingencia 2 × 2. proporciones
¿Cómo
comparamos?
Odds y odds ratio
1 2 Propiedades del
1 π1|1 π2|1 odds ratio
Nota de R
2 π1|2 π2|2 Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

14 / 40
Comparación de dos proporciones

Muchos estudios se diseñan para comparar grupos Probabilidad y


tablas de
contingencia
basándonos en una respuesta binaria, Y .
Comparación de dos
Con dos grupos tenemos una tabla de proporciones
Comparación de dos
contingencia 2 × 2. proporciones
¿Cómo
comparamos?
Odds y odds ratio

Éxito Fracaso Propiedades del


odds ratio
Grupo 1 π1|1 π2|1 Nota de R
Grupo 2 π1|2 π2|2 Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

14 / 40
Comparación de dos proporciones

Muchos estudios se diseñan para comparar grupos Probabilidad y


tablas de
contingencia
basándonos en una respuesta binaria, Y .
Comparación de dos
Con dos grupos tenemos una tabla de proporciones
Comparación de dos
contingencia 2 × 2. proporciones
¿Cómo
comparamos?
Odds y odds ratio

Éxito Fracaso Propiedades del


odds ratio
Grupo 1 π1|1 π2|1 Nota de R
Grupo 2 π1|2 π2|2 Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

π1|i = πi
π2|i = 1 − π1|i = 1 − πi

14 / 40
Comparación de dos proporciones

Muchos estudios se diseñan para comparar grupos Probabilidad y


tablas de
contingencia
basándonos en una respuesta binaria, Y .
Comparación de dos
Con dos grupos tenemos una tabla de proporciones
Comparación de dos
contingencia 2 × 2. proporciones
¿Cómo
comparamos?
Odds y odds ratio

Éxito Fracaso Propiedades del


odds ratio
Grupo 1 π1 1 − π1 Nota de R
Grupo 2 π2 1 − π2 Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

14 / 40
Comparación de dos proporciones

Muchos estudios se diseñan para comparar grupos Probabilidad y


tablas de
contingencia
basándonos en una respuesta binaria, Y .
Comparación de dos
Con dos grupos tenemos una tabla de proporciones
Comparación de dos
contingencia 2 × 2. proporciones
¿Cómo
comparamos?
Odds y odds ratio

Éxito Fracaso Propiedades del


odds ratio
Grupo 1 π1 1 − π1 Nota de R
Grupo 2 π2 1 − π2 Asociación parcial
en tablas 2 × 2
estratificadas

Queremos comparar π1 con π2 . Tablas I × J

14 / 40
¿Cómo comparamos?

Podemos estudiar la diferencia de las proporciones Probabilidad y


tablas de
contingencia
Comparación de dos
π1 − π2 . proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
O el riesgo relativo: Odds y odds ratio

Propiedades del
π1 odds ratio
. Nota de R
π2 Asociación parcial
en tablas 2 × 2
estratificadas
O bien el cociente de odds (odds ratio)
Tablas I × J

π1 /(1 − π1 )
θ= .
π2 /(1 − π2 )

15 / 40
Odds y odds ratio

Si π es la probabilidad de éxito entonces los odds Probabilidad y


tablas de
contingencia
se definen como
Comparación de dos
π proporciones
Comparación de dos
Ω= . proporciones
1−π ¿Cómo
comparamos?
Odds y odds ratio

Equivalentemente Propiedades del


odds ratio
Nota de R
Ω Asociación parcial
π= . en tablas 2 × 2
Ω+1 estratificadas

Tablas I × J
En una tabla 2 × 2 tenemos los odds en la fila i
πi
Ωi = .
1 − πi

16 / 40
El cociente de los odds de las dos filas será el odds Probabilidad y
tablas de
contingencia
ratio.
Comparación de dos
proporciones
π1 /(1 − π1 ) Comparación de dos
θ= . proporciones
π2 /(1 − π2 ) ¿Cómo
comparamos?
Odds y odds ratio
Se tiene fácilmente que
Propiedades del
odds ratio
π11 π22 Nota de R
θ= .
π12 π21 Asociación parcial
en tablas 2 × 2
estratificadas
Por ello también se le llama el cociente de los Tablas I × J

productos cruzados.

17 / 40
Propiedades del odds ratio

Puede ser cualquier valor positivo. Probabilidad y


tablas de
contingencia
θ = 1 significa que no hay asociación entre X e
Comparación de dos
Y. proporciones
Comparación de dos
Valores de θ alejados de 1 indican una asociación proporciones
¿Cómo
mayor. comparamos?
Odds y odds ratio
Se suele trabajar con log θ pues entonces el valor
Propiedades del
que tenemos es simétrico respecto a cero. odds ratio

El odds ratio no cambia cuando intercambiamos Nota de R


Asociación parcial
filas y columnas. en tablas 2 × 2
estratificadas

Tablas I × J

18 / 40
Nota de R

Probabilidad y
notaR/notaR004.pdf tablas de
contingencia
Comparación de dos
proporciones
Comparación de dos
proporciones
¿Cómo
comparamos?
Odds y odds ratio

Propiedades del
odds ratio
Nota de R
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J

19 / 40
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
Asociación parcial en tablas 2 × 2 El problema
Un ejemplo
¿Por qué?
estratificadas Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea

Tablas I × J

20 / 40
El problema

Cuando estudiamos el efecto de X sobre Y Probabilidad y


tablas de
contingencia
debemos de controlar las covariables que pueden
Comparación de dos
influir en la relación. proporciones

Lo mejor es mantener las covariables relevantes Asociación parcial


en tablas 2 × 2
constantes. estratificadas
El problema
Un efecto de X sobre Y puede representar un Un ejemplo
¿Por qué?
efecto de la (o las) covariables sobre las variables Nota de R
Odds ratios
X e Y. condicionales y
marginales
Esto no es fácil en estudios observacionales. Independencia
marginal e
independencia
condicionada
Asociación
homogénea

Tablas I × J

21 / 40
Un ejemplo

Consideramos los procesamientos por asesinatos Probabilidad y


tablas de
contingencia
múltiples en Florida entre 1976 y 1987.
Comparación de dos
Pena de muerte proporciones

Vı́ctima Acusado Si No % Sı́ Asociación parcial


en tablas 2 × 2
estratificadas
El problema
Blanco Blanco 53 414 11,3 Un ejemplo
¿Por qué?
Negro 11 37 22,9 Nota de R
Odds ratios
Negro Blanco 0 16 0,0 condicionales y
marginales
Negro 4 139 2,8 Independencia
marginal e
independencia
condicionada
Total Blanco 53 430 11,0 Asociación
homogénea
Negro 15 176 7,9 Tablas I × J

22 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.

23 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.

23 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.
Consideramos como covariable la raza de la vı́ctima.

23 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.
Pena de muerte
Vı́ctima Acusado Si No % Sı́

Blanco Blanco 53 414 11,3


Negro 11 37 22,9
Negro Blanco 0 16 0,0
Negro 4 139 2,8

Total Blanco 53 430 11,0


Negro 15 176 7,9

23 / 40
Se condena a muerte más a los blancos que a los negros en
Estados Unidos. En el paı́s de la igualdad se discrimina a los
blancos.
En el paı́s de la igualdad se condena más a los negros.

23 / 40
¿Por qué?

La explicación tiene que venir de la asociación existente entre la


raza de la vı́ctima y las variables que cruzamos marginalmente.
Hay una gran asociación entre raza de vı́ctima y raza del
acusado (odds ratio de 87)

Vı́ctima vs acusado Vı́ctima vs veredicto


Blanco Negro Si No
Blanco 467 48 Blanco 64 451
Negro 16 143 Negro 4 155

24 / 40
Los blancos tienden a matar más a blancos. Probabilidad y
tablas de
contingencia
Si matas a un blanco tienes una mayor
Comparación de dos
probabilidad de que te condenen. proporciones

Esto es un ejemplo de la paradoja de Simpson Asociación parcial


en tablas 2 × 2
(1951). estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea

Tablas I × J

25 / 40
Nota de R

Datos de asesinatos múltiples en Florida: Probabilidad y


tablas de
contingencia
notaR/notaR007.pdf
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas
El problema
Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea

Tablas I × J

26 / 40
Odds ratios condicionales y marginales

Las asociaciones marginales y condicionales Probabilidad y


tablas de
contingencia
pueden ser descritas mediante el odds ratio.
Comparación de dos
Supongamos una tabla 2 × 2 × K. proporciones

Tenemos µijk , frecuencia esperada en la celda Asociación parcial


en tablas 2 × 2
correspondiente. estratificadas
El problema
Fijamos Z = k, y tenemos Un ejemplo
¿Por qué?

µ11k µ22k Nota de R


Odds ratios
θXY (k) = condicionales y
µ12k µ21k marginales
Independencia
marginal e
que serı́an los odds ratio condicionales. independencia
condicionada
Los odds ratio marginales serı́an Asociación
homogénea

µ11+ µ22+ Tablas I × J


θXY =
µ12+ µ21+

27 / 40
Sustituyendo los µijk por las frecuencias Probabilidad y
tablas de
contingencia
observadas tenemos los odds ratio muestrales.
Comparación de dos
Un valor de uno en un odds ratio supone proporciones

independencia bien marginal (si θXY =) o bien Asociación parcial


en tablas 2 × 2
condicionada a que Z = k (si θXY (k) = 1). estratificadas
El problema
notaR/notaR010.pdf Un ejemplo
¿Por qué?
Nota de R
Odds ratios
condicionales y
marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea

Tablas I × J

28 / 40
Independencia marginal e independencia
condicionada

La independencia condicionada a Z = k significa

P (Y = j|X = i, Z = k) = P (Y = j|Z = k),

para todo i, j.
Si lo anterior es cierto para todo valor de Z entonces se dice que
X e Y son condicionalmente independientes dada Z y se
verifica:
πi+k π+jk
πijk =
π++k
para cualquier i, j, k.
La independencia condicional no implica la independencia
marginal.

29 / 40
Asociación homogénea

Una tabla 2 × 2 × K tiene una asociación XY Probabilidad y


tablas de
contingencia
homogénea cuando
Comparación de dos
proporciones

θXY (1) = . . . = θXY (K) . Asociación parcial


en tablas 2 × 2
estratificadas
El problema
El tipo de asociación entre X e Y es el mismo Un ejemplo
para las distintas categorı́as de Z. ¿Por qué?
Nota de R
Si existe una asociación XY homogénea entonces Odds ratios
condicionales y
también tenemos una asociación XZ homogénea marginales
Independencia
y una asociación Y Z homogénea. marginal e
independencia
condicionada
Asociación
homogénea

Tablas I × J

30 / 40
Un ejemplo

Probabilidad y
X = fumador (si, no) tablas de
contingencia
Y = cáncer de pulmón (si, no)
Comparación de dos
Z = edad (< 45, 45 − 65, > 65) proporciones

Los odds ratio observados son Asociación parcial


en tablas 2 × 2
estratificadas
El problema
θXY (1) = 1,2 θXY (2) = 3,9 θXY (3) = 8,8 Un ejemplo
¿Por qué?
Nota de R
El efecto de fumar se acentúa conforme la edad es Odds ratios
condicionales y
mayor. marginales
Independencia
marginal e
independencia
condicionada
Asociación
homogénea

Tablas I × J

31 / 40
Probabilidad y
tablas de
contingencia
Comparación de dos
proporciones
Asociación parcial
en tablas 2 × 2
estratificadas

Tablas I × J Tablas I × J
Medidas resumen de
asociación
Un ejemplo:
Theil,1970
Tendencias
ordinales: pares
concordantes y
discordantes

32 / 40
Medidas resumen de asociación

Los ı́ndices más interpretables son del estilo del Probabilidad y


tablas de
coeficiente de determinación R2 . contingencia
Comparación de dos
Sea V (Y ) una medida de variación de la proporciones

distribución marginal de Y (dada por Asociación parcial


en tablas 2 × 2
{π+1 , . . . , π+J }). estratificadas

Tablas I × J
Sea V (Y |i) la misma medida para la distribución Medidas resumen de
asociación
condicionada de Y a X = i, {π1|i , . . . , πJ|i }. Un ejemplo:
Theil,1970
Este tipo de ı́ndices consideran Tendencias
ordinales: pares
concordantes y
V (Y ) − E[V (Y |X)] discordantes

V (Y )
con X
E[V (Y |X)] = πi+ V (Y |i).
i

33 / 40
Un ejemplo: Theil,1970

Utilizamos la entropı́a Probabilidad y


tablas de
contingencia
X Comparación de dos
V (Y ) = π+j log π+j proporciones

j Asociación parcial
en tablas 2 × 2
estratificadas
Obtenemos el coeficiente de incertidumbre Tablas I × J
Medidas resumen de
P P asociación
i j πij log(πij /πi+ π+j ) Un ejemplo:
U =− P Theil,1970

j π+j log π+j


Tendencias
ordinales: pares
concordantes y
discordantes
U = 0 significa que X e Y son independientes.
U = 1 significa que para cada i, πj|i = 1 para
algún j.

34 / 40
Tendencias ordinales: pares concordantes y
discordantes

Satisfacción en el trabajo
Ingresos Muy Poco Moderadamente Muy
Dólares insatisfecho insatisfecho satisfecho satisfecho

< 15000 1 3 10 6
15000 − 25000 2 3 10 7
25000 − 40000 1 6 14 12
> 40000 0 1 9 11

35 / 40
Tenemos dos medidas ordinales. Cabe esperar una Probabilidad y
tablas de
contingencia
tendencia monótona.
Comparación de dos
Consideramos pares concordantes si un valor proporciones

mayor de X va asociado a un valor mayor de Y . Asociación parcial


en tablas 2 × 2
Un par es discordante cuando un valor mayor de estratificadas

Tablas I × J
X va asociado a un valor menor de Y . Medidas resumen de
asociación
Un par está empatado cuando coinciden en la Un ejemplo:
Theil,1970
clasificación de X e Y . Tendencias
ordinales: pares
En el ejemplo tenemos concordantes y
discordantes

C = 1331, D = 849.

Parece que hay una tendencia de mayor ingreso


mayor satisfacción.
36 / 40
Si X e Y son independientes entonces la Probabilidad y
tablas de
contingencia
probabilidades de concordancia y discordancia son:
Comparación de dos
proporciones
XX XX 
Asociación parcial
Πc = 2 πij πhk , en tablas 2 × 2
estratificadas
i j h>i k>j
Tablas I × J
Medidas resumen de
y XX  asociación
Un ejemplo:
Theil,1970
XX
Πd = 2 πij πhk Tendencias
ordinales: pares
i j h>i k<j concordantes y
discordantes

37 / 40
Condicionado a que no hay empate las Probabilidad y
tablas de
contingencia
probabilidades de concordancia y discordancia son
Comparación de dos
    proporciones
Asociación parcial
Πc / Πc + Πd y Πd / Πc + Πd en tablas 2 × 2
estratificadas

Tablas I × J
Medidas resumen de
La diferencia de las probabilidades es la gamma asociación
Un ejemplo:
(Goodman y Kruskal, 1954): Theil,1970
Tendencias
ordinales: pares
Πc − Πd concordantes y
γ= discordantes
Πc + Πd

38 / 40
La versión muestral serı́a Probabilidad y
tablas de
contingencia
C −D Comparación de dos
γ̂ = proporciones
C+D Asociación parcial
en tablas 2 × 2
estratificadas

La gamma trata simétricamente a las variables Tablas I × J


Medidas resumen de
(como el coeficiente de correlación). asociación
Un ejemplo:
−1 ≤ γ ≤ 1. Theil,1970
Tendencias
Si invertimos las categorı́as de una variable la ordinales: pares
concordantes y
discordantes
gamma cambia de signo.
|γ| = 1 significa que hay una relación
perfectamente monótona.

39 / 40
γ = 1 si Πd = 0. Probabilidad y
tablas de
contingencia
γ = −1 si Πc = 0.
Comparación de dos
Independencia implica γ = 0. El recı́proco no es proporciones

cierto. Asociación parcial


en tablas 2 × 2
Ejemplo de satisfacción con el trabajo: estratificadas

Tablas I × J
Medidas resumen de
asociación
γ̂ = 0,221. Un ejemplo:
Theil,1970
Tendencias
Una ligera tendencia se observa de que unos ordinales: pares
concordantes y
ingresos mayores suponen una mayor satisfacción. discordantes

notaR/notaR011.pdf

40 / 40

Das könnte Ihnen auch gefallen