Beruflich Dokumente
Kultur Dokumente
Introduccin
La presencia de valores perdidos (informacin ausente o faltante) es un problema comn a cualquier investigacin y no puede ser ignorado en el anlisis de datos. Ignorar los datos ausentes puede tener repercusiones graves que van desde la perdida de potencia del estudio hasta la aparicin de sesgos inaceptables. La eliminacin de sujetos con caractersticas especiales limita la representatividad o validez externa de los resultados del estudio. Las razones para la ausencia de datos pueden ser diversas: fallos en los instrumentos de medida, los sujetos no asisten a la entrevista (en diseos longitudinales pueden abandonar el estudio en una oleada concreta), no contestan a una serie de preguntas o responden con la opcin no sabe/no contesta incorporada en el cuestionario, etc. Por todas estas razones y muchas otras los datos perdidos son ubicuos en la investigacin en ciencias sociales y de la salud (Allison, 2002).
Introduccin
Hay una solucin fcil para el tratamiento de bases de datos con valores perdidos y consiste en analizar slo los casos con Informacin completa en el conjunto de variables. Esta solucin, es la opcin por defecto de la mayora de los paquetes estadsticos, se conoce como anlisis de casos completos (Casewise, Listwise). El anlisis de casos completos tiene la ventaja de su simplicidad pero el inconveniente de que se pueden excluir a muchos casos y perder potencia en los anlisis estadsticos.
a) X1 X2 X3 ..Yp
1 2 3 . . . . . . N
b) Y1 Y2 Y3 Yp Y1 Y2 ? ?
c) Y3....Yp ?
? ? ?
Datos perdidos no ignorables o no debidos al azar (MNI=missing nonignorable, o MNAR=missing not at random).
2.
Archivo: opinion.sav
opinion
1,57623 1,77693 1,77693 1,77693
salario
opinion
salario
. . 71 0 1536,0563 .
Para cada variable cuantitativa, los pares de grupos estn formados por variables indicador (presente, perdido). a. Las variables indicador con menos del 5% de los valores perdidos no se muestran.
salario
opinion
salario
salario
Presente Perdidos
71 71,0 29,0
45 81,8 18,2
26 57,8 42,2
Las variables indicador con menos del 5% de sus valores perdidos no se muestran.
hombre
mujer
Total
Patrones tabulados
no perdido
% perdido
Caso 43 44 45 47 48 49 50 52 54 55 79 80 81 82 83 84 85 86 87 88 89 91 92 93 95 96 98 99 100
Patrones a perdidos
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3 33,3
S S S S S S S S S S S S S S S S S S S S S S S S S S S S S
opinion
Nmero de casos 71 29
salario
X
sexo
71 100
Los patrones con menos del 1% de los casos (1 o menos) no se muestran. a. Las variables se ordenan segn los patrones perdidos. b. Nmero de casos completos si las variables perdidas en ese patrn (marcado con X) no se utilizan.
- i ndi ca un val or extremo baj o, m i entras que + i ndi ca un val or extrem o al to. El rango uti l izado es (C1 - 1,5*AIC, C3 + 1,5*AIC). a. Los casos y l as vari abl es se ordenan segn l os patrones de l os perdi dos.
Completo si...
opinion
salario
sexo
Nmero de caso
opinion
salario
opinion
salario
2,48451
salario opinion
1 -,634
71
1536,0563
4,7324
opinion
salario
opinion
salario
sexo
71 71 71
100 100
opinion
salario
3,15747
salario opinion
1 -,634
opinion
salario
opinion
opinion
salario
salario
a Correlaciones de EM
opinion
opinion
salario
1637,1620
4,2900
3,15747
salario opinion
1 -,679
a Correlaciones de regresin
opinion
opinion
salario
1585,1126
4,2900
3,15747
salario opinion
1 -,664
opinion
1
salario
salario
opinion
1
salario
salario
Algoritmo EM
2. Imputacin mltiple
Referencias bibliogrficas:
Allison, P.D. (2002). Missing values. Sage Little, R. J. A. y Rubin, D. B. (1989) The Analysis of Social Science Data with Missing Values. Sociological Methods and Research 18: 292-326. Little, R. J. A. y Rubin, D.B. Statistical Analysis with Missing Data, 2nd edition. New York: Wiley. Rejas, J. Imputacin de datos ausentes en estudios de calidad de vida relacionados con la salud: patrones de prdida de datos y mtodos de imputacin. Investig. Cln. Farm. 2005, Vol. 2 (1): 23-29 Schafer, J.L. y Graham, J.W. (2002). Missing Data: Our View of the State of the Art. Psychological Methods, Vol. 7, No. 2, 14777 Tutorial sobre anlisis de valores perdidos http://www2.chass.ncsu.edu/garson/pa765/missing.htm con SPSS 13.