Beruflich Dokumente
Kultur Dokumente
ANALISIS DE DATOS
CATERGORICOS
El anlisis de datos categricos se ocupa del estudio de variables que no son medibles
(color, nacionalidad, enfermedades, sexo, afiliacin poltica, etc.), denominadas
tambin atributos o caracteres cualitativos. Podemos distinguir entre datos en escala
nominal (sexo, estado civil, distintas ramas de actividad econmica, profesin,
ideologa poltica, ...) y datos en escala ordinal (nivel de estudios, estratificacin de
familias por su capacidad de consumo, nivel de autoestima, ..), cuando podemos
establecer un determinado orden o rango entre las observaciones.
En estos casos no tiene sentido el empleo de promedios, tales como la media
aritmtica. Cuando las observaciones se nos ofrecen en una escala nominal, solo la
moda puede utilizarse como medida resumen.
Una cuestin ms interesante es el estudio de la existencia o no de asociacin entre
dos atributos, y de medidas similares a las de correlacin para los casos en que
variables no numricas estn relacionadas entre s.
Para atributos en escala nominal estableceremos los llamados coeficientes de
contingencia. Cuando los caracteres estudiados pueden ordenarse de acuerdo con una
cierta escala, es posible definir unos coeficientes de correlacin que midan el grado de
asociacin entre ellos de manera parecida a como se mide la asociacin entre variables
cuantitativas. Estos coeficientes estn basados en los rangos u ordenes de las
observaciones.
Tablas de contingencia
La distribucin de frecuencias conjunta una variable cualitativa bidimensional (A, B)
est definida por los pares de datos observados sobre los individuos de la poblacin
junto con sus frecuencias absolutas. Los datos pueden organizarse en serie o en una
tabla de doble entrada. La tabla de doble entrada para caracteres cualitativos recibe el
nombre de tabla de contingencia.
1. Los datos bidimensionales en serie se presentan en una tabla unidimensional
con dos columnas, una para cada uno de los atributos. Los datos en una misma
fila se entiende que han sido observados sobre el mismo individuo.
AB
A1 B1
A2 B2
.
An Bn
FUMAN
NO FUMAN
TOTALES
PROBLEMAS
RESPIRATORIOS
BIEN DE SALUD
TOTALES
43
40
83
15
17
45
55
100
Una vez realizada la tabla como modelo grfico, existen varios mtodos para poder
analizar el comportamiento de dichos datos categricos, pero el ms utilizado es el de
Chi-Cuadrado (Ji-dos)
X 2=
ij
(f o ij f e ij )2
fe ij
Si la hiptesis nula es cierta, X2 sigue una distribucin Chi cuadrada con (i-1)(j-1)
grados de libertad.
Se rechazar Ho cuando X2 experimental > X2 crtico; es decir que hay una
dependencia de las repuestas de la tabla de contingencia.
El X2 crtico se tomara de una tabla ya propuesta en donde aparecen los valores ms
crticos dependiendo de los grados de libertad que tenga la tabla (i-1)(j-i)