Sie sind auf Seite 1von 3

2.2.

1 DATOS CATEGRICOS O CUALITATIVOS


Las variables categricas resultan de registrar la presencia de un atributo. Las
categoras de una variable cualitativa deben ser definidas claramente durante la etapa
de diseo de la investigacin y deben ser mutuamente excluyentes y exhaustivas. Esto
significa que cada unidad de observacin debe ser clasificada sin ambigedad en una y
solo una de las categoras posibles y que existe una categora para clasificar a todo
individuo.
En este sentido, es importante contemplar todas las posibilidades cuando se
construyen variables categricas, incluyendo una categora tal como No sabe / No
contesta, o No registrado u Otras, que asegura que todos los individuos observados
sern clasificados con el criterio que define la variable.

ANALISIS DE DATOS
CATERGORICOS
El anlisis de datos categricos se ocupa del estudio de variables que no son medibles
(color, nacionalidad, enfermedades, sexo, afiliacin poltica, etc.), denominadas
tambin atributos o caracteres cualitativos. Podemos distinguir entre datos en escala
nominal (sexo, estado civil, distintas ramas de actividad econmica, profesin,
ideologa poltica, ...) y datos en escala ordinal (nivel de estudios, estratificacin de
familias por su capacidad de consumo, nivel de autoestima, ..), cuando podemos
establecer un determinado orden o rango entre las observaciones.
En estos casos no tiene sentido el empleo de promedios, tales como la media
aritmtica. Cuando las observaciones se nos ofrecen en una escala nominal, solo la
moda puede utilizarse como medida resumen.
Una cuestin ms interesante es el estudio de la existencia o no de asociacin entre
dos atributos, y de medidas similares a las de correlacin para los casos en que
variables no numricas estn relacionadas entre s.
Para atributos en escala nominal estableceremos los llamados coeficientes de
contingencia. Cuando los caracteres estudiados pueden ordenarse de acuerdo con una
cierta escala, es posible definir unos coeficientes de correlacin que midan el grado de
asociacin entre ellos de manera parecida a como se mide la asociacin entre variables
cuantitativas. Estos coeficientes estn basados en los rangos u ordenes de las
observaciones.

Tablas de contingencia
La distribucin de frecuencias conjunta una variable cualitativa bidimensional (A, B)
est definida por los pares de datos observados sobre los individuos de la poblacin
junto con sus frecuencias absolutas. Los datos pueden organizarse en serie o en una

tabla de doble entrada. La tabla de doble entrada para caracteres cualitativos recibe el
nombre de tabla de contingencia.
1. Los datos bidimensionales en serie se presentan en una tabla unidimensional
con dos columnas, una para cada uno de los atributos. Los datos en una misma
fila se entiende que han sido observados sobre el mismo individuo.
AB
A1 B1
A2 B2
.

An Bn

Grfica de los datos categricos ordinales.


Si bien los datos categricos ordinales no pueden tener un modelo grfico de
frecuencias, dado que no se pueden estudiar sus distribuciones de frecuencias, s se
puede hacer con las tablas de contingencia, en donde asociamos los datos categricos
con el nmero de respuestas que tienen; es decir, un dato categrico va a depender de
una o varias respuestas y esta se va a contabilizar para graficar el nmero en una tabla
de contingencia, de este modo se analizaran las respuestas con una tendencia
puramente categrica.
Por ejemplo, se hizo una encuesta de las personas que fumaban o no fumaban y
estaban bien de salud o tenan problemas respiratorios

FUMAN
NO FUMAN
TOTALES

PROBLEMAS
RESPIRATORIOS

BIEN DE SALUD

TOTALES

43

40

83

15

17

45

55

100

Una vez realizada la tabla como modelo grfico, existen varios mtodos para poder
analizar el comportamiento de dichos datos categricos, pero el ms utilizado es el de
Chi-Cuadrado (Ji-dos)

Mtodo de Chi Cuadrado.

Se considera una prueba no paramtrica que mide la discrepancia entre una


distribucin observada y otra terica (bondad de ajuste), indicando en qu medida las
diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de
hiptesis.
Es decir habr dos posibles hiptesis:
Hiptesis de partida Ho: las dos variables en estudio son independientes.
Hiptesis Alternativa Ha; las dos variables en estudio estn relacionadas.
Para el caso de la tabla de contingencia de una tabla de i x j, se supondr que
primero la hiptesis Ho, partimos de una tabla de frecuencias observadas y se calculan
las frecuencias que cabra de esperar si son independientes. Matemticamente se
expresara.
feij=(Total de fila i-sima)(Total de columna j-sima)/Total Global.
Una vez teniendo todos los datos esperados se calcula la discrepancia es decir la
diferencia de los datos observados menos los datos esperados.
(foij-feij) donde fo son los datos observados y fe los datos esperados.
Y se termina por calcular la chi cuadrada:

X 2=
ij

(f o ij f e ij )2
fe ij

Si la hiptesis nula es cierta, X2 sigue una distribucin Chi cuadrada con (i-1)(j-1)
grados de libertad.
Se rechazar Ho cuando X2 experimental > X2 crtico; es decir que hay una
dependencia de las repuestas de la tabla de contingencia.
El X2 crtico se tomara de una tabla ya propuesta en donde aparecen los valores ms
crticos dependiendo de los grados de libertad que tenga la tabla (i-1)(j-i)

Das könnte Ihnen auch gefallen