You are on page 1of 16

EL SPSS Y SU APLICACIONES ESTADSTICA- Parte II

Extracto del Libro La Tesis de Postgrado de los Autores

Dr. Luis Alzamora de los Godos


Dra. Jully Pahola Caldern Saldaa

Generando tablas de frecuencia en SPSS


SPSS cuenta con otras ventanas como la de Resultados o la de Sintaxis. Para
conocer la ventana de resultados, vamos a generar una tabla de frecuencias con las
variables Gnero y Estado civil. Para realizarlo debemos ir al men Analizar,
Estadsticos descriptivos, Frecuencias [Fig.9]. Al seleccionar la opcin Frecuencias,
aparece el cuadro de dilogo correspondiente [Fig.10]. A travs de esta ventana se
deben definir las variables a las que queremos realizar la tabla de frecuencias.

Figuras 9 y 10

Si observamos el listado de variables que aparece al costado izquierdo del cuadro,


notaremos que las variables estn por su etiqueta y no por el nombre, esto es til si
desconocemos el archivo y su contenido, pero si es un archivo que hemos creado o su
contenido nos es familiar, sera ms aconsejable manejarlo por el nombre de las
variables. Antes de continuar, daremos nociones de cmo se puede cambiar la forma
de representar las variables en la lista. En primer lugar, es necesario cerrar por un
momento la ventana Frecuencias, luego volveremos a ella. Para cerrarla basta con
hacer clic en el botn cancelar ubicado al costado derecho del cuadro.
Una vez cerrada la ventana nos dispondremos a cambiar la forma de representar las
variables en la lista, para esto debemos ir al men Edicin, Opciones al hacer clic en
Opciones se abre el cuadro de dilogo correspondiente [11].

Figura 11
En este cuadro se manejan todas las opciones del paquete. Podemos observar que en
la parte superior del cuadro hay una serie de pestaas; cada una de ellas corresponde
a un proceso especfico del paquete. Dentro de estos procesos encontramos: General,
Visor, Visor de borrador, etiquetas de los resultados, grficos, interactivos, tablas
pivote, datos, moneda y procesos. Al seleccionar uno de ellos, el contenido de la
ventana cambiar y nos mostrar las opciones que cada pestaa maneja. Por el
momento nos concentraremos en la pestaa General, en ella encontraremos la opcin
Listas de variables, en la parte superior izquierda.

Figura 12

Esta seccin nos permite manipular la forma en que deseamos que se representen las
listas de variables, en nuestro caso deseamos que las listas se determinen por el
nombre de las variables y en orden alfabtico. Para hacerlo debemos seleccionar las
opciones:
Mostrar nombres y Alfabtico haciendo clic en el circulo ( ) que se encuentra a
la izquierda de ellas [Fig. 12].
Despus de seleccionar las opciones, hacemos clic en Aplicar y sucesivamente
en Aceptar, de manera que se cierra la ventana.
Para comprobar el efecto realizado en las Listas de variables, vamos a
continuar con la realizacin de la Tabla de frecuencias.
Para esto, nuevamente, abrimos la opcin Frecuencias en el men Analizar,
Estadsticos descriptivos, Frecuencias; al seleccionar la opcin, aparece el
cuadro de dilogo correspondiente [Fig.13].
Si nos fijamos en el listado de variables, notaremos que ahora aparecen los nombres
de las variables y no la etiqueta.

Figura 13

Continuando con el ejemplo, debemos ubicar las variables Gnero y Estado civil
(Estciv) en la lista de variables e ingresarlas a la casilla de seleccin. Para hacerlo,
debemos resaltar la variable deseada (Gnero) en la lista y sucesivamente hacer clic
en el botn flecha, de manera que aparezca en la casilla de seleccin. Una vez
ingresamos las dos variables, hacemos clic en el botn Aceptar, ejecutando las tablas
de frecuencia y sus consecuencias son presentadas en la ventana Visor de resultados.
Las dems partes de la ventana Frecuencias, sern explicadas a profundidad en los
captulos posteriores.

FRECUENCIAS I
Objetivo: Dominar la forma de generar resultados de frecuencias, tanto en un reporte
estadstico como en un reporte grfico.

OPCIONES DEL PROCEDIMIENTO FRECUENCIAS


Para activar alguna de las opciones basta con hacer clic sobre ella, con lo que
aparecer el cuadro de dilogo correspondiente a la opcin seleccionada. Por el
momento escogeremos la opcin Estadsticos, por lo que hacemos clic en el botn
Estadsticos de manera que aparezca el cuadro de dilogo correspondiente a
Frecuencia: Estadsticos [Fig.14].

Figura 14

En este cuadro encontramos las diferentes medidas estadsticas del procedimiento,


como las medidas de tendencia central (Media, Mediana, Moda y Suma), medidas de
posicin no central (Cuartiles, puntos de corte y percentiles), medidas de dispersin
(Desviacin estndar, Varianza, Amplitud o rango, Mnimo, Mximo y el Error tpico de
la media) y medidas de distribucin (Asimetra y Curtosis). Adems, encontramos una
casilla en la cual podemos informarle al programa que los valores representan puntos
medios de grupos; es decir, que los valores de la variable representan el punto medio
de los datos agrupados.

Dado que la mayora de los estadsticos que comprende este cuadro de dilogo han
sido explicados en los apartados anteriores, solo haremos referencia a las medidas de
posicin no central. Estas medidas nos permiten conocer el valor que se encuentra o
representa una posicin especfica dentro de los datos. Supongamos que contamos
con 100 datos, cuyos valores varan entre 1 y 100; si le pedimos al paquete que nos
indique el valor de los cuartiles, el programa nos ensear los valores que se
encuentren en las posiciones equivalentes al 25%, 50% y 75% de los datos, que para
el caso seran los valores (25, 50 y 75) respectivamente.

Por el contrario, los Percentiles nos permiten conocer los valores que se encuentran
en un porcentaje especfico de los datos; es decir, nos permite saber qu valor se
encuentra en la posicin que nosotros deseemos conocer, sin importar si se trata de
un porcentaje entero o fraccional (Ej: 18.75, 19.25, 20, etc.). Desde luego estas
posiciones no deben superar la cifra de cien, ya que para su clculo se toma la
totalidad de los datos vlidos como el global del porcentaje; es decir, el 100%.

Por ltimo, encontramos la opcin Puntos de corte para [XX] grupos iguales, en donde
podemos pedirle al paquete que divida la informacin en un determinado nmero de
grupos con igual porcentaje de casos. Esta opcin nos ofrece como resultado los
percentiles de corte (Porcentajes) de cada uno de los grupos y nos indica a su vez el
valor que se encuentra en cada punto. La nica restriccin que presenta esta opcin,
corresponde a que el nmero mximo de grupos que podemos obtener es de 100.

En conclusin, las medidas de posicin no central nos permiten identificar los valores
que se encuentran en las posiciones o porcentajes que deseemos conocer, siendo las
ms empleadas, los Cuartiles (25%, 50% y 75%).

La ltima eleccin que nos ofrece este nuevo cuadro corresponde a Los valores son
puntos medios de grupos, con la cual podemos especificar al paquete que los datos
recolectados en la variable han sido previamente agrupados y sus valores representan
el punto medio de cada uno de los rangos agrupados. Debemos recordar que las
ecuaciones de cada una de las medidas estadsticas difieren si los valores son
agrupados con anterioridad.

Para emplear cualquiera de los estadsticos del procedimiento Frecuencias, solo


basta con activarlo haciendo clic sobre la casilla que se encuentra a la izquierda de
cada medida, de manera que aparezca en ella un check ( ). Podemos seleccionar
todos los estadsticos que deseemos, teniendo como nica limitante el nivel de medida
de cada variable. Por el momento, continuaremos con el recorrido de los diferentes
elementos del procedimiento, por lo que no seleccionaremos ninguno de los
estadsticos y en cambio hacemos clic en el botn Cancelar, con lo que volvemos al
cuadro de dilogo Frecuencias.

La segunda opcin del procedimiento Frecuencias corresponde a Grficos. Al hacer


clic sobre el botn Grficos, aparece el cuadro de dilogo correspondiente a
Frecuencias: Grficos [Fig.15]. En este cuadro, encontramos los tres diferentes tipos
de grficos con que cuenta el procedimiento, como lo son el grfico de barras, el
grfico de sectores y el histograma. Adems, a travs de este cuadro podemos
escoger si las porciones de los grficos representan un recuento de los casos
(Frecuencias) o el porcentaje al que equivale.

Figuras 15 y 16
Por defecto, el programa tiene activada la opcin Ninguno. La seccin Valores del
grfico solo se activa cuando se selecciona uno de los grficos de barras o de
sectores y a su vez la casilla de Curva normal solo se activa cuando se selecciona el
Histograma [Fig.16]. Para comprender, la esencia de cada uno de estos mtodos de
representacin grfica, en la siguiente leccin vamos a realizar una pequea
explicacin de sus elementos y usos.

GRFICOS DEL PROCEDIMIENTO FRECUENCIAS - SPSS


1. Grfico de Barras
Este tipo de grfico nos permite identificar y comparar de forma visual el
comportamiento de las categoras de una variable. Por medio de las barras podemos
conocer aspectos de forma sencilla de una o varias variables, como lo pueden ser sus
categoras, las frecuencias y las diferencias entre ellas. La estructura bsica de un
grfico de barras [Fig.17], est basado en un eje de categoras, generalmente el
horizontal y un eje de frecuencias que en algunos casos puede ser remplazado por el
porcentaje. Adems, se suelen utilizar diferentes colores para cada una de las
categoras facilitando el reconocimiento por parte del usuario.

Figura 17
Los grficos de barras tambin son tiles para comparar diversas variables al mismo
tiempo [Fig.18]. Este tipo de opciones implica una serie de tcnicas como la anidacin
y la agrupacin, las cuales sern expuestas en el captulo siete.

Figura 18
2. Grfico de Sectores o Tortas
Los grficos de sectores o de torta nos permiten observar la variable de forma global
haciendo una comparacin inmediata del porcentaje o la frecuencia del total de las
categoras de una variable. Su utilidad radica en la facilidad para interpretar la
informacin contenida en una variable mediante la representacin grfica de los
resmenes (Porcentajes o Frecuencias).

Figura 19

La estructura bsica de los grficos de sectores [Fig.19], est definida por un crculo
en el cual se representan cada una de las categoras por la porcin o fraccin
correspondiente al porcentaje o la frecuencia. En algunas ocasiones suelen separarse
las fracciones, con el fin de hacer ms clara la informacin.
3. Histograma
Los histogramas nos permiten identificar diversos parmetros como la dispersin, la
distribucin y la concentracin de los datos en una variable de Escala. Este tipo de
grficos generan una representacin visual del comportamiento de los datos,
permitiendo observar rasgos caractersticos como la zona o rango de mayor
concentracin, la amplitud, los valores extremos, etc.

La estructura bsica de un histograma [Fig.20], est basada en rangos, los cuales


suelen ser representados por barras cuya altura es determinada por la cantidad de
valores que se encuentren dentro de los lmites de cada rango (Frecuencia).
Generalmente, se utiliza el Eje vertical para representar las frecuencias y el Eje
horizontal para los rangos; adicionalmente, se puede sobreponer una Curva Normal
con el fin de comparar si los datos tienden a distribuirse de manera uniforme.

Figura 20
En resumen, cuando se trabaja con variables categricas (Nominal u Ordinal), los
grficos ms indicados y representativos en su anlisis descriptivo corresponden a los
grficos de Barras y los de Sectores; por el contrario, si se trata de una variable de
Escala, el grfico ms apropiado es el Histograma.
Dado que por el momento solo estamos haciendo un recorrido por las opciones del
procedimiento Frecuencias, no seleccionaremos ninguno de los grficos y en cambio
hacemos clic en el botn Cancelar, con lo cual volvemos al cuadro de dilogo principal
del procedimiento. En la siguiente leccin, conoceremos la ltima opcin del
procedimiento Frecuencias denominada Formato.

TABLAS DE FRECUENCIAS PARA VARIABLES CATEGRICAS


Dado que el procedimiento Frecuencias genera los mismos resultados (Estadsticos,
Tablas y Grficos) para la totalidad de las variables seleccionadas, sin importar si son
Categricas o de Escala y que a su vez, estos dos tipos de medida emplean
parmetros distintos en el anlisis descriptivo; es indispensable realizar los anlisis de
las variables categricas antes que el de las variables de escala, con el fin de
optimizar los resultados, seleccionando exclusivamente los elementos ms apropiados
para cada tipo de medida.

Una vez seleccionado el procedimiento Frecuencias y estando activo el cuadro de


dilogo principal, podemos empezar con el anlisis descriptivo. Lo primero que
debemos efectuar es seleccionar las variables de inters (para el caso ESTCIV y
NIVEDUC), por lo que nos dirigimos al listado de variables, las ubicamos y
sucesivamente las llevamos hasta la casilla de seleccin [Fig.21], ya sea haciendo
doble clic sobre ellas o a travs del botn flecha ( ). Despus de haber seleccionado
las variables debemos especificarle al programa los procedimientos que deseamos
realizar en el anlisis, para lo que hacemos clic en el botn Estadsticos; de manera
que aparezca el cuadro de dilogo correspondiente [Fig.22], en donde seleccionamos
las medidas Mediana y Moda.

Figuras 21 y 22

Despus de seleccionar las medidas estadsticas hacemos clic en el botn Continuar


con lo que volvemos al cuadro principal del procedimiento Frecuencias. As, se
prosigue a seleccionar el botn Grficos con lo que aparece el cuadro de dilogo
respectivo [Fig.23]; a travs de este cuadro elegiremos la opcin Grfico de barras,
teniendo en cuenta que se debe definir en la seccin Valores del grfico, la opcin
Frecuencias y posteriormente hacemos clic en el botn Continuar, con lo que
volvemos al cuadro de dilogo principal.
Figura 23

Por ltimo, activamos el botn Formato con lo que aparece el cuadro de dilogo
correspondiente [Fig.24], en donde seleccionamos las opciones Valores ascendentes y
Comparar variables. Una vez activadas estas opciones, hacemos clic en el botn
Continuar con lo que volvemos al cuadro de dilogo principal del procedimiento
Frecuencias.

Figura 24

Hasta este momento todo lo que hemos hecho es pedirle al programa que nos realice
las tablas de frecuencia de las variables ESTCIV y NIVEDUC, as como las medidas
de tendencia central Mediana y Moda y un grfico de barras para cada una de ellas,
que organice los resultados de acuerdo a los valores que se establecieron en las
propiedades de las variables: as como que exponga los resultados de forma
comparativa; es decir, nos ensee las tablas de frecuencia de las dos variables y
sucesivamente los grficos. Para finalizar y observar los resultados debemos hacer
clic en el botn Aceptar con lo que los efectos del procedimiento aparecen en el visor
de resultados [Fig.25].

Figura 25

FRECUENCIAS VARIABLES CATEGRICAS


Por defecto, SPSS nos ensea el nombre del procedimiento (en este caso
Frecuencias) y los resultados del mismo, en donde encontraremos las tablas de
estadsticos, las tablas de frecuencia y por ltimo, los grficos. Dentro de las tablas de
estadsticos [Fig.26] se incluye un resumen de los valores vlidos que se encontraron
dentro de los datos de cada una de las variables (ESTCIV y NIEVEDUC), as como los
valores de cada uno de los estadsticos que se le hayan solicitado al procedimiento,
que para el caso corresponden a la Mediana y la Moda.
Figura 26

Despus de la tabla de estadsticos e informacin, aparecen las tablas de frecuencia


[Fig. 27]. Por defecto, SPSS incluye dentro de los resultados de una tabla de
frecuencia cada una de las categoras de la variable con sus respectivos estimadores
como Frecuencias, Porcentajes, Porcentajes vlidos (el porcentaje vlido representa el
resultado de dividir la frecuencia de la categora sobre el nmero total de valores
vlidos) y el Porcentaje acumulado (es el resultado de la suma del porcentaje vlido de
las diferentes categoras de la variable).

Figura 27

Si nos fijamos en la tabla de frecuencias correspondiente a la variable Nivel de


educacin (Niveduc), notaremos que aparece una ligera diferencia entre los valores
del Porcentaje y el Porcentaje vlido, esta variacin es ocasionada debido a que
dentro de los datos de la variable se encuentran cuatro (4) valores que han sido
declarados como perdidos en las propiedades de la variable. En esta ocasin, los
valores identifican a los casos en los que no fue posible obtener una respuesta
coherente por parte de los entrevistados (NR).

La diferencia en los valores se presenta debido a que el porcentaje es calculado


mediante la divisin de la frecuencia sobre el nmero total de casos (para el ejemplo
n= 300), mientras que el porcentaje vlido se calcula a travs de la divisin de la
frecuencia sobre el nmero total de casos vlidos (para el ejemplo n= 296). Por
ejemplo, si calculamos el porcentaje y el porcentaje vlido para la categora Primaria
obtenemos:

Ahora, si observamos en la parte inferior de la tabla de frecuencias de la variable


Niveduc, notaremos la existencia de dos totales; el primero de ellos (enmarcado en
azul) corresponde a los valores vlidos, mientras que el segundo (enmarcado en caf)
pertenece al colectivo de los valores encontrados dentro de la variable. La utilidad de
los totales radica en la informacin que nos brinda acerca del nmero de casos de la
variable y el nmero de casos con respuestas vlidas.
Por ltimo, aparecen en el visor de resultados los grficos de cada una de las
variables [Fig.28]. Por defecto, SPSS genera los grficos de cada una de las variables
ubicando en el eje Vertical (eje Y), el recuento o frecuencia y ubicando en el eje
Horizontal (eje X) las categoras; as como el nombre de la variable a la que
corresponde el grfico. Si nos fijamos en los grficos, notaremos que las categoras
ms sobre salientes son Soltero y Secundaria, respectivamente.

Figura 28

SPSS nos permite modificar algunos de los parmetros de cada uno de los grficos
como lo puede ser la forma de las barras, el color, la trama de relleno, la organizacin,
etc.
En conclusin, el procedimiento Frecuencias al ser utilizado en el anlisis de variables
categricas (Nominal u Ordinal), nos permite identificar los parmetros ms
representativos como lo son el nmero de categoras, las frecuencias de cada
categora y la representacin grfica de los datos, la cual puede ser expresada ya sea
mediante un grfico de barras o de sectores.
Adems, es necesario aclarar que los procedimientos que se especifiquen, se
realizarn con todas las variables que se hallan seleccionadas, sin importar el tipo al
que corresponda; por lo que es recomendable realizar primero los anlisis a las
variables categricas y posteriormente a las de escala. En la siguiente leccin,
haremos un ejemplo del procedimiento Frecuencias con Variables de Escala.

TABLAS DE CONTINGENCIA
Tablas de Contingencia o Cruzadas con SPSS
Las tablas de contingencia nos permiten realizar comparaciones de Relacin /
Independencia entre dos o ms variables categricas, ya sean de tipo Nominal u
Ordinal. En este tipo de tablas se definen las categoras de una variable a travs de la
frecuencia o el porcentaje de las categoras de una segunda variable.
Para comprender el concepto nos apoyaremos en los resultados de una encuesta
piloto realizada a 20 personas cuyas preguntas son Gnero del encuestado? y
Tiene telfono celular? Los resultados de estas preguntas se plasman en las tablas
de la figura [37]. Si nos fijamos en los resultados de la tabla del Gnero, notaremos
que el 35 % de los encuestados corresponde a los hombres, mientras el 65 %
restante corresponde a las mujeres.

As mismo, si nos fijamos en la tabla de tenencia de telfono celular, observaremos


que el 40 % de los encuestados s tiene, mientras el 60 % no tiene. A travs de una
tabla de contingencia podemos obtener la relacin de estas dos preguntas,
identificando aspectos como cuntos hombres tienen telfono celular? o cuntas
mujeres no tienen telfono celular?

Figura 29

Para generar una tabla de contingencia, es necesario vincular las categoras de una
de las variables en las Filas y las categoras de la segunda variable en las Columnas.
Si introducimos las categoras de la variable Gnero en las Filas y las categoras de la
variable Telfono celular en las Columnas obtendramos la tabla de la figura [38], en
donde la posicin uno (1) representa a los hombres que tienen telfono, la posicin
dos (2) representa a los hombres que No tienen telfono; la posicin tres (3)
representa a las mujeres que tienen telfono y la posicin cuatro (4) a las mujeres que
No tienen telfono.

Para hallar la frecuencia de cada una de estas opciones, es necesario acudir a los
datos y verificar cuntos de los hombres y mujeres tienen telfono y cuntos no. Los
resultados de este procedimiento son expuestos en la figura 39. Adems de las
frecuencias de cada uno de los cruces de categoras, tambin se acostumbra
introducir Totales en las filas y columnas, con el fin de obtener la mayor cantidad de
informacin posible de las variables.

Figuras 30 y 31

Si nos fijamos en la tabla de la figura [39], notaremos que los dos totales dan como
resultado final el nmero de encuestados (que para el caso corresponde a 20). La
nica condicin que debe cumplir un caso (Respuestas de un encuestado) para ser
incluido en la tabla de contingencia, es tener una respuesta o valor vlido en las dos o
ms variables que compongan la tabla, de lo contrario, el caso ser excluido. Por
ejemplo, si uno de los encuestados no responde la pregunta del Gnero, pero si la del
Telfono o viceversa, el caso ser excluido al momento de generar la tabla de
contingencia.
Las tablas de contingencia pueden servir a diferentes propsitos como el anlisis
descriptivo, en cuyo caso el objetivo es proporcionar informacin condensada que
describa las categoras de las variables involucradas, sin realizar comparaciones
explcitas que generen conclusiones de una poblacin. A su vez, este tipo de tablas
tambin puede ser empleado para la generacin de anlisis de Inferencia, en donde se
intenta extraer conclusiones sobre las relaciones de las variables que puedan ser
aplicadas a una poblacin.

Para este objetivo se emplean pruebas estadsticas a los datos de una muestra (por lo
general la prueba de independencia de Chi-cuadrado). Para generar una tabla de
contingencia es necesario tener un archivo de datos abierto en el Editor de datos de
SPSS.

Una vez abierto el archivo, podemos ejecutar el procedimiento, el cual se encuentra


en el men Analizar, Estadsticos descriptivos, Tablas de contingencia [Fig.32]; al
hacer clic sobre el procedimiento aparece el cuadro de dilogo correspondiente
[Fig.33]. Este cuadro de dilogo est dividido en cuatro secciones (Lista de variables,
Casillas de seleccin, Opciones de resultados y Botones de opcin).

Figuras 32 y 33

En la seccin Casillas de seleccin, encontramos las tres ubicaciones que podemos


emplear para las variables de la tabla (Filas, Columnas o Capas); al ingresar una
variable a la casilla Filas, sus categoras definen cada una de las filas de datos de la
tabla; a su vez al ingresar una variable en la casilla Columnas, sus categoras definen
cada una de las columnas de la tabla.

Si se ingresan mltiples variables a una de las casillas, el programa genera una tabla
de contingencia para cada combinacin de variables de fila y columna. Por ltimo,
encontramos la casilla de Capa; al ingresar una variable en esta casilla, el programa
genera una tabla de contingencia para cada una de las categoras de la variable de
Capa.

Para comprender mejor la metodologa empleada en las tablas de contingencia y los


elementos que nos facilita el procedimiento, en las siguientes lecciones vamos a
generar una serie de ejemplos, intentando aumentar la complejidad de forma gradual.

Pruebas estadsticas - tablas de contingencia


Hasta ahora solo hemos empleado las tablas de contingencia de manera descriptiva,
sin involucrar las pruebas estadsticas de asociacin e independencia. Para poder
determinar si existe una relacin entre dos variables no basta con los porcentajes o los
recuentos, la relacin debe ser comprobada mediante una prueba estadstica. Todas
las pruebas con que cuenta las tablas de contingencia se encuentran ubicadas dentro
de las opciones del botn Estadstico. Al hacer clic en l, aparece el cuadro de dilogo
correspondiente [Fig.34].

Figura 34

Dentro de las diferentes pruebas estadsticas de asociacin que nos ofrece el


procedimiento encontramos el Chi-cuadrado de Pearson, Chi-cuadrado de la razn de
verosimilitud, prueba de asociacin lineal por lineal, prueba exacta de Fisher, Chi-
cuadrado corregido de Yates, r de Pearson, rho de Spearman, coeficiente de
contingencia, phi, V de Cramer, lambdas simtricas y asimtricas, tau de Kruskal y
Goodman, coeficiente de incertidumbre, gamma, d de Somers, tau-b de Kendall, tau-c
de Kendall, coeficiente eta, kappa de Cohen, estimacin de riesgo relativo, razn de
ventajas, prueba de McNemar, estadsticos de Cochran y Mantel-Haenszel. La
mayora de estas pruebas nos permiten comprobar si existe alguna relacin entre las
variable, generando un nmero para representar la fuerza de la relacin.

Por el momento solo haremos nfasis en el Chi-cuadrado de Pearson, el cual es el


que ms utiliza. Esta prueba nos permite determinar si el comportamiento de las
categoras de una variable presenta diferencias Estadsticamente significativas. Para
establecer la diferencia a travs de SPSS, debemos partir de la teora que no existe
relacin entre las variables de la tabla de contingencia (Hiptesis nula); es decir,
debemos asumir que los resultados de las categoras de una variable no se ven
afectados o influenciados por las categoras de la segunda variable.

El clculo del Chi-cuadrado arroja como resultado un valor numrico denominado alfa
(a), el cual debe ser comparado con el valor terico de 0.05. Cuando el valor calculado
es menor que el 0.05 se rechaza la hiptesis nula, con lo cual podemos concluir que si
existe una relacin entre las variables; por el contrario, si el valor calculado es mayor
que 0.05 no se rechaza la hiptesis nula aceptando que no existe ninguna relacin
entre las variables.
A manera de ejemplo vamos a generar la prueba de asociacin del Chi-cuadrado para
las variables Gnero y Estado civil; para lograrlo debemos volver al cuadro de dilogo
y hacer clic en el botn Restablecer de manera que se retome la configuracin inicial
del procedimiento. Una vez se habilita el cuadro, ubicamos en el listado la variable
Estado civil y la ingresamos en la casilla Filas; sucesivamente ubicamos la variable
Gnero y la ingresamos en la casilla Columnas. A continuacin, seleccionamos el
botn Estadsticos y activamos la opcin Chi-cuadrado, haciendo clic sobre la opcin.
Para finalizar hacemos clic en Continuar y luego en Aceptar con lo que los resultados
son creados en el visor [Fig.35].
Figura 35
El programa genera la tabla del resumen del procesamiento y la tabla de contingencia,
pero adicionalmente genera una tercera tabla denominada Pruebas de Chi-cuadrado.
En ella aparecen los valores del Chi-cuadrado y la razn de verosimilitud, los cuales
son calculados con base a la diferencia entre las frecuencias observadas y las
esperadas. De todos los valores que se incluyen en la tabla, solo hay uno que
realmente nos interesa y es el valor correspondiente a la significacin asinttica
(Bilateral) de la prueba Chi-cuadrado de Pearson; este valor es el resultado de la
prueba y es el que se emplea para realizar la comparacin.

De acuerdo al resultado podemos concluir que las variables Estado civil y Gnero s
tienen relacin ya que el valor obtenido es menor que [0.05]. Existen tres factores que
pueden alterar el resultado de las pruebas de asociacin e independencia como lo son
el tamao de la muestra, la fidelidad de los datos y el sesgo muestral; antes de sacar
alguna conclusin es necesario revisar estos factores ya que cualquiera de ellos
puede distorsionar severamente el resultado.

Para concluir con las tablas de contingencia vamos a revisar el ltimo botn de opcin
que podemos encontrar en el cuadro de dilogo, el cual corresponde a Exactas (Este
botn solo est disponible si se ha instalado el mdulo de pruebas exactas). Al
seleccionar este botn, aparece el cuadro de dilogo correspondiente [Fig. 36]; a
travs de sus opciones se proporcionan dos mtodos adicionales para calcular los
niveles de significacin de los estadsticos disponibles en los procedimientos Tablas
de contingencia y Pruebas no paramtricas. Estos mtodos (el mtodo exacto y el de
Monte Carlo) proporcionan el medio para obtener resultados exactos cuando los datos
no cumplen alguno de los supuestos subyacentes necesarios para obtener resultados
fiables.

Figura 36
Las pruebas exactas permiten obtener un nivel de significacin exacto sin confiar en
supuestos que los datos podran no cumplir. Por ejemplo, los resultados de un examen
de calidad de 20 empaques en una fbrica muestran que los cinco empaques plsticos
superaron la prueba, mientras que los resultados de los empaques de papel son
diversos. Una prueba de Chi-cuadrado de Pearson, que contrasta la hiptesis nula de
que los resultados son independientes del material, produce un nivel de significacin
asinttico del 0,07. Este resultado lleva a la conclusin de que los resultados del
examen son independientes del material del empaque.

Sin embargo, dado que los datos incluyen solo 20 casos y las casillas tienen
frecuencias esperadas menores que 5, este resultado no es fidedigno. Al realizar una
prueba exacta a la muestra obtenemos que el Chi-cuadrado de Pearson sea de 0,04,
lo que conduce a la conclusin contraria. Segn la significacin exacta, se concluir
que los resultados del examen y el material del empaque estn relacionados. Esto
demuestra la importancia de la obtencin de resultados exactos cuando no se pueden
cumplir los supuestos del mtodo asinttico. La significacin exacta es siempre fiable,
independientemente del tamao, la distribucin, la dispersin o el equilibrio de los
datos.

En conclusin, el procedimiento Tablas de contingencia nos permite realizar tablas en


las que se describan las categoras de una variable a travs de las categoras de una
segunda variable. Para efectuar la descripcin se pueden emplear diferentes medidas
como el recuento, el porcentaje de fila, el porcentaje de columna o el porcentaje de
tabla. Adicionalmente, este procedimiento nos permite generar grficos de barras con
las variables involucradas en la tabla, as como tambin pruebas estadsticas de
independencia como el Chi-cuadrado de Pearson e incluso generar pruebas
estadsticas de precisin como el mtodo de Monte Carlo o el mtodo Exacto.

REFERENCIAS BIBLIOGRFICAS
- Caldern Saldaa Jully Pahola. Del guila Villar Carlos. Alzamora de los Godos Urcia Luis, La
Rosa Botonero Luis. La Investigacin Cientfica en Ciencias de la Salud. 1ra Edicin 2013. ISBN:
978-612-00-1390-8. Depsito Legal: 2013-15244. Universidad Nacional Federico Villareal.
Editorial Universitaria - 2013.
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis, Del guila Horna Eduardo. La
Tesis de Posgrado. 1ra Edicin 2013. ISBN: 978-612-4097-55-3. Depsito Legal: 2013-03871.
Universidad Alas Peruanas. Lima - 2013.
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis. INVESTIGACIN
CIENTFICA PARA LA TESIS DE POSTGRADO (Print and Ebook). ISBN: 9780557950812
Copyright. Jully Pahola Caldern Saldaa (Standard Copyright License) Edition 1ra Edicin
PublisherJully Pahola Caldern SaldaaPublished. January 4, 2011.
http://www.lulu.com/shop/jully-pahola-calder%C3%B3n-salda%C3%B1a-and-luis-alex-alzamora-
de-los-godos-urcia/investigaci%C3%B3n-cient%C3%ADfica-para-la-tesis-de-
postgrado/paperback/product-14440215.html. Disponible en lulu.com Inglaterra, en amazon.com
de USA. y fishpond.com de Australia.
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis. ESTADSTICA PARA LA
TESIS DE POSTGRADO(Print and Ebook). ISBN: 9780557976041 Copyright Jully Pahola
Caldern Saldaa (Standard Copyright License) Edition 1ra Edicin. Publisher Jully Pahola
Caldern Saldaa y Luis Alzamora de los Godos Urcia. Published February 11, 2011.
http://www.lulu.com/shop/jully-pahola-calder%C3%B3n-salda%C3%B1a-and-luis-alex-alzamora-
de-los-godos-urcia/estad%C3%ADstica-para-la-tesis-de-postgrado/paperback/product-
14729221.html. Disponible en lulu.com Inglaterra, en amazon.com de USA. y fishpond.com de
Australia.
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis. DESARROLLO DE LA TESIS
(ebook): Volumen I. ISBN: 9780557847648 Copyright Jully Pahola Caldern Saldaa (Standard
Copyright License) Edition 2da Edicin. Published November 17, 2010.
http://www.lulu.com/shop/jully-pahola-calder%C3%B3n-salda%C3%B1a-and-luis-alex-alzamora-
de-los-godos-urcia/desarrollo-de-la-tesis-volumen-i/ebook/product-13630126.html.
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis. DESARROLLO DE LA TESIS
(ebook). Segunda Etapa. ISBN: 9780557855469 Copyright Jully Pahola Caldern Saldaa
(Standard Copyright License) Edition 2da Edicin. Published November 17, 2010.
http://www.lulu.com/shop/jully-pahola-calder%C3%B3n-salda%C3%B1a-and-luis-alex-alzamora-
de-los-godos-urcia/desarrollo-de-la-tesis-segunda-etapa/ebook/product-13630654.html
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis. DESARROLLO DE LA TESIS
(ebook). Tercera Etapa. ISBN 9780557857517 Copyright Jully Pahola Caldern Saldaa
(Standard Copyright License) Edition 2da Edicin. Published November 18, 2010.
http://www.lulu.com/shop/jully-pahola-calder%C3%B3n-salda%C3%B1a-and-luis-alex-alzamora-
de-los-godos-urcia/desarrollo-de-la-tesis-tercera-etapa/ebook/product-13634992.html.
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis. METODOLOGA DE LA
INVESTIGACIN CIENTFICA EN POSTGRADO (Print and Ebook). ISBN 9780557970735
Copyright Jully Pahola Caldern Saldaa (Standard Copyright License) Edition 1ra Edicin.
Publisher Jully Pahola Caldern Saldaa y Luis Alzamora de los Godos Urc. Published.
December 14, 2010. http://www.lulu.com/shop/jully-pahola-calder%C3%B3n-salda%C3%B1a-
and-luis-alex-alzamora-de-los-godos-urcia/metodolog%C3%ADa-de-la-investigaci%C3%B3n-
cient%C3%ADfica-en-postgrado/hardcover/product-14303611.html.
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis. EPIDEMIOLOGIA Y
ESTADSTICA EN SALUD (Ebook). Pblico. N de pginas: 197.
http://www.bubok.es/libros/193076/EPIDEMIOLOGIA-Y-ESTADISTICA-EN-SALUD .
- Dra. Jully Pahola Caldern Saldaa. Dr. Luis Alzamora de los Godos Urcia, Dr. Eduardo del
guila Horna. GUA DE ELABORACIN DE PROYECTOS DE TESIS DOCTORAL. Universidad
Alas Peruanas. Vicerectorado de Investigacion y Postgrado. Lima Per. 2009.
http://dued.uap.edu.pe/books/60/600260107/60107-12-482455wuvytxgoko.pdf
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis. GUA DE ELABORACIN DE
PROYECTOS DE INVESTIGACIN E INFORMES DE TESIS CUANTITATIVA. @ 2006
Universidad Inca Garcilaso de la Vega EPG 2006. Escuela de Postgrado. Seccin de
Maestra. Editor: Luis Alzamora de los Godos Urcia. Revisin del documento: Jully Pahola
Caldern Saldaa. https://es.scribd.com/doc/256413894/Esquema-Cuantitativo-Maestria
- Caldern Saldaa Jully Pahola, Alzamora de los Godos Urcia Luis. GUA DE ELABORACIN DE
LA TESINA. Instituto Cientfico y Tecnolgico Del Ejrcito. Lima- Per. 2010.
https://es.scribd.com/doc/115461124/Esquema-ICTEo