Sie sind auf Seite 1von 35

Tabla de doble entrada

Tablas de doble entrada: Tambin llamadas tablas de


contingencias, son aquellas tablas de datos referentes
a dos variables, formada, en las cabeceras de las filas,
por las categoras o valores de una variable y en las de
las columnas por los de la otra, y en las casillas de la
tabla, por las frecuencias o nmero de elementos que
renen a la vez las dos categoras o valores de las dos
variables que se cruzan en cada casilla. Para la
tabulacin de un material agrupado de observaciones
simultneas de dos variables aleatorias necesitaremos
una tabla COMO SIGUE:


Este tipo de tablas brindan informacin estadstica de
dos eventos relacionados entre s, es til en casos en
los cuales los experimentos son dependientes de otro
experimento.
Empezando con SPSS
Con el men Analizar/Estadsticos descriptivos/tablas
de contingencia se pueden crear tablas de doble
entrada.







Al darle clic, nos mostrada el siguiente cuadro de
dialogo:

Si se indican varias variables en filas o
columnas harn tantas tablas de doble
entada como combinaciones se puedan
hacer











Como parte del ejemplo, utilizaremos edad que sera
como la entrada x y peso como entrada y.
Al darle clic en aceptar nos aparece la siguiente tabla
de contingencia.


En el men casillas puede especificar la
informacin requerida para cada par de
valores de las dos variables (frecuencias
absolutas, relativas conjuntas y relativas
condicionadas)







CREACIN O TRANSFORMACIN DE VARIABLES
Este comando nos va a permitir crear nuevas variables
o transformar las ya existentes mediante el uso de
operadores aritmticos, funciones aritmticas,
funciones estadsticas, funciones lgicas, funciones de
cadena, funciones de fecha y hora, funciones de
distribucin, funciones de variables aleatorias y
funciones de valores perdidos.


Men Transformar/ Calcular...



1. Asignar un nombre a la nueva variable. Este
nombre lo introduciremos en laceldaVariable de
destino.
2. Especificar el tipo de variable que queremos crear
y, opcionalmente, la etiquetade la nueva variable.
3. En Expresin numrica tendremos que escribir la
expresin a travs de la cual se determina los
distintos valores que toma esta nueva variable. Para
ellotenemos una serie de botones con dgitos del 0 al
9, operadores aritmticos, operadores lgicos, etc.
Adems, tenemos un conjunto de funciones que nos
permitirn realizar distintas operaciones. Una vez
seleccionado un grupo concreto de funciones,
seleccionaremos una funcin determinada.

4. Con el botn "Si..." podemos establecer una
expresin condicional. De esta forma, la nueva
variable slo se calcular para aquellos casos en los
cuales se cumpla la condicin. En aquellos casos, en
los que no se cumpla la condicin la nueva variable no
tomar ningn valor y, como resultado de ello,
tendremos un valor perdido del sistema. Al presionar
dicho botn aparece un cuadro de dilogo,
deberemos seleccionar la opcin Incluir si el caso
satisface la condicin y establecer la condicin que
ha de cumplir un determinado caso para que el valor
correspondiente de la nueva variable sea calculado.
Finalmente haremos clic en el botn "Continuar".

5. Hacer clic en el botn "Aceptar" del cuadro de
dilogo de Calcular variable.
RECODIFICAR VARIABLES
Permite modificar los valores de las variables
recodificndolos. Esto es til para aadir o combinar
categoras en una variable. El resultado de la
recodificacin puede guardarse en la misma variable,
sustituyendo as los valores originales, o bien generar
una nueva variable.
a) Para recodificar los valores de una variable en la
misma variable:
Elegir los mens:
Transformar/ Recodificar/ En las mismas variables...

- Seleccionar las variables que se deseen recodificar.
Si se seleccionan varias variables, debern ser del
mismo tipo (numricas o de cadena).
- Pulsar en Valores antiguos y nuevos y especificar
cmo recodificar los valores.


b) Para recodificar los valores de una variable en una
nueva variable:
Elegir los mens:

Transformar/ Recodificar/ En distintas variables...

- Seleccionar las variables que se deseen recodificar.
Si se seleccionan variasvariables, debern ser del
mismo tipo (numricas o de cadena).

- Introducir el nombre de una (nueva variable) de los
resultados para cada variable seleccionada y pulsar
Cambiar.

- Pulsar en Valores antiguos y nuevos y especificar
cmo recodificar los valores.

- Tambin existe la posibilidad de realizar la
recodificacin automticamente, el sistema se
encarga de establecer la transformacin e informa de
cules son y a qu corresponden los valores de la
nueva variable.






MANIPULACIN DE ARCHIVOS
Ordenar datos
Permite ordenar todos los casos de un archivo,
utilizando como criterio una o ms variables.

Men Datos / Ordenar casos.
Entonces, aparecer en pantalla un cuadro de dilogo:





Deberemos introducir en el cuadro "Ordenar por", en
primer lugar, la variable que va a constituir el criterio
de ordenacin principal y, a continuacin, la variable
o variables que se van a tener en cuenta cuando
existan determinados casos que tengan para dicha
variable el mismo valor. Asimismo, habr que
especificar el "Orden de clasificacin", es decir, si
queremos que los casos los ordene de menor a mayor
(ascendente) o de mayor a menor (descendente).



Agrupar datos
Esta opcin permite agrupar casos basndose en los
valores de una variable de agrupacin y crear un
nuevo archivo donde habr un caso por cada grupo.
Men Datos / Agregar / Variable de segmentacin:
/Variables agregadas: Funcin /Crear archivo
El resultado de la agrupacin puede aparecer en el
archivo activo, en un nuevo conjunto de datos o en un
nuevo archivo.

Segmentacin de un archivo.
Este comando nos va a permitir dividir nuestro
archivo de datos en distintosgrupos de elementos.
Por ejemplo, pensemos que tenemos las variables
peso, edad y sexo. Podramos estudiar el peso y la
edad por separado en los hombres y en las mujeres.

Con el men datos/segmentar archivo. Se pueden
organizar los resultados que se obtengan para una
variable en funcin de grupos formados por valores
de otra u otras variables, lo que resulta muy til para
trabajar con distribuciones condicionadas

Al darle clic nos arrojara el siguiente cuadro de
dilogo


Segmentar un archivo es un procedimiento que crea
un nuevo grupo cada vez que aparece un nuevo valor
de la variable que se emplea para segmentar el
archivo dedatos.
Las opciones que podemos seleccionar en el cuadro
de dilogo son:
Analizar todos los casos, no crear los grupos:
Analiza todos los casos juntos.
De esta manera, si se selecciona esta opcin se dejar
de realizar los distintos anlisis estadsticos para cada
uno de los posibles grupos en que estuviera
segmentado el archivo, pasando a realizarse sobre el
total de casos.
Se indica la variable (o variables con
respecto a las que se quiere segmentar
el archivo y se selecciona comparar
los grupos)
Comparar los grupos: Los resultados obtenidos tras
la ejecucin de un determinado procedimiento se
presentan juntos para que puedan ser comparados.

Organizar los resultados por grupos: Los resultados
de cada grupo se presentan por separado para cada
grupo en que est segmentado el archivo.
Finalmente, hay dos opciones ms que se activan
cuando seleccionamos
Comparar los grupos u Organizar los resultados por
grupos:

Ordenar los archivos segn variable de agrupacin:
El archivo es ordenado en funcin de los valores de
las variables que aparecen en la lista Grupos basados
en, teniendo en cuenta el orden en que dichas
variables aparecen en la lista. Seleccionaremos esta
opcin cuando el archivo de datos no est ordenado
segn los valores de las variables de agrupacin.
El archivo ya est ordenado: El archivo ya est
ordenado por las variables que aparecen en la lista
Grupos basados en. Con los archivos muy grandes
esta opcin tiene la ventaja de que nos permite
ahorrar bastante tiempo de procesamiento. Sin
embargo, tiene el inconveniente de que puede
aparecer un gran nmero de grupos intiles en el
supuesto de que el archivo no est ordenado en el
orden correcto.


Como consecuencia los anlisis que se realicen a
continuacin sobre una variable (ejemplo: edad) se
harn separando los datos para esos grupos y
comparando los resultados).






Observe que mientras el fichero permanezca
segmentado, se indicar en la vista de datos. Para
volver a trabajar con todos los datos se repite el
proceso de segmentacin y se selecciona analizar
todos los casos, no crear grupos.
Diagrama de dispersin.
En el men grficos/cuadros de dialogo
antiguos/dispersin/Puntos permite obtener el
diagrama de dispersin.

Nos arroja el siguiente cuadro de dilogo, donde
podemos escoger el subtipo



Al darle definir, nos muestra el siguiente cuadro de
dialogo



Escoge el suptipo y dale
definir
Se definen las variables que vayamos a graficar




Podemos cambiarles el titulo y hay algunas otras
opciones que se pueden utilizar, como la exclusin de
de casos, etc.

El diagrama que aparece en la ventana de
resultados, puede editarse haciendo doble clic
encima de la grafica. De esta manera se accede al
editor de grficos, que presenta distintas opciones de
edicin, entre las que se encuentra el insertar la recta
de regresin de mnimos cuadrados.


Matriz de correlaciones
La matriz de correlacin es una matriz
conformada por n filas y por n columnas.
Adems es una matriz simtrica; es decir, que los
valores de los elementos a
ij
de la matriz, es el
mismo valor en los elementos a
ji
de la matriz.

La matriz de correlacin nos explica cmo se
encuentran relacionadas cada una de las
variables con otra variable. Su diagonal siempre
contendr el valor de 1. Si tiene un valor 0, nos
indicar que no tiene ninguna relacin con esa
variable, por lo menos no lineal; es decir, pueda
que tenga una relacin cuadrtica o de otro
grado.

Cuando la correlacin es positiva, esto nos indica
que su proyeccin de la regresin lineal va a
tender a crecer conjuntamente con la contra
variable.

Cuando la correlacin es negativa, esto nos indica
que su proyeccin de la regresin lineal va a
tender a decrecer conjuntamente con la contra
variable.

En el men analizar/correlaciones/Bivariadas
pueden abstenerse los coeficientes de correlacin
para un conjunto de variables cuantitativas (dos a
dos).







Se puede indicar ms de dos variables. Si lo hace se
calcularan las correlaciones las variables dos a dos






En opciones tambin se puede solicitar el clculo
tambin de las covarianzas.
Los estadsticos aparecen en la ventana de resultados







Regresin de mnimos cuadrados
El anlisis de regresin lineal es una tcnica
estadstica utilizada para estudiar la relacin entre
variables cuantitativas. Tanto en el caso de dos
variables (regresin simple) como en el de ms de dos
variables (regresin mltiple), el anlisis regresin
lineal puede utilizarse para explorar y cuantificar la
relacin entre una variable llamada dependiente o
criterio(Y) y una o ms variables llamadas
independientes o predictoras (X1, X2, , Xp), as como
para desarrollar una ecuacin lineal con fines
predictivos.


En Dependiente se traslada la variable cuyos valores
se desea predecir o resumir.
En independientes, en este recuadro nos sirve para
introducir las variables independientes, nos permite
hacer varios anlisis de regresin a la vez, alternando
los botones anterior y siguiente, y adems no deja
elegir el mtodo de introduccin de las variables
independientes.
Independientes se trasladan las variables utilizadas
para predecir el valor de la variable dependiente.
Tambin se denominan variables predictoras o
variables explicativas. Para poder ejecutar este
procedimiento, la lista debe contener al menos una
variable.

Mtodo: Permite seleccionar el mtodo por el cual
se introducen las variables independientes en el
anlisis. Nos vale para elegir la mejor ecuacin de
regresin. Permite construir una variedad de modelos
de regresin a partir del mismo conjunto de variables:
- Introducir (Entry): Procedimiento para la seleccin
de variables en el que todas las variablesde un bloque
se introducen en un solo paso. Es el mtodo por
defecto.
- Pasos sucesivos (Stepwise): En cada paso se
introduce la variable independiente que no se
encuentre ya en la ecuacin y que tenga la
probabilidad para F ms pequea, si esa probabilidad
es suficientemente pequea. Las variables ya
introducidas en la ecuacin de regresin se eliminan
de ella si su probabilidad para F llega a ser
suficientemente grande. El mtodo termina cuando
ya no hay ms variables candidatas a ser incluidas o
eliminadas.
- Eliminar (Remove): Procedimiento para la seleccin
de variables en el que las variables de un bloque se
eliminan en un solo paso.
- Hacia atrs (Backward): Procedimiento de seleccin
de variables en el que se introducen todas las
variables en la ecuacin y despus se van excluyendo
una tras otra. Aquella variable que tenga la menor
correlacin parcial con la variable dependiente ser la
primera en serconsiderada para su exclusin. Si
satisface el criterio de eliminacin, ser eliminada.
Tras haber excluido la primera variable, se pondr a
prueba aquella variable, de las que queden en la
ecuacin, que presente una correlacin parcial ms
pequea. El procedimiento termina cuando ya no
quedan en la ecuacin variables que satisfagan el
criterio de exclusin.
- Hacia delante (Forward): Procedimiento de seleccin
de variables en el que stas son introducidas
secuencialmente en el modelo. La primera variable
que se considerar para ser introducida en la
ecuacin ser aqulla que tenga mayor correlacin,
positiva o negativa, con la variable dependiente.
Dicha variable ser introducida en la ecuacin slo si
satisface el criterio de entrada. Si ha entrado la
primera variable, se considerar como prxima
candidata la variable independiente que no est en la
ecuacin y cuya correlacin parcial sea la mayor. El
procedimiento termina cuando ya no quedan
variables que satisfagan el criterio de entrada.
En Variable de seleccin se traslada una variable que
limite el anlisis a un subconjunto de casos que
tengan un valor particular para esta variable. Con
Regla podemos definir el subconjunto de casos que
se emplearn para estimar el modelo de regresin.
En Etiquetas de caso designamos una variable para
identificar los puntos de los grficos. Para cada punto
de un diagrama de dispersin podemos utilizar la
herramienta de seleccin de puntos y mostrar el valor
de la variable de etiquetas de casos correspondiente
al caso seleccionado.
Ponderacin MCP: Permite obtener un modelo de
mnimos cuadrados ponderados. Los puntos de los
datos se ponderan por los inversos de sus varianzas.
Esto significa que las observaciones con varianzas
grandes tienen menor impacto en el anlisis que las
observaciones asociadas a varianzas pequeas.

Estadsticos
Con el botn Estadsticos accedemos al cuadro de
dilogo que muestra la figura 2 que nos valepara
solicitar resultados estadsticos opcionales,
incluyendo los coeficientes de regresin, descriptivos,
Estadsticos de ajuste del modelo, la prueba de
Durbin-Watson y diagnsticos de la colinealidad.

Coeficientes de regresin. En este recuadro podemos
obtener tanto las estimaciones de los coeficientes de
regresin, la bondad del ajuste del modelo elegido,
los intervalos de confianza de cada coeficiente as
como la matriz de covarianzas. Podemos elegir una o
ms de las opciones:
- Estimaciones: nos muestra coeficientes de regresin
y medidas relacionadas. Los coeficientes no
estandarizados (no tipificados) son los coeficientes de
regresin parcial que definen la ecuacin de regresin
en puntuaciones directas. Los coeficientes
estandarizados () son los coeficientes que definen la
ecuacin de regresin en puntuaciones tpicas. Estos
coeficientes estandarizados ayudan a valorar la
importancia relativa de cada variable independiente
dentro de la ecuacin. Muestra las pruebas de
significacin de cada coeficiente, el estadstico de
contraste (t) as como su nivel crtico (Sig.). Una
significacin pequea nos permite afirmar que el
coeficiente es significativo.
- Intervalos de confianza: nos muestra intervalos de
confianza al 95% para los coeficientes de regresin.
- Matriz de covarianzas: nos muestra la matriz de
varianza-covarianza de los coeficientes de regresin,
las varianzas en la diagonal y las covarianzas por
debajo y por encima de la diagonal.

Ajuste del modelo. Muestra el coeficiente de
correlacin mltiple (R mltiple), y su cuadrado (R2,
coeficiente de determinacin, que expresa la
proporcin de varianza de la variable dependiente
que est explicada por la variable o variables
independientes), la R cuadrado corregida y el error
tpico de la estimacin (desviacin tpica de los
residuos). Tambin, una tabla de ANOVA muestra las
sumas de cuadrados, los grados de libertad, las
medias cuadrticas, el valor del estadstico F y el nivel
crtico (Sig.) de la F.
Cambio en R cuadrado. Nos muestra el cambio en el
estadstico R cuadrado que se produce al aadir o
eliminar una variable independiente. Si el cambio en R
cuadrado asociado a una variable es grande, significa
que esa variable es un buen predictor de la variable
dependiente.
Descriptivos. Muestra las medias de las variables, las
desviaciones tpicas y la matriz de correlaciones con
las probabilidades unilaterales.
Correlaciones parcial y semiparcial. Muestra las
correlaciones de orden cero, semiparcial y parcial. Los
valores del coeficiente de correlacin van de -1 a 1. El
signo del coeficiente indica la direccin de la relacin
y su valor absoluto indica la fuerza de la relacin. Los
valores mayores indican que la relacin es ms
estrecha.

Diagnsticos de colinealidad. Muestra las tolerancias
para las variables individuales y una variedad de
estadsticos para diagnosticar los problemas de
colinealidad. La colinealidad (o multicolinealidad) es
una situacin no deseable en la que una de las
variables independientes es una funcin lineal de
otras variables independientes.

Residuos. Este recuadro nos permite seleccionar una
de las opciones:

- Durbin-Watson: Muestra la prueba de D-W para los
residuos correlacionados serialmente. ste estadstico
oscila entre 0 y 4 y toma el valor 2 cuando los
residuos son completamente independientes. Los
valores mayores de 2 indican autocorrelacin positiva
y los menores de 2 autocorrelacin negativa. Suele
asumirse que los residuos son independientes si el
estadstico de D-W est entre 15 y 25. Tambin
muestra estadsticos de resumen para los residuos y
los valores pronosticados.

- Diagnsticos por caso: Genera diagnsticos por
casos, para todos los casos que cumplan el criterio de
seleccin (los valores atpicos por encima de n
desviaciones tpicas).




Ejemplo en SPSS

En el men Analizar/Regresin/lineal se estiman
los coeficientes de la recta de regresin que mejor se
ajusta a la nube de puntos (segn el criterio de los
mnimos cuadrados) para dos variables cuantitativas








Al darle clic nos aparecer el siguiente cuadro de
dialogo, observe que en estadsticos se calculan, por
defecto, las estimaciones de los coeficientes y la
bondad de ajuste, pero existen ms opciones




Como resultado de este procedimiento se obtiene
informacin sobre la estimacin de los coeficientes
de la recta y la bondad de ajuste.



Practica 4
Objetivo de la prctica: que el alumno aprenda a
hacer tablas de doble entrada, grficas de dispersin,
covarianzas, segmentar archivos, etc.
Utilizando la informacin del fichero practica.sav,
responda las siguientes cuestiones:
1. Obtenga la distribucin conjunta para las
variables de Comunidad Autnoma de residencia
y nivel de estudios, y para los variables estado
civil y sexo. Seale el porcentaje de:
a) Individuos que residen en Murcia
b) Individuos que residen en Murcia entre los que
tienen un nivel de estudios medio
c) Individuos que residen en Murcia entre los que
tienen un nivel de estudios medio
d) Mujeres
e) Mujeres casadas
f) Mujeres entre los individuos casados

2. Halle la distribucin, en forma de frecuencias
relativas, del tipo de contrato para los individuos
que tengan con un nivel de estudios medio.
Reptalo para los individuos con un nivel de
estudios alto o muy alto.
3. En el caso de los hogares de ms de cuatro
miembros, halle la superficie media, mediana y
modal de los pisos. Tambin para esos hogares,
pero solo en la comunidad de Madrid. Cul es el
gasto medio anual en ocio y el intervalo que
agrupa el 50% central de la distribucin.

Das könnte Ihnen auch gefallen