Sie sind auf Seite 1von 188

Flix Calvo Gmez

Tcnicas estadsticas
de investigacin social
Uso y manejo del SPSS-Windows

Pulse

Tcnicas estadsticas
de investigacin social
Uso y manejo del SPSS-Windows

Flix Calvo Gmez

Tcnicas estadsticas
de investigacin social
Uso y manejo del SPSS-Windows

2008
Universidad de Deusto
Bilbao

Universidad de Deusto
ISBN: 978-84-9830-628-6
Depsito Legal: BI - 2008-08

INDICE
1. MODOS DE ACCEDER AL PROGRAMA SPSS ..................................... ...........1
2. FUNCIONAMIENTO DE LOS FICHEROS O ARCHIVOS .......................... .3
2.1.EXTENSION DE LOS FICHEROS .................................................................................. 3
2.2.ABRIR UN ARCHIVO YA EXISTENTE O CREAR UN NUEVO
FICHERO ........................................................................................................................ 3
2.3.TRABAJAR CON FICHEROS (PROGRAMAS) DE SINTAXIS ................................... 5
2.4.MANIPULAR UN FICHERO DE DATOS ...................................................................... 6
2.4.1. Rellenar un Fichero de Datos ............................................................................... 6
2.4.2. Manejo y Sintaxis para el Etiquetaje de las variables del Fichero
de Datos ............................................................................................................... 7
2.4.3. Manejo y Sintaxis de los Missing Values (Valores Perdidos) ......................... 9

3. TRANSFORMAR DATOS DE UN FICHERO DE DATOS:


RECODIFICACION ...................................................................................................... 11
3.1.RECODIFICAR VARIAS CATEGORIAS DE UNA VARIABLE EN
UNA SOLA CATEGORIA ........................................................................................... 11
3.2.RECODIFICAR DE FORMA IDENTICA VARIAS VARIABLES
(ITEMS O PREGUNTAS) A LA VEZ ......................................................................... 13
3.3.CREAR UNA NUEVA VARIABLE EN BASE A COMBINAR
VALORES DE 2 O MAS VARIABLES ....................................................................... 14

4. ELECCION DE CASOS (SUJETOS) DEL FICHERO DE DATOS PARA


OPERAR CON ELLOS................................................................................................. 17
4.1.SELECCION DE CASOS ............................................................................................... 17
4.2.SEGMENTAR EL FICHERO ......................................................................................... 19

5. CALCULAR NUEVOS VALORES .......................................................................... 20


6. COMO IMPRIMIR Y MODIFICAR LA PRESENTACION
DE RESULTADOS ........................................................................................................ 22
7. GUARDAR UN ARCHIVO MANIPULADO ....................................................... 23
8. CALCULOS ESTADISTICOS ................................................................................... 25
8.1. FRECUENCIAS ............................................................................................................ 25
8.1.0. Formulas y Aplicacin ....................................................................................... 25
8.1.0.1. Frmulas ...................................................................................................... 25
8.1.0.2. Tipo de variables requeridas ........................................................................ 25
8.1.0.3. Utilidades e interpretacin ........................................................................... 25
8.1.1. Manejo del SPSS................................................................................................. 25
8.1.2. Resultados e interpretacin ................................................................................. 28
8.1.3. Ejercicios y Sintaxis ............................................................................................ 30
8.2. DESCRIPTIVOS ........................................................................................................... 34
8.2.0. Formulas y Aplicacin ....................................................................................... 34
8.2.0.1. Frmulas ...................................................................................................... 34
8.2.0.2. Tipo de variables requeridas ........................................................................ 34
8.2.0.3. Utilidades e interpretacin ........................................................................... 34

Universidad de Deusto - ISBN 978-84-9830-628-6

8.2.1. Manejo del SPSS................................................................................................. 35


8.2.2. Resultados e interpretacin ................................................................................. 36
8.2.3. Ejercicios y Sintaxis ............................................................................................ 36
8.3. COMPARAR MEDIAS ................................................................................................ 43
8.3.1. MEDIAS......................................................................................................... 43
8.3.1.0. Frmulas y Aplicacin ................................................................................. 43
8.3.1.0.1. Frmulas ............................................................................................... 43
8.3.1.0.2. Tipos de variables requeridas ................................................................ 43
8.3.1.0.3. Utilidad e interpretacin........................................................................ 43
8.3.1.1. Manejo del SPSS.......................................................................................... 43
8.3.1.2. Resultados e interpretacin .......................................................................... 45
8.3.1.3. Ejercicios y Sintaxis ..................................................................................... 46
8.3.2. PRUEBA T PARA MUESTRAS INDEPENDIENTES................................. 49
8.3.2.0. Frmulas y Aplicacin ................................................................................ 49
8.3.2.0.1. Frmulas ............................................................................................... 49
8.3.2.0.2. Tipos de variables requeridas ................................................................ 49
8.3.2.0.3. Utilidades e interpretacin .................................................................... 49
8.3.2.1. Manejo del SPSS.......................................................................................... 49
8.3.2.2. Resultados e interpretacin .......................................................................... 51
8.3.1.3. Ejercicios y Sintaxis ..................................................................................... 51
8.3.3. PRUEBA T PARA MUESTRAS RELACIONADAS .................................... 58
8.3.3.0. Frmulas y Aplicacin ................................................................................. 58
8.3.3.0.1. Frmulas ............................................................................................... 58
8.3.3.0.2. Tipos de variables requeridas ................................................................ 58
8.3.3.0.3. Utilidades e interpretacin .................................................................... 58
8.3.3.1. Manejo del SPSS.......................................................................................... 58
8.3.3.2. Resultados e interpretacin .......................................................................... 60
8.3.3.3. Ejercicios y Sintaxis ..................................................................................... 61
8.4. TABLAS DE CONTINGENCIA ................................................................................. 67
8.4.0. Formulas y Aplicacin ....................................................................................... 67
8.4.0.1. Frmulas ...................................................................................................... 67
8.4.0.2. Tipo de variables requeridas ........................................................................ 69
8.4.0.3. Utilidades e interpretacin ........................................................................... 69
8.4.1. Manejo del SPSS................................................................................................. 70
8.4.2. Resultados e interpretacin ................................................................................. 71
8.4.3. Ejercicios y Sintaxis ............................................................................................ 74
8.5. NEUTRALIZACIN DE VARIABLES ..................................................................... 79
8.5.0. Formulas y Aplicacin ....................................................................................... 79
8.5.0.1. Frmulas ...................................................................................................... 79
8.5.0.2. Tipo de variables requeridas ........................................................................ 79
8.5.0.3. Utilidades e interpretacin ........................................................................... 79
8.5.1. Manejo del SPSS................................................................................................. 79
8.5.2. Resultados e interpretacin ................................................................................. 82
8.5.3. Ejercicios y Sintaxis ............................................................................................ 84
8.6. ANOVA DE UN FACTOR ........................................................................................... 91
8.6.0. Formulas y Aplicacin ....................................................................................... 91
8.6.0.1. Frmulas ...................................................................................................... 91
8.6.0.2. Tipo de variables requeridas ........................................................................ 93
8.6.0.3. Utilidades e interpretacin ........................................................................... 94
8.6.1. Manejo del SPSS................................................................................................. 94
8.6.2. Resultados e interpretacin ................................................................................. 96
8.6.3. Ejercicios y Sintaxis ............................................................................................ 98

Universidad de Deusto - ISBN 978-84-9830-628-6

8.7. ANOVA DE DOS FACTORES .................................................................................. 106


8.7.0. Formulas y Aplicacin ..................................................................................... 106
8.7.0.1. Frmulas .................................................................................................... 106
8.7.0.2. Tipo de variables requeridas ...................................................................... 106
8.7.0.3. Utilidades e interpretacin ......................................................................... 107
8.7.1. Manejo del SPSS............................................................................................... 107
8.7.2. Resultados e interpretacin ............................................................................... 111
8.7.3. Ejercicios y Sintaxis .......................................................................................... 113
8.8. CORRELACION ........................................................................................................ 120
8.8.0. Formulas y Aplicacin ..................................................................................... 120
8.8.0.1. Frmulas .................................................................................................... 120
8.8.0.2. Tipo de variables requeridas ...................................................................... 120
8.8.0.3. Utilidades e interpretacin ......................................................................... 121
8.8.1. Manejo del SPSS............................................................................................... 121
8.8.2. Ejercicios, resultados e interpretacin .............................................................. 125
8.9. REGRESIN MLTIPLE Y REGRESIN LINEAL ........................................... 129
8.9.0. Formulas y Aplicacin ..................................................................................... 129
8.9.0.1. Frmulas .................................................................................................... 129
8.9.0.2. Tipo de variables requeridas ...................................................................... 130
8.9.0.3. Utilidades e interpretacin ......................................................................... 130
8.9.1. Manejo del SPSS............................................................................................... 130
8.9.2. Ejercicios, resultados e interpretacin .............................................................. 137
8.10. FIABILIDAD DE LOS TEST .................................................................................. 145
8.10.0. Formulas y Aplicacin ................................................................................... 145
8.10.0.1. Frmulas ................................................................................................. 145
8.10.0.2. Tipo de variables requeridas ................................................................... 145
8.10.0.3. Utilidades e interpretacin ...................................................................... 145
8.10.1. Manejo del SPSS............................................................................................. 146
8.10.2. Ejercicios, resultados e interpretacin ............................................................ 149

BIBLIOGRAFIA ........................................................................................................... 161


CODIGOS DE INTERPRETACIN .................................................................... 168

Universidad de Deusto - ISBN 978-84-9830-628-6

Universidad de Deusto - ISBN 978-84-9830-628-6

1. MODOS DE ACCEDER AL PROGRAMA SPSS15.0


Para abrir el programa SPSS se debe colocar el puntero del ratn en Inicio situado en la parte
inferior izquierda de la pantalla original y PULSAR una vez, despus se PULSA en la opcin
Todos los Programas, a continuacin en la opcin SPSS para Windows y por ltimo en SPSS
para Windows con lo cual el programa entre en funcionamiento. En la Fig. 1 el procedimiento es
ms sencillo puesto que tras PULSAR en Inicio, la opcin SPSS15 es directamente ofertada y, por
tanto, tras PULSAR sobre ella el programa est disponible y en funcionamiento.
Figura 1.

La primera ventana de dilogo que ofrece el programa (Fig. 2) ofrece la posibilidad de Ejecutar el
tutorial, Introducir datos (crear un archivo de datos), ..., Abrir una fuente de datos existente
como en este caso el fichero CITEC.sav.

1
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 2.

Este fichero, que queda coloreado cuando se PULSA una vez sobre l, se abrir cuando se PULSA
dos veces inmediatamente seguidas sobre l o se PULSA sobre el botn Aceptar. Entonces
aparecern (Fig. 3) todos los datos y las variables que contiene en la pantalla principal del SPSS
llamada Editor de datos SPSS que va precedida del nombre del fichero, en este caso CITEC.
Figura 3.

Es importante sealar que pueden suceder dos cosas en la ventana inicial del SPSS expuesta en la
Fig. 2. Una, que tal ventana no surja puesto que se ha sealado en ella misma la opcin No volver a
mostrar este cuadro de dilogo. En tal caso, debe abrirse el fichero de datos segn se explica ms
adelante en el apartado 2.2. Abrir un Archivo. Otra, que tal fichero de datos no est en la lista
ofrecida. En este caso, se PULSA una vez en la opcin Ms Archivos y se procede de la manera
que se explica en ese apartado 2.2. Abrir un Archivo.

2
Universidad de Deusto - ISBN 978-84-9830-628-6

2. FUNCIONAMIENTO DE LOS ARCHIVOS


2.1. EXTENSIN DE LOS ARCHIVOS
Los archivos del SPSS, como todos los documentos del ordenador tienen una extensin de tres
letras que los identifica. Aqu destacaremos los tres modelos: *.sav, *.spo y *.sps (entendiendo que
el * es un nombre cualquiera del archivo):
*.sav Identifica los archivos de datos, donde aparecen codificadas las respuestas de los
sujetos a los tems/preguntas de un determinado cuestionario. Contiene, por tanto, datos
numricos o alfanumricos (letras).
*.spo Identifica los archivos de resultados, donde aparecen las operaciones y resultados que
el programa ha efectuado al pedirle que ejecute alguna operacin mediante los comandos
adecuados.
*.sps Identifica los archivos de sintaxis, es decir, los archivos donde pueden escribirse toda
una serie de rdenes escritas para que el programa las ejecute y puedan desde modificarse los
archivos de datos hasta conseguir los resultados estadsticos solicitados.
2.2. ABRIR UN ARCHIVO YA EXISTENTE O CREAR UN NUEVO ARCHIVO
Si ya se ha trabajado anteriormente con el SPSS y se dispone de archivos bien de datos, bien de
resultados o bien de sintaxis, es muy sencillo acceder a cualquiera de ellos. Por ejemplo, Fig. 4,
basta con PULSAR en el botn superior izquierdo Archivo, posteriormente en la opcin Abrir y
despus en Sintaxis.
Se abrir una ventana de dilogo, Fig. 5, donde aparecern en el directorio o subdirectorio
correspondiente toda una serie de archivos de sintaxis, de los cuales se elige el que se desea (en este
caso, SintaxisEtiquetaje) tan solo PULSAndo sobre su nombre y despus pulsando en el botn
Abrir con lo cual aparecer el contenido del archivo (Fig. 6).
Figura 4.

3
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 5.

Figura 6.

Si se quiere crear un nuevo archivo bien de datos, bien de resultados o bien de sintaxis la forma de
realizarlo es parecida al anterior pero una vez pulsado en el botn Archivo se PULSA a
continuacin en la opcin Nuevo y posteriormente se elige el tipo de archivo que se desea, en este
caso, Datos (Fig. 7)
Figura 7.

Lgicamente, el fichero de datos abierto est vaco y, por tanto, en disposicin para que se
introduzcan los datos as como las caractersticas de las variables (Fig. 8).

4
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 8.

2.3. TRABAJAR CON FICHEROS (PROGRAMAS) DE SINTAXIS


El programa estadstico SPSS est diseado para que el usuario pueda elegir en la pantalla aquellos
tipos de clculos que le sean necesarios. Para ello, el programa va ofreciendo progresivamente
ventanas de dilogo sobre las cuales el usuario, a travs del manejo del ratn y el puntero,
seala lo que le interesa hasta finalizar ordenando al programa que ejecute los clculos solicitados.
Los ficheros o programas de sintaxis son un conjunto de rdenes informticas que realizan
directamente los clculos estadsticos sin necesidad de que el usuario trabaje con el ratn
eligiendo paso a paso de entre las ofertas que aparecen en la pantalla. Se trata, por tanto, de
paquetes de rdenes, construidas en base a un lenguaje (vocablos) muy preciso y que suelen ser
muy breves. Es el caso, por ejemplo, del clculo de medias, desviacin tpica, etc. cuyas rdenes se
exponen en la Fig. 9.
Figura 9.

La primera orden Get file="c:\Personal\Libroestad\libro3\Fichelib\Escuel.sav"/Keep=all. hace


entender al programa donde se encuentra (directorio, subdirectorio, etc.) el fichero de datos sobre el
que tiene que trabajar. Es una orden bsica y siempre necesaria. Obviamente cada usuario debe
saber dnde se encuentra el fichero de datos con el que trabajar.
La segunda Descriptives le indica que se trata del clculo de medias. La siguiente, Variables=v10
indica sobre qu variable se desea calcular la media y la ltima /Statistics=Mean Stddev Variance
Min Max. concreta los estadsticos que se solicitan: media, desviacin tpica, varianza, valor mximo
y valor mnimo respectivamente.
La forma de hacer funcionar los programas de sintaxis es ciertamente fcil. En primer lugar, se
sombrean las rdenes del programa (pulsando el puntero y pasndolo por encima de las rdenes),
despus se PULSA en el botn superior Ejecutar y, posteriormente en la opcin Seleccin tal y
como aparece en la Fig. 10.
5
Universidad de Deusto - ISBN 978-84-9830-628-6

Esta forma operativa de hacer funcionar los programas de sintaxis siempre va a ser la misma sean
cuales sean las rdenes escritas. Por tanto, a lo largo del libro se har referencia a la Fig. 10 para
recordar la forma por la que se pueden obtener los diferentes resultados estadsticos solicitados.
Figura 10.

2.4. MANIPULAR UN FICHERO DE DE DATOS


2.4.1. Rellenar el Fichero de Datos
Este es un apartado fundamental para conocer en todo momento qu datos se tienen y qu
caractersticas poseen las variables incluidas en el fichero de datos. Tambin es importante para la
presentacin en pantalla tanto de los datos como de las variables as como para la esttica y
presentacin de los resultados que se obtendrn al ejecutar los distintos comandos.
La clave est en la parte inferior izquierda de la pantalla donde en principio aparecen todos los
datos del archivo (Fig. 3) donde se ofrecen dos posibilidades: Vista de Datos y Vista de Variables.
En la Fig. 11 se ha elegido Vista de Variables.
Figura 11.
Como puede apreciarse se puede
acceder al etiquetaje de las
variables, es decir, dar nombre o
ttulo a la variable, quitar valores
perdidos (missing) en el caso de que
los haya, definir y poner nombre a
los valores de las categoras o
grupos de diferentes variables
nominales, establecer la anchura de las columnas, decidir el nmero de decimales con los que se
quiere trabajar y determinar la medida de las variables: sin son nominales, ordinales o de escala
(cuantitativas).
En la Fig. 12 puede verse un ejemplo realizado con el fichero Citec.sav en el que aparecen
sealados en cada variable tanto el Tipo, la Anchura, los Decimales, la Etiqueta o nombre/ttulo
de cada variable (se sugiere que sean nombres cortos preferentemente con ocho dgitos como
mximo), los Valores que contiene esa variable (cuando son variables cuantitativas aparecer
escrito Ninguno y cuando son variables nominales aparecer el nombre de la primera de las
categoras de esa variable, por ejemplo en la variable Edad, que tiene cuatro categoras, aparece el
nmero de la primera categora, el 1, y despus de la coma aparece su nombre 15-24), los valores
Perdidos, que en este ejemplo aparece Ninguno es decir no se considera ningn valor como
perdido o missing, las Columnas cuyo nmero debe coincidir con el de Anchura o ser mayor, la
Alineacin o sea si el nmero comienza en la derecha, se coloca centrado o a la izquierda de la
casilla, y, por ltimo la Medida donde se especifica si se trata de una variable nominal, ordinal o
de escala.
6
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 12.

Para realizar por primera vez estas especificaciones y estas escrituras de nombres, etiquetas, etc.
basta con situar el puntero del ratn en la casilla correspondiente (segn la variable o lnea en
cuestin y la columna adecuada) que estar en blanco y PULSAR dos veces inmediatamente
seguidas (doble clic). Una vez que se realiza este doble clic aparecer la ventana de dilogo
particular en la que podr escribirse todo lo necesario. La misma operacin se realizar casilla a
casilla hasta que todas las variables estn etiquetadas, con valores perdidos, con la anchura que se
desee, etc.
Cuando se desee modificar el contenido de algunas casillas, en particular aquellas definidas por
nmeros, basta con colocar el puntero del ratn en esa casilla y se PULSA una sola vez apareciendo
a mano derecha un pequeo recuadro con una flecha hacia arriba y otra hacia abajo con el fin de
aumentar o disminuir el nmero existente. (Fig. 13). Tras realizar en ella los cambios pertinentes
(en la variable Nacin cambiar la anchura a 4) basta con colocar el ratn en otra casilla y PULSAR
en ella con lo cual quedar recogido el cambio anterior.
Figura 13.

Cuando se PULSA en cualquier casilla de las columnas Alineacin o Medida aparece a mano
derecha una sola flecha hacia abajo donde se ofrecen las alternativas que se pueden elegir. Y
cuando se PULSA en alguna casilla de la columna Etiqueta no aparece nada porque directamente
puede escribirse sobre ella.
2.4.2. Manejo y Sintaxis para el Etiquetaje de las variables del Fichero de Datos
A veces, un determinado fichero de datos puede no tener etiquetadas sus variables, es decir, las
variables no tienen nombre ni tampoco tienen nombre sus distintas categoras si se trata de una
variable discreta o categrica. En ese caso, el manejo del programa es el siguiente.
En primer lugar se abre el fichero de datos, por ejemplo el fichero Escuel-00.sav y aparecer en
pantalla. Posteriormente, se acude a la variable que se quiere etiquetar, por ejemplo, la v34 y se
7
Universidad de Deusto - ISBN 978-84-9830-628-6

escribe en la columna Etiqueta el nombre de la variable, en este caso Sexo, como aparece en la
Fig. 14. A continuacin, se escribe el nombre de las dos categoras incluidas en esa variable: los 1
representan a los Hombres y los 2 a las Mujeres. Para ello, se PULSA en la columa Valores y
aparecer la ventana de dilogo donde se colocan el valor del dgito de la categora y la Etiqueta
(nombre) de esa categora tal y como aparece en la Fig. 15. Tras PULSAR en Aadir los datos
quedarn recogidos y se trasladarn al cuadro central en blanco como aparece en la Fig. 16.
Figura 14.

Figura 15.

Figura 16.

Cuando se han etiquetado todas las categoras de la variable basta con PULSAR en Aceptar para
que quede grabado en el fichero correspondiente.
Con este procedimiento, pueden rellenarse todas las etiquetas de las categoras de las variables
nominalaes as como los nombres de los valores incluidos en cada una de esas variables. Como las
variables cuantitativas (de escala) no tienen categoras tan slo ser necesario etiquetar el nombre
de la variable.
La sintaxis, es decir, la serie de rdenes para los casos de etiquetaje de las variable de cualquier
fichero de datos es ciertamente sencilla. La Fig. 17 ofrece un ejemplo de cmo se puede realizar el
proceso en el caso del ejemplo anterior.
8
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 17.

En el programa aparece la primera lnea de rdenes Get file... con lo cual el programa entiende a
qu fichero de datos se refiere (Escuel-00.sav) y en qu subdirectorio del ordenador se encuentra
c:\Personal\Libroestad\libro3\Fichelib\. La orden var labels acoge el nombre de la variable y la
orden value labels acoge los nombres, en este caso, de las dos categoras de esa variable.
Obviamente, lo mismo podra hacerse con cualquier otra variable nominal.
Deben tenerse muy en cuenta en todos los programas de sintaxis el tipo de signos que se deben
utilizar como por ejemplo las comillas (), el signo (`), los espacios en blanco entre palabras, el
punto al final de cada lnea y al final del programa. Si no se hace as, el programa indicar
ERROR! cuando se ejecute.
Para ejecutar el programa de sintaxis es necesario en primer lugar sombrear las rdenes operativas
(no as el ttulo del programa: PROGRAMA PARA EL ETIQUETAJE DE VARIABLES Y
CATEGORIAS), despus PULSAR Ejecutar y finalmente PULSAR en la opcin Seleccin como
indica la Fig. 18.
Figura 18.

El programa se ejecutar y en el Fichero de Datos Escuel-00.sav aparecer el nombre Sexo en el


apartado Etiqueta de la v34 as como las dos categoras en el apartado Valores.

2.4.3. Manejo y Sintaxis de los Missing Values (Valores Perdidos)


Suele ser muy frecuente ofrecer en las preguntas de los cuestionarios (o test o escalas, etc) la
posibilidad de responder No Sabe/No Contesta. Obviamente, cuando se quieren conocer los
estadsticos de las respuestas vlidas, es decir, de aquellas diferentes al No Sabe/No Contesta deber
darse la orden de que stas no sean contabilizadas. En el caso, por ejemplo, de la v1 en el fichero
Salud-00.sav existe el valor 0 que corresponde a NS/NC y no se desea que entre en los clculos.
Para ello, basta con abrir el fichero de datos y PULSAR en la columna Perdidos correspondiente
a la v1 tal y como aparece en la Fig. 19.
9
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 19.

Aparecer la siguiente ventana de dilogo (Fig. 20) donde se debe sealar la opcin Valores
perdidos discretos y escribir el valor 0. Posteriormente es necesario PULSAR en Aceptar para
que la orden se haga efectiva.
Figura 20.

La serie de rdenes de la sintaxis para los valores perdidos es muy breve, como se indica en la Fig.
21 utilizando el ejemplo anterior
Figura 21.

En el propio fichero de datos aparecer efectivamente el 0 como valor perdido en la variable v1


como se ve en la Fig. 22.
Figura 22.

Si en lugar de tener un valor perdido se tienen dos o tres (no ms) , la orden sera:
missing value v1 (0,7).

10
Universidad de Deusto - ISBN 978-84-9830-628-6

De la misma forma, si se quieren eliminar ciertos valores, por ejemplo, del 1 al 5 basta con colocar
en el parntesis la orden (1 thru 5). Por ltimo si se quiere eliminar un valor determinado y, adems,
un intervalo de valores, tal y como el 0 y desde el 2 al 5 la orden sera
missing value v1 (0,2 thru 5).

3. TRANSFORMAR DATOS DE UN FICHERO DE DATOS


El SPSS ofrece mediante el botn Transformar toda una serie de posibilidades para responder a
los condicionantes propuestos en los diversos clculos. Si se quiere calcular, por ejemplo, la media
de una variable teniendo en cuenta a toda la muestra no se imponen condiciones o restricciones a
los datos (salvo los missing values en cada variable). Sin embargo, si se desea calcular esa
medida slo entre los hombres, o slo entre las mujeres..., en estos casos deber ser indicado al
ordenador la condicin que debe cumplirse. Particularmente importante es el proceso de
remodificacin cuando se quiere reducir el nmero de categoras de que consta una determinada
variable.
3.1. RECODIFICAR VARIAS CATEGORAS DE UNA VARIABLE EN UNA SOLA
CATEGORA.
Por ejemplo, recodificar la v25, denominada Religin, del fichero de datos Campaa-00.sav
que presenta 8 categoras en slo dos categoras con las siguientes condiciones: la nueva categora 1
agrupara a las categoras antiguas: 1 Muy buen catlico, 2 Catlico practicante, 3 catlico no muy
practicante y 4 catlico no practicante, y la nueva categora 2 agrupara a las categoras antiguas: 5
Indiferente, 6 Ateo, 7 Creyente de otra religin y 8 Otros. Estas dos nuevas categoras
(denominadas 1 Catlicos y 2 No catlicos formarn una nueva variable en el fichero de datos
con el nombre de Religion Recod.
Para ello, una vez abierto el fichero, se PULSA en Transformar y posteriormente en la opcin En
distintas variables (si se elige la opcin de En las mismas variables se corre el riesgo de perder
los datos originales de esa variable) como indica la Fig. 23
Figura 23.

La nueva ventana de dilogo (Fig. 24) permite recodificar el ejemplo propuesto de la forma
siguiente

11
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 24.

En la parte superior derecha est el recuadro titulado Variable de resultado donde hay dos
pequeos recuadros blancos, uno para el Nombre de la nueva variable que se va a crear (en este
caso, v27) y el otro para la Etiqueta (ReligionRecodificada). Tras PULSAR en el botn Cambiar
(atencin: el nombre de la variable debe tener todas las letras o nmeros seguidos sin espacio en
blanco) y posteriormente en el botn Valores antiguos y nuevos aparecer una nueva pantalla
donde se indicarn las rdenes para hacer efectiva la recodificacin como se puede ver en la Fig.
25.
Figura 25.

Efectivamente, la primera orden se realiza pulsando en el botn Rango y escribiendo el 1 en el


primer recuadro en blanco y despus el 4 en el recuadro debajo de hasta y pulsando despus en el
botn Valor (debajo del recuadro Valor nuevo) y escribiendo el nuevo dgito, que en este caso es el
1. Para hacer efectivo estos cambios se deber PULSAR despus en el botn Aadir y quedar
fijado en el recuadro en blanco con el ttulo de Antiguo Nuevo. Tras concluir todos los cambios,
la ventana quedar como en la Fig. 26.

12
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 26.

Finalmente, para culminar la operacin basta con PULSAR en el botn inferior Continuar y, en
efecto, el fichero de datos Campaa-00.sav tendr la nueva variable v27 con su etiqueta, como
puede verse en la Fig. 27.
Figura 27.

Toda esta operacin puede realizarse mediante la adecuada sintaxis o serie de ordenes tal y como
aparece en la Fig. 28 y siguiendo los pasos necesarios para su ejecucin como se explica al final del
apartado 1 (es decir, sombreando las rdenes, pulsando en ejecutar y posteriormente pulsando en
seleccin) y se puede ver en la Fig. 7.
Figura 28.

3.2. RECODIFICAR DE FORMA IDNTICA VARIAS VARIABLES (TEMS O


PREGUNTAS) A LA VEZ.
En muchas ocasiones es necesario recodificar de la misma manera a varias variables o preguntas de
un determinado cuestionario. Se puede poner como ejemplo, el querer recodificar la v22, v23, v24 y
v25 del fichero Drogode-00.sav creando en cada una de ellas tres grupos: el 1 abarca todos los
valores del 1 al 5, el 2 abarca del 6 al 9 y el tercer grupo recoge a los missing values, es decir,
quienes hayan contestado 0 (NS/NC). .
13
Universidad de Deusto - ISBN 978-84-9830-628-6

Para realizar esta tarea se pueden seguir los pasos explicados en el apartado anterior utilizando la
opcin Transformar, En distintas variables, etc.
Pero utilizando el adecuado programa de sintaxis se puede hacer de forma ms rpida y sencilla. La
serie de rdenes aparecen en la Fig. 29.
Figura 29.

El programa de sintaxis, como se puede apreciar es muy sencillo porque todos los valores entre 1 y
5 quedan renumerados con el valor 1, los entre 6 y 9 con el valor 2, los de valor 0 quedan iguales.
Las nuevas variables, por otra parte, quedan etiquetadas, as como tambin quedan etiquetadas en
cada una de ellas las tres categoras Desacuerdo, Acuerdo y NS/NC especificando, por
ltimo, que el valor cero es missing value (valor perdido) como aparece en la Fig. 30..
Figura 30.

3.3. CREAR UNA NUEVA VARIABLE EN BASE A COMBINAR VALORES DE 2 O


MS VARIABLES.
Un ejemplo de este caso puede ser el de crear una nueva variable en el fichero Salud-00.sav
basndose en la variable v2 (Abandonar los estudios: 1=No 2=S 0=NS/NC) y en la v23
(Detenido por la polica: 1=S 2=No 0=NS/NC) de forma que se formen cinco grupos diferentes
caracterizados de la siguiente manera:
- grupo 1: No abandono y S detenido
- grupo 2: No abandono y No detenido
- grupo 3: S abandono y S detenido
- grupo 4: S abandono y No detenido
- grupo 5: Los que contestan 0 en cualquiera de las dos variables

14
Universidad de Deusto - ISBN 978-84-9830-628-6

La sintaxis, como puede apreciarse en la Fig. 31 es fcil teniendo en cuenta que a la nueva variable
creada se le adjudica el nombre de Vnueva
Figura 31.

Los cambios, efectivamente, se han producido en el fichero (Fig. 32) tanto en la creacin de la
Vnueva como en las etiquetas de las categoras (Fig. 33)
Figura 32.

Figura 33.

Se puede exponer otro ejemplo un tanto ms complicado con el fin de ofrecer otras alternativas de
rdenes en la sintaxis. Supongamos que del fichero Drogode-00.sav se desean formar cuatro
grupos de sujetos en base a tres variables: la v4 Nivel de estudios (1=Bsicos 2=Medios
3=Universitarios), la v5 Edad (1=Menos de 25 aos 2=Entre 26 y 35 aos 3=Entre 36 y 45 aos
4=Entre 46 y 55 aos y 5=Ms de 56 aos) y la v8 yonki que se droga diariamente (que se
responde eligiendo un valor que va desde el 1=Nada toxicmano hasta el 9=Muy toxicmano) con
las siguientes caractersticas:
15
Universidad de Deusto - ISBN 978-84-9830-628-6

- grupo 1: Universitario, menor de 36 aos y no considera al yonki toxicomano (es decir, en la


pregunta v8 responde con un valor de 4 o menos).
- grupo 2: Bsicos, mayor que 45 aos y considera al yonki muy toxicmano (responde con
una puntuacin de 6 o ms).
- grupo 0: El resto de sujetos que no cumplen las condiciones anteriores y aquellos con
respuesta NS/NC en cualquiera de las tres variables
Figura 34.

Como se puede apreciar en la Fig. 34, las dos primeras rdenes corresponden respectivamente al
grupo 1: universitarios, menores de 36 aos y puntuando al yonki como toxicmano con un valor
menor que 5 (la orden es: if ((v4=3) and (v5<3) and (v8<5)) V=1.
El grupo 2 lo constituyen aquellos sujetos de estudios Bsicos, mayores de 45 aos y puntuando la
toxicomana del yonki con un valor de 6 o ms (la orden es if ((v4=1) and (v5>3) and (v8>5)) V=2.
El grupo 0, o grupo tercero, lo constituyen todos aquellos sujetos distintos a los anteriores. Y ello,
se puede producir por algunas de las siguientes razones:
- han contestado NS/NC a alguna de las tres variables (la orden es if ((v4=0) or (v23=0) or
(v8=0)) V=0.
- son sujetos con estudios bsicos: la orden es if (v4=2) V=0.
- son universitarios pero tienen 36 aos o ms: la orden es if ((v4=3) and (v5>2)) V=0.
- son universitarios, tienen menos de 36 aos pero puntuan a los yonkis con un valor de 5 o
ms: la orden es if ((v4=3) and (v5<3) and (v8>4)) V=0.
- los de estudios bsicos pero con 45 aos o menos: la orden es if ((v4=1) and (v5<4)) V=0.
- los de estudios bsicos, mayores de 45 aos pero con puntuacin al yonki menor de 6: la
orden es: if ((v4=1) and (v5>3) and (v8<6)) V=0.
Todas estas rdenes se exponen para visualizar los distintos grupos que se pudieran crear en base a
las muy distintas combinaciones y, por tanto, poder comparalos entre ellos para obtener las
conclusiones pertinentes. Cuando existe entre las variables de un determinado archivo una variable
que recoja distintos pases, el construir distintos grupos segn sean los pases (junto con una o dos
caractersticas ms) es muy til e interesante. Lo mismo podra decirse cuando se tiene la variable
Clase Social o la variable Edad o la variable Ideologa Poltica o cualquier tipo de variable donde se
mida el mayor o menor acuerdo con alguna determinada cuestin u otras varias porque la
informacin aportadas y las diferencias que se puedan producir son altamente clarificadoras.
A modo de complemento se ofrecen otras dos rdenes de sintaxis con el fin de aadir otras formas
de programar pero aclarando que las variables utilizadas son genricas y no se refieren al ejemplo
utilizado anteriormente, as como Vxx es el nombre de una variable ficticia.
16
Universidad de Deusto - ISBN 978-84-9830-628-6

if ((v3=1 or v3=2) and (v10=1) and (v1=1) Vxx=1


if (v5<4 and v3=1) and (v6=1)) Vxx=2
En cualquier caso, si slo interesa, como en este ejemplo, distinguir dos grupos principales y en el
tercero juntar a todos los dems sujetos, las rdenes son ciertamente breves y sencillas
Get file="c:\Personal\Libroestad\libro3\Fichelib\Drogode-00.sav"/Keep=all.
if ((v4=3) and (v5<3) and (v8<5)) V=1.
if ((v4=1) and (v5>3) and (v8>5)) V=2.
Recode
V (sysmis=0) (1=1) (2=2) into V_1.

Las dos primeras lneas de rdenes son iguales que las de la Fig. 34. Despus se aplica un Recode
para crear una nueva variable, aqu designada como V_1, donde aparezcan claramente los 1 y los 2,
y a todos los dems sujetos se les asigne el valor 0 (sysmis=0) con lo cual la nueva variable V_1
slo tendr esos tres grupos, los cuales debern ser etiquetados debidamente.
ATENCIN: Es importante hacer notar que cuando a un determinado fichero de datos se le aade
una nueva variable mediante la sintaxis de recodificacin en una nueva variable, el SPSS ofrece
como resultado un nuevo fichero de datos que lo denomina Sin ttulo y, por ello, es necesario
adjudicarle un ttulo que, en numerosas ocasiones, puede ser el mismo ttulo que el del fichero
original, aunque por precaucin conviene llamarlo de otra manera distinta al del original, en ese
caso podra ser Drogode-01.sav.

4. ELECCION DE CASOS (SUJETOS) DEL FICHERO DE DATOS PARA


OPERAR CON ELLOS.
4.1. SELECCIN DE CASOS
Este operador permite seleccionar un grupo o categora concreta de una variable. Por ejemplo, el
grupo de Hombres en la variable Sexo, los de clase social baja en la variable Clase Social, los de
Espaa en la variable Pas, los de entre 15-24 aos en la variable Edad, los que estn de acuerdo en
una determinada variable (pregunta o item), etc.
Para acceder a esta opcin es necesario dirigirse en el Fichero de Datos al botn Datos situado en la
parte superior, PULSARLO y posteriormente PULSAR Seleccionar casos, como se ve en la Fig.
35:
Figura 35.

17
Universidad de Deusto - ISBN 978-84-9830-628-6

Al acceder a esta opcin aparece en pantalla la siguiente ventana de dilogo (Fig. 36)
Figura 36.
En esta ventana, la opcin ms usual suele
ser la titulada Si se satisface la condicin.
Una vez elegida, tras pulsar dentro del
pequeo circulo blanco se PULSA El botn
Si... apareciendo el cuadro de dilogo donde
se establecen las condiciones.
El siguiente paso (Fig. 37) ser indicar qu
condicin concreta se quiere satisfacer de
entre las muchas posibles. Aqu se elige una
sencilla: que v8=1 dado que este es el dgito
representativo de aquellos que tienen Menos
de 15 aos de Educacin en la variable v8
Aos de Educacin. Para ello, es necesario
PULSAR una vez sobre esa variable v8
situada en el recuadro grande de la izquierda
donde se muestran todas las variables y
PULSAR despus el pequeo recuadro con la
flecha hacia la derecha para que esa variable se site en el rectngulo en blanco. Despus se elige el
signo que se necesite, en este caso el signo =. Por ltimo, se elige el nmero 1. Todo ello ir
apareciendo sucesivamente en el rectngulo blanco. Tras PULSAR en Continuar se volver al
cuadro de dilogo de la Fig. 37. en la que se debe PULSAR en Aceptar para que el programa
ejecute esa seleccin.
Figura 37.

El significado de los diversos signos ofrecidos es el siguiente:


=
Se selecciona slo este grupo.
>
Se seleccionan todos aquellos grupos cuyo dgito de codificacin sea mayor que el
indicado.
<
Se seleccionan todos aquellos grupos cuyo dgito de codificacin sea menor que el
indicado.

Se seleccionan aquellos grupos con dgito igual o mayor que el indicado.

Se seleccionan aquellos grupos con dgito igual o menor que el indicado.


=
Se seleccionan aquellos grupos que no estn codificados con el dgito indicado.
&
Acumula dos condiciones. Por ejemplo, v8 = 2 & v8 = 3 cuyo significado es que se
seleccionan todos aquellos grupos que no sean igual a 2 ni tampoco igual a 3.

18
Universidad de Deusto - ISBN 978-84-9830-628-6

Existe tambin en el recuadro de la derecha titulado Funciones, toda una amplia gama de
posibilidades para ejecutar no slo ecuaciones matemtico-estadsticas sino condicionantes de tipo
tiempo, fecha, expresiones alfanumricas, y un amplsimo etctera con el fin de seleccionar aquellos
sujetos que cumplan/no cumplan la condicin establecida.
Toda la operativa anterior puede ejecutarse con una orden de sintaxis muy breve que va escrita
inmediatamente despus de definir sobre qu fichero de datos se va a trabajar:
Get file="c:\Personal\Libroestad\libro3\Fichelib\Citec.sav"/Keep=all.
Select if (v8=1).

Obviamente, la expresin V8=1 puede ser cambiada segn las necesidades de los clculos por
cualquier otro smbolo tal como v8>1, v8=1, etc. segn se expone anteriormente.

4.2. SEGMENTAR EL FICHERO


El proceso de segmentacin de archivo es relativamente similar al anterior, si bien presenta una
diferencia clara: no se elige un nico grupo o categora de una determinada variable, sino que se
eligen a todas las categoras por separado. Esto quiere decir, que se obtendrn los resultados que se
desean para todos y cada uno de los grupos que configuren la variable segmentada. As, por
ejemplo, se puede calcular la media segn la variable Sexo para Hombre o Mujer, mediante la
segmentacin de la variable Sexo (v5) en el fichero Citec-00.sac. Es como si se seleccionara de
manera individual cada uno de los grupos de la variable.
Este operador se obtiene tras PULSAR en el botn superior Datos y tras PULSAR en la opcin
Segmentar archivo (Fig. 38).
Figura 38.

En la nueva ventana de dilogo que aparece (Fig. 39) se seala la opcin Comparar los grupos
(pulsando en el pequeo circulo blanco situado a su izquierda), y, despus, trasladando al
rectngulo en blanco, titulado Grupos basados en:, la variable que se quiere segmentar,
simplemente PULSANDO sobre ella y posteriormente PULSANDO en el pequeo recuadro con la
flecha hacia la derecha.

19
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 39.

Tras PULSA en Aceptar el programa ofrecer todos los resultados estadsticos que se soliciten para
cada uno de los grupos procedentes de la segmentacin.
Debe tenerse muy en cuenta que al imponer la segmentacin no aparece nada indicativo en pantalla
acerca de que el archivo est segmentado, con lo cual se ha de tener mucho cuidado al realizar
posteriores operaciones porque si se desea operar, por ejemplo, con todos los sujetos deber
acudirse primero a la ventana de la Fig. 39, sealar la opcin Analizar todos los casos, no crear
los grupos y despus PULSAR en Aceptar.
Tambin todo este procedimiento, como en el caso de seleccionar casos, puede ser ejecutado a
partir de las rdenes de sintaxis adecuadas, como se expone en el recuadro
Get file="c:\Personal\Libroestad\libro3\Fichelib\Citec.sav"/Keep=all.
Sort cases by v5 .
Split file
Layered by v5 .

5. CALCULAR NUEVOS VALORES


Este operador sirve para crear una nueva variable mediante la suma (o resta, multiplicacin, etc.) de
los valores de otras variables. Se accede a l tras PULSAR en el botn Transformar y
posteriormente PULSANDO en Calcular (Fig. 40)
Figura 40.

20
Universidad de Deusto - ISBN 978-84-9830-628-6

Al igual que sucede con el operador recodificar, es muy importante darse cuenta que se est
generando una nueva variable, por lo que es esencial definirla (nombre de variable, etiqueta y
etiqueta de valores).
En la nueva ventana que aparece (Fig. 41) debe ponerse nombre a esa nueva variable, por ejemplo,
Vtotal, en el rectngulo blanco del extremo superior izquierdo titulado Variable de destino.
Posteriormente se escriben en el rectngulo blanco situado debajo de Expresin numrica las
operaciones que van a definir los nuevos valores Como se ha decidido, en este caso, que Vtotal
contenga la suma de los valores de la v16, la v21 y la v25 se va PULSANDO primero la v16 que
quedar coloreada y se traslada al rectngulo grande blanco PULSANDO en el recuadro con la
flecha hacia la derecha. A continuacin se PULSA en el pequeo botn que contiene el signo + y
automticamente pasa al rectngulo blanco. De la misma forma se procede con las otras dos
variables hasta configurar la expresin v16 + v21 + v25. Finalmente se PULSA en Aceptar y se
habr creado la nueva variable con el nombre de Vtotal.
Figura 41.

Esta nueva variable Vtotal, se encontrar situada en el archivo de datos al final de todas las
variables que lo constituyen y puede ser observada utilizando Vista de datos y acudiendo al final de
las variables (Fig. 42).
Figura 42.

En todo este proceso, normalmente las variables a utilizar son cuantitativas u ordinales y, en
consecuencia, la nueva variable creada tambin tendr carcter cuantitativo u ordinal. En algunos
casos particulares, se pueden sumar los aciertos logrados en un determinado test compuesto de una
batera de tems dicotmicos (acierto o desacierto) para obtener la puntuacin total de aciertos de
cada sujeto. La puntuacin total, lgicamente es cuantitativa aunque proviene de sumandos
nominales o categricos.
21
Universidad de Deusto - ISBN 978-84-9830-628-6

Tambin es conveniente aclarar lo que ocurre cuando el ordenador debe hacer una suma de valores
pero alguno de ellos es missing value, es decir valor perdido. Naturalmente, la suma no puede
llevarse a cabo y no hay, por tanto, puntuacin total resultante. El valor que el ordenador otorga a
esa suma incompleta es System missing o valor perdido por el sistema que es fcilmente
reconocible porque el ordenador coloca en la casilla correspondiente una coma (,).
La sintaxis u rdenes para obtener nuevos valores mediante determinados clculos previos es aqu
particularmente sencilla, como aparece en el recuadro siguiente:
Get file="c:\Personal\Libroestad\libro3\Fichelib\Citec.sav"/Keep=all.
Compute Vtotal=v16+v21+v25

En la formulacin del Compute cabe introducir todo tipo de funciones matemticas, desde las
ms sencillas hasta las ms complicadas. A veces, una determinada variable se quiere hacer valer
ms que las dems, por ejemplo la v21 se la considera que vale el doble que las otras, y entonces la
orden de Compute es =v16+2*v21+v25.

6. COMO IMPRIMIR
RESULTADOS

MODIFICAR

LA

PRESENTACION

DE

En ocasiones se observa que al obtener los resultados, es decir, las tablas o los grficos, etc. no
aparecen completos en pantalla por lo que por ejemplo al imprimir, aquella parte de la tabla que no
se ve en pantalla aparecer en una hoja diferente. Tambin puede ocurrir que se quiera cambiar el
tamao o el estilo de los nmeros, o se quiera cambiar la anchura de las columnas, etc.
Lo primero que se tiene que hacer es seleccionar la tabla que se quiere manipular. Para ello se
PULSA dos veces inmediatamente seguidas sobre la misma. Hecho esto la tabla queda bordeada
con una lnea en forma de dientes de sierra. As mismo tambin se observa que el men de
comandos que aparecen en la parte superior de la pantalla es diferente, comandos con los que se van
a trabajar para la modificacin de la tabla (Fig. 43).
En primer lugar se PULSA en Edicin, posteriormente en Seleccionar y, por ltimo, en Cuerpo de
tabla. Con este paso, la tabla queda ennegrecida y a partir de ah se puede PULSAR en el comando
Formato que ofrece variadas posibilidades de actuacin sobre toda la tabla, sobre las casillas, sobre
las fuentes, sobre el ancho de casillas, sobre el autoajuste, etc.
Figura 43.

Particularmente importante, cuando haya tablas de dimensiones muy amplias y se desea


imprimirlas, es ordenar que tales tablas se ajusten a las dimensiones de la hoja de impresin,
22
Universidad de Deusto - ISBN 978-84-9830-628-6

normalmente Dina A4. Para ello, es preciso dirigirse a esa opcin del men llamada Formato y
dentro de sta a Propiedades de la tabla tras lo cual aparecer la ventana de dilogo siguiente
(Fig.44).
En esta ventana y tras PULSAR en Impresin se sealan las dos opciones de Reducir tabla
ancha para caber en pgina y Reducir tabla larga para caber en la pgina que permitirn el
ajuste tanto a lo ancho como a lo alto de la pgina de impresin.
Dentro de esta misma opcin de Propiedades de tabla, es posible seleccionar otras alternativas tras
PULSAR en Formato de casillas, que permite modificar distintos aspectos de las casillas como
son: el tamao de letra, tipo de letra, alineacin, sombreado, etc.
Figura 44

Si se PULSA en Propiedades de casillas en lugar de Propiedades de tabla se presenta una opcin


interesante cuando se quieren modificar algunos nmeros expresados en la forma por ejemplo 9,32
E0.2 y se quiere cambiar a la forma clsica 0,0932. Se PULSA entonces la opcin Nmero y a la
derecha la opcin #.# adems de elegir en la parte inferior central el nmero de Decimales que se
desee como se aprecia en la Fig. 45 donde se han elegido 3 decimales.
Figura 45.

7. GUARDAR UN ARCHIVO MANIPULADO


Por norma general no se debe guardar un archivo de datos o de resultados o de sintaxis con el
mismo nombre que el original sobre todo si han sido manipulados o se ha cambiado alguna
informacin que ofrecen porque si se hace se perderan los datos reales originales. Por ello, es
23
Universidad de Deusto - ISBN 978-84-9830-628-6

preferible guardar los archivos manipulados desde el men Archivo con la opcin Guardar como,
dndole un nuevo nombre (Fig. 46)
Figura 46.

A la hora de guardar no es necesario indicar el tipo de archivo, ya que viene predeterminado por el
programa. Basta con PULSAR en el botn Guardar
Ser importante indicar al ordenador en que unidad se quiere guardar el archivo: disco duro (C:),
cdrom; etc. En este caso se ha elegido el subdirectorio (C:\Personal\Libroestad\Libro3\Fichelib) y
con el nombre de XXX (se puede poner cualquier otro) como aparece en la Fig. 47.
Figura 47.

24
Universidad de Deusto - ISBN 978-84-9830-628-6

8. CALCULOS ESTADISTICOS
8.1. FRECUENCIAS
8.1.0. Frmulas y Aplicacin
8.1.0.1. Frmulas
Q

Porcentaje p =

f
1

siendo Q = nmero de categoras de una variable. fi = nmero de sujetos de la categora i. N = nmero total de sujetos

8.1.0.2. Tipo de variables requeridas


El clculo de este comando se puede realizar tanto para atributos (variables cualitativas) como para
variables cuantitativas recodificadas o de poca amplitud. Un ejemplo del primer caso es la v2 del
fichero DROGODE.sav (sexo), y en cuanto al segundo encontramos la v43 del fichero
CRIMINO.sav (precio en el que el entrevistado valora lo robado). Esta variable puede ser
recodificada en tres grupos: barato, normal y caro.
En el caso de que la caracterstica objeto de estudio fuera un atributo, no tendra sentido calcular
determinados estadsticos de carcter cuantitativo (varianza, rango, etc.) Para la variable a la que
nos referimos (v2 de DROGODE.sav) deben ser analizadas la distribucin de frecuencias, sus
porcentajes y la moda. Lo ms interesante son la distribucin de frecuencias y los porcentajes,
puesto que nos permiten hacer un primer anlisis de la caracterstica objeto de estudio.
Las variables cuantitativas de poca amplitud (segundo ejemplo del primer prrafo) permiten el
clculo de ms estadsticos que los atributos o variables cualitativas. El programa SPSS permite
obtener, adems de la distribucin de frecuencias y porcentajes, los estadsticos de tendencia central
(media, moda, mediana y suma) y las medidas de dispersin (desviacin tpica, varianza, mximo,
mnimo, etc.)
8.1.0.3. Utilidades e interpretacin
Estos resultados son tiles ya que resumen el comportamiento general de la o la variable. Sirven
esencialmente para iniciar el anlisis de dicha variable, como primera aproximacin. Por encima de
otros resultados, conviene fijarse en los porcentajes, en ocasiones muy ilustrativos de cara a detectar
diferencias entre los grupos de respuesta, etc.
Por supuesto, el programa SPSS permite trabajar con grficos, aunque la poca manejabilidad y
potencia de esta funcin aconsejan el uso de otros programas.
8.1.1. Manejo del SPSS
Como el resto de los comandos para clculos estadsticos se localiza en el men en la opcin
Analizar (Fig. 48). Tras PULSAR en ella debe PULSARSE despus en Estadsticos descriptivos
y finalmente se PULSA en Frecuencias.

25
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 48.

Este comando permitir conocer el porcentaje y el nmero de personas que se posicionan en un


determinado valor o categora de una determinada variable.
La lgica de anejo del programa SPSS es la misma en la mayor parte de los comandos: se colocan
las variables necesarias para el estudio que se est realizando en el cuadro de Variables sealando,
en primer lugar, con el puntero y PULSANDO en esa variable que quedar coloreada y
posteriormente PULSANDO en el pequeo recuadro con la flecha a la derecha para que esa
variable se instale en el gran recuadro en blanco. En el ejemplo que se ve a continuacin (Fig. 49.)
se ha seleccionado del fichero ESCUEL.sav la variable Tcnicas de estudio (v7).
Figura 49.

Si se desea obtener ciertos estadsticos descriptivos como son la moda, mediana, desviacin tpica,
etc. que acompaen a la tabla de porcentajes de esa variable (esto se puede hacer cuando las
variables admiten el tratamiento de variables cualitativas o cuantitativas) se debe PULSAR en
Estadsticos y sealar los que interesan como aparece en la Fig. 50.
Figura 50.

El significado operativo-estadstico de estos conceptos es el siguiente:


Media Valor promedio de los datos (suma de todos ellos dividido por el nmero de datos).
Moda Dato ms frecuente.
26
Universidad de Deusto - ISBN 978-84-9830-628-6

Mediana Dato o valor al que no llega el 50 % de la muestra.


Desviacin tpica La raz cuadrada del promedio de las desviaciones cuadrticas respecto de la
media. En trminos ms simples, lo que se desvan los datos respecto de la media. Varianza es el
cuadrado de la desviacin tpica.
Amplitud Diferencia entre el dato o valor mximo y el valor mnimo.
Cuartil Dato o valor al que no llega el 25 % el 50% el 75% de la muestra.
Percentil Dato o valor al que no llega el 15% el 38% ... de la muestra.
Despus de elegir los estadsticos que interesan, en este caso han sido Media, Mediana, Desviacin
tpica, Varianza, Mnimo y Mximo se PULSA en el botn Continuar y se vuelve a la ventana
principal de dilogo (Fig. 49.).
En esta ventana se puede PULSAR en el botn Grficos y se ofrecern las siguientes posibilidades
(Fig. 51)
Figura 51.

Puede elegirse, efectivamente, un Grfico de barras, Grficos de sectores, Histogramas (eso se


ha pedido en este caso) con o sin Curva normal aadida e incluso puede elegirse la opcin
Ninguno. Los grficos pueden elaborarse o con las frecuencias directas o con los porcentajes
mientras que los histogramas son elaborados en funcin de las frecuencias.
Si, finalmente, en la ventana principal se PULSA el botn Formato (Fig. 49) surgen otra serie de
posibilidades interesantes sobre todo cuando en lugar de solicitar las frecuencias de una sola
variable se piden las de varias a la vez (Fig. 52).
Figura 52.

Cuando se trata de Mltiples variables se puede seleccionar Comparar variables o Organizar


resultados segn variables e incluso Suprimir tablas con ms de XX categoras (el programa
coloca por defecto 10 categoras). Una vez seleccionada la eleccin se PULSA en Continuar y se
vuelve a la ventana principal de dilogo.
En esa ventana principal de dilogo una vez concluida la seleccin de opciones se PULSA en
Continuar y despus en Aceptar segn la Fig. 48.el programa ofrece los resultados solicitados.
27
Universidad de Deusto - ISBN 978-84-9830-628-6

8.1.2. Resultados e Interpretacin


Al realizar el ejemplo propuesto con el fichero ESCUEL.sav se obtienen por una parte los
resultados referidos expresamente a las frecuencias y porcentajes (tanto generales como vlidos:
stos se calculan sin tener en cuenta el nmero de valores perdidos) ms los porcentajes vlidos
acumulados as como, por otra parte, el resto de estadsticos solicitados y el histograma segn
aparecen en las tablas siguientes.
Frecuencias
Estadsticos
Tcnicas de Estudio
N
Vlidos
Perdidos
Media
Mediana
Desv. tp.
Varianza
Mnimo
Mximo
Percentiles
25
50
75

116
1
6.97
8.00
2.312
5.347
1
9
5.00
8.00
9.00

Tcnicas de Estudio

Vlidos

Perdidos
Total

1=Nada
2
3
4
5
6
7
8
9=Muchsimo
Total
0=NS/NC

Frecuencia
4
4
4
5
14
8
14
18
45
116
1
117

Porcentaje
3.4
3.4
3.4
4.3
12.0
6.8
12.0
15.4
38.5
99.1
.9
100.0

Porcentaje
vlido
3.4
3.4
3.4
4.3
12.1
6.9
12.1
15.5
38.8
100.0

Porcentaje
acumulado
3.4
6.9
10.3
14.7
26.7
33.6
45.7
61.2
100.0

Si se PULSA dos veces en este grfico que aparece en los resultados surge una ventana propia de
dilogo a partir de la cul pueden modificarse ciertos aspectos del grfico as como cambiarlo a
diagrama de barras, modificar el color, aadir la frecuencia en cada barra, etc. (Fig. 53).
Figura 53.

28
Universidad de Deusto - ISBN 978-84-9830-628-6

Se suele aconsejar a los usuarios, no obstante, que cuando sea necesario confeccionar un grfico en
base a resultados estadsticos utilicen otros programas de grficos ms potentes y eficaces que el
ofrecido por el SPSS.
Las tablas de porcentajes, en definitiva, siempre tienen muchos tipos de lecturas. Puede decirse, por
ejemplo, que tan slo el 26.7% ocupan los valores que van desde el 1 (nada me ensearon) hasta el
5 inclusive, o puede decirse que la gran mayora responden a esa pregunta dando un valor 8 o 9
(15.5% y 36.8% respectivamente de porcentaje vlido), que slo hay un sujeto que No sabe/No
contesta, etc. Se trata de una pregunta/variable, por tanto, a la que los sujetos responden
inclinndose por los valores altos (en torno a: me ensearon muchsimo) como puede apreciarse
tambin en el grfico.
Por otra parte, una media tan alta como 6.974 corrobora que las respuestas estn inclinadas ms
bien hacia el S me ensearon muchsimo Tcnicas de Estudio en la Escuela. Ciertamente, la
desviacin tpica (2.312) es considerable lo que indica diferencias serias de opinin y no es de
extraar porque los sujetos han variado en su opinin desde el valor mnimo (1) hasta el valor
mximo (9).
Es importante advertir que el clculo de frecuencias tambin puede y, muchas veces, debe realizarse
con variables sobre las que han operado los subcomandos: por ejemplo, pueden calcularse las
frecuencias de esta misma variable segn Sexo (v34) bien sea utilizando el Segmentar Archivo o
Seleccionar Casos, puede crearse una nueva variable mediante Calcular, luego recodificarla y
posteriormente realizar una clculo de frecuencias, etc.
8.1.3. La Sintaxis del programa Frecuencias
Todos los clculos anteriores pueden realizarse directamente acudiendo al programa de sintaxis o
serie de rdenes informticas para el clculo de Frecuencias.
En el caso ms sencillo del clculo de frecuencias de la v7 Tcnicas de Estudio las rdenes son
(Fig. 54):
Figura 54.

Para hacer funcionar el programa, como se explica en el Apartado 2.3, Figura 9 y Figura 10, basta
con sombrear las rdenes, PULSAR en Ejecutar y posteriormente en la opcin Seleccin.
En el caso de solicitar los estadsticos media, mediana, etc., adems de las frecuencias las rdenes
de sintaxis son (Fig. 55):

29
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 55.

8.1.4. Ejercicios y Sintaxis


1. Con el fichero DROGODE.sav hallar las frecuencias de la v6 y v7
1.a.) Toda la poblacin
1.b.) Slo para el grupo que tiene nivel de estudios bajos.
1.a.) Estudio para toda la muestra.
Tabla de frecuencia
Tabla 1.a.1.
Borracho-penas

Vlidos

Perdidos
Total

2
3
4
5
6
7
8
9=muy toxicmano
Total
0

Frecuencia
3
3
7
7
7
27
20
33
107
4
111

Porcentaje
2.7
2.7
6.3
6.3
6.3
24.3
18.0
29.7
96.4
3.6
100.0

Porcentaje
vlido
2.8
2.8
6.5
6.5
6.5
25.2
18.7
30.8
100.0

Porcentaje
acumulado
2.8
5.6
12.1
18.7
25.2
50.5
69.2
100.0

Tabla 1.a.2.
Chico-litronas

Vlidos

Perdidos
Total

1=nada toxicmano
2
3
4
5
6
7
8
9=muy toxicmano
Total
0

Frecuencia
4
2
10
12
28
18
20
7
6
107
4
111

Porcentaje
3.6
1.8
9.0
10.8
25.2
16.2
18.0
6.3
5.4
96.4
3.6
100.0

Porcentaje
vlido
3.7
1.9
9.3
11.2
26.2
16.8
18.7
6.5
5.6
100.0

1.b.) Realizar el estudio slo para los de estudios bsicos

30
Universidad de Deusto - ISBN 978-84-9830-628-6

Porcentaje
acumulado
3.7
5.6
15.0
26.2
52.3
69.2
87.9
94.4
100.0

Tabla de frecuencia
Tabla 1.b.1.
Borracho-penas

Vlidos

Perdidos
Total

3
4
5
6
7
8
9=muy toxicmano
Total
0

Frecuencia
2
2
3
2
13
11
15
48
3
51

Porcentaje
3.9
3.9
5.9
3.9
25.5
21.6
29.4
94.1
5.9
100.0

Porcentaje
vlido
4.2
4.2
6.3
4.2
27.1
22.9
31.3
100.0

Porcentaje
acumulado
4.2
8.3
14.6
18.8
45.8
68.8
100.0

Porcentaje
vlido
2.1
8.3
10.4
25.0
12.5
25.0
8.3
8.3
100.0

Porcentaje
acumulado
2.1
10.4
20.8
45.8
58.3
83.3
91.7
100.0

Tabla 1.b.2.
Chico-litronas

Vlidos

Perdidos
Total

1=nada toxicmano
3
4
5
6
7
8
9=muy toxicmano
Total
0

Frecuencia
1
4
5
12
6
12
4
4
48
3
51

Porcentaje
2.0
7.8
9.8
23.5
11.8
23.5
7.8
7.8
94.1
5.9
100.0

Sintaxis para el Ejercicio 1

2. Con el fichero ESCUEL.sav calcular las frecuencias de la v2 y v3


2.a.) Toda la muestra
2.b.) Slo para los de Clase social alta.
2.a.) Realizar el estudio para toda la muestra.

31
Universidad de Deusto - ISBN 978-84-9830-628-6

Tabla de frecuencia
Tabla 2.a.1.
Capacidades Artsticas

Vlidos

1=Nada
2
3
4
5
6
7
8
9=Muchsimo
Total

Frecuencia
3
3
3
5
17
11
14
22
39
117

Porcentaje
2.6
2.6
2.6
4.3
14.5
9.4
12.0
18.8
33.3
100.0

Porcentaje
vlido
2.6
2.6
2.6
4.3
14.5
9.4
12.0
18.8
33.3
100.0

Porcentaje
acumulado
2.6
5.1
7.7
12.0
26.5
35.9
47.9
66.7
100.0

Tabla 2.a.2.
Educacin Cvica

Vlidos

Perdidos
Total

1=Nada
2
3
4
5
6
7
8
9=Muchsimo
Total
0=NS/NC

Frecuencia
7
3
1
6
6
11
26
19
37
116
1
117

Porcentaje
6.0
2.6
.9
5.1
5.1
9.4
22.2
16.2
31.6
99.1
.9
100.0

Porcentaje
vlido
6.0
2.6
.9
5.2
5.2
9.5
22.4
16.4
31.9
100.0

Porcentaje
acumulado
6.0
8.6
9.5
14.7
19.8
29.3
51.7
68.1
100.0

2.b.) Calcular las frecuencias slo para los de clase social alta.
Tabla de frecuencia
Tabla 2.b.1
Capacidades Artsticas

Vlidos

1=Nada
3
4
5
6
7
8
9=Muchsimo
Total

Frecuencia
1
1
1
5
2
4
6
14
34

Porcentaje
2.9
2.9
2.9
14.7
5.9
11.8
17.6
41.2
100.0

Porcentaje
vlido
2.9
2.9
2.9
14.7
5.9
11.8
17.6
41.2
100.0

Porcentaje
acumulado
2.9
5.9
8.8
23.5
29.4
41.2
58.8
100.0

Tabla 2.b.2.
Educacin Cvica

Vlidos

2
4
6
7
8
9=Muchsimo
Total

Frecuencia
1
1
4
9
7
12
34

Porcentaje
2.9
2.9
11.8
26.5
20.6
35.3
100.0

Porcentaje
vlido
2.9
2.9
11.8
26.5
20.6
35.3
100.0

Porcentaje
acumulado
2.9
5.9
17.6
44.1
64.7
100.0

32
Universidad de Deusto - ISBN 978-84-9830-628-6

Sintaxis para el Ejercicio 2

33
Universidad de Deusto - ISBN 978-84-9830-628-6

8.2. DESCRIPTIVOS
8.2.0. Frmulas y Aplicacin
8.2.0.1. Frmulas
Media y Desviacin Tpica

Asimetra y Curtosis

Media: X =

X
1

(X X )

Desviacin Tpica: S =

(X X )

Varianza: S =

Asimetra: As =

(X X )

(X X )2
1

(X X )

Estimacin de la Desviacin Tpica


N


S=

(X X )

Curtosis: Curt =

N 1
Estimacin de la Varianza


S2 =

(X X )

(X X )2
1

N 1

8.2.0.2. Tipo de variables requeridas


Este comando se utiliza nicamente con variables cuantitativas, como por ejemplo la variable
Alcohol (v5 del fichero SALUD.sav), con la cual se trabaja en la 56.
8.2.0.3. Utilidades e interpretacin
El clculo de este comando nos proporciona medidas de estadstica descriptiva muy habituales en la
investigacin en general, y sociolgica en particular. Las opciones ms relevantes son el mximo, el
mnimo, la media y la desviacin tpica.
En general, resulta interesante observar la homogeneidad o heterogeneidad de las respuestas,
fijndose en la desviacin tpica, as como en las medias de las distintas respuestas, etc. Otros datos
relevantes podran ser los valores mximo y mnimo de cada grupo, los cuales nos permiten situar
los resultados obtenidos en un marco concreto, as como obtener conclusiones sobre el
comportamiento de los individuos encuestados. Por ejemplo, si las diferencias entre mximo y
mnimo son pequeas, podemos deducir que las respuestas se diferenciarn poco, o que hay
bastante homogeneidad en las mismas.
Siempre es necesario fijarse en las diferencias entre variables, tal y como se puede ver en el
ejercicio propuesto en el apartado 8.2.3.1, en el que se realiza el tipo de anlisis aqu propuesto
(observacin de medias, desviacin tpica, valor mximo y mnimo.)

34
Universidad de Deusto - ISBN 978-84-9830-628-6

En cualquier caso, las posibles diferencias aparecidas requeriran un anlisis ms profundo (anlisis
de varianza, entre otros) que aparecer en captulos posteriores.
8.2.1. Manejo del SPSS
En este comando se encuentran las clsicas medidas de estadstica descriptiva de tendencia central
de las distribuciones univariadas. Para acceder a este comando hay que dirigirse al men y
PULSAR consecutivamente Analizar, Estadsticos descriptivos y Descriptivos tras lo cual
aparece la ventana de la Fig. 56:
Figura 56.

El procedimiento es el mismo que en el apartado de Frecuencias: se trasladan las variables con las
que se quieren trabajar al recuadro titulado Variables. Como se ve en la Figura 55. se ha
seleccionado en el archivo de datos SALUD.sav la variable Alcohol(v5) que lgicamente es de
carcter cuantitativo. Despus, se PULSA en Opciones para elegir aquellos estadsticos
descriptivos que se deseen obtener (Fig. 57). En este caso se han seleccionado Media, Desviacin
tpica, Mnimo y Mximo.
Figura 57.

La ventana tambin ofrece la posibilidad de elegir medidas del tipo de Distribucin como son la
Curtosis y la Asimetra siendo la primera una medida del grado de apertura o estrechamiento de la
supuesta distribucin normal de los datos y la segunda una medida del grado de sesgo de los datos
hacia un lado u otro de la medicin.
El Orden de visualizacin, por otra parte, es interesante por cuanto permite, por ejemplo, pedir que
las medias de las diferentes variables aparezcan en los resultados ordenadas segn Lista de
variables (tal y como estn en el archivo de datos), segn orden Alfabtico, segn Medias
ascendentes o segn Medias descendentes.
35
Universidad de Deusto - ISBN 978-84-9830-628-6

8.2.2. Resultados e Interpretacin


Al realizar el ejemplo con la variable Alcohol(v5) del fichero SALUD.sav surgen los siguientes
resultados (Fig. 58.).
Figura 58.

Segn estos resultados la edad del primer consumo regular de alcohol en la muestra de
drogodependientes que han contestado vlidamente (N=180) es 15.11 aos, con una desviacin
tpica de 2.98 aos siendo la edad mnima 6 aos y 28 aos la edad mxima del primer consumo
regular de alcohol. Tienen trascendencia algunas de las realidades implcitas en estos resultados: por
ejemplo, el hecho de que haya 42 ceros (222 sujetos en total menos 180 que dicen haber
consumido) entendibles como que no han consumido alcohol a ninguna edad, es decir son
abstemios, tambin llama la atencin que para algunos sujetos la edad inicial a la que consumieron
alcohol es a los 6 aos as como que otros, ms tardos, consumieron alcohol a los 28 aos, etc.
Debe advertirse tambin aqu que puede solicitarse el clculo de medias pero no slo para todos los
sujetos de la muestra sino para algn grupo determinado, por ejemplo los que s han tenido alguna
actividad o tarea ocupacional (v4=2) o para los que s o no abandonaron sus estudios (v2=1 2)
mediante la segmentacin del archivo, o incluso creando una nueva variable fruto de calcular una
determinada puntuacin y posteriormente calcular sobre ella la media total, la media por grupo o la
media por grupos.

8.2.3. Ejercicios y Sintaxis


1.
En el fichero CAMPAA.sav.
1.a.) Hallar los descriptivos de las variables v3-v4-v5-v6-v7-v8-v9-v10 para toda la
muestra
1.b.) Realizar el mismo estudio pero slo para el colectivo que tiene estudios
superiores.
1.a.) Para toda la muestra
Tabla 1.a.
Estadsticos descriptivos
N
V3 catlicos deben
rechazarla
V4 irresponsabilidad
del gobierno no hacerla
V5 campaa ayudar a
explicar sexo
V6 ms necesaria
educacin sexo
V7 campaa fomenta
promiscuidad
V8 obispos
incomprensivos
v9 condn no gusta,
pero necesario
V10 pocas campaas
N vlido (segn lista)

Mnimo

Mximo

Media

Desv. tp.

169

1.85

1.121

169

3.94

1.209

167

3.32

1.043

168

4.19

.966

169

2.27

1.157

168

3.66

1.168

166

3.71

1.118

168
164

3.88

1.022

36
Universidad de Deusto - ISBN 978-84-9830-628-6

Interpretacin:
Se puede observar como la media menor se encuentra en la v3 Catlicos deben rechazar la
Campaa, con un valor de 1.85, siendo ms de dos puntos menor que la media ms alta, que es la
v6 Es ms necesaria la educacin sexual con 4.19, que a la vez, es la que tiene una desviacin
tpica menor.
El resto de las medias se encuentran entre 3 y 4 puntos, exceptuando la v7 Fomenta promiscuidad
que tiene una media de 2.27. La desviacin tpica mayor la encontramos en la v4 Irresponsabilidad
del Gobierno no hacerla con un valor de 1.21
1.b.) Para el colectivo que tiene estudios superiores
Se debe seleccionar el grupo de estudios superiores nicamente y realizar lo mismo que en el
apartado anterior.
Tabla 1.b.
Estadsticos descriptivos
N
V3 catlicos deben
rechazarla
V4 irresponsabilidad
del gobierno no hacerla
V5 campaa ayudar a
explicar sexo
V6 ms necesaria
educacin sexo
V7 campaa fomenta
promiscuidad
V8 obispos
incomprensivos
v9 condn no gusta,
pero necesario
V10 pocas campaas
N vlido (segn lista)

Mnimo

Mximo

Media

Desv. tp.

98

1.93

1.105

98

3.88

1.195

98

3.17

1.055

97

4.28

.987

98

2.19

1.062

97

3.67

1.106

97

3.57

1.189

98
96

3.88

1.028

Tanto la media menor y la media mayor, as como la desviacin tpica menor y la menor, se
encuentran en las mismas variables que en el apartado anterior (a.1.), observando como los valores
que se dan no varan a penas de los anteriormente obtenido con lo que puede concluirse que el tener
estudios superiores no origina diferencias respecto al colectivo total en las variables estudiadas.
Sintaxis para el Ejercicio 1

37
Universidad de Deusto - ISBN 978-84-9830-628-6

2. Del fichero CITEC. sav


2.a.) Crear una nueva variable con la puntuacin total de la escala de conocimientos
cientficos, utilizando las variables 9 a la 18. y Hallar la media, desviacin tpica,
mximo y mnimo de la variable total para todos los individuos
2.b.) Hacer lo mismo para los de edad comprendida entre 15 y 24 aos.
2.c.) Comparar los resultados.
Atencin: cada sujeto tendr 1 punto si acierta a cada pregunta, de lo contrario tendr 0 puntos.
Vase el cdigo de respuestas acertadas.
Cdigo de respuestas acertadas
v9
v10
v11
v12
v13

1
1
1
1
2

v14
v15
v16
v17
v18

1
2
1
2
2

2.a.) Para toda la muestra.


Tabla 2.a.
Estadsticos descriptivos
ConocimientoCientifico
N vlido (segn lista)

N
1021
1021

Mnimo
.00

Mximo
10.00

Media
4.9432

Desv. tp.
2.25021

2.b.) Para los de edad comprendida entre 15-24 aos.


Tabla 2.b.
Estadsticos descriptivos
N
ConocimientoCientifico
N vlido (segn lista)

219
219

Mnimo
1.00

Mximo
10.00

Media
5.7626

Desv. tp.
1.83949

2.c.) Interpretacin
Se puede apreciar como el mnimo valor de Conocimiento Cientfico considerando a todos los
individuos, es 0, mientras que entre 15-24 aos es de 1.
La media de conocimiento Cientfico aumenta en casi un punto, en los de edad 15-24 aos, siendo
de 5.7626, mientras que en todos los individuos es de 4.9432.
La desviacin tpica, sin embargo, es bastante menor entre los jvenes que e la poblacin general:
1.84 frente a 2.25, es decir, los jvenes constituyen un grupo ms homogneo que la muestra total.

38
Universidad de Deusto - ISBN 978-84-9830-628-6

Sintaxis para el Ejercicio 2

3. Del fichero CAMPAA. sav


3.a.) Recodificar la v25 en cuatro grupos y calcular los descriptivos de las variables
v18 a v23 para toda la muestra.
1- 2 = 1
3 = 2
4 = 3
5- 8 = 4
3.b.) Asimismo calclalas para los cuatro grupos.
3.c.) Interpretar datos
3.a.) Para toda la muestra.
Tabla 3.a.
Estadsticos descriptivos
N
V18 iniciativa que llega tarde
V19 irresponsabilidad criticar campaa
V20 lema aboga por seguridad
V21 preservativo parche a corto plazo
V22 campaa slo lleva a atraccin
V23 relaciones con otro sexo
N vlido (segn lista)

Mnimo
168
167
168
168
168
170
166

1
1
1
1
1
1

Mximo
5
5
5
5
5
4

3.b.) Calcular para los cuatro grupos.

39
Universidad de Deusto - ISBN 978-84-9830-628-6

Media
3.54
3.47
4.05
2.82
2.19
2.38

Desv. tp.
1.083
1.155
1.115
1.130
1.137
1.359

Tabla 3.b.
Estadsticos descriptivos
v25r
1.00

2.00

3.00

4.00

N
V18 iniciativa que llega tarde
V19 irresponsabilidad criticar campaa
V20 lema aboga por seguridad
V21 preservativo parche a corto plazo
V22 campaa slo lleva a atraccin
V23 relaciones con otro sexo
N vlido (segn lista)
V18 iniciativa que llega tarde
V19 irresponsabilidad criticar campaa
V20 lema aboga por seguridad
V21 preservativo parche a corto plazo
V22 campaa slo lleva a atraccin
V23 relaciones con otro sexo
N vlido (segn lista)
V18 iniciativa que llega tarde
V19 irresponsabilidad criticar campaa
V20 lema aboga por seguridad
V21 preservativo parche a corto plazo
V22 campaa slo lleva a atraccin
V23 relaciones con otro sexo
N vlido (segn lista)
V18 iniciativa que llega tarde
V19 irresponsabilidad criticar campaa
V20 lema aboga por seguridad
V21 preservativo parche a corto plazo
V22 campaa slo lleva a atraccin
V23 relaciones con otro sexo
N vlido (segn lista)

Mnimo
31
31
31
31
31
33
31
51
50
51
51
51
50
49
48
48
48
48
48
48
48
38
38
38
38
38
39
38

1
1
1
1
1
1

Mximo
5
5
5
5
5
4

Media
3.16
2.94
3.87
3.00
2.65
1.82

Desv. tp.
1.157
1.289
1.176
1.238
1.279
1.211

1
1
1
1
1
1

5
5
5
5
4
4

3.37
3.36
4.16
2.67
2.18
2.12

1.148
1.120
1.084
1.071
1.014
1.319

2
1
1
1
1
1

5
5
5
5
5
4

3.75
3.75
4.02
2.67
1.94
2.54

.911
.957
1.176
.975
1.119
1.414

1
1
1
1
1
1

5
5
5
5
5
4

3.79
3.68
4.08
3.05
2.16
3.00

1.044
1.188
1.050
1.272
1.128
1.214

3.c.) Interpretacin.
En primer lugar debe notarse cmo la N total vara dependiendo de los 0 que hay en cada caso. Los
valores mnimos son iguales en todos: valor 1. Los valores mximos, excepto en la variable
(relaciones con otro sexo) es igual a 5.
En cuanto a las medias, estn comprendidas entre los valores 2 y 4, teniendo una media mayor la
variable (Fornica-seguridad) con un valor de 4.05, y una media menor (amor-atraccin) con una
media de 2.19. Existe, por tanto, una considerable diferencia entre ciertos aspectos de la campaa
porque con unos se est ms bien en desacuerdo y con otros, en cambio, se da una posicin media
ms bien de acuerdo.
En cuanto a las desviaciones tpicas el mayor valor le corresponde a la variable cuyo valor mximo
es el 4 y que difiere de las dems. Corresponde a la variable Relaciones Sexuales. Por lo
contrario, la variable con una desviacin tpica menor es la variable Iniciativa tarde con valor de
1.08.
Si se estudian los datos para los cuatro grupos, se puede apreciar como en las medias los valores
ms altos corresponden en los 4 grupos a la variable fornica-seguridad con valores de 3.87 (grupo
1); 4.16 (grupo 2); 4.02 (grupo 3); 4.08 (grupo 4). Por el contrario las medias de menor valor se
encuentran tanto en el gupo 1, con un valor de 1.21 como en el 2 en las variables relaciones con
otro sexo con un valor de 2.12, en cambio, en los grupo 3 y 4 se encuentran en las variables amoratraccin con un valor de 1.94 y 2.16 respectivamente. En cuanto a las desviaciones tpicas, en el
grupo 1,3 y 4 las desviaciones tpicas ms bajas se encuentran en la variable Iniciativa tarde con
valores 1.16,0.91 y 1.04 respectivamente; mientras que tanto en el grupo 2 se encuentra en la
variable amor-atraccin con valor 1.01. Existen, pues, algunas diferencias tanto respecto a las
medias en algunas variables como respecto a las desviaciones tpicas lo cual es indicativo que todos
los grupos no opinan igual y debera pasarse a otra fase de estudio para verificar si tales diferencias
resultan significativas: anlisis de varianza, diferencia significativa de medias, etc.

40
Universidad de Deusto - ISBN 978-84-9830-628-6

Sintaxis para el Ejercicio 3

4.

Del fichero DROGODE. sav


4.a.) Recodificar la v5 en tres grupos y calcular los descriptivos de las variables v7, v9,
v10, v11, v12, y de v18-v20 para toda la muestra.
1- 2 = 1
3=2
4- 5 = 3
4.b.) Realizar el mismo estudio para los tres grupos.
4.c.) Interpretar datos
4.a.) Realizar el estudio para toda la muestra.
Tabla 4.a.
Estadsticos descriptivos
N
Chico-litronas
Txikitero
Borracho-finsemana
Herona
Porros-diario
Joven-colocarse
Chica-coca-a veces
Anfetaminas-examen
N vlido (segn lista)

Mnimo
107
109
109
108
107
106
108
105
102

1
1
1
1
1
1
1
1

Mximo
9
9
9
9
9
9
9
9

Media
5.46
5.01
6.12
7.46
6.79
6.70
6.93
5.81

4.b.) Realizar el estudio para los tres grupos.

41
Universidad de Deusto - ISBN 978-84-9830-628-6

Desv. tp.
1.865
2.030
1.947
1.704
1.594
1.691
1.717
1.845

Tabla 4.b.
Estadsticos descriptivos
v5r
1.00

2.00

3.00

N
Chico-litronas
Txikitero
Borracho-finsemana
Herona
Porros-diario
Joven-colocarse
Chica-coca-a veces
Anfetaminas-examen
N vlido (segn lista)
Chico-litronas
Txikitero
Borracho-finsemana
Herona
Porros-diario
Joven-colocarse
Chica-coca-a veces
Anfetaminas-examen
N vlido (segn lista)
Chico-litronas
Txikitero
Borracho-finsemana
Herona
Porros-diario
Joven-colocarse
Chica-coca-a veces
Anfetaminas-examen
N vlido (segn lista)

Mnimo
50
51
51
51
51
49
51
50
49
25
25
25
25
24
25
25
25
24
32
33
33
32
32
32
32
30
29

1
1
1
1
1
1
1
1

Mximo
9
9
9
9
9
9
9
9

Media
4.92
4.65
5.59
7.29
6.45
6.63
6.76
5.56

Desv. tp.
1.904
2.115
1.780
1.781
1.770
1.629
1.839
1.939

3
1
1
3
4
1
2
3

9
9
9
9
9
9
9
9

5.52
5.12
5.96
7.20
6.88
6.48
6.92
5.56

1.711
2.128
2.423
1.958
1.227
1.782
1.824
1.583

3
1
3
4
4
2
4
3

9
8
9
9
9
9
9
9

6.25
5.48
7.06
7.94
7.28
6.97
7.19
6.43

1.666
1.752
1.435
1.268
1.442
1.732
1.424
1.794

4.c.) Interpretacin
En el estudio para todo el colectivo, el valor mnimo es 1 mientras que el valor mximo es 9. Esto,
prcticamente es similar respecto al segundo apartado, que corresponde al estudio para los tres
grupos.
En cuanto a la media, el valor ms alto corresponde a la variable Herona con un valor de 7.46
(bastante toxicmano), mientras que el valor ms bajo corresponde al tem Txikitero con un valor
de 5.01 (medianamente toxicmano).
Respecto al estudio de los tres grupos, hay que decir que coincide el valor mximo de la media en la
variable Herona con valores 7.29 (grupo 1); 7.20 (grupo 2) y 7.94 (grupo tres) respectivamente.
En cuanto a las desviaciones tpicas, por el contrario, se aprecia como en el estudio para todo el
colectivo el mayor valor corresponde a la variable Txikitero con un valor de 2.03 (apreciable
heterogeneidad en las opiniones); mientras que el valor menor corresponde a la variable porrosdiario con un valor de 1.59 (menor heterogeneidad). En cuanto al estudio para los tres grupos, se
aprecia como para el grupo 1 y 3 coinciden las desviaciones tpicas mayores con la variable
Txikitero, mientras que en el grupo 2, se sita por delante de esta la variable Borrachofinsemana.
Sintaxis para el Ejercicio 4

42
Universidad de Deusto - ISBN 978-84-9830-628-6

8.3. COMPARAR MEDIAS


8.3.1. MEDIAS....
8.3.1.0. Frmulas y Aplicacin
8.3.1.0.1. Frmulas
Para estos clculos sirven las frmulas expuestas en el apartado 8.2.0.1. Frmulas del tema
Descriptivos.
8.3.1.0.2. Tipo de variables requeridas
Se utiliza con variables cuantitativas, como por ejemplo la utilizada en el ejemplo que figura en el
punto 8.3.1.2. Se trata de Educacin sexual (v33 del fichero ESCUEL.sav), de la cual queremos
conocer las medias en funcin de una variable independiente, que en este ejemplo es Sexo (v34).
8.3.1.0.3. Utilidad e interpretacin
El comando Comparar medias permite obtener medias, desviaciones tpicas, nmero de
casos, mximos y mnimos para diferentes grupos en funcin de una o varias variables, as como
otros estadsticos de inters. Adems permite hacerlo sin utilizar otros mtodos indirectos, como
son los subcomandos Seleccionar casos y Segmentar archivo.
Este comando es muy til si se sabe aprovechar la cantidad de informacin que proporciona.
Presenta los estadsticos requeridos (ver opciones en punto 8.3.1.3) ordenados en funcin de las
variables de identificacin que se han pedido. Como principal atractivo, en la tabla de resultados
podemos analizar fcilmente las diferencias entre medias, lo cual supone un salto cualitativo y
cuantitativo respecto a los comandos Frecuencias y Descriptivos, sobre todo en trminos de
accesibilidad a los datos. Los datos se agrupan en una sola tabla y de un vistazo podemos iniciar el
anlisis.
No se debe subestimar el valor de la comparacin de medias. Como ya se ha dicho en otros
captulos, la existencia de comandos ms potentes no nos debe hacer olvidar que en la superficie de
la o las variables podemos encontrar datos muy importantes, a modo de pistas que conduzcan hacia
un anlisis ms completo
8.3.1.1. Manejo del SPSS
Como ya se ha descrito anteriormente, se acude al comando Descriptivos si lo que se quiere es
conocer la puntuacin media en una determinada variable cuantitativa. Bien es verdad que
utilizando el subcomando Seleccionar casos o el subcomando Segmentar archivo se pueden
conocer las medias en esa variable de los diversos grupos seleccionados.
Precisamente es este clculo de las medias para diferentes grupos lo que puede obtenerse
directamente y sin el uso de subcomandos despus de PULSAR como siempre en la opcin
Analizar, en Comparar medias y finalmente en Medias (Fig. 59)

43
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 59.

Al ejecutar esta eleccin surge la ventana de dilogo siguiente (Fig. 60).


Figura 60.
Aqu se ha seleccionado del fichero de datos
ESCUEL.sav la variable dependiente Educ.
Sexual. (v33) que ha sido colocada en el
rectngulo blanco titulado Dependientes y
como variable independiente se ha elegido
Sexo (v34) dado que el objetivo es conocer las
medias de hombres y la media de mujeres en
esa variable de cunto me ensearon en la
escuela acerca de Educacin Sexual. La forma
de operar es la ya conocida de PULSAR sobre Educ. Sexual (v33) que quedar coloreada y
mediante el pequeo recuadro con la flecha hacia la derecha se transporta al rectngulo blanco
donde deben estar ubicadas las variables dependientes. De forma similar se opera con la variable
Sexo(v34) que se transporta al otro rectngulo en blanco donde deben estar las variables
dependientes.
En medio de la ventana de dilogo aparece la opcin Capa 1 de 1 y el botn Siguiente. Si se
PULSA este botn aparece (Fig. 61) prcticamente la misma ventana pero se ha modificado un
tanto porque se puede leer Capa 2 de 2 teniendo a ambos lados el botn de Anterior y el botn de
Siguiente y adems en el rectngulo de las independientes aparece Clase social(v35).
Figura 61.
Esto significa que hemos solicitado las
medias en la variable Educacin Sexual(v33)
para los 8 diferentes grupos que pueden
formarse con las categoras de la variable
Sexo y de la variable Clase Social, es decir,
medias para los Hombres-C.Social Alta,
Hombres-C.Social Media Alta, HombresC.Social Media Baja y Hombres-C.Social
Baja. Los otros cuatro grupos, lgicamente,
son los mismos pero para Mujeres.
Esta posibilidad es sumamente interesante sobre todo cuando el tamao de la muestra general es
bastante grande porque de lo contrario el nmero de sujetos en cada uno de esos grupos puede ser
muy pequeo y en consecuencia sus resultados pueden carecer de representatividad.
44
Universidad de Deusto - ISBN 978-84-9830-628-6

Al PULSAR el botn Opciones (Fig. 62) aparece toda una batera de diferentes posibilidades sobre
el tipo de resultados que se desea. En este caso se ha elegido la Media, la Desviacin tpica y el
Nmero de casos. El procedimiento es el usual: se PULSA en la posibilidad que se desea que
quedar coloreada y se PULSA despus en el pequeo recuadro con la flecha hacia la derecha para
que se traslade al rectngulo blanco titulado Estadsticos de casilla
Figura 62.
Tras PULSAR en Continuar se vuelve a la ventana
principal y ah se PULSA en Aceptar con lo cual el
programa ofrecer los resultados solicitados.

8.3.1.2. Resultados e Interpretacin


Una vez finalizadas las peticiones, los resultados ofrecidos en la pantalla Visor SPSS presentan el
siguiente formato (Fig. 63).
Figura 63.

Debe recordarse que si se coloca el puntero dentro de cualquier cuadro de resultados y se PULSA
dos veces consecutivas el men de esta ventana se ampla ofreciendo ms posibilidades de cambio y
modificacin tanto en cuanto a la esttica de los nmeros, de los ttulos, de la anchura de las
columnas, etc. como de eliminacin de ciertas columnas, autoajuste, reduccin de la anchura y de la
altura de los cuadros de resultados a las hojas Dina A4 donde se imprimen, etc. (Cfr. Apartado 6.
COMO IMPRIMIR Y MODIFICAR LA PRESENTACION DE RESULTADOS)

45
Universidad de Deusto - ISBN 978-84-9830-628-6

Los resultados completos, en todo caso, son los siguientes:


Medias
Resumen del procesamiento de los casos
Casos
Excluidos
N
Porcentaje

Incluidos
N
Porcentaje
Educ.Sexual * Sexo
* Clase Social

87

74.4%

30

25.6%

Total
Porcentaje
117

100.0%

Informe
Educ.Sexual
Sexo
HOMBRE

MUJER

Total

Clase Social
ALTA
MEDIA-ALTA
MEDIA-BAJA
BAJA
Total
ALTA
MEDIA-ALTA
MEDIA-BAJA
BAJA
Total
ALTA
MEDIA-ALTA
MEDIA-BAJA
BAJA
Total

Media
5.75
8.00
6.67
8.11
7.27
7.70
7.76
6.08
7.00
7.34
7.38
7.79
6.28
7.59
7.32

Desv. tp.
3.202
1.000
2.805
1.054
2.186
1.031
1.128
2.906
1.690
1.726
1.663
1.101
2.803
1.460
1.839

N
4
3
6
9
22
20
25
12
8
65
24
28
18
17
87

El primer cuadro simplemente indica cuntos sujetos tienen datos vlidos y cuntos tienen
datos/valores perdidos: concretamente 87 vlidos (74.4%) y 30 perdidos (25.6%). En el segundo
cuadro se tienen todas las medias de todos los posibles grupos: por ejemplo, 7.27 en los hombres y
7.34 en las mujeres siendo el total 7.32. Los de Clase Alta alcanzan 7.38, los de Media-Alta 7.79,
los de Media-Baja 6.28 y los de Baja 7.59. El resto del cuadro presenta las medias de los grupos
formados por ejemplo por Hombre-C.Alta cuya media llega a 5.75, los de Mujer-Media Alta que
llega a 7.76, etc.
Se deduce de tales datos que mientras entre Hombres y Mujeres no hay diferencia de medias, s la
hay entre los de diferente Clase Social y ms an cuando se comparan en general los grupos
formados por el cruce de las dos variables Sexo-Clase Social. Este comando, de todas formas, no
aporta informacin acerca de si tales diferencias de medias son o no significativas y, por lo tanto, se
trata de un comando ms bien informativo pero no conclusivo.
8.3.1.3. Ejercicios y Sintaxis
1.

Del fichero SALUD.sav se quieren conocer las medias respecto al consumo regular de
alcohol (v5), tabaco (v7) y porros(v15) distinguiendo entre los que son de Logroo y los del
resto de la provincia.
1.a.) Realizar el estudio para toda la muestra.
1.b.) Hallar el mismo estudio solo para solteros.
1. a.) Realizar el estudio para toda la muestra

46
Universidad de Deusto - ISBN 978-84-9830-628-6

Tabla 1.a.
Informe

Lugar nacimiento
LOGROO

Media
N
Desv. tp.
RESTO PROVINCIA Media
N
Desv. tp.
Total
Media
N
Desv. tp.

Consumo
regular
alcohol
14.58
57
3.375
15.16
49
2.375
14.85
106
2.956

Consumo
regular de
tabaco
12.28
74
3.486
13.27
60
3.113
12.72
134
3.348

Porro
consumo
regular
14.99
68
4.393
15.32
57
2.261
15.14
125
3.573

Los resultados evidencian un superior consumo medio de los del resto de provincia sobre los de
Logroo tanto en consumo regular de alcohol as como de tabaco y de porros.
1.b.) Realizar el estudio slo para los solteros.
Tabla 1.b.
Informe

Lugar nacimiento
LOGROO

Media
N
Desv. tp.
RESTO PROVINCIA Media
N
Desv. tp.
Total
Media
N
Desv. tp.

Consumo
regular
alcohol
14.58
38
3.629
14.87
30
2.529
14.71
68
3.172

Consumo
regular de
tabaco
12.21
48
3.115
12.94
35
2.920
12.52
83
3.038

Porro
consumo
regular
14.40
45
3.407
14.97
33
2.325
14.64
78
2.993

A similares conclusiones se llega con los resultados de esta tabla referida expresamente a los
solteros. Por tanto, no parece que pueda hablarse de diferencias entre los resultados de consumo de
alcohol, de tabaco y de porros en la poblacin comparados con los de los solteros. Dicho de otra
forma, el hecho de ser soltero no parece influir en consumir mayores cantidades de esa droga.
Sintaxis para el Ejercicio 1

2. Del fichero ESCUEL.sav calcular la media de las variables v3 a v8.


2.a.) Les ensean mas a los hombres o a las mujeres?

47
Universidad de Deusto - ISBN 978-84-9830-628-6

Tabla 2.a.
Informe
Sexo
HOMBRE

MUJER

Total

Media
N
Desv. tp.
Media
N
Desv. tp.
Media
N
Desv. tp.

Educacin
Cvica
6.90
31
2.226
6.93
85
2.313
6.92
116
2.281

Vida sana
5.90
30
2.280
6.94
86
2.105
6.67
116
2.190

Conocerse
6.61
31
2.445
7.52
86
2.045
7.28
117
2.185

Hablar
6.45
31
2.461
8.01
86
1.612
7.60
117
1.987

Tcnicas
de Estudio
6.23
30
2.431
7.23
86
2.226
6.97
116
2.312

Disfrutar
6.71
31
2.283
7.41
86
2.072
7.22
117
2.142

Se puede observar como en las mujeres, exceptuando en la v3 Educacin cvica, son mucho mas
altas las media que entre los hombres por lo que se puede deducirse que el sexo influye a la hora de
responder a esas preguntas sobre cunto les ensearon en la escuela de vida sana, conocerse as
mismo, etc.
Sintaxis para el Ejercicio 2

48
Universidad de Deusto - ISBN 978-84-9830-628-6

8.3.2. PRUEBA T PARA MUESTRAS INDEPENDIENTES


8.3.2.0. Frmulas y Aplicacin
8.3.2.0.1. Frmulas
Prueba de Levene

Estadstico t

(X 1 X 2 ) 0
t=
2

Se lleva a cabo a travs del estadstico F de Fisher que
N 1 S1 + N 2 S 22 N 1 + N 2
resulta del Anlisis de Varianza Simple realizado entre una

nueva variable Zij = Xij - Xj (siendo Xij el valor de cada


N 1 + N 2 2 N 1 + N 2
dato en cada uno de los grupos y Xj la media de cada uno X 1 , N , S = Media, Tamao y Estimacin de D.T. del
1 1
de los dos grupos) y la variable cualitativa independiente.
grupo
1.
La significatividad de la F se coteja en las tablas teniendo

X 2 , N 2 , S 2 = Media, Tamao y Estimacin de D.T. del
en cuenta los grados de libertad = N1 + N2 2.
grupo 2.
8.3.2.0.2. Tipo de variables requeridas
Al ser un comando relativamente similar al anterior, tambin se utiliza con variables cuantitativas,
normalmente agrupadas en funcin de una variable cualitativa o atributo. Vase el ejemplo
realizado con las variables dependientes cuantitativas Confortabilidad (v21), Medioambiente
(v22) y la variable independiente cualitativa Sexo (v5), todas ellas del fichero CITEC.sav.
8.3.2.0.3. Utilidades e interpretacin
La diferencia con el comando anterior radica en la profundidad de los anlisis del mismo. La prueba
T para muestras independientes analiza tambin la significacin de las posibles diferencias de
medias entre los grupos. La utilidad de este comando es por tanto alta, y nos otorga un nivel de
anlisis bastante profundo.
Muy importante en este caso es la prueba de Levene para la igualdad de varianzas, que nos va a
orientar en la utilizacin de unos u otros tipos de clculos. La prueba de Levene, en caso de tener
una significacin menor que 0,05, indica que existe diferencia significativa de varianzas y por ello
deberemos atender al parmetro No se han asumido varianzas iguales. All buscaremos el valor
de t y su significacin (de nuevo ser significativo aquel valor cuya significacin sea menor que
0,05), para as poder dar una interpretacin completa de los resultados.
Si la prueba de Levene tuviera una significacin superior a 0,05 pasaramos a fijarnos en el
parmetro Se han asumido varianzas iguales, procediendo a actuar de la misma manera que antes.
En cualquier caso, puede resultar interesante ver el ejemplo recogido en los puntos 8.3.2.3 y 8.3.2.4,
en el que se trabaja con esta prueba.
8.3.2.1. Manejo del SPSS
Este comando se encuentra en el men Analizar y dentro del apartado Comparar medias con el
enunciado de Prueba T para muestras independientes (Fig. 64). Es relativamente similar al
anterior pero su objetivo es distinto: compara si la diferencia entre las medias de dos grupos es o no
significativa. Por ejemplo entre casados solteros, hombre mujer, etc.

49
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 64.

Las variables dependientes (Fig. 65), variables cuantitativas, se introducen en el apartado


Contrastar variables de la forma ya conocida mientras que la variable independiente, variable
cualitativa, deber ir situada en el apartado Variable de agrupacin.
Figura 65.

Al introducir la variable independiente, en este ejemplo Sexo(v5) tomada del fichero CITEC.sav,
aparecen dos interrogantes lo cual exige acudir al botn Definir grupos (Fig. 66) para establecer
cules son los grupos que van a intervenir en la comparacin de medias indicando su dgito de
codificacin y as los dos interrogantes pasarn a ser tales dgitos.
Figura 66.

Despus de PULSAR en Continuar se puede optar por PULSAR en Opciones para decidir qu
Intervalo de confianza se va a utilizar (usualmente el 95%) y qu tipo de Valores perdidos se
excluyen: Excluir casos segn anlisis (se excluyen aquellos sujetos con valores perdidos en las
variables utilizadas) o Excluir datos segn lista (se excluyen aquellos sujetos con valores perdidos
en cualquiera de las variables del archivo de datos). Posteriormente se PULSA en Aceptar y en
programa entra en funcionamiento.
En este ejemplo, como se puede apreciar, se han empleado las variables dependientes
Confortabilidad(v21) y Medioambiente(v22) y como variable independiente Sexo(v5).

50
Universidad de Deusto - ISBN 978-84-9830-628-6

8.3.2.2. Resultados e Interpretacin


Prueba T
Estadsticos de grupo

Confortabilidad
Medio ambiente

Sexo
hombre
mujer
hombre
mujer

Media
1.972
2.111
3.533
3.576

497
524
497
524

Desviacin
tp.
.989
1.053
1.378
1.293

Error tp. de
la media
.044
.046
.062
.056

Prueba de muestras independientes


Prueba de Levene
para la igualdad de
varianzas

F
Confortabilidad

Medio ambiente

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

6.427

6.205

Sig.
.011

.013

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

Diferencia
de medias

-2.169

1019

.030

-.139

-2.173

1018.918

.030

-.139

-.516

1019

.606

-.043

-.515

1005.336

.606

-.043

El primer cuadro simplemente aporta el tamao de cada grupo, la media, la desviacin tpica y el
error tpico de la media. En cualquier caso, se nota una similitud numrica bastante considerable en
los estadsticos de uno y otro grupo lo cual no supone, <sin embargo, que deje de haber diferencias
significativas dado el elevado tamao de ambos grupos.
El segundo cuadro, en efecto, ofrece en primer lugar la Prueba de Levene para la igualdad de
varianzas. Tanto en el caso de Confortabilidad(v21) como de Medioambiente(v22) existe diferencia
significativa al 95%, es decir, significacin menor del 0.05 (F=6.427; Sig.=0.011 y F=6.205;
Sig.0.013 respectivamente). Esto es importante porque obliga a calcular la t de una forma especial
y con parmetros distintos a los utilizados si las varianzas no son diferentes, entre ellos el de los
gl (Grados de Libertad). El valor de la t, en consecuencia, deber ser buscado en la lnea
correspondiente a No se han asumido varianzas iguales y, en concreto, vale 2.173 que con
1018.92 grados de libertad resulta significativa (Sig.=0.030) para Confortabilidad y vale 0.515
para Medioambiente que con 1005.34 grados de libertad no resulta significativa al 95% (Sig.0.606).
Los hombres y las mujeres, en definitiva, no se diferencian significativamente al 95% respecto a sus
actitudes promedio en el tem Medioambiente(v13) mientras que s son diferentes respecto al tem
Confortabilidad(v14).

8.3.2.3. Ejercicios y Sintaxis


1. Segn el fichero SALUD.sav.Existe diferencia significativa de medias en el consumo de
alcohol durante el fin de semana(v57)
1.a.) Segn sea el sexo(v59)
1.b.) Segn el lugar de nacimiento(v60)
1.c.) Segn el abandono de estudios(v2)
51
Universidad de Deusto - ISBN 978-84-9830-628-6

1.a.) Estudiar si existe diferencia significativa de medias en el consumo de alcohol durante


el fin de semana segn sea el sexo de los consumidores.
Para ello es necesario realizar el anlisis mediante la prueba t para muestras independientes.
Tabla 1.a.1.
Estadsticos de grupo
Sexo
HOMBRE
MUJER

Consumo medio
alc. fin sem.

Desviacin
tp.
63.096
15.342

Media
27.49
6.43

185
37

Error tp. de
la media
4.639
2.522

Tabla 1.a.2.
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
Consumo medio
alc. fin sem.

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

7.652

Prueba T para la igualdad de medias

Sig.

.006

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

2.015

220

.045

21.059

10.452

.461

41.658

3.988

213.506

.000

21.059

5.280

10.651

31.468

De la prueba de Levene para la igualdad de varianzas hallamos una significacin de 0.006 (0,6%)
correspondiente a una F=7.662 por lo que se concluye que las dos muestras presentan diferente
varianza al nivel de confianza del 99%. Por otra parte, existe una diferencia de medias con t=3.988
siendo la significacin bilateral de 0.000 (0,0%) mirando en la lnea segunda titulada a mano
izquierda No se han asumido varianzas iguales por lo que el grupo formado por los hombres
muestra un consumo medio de alcohol de 27.49 consumo medio muy superior al 6.43 del grupo
formado por las mujeres.
Podemos concluir que existe una diferencia significativa de medias en el consumo medio de alcohol
el fin de semana si tenemos en cuenta la variable sexo, siendo los hombres lo que mas alcohol
consumen.
1.b.) Estudiar si existe diferencia significativa de medias en el consumo medio de alcohol
durante el fin de semana en relacin si los consumidores son de Logroo o del resto de provincia.
Para ello se realiza de nuevo un anlisis mediante la prueba t para muestras independientes.
Tabla 1.b.1.
Estadsticos de grupo

Consumo medio
alc. fin sem.

Lugar nacimiento
LOGROO
RESTO PROVINCIA

N
75
62

Media
26.52
15.90

Desviacin
tp.
58.237
24.553

52
Universidad de Deusto - ISBN 978-84-9830-628-6

Error tp. de
la media
6.725
3.118

Tabla 1.b.2.
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
Consumo medio
alc. fin sem.

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

Prueba T para la igualdad de medias

Sig.

5.790

.017

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

1.340

135

.183

10.617

7.925

-5.056

26.289

1.432

103.442

.155

10.617

7.412

-4.083

25.317

De la prueba de Levene para la igualdad de varianzas tambin aqu se deduce que existe diferentes
varianzas entre los dos grupos (F=5.79; sig.=1.7%). El estadstico t=1.340 tiene una significacin de
15.5% por lo que se concluye la ausencia de diferencia significativa de medias entre los nacidos en
Logroo (media de 26.52) frente a los nacidos en el resto de la provincia (media de 15.90) respecto
al consumo de alcohol durante el fin de semana.
1.c.) Estudiar si existe diferencia de medias en el consumo de alcohol durante el fin de
semana en relacin a si abandonaron o no los estudios.
Tras realizar los correspondientes clculos mediante la prueba t para muestras independientes
resulta:
Tabla 1.c.1.
Estadsticos de grupo

Consumo medio
alc. fin sem.

Abandono de estudios
no
si

Desviacin
tp.
18.810
63.327

Media
12.11
26.42

56
165

Error tp. de
la media
2.514
4.930

Tabla 1.c.2.
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
Consumo medio
alc. fin sem.

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

Sig.

6.522

.011

Prueba T para la igualdad de medias

Sig. (bilateral)

-1.665

219

.097

-14.317

8.600

-31.266

2.631

-2.587

216.685

.010

-14.317

5.534

-25.224

-3.410

gl

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

Diferencia
de medias

Como en los casos anteriores, la diferencia de varianzas entre los dos grupos es significativa
(sig.=1.1%) as como la diferencia de medias (t=-2.587; sig.=1.0%) y, por tanto, el grupo formado
por los que s abandonaron los estudios muestra un consumo medio de alcohol de 26.42 consumo
medio muy superior al 12.11 del grupo formado por los que no abandonaron los estudios.
Sintaxis para el Ejercicio 1

53
Universidad de Deusto - ISBN 978-84-9830-628-6

2. Del fichero ESCUEL.sav, recodifar la clase social (v35) en dos grupos: alta(1 y 2) y baja (3 y
4). Verificar si:
2.a.) Existe diferencia significativa entre ambos grupos respecto de lo que echan en
falta que les hayan enseado educacin sexual (v33)
2.b.) Respecto de no pasarse la vida viendo televisin (v27)
2.a.) Estudiar si existe diferencia de medias teniendo en cuenta la clase social de pertenencia
de los encuestados en relacin a si echan en falta que les hayan enseado no pasarse la vida viendo
la televisin.
La prueba t para muestras independientes da los siguientes resultados en las dos variables.
Tabla 2.a.1. y 2.b.1.
Estadsticos de grupo
v35r
1.00
2.00
1.00
2.00

Educ.Sexual
Ver TV

N
52
35
67
50

Media
7.60
6.91
1.90
1.98

Desviacin
tp.
1.390
2.318
.721
.769

Error tp. de
la media
.193
.392
.088
.109

Tabla 2.a.2. y 2.b.2.


Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
Educ.Sexual

Ver TV

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

Sig.

10.932

.001

.094

.760

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

1.714

85

.090

1.561

50.471

-.610

115

-.604

101.798

Diferencia
de medias

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

.682

.398

-.109

1.473

.125

.682

.437

-.195

1.559

.543

-.084

.139

-.359

.190

.547

-.084

.140

-.362

.193

Las conclusiones deducibles de los resultados son claras: no hay diferencia de medias ni en ver TV
ni en educacin sexual entre las dos clases sociales (sign.=11.5% y 54.3% respectivamente) as
como tampoco la hay entre las varianzas de los dos grupos sociales en ninguna de las dos variables
(sig.=5.8% y 76.0% respectivamente).
Sintaxis para el Ejercicio 2

54
Universidad de Deusto - ISBN 978-84-9830-628-6

3. Otros ejercicios y Sintaxis


3.1. Del Fichero CAMPAA.sav obtener y analizar la diferencia significativa de medias segn
la Religin (v25) clasificada en Catlicos (1-2-3-4=1) y No Catlicos (5-6-7-8=2) respecto a las
variables Rechazar (v3), Explicar (v5) y Promiscuidad (v7).
Algunas soluciones numricas relevantes:
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
V3 catlicos deben
rechazarla

V5 campaa ayudar a
explicar sexo

V7 campaa fomenta
promiscuidad

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

Sig.

.116

3.626

.149

.733

.059

.700

Prueba T para la igualdad de medias

gl

Diferencia
de medias

Sig. (bilateral)

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

-.430

167

.668

-.089

.207

-.498

.320

-.430

60.139

.669

-.089

.207

-.503

.325

2.016

165

.045

.385

.191

.008

.761

2.145

66.790

.036

.385

.179

.027

.742

1.945

167

.053

.411

.211

-.006

.829

1.929

59.425

.058

.411

.213

-.015

.838

Sintaxis para el Ejercicio 3.1

3.2. Realizar el mismo ejercicio anterior pero tan solo para el grupo de Estudios Bsicos (v24)
interpretando los resultados y comparndolos con los anteriores.
Algunas soluciones numricas relevantes:
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
V3 catlicos deben
rechazarla

V5 campaa ayudar a
explicar sexo

V7 campaa fomenta
promiscuidad

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

4.626

.059

1.423

Sig.
.044

.811

.247

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

-2.451

20

.024

-1.474

.601

-2.728

-.219

-1.447

2.151

.277

-1.474

1.018

-5.573

2.626

3.912

18

.001

2.000

.511

.926

3.074

3.288

2.462

.061

2.000

.608

-.199

4.199

-.534

20

.599

-.456

.854

-2.238

1.326

-.369

2.242

.744

-.456

1.237

-5.263

4.351

55
Universidad de Deusto - ISBN 978-84-9830-628-6

Sintaxis para el Ejercicio 3.2

3.3. Crear una nueva variable VSP en el fichero SALUD.sav que recoja las puntuaciones
totales de los sujetos en la escala de Salud Psicopatolgica (de la v33 a la v52) y analizar la
diferencia significativa de medias segn el Lugar de Nacimiento (v60) respecto a esa nueva variable
VSP.
Algunas soluciones numricas relevantes:
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
VSP

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

Sig.

.294

.589

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

.778

135

.438

.62344

.80086

-.96041

2.20730

.783

132.740

.435

.62344

.79617

-.95137

2.19825

Sintaxis para el Ejercicio 3.3

3.4. Realizar el mismo ejercicio anterior para cada uno de los dos grupos de la variable Actividad
o Tarea Ocupacional (v4) comparando los resultados de los dos grupos.
Algunas soluciones numricas relevantes:

56
Universidad de Deusto - ISBN 978-84-9830-628-6

Prueba de muestras independientes


Prueba de Levene
para la igualdad de
varianzas

F
VSP

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

Prueba T para la igualdad de medias

Sig.

.932

.335

gl

Sig. (bilateral)

Diferencia
de medias

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

Error tp. de
la diferencia

3.783

218

.000

2.49921

.66068

1.19709

3.80134

3.770

211.064

.000

2.49921

.66298

1.19231

3.80612

Sintaxis para el Ejercicio 3.4

3.5. Segn la variable Leadership/Liderazgo (v7) clasificada en Alto (1=1-2) y Bajo (2=3-4) del
Fichero CITEC.sav obtener y analizar la diferencia significativa de medias respecto a las
variables Cientficos Peligrosos (v23), Productos (v38) y Nuevas Invenciones (v39).
Algunas soluciones numricas relevantes:
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
Cientficos peligrosos

Productos

Nuevas invenciones

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

Sig.

13.117

.000

6.108

.014

12.741

.000

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

-.900

1019

.368

-,080

,089

-,254

,094

-.869

611.274

.385

-,080

,092

-,260

,100

-3.367

1019

.001

-,267

,079

-,422

-,111

-3.344

656.891

.001

-,267

,080

-,424

-,110

-2.718

1019

.007

-,208

,077

-,359

-,058

-2.595

594.163

.010

-,208

,080

-,366

-,051

Sintaxis para el Ejercicio 3.5

57
Universidad de Deusto - ISBN 978-84-9830-628-6

8.3.3. PRUEBA T PARA MUESTRAS RELACIONADAS


8.3.3.0. Frmulas y Aplicacin
8.3.3.0.1. Frmulas
Estadstico t
t=

(X 1 X 2 ) 0




2
S1
S2
S
S
+ 2 2 r12 1 2

N1
N 2
N 1 N 2


X 1 , N 1 , S1 = Media, Tamao y Estimacin de D.T. de la
variable 1.

X 2 , N 2 , S 2 = Media, Tamao y Estimacin de D.T. de la
variable 2.
r12 = coeficiente de correlacin de Pearson entre var.1 y
var.2

8.3.3.0.2. Tipo de variables requeridas


Es un comando relativamente similar al anterior pero se diferencia en que parte del supuesto de la
correlacin existente entre dos variables cuantitativas. Si se quiere averiguar si entre tales dos
variables cuantitativas existe diferencia significativa de medias habr de tenerse en cuenta esa
correlacin existente entre ellas. Vase el ejemplo realizado con las variables dependientes
cuantitativas Litronas (v7), Tranquilizantes (v21) del fichero DROGODE.sav.
8.3.3.0.3. Utilidades e Interpretacin
A diferencia del comando anterior que verifica la diferencia de medias entre dos grupos de sujetos
respecto de una determinada variable este comando aclara si entre dos variables hay o no diferencia
de medias. Es til, por tanto, cuando se desea comprobar cmo se comportan determinadas
variables cuantitativas de un fichero de datos en el sentido concreto de si presentan similar
promedio o no.
Tambin aqu es importante la prueba de Levene para la igualdad de varianzas. Si no son
iguales deberemos guiarnos por el parmetro No se han asumido varianzas iguales. All
buscaremos el valor de t y su significacin (de nuevo ser significativo aquel valor cuya
significacin sea menor que 0.05), para as poder dar una interpretacin completa de los resultados.
Si la prueba de Levene no resulta significativa pasaramos a fijarnos en el parmetro Se han
asumido varianzas iguales, procediendo a actuar de la misma manera que antes. En cualquier caso,
puede resultar interesante ver el ejemplo recogido en los puntos 8.3.2.3 y 8.3.2.4, en el que se
trabaja con esta prueba.
8.3.3.1. Manejo del SPSS
Para acceder a este comando una vez abierto el fichero, en este caso DROGODE.sav es
necesario dirigirse/PULSAR, al igual que en los apartados anteriores al men Analizar, y dentro de
l al apartado Comparar medias para finalmente PULSAR en Prueba T para muestras
relacionadas (Fig. 67)

58
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 67.

Dos muestras estn en principio relacionadas bien cuando as nos lo indiquen o bien en aquellos
casos en que es una misma muestra (los mismos sujetos) la que responde a dos preguntas o a una
pregunta en dos momentos distintos. Esto significa que cuando en un determinado archivo de datos
se desee hacer una comparacin de medias entre dos variables obviamente cuantitativas (y se
supone que tratan del mismo tema) se tendr que tener en cuenta el nivel o grado de correlacin que
tengan porque aunque su diferencia de medias sea pequea tender a ser significativa si la
correlacin es alta.
Para la ejecucin de este comando, se PULSA sobre una variable que quedar coloreada y cuyo
nombre (por ejemplo, v7) aparecer en la parte inferior izquierda en el recuadro titulado
Selecciones actuales, despus sobre la otra variable (v21) que tambin aparecer en esa parte
inferior. Para trasladarlas al rectngulo en blanco titulado Variables relacionadas basta PULSAR
en el pequeo recuadro con la flecha orientada hacia la derecha (Fig. 68). Y as sucesivamente con
todos los pares de variables sobre los que se que quiera saber si presentan diferencia significativa de
medias. Debe notarse que en este caso cuando una variable es sealada/transportada no desaparece
del recuadro de la izquierda porque puede volver a ser sealada ms veces para compararla con
otras variables.
Efectivamente, se ve en la figura la comparacin entre v7 v21, v17 v21 y est dispuesta la
comparacin v18 v21. Si se PULSA en Opciones se podr designar el Intervalo de confianza as
como los Valores perdidos. Finalmente, se PULSA en Aceptar y el programa ofrecer los resultados
de la operacin.
En el ejemplo prctico se han seleccionado las cuatro comparaciones de medias siguientes:
Litronas(v7) Tranquilizantes(v21); Tabaco(v17) Tranquilizantes(v21); Colocarse(v18)
Tranquilizantes(v21) y Cocana(v13) Tranquilizantes(v21), es decir, se ha querido conocer si el
promedio acerca de cunto consideran como toxicomana el tomar Tranquilizantes por parte de las
amas de casa se diferencia o no de lo que consideran como toxicomana el beber Litronas, el
Colocarse con los amigos, el consumir ms de un paquete de Tabaco al da o consumir Cocana.
Figura 68.

59
Universidad de Deusto - ISBN 978-84-9830-628-6

8.3.3.2. Resultados e Interpretacin


Los resultados concretos a los que se llega son los siguientes:
Prueba T
Estadsticos de muestras relacionadas

Par 1
Par 2
Par 3
Par 4

Chico-litronas
Tranquilizantes
Tabaco
Tranquilizantes
Joven-colocarse
Tranquilizantes
Cocana
Tranquilizantes

Media
5.45
5.31
5.50
5.31
6.70
5.35
7.43
5.35

N
105
105
106
106
105
105
105
105

Desviacin
tp.
1.860
2.100
1.977
2.090
1.698
2.057
1.770
2.057

Error tp. de
la media
.182
.205
.192
.203
.166
.201
.173
.201

Correlaciones de muestras relacionadas


N
Par 1
Par 2
Par 3
Par 4

Chico-litronas y
Tranquilizantes
Tabaco y Tranquilizantes
Joven-colocarse y
Tranquilizantes
Cocana y Tranquilizantes

Correlacin

Sig.

105

.375

.000

106

.628

.000

105

.650

.000

105

.542

.000

Prueba de muestras relacionadas


Diferencias relacionadas

Media
Par 1
Par 2
Par 3
Par 4

Chico-litronas Tranquilizantes
Tabaco - Tranquilizantes
Joven-colocarse Tranquilizantes
Cocana - Tranquilizantes

Desviacin
tp.

Error tp. de
la media

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

gl

Sig. (bilateral)

.133

2.223

.217

-.297

.564

.614

104

.540

.189

1.757

.171

-.150

.527

1.105

105

.271

1.352

1.605

.157

1.042

1.663

8.633

104

.000

2.076

1.849

.180

1.718

2.434

11.509

104

.000

En el primer cuadro hay dos tipos de datos importantes: por un lado, las medias de cada variable
con su desviacin tpica estimada y, por otro lado, el tamao de muestra. Sucede que curiosamente
las medias de una misma variable, por ejemplo Tranquilizantes, no presenta la misma media aun
teniendo el mismo tamao (105 sujetos) en la comparacin Litronas-Tranquilizantes que en la
Cocana-Tranquiliantes. La explicacin est en que los 105 sujetos no son los mismos en un caso
que en el otro debido a que se ha optado por la opcin Excluir casos segn anlisis deferida a los
valores perdidos. Uno o ms determinados sujetos no sern contabilizados en la comparacin
Litronas-Tranquilizantes si presentan valores perdidos en Litronas y a su vez otros sujetos distintos
no sern contabilizados en la Cocana-Tranquilizantes. El nmero de sujetos puede ser idntico pero
no son los mismos sujetos.
El segundo cuadro expone los coeficientes de correlacin en cada caso. Aun no siendo alto el
coeficiente r de Pearson resulta significativo en todos ellos, es decir, hay relacin entre las
respuestas dadas a Tranquilizantes y las dadas al resto de las variables. Del ltimo cuadro hay que
subrayar como ms fundamental la columna de la diferencia de medias (0.13; 0.19; 1.35 y 2.08), la
columna de la t (0.614; 1.105; 8.633 y 11.509) y sobre todo la columna de la Significacin
Bilateral que en definitiva indica si hay diferencia significativa o no en cada caso. En los dos
primeros Litronas-Tranquilizantes y Tabaco-Tranquilizantes no se da diferencia significativa
(0.540; 0.271); los sujetos piensan por trmino medio prcticamente lo mismo. En los otros dos
casos, Colocarse-Tranquilizantes y Cocana-Tranquilizantes, sin embargo, s hay diferencia

60
Universidad de Deusto - ISBN 978-84-9830-628-6

significativa (0.000; 0.000). Se percibe, por tanto, como mucho ms toxicmano el Colocarse y
principalmente tomar cocana que no consumir Tranquilizantes (medias: 6.70 y 7.43 frente a 5.35).
8.3.3.3. Ejercicios y Sintaxis
1.

Del fichero ESCUEL.sav,


1.a.) Calcular y analizar las diferencias de medias relacionadas entre las variables v13,
v14, v15 y v16. Realizar los clculos para toda la muestra
1.b.) Realizar los clculos slo para el grupo de clase social alta.

1.a.) Calcular y analizar las diferencias de medias relacionadas entre las variables v13, v14,
v15 y v16. Realizar los clculos para toda la poblacin
Debe entenderse que comparar la diferencia de medias entre muestras relacionadas de las variables
expuestas supone comparar todas ellas entre s. Los resultados de tal comparacin son los siguientes
para toda la poblacin:
Tabla 1.a.1.
Estadsticos de muestras relacionadas

Par 1
Par 2
Par 3
Par 4
Par 5
Par 6

Trabajar en grupo
Capacidad de crstica
Trabajar en grupo
Valenta
Trabajar en grupo
Expresin corporal
Capacidad de crstica
Valenta
Capacidad de crstica
Expresin corporal
Valenta
Expresin corporal

Media
6.00
7.10
5.96
6.50
5.97
6.86
7.10
6.51
7.13
6.88
6.49
6.86

N
116
116
117
117
116
116
116
116
115
115
116
116

Desviacin
tp.
2.381
2.338
2.415
2.132
2.424
2.406
2.338
2.137
2.330
2.410
2.141
2.406

Error tp. de
la media
.221
.217
.223
.197
.225
.223
.217
.198
.217
.225
.199
.223

Tabla 1.a.2.
Correlaciones de muestras relacionadas
N
Par 1
Par 2
Par 3
Par 4
Par 5
Par 6

Trabajar en grupo y
Capacidad de crstica
Trabajar en grupo y
Valenta
Trabajar en grupo y
Expresin corporal
Capacidad de crstica
y Valenta
Capacidad de crstica
y Expresin corporal
Valenta y Expresin
corporal

Correlacin

Sig.

116

.465

.000

117

.381

.000

116

.364

.000

116

.294

.001

115

.387

.000

116

.201

.031

61
Universidad de Deusto - ISBN 978-84-9830-628-6

Tabla 1.a.3.
Prueba de muestras relacionadas
Diferencias relacionadas

Media
Par 1
Par 2
Par 3
Par 4
Par 5
Par 6

Trabajar en grupo Capacidad de crstica


Trabajar en grupo Valenta
Trabajar en grupo Expresin corporal
Capacidad de crstica
- Valenta
Capacidad de crstica
- Expresin corporal
Valenta - Expresin
corporal

Desviacin
tp.

Error tp. de
la media

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

gl

Sig. (bilateral)

-1.103

2.440

.227

-1.552

-.655

-4.870

115

.000

-.538

2.541

.235

-1.004

-.073

-2.292

116

.024

-.897

2.723

.253

-1.397

-.396

-3.546

115

.001

.595

2.664

.247

.105

1.085

2.405

115

.018

.252

2.625

.245

-.233

.737

1.030

114

.305

-.371

2.882

.268

-.901

.159

-1.385

115

.169

Se observa que si existe diferencia significativa de medias, debido a la que la significacin bilateral
es menor que 0.05 (5%), en las parejas:
Trabajar en grupo capacidad de critica, con una significacin de 0.000 (0.0%)
Trabajar en grupo- valenta, con una significacin de 0.001 (0.1%)
Trabajar en grupo expresin corporal, con una significacin de 0.024 (2.4%)
Capacidad de critica- expresin corporal, con una significacin de 0.018 (1.8%)
Es constatable que la variable trabajar en grupo es comn y por lo tanto podemos concluir que es
clave en determinar la diferencias de medias en los distintas parejas de variables. Por otra parte,
efectivamente de los seis grupos de parejas, en cuatro existe correlacin entre ellas y en dos no con
lo cual en estos dos casos pudiera realizarse la comparacin de medias como si fueran variables
independientes.
1.b. Realizar los clculos slo para el grupo de clase social alta.
En este apartado debe seleccionarse el grupo de clase social alta para realizar con ese grupo de
sujetos las pruebas de muestras relacionadas entre las cuatro variables.
Tabla 1.b.1.
Estadsticos de muestras relacionadas

Par 1
Par 2
Par 3
Par 4
Par 5
Par 6

Trabajar en grupo
Capacidad de crstica
Trabajar en grupo
Valenta
Trabajar en grupo
Expresin corporal
Capacidad de crstica
Valenta
Capacidad de crstica
Expresin corporal
Valenta
Expresin corporal

Media
7.21
8.24
7.21
6.56
7.21
7.62
8.24
6.56
8.24
7.62
6.56
7.62

N
34
34
34
34
34
34
34
34
34
34
34
34

Desviacin
tp.
2.100
1.327
2.100
2.149
2.100
2.030
1.327
2.149
1.327
2.030
2.149
2.030

62
Universidad de Deusto - ISBN 978-84-9830-628-6

Error tp. de
la media
.360
.228
.360
.369
.360
.348
.228
.369
.228
.348
.369
.348

Tabla 1.b.2.
Correlaciones de muestras relacionadas
N
Par 1

Trabajar en grupo y
Capacidad de crstica
Trabajar en grupo y
Valenta
Trabajar en grupo y
Expresin corporal
Capacidad de crstica
y Valenta
Capacidad de crstica
y Expresin corporal
Valenta y Expresin
corporal

Par 2
Par 3
Par 4
Par 5
Par 6

Correlacin

Sig.

34

.374

.030

34

.249

.156

34

.367

.033

34

.165

.351

34

.068

.702

34

.287

.100

Tabla 1.b.3.
Prueba de muestras relacionadas
Diferencias relacionadas

Media
Par 1
Par 2
Par 3
Par 4
Par 5
Par 6

Trabajar en grupo Capacidad de crstica


Trabajar en grupo Valenta
Trabajar en grupo Expresin corporal
Capacidad de crstica
- Valenta
Capacidad de crstica
- Expresin corporal
Valenta - Expresin
corporal

Desviacin
tp.

Error tp. de
la media

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

gl

Sig. (bilateral)

-1.029

2.022

.347

-1.735

-.324

-2.968

33

.006

.647

2.604

.447

-.262

1.556

1.449

33

.157

-.412

2.324

.399

-1.223

.399

-1.033

33

.309

1.676

2.332

.400

.863

2.490

4.192

33

.000

.618

2.349

.403

-.202

1.437

1.533

33

.135

-1.059

2.498

.428

-1.930

-.187

-2.472

33

.019

Los resultados muestran algunos cambios respecto a los obtenidos para toda la poblacin. Aqu s
existe diferencia significativa de medias (sig. menor que 0.05) en las parejas:

Trabajar en grupo- capacidad critica, con una significacin de 0.006 (0.6%)


Capacidad critica- valenta, con una significacin de 0.000 (0.0%)
Expresin corporal- valenta, con una significacin de 0.019 (1.9%)

La variable trabajar en grupo ya no presenta tantas diferencias como antes y, por otra parte, aparece
la diferencia significativa entre expresin corporal- valenta que antes no exista. Todo ello
demuestra que el grupo de clase social alta no piensa de la misma forma que el colectivo general y
se diferencia de l al menos en la forma de contestar a estas cuatro variables.

63
Universidad de Deusto - ISBN 978-84-9830-628-6

Sntesis para el Ejercicio 1

2. Otros Ejercicios y Sintaxis


2.1. Calcular y analizar la diferencia significativa de medias relacionadas entre las variables
Olvidar Penas (v6), Litronas (v7), Txikitero (v9) y Joven Herona (v11) del Fichero
DROGODE.sav.
Algunas soluciones numricas relevantes:
Prueba de muestras relacionadas
Diferencias relacionadas

Media
Par 1
Par 2
Par 3
Par 4
Par 5
Par 6

Borracho-penas Chico-litronas
Borracho-penas Txikitero
Borracho-penas Herona
Chico-litronas - Txikitero
Chico-litronas - Herona
Txikitero - Herona

Desviacin
tp.

Error tp. de
la media

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

gl

Sig. (bilateral)

1.726

2.105

.204

1.321

2.132

8.446

105

.000

2.159

2.232

.216

1.731

2.587

10.003

106

.000

-.290

2.042

.197

-.681

.102

-1.468

106

.145

.449
-2.009
-2.444

1.895
1.891
2.163

.183
.183
.208

.085
-2.372
-2.857

.812
-1.647
-2.032

2.449
-10.992
-11.744

106
106
107

.016
.000
.000

Sintaxis para el Ejercicio 2.1

2.2. Realizar los mismos clculos del ejercicio anterior para cada uno de los grupos de Religin
(v3) interpretando los resultados y comparndolos entre ellos.
64
Universidad de Deusto - ISBN 978-84-9830-628-6

Algunas soluciones numricas relevantes:


Prueba de muestras relacionadasa
Diferencias relacionadas

Religin
NO CREYENTE

Media
Par 1
Par 2
Par 3

MUY CATLICO

Par 4
Par 5
Par 6
Par 1
Par 2
Par 3

Par 4
Par 5
Par 6
POCO CATLICO Par 1
Par 2
Par 3
Par 4
Par 5
Par 6

Borracho-penas Chico-litronas
Borracho-penas Txikitero
Borracho-penas Herona
Chico-litronas - Txikitero
Chico-litronas - Herona
Txikitero - Herona
Borracho-penas Chico-litronas
Borracho-penas Txikitero
Borracho-penas Herona
Chico-litronas - Txikitero
Chico-litronas - Herona
Txikitero - Herona
Borracho-penas Chico-litronas
Borracho-penas Txikitero
Borracho-penas Herona
Chico-litronas - Txikitero
Chico-litronas - Herona
Txikitero - Herona

Desviacin
tp.

Error tp. de
la media

2.308

2.136

.593

1.923

2.722

-.385

2.022

-.385
-2.692
-2.308

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

gl

Sig. (bilateral)

1.017

3.599

3.895

12

.002

.755

.278

3.568

2.547

12

.026

.561

-1.607

.837

-.686

12

.506

1.193
2.175
2.250

.331
.603
.624

-1.105
-4.007
-3.668

.336
-1.378
-.948

-1.162
-4.463
-3.697

12
12
12

.268
.001
.003

1.222

1.726

.288

.638

1.806

4.250

35

.000

1.750

2.005

.334

1.071

2.429

5.236

35

.000

-.556

1.731

.289

-1.141

.030

-1.926

35

.062

.568
-1.730
-2.297

2.102
1.677
2.106

.346
.276
.346

-.133
-2.289
-3.000

1.268
-1.170
-1.595

1.642
-6.272
-6.634

36
36
36

.109
.000
.000

1.912

2.278

.302

1.308

2.517

6.338

56

.000

2.474

2.261

.299

1.874

3.074

8.261

56

.000

-.123

2.245

.297

-.718

.473

-.413

56

.681

.561
-2.035
-2.596

1.861
1.945
2.219

.247
.258
.294

.068
-2.551
-3.185

1.055
-1.519
-2.008

2.277
-7.898
-8.835

56
56
56

.027
.000
.000

a. No se han calculado los estadsticos para uno o ms de los archivos segmentados.

Sintaxis para el Ejercicio 2.2

2.3. Obtener los resultados interpretndolos sobre la diferencia significativa de medias


relacionadas entre las variables Confortabilidad (v21), Cientficos Peligrosos (v23), Desarrollo
Industrial (v35) y Beneficios (v43) del Fichero CITEC.sav.
Algunas soluciones numricas relevantes:

65
Universidad de Deusto - ISBN 978-84-9830-628-6

Prueba de muestras relacionadas


Diferencias relacionadas

Media
Par 1
Par 2
Par 3
Par 4
Par 5
Par 6

Confortabilidad Cientficos peligrosos


Confortabilidad Desarrollo industrial
Confortabilidad Beneficios
Cientficos peligrosos
- Desarrollo industrial
Cientficos peligrosos
- Beneficios
Desarrollo industrial Beneficios

Desviacin
tp.

Error tp. de
la media

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

gl

Sig. (bilateral)

-,758

1,703

,053

-,863

-,653

-14.221

1020

.000

-1,949

1,617

,051

-2,048

-1,850

-38.527

1020

.000

-,123

1,277

,040

-,202

-,045

-3.089

1020

.002

-1,191

1,702

,053

-1,295

-1,086

-22.363

1020

.000

,635

1,774

,056

,526

,744

11.430

1020

.000

1,826

1,728

,054

1,720

1,932

33.763

1020

.000

Sintaxis para el Ejercicio 2.3

4. Considerando solamente al grupo de 15-24 Aos de Edad (v4) realizar los clculos del ejercicio
anterior y comparar los resultados.
Algunas soluciones numricas relevantes:
Prueba de muestras relacionadas
Diferencias relacionadas

Media
Par 1
Par 2
Par 3
Par 4
Par 5
Par 6

Confortabilidad Cientficos peligrosos


Confortabilidad Desarrollo industrial
Confortabilidad Beneficios
Cientficos peligrosos
- Desarrollo industrial
Cientficos peligrosos
- Beneficios
Desarrollo industrial Beneficios

Desviacin
tp.

Error tp. de
la media

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

gl

Sig. (bilateral)

-1,123

1,656

,112

-1,344

-,903

-10.039

218

.000

-2,146

1,672

,113

-2,369

-1,923

-18.997

218

.000

-,146

1,309

,088

-,320

,028

-1.652

218

.100

-1,023

1,834

,124

-1,267

-,779

-8.255

218

.000

,977

1,801

,122

,737

1,217

8.031

218

.000

2,000

1,745

,118

1,768

2,232

16.959

218

.000

Sintaxis para el Ejercicio 2.4

66
Universidad de Deusto - ISBN 978-84-9830-628-6

8.4. TABLAS DE CONTINGENCIA


8.4.0. Frmulas y Aplicacin
8.4.0.1. Frmulas
COEFICIENTE 2
2 =

f k

CORRELACIONES
Coeficiente r de Pearson

( Fr Ft ) 2
Ft

f k = nmero de filas por nmero de


columnas, o sea, nmero total de
casillas (celdas).
Fr = frecuencias reales en cada casilla

rs =

XY X Y
N
X ( X ) N Y ( Y )

X e Y= cada uno de los valores de la variable X y de


la variable Y.

Ft = frecuencias tericas que correspondera a


cada casilla.

VARIABLES NOMINALES
Razn de Verosimilitud
L2 ( 2 ) = 2

f k

Fr ln

ln = logaritmo neperiano
1

Fr
Ft

VARIABLES ORDINALES
Coeficiente Gamma de Goodman y
Kruskal
CD
C+D

Gamma =

Coeficiente Tau-a de Kendall

Probabilidad exacta de Fisher

CD
(a + b)!(c + d )!(a + c)!(c + d )!
Tau a =
a! b! c! d ! N !
T
Coeficiente
Tau-b de Kendall
Las casillas a, b, c y d son las cuatro de
una tabla de 2 por 2
CD
Tau b =
(T T1 )(T T2 )
P=

a
c

b
d

Coeficiente Tau-c de Kendall


Tau c =

(C D)2 S
N 2 ( S 1)

Asociacin Lineal por Lineal (Test


de Mantel-Haenszel. Test de
Cochran)

Coeficiente d de Somerss
Modo asimtrico

Test de Asociacin Lineal = r 2 ( N 1)


r2 = correlacin entre variables nominales
N = total de datos

Modo Simtrico

d =

d =

CD
C + D + T1
CD
(C + D + T1 + C + D + T2 ) / 2

N ( N 1)
nmero de pares de sujetos diferentes
2
posibles (N=nmero de sujetos)
C = nmero de pares de sujetos que estn
distribuidos en el mismo orden en las dos
variables.
D = nmero de pares de sujetos que estn
distribuidos
en orden inverso en las dos
variables.
T1 = nmero de pares de sujetos empatados en la
primera variable (la dependiente) pero no lo
estn en la otra (independiente).
T =

Coeficiente de Contingencia C
C=

2
2 + N

T2 = nmero de pares de sujetos empatados en la


segunda variable pero no lo estn en la primera.

67
Universidad de Deusto - ISBN 978-84-9830-628-6

Coeficiente
=

bc ad
(a + b)(c + d )(a + c)(b + d )

OTROS COEFICIENTES

Coeficiente V de Cramer
V =

Coeficiente Kappa

N (k 1)

K=

k = el nmero de filas o de columnas que sea


menor.

Coeficiente Lambda
Modo Asimtrico

Coeficiente de Riesgo Relativo


Riesgo Re lativoY1 =

f i Fmax j
1

=
N Fmax j
r

yx

Fr acuerdo Ft acuerdo
N Ft acuerdo

Pa =

a
a+b

Pb =

Pa
P
Riesgo Re lativoY2 = b
Pc
Pd
b
a+b

Pc =

d
c
Pd =
c+d
c+d

yx = el coeficiente Lambda cuando y se toma


como var. dependiente y como la independiente
x.
fi = las frecuencias mximas (frecuencias
modales) de cada una de las columnas.
Coeficiente 2 de McNemar
Fmaxj = la mayor de las frecuencias totales de
(b c )2
las filas
2 =
(b + c )

Modo Simtrico
r
k
f j + f i Fmax j Fmaxi
=1 1
2 N Fmax j Fmaxi

Coeficiente de Incertidumbre
Cuando las
dependiente

columnas

son

el

Coeficiente Tau de Goodman y Kruskal


(Tau-y)
atributo
Tau y =

U ( F ) + U (C ) U ( FC )
UC =

U (C )

U (F ) =

n ij

ln

U (C ) =

1
h

U (F ) =

ij

N
k

ij

N
h

n ij

ln

ij

N
n ij

N ln N
1

E1 E 2
E1

r N n

j
(n j )
E1 =
N
1

r k n f

i
ji
( f ji )
E2 =
n
1 1
i

E1 = Errores esperados al predecir las categoras de la


variable dependiente
E2 = Errores esperados al predecir las categoras de la
variable independiente
N = Total de datos
nj = Frecuencia total para cada fila
ni = Frecuencia total para cada columna
fji = frecuencia de cada casilla ji

NOMINAL POR INTERVALO


68
Universidad de Deusto - ISBN 978-84-9830-628-6

Coeficiente Eta
Eta =

Suma de Cuadrados Intergrupos


Suma de Cuadrados Total

Residuos Tipificados Corregidos


Re s . Tip . Correg . =

F fila
Var. = 1
N

Re s.Tip .
Var .


F
1 columna

N

8.4.0.2. Tipo de variables requeridas


Se trata de una asociacin entre dos variables cualitativas o discretas, teniendo cada una P y Q
categoras respectivamente.
Este comando permite analizar el problema estadstico de la asociacin entre dos variables
cualitativas, es decir, permite conocer si las categoras/grupos de una variable cualitativa se reparten
porcentualmente por igual en las categoras/grupos de otra variable tambin cualitativa. Por
ejemplo, si los hombres presentan el mismo Nivel de Estudios que las mujeres o si los muy
catlicos piensan igual sobre el grado de toxicomana que representa el tomar alcohol respecto a los
poco catlicos y a los ateos, etc. Lgicamente, si hay asociacin quiere decir que hay repartos
porcentuales desiguales o lo que es lo mismo que una determinada variable influye o incluso
determinada los resultados de la otra variable. De ah que, usualmente, una de las dos variables sea
tomada como variable explicativa o variable independiente y la otra la variable a explicar o variable
dependiente. Este reparto de funciones o denominaciones de cada una de las dos variable es
importante en todo Cruce de Variables.
Entre los coeficientes estadsticos usados en estos anlisis destaca el 2 (ji cuadrado) pero deben
sealarse otros importantes tales como el coeficiente (phi), la Correccin de Continuidad de
Yates, la Razn de Verosimilitud, la Asociacin Lineal por Lineal, el coeficiente V de Cramer, el
Test de Mantel-Haenszel, el Test de Cochran, el coeficiente (Lambda), la Tau de Goodman y
Kruskal (Tau-y), la d de Somers, el coeficiente Eta, el coeficiente Kappa, el coeficiente de Riesgo
Relativo, etc. Todos estos coeficientes aportan informacin interesante cuando se quiere conocer no
slo si existe asociacin o no sino si se pueden predecir los valores de una variable conociendo los
de la otra, qu riesgo se corre en esa prediccin, cunta variabilidad se explica, qu representa la
asociacin hallada sobre la asociacin mxima que pudiera darse con tales datos.
8.4.0.3. Utilidad e interpretacin
Por medio de este comando se resuelven ejercicios del tipo: la variable A est asociada a la
variable B o algunas categoras de una variable A tienen diferentes porcentajes respecto a
determinadas categoras de la variable B.
Si se nos preguntase si en el fichero CITEC.sav existe asociacin entre el nivel de educacin del
entrevistado (v8) y su opinin sobre si la ciencia hace peligrosos a los investigadores (v23),
acudiramos a un anlisis de tablas de contingencia. En este caso concreto sera recomendable
realizar una recodificacin de ambas variables ya que nos encontramos con muchas categoras que
complicaran el anlisis.
Como se ha sealado el coeficiente de asociacin ms utilizado es el 2 (ji cuadrado) siempre
teniendo en cuenta que al manejar variables discretas no puede hablarse de correlacin (propia de
69
Universidad de Deusto - ISBN 978-84-9830-628-6

variables continuas) sino de asociacin. Este coeficiente no tiene signo por lo que la direccin de la
asociacin entre variables ha de decidirla el investigador con el estudio de los porcentajes o por
indicacin terica previa. Es importarse darse cuenta de que el ji cuadrado depende del tamao de la
muestra no de los porcentajes.
Otro tema interesante en el estudio de una tabla de contingencia es el de la interaccin. Que exista
interaccin en alguna de las casillas quiere decir que existe una presencia de sujetos muy sealada
(mucho mayor o mucho menor) en esa casilla en comparacin al resto de casillas. Es decir, en
alguna casilla aparece un grupo de sujetos mayoritario o minoritario respecto de las dems lo cual
indica de inmediato que no existe un reparto proporcional de todos los sujetos entre todas las
casillas.

8.4.1. Manejo del SPSS


Para acceder a este comando se PULSA en Analizar, despus en Estadsticos descriptivos y, por
ltimo, en Tablas de contingencia tras lo cual aparece la ventana de dilogo de la Fig. 69.
Como se puede apreciar, se ha utilizado en este ejemplo la variable explicativa o independiente
Aos Educ. (v8), del fichero de datos CITEC.sav, que se ha colocado en el rectngulo titulado
Filas y se han colocado en el rectngulo titulado Columnas dos variables de contenido o
dependientes Recursos(v24) y Futuro(v25).
Figura 69.

Se pretende averiguar si las respuestas a esas dos preguntas o tems estn influenciadas por el nivel
de cultura medido por los aos de educacin. En medio de la ventana (Capa 1 de 1) se ofrece la
posibilidad de introducir una variable nueva, tal y como sucede tambin en la Figura 40. cuando se
trata de averiguar Medias para distintos grupos, que supondra realizar todo el estudio de asociacin
entre variables solicitado y que se realizar para cada uno de los grupos/categoras que tenga esa
nueva variable.
Debe advertirse, por otra parte, que la v8 ha sido recodificada en dos grupos (1-2=1 y 3-4=2) siendo
el 1=Menos cultura y 2=Mayor cultura. Tambin la v24 y v25 han sido recodificadas en dos grupos
70
Universidad de Deusto - ISBN 978-84-9830-628-6

(1-3=1 y 4-5=2) siendo 1=Acuerdo y 2=Desacuerdo. En ambos casos los ceros se toman como
valores perdidos.
Si se PULSA la opcin Estadsticos pueden elegirse (Fig. 70) los coeficientes estadsticos
necesarios que, en este caso, han sido Chi Cuadrado, Coeficiente de Contingencia y tambin la d
de Somers porque ambos tipos de variables pueden ser considerados de alguna forma como
variables ordinales al presentar las categoras un cierto orden que va de menos a ms.
Figura 70.

Una vez elegidos los estadsticos se PULSA en Continuar y se vuelve a la ventana principal de
dilogo (Fig. 69) en la que se puede PULSAR la opcin Casillas (Fig. 71).
Figura 71.

En esta ventana pueden solicitarse las Frecuencias (Observadas o Esperadas), los Porcentajes (por
Fila, por Columna o para el Total) y los Residuos (No tipificados, Tipificados o Tipificados
corregidos). En la figura aparecen solicitados los ms usuales: frecuencias observadas y porcentajes
por columnas, es decir, segn las categoras de la variable independiente.
Una vez sealadas las opciones de casillas se PULSA Continuar y se vuelve a la ventana principal
de dilogo en la que se puede PULSAR en Formato donde simplemente se ofrece si el orden de las
filas es ascendente o descendente.
Si, finalmente, se PULSA Aceptar en la ventana principal de dilogo (Fig. 69) el programa entra en
funcionamiento y realiza los clculos pertinentes referidos a las tablas de contingencia.
8.4.2. Resultados e Interpretacin
Los resultados que se obtienen en el ejemplo propuesto son los siguientes:
71
Universidad de Deusto - ISBN 978-84-9830-628-6

Tablas de contingencia
Resumen del procesamiento de los casos
Casos
Perdidos
N
Porcentaje
0
.0%
0
.0%

Vlidos
N
Porcentaje
1021
100.0%
1021
100.0%

Aos educ. * Recursos


Aos educ. * Futuro

Total
N
Porcentaje
1021
100.0%
1021
100.0%

Aos educ. * Recursos


Tabla de contingencia

v8r

Menos cultos
Ms cultos

Total

v24r
1.00
2.00
362
367
49.7%
50.3%
90
202
30.8%
69.2%
452
569
44.3%
55.7%

Recuento
% de v8r
Recuento
% de v8r
Recuento
% de v8r

Total
729
100.0%
292
100.0%
1021
100.0%

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos

Sig. asinttica
(bilateral)
.000

29.221

.000

30.677

.000

Valor
29.979b

gl

29.950

Sig. exacta
(bilateral)

Sig. exacta
(unilateral)

.000

.000

.000

1021

a. Calculado slo para una tabla de 2x2.


b. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada
es 129.27.
Medidas direccionales

Ordinal por ordinal

d de Somers

Error tp.
a
asint.
.030
.027
.033

Valor
.171
.156
.188

Simtrica
v8r dependiente
v24r dependiente

T aproximada
5.668
5.668
5.668

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis nula.

Medidas simtricas
Valor
Nominal por
nominal
N de casos vlidos

Coeficiente de
contingencia

Sig.
aproximada

.169

.000

1021

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis
nula.

Aos educ. * Futuro


Tabla de contingencia

v8r

Menos cultos
Ms cultos

Total

v25r
1.00
2.00
607
122
83.3%
16.7%
239
53
81.8%
18.2%
846
175
82.9%
17.1%

Recuento
% de v8r
Recuento
% de v8r
Recuento
% de v8r

Total
729
100.0%
292
100.0%
1021
100.0%

72
Universidad de Deusto - ISBN 978-84-9830-628-6

Sig.
aproximada
.000
.000
.000

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos

Sig. asinttica
(bilateral)
.588

.203

.652

.291

.589

Valor
.294b

gl

.294

Sig. exacta
(bilateral)

Sig. exacta
(unilateral)

.583

.324

.588

1021

a. Calculado slo para una tabla de 2x2.


b. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada
es 50.05.

Medidas direccionales

Ordinal por ordinal

d de Somers

Valor
.017
.020
.014

Simtrica
v8r dependiente
v25r dependiente

Error tp.
a
asint.
.031
.038
.026

T aproximada
.535
.535
.535

Sig.
aproximada
.593
.593
.593

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis nula.

Medidas simtricas
Valor
Nominal por
nominal
N de casos vlidos

Coeficiente de
contingencia

Sig.
aproximada

.017

.588

1021

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis
nula.

La primera tabla es general y tan slo ofrece el total de sujetos vlidos analizados as como el
nmero de sujetos con valores perdidos que, en este caso, no hay ninguno de forma que el total
coincide con el de vlidos: 1021 sujetos.
El anlisis de la asociacin entre Aos Educ.(v8) y Recursos(v24) consta de cuatro tablas: La
primera es la Tabla de contingencia donde aparecen las frecuencias observadas y los porcentajes
calculados por filas: llama la atencin la disparidad de porcentajes de los Muy Cultos que estn de
Acuerdo con que los Recursos de la tierra sern inagotables porque slo llega al 30.8% frente al
49.7% de los Menos Cultos. Puede pensarse ya que la cultura (medida por los aos de educacin)
influye en ser ms o menos optimista respecto a la inagotabilidad de los recursos naturales. Es decir,
los coeficientes de asociacin sern significativos.
En la segunda tabla, efectivamente, titulada Pruebas de chi-cuadrado todos los coeficientes (Chicuadrado, Razn de verosimilitud, etc.) presentan un Valor muy alto lo que origina que para 1 gl
(grado de libertad) sean muy significativos tal y como aparece reflejado en las tres columnas donde
se ofrece la Significacin tanto asinttica como bilateral o unilateral: en todos los casos es del 0.000
en tanto por uno o 0.0% por ciento. Quiere esto decir que tales diferencias porcentuales o tales
coeficientes estadsticos no pueden salir por azar ni en un uno por mil de las ocasiones. Por lo tanto,
los Muy cultos se diferencian real y significativamente de los Menos cultos en esta temtica de los
Recursos.
La tabla tercera titulada Medidas direccionales ofrece el Valor para el estadstico d de Somer
calculndolo sobre esos datos de frecuencias observadas y sus porcentajes. Este estadstico
73
Universidad de Deusto - ISBN 978-84-9830-628-6

presupone que las categoras de las dos variables son ordinales, es decir, tienen un orden o una
jerarqua: van, por ejemplo, de menos a ms. Por otra parte, la d de Somer presenta varios
resultados segn como considere la tabla de contingencia: por Simtrica entiende que tal tabla no
tiene establecida una variable dependiente y otra independiente de forma que la influencia presente
una determinada direccin. En ese caso, su Valor es 0.171 y su Significacin el 0000 por lo tanto se
concluye de la misma forma que con los coeficientes anteriores. Por Recursos dependiente entiende
que esa es la variable dependiente y la que influye son los Aos educ. Aqu su Valor es un poco
mayor 0.188 y tambin indica que existe diferencia significativa entre los Muy Cultos y los Menos
Cultos. Por Aos educ. dependiente entiende que esta variable es la dependiente, cuestin que en
este caso no tiene sentido porque claramente est definida a priori como la variable que influye, es
decir, como variable independiente.
La cuarta y ltima tabla titulada Medidas simtricas presenta el Coeficiente de contingencia y
toma las dos variables como cualitativas o nominales y, adems, considera que ambas variables se
influyen mutuamente (cuestin que, en este caso, no sera del todo correcta). Su Valor es 0.189 y su
Significacin es tambin 0.000. Por lo tanto, indica lo mismo que los coeficientes anteriores: hay
una diferencia significativa muy elevada entre la opinin de los Ms Cultos y la de los Menos
Cultos respecto a si los recursos sern inagotables. Los ms optimistas son los de menor cultura y
los ms pesimistas los de mayor cultura.
En el anlisis de la asociacin entre Aos educ.(v8) y Futuro(v25) se ofrecen tambin las mismas
cuatro tablas aunque lgicamente con resultados diferentes a las anteriores. En la primera, Tabla de
contingencia, ya se aprecia que entre los de ms y los de menos cultura no hay diferencia sensible
respecto al Acuerdo con que la ciencia y la tecnologa proporcionar ms oportunidades para las
generaciones futuras: concretamente 81.8% frente a un 83.3%. La segunda tabla, Pruebas de chicuadrado, constata estadsticamente que, en efecto, no hay diferencia significativa: tanto el Chicuadrado como la Razn de verosimilitud, etc. no alcanzan valores (0.294; 0.291, etc.) que
impliquen o permitan deducir la diferencia significativa entre los porcentajes (Sig.0.588; 0.589, etc.,
es decir, un 58.8%; un 58.9% , etc. de que tales diferencias porcentuales y, por tanto, tales
estadsticos puedan producirse por azar).
Las tablas tercera y cuarta referidas respectivamente a Medidas direccionales y a Medidas
simtricas con sus respectivos estadsticos d de Somer y Coeficiente contingencia no hacen sino
refrendar y apoyar las conclusiones ya sabidas.
8.4.3. Ejercicios y Sintaxis
Los siguientes ejercicios favorecen el conocimiento de los clculos y de la interpretacin del chicuadrado. Se recomienda, no obstante, consular los ejercicios de Neutralizacin de variables,
(Apartado 8.5) porque el estadstico bsico para la toma de decisiones en ese tema es precisamente
el chi-cuadrado calculado en distintas condiciones y segn determinadas variables.
1. Cruzar la variable Sexo (v5) del fichero CITEC.sav con una nueva variable VPT que deber
ser creada en ese fichero. Esa variable VPT ser la puntuacin total de cada sujeto en la escala de
conocimientos cientficos (de la v10 a la v20) teniendo en cuenta que se otorgar 1 punto a quien
acierta la pregunta, de lo contrario tendr cero puntos. (Vase el cdigo de respuestas acertadas)
v10
v11
v12
v13
v14
v15

Cdigo de respuestas acertadas

1
v16

1
v17

1
v18

2
v19

1
v20

1
2
2
1
1

74
Universidad de Deusto - ISBN 978-84-9830-628-6

Posteriormente, esa nueva variable VPT se recodificar de la siguiente manera:


0, 1, 2, 3, 4 = 1
5, 6 = 2
7, 8, 9, 10, 11 = 3
Interpretar los resultados en base a los coeficientes de asociacin y en base a los porcentajes en el
cruce de las dos variables.
Algunas soluciones numricas relevantes:
Tabla de contingencia Sexo * VPTR

Sexo

hombre
mujer

Total

Recuento
% de Sexo
Recuento
% de Sexo
Recuento
% de Sexo

VPTR
2.00
148
29.8%
169
32.3%
317
31.0%

1.00
117
23.5%
173
33.0%
290
28.4%

3.00
232
46.7%
182
34.7%
414
40.5%

Total
497
100.0%
524
100.0%
1021
100.0%

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos

Valor
17.542a
17.614

2
2

Sig. asinttica
(bilateral)
.000
.000

.000

gl

17.329
1021

a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 141.17.

Medidas direccionales

Ordinal por ordinal

d de Somers

Simtrica
Sexo dependiente
VPTR dependiente

Valor
-.122
-.108
-.142

Error tp.
a
asint.
.029
.025
.034

T aproximada
-4.232
-4.232
-4.232

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis nula.

Medidas simtricas
Valor
Nominal por
nominal
N de casos vlidos

Coeficiente de
contingencia

Sig.
aproximada

.130
1021

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis
nula.

75
Universidad de Deusto - ISBN 978-84-9830-628-6

.000

Sig.
aproximada
.000
.000
.000

Sintaxis para el Ejercicio 1

2. Averiguar e interpretar tambin la asociacin entre Sexo (v5) y VTP recodificada, pero solamente
para el grupo de los de +20 aos de educacin (v8) comparando los resultados con los anteriores.
Algunas soluciones numricas relevantes:
Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos

Valor
7.291a
8.849

2
2

Sig. asinttica
(bilateral)
.026
.012

.631

gl

.230
151

a. 2 casillas (33.3%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 1.91.

Medidas direccionales

Ordinal por ordinal

d de Somers

Simtrica
Sexo dependiente
VPTR dependiente

Valor
-.084
-.094
-.075

Error tp.
a
asint.
.080
.091
.072

T aproximada
-1.043
-1.043
-1.043

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis nula.

Medidas simtricas
Valor
Nominal por
nominal
N de casos vlidos

Coeficiente de
contingencia

Sig.
aproximada

.215

.026

151

a. Asumiendo la hiptesis alternativa.


b. Empleando el error tpico asinttico basado en la hiptesis
nula.

76
Universidad de Deusto - ISBN 978-84-9830-628-6

Sig.
aproximada
.297
.297
.297

Sintaxis para el Ejercicio 2

3. Cruzar la variable Clase Social (v35) recodificada segn 1-2=1 y 3-4=2 del fichero
ESCUEL.sav, con Disfrutar (v8) recodificada segn 1-2-3-4=1; 5-6=2 y 7-8-9=3. Interpretar los
resultados con los correspondientes coeficientes y a los porcentajes.
Algunas soluciones numricas relevantes:
Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos

Valor
5.721a
5.716
5.498

2
2

Sig. asinttica
(bilateral)
.057
.057

.019

gl

117

a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 6.84.

Sintaxis para el Ejercicio 3

4. A qu conclusiones se llega si el ejercicio anterior es realizado para cada uno de los dos grupos
de Sexo (v34)?.
Soluciones numricas relevantes:

77
Universidad de Deusto - ISBN 978-84-9830-628-6

Pruebas de chi-cuadrado
Sexo
HOMBRE

MUJER

2
2

Sig. asinttica
(bilateral)
.473
.450

1.392

.238

31
2.499b
2.345

2
2

.287
.310

2.148

.143

Valor
1.499a
1.597

Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos

gl

86

a. 4 casillas (66.7%) tienen una frecuencia esperada inferior a 5. La


frecuencia mnima esperada es 1.45.
b. 2 casillas (33.3%) tienen una frecuencia esperada inferior a 5. La
frecuencia mnima esperada es 2.93.

Sintaxis para el Ejercicio 4

78
Universidad de Deusto - ISBN 978-84-9830-628-6

8.5. NEUTRALIZACION DE VARIABLES


8.5.0. Frmulas y Aplicacin
8.5.0.1. Frmulas
En este apartado son tiles todas las frmulas expuestas en el apartado anterior 8.4.0.1. dentro del
captulo de Tablas de Contingencia.
8.5.0.2. Tipo de variables requeridas
Se puede decir que la neutralizacin de variables consiste en la introduccin de una tercera variable
en el anlisis de las tablas de contingencia para conocer si esa variable hace variar los resultados
iniciales entre las dos variables primeras. Ejemplo: Del fichero CITEC.sav se desea cruzar las
variables sexo(v5) y aos de educacin(v8) con la v22. Tanto la v5 como la v8 son variables
nominales; sin embargo, la v22 puede ser tomada, no como una variable estrictamente nominal sino
como una escala que se mueve del 1 al 5; por lo tanto, tendremos que recodificarla en dos o tres
grupos.
8.5.0.3. Utilidad e interpretacin
La neutralizacin de variables se utiliza como finalidad principal para conocer cul de entre dos
variables cualitativas presenta mayor asociacin (ji cuadrado) con la variable dependiente tambin
cualitativa. La prctica consiste en introducir una tercera variable en el anlisis de las tablas de
contingencia realizado en base a dos variables. Si por ejemplo ya es conocida la asociacin entre
educacin (v8) y la v22 (tres grupos) para toda la muestra podemos calcular otra vez la asociacin
existente entre educacin (v8) y la v22 (tres grupos) pero por un lado slo para los sujetos Hombres
y por otro slo para los sujetos Mujeres con lo cual se tendrn dos ji-cuadrado de asociacin entre
educacin y v22: uno obtenido con la muestra de Hombres y otro con la de Mujeres. Este proceso
se llama neutralizacin de la variable sexo (v5) y da como resultado conocer si la asociacin inicial
entre educacin y v22 (tres grupos) se mantiene igual o cambia en el grupo de hombres y en el
grupo de mujeres. A este proceso le sigue otro similar. Se parte de realizar las tablas de
contingencia entre sexo (v5) y v22 (tres grupos). Posteriormente se neutraliza la variable educacin
(v8), es decir, se realizan cuatro tablas de contingencia entre sexo (v5) y v22 (tres grupos) una por
cada uno de los cuatro grupos de la variable educacin (v8). Al comparar los resultados de la tabla
de contingencia (ji-cuadrado) para toda la muestra con los resultados de las otra cuatro tablas se
podr conocer si han variado y en qu direccin o, por el contrario, se mantienen similares. De estas
comparaciones se puede deducir el objetivo inicial que consiste en averiguar si el sexo (v5) o
educacin (v8) es la variable con mayor asociacin o influencia sobre la v22 recodificada en tres
grupos.
8.5.1. Manejo del SPSS
Se trata en cierto modo de un anlisis similar al de la correlacin parcial pero con variables
cualitativas/nominales. Un ejemplo concreto es el de conocer si la asociacin encontrada en el
apartado anterior entre Aos educ.(v8) y Recursos(v24) se modifica de alguna manera si se tiene en
cuenta una tercera variable: Edad(v4) recodificada en dos grupos (1-2=1; 3-4=2), es decir 1=15-39
aos y 2=40 o ms aos.
La estrategia metodolgica sigue los siguientes pasos:
1)

Obtener e interpretar las dos tablas de contingencia generales: una, cruzando Aos educ.(v8)
con Recursos(v24); dos, cruzando Edad(v4) con Recursos(v24).

2)

Neutralizar la variable Edad(v4). Esto exige obtener la tabla de contingencia de :


79
Universidad de Deusto - ISBN 978-84-9830-628-6

a) Aos educ.(v8) cruzada con Recursos(v24) pero slo teniendo en cuenta a los de
15-39 aos, es decir, slo teniendo en cuenta a quienes tienen el dgito 1 en la
variable Edad(v4).
b) Aos educ.(v8) cruzada con Recursos(v24) pero slo teniendo en cuenta a los de
40 aos o ms, es decir, slo teniendo en cuenta a quienes tienen el dgito 2 en la
variable Edad(v4).
c) Si en lugar de la variable Edad(v4) fuera otra variable que tuviera ms dgitos
(ms categoras/grupos) debera hacerse lo mismo: Aos educ.(v8) cruzada con
Recursos(v4) teniendo en cuenta cada vez slo a los de un determinado dgito.
3)

Neutralizar la variable Aos educ.(v8). Esto exige obtener la tabla de contingencia de:
a) Edad(v4) cruzada con Recursos(v24) pero slo teniendo en cuenta a los Menos
Cultos, es decir, slo teniendo en cuenta a quienes tienen el dgito 1 en la
variable Aos educ.(v8).
b) Edad(v4) cruzada con Recursos(v24) pero slo teniendo en cuenta a los Ms
Cultos, es decir, slo teniendo en cuenta a quienes tienen el dgito 2 en la
variable Aos educ.(v8).
c) Si en lugar de la variable Aos educ.(v8) fuera otra variable que tuviera ms
dgitos (ms categoras/grupos) debera hacerse lo mismo: Edad(v4) cruzada con
Recursos(v24) teniendo en cuenta cada vez slo a los de un determinado dgito.

4)

Analizar e interpretar los resultados anteriormente obtenidos con el fin de dar respuesta a la
pregunta sobre el influjo que ejerce la introduccin de esa tercera variable.

El procedimiento operativo en el SPSS es relativamente sencillo:


Para obtener las dos tablas de contingencia generales basta con solicitarlo tal y como se explica en el
apartado anterior 8.3.4. Tablas de Contingencia. En la Fig. 72 y en la Fig. 73 se presentan las
peticiones primarias sin olvidar que al PULSAR en Estadsticos se pueden elegir aquellos
coeficientes que se consideren necesarios as como al PULSAR en Casillas o en Formato pueden
elegirse por una parte las frecuencias, los porcentajes y los residuos as como la forma en que salgan
estticamente los resultados.
Figura 72.

Figura 73.

Para realizar la segunda etapa referida a la neutralizacin, en concreto de la Edad(v4), basta con
trasladar esa variable Edad(v4) al rectngulo blanco inferior de la ventana principal de dilogo que
aparece momentneamente titulado Capa 1 de 1 (Fig. 74). Si se PULSA Aceptar (tras haber
elegido en la opcin Estadsticos, en la opcin Casillas y en la opcin Formato lo que se considere
80
Universidad de Deusto - ISBN 978-84-9830-628-6

ms conveniente) el programa proporciona dos tablas de contingencia con sus respectivos


estadsticos donde en cada una estn cruzadas Aos educ.(v8) con Recursos(v24) pero una de ellas
solo recoge a los sujetos de entre 15-39 aos y la otra solo recoge o tiene en cuenta a los sujetos de
40 aos o ms.
Figura 74.
Figura 75.

De la misma forma se procede en la neutralizacin de la variable Aos educ.(v8). En este caso se


coloca esta variable en el rectngulo blanco inferior y la variable Edad(v4) se coloca en el
rectngulo blanco titulado Columnas (Fig. 75). Aqu tambin se obtendrn dos tablas de
contingencia donde estarn cruzadas Edad(v4) con Recursos(v24) pero una corresponder a los
sujetos Menos Cultos y la otra corresponder a los sujetos Ms cultos.
Con estos resultados ya pueden obtenerse las conclusiones pertinentes acerca de qu ocurre cuando
se incorpora una tercera variable en la asociacin de otras dos. Efectivamente, ya se conoce si la
variable Aos educ.(v8) influye (est asociada) en la variable Recursos(v24) considerando el total
de los sujetos de la muestra. Y tambin se conoce cunta es la influencia (asociacin) teniendo en
cuenta por separado a los dos grupos de edad.
Se puede saber, por tanto, si la influencia ha disminuido, ha aumentado o se mantiene ms o menos
similar. En esta ltima posibilidad quiere decir que la influencia no vara ya sea considerando a
todos los sujetos o considerando los dos grupos de edad y, en consecuencia, significa que esa
variable Edad no tiene peso para alterar la asociacin entre v8 y v24. Si, por el contrario, aumenta o
disminuye quiere decir que esa variable interviniente v4 es capaz de alterar y modificar la
asociacin existente entre v8 y v24. En el caso concreto de aumentar la asociacin significa que la
influencia de la Edad(v4) va en la misma direccin que la de Aos de educ.(v8) y, por el contrario,
si disminuye significa que la edad influye en direccin contraria a la de aos de educacin.
El mismo recorrido debe hacerse para conocer qu ocurre entre Edad(v4) y Recursos(v24). Se sabe
cunta es la influencia considerando a todos los sujetos y tambin se sabe cunta es la influencia en
cada grupo segn aos de educacin, es decir, entre los Ms Cultos y entre los MenosCultos. Por
tanto, se podr deducir en definitiva si la variable Aos educ.(v8) es capaz de modificar o no la
influencia de la Edad sobre la variable Recursos.
Deben advertirse varias cuestiones importantes: la primera, admitir que las variables sobre las que
se investiga pueden tener ms de dos categoras/grupos, lo cul convierte el anlisis en algo ms
complicado aunque la forma operativa de actuar sea la misma. La segunda, que normalmente, como
se ha hecho en este ejemplo, suele hacerse uso del Recodificar de modo que las variables que se
analizan suelen presentan menos categoras/grupos que las originales sobre todo cuando se trata de
variables cuantitativas transformadas en variables cualitativas o nominales. En este caso, el nmero
81
Universidad de Deusto - ISBN 978-84-9830-628-6

de categoras/grupos que se vayan a formar debe pensarse con cuidado as como qu sujetos van a
formar parte de una categora o de otra. Pinsese que recodificar (categorizar) la variable Ingresos
por ejemplo puede hacerse de muy diversas formas. La tercera, fundamental a la hora de realizar las
interpretaciones, es considerar si se produce el fenmeno de las Tipologas, es decir, si un cierto
tipo de sujetos se diferencian enormemente de los dems. Pudiera ocurrir, por ejemplo, que los Muy
Catlicos y, adems, Mayores de edad se diferenciaran muy significativamente de los dems en su
opinin en contra del aborto. El hallazgo de estas posibles tipologas cuando se realizan anlisis
de tablas de contingencia es un descubrimiento altamente interesante y que debe ser resaltado en las
conclusiones.
8.5.2. Resultados e Interpretacin
8.5.2.1. Influencia de Aos Educ.(v8) en Recursos(v24) neutralizando Edad(v4).
Tabla de Contingencia y estadsticos de asociacin (2) considerando todos los sujetos.
Tabla de contingencia Recursos * Aos educ.

Recursos

1.00
2.00

Total

2= 29,979

Recuento
% de Aos educ.
Recuento
% de Aos educ.
Recuento
% de Aos educ.

Aos educ.
1=Menos Cultos
2=Ms Cultos
362
90
49.7%
30.8%
367
202
50.3%
69.2%
729
292
100.0%
100.0%

Sig.= 0,000

Tablas de contingencia y estadsticos de asociacin (2) considerando el grupo de los de 15-39 aos
y el grupo de 40 aos o ms.
Tabla de contingencia Recursos * Aos educ. * Edad

Edad
1=15-39 aos

Recursos

1=Acuerdo
2=Descacuerdo

Total
2=40 aos o ms

Recursos

1=Acuerdo
2=Descacuerdo

Total

Recuento
% de Aos educ.
Recuento
% de Aos educ.
Recuento
% de Aos educ.
Recuento
% de Aos educ.
Recuento
% de Aos educ.
Recuento
% de Aos educ.

Aos educ.
1=Menos Cultos
2=Ms Cultos
113
76
41.4%
31.0%
160
169
58.6%
69.0%
273
245
100.0%
100.0%
249
14
54.6%
29.8%
207
33
45.4%
70.2%
456
47
100.0%
100.0%

Total
189
36.5%
329
63.5%
518
100.0%
263
52.3%
240
47.7%
503
100.0%

2= 5,994 Sig.= 0,014

2= 10,520 Sig.= 0,001

De la primera tabla se conoce la diferencia de porcentajes respecto al Acuerdo con que la ciencia y
la tecnologa conseguirn que los Recursos de la tierra sean inagotables: los Ms cultos solo llegan
al 31,0% mientras que los Menos Cultos llegan al 49,7%. Esta disparidad medida por el 2= 29,979
indica una fuerte asociacin entre las dos variables: a menor cultura ms optimismo (aunque no
mayoritario puesto que el porcentaje no llega al 50%) respecto a la inagotabilidad de los recursos
naturales que los de mayor cultura.
En las dos tablas siguientes, la distribucin de los porcentajes ha variado: por una parte, 31.0% de
los Ms Cultos frente a 41.4% de los Menos Cultos lo que origina una asociacin medida por el 2=
5.994 y Sig.=0.014 menor que la anterior, es decir en el grupo de los de 15-39 aos de edad la
asociacin Aos educ(v8) y Recursos(v24) ha disminuido, ya no tiene tanta fuerza a pesar de que
todava la asociacin es significativa no al 99% pero s al 95%. En la tabla del grupo de 40 aos o
ms tambin los porcentajes varan llegando en este caso a presentar diferencias ms abultadas:

82
Universidad de Deusto - ISBN 978-84-9830-628-6

29.8% frente a 54.6% aunque, sin embargo, la cuanta de la asociacin medida por el 2 =10.520
Sig. =0.001 es menos significativa que la primitiva de la tabla general (1). En definitiva, la
asociacin entre Aos educ.(v8) y Recursos(v24) es ms fuerte en la muestra general que en los dos
grupos de edad porque en stos pierde intensidad.

8.5.2.2. Influencia de Edad(v4) en Recursos(v24) neutralizando Aos educ.(v8).


Tabla de contingencia Recursos * Edad
Edad

Recursos

1=Acuerdo
2=Descacuerdo

Total

2= 25,821

Recuento
% de Edad
Recuento
% de Edad
Recuento
% de Edad

1=15-39 aos
189
36.5%
329
63.5%
518
100.0%

2=40 aos
o ms
263
52.3%
240
47.7%
503
100.0%

Total
452
44.3%
569
55.7%
1021
100.0%

Sig.= 0,000
Tabla de contingencia Recursos * Edad * Aos educ.
Edad

Aos educ.
1=Menos Cultos

Recursos

1=Acuerdo
2=Descacuerdo

Total
2=Ms Cultos

Recursos

1=Acuerdo
2=Descacuerdo

Total

Recuento
% de Edad
Recuento
% de Edad
Recuento
% de Edad
Recuento
% de Edad
Recuento
% de Edad
Recuento
% de Edad

1=15-39 aos
113
41.4%
160
58.6%
273
100.0%
76
31.0%
169
69.0%
245
100.0%

2=40 aos
o ms
249
54.6%
207
45.4%
456
100.0%
14
29.8%
33
70.2%
47
100.0%

Total
362
49.7%
367
50.3%
729
100.0%
90
30.8%
202
69.2%
292
100.0%

2= 11,926 Sig.= 0,001

2= 0,028 Sig.= 0,867

En la primera tabla, la variable Edad est asociada con la opinin sobre los Recursos de forma
significativa llegando el 2 a la cifra de 25.821 (Sig.=0.000). Los ms jvenes son aqu menos
optimistas (36.5%) acerca de que los recursos sern inagotables que los mayores dado que stos
llegan a un 52.3% de acuerdo.
Sin embargo, cuando se analizan las dos tablas provenientes de la neutralizacin de la variable Aos
educ.(v8) tal aparente asociacin y, por tanto, tal aparente influencia de la variable Edad sobre la
variable Recursos queda puesta en entredicho. Efectivamente, sobre todo en la segunda tabla, la
perteneciente a los Ms Cultos, la variable Edad no influye en absoluto sobre la opinin sobre los
recursos naturales (2=0.028; Sig.=0.867, es decir, un 86.7% de que tal asociacin pueda darse por
azar). Los porcentajes tambin abonan esta conclusin: los ms jvenes estn de acuerdo en un
31.0% y los ms mayores en una cifra muy similar 29.8%.
Como conclusin final, en consecuencia, debe decirse que tiene ms capacidad de influencia la
variable Aos educ.(v8) sobre la variable Recurso(v24) que no la variable Edad(v8).

(1 ) Es evidente que no por haber mayor diferencia de porcentajes el coeficiente 2 tiene que resultar siempre mayor. En
realidad, el 2 depende matemticamente sobre todo del tamao de la muestra analizada.

83
Universidad de Deusto - ISBN 978-84-9830-628-6

8.5.3. Ejercicios y Sintaxis


1. Del fichero SALUD.sav crear una nueva variable VSP que recoja las puntuaciones totales de
los sujetos en la escala de Salud Psicopatolgica (de la v27 a la v36) y recodificarla en tres grupos
(1=0-1-2-3; 2=4-5-6 y 3=7-8-9-10). Averiguar y analizar, mediante el cruce de variables y la
neutralizacin, si es la variable Actividad (v4) o el Sexo (v59) quien ms asociacin tiene con esa
nueva variable recodificada.
Algunas soluciones numricas relevantes:
Chi-cuadrados entre v4 y VSPR neutralizando v59
Tabla de contingencia Tarea ocupacional * VSPR * Sexo

Sexo
HOMBRE

Tarea ocupacional

no
si

Total
MUJER

VSPR
2.00
27
30.7%
22
22.9%
49
26.6%
4
21.1%
4
23.5%
8
22.2%

1.00

Tarea ocupacional

no
si

Total

Recuento
% de Tarea ocupacional
Recuento
% de Tarea ocupacional
Recuento
% de Tarea ocupacional
Recuento
% de Tarea ocupacional
Recuento
% de Tarea ocupacional
Recuento
% de Tarea ocupacional

45
51.1%
67
69.8%
112
60.9%
11
57.9%
11
64.7%
22
61.1%

3.00
16
18.2%
7
7.3%
23
12.5%
4
21.1%
2
11.8%
6
16.7%

Pruebas de chi-cuadrado
Sexo
HOMBRE

MUJER

Valor
8.021a
8.130

Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos

2
2

Sig. asinttica
(bilateral)
.018
.017

gl

7.976

.005

184
.557b
.568

2
2

.757
.753

.390

.532

36

a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia


mnima esperada es 11.00.
b. 4 casillas (66.7%) tienen una frecuencia esperada inferior a 5. La
frecuencia mnima esperada es 2.83.

Chi-cuadrados entre v59 y VSPR neutralizando v4


Pruebas de chi-cuadrado
Tarea ocupacional
no

si

Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos

2
2

Sig. asinttica
(bilateral)
.703
.690

.039

.843

107
.419b
.382

2
2

.811
.826

.329

.566

Valor
.705a
.742

gl

113

a. 1 casillas (16.7%) tienen una frecuencia esperada inferior a 5. La frecuencia


mnima esperada es 3.55.
b. 2 casillas (33.3%) tienen una frecuencia esperada inferior a 5. La frecuencia
mnima esperada es 1.35.

84
Universidad de Deusto - ISBN 978-84-9830-628-6

Total
88
100.0%
96
100.0%
184
100.0%
19
100.0%
17
100.0%
36
100.0%

Sintaxis para el Ejercicio 1

2. Utilizando el cruce de variables y la neutralizacin comprobar en el fichero CITEC.sav si


es la variable Sexo (v5) o la variable Aos de Educacin (v8) recodificada segn 1=1-2 y 2=3-4, la
que ms asociacin presenta con la variable Cientficos Peligrosos (v23) recodificada segn 1=1-23 y 2=4-5.
Algunas soluciones numricas relevantes:
Chi-cuadrados entre v5 y v23R neutralizando v8R
Pruebas de chi-cuadrado
V8R
1,00

2,00

Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitud
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitud
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos

Sig. asinttica
(bilateral)
,388

,606

,436

,744

,388

Valor
,744b

gl

,743

,389

729
3,291c

,070

2,877

,090

3,298

,069

3,279

Sig. exacta
(bilateral)

Sig. exacta
(unilateral)

,402

,218

,078

,045

,070

292

a. Calculado slo para una tabla de 2x2.


b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es
91,87.
c. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es
63,71.

Chi-cuadrados entre v8R y v23R neutralizando v5

85
Universidad de Deusto - ISBN 978-84-9830-628-6

Pruebas de chi-cuadrado
Sexo
1

Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitud
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitud
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos

Sig. asinttica
(bilateral)
,000

21,528

,000

21,963

,000

Valor
22,492b

gl

22,447

,000

497
10,288c

,001

9,605

,002

9,940

,002

10,268

Sig. exacta
(bilateral)

Sig. exacta
(unilateral)

,000

,000

,002

,001

,001

524

a. Calculado slo para una tabla de 2x2.


b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es
51,91.
c. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es
41,19.

Sintaxis para el Ejercicio 2

3. Con el fichero CITEC.sav verificar cual de las dos variables: Liderazgo (v7) o Aos de
Educacin (v8) recodificadas segn 1=1-2 y 2=3-4 presenta mayor asociacin con Desarrollo
Industrial (v38) haciendo uso del cruce de variables y la neutralizacin.
Algunas soluciones numricas relevantes:
Chi-cuadrados de v8R con v38 neutralizando v7R

86
Universidad de Deusto - ISBN 978-84-9830-628-6

Pruebas de chi-cuadrado
V7R
1,00

2,00

4
4

Sig. asinttica
(bilateral)
,000
,000

17,536

,000

684
28,026b
30,917

4
4

,000
,000

20,417

,000

Valor
25,189a
26,672

Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos

gl

337

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La


frecuencia mnima esperada es 8,34.
b. 1 casillas (10,0%) tienen una frecuencia esperada inferior a 5. La
frecuencia mnima esperada es 4,59.

Chi-cuadrados de v7R con v38 neutralizando v8R


Pruebas de chi-cuadrado
V8R
1,00

2,00

Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos

4
4

Sig. asinttica
(bilateral)
,071
,069

5,563

,018

729
10,691b
10,921

4
4

,030
,027

7,840

,005

Valor
8,646a
8,695

gl

292

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La


frecuencia mnima esperada es 10,56.
b. 1 casillas (10,0%) tienen una frecuencia esperada inferior a 5. La
frecuencia mnima esperada es 4,42.

Sintaxis para el Ejercicio 3

4. Comprobar si la variable Centro Educativo (v36) est ms asociada con Guerra Nuclear (v24)
que el Sexo (v34 ) en el fichero ESCUEL.sav utilizando el cruce de variables, la neutralizacin
y los adecuados coeficientes estadsticos.
Algunas soluciones numricas relevantes:
Chi-cuadrado de v36 con v24

87
Universidad de Deusto - ISBN 978-84-9830-628-6

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos

Valor
1,253a
1,245

2
2

Sig. asinttica
(bilateral)
,534
,537

,399

gl

,713
117

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 7,56.

Chi-cuadrados de v36 con v24 neutralizando v34


Pruebas de chi-cuadrado
Sexo
HOMBRE

MUJER

2
2

Sig. asinttica
(bilateral)
,818
,822

,274

,601

31
2,072b
2,031

2
2

,355
,362

1,594

,207

Valor
,401a
,393

Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos

gl

86

a. 3 casillas (50,0%) tienen una frecuencia esperada inferior a 5. La


frecuencia mnima esperada es 2,32.
b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia
mnima esperada es 5,12.

Chi-cuadrado de v34 con v24


Pruebas de chi-cuadrado

Chi-cuadrado de Pearson
Razn de verosimilitud
Asociacin lineal por
lineal
N de casos vlidos

Valor
,620a
,615

2
2

Sig. asinttica
(bilateral)
,734
,735

,462

gl

,541
117

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 6,89.

Chi-cuadrados de v34 con v24 neutralizando v36


Pruebas de chi-cuadrado
Centro Estudios
COLEGIO PRIVADO Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos
INSTITUTO
Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por
lineal
N de casos vlidos

2
2

Sig. asinttica
(bilateral)
.863
.864

.285

.593

34
1.504b
1.501

2
2

.471
.472

1.427

.232

Valor
.295a
.293

gl

83

a. 3 casillas (50.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima


esperada es 2.47.
b. 1 casillas (16.7%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima
esperada es 4.35.

88
Universidad de Deusto - ISBN 978-84-9830-628-6

Sintaxis para el Ejercicio 4

5. Mediante el cruce de variables y la neutralizacin averiguar en el fichero CAMPAA.sav si


es la variable Relaciones Sexuales (v23) recodificada segn 1=1 y 2=2-3-4 o la variable Religin
(v25) recodificada segn 1=1-2-3 y 2=4-5-6-7-8 quin ms asociada est con Higiene-Seguridad
(v16) recodificada segn 1=1-2-3 y 2=4-5.
Algunas soluciones numricas relevantes:
Chi-cuadrados de v23Rcon v16R neutralizando v25R
Pruebas de chi-cuadrado
v25r
1.00

2.00

Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos

Sig. asinttica
(bilateral)
.270

.753

.386

1.230

.267

Valor
1.219b

gl

1.204

.273

81
.077c

.782

.000

.986

.077

.781

.076

Sig. exacta
(bilateral)

Sig. exacta
(unilateral)

.346

.193

1.000

.499

.783

86

a. Calculado slo para una tabla de 2x2.


b. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 12.
33.
c. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 7.53.

Chi-cuadrados de v25Rcon v16R neutralizando v23R

89
Universidad de Deusto - ISBN 978-84-9830-628-6

Pruebas de chi-cuadrado
v23r
1.00

2.00

Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos
Chi-cuadrado de Pearson
Correccin por
a
continuidad
Razn de verosimilitudes
Estadstico exacto de
Fisher
Asociacin lineal por
lineal
N de casos vlidos

Sig. asinttica
(bilateral)
.272

.707

.401

1.233

.267

Valor
1.208b

gl

1.191

1
1

.850

.000

1.000

.036

.849

Sig. exacta
(unilateral)

.311

.201

1.000

.521

.275

71
.036c

.036

Sig. exacta
(bilateral)

.850

96

a. Calculado slo para una tabla de 2x2.


b. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 9.13.
c. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 10.
41.

Sintaxis para el Ejercicio 5

90
Universidad de Deusto - ISBN 978-84-9830-628-6

8.6. ANOVA DE UN FACTOR


8.6.0. Frmulas y Aplicacin
8.6.0.1. Frmulas
Estadstico F de Fisher

Prueba

de

Homogeneidad

de

Media Cuadrtica Intergrupo CM ( Inter ) V ( Inter ) Varianzas


F=
=
=
Media Cuadrtica Intragrupo
CM ( E )
V (E)
Uno de los mtodos para calcular la
nj
N
2
2
homogeneidad de las varianzas es el de
X
X
(
)
(
)
P
Levene: para realizarlo se crea en primer
1
1

lugar una nueva variable Zij = Xij - Xj, y


n
N
S .C. Inter
j
CM Inter = V Inter =
= 1
posteriormente se lleva a cabo un anlisis de
GL Inter
P 1
varianza con la misma variable independiente o
S .C. Intra
factor A y esta nueva variable dependiente
CM ( E ) = V ( E ) =
cuantitativa obteniendo el estadstico F con los
GL Intra
mismos P-1 y N-P grados de libertad. Si esta F
SCIntra = SCTotal - SCInter
calculada es mayor que la F de las Tablas se
N
2
(
)
X
deber concluir que efectivamente hay

N
2
1
diferencia significativa entre las varianzas de
SC Total = X
N
los grupos o, lo que es lo mismo, que los grupos
1
no provienen de una misma poblacin.
GLInter=P 1 GLIntra =N - P

Pruebas Post-Hoc
NO asumiendo Varianzas Iguales

Pruebas Post-Hoc
Asumiendo Varianzas Iguales

Recorrido Mltiple de Duncan (Vlido para Modelos Prueba de T2 de Tamhane


Equilibrados: igual tamao en todos los grupos).

CM ( E )
n
p es el nmero de medias existente entre las dos medias que
se comparan, incluyendo stas, una vez ordenadas de mayor a
menor. Por lo tanto, se debe calcular cada vez un valor
diferente de rp, dependiendo de las medias sobre las que se
pretenda comprobar su diferencia.
rp es el valor correspondiente en las tablas de Recorrido
Significativo de Duncan. Debe elegirse el nivel de confianza
con p y v (grados de libertad del CM(E))
CM(E) es el Cuadrado Medio o Media Cuadrtica del Error.
n es el nmero de observaciones por grupo que deben ser las
mismas para todos los grupos (obviamente, en consecuencia,
slo se puede aplicar para modelos equilibrados).
R p = r p ;v

Se basa en la prueba T y el clculo del valor


crtico T2 se obtiene mediante:
2 2
1
+ 2
T2 = t DS / 2 (C ;v )
n2
n1

tDS pertenece a la distribucin t pero


corregida por Dunn y Sidak.
v = n1 + n2 - 2 grados de libertad.
C nmero de contrastes realizados
12 y 22 son estimadores de la varianza
para cada grupo comparado al igual que
CM(E) lo es para el conjunto de los grupos.
'

Student-Neuwman-Keuls (S-N-K) (Vlido para Prueba de T3 de Dunnett


Modelos Equilibrados: igual tamao en todos los grupos).
Su frmula para el clculo del valor crtico DT3
es muy similar a la anterior aunque cambiando
la tDS por el valor m del mdulo mximo
CM ( E )
studentizado con v grados de libertad:
W p = q ( p ;v )
n
q(p;v) es el valor correspondiente en las tablas de
2 2
1
Recorrido studentizado. Debe elegirse el nivel de
DT 3 = m (C ;v )
+ 2
n2
n1
confianza y los Grados de Libertad: p = nmero total de

medias que hay entre las dos medias a comparar inclusive y


v los grados de libertad del CM(E).
CM(E) es el Cuadrado Medio o Media Cuadrtica del Error.
n es el nmero de observaciones por grupo que deben ser las
mismas para todos los grupos
'

91
Universidad de Deusto - ISBN 978-84-9830-628-6

Diferencia Honestamente Significativa (DHS de Prueba de T2 de Games-Howell


Tukey) (Vlido para Modelos Equilibrados: igual tamao en Similar a las pruebas anteriores, su frmula de

clculo del valor crtico G-H emplea el valor q


de la distribucin del recorrido studentizado
y los grados de libertad de Welch:

todos los grupos).

CM ( E )
n
12 22
q(P;v) es el valor correspondiente en las tablas de Recorrido
+
n1
n2
studentizado. Debe elegirse el nivel de confianza y los
G H = q (P ;v )
2
Grados de Libertad: P = nmero total de medias a comparar y
v los grados de libertad del CM(E).
CM(E) es el Cuadrado Medio o Media Cuadrtica del Error.
n es el nmero de observaciones por grupo que deben ser las
mismas para todos los grupos.
DMS Diferencia Mnima Significativa (Vlido para Prueba de C de Dunnett
Modelos Equilibrados: igual tamao en todos los grupos).
Se trata de una prueba similar a otra de Cochran,
y de ah su nombre, muy potente y robusta
cuando efectivamente no se puede asumir la
CM ( E )
igualdad de varianzas. La frmula es:
L = t ( v ) 2
n
q~ 12 22
donde:
+
DC =
n2
2 n1
t(v) es el valor de las tablas de la distribcin t de
Student con los v grados de libertad de CM(E) y el nivel de
confianza elegido.
2
2
q ( P ; v1 ) 1 + q ( P ; v 2 ) 2
CM(E) es el Cuadrado Medio o Media Cuadrtica del Error.
n1
n2
~
n es el nmero de observaciones por grupo que deben ser las q =
12 22
+
mismas para todos los grupos.
n1 n2
Q = q ( P ;v )

Scheff
n + n2

CM ( E ) 1
n1 n 2
S es el valor de la diferencia mnima significativa. Si el valor de la diferencia real entre las medias de los
grupos la supera habr diferencia significativa de medias.
P es el nmero total de grupos.
F es el valor correspondiente en las tablas de la distribucin F de Fisher para el nivel de confianza elegido y
con Grados de Libertad: P-1 y v que son los g.lib. del CM(E).
CM(E) es el Cuadrado Medio o Media Cuadrtica del Error.
n1 y n2 el nmero de sujetos de uno de los dos grupos que se comparan.
S=

Tukey-b
Tb =

(P 1)F1 ( P 1;v )

(SNK ) + (Tukey )

2
Tb es el promedio del valor del coeficiente SNK y el de HSD de Tukey. La diferencia real entre las medias
de los dos grupos se compara con ese valor y si resulta mayor que l se podr concluir que existe diferencia
significativa.

Prueba de Dunnett
T ' = t '

(P ;v ))
2

2 CM ( E )
n

donde:
t es el valor crtico de las tablas del estadstico t de Dunnett para el nivel de confianza elegido y Grados
de Libertad: P = nmero de grupos y v = grados de libertad de CM(E).

Prueba de Bonferroni
Se basa en la prueba t de Student aunque controlando la tasa de error global, es decir, se emplea un nivel de error
mucho menor para cada contraste de medias. Concretamente, para cada comparacin de medias se emplea la
probabilidad de error /m siendo la probabilidad de error para todo el experimento y m= P(P-1)/2 el nmero
total de comparaciones de medias.

Prueba de Sidak
Tambin se basa en el estadstico t pero corrigiendo el nivel de significacin para las comparaciones
mltiples dando lmites ms estrechos incluso que los de la prueba de Bonferroni.

92
Universidad de Deusto - ISBN 978-84-9830-628-6

Prueba GT2 de Hochberg


Esta prueba es similar al test de Tukey y se puede emplear en el caso de que los grupos comparados presenten
tamaos diferentes.
CM ( E ) CM ( E )
+
H = m (C ;v )
n1
n2
H es el valor de la diferencia mnima significativa. Si el valor de la diferencia real entre las medias de los
grupos la supera habr diferencia significativa de medias.
m valor de la distribucin del mdulo mximo studentizado.
v grados de libertad del CM(E)
C nmero de contrastes realizados
CM(E) es el Cuadrado Medio o Media Cuadrtica del Error.
n1 y n2 son los tamaos de los dos grupos comparados.

Prueba de Gabriel
De formato e interpretacin similar a la anterior pero con diferente tipo de clculo aunque alcanza el mismo valor
si las n son iguales.
CM ( E )
CM ( E )
+
G = m (C ;v )

2 n1
2 n 2

G es el valor de la diferencia mnima significativa. Si el valor de la diferencia real entre las medias de los
grupos la supera habr diferencia significativa de medias.
m valor de la distribucin del mdulo mximo studentizado.
v grados de libertad del CM(E)
C nmero de contrastes realizados.
CM(E) es el Cuadrado Medio o Media Cuadrtica del Error.
n1 y n2 son los tamaos de los dos grupos comparados.

Prueba de Waller-Duncan
Se basa en el estadstico T pero empleando la aproximacin bayesiana.

Prueba F de Ryan-Einot-Gabriel-Welch (R-E-G-W F)


Utiliza el procedimiento de comparaciones mltiples por pasos segn el tamao de las distancias entre las
medias de los grupos basndose en una prueba F.

Prueba Q de Ryan-Einot-Gabriel-Welch (R-E-G-W Q)


Del mismo modo que la anterior, utiliza el procedimiento de comparaciones mltiples por pasos segn el
tamao de las distancias entre las medias de los grupos pero basndose en la distribucin del recorrido
studentizado.

8.6.0.2. Tipo de variables requeridas


Las dos variables que este anlisis exige tienen distinto carcter: la variable nominal o cualitativa
llamada Factor que cumple con la funcin de variable independiente y que divide a la poblacin o
muestra en grupos (por ejemplo: edad recodificada, nivel de estudios,...) y la variable dependiente
necesariamente cuantitativa sobre la que se va a calcular la media en cada uno de esos grupos.
Si la variable cualitativa (el factor) tiene dos categoras puede utilizarse el mtodo de la
comparacin de medias para muestras independientes y si tiene ms de dos categoras debe
realizarse este procedimiento de anlisis de varianza.
El mtodo de ANOVA exige que las muestras no estn relacionadas, esto es, las muestras han de
ser independientes y no presentar correlacin significativa.
Tampoco puede hacerse anlisis de varianza si las muestras presentan diferente varianza. Esto se
mide a travs de la prueba de Levene. Pero, an no cumplindose esta premisa, suele admitirse
seguir realizando la verificacin de la significatividad de la diferencia de medias.

93
Universidad de Deusto - ISBN 978-84-9830-628-6

8.6.0.3. Utilidad e interpretacin


El Anlisis Simple de Varianza o ANOVA de un factor es un procedimiento estadstico que tiene
por finalidad comparar las medias de distintos grupos en una determinada variable. Su aportacin se
dirige en dos direcciones: por una parte, verificar si entre el conjunto de todas las medias hay
diferencia significativa o, lo que es lo mismo, si los grupos son diferentes entre s y, por otra parte,
cul es la media (cul es el grupo) ms diferente respecto de los/las dems (sea porque resulta la
ms elevada o sea porque resulta la ms pequea). En este ltimo caso deben hacerse varias
comparaciones tomando siempre pares de medias, es decir, cada media se compara con cada una de
las dems (contrastes post-hoc).
As, ANOVA seala si hay diferencia significativa de medias en conjunto, pero las pruebas de posthoc muestran cules son las categoras (grupos) ms diferentes.
Si se nos preguntase si en el fichero DROGODE.sav existe diferencia significativa de medias en
las distintas categoras del factor edad (v5) respecto a la variable del grado de toxicomana de un
estudiante consumidor de anfetaminas en exmenes (v20), realizaramos un anlisis de varianza
simple al tener una variable cualitativa (v4) con ms de dos categoras y una variable cuantitativa
(v20).
Una vez extrados los resultados del anova observamos como nos encontramos con que en la prueba
de homogeneidad de varianzas el estadstico de Levene es mayor del 5% (mayor de 0,05) por lo
que existe homogeneidad de varianzas y el contraste post-hoc se realizar de acuerdo a esta
realidad. En esta ocasin utilizaremos la prueba de Scheff.
El estadstico F del anova presenta una significacin menor del 5% por lo que se puede sealar que
existe diferencia significativa entre el conjunto de las tres medias correspondientes a las diferentes
categoras del factor estudios.
Es importante tener en cuenta como en las comparaciones mltiples resulta un anova significativo
en la categora de estudios universitarios, por lo que realizaremos un anova en cascada. Este
proceso consiste en ir eliminando aquellas categoras que ms influyen hasta que nos encontremos
con que ya no hay diferencia de medias.
En este caso tras eliminar el grupo de estudios universitarios y realizar nuevamente el anlisis de
varianza tan slo con los dos grupos restantes se observa como ya no hay diferencia de medias entre
ellos. Esto permite deducir que el grupo de estudios universitarios era el que presentaba una opinin
ms diferenciada del resto.
8.6.1. Manejo del SPSS
El comando que permite realizar estas comparaciones se encuentra, como siempre, tras PULSAR en
la opcin Analizar del men principal, tras abrir el fichero CITEC.sav, posteriormente
PULSANDO en Comparar medias y, por ltimo, se PULSA en Anova de un factor (Fig. 76)
Figura 76.

94
Universidad de Deusto - ISBN 978-84-9830-628-6

En la ventana que surge inmediatamente (Fig. 77) se debe colocar la variable cualitativa o
clasificadora en el rectngulo blanco inferior titulado Factor que en este ejemplo, es la variable
Liderazgo(v7) y en el rectngulo blanco superior titulado Dependientes se colocan las variable
dependientes que, en este caso, se ha elegido solo una v42 Computers (Usar los servicios
bancarios se ha vuelto ms complicado con las mquinas informticas.
Figura 77.
En la parte inferior se encuentran tres botones:
Contrastes dedicado a explicar la variacin intergrupos en componentes de tendencia (lineal,
cuadrtica o cbica) que habitualmente no suele
ser muy utilizado, Post hoc sin embargo muy til
para realizar las comparaciones mltiples de
medias
por
parejas
calculando
tales
comparaciones segn una amplia gama de
estadsticos (Fig. 78) divididos en dos grandes
bloques: los que realizan los clculos Asumiendo
varianzas iguales entre los que se encuentran los ms habituales: DMS (diferencia mnima
significativa), Scheff, Tukey, Duncan, etc. y los que realizan los clculos No asumiendo
varianzas iguales entre los que suelen ser usuales Games-Howell y C de Dunnett. En uno y otro
caso se est haciendo referencia a si las varianzas internas de los grupos pueden ser consideradas
iguales o, por el contrario, diferentes lo cual exige otro tipo de formulacin matemtica para
averiguar si las medias son o no diferentes.
Figura 78

Figura 79.
Por ltimo, el botn Opciones (Fig. 79) ofrece en
Estadsticos la posibilidad de conocer las medias y
desviaciones tpicas de cada uno de los grupos y en
Homogeneidad de varianzas la prueba de Levene
para dilucidar si en efecto pueden ser tales varianzas
consideradas iguales o significativamente diferentes.
Tambin ofrece la posibilidad de dibujar el Grfico
de las medias y una ltima opcin sobre los Valores
perdidos bien sea excluyendo nicamente aquellos
sujetos con valores perdidos en las variables
analizadas o bien excluyendo a aquellos sujetos con
valores perdidos en cualquiera de las variables del
archivo de datos.

95
Universidad de Deusto - ISBN 978-84-9830-628-6

Una vez sealadas las necesidades, en este caso, Scheff, Games-Howell de pruebas Post-hoc y
Descriptivos, Homogeneidad de varianzas en Opciones se PULSA en Aceptar para que el
programa ofrezca los resultados requeridos.
8.6.2. Resultados e Interpretacin
El conjunto de los resultados concretos sobre este ejemplo propuesto acerca de la posible diferencia
de medias entre los cuatro grupos de Liderazgo(v7) respecto a la variable Computers(v42) es el
siguiente:
ANOVA de un factor
Descriptivos
Computers

N
Bajo
Regular
Medio
Alto
Total

298
386
276
61
1021

Media
3.37
3.56
3.95
3.77
3.62

Desviacin
tpica
1.44
1.40
1.31
1.30
1.40

Error tpico
.08
.07
.08
.17
.04

Mnimo
1
1
1
1
1

Mximo
5
5
5
5
5

Prueba de homogeneidad de varianzas


Computers
Estadstico
de Levene
5.232

gl1

gl2
1017

Sig.
.001

ANOVA
Computers

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
51.091
1946.977
1998.069

gl
3
1017
1020

Media
cuadrtica
17.030
1.914

F
8.896

Sig.
.000

Pruebas post hoc


Comparaciones mltiples
Variable dependiente: Computers

Scheff

(I) Liderazgo
Bajo

Regular

Medio

Alto

Games-Howell

Bajo

Regular

Medio

Alto

(J) Liderazgo
Regular
Medio
Alto
Bajo
Medio
Alto
Bajo
Regular
Alto
Bajo
Regular
Medio
Regular
Medio
Alto
Bajo
Medio
Alto
Bajo
Regular
Alto
Bajo
Regular
Medio

Diferencia de
Error tpico
medias (I-J)
-.18
.11
-.58*
.12
-.40
.19
.18
.11
-.39*
.11
-.21
.19
.58*
.12
.39*
.11
.18
.20
.40
.19
.21
.19
-.18
.20
-.18
.11
-.58*
.11
-.40
.19
.18
.11
-.39*
.11
-.21
.18
.58*
.11
.39*
.11
.18
.18
.40
.19
.21
.18
-.18
.18

Sig.
.39
.00
.24
.39
.00
.74
.00
.00
.84
.24
.74
.84
.33
.00
.15
.33
.00
.64
.00
.00
.77
.15
.64
.77

Intervalo de confianza al
95%
Lmite
Lmite inferior
superior
-.48
.11
-.90
-.25
-.94
.15
-.11
.48
-.70
-.09
-.75
.32
.25
.90
.09
.70
-.37
.73
-.15
.94
-.32
.75
-.73
.37
-.47
.10
-.87
-.28
-.88
.09
-.10
.47
-.67
-.12
-.69
.26
.28
.87
.12
.67
-.30
.66
-.09
.88
-.26
.69
-.66
.30

*. La diferencia de medias es significativa al nivel .05.

96
Universidad de Deusto - ISBN 978-84-9830-628-6

Subconjuntos homogneos
Computers

Liderazgo
Scheffa,b Bajo
Regular
Alto
Medio
Sig.

N
298
386
61
276

Subconjunto para alfa


= .05
1
2
3.37
3.56
3.56
3.77
3.77
3.95
.10
.10

Se muestran las medias para los grupos en los subconjuntos


homogneos.
a. Usa el tamao muestral de la media armnica = 154.
065.
b. Los tamaos de los grupos no son iguales. Se utilizar
la media armnica de los tamaos de los grupos. Los
niveles de error de tipo I no estn garantizados.

La primera tabla, titulada Descriptivos, tiene gran importancia puesto que descubre entre otras
cosas, las medias de los cuatro grupos as como sus respectivas desviaciones tpicas (se han
eliminado aqu por su escasa aportacin a la interpretacin las columnas de los errores tpicos as
como los intervalos de confianza que s los ofrece el programa). La media ms alta es 3.95 (grupo
Liderazgo Medio) y la ms baja 3.37 (grupo Liderazgo Bajo). Las otras dos se sitan obviamente en
medio y son 3.56 (Lid. Regular) y 3.77 (Lid. Alto). Como la variable Computers se responde del
1 al 5 entendiendo que el 1 implica Muy de Acuerdo y el 5 Muy en Desacuerdo quiere decir que
todos los grupos se encuentran en la zona del desacuerdo, aunque lgicamente unos con medias ms
elevadas que otros. De estas medias precisamente va a tratar el anlisis de la varianza, es decir, si
existe distinto grado de desacuerdo.
Por otra parte, las desviaciones tpicas oscilan entre 1.30 de Lid. Alto y 1.44 de Lid. Bajo siendo las
otras dos 1.31 y 1.40. Debe tenerse en cuenta que a pesar de tan pequeas diferencias (mxima de
0.14) puede resultar, como en realidad sucede aqu segn la prueba de heterogeneidad de varianzas
medida por el Estadstico de Levene cuyo resultado aparece en la segunda tabla, que exista
diferencia significativa entre ellas y suponga ciertamente un grado de desviacin notablemente
superior en unos casos frente a otros. Dicho de otra forma, los sujetos sobre todo del grupo 1 y 2, en
comparacin con los del grupo 3 y 4, puntan de manera mucho ms heterognea como dando a
entender que se trata de unas muestras/grupos muy distintas a las otras. Ya se sabe que el ANOVA
de un Factor exige igualdad de varianzas entre los grupos porque de lo contrario no se cumple uno
de los condicionantes estadstico-matemticos exigidos (que las muestras procedan de una misma
poblacin). Ocurre, sin embargo, que en la prctica no se suele considerar a veces esta exigencia
por juzgarla excesiva aunque, sin embargo, se tiene en cuenta en las comparaciones Post hoc
utilizando las frmulas y directrices emanadas del hecho de la desigualdad de varianzas entre los
grupos.
La tercera tabla, titulada ANOVA, aporta sobre todo informacin en las dos ltimas columnas: la de
la F (F de Fisher) que es el cociente entre la Media cuadrtica Inter-grupos sobre la Media
cuadrtica Intra-grupos resultando 8.896. Esta cifra supone para 3 y 1017 grados de libertad una
Significacin (ltima columna) de 0.000. Esto es, tal cifra de F no puede darse por azar ni en un uno
por mil de las ocasiones, por tanto resulta significativa indicando que existe realmente diferencia
significativa entre el conjunto de las cuatro medias.
La siguiente tabla, Pruebas post hoc o pruebas a posteriori de comparaciones mltiples dado que se
realizan entre todas las parejas de medias que puedan formarse, aporta las soluciones segn la
prueba de Scheff y segn la prueba de Games-Howell. Como se ha visto que existe desigualdad de
varianzas es ms conveniente atender a sta ltima para sacar conclusiones. Lo importante en este
caso a la hora de interpretar son las dos ltimas columnas agrupadas bajo el epgrafe Intervalo de
confianza al 95%. Si uno de los intervalos presenta signo negativo y el otro positivo indica que no

97
Universidad de Deusto - ISBN 978-84-9830-628-6

hay diferencia significativa entre las medias de los grupos que se comparan. De lo contrario s hay
diferencia significativa. La razn es clara: si se pasa de un signo a otro quiere decir que se pasa por
el valor cero y este valor supone que las dos medias pueden ser iguales. Sin embargo, si los dos
valores extremos (Lmite inferior y Lmite superior) presentan el mismo signo quiere decir que una
de las dos medias es siempre distinta (superior o inferior) a la otra. Por tanto, hay siempre diferencia
significativa al 95% de nivel de confianza. Esto es lo que sucede con la media del grupo 1=Bajo con
respecto a la media del grupo 3=Medio. Con los otros dos grupos no hay diferencia significativa. Lo
mismo sucede con el grupo 2=Regular con respecto a la media del grupo 3=Medio pero no con los
otros dos grupos. El grupo 4=Alto no presenta diferencia significativa con ningn grupo.
Se puede concluir, en definitiva, que el grupo 3=Liderazgo Medio es significativamente el de mayor
media y que se diferencia claramente del grupo 1 y del 2 aunque no as del 4. Ms an, entre estos
tres grupos no existe diferencia significativa. De esta forma, puede entenderse mejor la ltima tabla
de resultados titulada Subconjuntos homogneos que el SPSS ofrece tomando siempre las medias
de menor a mayor y notando indicativamente cules se diferencian de las dems y cules forman
grupo no diferenciado.
En la tabla de Pruebas post hoc, por ltimo, hay dos columnas centrales tituladas Error tpico y
Sig. que tienen una utilidad particular. Sirven para pruebas de contrastes a priori, es decir, para
pruebas diseadas desde el inicio de la investigacin para lo cual no slo se prepara adecuadamente
el estudio sino que se admiten como cumplidos ciertos condicionantes, el ms importante de ellos es
el de admitir que los grupos tienen idntica varianza (la media cuadrtica intra-grupo) y que la
comparacin se realiza teniendo en cuenta tan solo los dos grupos que se comparan no el resto de
grupos que pueda haber. El valor del error tpico, por ejemplo, entre el grupo 1=Bajo y el
2=Regular es

1,914 1,914
CMA CMA
+
=
+
= 0 ,11 siendo CMA la Media cuadrtica intra-grupo. Al
n1
n2
298
386

dividir la diferencia de medias entre esos dos grupos (-0.18) por el error tpico surge el estadstico
cuya significacin (que en este caso es 0.394 o 39.4%) depender de los grados de libertad
correspondientes. Ntese, por ejemplo, que la significacin de la diferencia de medias entre esos
dos grupos no es la misma segn Scheff (0,394) que segn Games-Howell (0,334).
8.6.3. Ejercicios y Sintaxis
1. Del fichero CITEC.sav.
1.a.) Crear una variable que recoga las puntuaciones totales en la escala de
Conocimientos Cientficos de la v9 a la v19 recordando que cualquier sujeto
tendr 1 punto si acierta a cada pregunta, si no tendr cero puntos, y analizar si
existe diferencia entre las medias al tener en cuenta la variable v7.
1.b.) Repetirlo para hombres.
1.c.) Repetirlo tambin para las mujeres.
Cdigo de respuestas acertadas
v9
v10
v11
v12
v13
v14

1
1
1
1
2
1

v15
v16
v17
v18
v19

2
1
2
2
1

1.a.) Analizar si existe diferencia entre las medias

98
Universidad de Deusto - ISBN 978-84-9830-628-6

Descriptivos
vNueva

N
Bajo
Regular
Medio
Alto
Total

298
386
276
61
1021

Media
4.75
5.83
6.25
6.21
5.65

Desviacin
tpica
2.55
2.31
2.31
2.53
2.47

Error tpico
.15
.12
.14
.32
.08

Intervalo de confianza para


la media al 95%
Lmite
Lmite inferior
superior
4.46
5.04
5.60
6.06
5.98
6.52
5.57
6.86
5.50
5.80

Mnimo
.00
.00
.00
.00
.00

Mximo
10.00
11.00
11.00
11.00
11.00

Prueba de homogeneidad de varianzas


vNueva
Estadstico
de Levene
2.633

gl1

gl2
1017

Sig.
.049

ANOVA
vNueva

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
373.713
5832.158
6205.871

gl
3
1017
1020

Media
cuadrtica
124.571
5.735

F
21.722

Sig.
.000

En la tabla de Prueba de Homogeneidad de varianzas el estadstico de Levene (2.633) presenta una


significacin de 0.049 (4.9%) lo que indica que la diferencia entre las varianzas de los cuatro grupos
es significativa a nivel de confianza del 95% y, por lo tanto, en estricta teora no debera seguir
realizndose el anlisis de varianza puesto que ya es conocida la diferencia entre la variabilidad de
los cuatro grupos y ello supone que tales grupos no son iguales. No obstante, se puede proseguir en
algunos casos puntuales con el anlisis de varianza para a ttulo indicativo conocer el
comportamiento y diferencia de las medias de los grupos. En este caso concreto, adems, se puede
proseguir considerando el 99% como nivel de confianza por cuanto a ese nivel la diferencia de
varianzas no es significativa y utilizando la prueba de Scheff.
En la tabla de ANOVA se aprecia una F=21.722 cuya significacin (probabilidad de que tal
diferencias de medias suceda por azar) llega al 0.000 (0.0%) y, en consecuencia, se concluye que
tales medias en conjunto presentan diferencia significativa.
Pruebas post hoc
Comparaciones mltiples
Variable dependiente: vNueva
Scheff

(I) Liderazgo
Bajo

Regular

Medio

Alto

(J) Liderazgo
Regular
Medio
Alto
Bajo
Medio
Alto
Bajo
Regular
Alto
Bajo
Regular
Medio

Diferencia de
medias (I-J)
Error tpico
-1.083*
.185
-1.502*
.200
-1.465*
.337
1.083*
.185
-.418
.189
-.382
.330
1.502*
.200
.418
.189
.037
.339
1.465*
.337
.382
.330
-.037
.339

Sig.
.000
.000
.000
.000
.179
.720
.000
.179
1.000
.000
.720
1.000

Intervalo de confianza al
95%
Lmite
superior
Lmite inferior
-1.600
-.566
-2.062
-.941
-2.407
-.522
.566
1.600
-.947
.110
-1.305
.542
.941
2.062
-.110
.947
-.912
.986
.522
2.407
-.542
1.305
-.986
.912

*. La diferencia de medias es significativa al nivel .05.

99
Universidad de Deusto - ISBN 978-84-9830-628-6

El grupo que ms difiere, segn las Pruebas post-hoc utilizando el mtodo de Scheff, es el de
capacidad de liderazgo baja. Esto se aprecia comprobando el nmero de asteriscos que presenta, es
decir, es el grupo que difiere con todos los dems grupos. Sera conveniente, por tanto, si se sigue el
anlisis, eliminarlo y observar si tras su purgacin existe diferencia significativa de medias entre los
grupos restantes.
En el caso de que hubiera 2 o ms grupos con el mismo nmero de asteriscos es usual eliminar
aqul con mayor diferencia significativa (significacin menor) respecto de todos los dems.
Grfico de las medias
6,50

Media de vNueva

6,00

5,50

5,00

4,50
Bajo

Regular

Medio

Alto

Liderazgo

En este ejemplo, se deja de considerar el grupo de liderazgo bajo y se sigue realizando el anlisis simple en
cascada.
ANOVA
vNueva

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
30.566
3902.034
3932.600

gl
2
720
722

Media
cuadrtica
15.283
5.419

F
2.820

Sig.
.060

Al eliminar el grupo de liderazgo bajo, se deduce segn los resultados (F=2.820 sig.=0.060 6.0%)
la ausencia de diferencia significativa entre las medias de los grupos restantes y, en ese sentido, el
ejercicio se da por finalizado. Ciertamente si se solicitan los datos de las Comparaciones mltiples
entre esos tres grupos restantes se comprobar cmo ya no existe diferencia significativa entre ellos
al compararlos de dos en dos.
1.b.) Repetirlo para los hombres
Para Hombres
Descriptivos
vNueva

N
Bajo
Regular
Medio
Alto
Total

120
188
151
38
497

Media
5.6583
6.1968
6.1325
6.3684
6.0604

Desviacin
tpica
2.262
2.223
2.427
2.832
2.350

Error tpico
.207
.162
.197
.459
.105

Intervalo de confianza para


la media al 95%
Lmite
superior
Lmite inferior
5.249
6.067
5.877
6.517
5.742
6.523
5.437
7.299
5.853
6.268

100
Universidad de Deusto - ISBN 978-84-9830-628-6

Mnimo
.00
.00
.00
.00
.00

Mximo
10.00
11.00
11.00
11.00
11.00

Prueba de homogeneidad de varianzas


vNueva
Estadstico
de Levene
2.251

gl1

gl2
493

Sig.
.082

ANOVA
vNueva

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
27.286
2712.903
2740.189

gl
3
493
496

Media
cuadrtica
9.095
5.503

F
1.653

Sig.
.176

Adems de no haber diferencia significativa entre las varianzas, tampoco existe diferencia
significativa entre las medias de los cuatro grupos de liderazgo en el colectivo hombres tal como
aparece en la significacin del ANOVA (17.6%) y a su vez tambin en la tabla de Comparaciones
mltiples en la que ninguno de los cuatro grupos presenta diferencia significativa con ninguno de
los dems.
Comparaciones mltiples
Variable dependiente: vNueva
Scheff

(I) Liderazgo
Bajo

(J) Liderazgo
Regular
Medio
Alto
Bajo
Medio
Alto
Bajo
Regular
Alto
Bajo
Regular
Medio

Regular

Medio

Alto

Diferencia de
medias (I-J)
-.538
-.474
-.710
.538
.064
-.172
.474
-.064
-.236
.710
.172
.236

Error tpico
.274
.287
.437
.274
.256
.417
.287
.256
.426
.437
.417
.426

Sig.
.278
.436
.451
.278
.996
.982
.436
.996
.959
.451
.982
.959

Intervalo de confianza al
95%
Lmite
superior
Lmite inferior
-1.307
.230
-1.279
.331
-1.935
.515
-.230
1.307
-.655
.783
-1.342
.999
-.331
1.279
-.783
.655
-1.430
.958
-.515
1.935
-.999
1.342
-.958
1.430

1.c.) Repetirlo para las mujeres.


Para las mujeres
Descriptivos
vNueva

Sexo
mujer

N
Bajo
Regular
Medio
Alto
Total

178
198
125
23
524

Media
4.135
5.485
6.392
5.957
5.263

Desviacin
tpica
2.554
2.343
2.155
1.965
2.513

Error tpico
.191
.167
.193
.410
.110

Intervalo de confianza para


la media al 95%
Lmite
superior
Lmite inferior
3.757
4.513
5.156
5.813
6.011
6.773
5.107
6.806
5.048
5.479

Mnimo
.00
.00
.00
1.00
.00

Mximo
10.00
11.00
11.00
9.00
11.00

Descriptivos
vNueva

Sexo
mujer

N
Bajo
Regular
Medio
Alto
Total

178
198
125
23
524

Media
4.135
5.485
6.392
5.957
5.263

Desviacin
tpica
2.554
2.343
2.155
1.965
2.513

Error tpico
.191
.167
.193
.410
.110

Intervalo de confianza para


la media al 95%
Lmite
superior
Lmite inferior
3.757
4.513
5.156
5.813
6.011
6.773
5.107
6.806
5.048
5.479

101
Universidad de Deusto - ISBN 978-84-9830-628-6

Mnimo
.00
.00
.00
1.00
.00

Mximo
10.00
11.00
11.00
9.00
11.00

Prueba de homogeneidad de varianzas


vNueva
Sexo
mujer

Estadstico
de Levene
3.377

gl1
3

gl2
520

Sig.
.018

ANOVA
vNueva
Sexo
mujer

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
406.689
2896.967
3303.656

gl
3
520
523

Media
cuadrtica
135.563
5.571

F
24.333

Sig.
.000

En este caso, aunque la diferencia de varianzas no es signficativa el 99%, s se aprecia diferencia


significativa entre las medias de los cuatro grupos de liderazgo de las mujeres (sig.=0.0%) siendo el
grupo de liderazgo bajo el que se diferencia de todos los dems.
Comparaciones mltiples
Variable dependiente: vNueva
Scheff

Sexo
mujer

(I) Liderazgo
Bajo

Regular

Medio

Alto

(J) Liderazgo
Regular
Medio
Alto
Bajo
Medio
Alto
Bajo
Regular
Alto
Bajo
Regular
Medio

Diferencia de
medias (I-J)
Error tpico
-1.350*
.244
-2.257*
.275
-1.822*
.523
1.350*
.244
-.907*
.270
-.472
.520
2.257*
.275
.907*
.270
.435
.536
1.822*
.523
.472
.520
-.435
.536

Sig.
.000
.000
.007
.000
.011
.844
.000
.011
.882
.007
.844
.882

Intervalo de confianza al
95%
Lmite
superior
Lmite inferior
-2.034
-.666
-3.030
-1.485
-3.289
-.355
.666
2.034
-1.663
-.151
-1.930
.987
1.485
3.030
.151
1.663
-1.066
1.937
.355
3.289
-.987
1.930
-1.937
1.066

*. La diferencia de medias es significativa al nivel .05.

Pero si tal grupo se deja de considerar en un nuevo anlisis se verifica que, de distinto modo a como
suceda con los datos de toda la muestra, entre las mujeres sigue habiendo diferencia significativa
entre los tres grupos restantes tal como muestra la tabla de ANOVA (sig.=0.2%) y tal como lo
ratifica la tabla de Comparaciones mltiples donde se aprecia que el grupo de los de liderazgo
regular y medio se diferencian entre s segn la prueba de Scheff.
ANOVA
vNueva
Sexo
mujer

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
63.369
1742.203
1805.572

gl
2
343
345

Media
cuadrtica
31.685
5.079

F
6.238

Sig.
.002

Comparaciones mltiples
Variable dependiente: vNueva
Scheff

Sexo
mujer

(I) Liderazgo
Regular
Medio
Alto

(J) Liderazgo
Medio
Alto
Regular
Alto
Regular
Medio

Diferencia de
medias (I-J)
Error tpico
-.907*
.257
-.472
.496
.907*
.257
.435
.511
.472
.496
-.435
.511

Sig.
.002
.637
.002
.696
.637
.696

Intervalo de confianza al
95%
Lmite
superior
Lmite inferior
-1.540
-.274
-1.692
.749
.274
1.540
-.822
1.693
-.749
1.692
-1.693
.822

*. La diferencia de medias es significativa al nivel .05.

102
Universidad de Deusto - ISBN 978-84-9830-628-6

Sintaxis para el Ejercicio 1

2. Realizar el mismo ejercicio anterior pero nicamente para los que tienen Ms de 55 aos (v4).
Verificar e interpretar la diferencia de resultados.
Algunas soluciones numricas relevantes:
ANOVA
vNueva

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
138.534
1552.005
1690.539

gl
3
289
292

Media
cuadrtica
46.178
5.370

F
8.599

Sig.
.000

Comparaciones mltiples
Variable dependiente: vNueva
Scheff

(I) Liderazgo
Bajo

Regular

Medio

Alto

(J) Liderazgo
Regular
Medio
Alto
Bajo
Medio
Alto
Bajo
Regular
Alto
Bajo
Regular
Medio

Diferencia de
Error tpico
medias (I-J)
-1.094*
.318
-1.661*
.363
-1.536
.617
1.094*
.318
-.567
.377
-.442
.625
1.661*
.363
.567
.377
.125
.650
1.536
.617
.442
.625
-.125
.650

Sig.
.009
.000
.105
.009
.520
.919
.000
.520
.998
.105
.919
.998

Intervalo de confianza al
95%
Lmite
Lmite inferior
superior
-1.987
-.201
-2.683
-.639
-3.272
.200
.201
1.987
-1.627
.493
-2.200
1.316
.639
2.683
-.493
1.627
-1.702
1.952
-.200
3.272
-1.316
2.200
-1.952
1.702

*. La diferencia de medias es significativa al nivel .05.

103
Universidad de Deusto - ISBN 978-84-9830-628-6

Sintaxis para el Ejercicio 2

3. Comprobar si existe diferencia significativa entre las medias de los cuatro grupos de Clase
Social (v35) del fichero ESCUEL.sav en la variable Mtodos de Relajacin (v17).
Algunas soluciones numricas relevantes:
ANOVA
Mtodos reljacin

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
8.631
565.676
574.308

gl
3
113
116

Media
cuadrtica
2.877
5.006

F
.575

Sig.
.633

Sntesis para el Ejercicio 3

4. En el fichero CAMPAA.sav analizar la posible diferencia significativa entre las medias de


los tres niveles de Estudios (v24) en la variable Amor (v22).
Algunas soluciones numricas relevantes:
ANOVA
V22 campaa slo lleva a atraccin

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
5.769
210.136
215.905

gl
2
165
167

Media
cuadrtica
2.884
1.274

F
2.265

104
Universidad de Deusto - ISBN 978-84-9830-628-6

Sig.
.107

Sntesis para el Ejercicio 4

5. Comprobar si las medias de los 5 grupos de edad de la variable Edad (v5) respecto a la variable
Bohemio (v16) en el fichero DROGODE.sav presentan diferencia significativa.
Algunas soluciones numricas relevantes:
ANOVA
Bohemio

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
46.240
362.957
409.196

gl
4
102
106

Media
cuadrtica
11.560
3.558

F
3.249

Sntesis para el Ejercicio 5

105
Universidad de Deusto - ISBN 978-84-9830-628-6

Sig.
.015

8.7. ANOVA DE DOS FACTORES


8.7.0. Frmulas y Aplicacin
8.7.0.1. Frmulas
Estadsticos F de Fisher

Prueba de Homogeneidad de Varianzas

SC A
GL A CM ( A) V ( A)
FA =
=
=
SC e
CM ( E ) V ( E )
GLe

Hay un sistema de comprobacin de la homogeneidad de


varianzas cuando se trata de anlisis de varianza doble (o,
incluso, del anlisis de varianza multivariante). Se trata de
comprobar la igualdad de varianzas del error (residual), es
decir, de comprobar si las varianzas de los diferentes
conjuntos de datos que componen cada celdilla son
similares o no lo son. Para ello, tambin se realiza un
anova simple creando una nueva variable cualitativa en la
que aparezcan identificados todos los sujetos segn
pertenezcan a una u otra celdilla (el nmero total de
celdillas es PQ). En la otra nueva variable obviamente de
carcter cuantitativo se adjudica a cada sujeto un nuevo
valor que ser el valor absoluto de la resta entre su valor
original y la media de esa celdilla a la que el sujeto
pertenezca. Con estas dos variables se realiza el anlisis
de varianza y se atiende a la significacin de la F con PQ
- 1 y N - PQ grados de libertad. Si tal F no resulta
significativa se admite la homogeneidad de las varianzas
del error y, por tanto, las varianzas similares entre los
diferentes grupos de datos.

SC B
GL B
CM ( B ) V ( B)
FB =
=
=
SC e
CM ( E ) V ( E )
GLe
F AB

SC AB
GL AB CM ( AB) V ( AB)
=
=
=
SC e
CM ( E )
V (E)
GLe
2

Q
N
X
X
P
1
1
SC A =
nQ
N
1

P
N
X
X
Q
SCB = 1 1
nP
N
1

SC AB

N
n
X
X
P Q
= 1 1 SC A SC B
n
N
1 1

SCe= SCT - SCA- SCB - SCAB


N
X
N
SCT = X 2 1
N
1

P = nmero de categoras del Factor A


Q = nmero de categoras del Factor B

GLA= P-1 GLB= Q-1 GLAB= (P-1)(Q-1)


GLe =(N - 1) - GLA - GLB - GLAB
En este apartado son tiles todo el resto de frmulas expuestas en el apartado anterior 8.6.0.1 dentro
del captulo de Anlisis de Varianza de un Factor.
8.7.0.2. Tipo de variables requeridas
Si el Anlisis Simple de Varianza permita establecer la influencia de un Factor o variable
independiente respecto a una variable dependiente; el ANOVA de 2 factores requiere el empleo de
2 o ms Factores. En este caso, la variable dependiente tendr un carcter cuantitativo, mientras
que los factores sern, en todo momento, variables cualitativas.
Ejemplo: Se quiere analizar si existen diferencias en la capacidad de decisin(v11) tomando como
criterio de anlisis la clase social(v35) y el centro de estudios(v36). La v35, as como la v36, son los
factores; mientras que la v11 en una variable de carcter cuantitativo en el fichero ESCUEL.sav

106
Universidad de Deusto - ISBN 978-84-9830-628-6

8.7.0.3. Utilidades e interpretacin


El Anlisis de Varianza de 2 factores sirve, al igual que el ANOVA de un Factor, para determinar si
existe diferencia significativa de medias entre los grupos o categoras de cada uno de los 2 factores
respecto a la variable dependiente.
Siguiendo con el ejemplo del apartado anterior del fichero ESCUEL.sav queremos estudiar si
existe diferencia significativa entre las medias de los grupos de clase social(v35) y del centro de
estudios(v36) con respecto a la capacidad de decisin(v11). Es decir, si la clase social y el centro de
estudios tiene algo que ver con lo que la gente opina sobre que se eche en falta o no que se les haya
enseado a tener una cierta capacidad de decisin.
8.7.1. Manejo del SPSS
El Anlisis Simple de Varianza (Anlisis de un Factor o Anova one-way), a travs de la razn F de
Fisher y otras tcnicas, permite llegar a la conclusin de si una variable o Factor tomado como
Independiente influye en la variable Dependiente de forma que quede patente la posible diferencia
significativa entre las medias de los diferentes grupos de las variable o factor.
En el Anlisis de Varianza de Dos Factores (Anlisis Doble de Varianza o Anova Two-Way) son
dos las variables o factores Independientes (Factor A y Factor B) los que en principio influyen en la
Dependiente, como por ejemplo la posible influencia en las calificaciones estudiantiles de por una
parte las asignaturas y por otra el hecho de que los alumnos pertenezcan a un determinado club, o la
posibilidad de que el rendimiento de un producto agrcola est influido por el tipo de tierra y por la
capacidad gentica de la semilla, etc. Cuando hay dos variables o factores independientes (pueden ser
tres, cuatro o incluso ms con lo cual el anlisis de varianza sera anlisis three-way, four-way, etc)
que influyen sobre una variable dependiente aparece un nuevo factor decisivo a tener en cuenta y es el
factor "Interaccin", es decir, la posibilidad de que, por ejemplo, una semilla con capacidad gentica
alta unida a la tierra de tipo caliza rindan enormemente ms debido a que multiplican juntas su
influencia, es decir, unen sus efectos, o, lo que es lo mismo, presentan interaccin.
Tal "Interaccin" supone que la variacin total de los datos ya no slo se deber al influjo del Factor A
(1 Variable Independiente) ms el influjo del Factor B (2 Variable Independiente) ms el influjo del
azar o residual, sino tambin al influjo de la "Interaccin" entre las dos variables (Factor A y Factor B).
Esto significa en sentido estricto que cuando hay interaccin no puede saberse cul es la influencia
exacta del factor A y del factor B. Por tanto, el anlisis de varianza doble en estas circunstancias
presenta la desventaja de tener que subrayar tan slo la influencia de la interaccin pero no de los
factores aunque, a veces, el propio descubrimiento de la existencia de interaccin es ya un hallazgo
importante en cualquier investigacin, ms importante incluso que el conocimiento del efecto o
influencia de uno y otro factor. No obstante, y merced a una argucia estratgica, puede entenderse la
influencia de la interaccin como un factor ms e independiente de los otros dos factores.
Conviene tener presente las condiciones estadsticas que deben cumplirse para realizar el anlisis de
Varianza de Dos Factores con Interaccin: 1) Las Variables Independientes (Factores) sern
Variables Cualitativas, es decir Variables Discretas y la Variable Dependiente ser Variable
Continua. 2) Los datos deben haber sido elegidos al azar de una poblacin normal. 3) Los errores se
distribuyen normalmente. 4) No existe correlacin entre los datos de los diferentes grupos y 5) Los
distintos grupos o subgrupos, en su caso, comparten supuestamente una varianza comn.
Si se toman como ejemplo los siguientes datos de un Diseo No Equilibrado y Modelo de Efectos
Fijos de Anlisis Doble de Varianza que aparecen en la tabla adjunta y que tras ser introducidos en
SPSS10 como un fichero de datos llamado ANVAD12.SAV (donde v1 = Clase Social, v2 =
Sexo y v3 = Satisfaccin Estudios Universitarios se puede averiguar si existe Interaccin y si,
107
Universidad de Deusto - ISBN 978-84-9830-628-6

adems, existe diferencia significativa entre los tres grupos de Clase Social y entre los dos de
Sexo.

FACTOR B
(v2: Sexo)

Hombre
Mujer

FACTOR A (v1: Origen Social)


C. Baja
C. Media
7,7,8
2,2,3,4
9,10,11,12,11
3,2,4

C. Alta
7,7,5,5,8
20,16,15

Se PULSA, en primer lugar, en la Opcin Analizar, posteriormente se elige Modelo lineal general
y finalmente Univariante (Fig. 80)
Figura 80.

Figura 81.
Como fruto de esa eleccin aparecer la ventana principal
de dilogo donde deben concretarse tanto las variables que
entran en el anlisis como los coeficientes y resultados
requeridos as como otros aspectos formales (Fig. 81).
Efectivamente, en la Figura 80 ya aparecen elegidas y
colocadas en su correspondiente recuadro la variable
dependiente y las dos variables independientes. Esto se
realiza PULSANDO la variable Clase Social (v1), en el
recuadro de la izquierda, donde aparecen las tres variables,
que quedar inmediatamente sealada (coloreada) y
despus PULSANDO el pequeo recuadro con la flecha
dirigida hacia el recuadro titulado Factores fijos. La misma operacin se realiza con la variable
Sexo (v2). Tambin de idntica forma se PULSA en las variables Satisfaccin E. Univ.(v3)que
tambin quedar sealada (coloreadas) y despus PULSANDO en el pequeo recuadro con la
flecha dirigida hacia el recuadro titulado Dependientes:.
Una vez concluido el proceso anterior, se van eligiendo entre los botones que aparecen
en la parte derecha de la ventana principal de dilogo aquellos que necesarios para
determinar los tipos de clculos (Fig. 82).
PULSANDO en Modelo aparecer el siguiente cuadro de dilogo (Fig. 83) en el que
propio programa ya ofrece la especificacin del modelo, segn las variables (Factores
fijos) determinadas anteriormente, que es el Factorial completo. Este ofrece todos
los efectos principales del factor, todos los efectos principales de las covariables si las
hay as como las interacciones factor por factor. Si se quiere un modelo
108
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 82.

Personalizado se seala esta opcin y se especifican en el recuadro Construir trminos qu


efectos se desean someter a anlisis.
Figura 83.

Es muy importante determinar en la parte inferior izquierda (Fig. 83) cmo se va a calcular la
Suma de Cuadrados, es decir, con qu Tipo de mtodo se va a dividir la suma de cuadrados, en
definitiva, la varianza. Es bastante usual utilizar el Tipo III porque considera la fuerza de todos los
efectos a la vez. El Tipo I, denominado descomposicin jerrquica de la suma de cuadrados
calcula el efecto de cada componente teniendo en cuenta solamente al componente que le precede.
El Tipo II calcula la suma de cuadrados considerando slo los efectos pertinentes entendiendo por
efecto pertinente aqul que no est contenido en el efecto que se est comprobando. El tipo IV est
diseado para las situaciones en las que haya casillas vacas. Una vez especificado el Modelo y el
Tipo de Suma de Cuadrados se PULSA Continuar y se vuelve a la ventana principal de dilogo
(Fig. 81).
Figura 84.
En este caso concreto, se va a utilizar el Tipo II para comprobar
el efecto de la Interaccin tenido en principio como inexistente y,
por tanto, averiguar la influencia de las otras dos variables
(factores).
El botn Contrastes (Fig. 84) se utiliza para contrastar las
diferencias entre los grupos de un factor. Puede haber contrastes
Simples (cada grupo se compara con todos los dems tomando
como grupo de control normalmente el ltimo o el primero), de Desviaciones (todos los grupos
menos normalmente el ltimo o el primero se comparan con la media total general de todos los
grupos), de las Diferencias (cada grupo menos el primero se compara con la media de los grupos
anteriores), de Herlmert (cada grupo menos el ltimo se compara con la media de los grupos
posteriores, Repetido (cada grupo menos el primero se compara con la media del grupo anterior. Y
tambin pueden establecerse contrastes de tendencia entre los parmetros de los grupos de cada
factor para averiguar si sta es lineal, cuadrtica, etc.). En este ejemplo no se ha elegido a priori
ningn tipo de contraste. Para volver a la ventana principal de dilogo se PULSA Continuar.
El botn Grficos (Fig. 85) proporciona para cada factor o variable independiente la representacin
grfica en la variable dependiente del valor alcanzado en ella por cada uno de los grupos.

109
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 85.

En este caso, como se puede apreciar, no se ha solicitado tampoco ningn grfico. PULSANDO en
Continuar de nuevo se vuelve a la ventana principal de dilogo.
El botn Post Hoc (Fig. 86) es de los de uso ms frecuente porque ofrece la posibilidad de verificar
las diferencias significativas entre las medias de los grupos existentes en los factores.
Figura 86.

Una explicacin resumida de los diferentes coeficientes ofrecidos por el programa estn expuestos
en el Apartado 8.6.1. y siguientes dentro del Anlisis de Varianza Simple diferenciando las dos
grandes alternativas: Asumiendo Varianzas Iguales en los grupos o No Asumiendo Varianzas
Iguales.
En el ejemplo se ha elegido, en primer lugar realizar comparaciones de medias entre los tres grupos
de la v1 Clase Social y para ello se seala la v1 en el recuadro Factores y se traslada al
recuadro de la derecha Contrastes Post Hoc para: utilizando el pequeo recuadro con la flecha en
direccin hacia la derecha. Posteriormente, se han elegido las comprobacin de C de Dunnett
simplemente pulsando en el pequeo recuadro blanco correspondiente.
Figura 87
El botn Guardar (Fig. 87) ofrece entre otras
posibilidades la de almacenar los resultados de la
prediccin, en base a la ecuacin de regresin, en un
fichero al que se le debe poner el nombre tras pulsar la
opcin Estadsticos de los coeficientes en el recuadro
Guardar en archivo nuevo. Este archivo es un archivo
.sav al que se accede y manipula desde el SPSS
Archivo de datos. Puede calcular tambin Valores
Pronosticados as como Residuos y Diagnsticos.

110
Universidad de Deusto - ISBN 978-84-9830-628-6

Aqu slo se ha optado por guardar el fichero de resultados al que se le ha puesto el nombre de
Anvad12coef.sav. Tener a disposicin este fichero de resultados, aunque de difcil manejo
interno, puede resultar muy til no slo para consultas puntuales sino para comparaciones entre
unos coeficientes y otros, etc., y todo ello en un mismo documento de datos global y conjunto.
El botn Opciones (Fig. 88) ofrece una amplia gama de posibilidades entre las cules hay sobre
todo dos de inters prioritario: la opcin Estadsticos descriptivos y la opcin Pruebas de
homogeneidad ambas en el recuadro Mostrar que, por una parte, informan de las medias y
desviaciones tpicas de todos los grupos de las variables independientes (factores) en la variable
dependiente y, por otra, del cumplimiento de la homocedasticidad o igualdad de varianzas de los
grupos. En el recuadro de Medias marginales estimadas puede solicitarse la media estimada que
se desea bien para el GLOBAL, bien para cada variable (factor) o bien para la interaccin.
Figura 88.

En este ejemplo, slo se han solicitado los Estadsticos descriptivos y la Prueba de


Homogeneidad. Al PULSAR Continuar, como se hace en el resto de cuadros de dilogo, se
vuelve a la ventana principal de dilogo (Fig. 81).
Una vez sealadas todas las opciones pertinentes requeridas se PULSA en esa ventana principal de
dilogo en Aceptar y el programa calcula todo lo solicitado.

8.7.2. Resultados e Interpretacin


Expuestos los resultados solicitados en su totalidad son los siguientes:

111
Universidad de Deusto - ISBN 978-84-9830-628-6

Anlisis de varianza univariante


Estadsticos descriptivos
Variable dependiente: v3. Satisfaccin E. Univ.
v1. Clase social
1.clase baja

2.clase media

3.clase alta

Total

v2. Sexo
1.hombre
2. mujer
Total
1.hombre
2. mujer
Total
1.hombre
2. mujer
Total
1.hombre
2. mujer
Total

Media
7.33
10.60
9.38
2.75
3.00
2.86
6.40
17.00
10.38
5.42
10.27
7.74

Desv. tp.
.577
1.140
1.923
.957
1.000
.900
1.342
2.646
5.755
2.234
5.623
4.798

N
3
5
8
4
3
7
5
3
8
12
11
23

a
Contraste de Levene sobre la igualdad de las varianzas error

Variable dependiente: v3. Satisfaccin E. Univ.


F
2.866

gl1

gl2
5

Significacin
.047

17

Contrasta la hiptesis nula de que la varianza error de la


variable dependiente es igual a lo largo de todos los grupos.
a. Diseo: Interseccin+v1+v2+v1 * v2

Pruebas de los efectos inter-sujetos


Variable dependiente: v3. Satisfaccin E. Univ.

Fuente
Modelo corregido
Interseccin
v1
v2
v1 * v2
Error
Total
Total corregida

Suma de
cuadrados
tipo III
474.618a
1343.540
289.790
120.776
102.966
31.817
1884.000
506.435

gl
5
1
2
1
2
17
23
22

Media
cuadrtica
94.924
1343.540
144.895
120.776
51.483
1.872

F
50.719
717.868
77.419
64.532
27.508

Significacin
.000
.000
.000
.000
.000

a. R cuadrado = .937 (R cuadrado corregida = .919)

Pruebas post hoc


v1. Clase social
Comparaciones mltiples
Variable dependiente: v3. Satisfaccin E. Univ.
C de Dunnett

(I) v1. Clase social


1.clase baja
2.clase media
3.clase alta

(J) v1. Clase social


2.clase media
3.clase alta
1.clase baja
3.clase alta
1.clase baja
2.clase media

Diferencia
entre
medias (I-J)
6.52*
-1.00
-6.52*
-7.52*
1.00
7.52*

Error tp.
.760
2.145
.760
2.063
2.145
2.063

Intervalo de confianza al
95%.
Lmite
superior
Lmite inferior
4.26
8.78
-7.32
5.32
-8.78
-4.26
-13.60
-1.44
-5.32
7.32
1.44
13.60

Basado en las medias observadas.


*. La diferencia de medias es significativa al nivel .05.

Del primer cuadro, Estadsticos descriptivos, ya pueden deducirse las primeras conclusiones, sobre
todo referidas a la sustancial diferencia entre las medias de la v2: 1(Hombre) = 5.42 y 2(Mujer) =
10.27 y tambin de la v1 principalmente entre 2(Clase media) = 2.86 y los otros dos grupos 1(Clase
baja) = 9.38 y 3(Clase alta) = 10.38. Respecto a la desviacin tpica se dan as mismo enormes
diferencias, por ejemplo, 5.62 del grupo 2(Mujer) de la v2 frente a 2.23 del grupo 1(Hombre) y una

112
Universidad de Deusto - ISBN 978-84-9830-628-6

desviacin tpica tan pequea como 0.90 del grupo 2(Clase media) de la v1 o 1.92 del grupo
1(Clase baja) frente a 5.76 del grupo 3(Clase alta).
El cuadro Pruebas de los efectos inter-sujetos en realidad no hace sino refrendar esas diferencias
existentes y consecuentemente ratificar el influjo de la v1, de la v2 y de la Interaccin sobre la
variable cuantitativa Satisfaccin con los Estudios Universitarios (FA = 77.419; FB = 64.532 y FAB
= 27.508, todas ellas muy significativas en los tres casos: Sig. = 0.000 0.0%).
No es de extraar, dentro de esta misma lgica, que el Contraste de Levene sobre la igualdad de
varianzas error considerando todos los grupos resulte significativa anunciando que los datos no
provienen de una nica poblacin dado que sus respectivas varianzas grupales no son homogneas.
Como ya se sabe, este dato exigira que el anlisis de varianza doble se detuviera por incumplir la
exigencia estadstica de homogeneidad de las varianzas.
Si se contina, sin embargo, a efectos de mera constatacin de qu grupos presentan medias
distintas en la v1 aparece el grupo 2 diferenciado muy significativamente del grupo 1 y del grupo 3
(2.86 frente a 9.38 y 10.38 respectivamente) utilizando la prueba C de Dunnett que asume varianzas
desiguales tal y como queda expuesto en el cuadro de Comparaciones mltiples.

8.7.3. Ejercicios y Sintaxis


1. Del fichero SALUD.sav
1.a.) Se puede decir que existen diferencias en el consumo de alcohol el fin de
semana (v57) segn las variables Tarea Ocupacional (v4) y Nivel de Estudios
(v1) recodificada (1 Sin estudios =1-2; 2 Bsicos = 3-4 y 3 Superiores = 5-7)?
Obviamente se trata de un anlisis de varianza doble con posible interaccin. Para resolverlo se
solicitan los necesarios clculos con el fin de ayudar a la interpretacin.
Estadsticos descriptivos
Variable dependiente: Consumo medio alc. fin sem.
v1r
Sin estudios

Bsicos

Superiores

Total

Tarea ocupacional
no
si
Total
no
si
Total
no
si
Total
no
si
Total

Media
52.71
24.27
42.78
19.67
16.27
17.72
8.33
8.10
8.19
31.69
17.11
24.20

Desv. tp.
103.558
38.825
87.270
58.106
24.491
42.053
10.309
12.600
11.432
78.833
27.233
58.658

N
41
22
63
60
81
141
6
10
16
107
113
220

a
Contraste de Levene sobre la igualdad de las varianzas error

Variable dependiente: Consumo medio alc. fin sem.


F
5.643

gl1
5

gl2
214

Significacin
.000

Contrasta la hiptesis nula de que la varianza error de la


variable dependiente es igual a lo largo de todos los grupos.
a. Diseo: Interseccin+v1r+v4+v1r * v4

113
Universidad de Deusto - ISBN 978-84-9830-628-6

Pruebas de los efectos inter-sujetos


Variable dependiente: Consumo medio alc. fin sem.

Fuente
Modelo corregido
Interseccin
v1r
v4
v1r * v4
Error
Total
Total corregida

Suma de
cuadrados
tipo III
43746.757a
45774.992
20505.269
2812.498
6726.941
709768.443
882356.000
753515.200

gl
5
1
2
1
2
214
220
219

Media
cuadrtica
8749.351
45774.992
10252.634
2812.498
3363.470
3316.675

F
2.638
13.801
3.091
.848
1.014

Significacin
.024
.000
.047
.358
.364

a. R cuadrado = .058 (R cuadrado corregida = .036)

La prueba de Levene evidencia una clara diferencia significativa entre las varianzas de los grupos
constituidos por la v1r y la v4. Siguiendo con el anlisis, la Prueba de efectos Inter.-sujetos destaca
en primer lugar la no existe diferencia significativa en la interaccin de ambos factores (0.364) por
lo que es necesario a continuacin realizar un anlisis doble de varianza sin interaccin.
Los resultados de este nuevo anlisis son:
Pruebas de los efectos inter-sujetos
Variable dependiente: Consumo medio alc. fin sem.

Fuente
Interseccin
v1r
v4

Hiptesis
Error
Hiptesis
Error
Hiptesis
Error

Suma de
cuadrados
tipo III
55948.970
11361.135
25328.165
716495.383
5246.596
716495.383

gl
1
2.652
2
216
1
216

Media
cuadrtica
55948.970
4283.499a
12664.082
3317.108b
5246.596
3317.108b

F
13.062

Significacin
.044

3.818

.023

1.582

.210

a. .501 MS(v4) + .499 MS(Error)


b. MS(Error)

De este nueva tabla Prueba de efectos inter-sujetos se deduce que v1r Nivel de estudios es
significativa, es decir, si hay diferencia significativa entre las medias de los tres grupos
recodificados respecto a v57 Consumo de alcohol el fin de semana (Sig.=0.023). No ocurre lo
mismo con v4 Tarea ocupacional dado que su Sig. Llega a 0.210 (21.0%) y, por tanto no existe
diferencia significativa de medias entre los que s tienen y los que no tienen tarea ocupacional o
actividad.
Esto supone seguir con el anlisis ms detallado utilizando la v1r y con ella realizar un anlisis de
varianza simple respecto de la v57 teniendo en cuenta que de la Prueba de Levene se sabe que la
diferencia de varianzas entre los tres grupos es significativa y, en consecuencia, al solicitar las
comparaciones Post-hoc se habr de elegir la opcin de No asumiendo varianzas iguales.
Descriptivos
Consumo medio alc. fin sem.

N
Sin estudios
Bsicos
Superiores
Total

63
143
16
222

Media
42.78
17.47
8.19
23.98

Desviacin
tpica
87.270
41.808
11.432
58.436

Error tpico
10.995
3.496
2.858
3.922

Intervalo de confianza para


la media al 95%
Lmite
Lmite inferior
superior
20.80
64.76
10.56
24.38
2.10
14.28
16.25
31.71

114
Universidad de Deusto - ISBN 978-84-9830-628-6

Mnimo
0
0
0
0

Mximo
573
412
33
573

ANOVA
Consumo medio alc. fin sem.

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
32314.993
722360.935
754675.928

gl
2
219
221

Media
cuadrtica
16157.497
3298.452

F
4.899

Sig.
.008

A partir de estos resultados del anova simple se verifica (Sig.=0.008) que ciertamente existe
diferencia significativa de medias entre los tres grupos de nivel de estudios respecto al consumo de
alcohol el fin de semana siendo el mayor consumo el de los Sin estudios y mucho menor el de los
estudios Superiores.
La determinacin de qu grupos difieren entre s se lleva a cabo mediante las Comparaciones
mltiples donde se verifica que tanto el grupo de Sin estudios como el grupo de estudios
Superiores difieren significativamente del grupo de estudios Bsicos. Tengase en cuenta que
los asteriscos en la columna de Diferencia de medias (I-J) tiene precisamente ese significado:
sealar que hay diferencia significativa entre los dos grupos comparados. Cuando no hay asterisco
no hay diferencia significativa. A estas mismas conclusiones se llega sabiendo que comparando los
signos de los valores de las columnas de Limite Inferior y de Lmite Superior no habr diferencia
significativa si tales signos no son iguales y habr diferencia si tales signos son iguales.
Comparaciones mltiples
Variable dependiente: Consumo medio alc. fin sem.
Games-Howell

(I) v1r
Sin estudios
Bsicos
Superiores

(J) v1r
Bsicos
Superiores
Sin estudios
Superiores
Sin estudios
Bsicos

Diferencia de
Error tpico
medias (I-J)
25.309
11.537
34.590*
11.360
-25.309
11.537
9.281
4.516
-34.590*
11.360
-9.281
4.516

Sig.
.079
.009
.079
.106
.009
.106

Intervalo de confianza al
95%
Lmite
Lmite inferior
superior
-2.28
52.90
7.38
61.80
-52.90
2.28
-1.51
20.08
-61.80
-7.38
-20.08
1.51

*. La diferencia de medias es significativa al nivel .05.

El paso ltimo en ese caso concreto consiste en realizar Anlisis de Varianza Simple en Cascada
eliminando aqul grupo ms diferente de los dems, en el ejemplo el grupo Sin estudios. Por
tanto, se comparan el grupo de estudios Bsicos con el grupo de estudios Superiores.
ANOVA
Consumo medio alc. fin sem.

Inter-grupos
Intra-grupos
Total

Suma de
cuadrados
1239.514
250164.046
251403.560

gl
1
157
158

Media
cuadrtica
1239.514
1593.402

F
.778

Sig.
.379

La Sig.= 0.379 (37.9%) deja claro que entre los dos grupos no existe diferencia significcativa con lo
que la conclusin final debe reconocer la importancia del grupo no considerado en este ltimo
anlisis, el de Sin estudios. Este grupo es el verdadera y significativamente distinto de los dems
y es el responsable de que pueda hablarse de diferencia significativa de medias en el consumo de
alcohol los fines de semana segn sea el nivel de estudios. Los de estudios bsicos y superiores no
se diferencian pero s es diferente el de sin estudios.

115
Universidad de Deusto - ISBN 978-84-9830-628-6

Deben recordarse varios pasos metodolgicos que en este ejemplo concreto no ha habido
oportunidad de realizar. Se trata de si en el anlisis doble de varianza hay Interaccin. En ese caso,
debe crearse una nueva variable que identifique los distintos grupos (tantos como casillas haya en el
cruce de las variables/factores fijos, o sea, multiplicando el nmero de categoras de una
variable/factor fijo por el nmero de categoras de la otra variable/factor fijo) y realizar con esa
nueva variable un Anlisis de Varianza Simple completo respecto de la variable dependiente para
determinar no slo la presencia de diferencias significativas de medias sino qu casillas se
diferencian de otras mediante las correspondientes comparaciones mltiples.
Por otra parte, puede ocurrir que las dos variables/factores fijos presenten significacin, es decir,
presenten diferencias significativas de medias. En esos casos, se toma la variable con mayor
significacin (menor valor en Sig.) que corresponde al mayor valor de F de Fisher. Y con ella se
lleva a cabo el necesario Anlisis de Varianza Simple completo respecto de la variable dependiente.
Sintaxis para el Ejercicio 1

2. Del fichero CITEC.sav realizar un Anlisis de Varianza de Dos factores con las variables
independientes v5 Sexo y v8 Aos de Educacin respecto a la variable dependiente v23 Cientficos
peligrosos.
Algunas soluciones numricas relevantes:
Pruebas de los efectos inter-sujetos
Variable dependiente: Cientficos peligrosos

Fuente
Modelo corregido
Interseccin
v5
v8
v5 * v8
Error
Total
Total corregida

Suma de
cuadrados
tipo III
71.113a
6881.460
1.317
57.372
15.198
1735.526
9818.000
1806.639

gl
7
1
1
3
3
1013
1021
1020

Media
cuadrtica
10.159
6881.460
1.317
19.124
5.066
1.713

F
5.930
4016.604
.769
11.162
2.957

a. R cuadrado = .039 (R cuadrado corregida = .033)

116
Universidad de Deusto - ISBN 978-84-9830-628-6

Significacin
.000
.000
.381
.000
.032

Sintaxis para el Ejercicio 2

3. Con el fichero DROGODE.sav averiguar si existe diferencia de medias entre los grupos de la
variable v3 Religiosidad y entre los grupos de la variable v4 Estudios respecto a la variable v9
Txikitero averiguando tambin si hay Interaccin entre las dos variables independientes v3 y v4.
Algunas soluciones numricas relevantes:
Contraste de Levene sobre la igualdad de las varianzas error

Variable dependiente: Txikitero


F
1.972

gl1

gl2
8

99

Significacin
.058

Contrasta la hiptesis nula de que la varianza error de la


variable dependiente es igual a lo largo de todos los grupos.
a. Diseo: Interseccin+v3+v4+v3 * v4

Pruebas de los efectos inter-sujetos


Variable dependiente: Txikitero

Fuente
Modelo corregido
Interseccin
v3
v4
v3 * v4
Error
Total
Total corregida

Suma de
cuadrados
tipo III
24.743a
1184.957
8.715
2.261
4.376
419.257
3144.000
444.000

gl
8
1
2
2
4
99
108
107

Media
cuadrtica
3.093
1184.957
4.358
1.130
1.094
4.235

F
.730
279.806
1.029
.267
.258

a. R cuadrado = .056 (R cuadrado corregida = -.021)

Sintaxis para el Ejercicio 3

117
Universidad de Deusto - ISBN 978-84-9830-628-6

Significacin
.664
.000
.361
.766
.904

4. Con el fichero ESCUEL.sav tomando las variables v35 (clase social) y v36 (centro) Qu
conclusiones pertinentes se obtienen sobre la influencia o relacin con la v16 (expresin corporal)?
Realizarlo tambin slo para el colectivo de mujeres.
Algunas soluciones numricas relevantes:
Pruebas de los efectos inter-sujetos
Variable dependiente: Expresin corporal

Fuente
Modelo corregido
Interseccin
v35
v36
v35 * v36
Error
Total
Total corregida

Suma de
cuadrados
tipo III
116.360a
3719.179
58.796
1.910
23.131
549.433
6128.000
665.793

gl
7
1
3
1
3
108
116
115

Media
cuadrtica
16.623
3719.179
19.599
1.910
7.710
5.087

F
3.268
731.065
3.852
.375
1.516

Significacin
.003
.000
.012
.541
.215

a. R cuadrado = .175 (R cuadrado corregida = .121)

Sintaxis para el Ejercicio 4

5. Con el fichero CAMPAA.sav analizar si existe diferencia de medias en la variable v19


teniendo en cuenta las v24 y v25 recodificada como sigue:
1-2 = 1
3=2
4=3
5-8 = 4

Algunas soluciones numricas relevantes:


Pruebas de los efectos inter-sujetos
Variable dependiente: V19 irresponsabilidad criticar campaa

Fuente
Modelo corregido
Interseccin
v24
v25r
v24 * v25r
Error
Total
Total corregida

Suma de
cuadrados
tipo III
38.032a
1208.872
6.176
9.789
17.050
183.537
2229.000
221.569

gl
11
1
2
3
6
155
167
166

Media
cuadrtica
3.457
1208.872
3.088
3.263
2.842
1.184

F
2.920
1020.914
2.608
2.756
2.400

a. R cuadrado = .172 (R cuadrado corregida = .113)

118
Universidad de Deusto - ISBN 978-84-9830-628-6

Significacin
.002
.000
.077
.044
.030

Sintaxis para el Ejercicio 5

6. Con el fichero CITEC.sav analizar si existe diferencia de medias en la variable resultante de


sumar los aciertos desde la v9 a la v20 de la escala de conocimiento cientfico segn las variables
v7 y v8. Se otorgar un punto si la respuesta es acertada y cero puntos si la respuesta no es acertada.
Cdigo de respuestas acertadas.
v9
v10
v11
v12
v13
v14

1
1
1
1
2
1

v15
v16
v17
v18
v19
v20

2
1
2
2
1
1

Algunas soluciones numricas relevantes:


Pruebas de los efectos inter-sujetos
Variable dependiente: TConoc

Fuente
Modelo corregido
Interseccin
v7
v8
v7 * v8
Error
Total
Total corregida

Suma de
cuadrados
tipo III
1943.492a
23119.729
51.158
865.264
37.823
5139.628
50370.000
7083.120

gl
15
1
3
3
9
1005
1021
1020

Media
cuadrtica
129.566
23119.729
17.053
288.421
4.203
5.114

F
25.335
4520.819
3.334
56.398
.822

a. R cuadrado = .274 (R cuadrado corregida = .264)

Sintaxis para el Ejercicio 6

119
Universidad de Deusto - ISBN 978-84-9830-628-6

Significacin
.000
.000
.019
.000
.596

8.8. CORRELACION
8.8.0. Frmulas y Aplicacin
8.8.0.1. Frmulas
Correlacin r de Pearson
_

( X X ) (Y Y )
r=
r=

= 1

ZxZ y
r=

N Sx S y

Coeficiente de correlacin de Spearman

XY X Y
[N X ( X ) )] [N Y ( Y ) )]
2

ryz.x =

ryx .zw =

ryz ryx rzx


(1 ryz2 )(1 rzx2 )
ryz ryx rzx

(1 r )(1 r )
2
yw . z

2
xw . z

D yi

Dyy Dii

D = matriz inversa de la matriz original de


correlaciones C
r yy

r1 y

C =

r
my

un individuo en una serie respecto al orden alcanzado


en la otra.
N = nmero de sujetos

2 A
N ( N 1)
A es la diferencia entre el nmero de rdenes lgicos
y el nmero de alteraciones del orden.

En general, la correlacin Parcial es

Ryi.234... =

N ( N 2 1)

Correlacin de Kendall

Si se trata de la correlacin parcial entre Y X


teniendo en cuenta dos variables que intervienen Z y
W, ryx.zw ser

2
i

Correlaciones Parciales
ryx ryz rxz
ryx.z =
(1 ryz2 )(1 rxz2 )
y si se trata de

d i = diferencia entre el orden o puesto alcanzado por

Para calcular A:
Se ordenan los sujetos (desde el primero hasta el
ensimo) en una de las variables.
Se adjudica a cada uno de esos sujetos ordenados el
orden que les corresponde en la otra variable.
Tomando esta ltima ordenacin se calcula el nmero
de rdenes lgicos existentes otorgndoles a cada uno
un punto positivo (+1) y se calcula el nmero de
desordenes otorgndoles a cada uno un punto
negativo.
Finalmente A = (+1) (1)

r y1 r y 2 r ym

r11 r12 r1m

rm1 rm 2 rmm

8.8.0.2. Tipo de variables requeridas


Se trabaja con variables continuas o cuantitativas como ingresos, puntuaciones... esto es, todas
aquellas cuyos datos son mediciones.

Al realizar las correlaciones se analiza en realidad el porcentaje de la varianza de la variable


dependiente explicado por la variable independiente.

120
Universidad de Deusto - ISBN 978-84-9830-628-6

8.8.0.3. Utilidades e interpretacin


La correlacin contesta a preguntas del tipo: depende la variable y de la variable x?. El coeficiente
de correlacin ms utilizado es la r de Pearson. Este va de -1 a 1 y se interpreta de forma que si el
coeficiente r de Pearson es negativo significa que a ms de x, menos de y y si es positivo a ms
de x, ms de y. El coeficiente tambin puede ser cero o prximo a ese valor, lo que significa que la
relacin que hay entre ambas variables es prcticamente nula.

Las correlaciones en las que slo se seala una variable dependiente y una independiente se
denominan correlaciones de orden cero o correlacin neta (rxy). De este coeficiente se puede
extraer el coeficiente de determinacin que refleja el porcentaje de la varianza de la variable
dependiente explicado por la independiente y matemticamente se calcula como el cuadrado del
coeficiente de correlacin r de Pearson denominado coeficiente de determinacin.
Pero tambin es conveniente atender a la existencia de otras variables independientes que ejercen su
influencia tanto sobre la variable dependiente como sobre la independiente. As, nos podemos
encontrar con una variable z que ejerce su influencia sobre la variable y y sobre la x. Al tener en
cuenta esta variable pasamos a la realizacin de las correlaciones parciales (rxy.z). En este caso al
estudiar este coeficiente hallaramos lo que explica x de y si le quitamos la influencia de z. As
cuanto ms descienda el coeficiente de correlacin parcial mayor es la influencia de z y si desciende
mucho podramos encontrarnos frente a una correlacin inexistente o esprea.
En lo que se refiere a la matriz de correlaciones hay que tener en cuenta que tal matriz es simtrica
(rxy=ryx) dado que la diagonal de esa matriz es 1 (ya que es la correlacin de cada variable consigo
misma). Por otra parte, para el estudio de los resultados en esa matriz es importante detenerse en los
coeficientes de correlacin elevados y detectar aquellos subconjuntos de variables con coeficientes
de correlacin elevados porque ello significar que existe relacin entre todas ellas.
Inicialmente la matriz se hace con correlaciones directas por lo que es conveniente posteriormente
realizar otra matriz de correlaciones parciales quitando el influjo de la variable que parezca ms
influyente. Puede pasar que al quitar esa variable no exista relacin entre las dems con lo que
podemos deducir que la causa explicativa est en esa variable. Si al eliminar el influjo de esa
variable no pasa nada es debido a su escasa influencia.
8.8.1. Manejo del SPSS
Antes de iniciar los pasos operativos, es necesario localizar el fichero de datos con el que se va a
trabajar, en este caso el fichero ESCUEL.sav, y abrirlo de manera que se site en pantalla. Para
ello, se pulsa Archivo, Abrir y por ltimo sealando el nombre del fichero y PULSANDO
Aceptar.

Para obtener los diversos coeficientes de correlacin se PULSA la opcin Analizar, posteriormente
Correlaciones y finalmente PULSANDO Bivariadas (Fig. 89)

121
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 89.

Como resultado de la eleccin se obtiene la ventana de Correlaciones bivariadas (Fig. 90).


Figura 90.

En el recuadro de la izquierda nos encontramos con la lista de variables numricas del archivo de
datos. De ella, seleccionamos las que se precisan obtener el coeficiente de correlacin deseado.
Como siempre se PULSAN las variables seleccionadas y se pasan al recuadro Variables
PULSANDO el pequeo recuadro con la flecha hacia la derecha.
En el recuadro Coeficientes de correlacin se ofrecen tres coeficientes aunque siempre viene
sealado por defecto el coeficiente de Pearson.
1. Pearson: Coeficiente de correlacin r de Pearson. Medida apropiada para medir la
relacin lineal entre dos variables cuantitativas. Los valores del coeficiente de
correlacin van de -1 a 1. El signo del coeficiente indica la direccin de la relacin y su
valor absoluto indica la fuerza.
2. Tau b de Kendall: Medida no paramtrica de relacin para variables ordinales o de
rangos (tiene en consideracin los empates). El signo del coeficiente indica la direccin
de la relacin y su valor absoluto indica la magnitud de la misma de tal modo que los
mayores valores absolutos indican relaciones ms fuertes. Los valores posibles van de -1
a 1 aunque un valor de -1 +1 slo se puede obtener a partir de tablas cuadradas.
3. Spearman: Versin no paramtrica del coeficiente de correlacin de Pearson, que se
basa en los rangos de los datos en lugar de hacerlo en los valores reales. Resulta
apropiada para datos ordinales o los de intervalo que no satisfagan el supuesto de
normalidad. Los valores del coeficiente van de -1 a +1. Como en los otros coeficientes,
122
Universidad de Deusto - ISBN 978-84-9830-628-6

el signo indica la direccin de la relacin y el valor absoluto la intensidad. Los valores


absolutos mayores indican que la relacin es mayor.
El recuadro Prueba de significacin est referido a la prueba de hiptesis de que el coeficiente de
correlacin es cero. Las alternativas son las siguientes:
1. Bilateral: Probabilidad de obtener resultados tan extremos como el obtenido, y en
cualquier direccin, cuando la hiptesis nula es cierta
2. Unilateral: Probabilidad de obtener un resultado tan extremo como el observado, y en la
misma direccin, cuando la hiptesis nula es cierta. Contrasta la hiptesis nula en la que
se especifica con antelacin la direccin del efecto.
El recuadro Marcar las correlaciones significativas muestra los niveles de significacin de la
prueba de hiptesis arriba seleccionada. Una vez especificadas estas preferencias y antes de pulsar
el botn Aceptar para obtener los resultados se puede PULSAR el botn Opciones el cual permite
solicitar estadsticos adicionales y determinar el tratamiento de los valores perdidos (Fig. 91)
Figura 91.

Seleccionando Medias y desviaciones tpicas muestra para cada variable la media, la desviacin
tpica y el nmero de casos no perdidos. Productos cruzados y covarianzas muestra los productos
cruzados diferenciales y las covarianzas para cada par de variables.
Dentro del recuadro valores perdidos se dan dos opciones:
1. Excluir casos segn pareja: excluye del anlisis los casos que tengan valores perdidos
en cualquiera (o en ambas) de las variables de una pareja implicada en el clculo de un
estadstico especfico.
2. Excluir casos segn lista: excluye los casos que tienen valores perdidos en cualquiera
de las variables utilizadas en cualquiera de los anlisis.
Una vez finalizada la eleccin de los Opciones, se PULSA Continuar para volver a la ventana
original (Fig. 89) y PULSAR definitivamente Aceptar para obtener los resultados en la ventana de
resultados Navegador de resultados del SPSS.
Cuando se desean calcular los coeficientes de correlacin r de Pearson entre varias variables
tomadas de dos en dos los resultados se presentan como una matriz de correlaciones. Obviamente,
la correlacin de una variable consigo misma es 1 y la correlacin de X con Y es la misma que la
correlacin de Y con X, con lo cul tal matriz de correlaciones resulta simtrica y aporta los
siguientes datos.
Ejemplo:

123
Universidad de Deusto - ISBN 978-84-9830-628-6

Correlaciones
Hablar
Hablar

Anlisis-Sntesis

Capacidad de decisin

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

1
117
.544**
.000
115
.201*
.030
117

AnlisisCapacidad
Sntesis
de decisin
.544**
.201*
.000
.030
115
117
1
.243**
.009
115
115
.243**
1
.009
115
117

**. La correlacin es significativa al nivel 0,01 (bilateral).


*. La correlacin es significante al nivel 0,05 (bilateral).

Con estos resultados se conocen las correlaciones de cada una de las variables con todas las dems.
En ocasiones, sin embargo, se quiere conocer cul es la correlacin parcial o neta de una variable
con otra pero eliminando el posible influjo de otra u otras variables.
En ese caso, se PULSA secuencialmente: Analizar, Correlaciones y Parciales y aparecer la
ventana de dilogo Correlaciones parciales. En ella se puede pedir, por ejemplo, la correlacin
parcial de la v6 con la v9 eliminando el influjo de la v11(Fig. 92).
Figura 92.

Si se pulsa el botn Opciones aparece un cuadro similar al de la Fig. 91 pero con una nueva
posibilidad: las Correlaciones de orden cero (Fig. 93) que en realidad son los coeficientes de
correlacin ordinarios sin variables de control.
Figura 93.

Una vez realizado el clculo resulta una correlacin parcial


entre v6 y v9 controlando la v11 de r=0.525 con 112 sujetos y
una significacin de 0,000. Es evidente que se ha perdido algo
de correlacin ordinaria o de orden cero (r=0.544) entre v6 y
v9 porque se ha eliminado la influencia de la v11.

Correlaciones
Variables de control
Capacidad de decisin

Hablar

Anlisis-Sntesis

Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl

Hablar
1.000
.
0
.525
.000
112

124
Universidad de Deusto - ISBN 978-84-9830-628-6

AnlisisSntesis
.525
.000
112
1.000
.
0

8.8.2. Ejercicios, Resultados e Interpretacin

1. Del fichero de datos DROGODE.sav hallar la matriz de correlacin de las variables v6 a la


v13 sealando aquellas variables con mayor intercorrelacin entre ellas.
Estadsticos descriptivos

Borracho-penas
Chico-litronas
Yonki
Txikitero
Borracho-finsemana
Herona
Porros-diario
Cocana

Media
7.16
5.46
8.64
5.01
6.12
7.46
6.79
7.41

Desviacin
tpica
1.869
1.865
1.007
2.030
1.947
1.704
1.594
1.759

N
107
107
106
109
109
108
107
107

Correlaciones

Borracho-penas

Chico-litronas

Yonki

Txikitero

Borracho-finsemana

Herona

Porros-diario

Cocana

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

Borrachopenas
1

Chico-litronas
.359**
.000
107
106
.359**
1
.000
106
107
.294**
.200*
.002
.042
105
104
.349**
.533**
.000
.000
107
107
.422**
.677**
.000
.000
107
107
.350**
.444**
.000
.000
107
107
.308**
.393**
.001
.000
106
105
.338**
.346**
.000
.000
105
105

Borracho-fi
nsemana
Yonki
Txikitero
Herona
Porros-diario
Cocana
.294**
.349**
.422**
.350**
.308**
.338**
.002
.000
.000
.000
.001
.000
105
107
107
107
106
105
.200*
.533**
.677**
.444**
.393**
.346**
.042
.000
.000
.000
.000
.000
104
107
107
107
105
105
1
.133
.215*
.375**
.132
.310**
.174
.027
.000
.179
.001
106
106
106
105
105
104
.133
1
.447**
.342**
.094
.327**
.174
.000
.000
.334
.001
106
109
109
108
107
107
.215*
.447**
1
.531**
.402**
.310**
.027
.000
.000
.000
.001
106
109
109
108
107
107
.375**
.342**
.531**
1
.376**
.588**
.000
.000
.000
.000
.000
105
108
108
108
106
106
.132
.094
.402**
.376**
1
.290**
.179
.334
.000
.000
.003
105
107
107
106
107
106
.310**
.327**
.310**
.588**
.290**
1
.001
.001
.001
.000
.003
104
107
107
106
106
107

**. La correlacin es significativa al nivel 0,01 (bilateral).


*. La correlacin es significante al nivel 0,05 (bilateral).

Las variables v7 Chico-litronas, v9 Txikitero, v10 Borracho-finsemana y v11 Heroina son las que
presentan entre ellas mayores correlaciones debido principalmente a que estn referidas al tema del
alcohol, as como v6 Borracho-penas, v8 Yonki y v13 Cocana tambin presentan intercorrelacin,
aunque ms baja, mezclando el tema de herona y cocaina con alcohol. El resto tienden a ser
correlaciones ms bajas y, en algn caso, incluso no significativas.
Sintaxis para el Ejercicio 1

2. Partiendo de la matriz de correlaciones del ejercicio anterior, tomar como variable objeto de
estudio a la v10 Borracho-finsemana e ir realizando anlisis de correlaciones parciales con el resto
de variables ligadas a ella, es decir v7 Litronas, v9 Txikitero y v11 Heroina de manera que pueda

125
Universidad de Deusto - ISBN 978-84-9830-628-6

conocerse la correlacin v7-v10 eliminando el influjo de las dems, v9-v10 y v11-v10 eliminando
en su caso el influjo de las dems variables.
Correlaciones Parciales v7 y v10 controlando v9- v11
Variables de control
Txikitero & Herona

Chico-litronas

Borracho-finsemana

Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl

Chico-litronas
1.000
.
0
.507
.000
103

Borracho-fi
nsemana
.507
.000
103
1.000
.
0

Como se puede observar, la correlacin inicial entre v7 Chico-litronas y v10 Borrracho-finsemana


r=0.677 ha descendido hasta r=0.,507 lo que demuestra la presencia de influencia de v9 Txikitero y
v11 Heroina.
As mismo, pueden obtenerse las correlaciones parciales de v9 Txikitero-v10 Borracho-finsemana y
v11 Heroina-v10 Borracho-finsemana eliminando en cada caso las otras dos variables. Tras seguir
los pasos operativos oportunos, los resultados indican que la correlacin inicial de v9-v10 r=0.447
desciende significativamente hasta r=0.118 (con lo que obviamente se deduce la mayor fuerza de
influencia de v7 y v11 sobre la v10) y la correlacin inicial de v11-v10 r=0.531 tambin baja a
r=0.334.
Sintaxis para el Ejercicio 2

3. Con el fichero ESCUEL.sav analizar las relaciones existentes entre las variables v2, v3, v8,
v13, v14, v15 y v16 mediante las correlaciones bivariadas. Asimismo, analizar dichas relaciones
cundo se neutraliza la variable v16.
Algunas soluciones numricas relevantes: correlaciones parciales de todas con todas controlando la
v16

126
Universidad de Deusto - ISBN 978-84-9830-628-6

Correlaciones Parciales v2, v3, v8, v13, v14, v15 controlando v16
Variables de control
Expresin corporal

Capacidades Artsticas

Educacin Cvica

Disfrutar

Trabajar en grupo

Capacidad de crstica

Valenta

Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl

Capacidades
Artsticas
1.000
.
0
.282
.003
111
.029
.758
111
.101
.288
111
-.071
.457
111
.116
.223
111

Educacin
Cvica
.282
.003
111
1.000
.
0
.184
.052
111
.127
.180
111
.267
.004
111
.246
.009
111

Disfrutar
.029
.758
111
.184
.052
111
1.000
.
0
.216
.022
111
.416
.000
111
.226
.016
111

Trabajar
en grupo
.101
.288
111
.127
.180
111
.216
.022
111
1.000
.
0
.389
.000
111
.328
.000
111

Capacidad
de crstica
-.071
.457
111
.267
.004
111
.416
.000
111
.389
.000
111
1.000
.
0
.249
.008
111

Valenta
.116
.223
111
.246
.009
111
.226
.016
111
.328
.000
111
.249
.008
111
1.000
.
0

Sintaxis para el Ejercicio 3

4. Con el fichero SALUD.sav analizar las relaciones existentes entre las variables v5, v7, v11,
v13 y v17. Qu ocurre en dichas relaciones cuando se neutraliza la variable v13?.
Algunas soluciones numricas relevantes:
Correlaciones

Consumo regular alcohol

Consumo regular de
tabaco
Opiceos consumo
regular

Consumo regular cocana

Consumo regular herona

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

Consumo
regular
alcohol
1

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

Consumo
Opiceos
regular de
consumo
tabaco
regular
.398**
.296**
.000
.002
180
179
107
.398**
1
.209*
.000
.023
179
217
117
.296**
.209*
1
.002
.023
107

117

119

.350**
.000
154
.336**
.000
179

.310**
.000
173
.268**
.000
214

.630**
.000
110
.732**
.000
119

**. La correlacin es significativa al nivel 0,01 (bilateral).


*. La correlacin es significante al nivel 0,05 (bilateral).

127
Universidad de Deusto - ISBN 978-84-9830-628-6

Consumo
regular
cocana
.350**
.000
154
.310**
.000
173
.630**
.000
110
1
174
.764**
.000
173

Consumo
regular
herona
.336**
.000
179
.268**
.000
214
.732**
.000
119
.764**
.000
173
1
216

Correlaciones Parciales v5, v7, v11, v13, v17 controlando v13

Variables de control
Consumo regular
cocana

Consumo regular alcohol

Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl

Consumo regular de
tabaco
Opiceos consumo
regular

Consumo regular cocana

Consumo regular herona

Correlacin
Significacin (bilateral)
gl
Correlacin
Significacin (bilateral)
gl

Consumo
regular
alcohol
1.000
.
0
.399
.000
97
.099
.330

Consumo
regular de
tabaco
.399
.000
97
1.000
.
0
.088
.387

Opiceos
consumo
regular
.099
.330
97
.088
.387
97
1.000
.

97

97

.
.
97
.141
.164
97

.
.
97
.156
.123
97

Sintaxis para el Ejercicio 4

128
Universidad de Deusto - ISBN 978-84-9830-628-6

Consumo
regular
cocana
.
.
97
.
.
97
.
.

Consumo
regular
herona
.141
.164
97
.156
.123
97
.499
.000

97

97

.
.
97
.499
.000
97

1.000
.
0
.
.
97

.
.
97
1.000
.
0

8.9. REGRESIN MLTIPLE Y REGRESIN SIMPLE


8.9.0. Frmulas y Aplicacin
8.9.0.1. Frmulas
Ecuacin de Regresin Mltiple Lineal
Yp = ao + b1 X1 + b2 X2 + ... + bm Xm

Correlacin
Tolerancia

Para hallar los coeficientes bi debe cumplirse

[Y-(a + b X + b X + ...)] = mnimo


1

Semiparcial

En general, la frmula de la Correlacin Parcial es


D yi
R yi .234... =
D yy Dii

Parcial,

la solucin de la ecuacin anterior se convierte matricialmente D la matriz inversa de la matriz original de correlaciones
en X'Y =(X'X)bi pudindose hallar, por tanto, el valor de los C
coeficientes mediante
r yy r y1 r y 2 r ym

bi = (X'X)-1 X'Y
r1 y r11 r12 r1m
X matriz de todos los datos de X

Y matriz de todos los datos de Y


C=
X' es la matriz transpuesta de la matriz X

ao = Y - Xi bi

r
r
r
mm
Ecuacin de Regresin Mltiple Lineal
my m1 m 2
Yp = a + b X

Significatividad de los coeficientes bi estimados

Correlacin Semiparcial

La significatividad se calcula mediante el estadstico t de R yx1. x 2 =


Student
bi
bi
t=
=
SE (B )
Ve d ii

r yx1 r yx 2 rx1x 2
1 rx21x 2

Tolerancia= 1 Ri2. j

R i2. j el cuadrado de la correlacin entre la variable


bi = coeficiente de cada variable
SE(B) = Error tpico de los coeficientes de la ecuacin independiente i que no est includa en la ecuacin y el
conjunto de variables j ya incluidas en la ecuacin
= Ve d ii

Ve= Varianza del error


1
dii = el elemento diagonal propio de la variable i de la matriz
(Factor Inflaccin de la Varianza) =
F.I.V.
-1
[XX]
1 Ri2. j

Test de Durbin-Watson

La correlacin mltiple Ry . x1x 2... y el anlisis de

Varianza
R2 =

S 2y.x1x 2...
S 2y

(Y

N
2
(Y p Y )
= 1
N
2
(Y Y )
1

(e e

i 1

Tambin R 2 =

D=

b X Y
Y Y

)2

e

2
i

ei es el residuo: la diferencia entre el verdadro valor Yi



y el valor pronosticado Yi .

Y ) 2 Influjo de X1,X2,,.,Xm

129
Universidad de Deusto - ISBN 978-84-9830-628-6

(Y Y )

Varianza Total de los datos Y

Mahalanobis

Coeficiente de Correlacin Mltiple Corregido

Rc2 =

N 1
m
R2
N m 1
N m 1

(Y

X X
D = i
Sx

Cook

Y)

Ci =

m
N

(Y Y

p)

(Y ( ) Y )
N

Estadstico F =

Distancias

j =1

( p + 1)S 2

Error Tpico de Estimacin

N m 1
m es el nmero de variables independientes

Se =

N
S y 1 R2
N m 1

Relacin entre el estadstico F y el coef. Correl. Mltiple R


R2
R 2 ( N m 1)
m
F=
=
1 R2
m (1 R )
( N m 1)

8.9.0.2. Tipo de variables requeridas


El procedimiento estadstico de la regresin mltiple exige que todas las variables que vayan a ser
objeto de estudio, tanto la dependiente Y como las variables independientes X, sean cuantitativas.
As, por ejemplo, y tomando como punto de referencia el fichero ESCUEL.sav, podramos utilizar en
la regresin mltiple cualquiera de las variables 15(valenta para enfrentarse), v12(destrezas manuales),
v19(no comprometerse tanto), v22(escuchar atentamente), v23(todos cometemos errores) y
v31(compasin); ya que todas ellas son escalas y por lo tanto de carcter cuantitativo.
8.9.0.3. Utilidades e interpretacin
Tanto la regresin simple como la regresin mltiple tienen como utilidad establecer en que medida
una variable dependiente viene explicada por el resto de las variables independientes.

Ejemplo: del fichero ESCUEL.sav, deseamos conocer en que medida la variable detectar los
engaos(v20) viene explicada, para toda la poblacin, por las variables Valenta para
enfrentarse(v15), Expresin corporal(v16), Mtodos de relajacin(v17), Preguntas
estpidas(v18) y Pasar(v19). En este sentido, y una vez realizado el anlisis (mtodo introducir),
detectamos que la v20 tiene una relacin baja (0,5) con el resto de las variables independientes. Por
lo tanto, la interpretacin que se har ser la siguiente; Detectar los engaos viene explicada por
el resto de las variables independientes (v15, v16, v17, v18 y v19) en un 25%, dejando el 75% al
influjo del azar o de otras variables no contempladas.

8.9.1. Manejo del SPSS


Antes de iniciar los pasos operativos, debe lgicamente localizarse el fichero de datos con el que se
va a trabajar y recuperarlo de modo que aparezca en pantalla. Esto se lleva a cabo PULSANDO en
Archivo, despus en Abrir, seguidamente sealando el nombre del fichero y PULSANDO
Aceptar.
130
Universidad de Deusto - ISBN 978-84-9830-628-6

El procedimiento para la obtencin de los distintos estadsticos (coeficiente de regresin mltiple R2,
ecuacin de regresin mltiple, significacin de los coeficientes de la ecuacin, etc.) comprendidos en
la tcnica de la regresin mltiple se realiza (Fig. 94) PULSANDO el ratn en la opcin Analizar,
PULSANDO en la opcin Regresion y finalmente PULSANDO en Lineal. Esta ltima eleccin
significa admitir que la relacin entre las variables es lineal y no curvilnea ni de otro estilo y que los
clculos matemticos se realizan mediante la tcnica del mnimo error cuadrtico de prediccin.
Como puede apreciarse en la Fig. 94 existen, en la opcin Regresin otras alternativas de clculo que
no van a ser consideradas aqu:
Estimacin curvilnea.
Logistica.
Probit.
No lineal.
Estimacin ponderada.
Mnimos cuadrados en dos fases.
Figura 94.

Como resultado de la eleccin Lineal aparece la ventana de dilogo de la Fig. 95.


En l hay un recuadro a mano izquierda con la lista de variables del fichero de datos. Para elegir la
Variable Dependiente se PULSA sobre ella y despus se PULSA el pequeo recuadro con la flecha
dirigida hacia la derecha. Inmediatamente esta variable quedar ubicada en el recuadro titulado
Dependiente. Con la misma forma de proceder se van seleccionando aquellas variables
consideradas independientes y se PULSA el pequeo recuadro inferior con la flecha dirigida hacia
la derecha para que queden colocadas en el recuadro con el ttulo Independientes..
Bloque 1 de 1
Siguiente. Suele ser lo normal
Hacia la mitad del cuadro se lee Anterior
seleccionar un slo bloque de variables independientes para explicar la variable dependiente. Pero
el programa posibilita el que se incorporen dos bloques o ms de variables independientes. Caso de
ser as, el programa trabaja siempre con el primer bloque y aparecer Bloque 1 de 2. PULSANDO
en Siguiente se cambiar al segundo bloque de variables y aparecer Bloque 2 de 2, etc.

131
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 95.

Debajo del recuadro de las variables independientes aparece la importantsima opcin de Mtodo,
es decir, el modo estratgico de clculo de la regresin mltiple. El programa ofrece en principio el
modo: Introducir. Significa que todas las variables independientes van a ser tenidas en cuenta para
explicar la variable dependiente. Pero hay otras posibilidades para elegir si se PULSA el pequeo
recuadro adjunto con la flecha dirigida hacia abajo (Fig. 96).
Figura 96.

El mtodo Pasos sucesivos: incluye sucesivamente en la ecuacin de regresin mltiple


aquellas variables independientes con mayor grado de influencia significativa sobre la
variable dependiente. El propio programa se detiene cuando ninguna de las variables
independientes restantes es capaz de aadir un grado significativo de explicacin. Este
proceso se realiza teniendo en cuenta fundamentalmente la correlacin parcial de las
variables no incluidas.
Eliminar: es un procedimiento que toma en consideracin las variables independientes
que han quedado sin utilizar en un determinado mtodo. Quiere esto decir que entra en
funcionamiento siempre despus de utilizar un primer mtodo.
Hacia atrs: para el clculo de la ecuacin de regresin mltiple, toma al inicio todas las
variables independientes. Despus va eliminando sucesivamente la variable que menos
fuerza explicativa presenta. Luego, la siguiente y as hasta que no elimina ninguna y
queda el conjunto de variables independientes que ms capacidad significativa de
explicacin.
Hacia adelante: consiste, como en el caso del mtodo Pasos sucesivos, en introducir
sucesivamente en la ecuacin de regresin mltiple la variable independiente con ms
alta influencia aunque se diferencia de l porque una vez introducida la variable en la
ecuacin ya no es sacada de la misma a pesar de que en las sucesivas ecuaciones no
llegue a tener significatividad su test de la F.
132
Universidad de Deusto - ISBN 978-84-9830-628-6

En la parte inferior de la Fig. 95 hay una serie de botones que ofrecen distintas posibilidades:
MCP>>-Ponderacin mnimo cuadrtica-: otorga diferente peso o ponderacin a los
datos de las variables multiplicndolos por la raz cuadrada del valor de su ponderacin.
Para ello deber estar creada esa variable de ponderacin, la MCP que no ser ninguna de
las variables independientes ni tampoco la dependiente. Si se PULSA MCP aparecer un
recuadro en el que deber incluirse esa variable de ponderacin de los datos.
Estadsticos-: Al PULSARLO (Fig. 97) surge un cuadro de seleccin de diferentes
coeficientes, matrices, etc.
1. Estimaciones-: el programa siempre ofrece esta posibilidad. Se trata de la
estimacin de los coeficientes de las variables independientes en la ecuacin de
regresin mltiple.
2. Intervalos de confianza se refiere a los lmites de confianza de los coeficientes
de la ecuacin para un nivel de confianza determinado.
3. Matriz de covarianzas se trata de la matriz de varianzas y covarianzas entre los
coeficientes de la ecuacin de regresin mltiple.
Figura 97.

En la parte superior central tambin se ofrecen otras posibilidades:


1. Ajuste del modelo: aporta la R mltiple, la R2 o coeficiente de Determinacin, la R2
ajustada o corregida, el error tpico de la R y la tabla del Anlisis de Varianza.
2. Cambio en R cuadrado. Cambio en el estadstico R cuadrado que se produce al
aadir o eliminar una variable independiente. Si es grande el cambio en R cuadrado
asociado a una variable es grande, esto significa que esa variable es un buen
predictor de la variable dependiente.
3. Descriptivos: aporta la media, desviacin tpica y la matriz de correlaciones tanto de
la variable dependiente como de las independientes.
4. Correlaciones parcial y semiparcial. Muestra las correlaciones de orden cero,
semiparcial y parcial.
5. Diagnstico de colinealidad. Muestra las tolerancias para las variables individuales
y una variedad de estadsticos para diagnosticar los problemas de colinealidad. La
colinealidad (o multicolinealidad) es una situacin no deseable en la que una de las
variables independientes es una funcin lineal de otras variables independientes.
En la parte inferior se dan las siguientes posibilidades:
1. Durbin-Watson: el test de Durbin-Watson para la correlacin/independencia de los
residuos o errores.
2. Diagnstico por caso. Genera diagnsticos por casos, para todos los casos que
cumplan el criterio de seleccin (los valores atpicos por encima de n desviaciones
tpicas).
Todas estas posibilidades se refieren a los resultados que se van produciendo paso a paso segn el
mtodo utilizado y no slo a los resultados finales definitivos.
133
Universidad de Deusto - ISBN 978-84-9830-628-6

Una vez finalizado con la eleccin de los Estadsticos- se PULSA en Continuar para poder elegir
nuevas opciones.
Grficos: ofrece un conjunto variado de grficos que completa e ilustra los resultados
obtenidos y posibilita una mejor interpretacin a partir del anlisis del cumplimiento de
las condiciones exigibles a la regresin mltiple. (Fig. 98)
1. En el recuadro de la izquierda aparecen las abreviaturas de DEPENDNTVar.Dependiente-, ZPRED-Valores de prediccin, ZRESID-Errores tipificados,
DRESID-Errores no considerados-,ADJPRED-Valores de prediccin ajustados, SRESID-Errores estudentizados- y SDRESID-Errores estudentizados no
consideradosCon cualquiera de estas nuevas variables puede establecerse un grfico de
coordenadas. Basta con PULSAR en ella y PULSAR el recuadro pequeo con la
flecha en direccin a la derecha para colocarla en la ordenada Y o en el eje de
abcisas X. Por ejemplo, con ZPRED-Valores de prediccin tipificados- y
ZRESID-Errores tipificados- para detectar la posible linealidad entre ellos, es
decir, la posible relacin entre ambos que, lgicamente, no debe existir. El grfico
no debe demostrar la relacin entre ellas.
Figura 98.

2. Generar todos los grficos parciales: se refiere a los grficos de regresin


parcial de cada una de las variables independientes con la dependiente.
3. Grficos de residuos tipificados:
3.1. Histograma: ofrece el histograma de los residuos o errores tipificados
incorporando tambin la curva normal.
3.2. Grfico de probabilidad normal: aporta el grfico de probabilidad
acumulada de los errores en X (observada) e Y (esperada).
Guardar: la posibilidad de guardar en un archivo o en varios archivos todos los clculos
adicionales solicitados es una opcin interesante (Fig. 99)

134
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 99.

1. En el recuadro superior de la izquierda aparecen los Valores pronosticados:


No tipificados. Valor que predice el modelo para la variable dependiente.
Tipificados. Transformacin de cada valor pronosticado a su forma
tipificada. Es decir, se sustrae el valor pronosticado medio al valor
pronosticado y el resultado se divide por la desviacin tpica de los
valores pronosticados. Los valores pronosticados tipificados tienen una
media de 0 y una desviacin tpica de 1.
Corregidos. Valor pronosticado para un caso cuando dicho caso no se
incluye en los clculos de los coeficientes de regresin.
E.T. de pronsticos promedio. Error tpico de los valores pronosticados.
Estimacin de la desviacin tpica del valor promedio de la variable
dependiente para los casos que tienen valores iguales en las variables
independientes.
2. En el recuadro inmediatamente inferior aparecen los clculos de diferentes tipos
de Distancias.
En regresin es importante localizar los casos que tienen mayor influencia o
ejercen un efecto ms grande a la hora de establecer el modelo. Estos casos o
sujetos pueden ser aquellos que influyen en las B del modelo y por tanto, en las
predicciones, que aumentan las varianzas de los coeficientes o que tienen un
ajuste deficiente al modelo. Una forma de localizar estos sujetos es calculando la
distancia que en la variable independiente tienen los mismos respecto a la media
aritmtica.
Mahalanobis.
Esta distancia aunque resulta ms compleja de calcular es ms valiosa en el
caso de la regresin mltiple, en donde intervienen todas las distancias a
todas las variables independientes del modelo. Sealar finalmente que el
hecho de que un individuo tenga un valor extremo en la variable
independiente no necesariamente conlleva que su residual sea tambin
extremo.
De Cook.
Tiene en consideracin el valor de los cambios en todos los residuales cuando
una puntuacin determinada es eliminada de la regresin y calcula, por tanto,
esos cambios para cada sujeto. En concreto:
Valores de influencia Medida de la influencia de un punto en el ajuste de
la regresin. La influencia centrada vara entre 0 (no influye en el ajuste)
y (N-1)/N.
135
Universidad de Deusto - ISBN 978-84-9830-628-6

3. Ms abajo, aparece el recuadro Intervalos de pronstico.


Medias: intervalos de la media para un nivel de confianza dado.
Individuo: intervalo de confianza para un determinado valor de
prediccin a un nivel de confianza dado.
Nivel de confianza-: por defecto, el programa ofrece el 95%. Puede
elegirse otro cualquiera, 99%, 90%, etc.
4. En el primer recuadro superior a la derecha aparecen los Residuos:
No tipificados. Diferencia entre un valor observado y el valor
pronosticado por el modelo.
Tipificados. Residuo dividido por una estimacin de su error tpico. Los
residuos tipificados, que son conocidos tambin como los residuos de
Pearson o residuos estandarizados, tienen una media de 0 y una
desviacin tpica de 1.
Estudentizados. Residuo dividido por una estimacin de su desviacin
tpica que vara de caso en caso, dependiendo de la distancia de los
valores de cada caso en las variables independientes respecto a las medias
en las variables independientes.
Eliminados. Residuo para un caso cuando ste se excluye del clculo de
los coeficientes de la regresin. Es igual a la diferencia entre el valor de la
variable dependiente y el valor pronosticado corregido.
Eliminados estudentizados. Residuo eliminado para un caso dividido por
su error tpico. La diferencia entre un residuo eliminado estudentizado y
su residuo estudentizado asociado indica la diferencia que implica el
eliminar un caso sobre su propia prediccin.
5. En el siguiente recuadro aparecen los Estadsticos de influencia:
DfBetas. La diferencia en el valor de beta es el cambio en el valor de un
coeficiente de regresin que resulta de la exclusin de un caso particular.
Se calcula un valor para cada trmino del modelo, incluyendo la
constante.
DfBetas tipificadas. Valor de la diferencia en beta tipificada. El cambio
tipificado en un coeficiente de regresin cuando se elimina del anlisis un
caso particular. Puede interesarle examinar aquellos casos cuyos valores
absolutos sean mayores que 2 dividido por la raz cuadrada de N, donde N
es el nmero de casos. Se calcula un valor para cada trmino del modelo,
incluyendo la constante.
DfAjuste. La diferencia en el valor ajustado es el cambio en el valor
pronosticado que resulta de la exclusin de un caso particular.
DfAjuste tipificados. Diferencia tipificada en el valor ajustado. El
cambio, tipificado, en el valor pronosticado que resulta de la exclusin de
un caso particular. Puede interesarle examinar aquellos valores tipificados
cuyo valor absoluto sea mayor que 2 dividido por la raz cuadrada de p/N,
donde p es el nmero de variables independientes en la ecuacin y N es el
nmero de casos.
Razn entre covarianzas. Razn del determinante de la matriz de
covarianza con un caso particular excluido del clculo de los coeficientes
de regresin, respecto al determinante de la matriz de covarianza con
todos los casos incluidos. Si la razn se aproxima a 1, el caso no altera
significativamente la matriz de covarianza.
136
Universidad de Deusto - ISBN 978-84-9830-628-6

Una vez finalizada la eleccin de Guardar se PULSA en Continuar y se vuelve a la ventana


original (Figura 74.) en las que se pueden seleccionar otras opciones

Opciones: determina las condiciones matemticas y operativas para la construccin del


modelo de regresin (Fig. 100)

1. En el primer recuadro aparece Criterios del mtodo por pasos. Se refiere a usar
el criterio de Probabilidad de F o el criterio del valor de F como baremo
operativo de los diversos clculos finales.
1.1 Usar la probabilidad de F: distingue dos momentos. Entrada si se trata
de permitir la entrada de una nueva variable a la ecuacin. Por defecto,
utiliza el .05 pero puede ser modificado por el .01 o por .10, etc. segn el
propio investigador. Salida si se trata de eliminar una variable de la
ecuacin. Por defecto, utiliza el .10 pero tambin puede ser modificado.
1.2 Usar el valor de F: tambin se ofrecen por defecto pero pueden ser
modificados.
2. Incluir la constante en la ecuacin: se da por defecto. Si no se desea, basta con
PULSAR en el recuadro y dejarlo en blanco.
Figura 100.

3. Valores Perdidos
3.1 Excluir casos segn lista: excluye aquellos casos con valores missing, o
sea con valores despreciados.
3.2 Excluir casos segn pareja: excluye los casos que en cualquiera de las
variables que entran a formar parte de la ecuacin de regresin presentan
missing o valores despreciados.
3.3 Reemplazar por la media: se reemplaza el valor missing de cualquier
caso en una determinada variable con el valor de la media de esa
variable.
Tras finalizar la eleccin de las Opciones se PULSA en CONTINUAR para volver a la ventana
original (Fig. 94) y PULSAR definitivamente en Aceptar para obtener los resultados en la ventana
de Navegador de Resultados.

8.9.2. Ejercicios, Resultados, Interpretacin y Sintaxis

1. Realizar el anlisis de regresin mltiple obteniendo los resultados ms bsicos a partir de los datos
del fichero denominado REGRE1.sav.

137
Universidad de Deusto - ISBN 978-84-9830-628-6

Una vez abierto el fichero, se PULSA en la opcin Analizar, posteriormente en Regresion y a


continuacin en Lineal. Dado que la v1 (Nivel de Frustracin) es la variable dependiente se PULSA
sobre ella y se traslada al recuadro de Dependiente tras pulsar en el recuadro pequeo que tendr la
flecha dirigida hacia la derecha. Despus se PULSA sobre v2 (Horas TV/Semana) y sobre v3 (Nivel
Socioec.) y se trasladan al recuadro de Independientes. El mtodo de clculo, en este caso, es
Introducir porque se desea conocer la influencia de las dos variables sobre la dependiente.
PULSANDO en el botn inferior Estadsticos se opta por Descriptivos para conocer las medias, las
desviaciones tpicas y la matriz de correlaciones entre las tres variables. Una vez elegido se PULSA en
Continuar y se vuelve al cuadro de dilogo inicial donde ya se puede PULSAR Aceptar para obtener
los resultados, que son los siguientes:
Estadsticos descriptivos
Desviacin
tp.
18.006
7.718
16.059

Media
63.70
19.30
59.90

v1. NIVEL DE FRUSTRACION


v2. Horas TV/Semana
v3. Nivel Socioec.

N
10
10
10

Correlaciones

Correlacin de Pearson

Sig. (unilateral)

v1. NIVEL DE FRUSTRACION


v2. Horas TV/Semana
v3. Nivel Socioec.
v1. NIVEL DE FRUSTRACION
v2. Horas TV/Semana
v3. Nivel Socioec.
v1. NIVEL DE FRUSTRACION
v2. Horas TV/Semana
v3. Nivel Socioec.

v1. NIVEL DE
FRUSTRACION
1.000
.766
.967
.
.005
.000
10
10
10

v2. Horas
TV/Semana
.766
1.000
.831
.005
.
.001
10
10
10

v3. Nivel
Socioec.
.967
.831
1.000
.000
.001
.
10
10
10

Resumen del modelo


Modelo
1

R
.970a

R cuadrado
corregida
.924

R cuadrado
.941

Error tp. de la
estimacin
4.971

a. Variables predictoras: (Constante), v3. Nivel Socioec., v2.


Horas TV/Semana

ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
2745.118
172.982
2918.100

gl
2
7
9

Media
cuadrtica
1372.559
24.712

F
55.543

Sig.
.000a

a. Variables predictoras: (Constante), v3. Nivel Socioec., v2. Horas TV/Semana


b. Variable dependiente: v1. NIVEL DE FRUSTRACION

Coeficientesa

Modelo
1

(Constante)
v2. Horas TV/Semana
v3. Nivel Socioec.

Coeficientes no
estandarizados
B
Error tp.
-2.623
6.624
-.290
.386
1.201
.186

Coeficientes
estandarizad
os
Beta
-.124
1.071

t
-.396
-.751
6.467

Sig.
.704
.477
.000

a. Variable dependiente: v1. NIVEL DE FRUSTRACION

Los resultados dejan en evidencia varias cosas: por una parte, el cuidado que debe tenerse en la
interpretacin de los coeficientes de correlacin porque, efectivamente, v2 Horas de TV/Semana
influye mucho en v1 Nivel de Frustracin (r=0.766) pero, sin embargo, la verdadera influencia est
en v3 Nivel socioec. y no solo porque r=0.967 sino porque en la ecuacin de regresin se nota con
138
Universidad de Deusto - ISBN 978-84-9830-628-6

claridad que el coeficiente de la variable v2 (-0.290) no resulta significativo (t=-0.751 Sig.=0.477 o


sea, 47.7% de que se deba al azar) mientras que el coeficiente de v3 (1.201; t=6.467 Sig.=0.000 o
sea, no puede deberse al azar) resulta muy influyente y decisivo.
Por otra parte, en el recuadro de resultados Resumen del Modelo aparece que la correlacin
mltiple R=0.970 y la R2=0.941, es decir el 94.1% de la Varianza de v1 queda explicada por la
accin conjunta de v2 y v3. En realidad, debe precisarse que en esa correlacin quien ms peso
tiene es la v3 Nivel socioec. y no tanto la v2 Horas TV/Semana.
Sintaxis para el Ejercicio 1

2. Averiguar cmo es explicada la v14 (Crtica) mediante la v6 (Hablar en pblico), v7 (Tcnicas


de estudio) y v9 (Anlisis-sntesis) del fichero ESCUEL.sav mediante el mtodo de Pasos
Sucesivos.
Figura 101.

Cuando se elige el mtodo de Pasos sucesivos (Fig. 101), tras PULSAR en la opcin Pasos suc. en el
recuadro correspondiente de Mtodo, es muy til obtener los datos descriptivos de las variables, sobre
todo la matriz de correlaciones para poder posteriormente comparar esas correlaciones de orden cero
con las correlaciones parciales. Por tanto, se PULSA el botn inferior de Estadsticos para sealar
Descriptivos adems de Estimaciones y Ajuste del modelo que los proporciona automticamente el
propio programa. Tras PULSAR Continuar el programa vuelve al cuadro de dilogo inicial y ah se
PULSA Aceptar para obtener los resultados.
Los resultados son los siguientes:

139
Universidad de Deusto - ISBN 978-84-9830-628-6

Estadsticos descriptivos
Desviacin
tp.
2.355
1.953
2.213
2.329

Media
7.11
7.68
7.07
6.87

Capacidad de crstica
Hablar
Tcnicas de Estudio
Anlisis-Sntesis

N
114
114
114
114

Correlaciones

Correlacin de Pearson

Sig. (unilateral)

Capacidad de crstica
Hablar
Tcnicas de Estudio
Anlisis-Sntesis
Capacidad de crstica
Hablar
Tcnicas de Estudio
Anlisis-Sntesis
Capacidad de crstica
Hablar
Tcnicas de Estudio
Anlisis-Sntesis

Capacidad
de crstica
1.000
.490
.491
.729
.
.000
.000
.000
114
114
114
114

Tcnicas
de Estudio
.491
.597
1.000
.616
.000
.000
.
.000
114
114
114
114

Hablar
.490
1.000
.597
.533
.000
.
.000
.000
114
114
114
114

AnlisisSntesis
.729
.533
.616
1.000
.000
.000
.000
.
114
114
114
114

Resumen del modelo


Modelo
1

R
R cuadrado
.729a
.531

R cuadrado
corregida
.527

Error tp. de la
estimacin
1.620

a. Variables predictoras: (Constante), Anlisis-Sntesis

ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
332.651
294.086
626.737

gl
1
112
113

Media
cuadrtica
332.651
2.626

F
126.687

Sig.
.000a

a. Variables predictoras: (Constante), Anlisis-Sntesis


b. Variable dependiente: Capacidad de crstica
Coeficientesa

Modelo
1

(Constante)
Anlisis-Sntesis

Coeficientes no
estandarizados
B
Error tp.
2.046
.474
.737
.065

Coeficientes
estandarizad
os
Beta
.729

t
4.312
11.256

Sig.
.000
.000

a. Variable dependiente: Capacidad de crstica


Variables excluidasb

Modelo
1

Hablar
Tcnicas de Estudio

Beta dentro
.142a
.068a

t
1.882
.821

Sig.
.062
.414

Correlacin
parcial
.176
.078

Estadsticos
de
colinealidad
Tolerancia
.716
.620

a. Variables predictoras en el modelo: (Constante), Anlisis-Sntesis


b. Variable dependiente: Capacidad de crstica

La interpretacin puede partir de este ltimo cuadro de resultados Variables excluidas en el que
precisamente por su mismo ttulo se sabe que v6.Hablar y v7.Tcnicas de Estudio no entran a formar
parte de la ecuacin de regresin sobre v14.Crtica. Desde luego sus correlaciones parciales con ella as
lo manifiestan (r=0.176 y r=0.078 respectivamente) puesto que son muy bajas y descienden bastante de
las correlaciones de orden cero (r=0.490 y r=0.491 respectivamente). Quiere esto decir que la variable,
140
Universidad de Deusto - ISBN 978-84-9830-628-6

en definitiva, ms importante para explicar v14 es v9.Anlisis-Sntesis. Alcanza una R=0.729 y una
R2=0.531, es decir, ella sola logra explicar el 53.1% de la varianza de v14. Por otra parte, el coeficiente
de la ecuacin (0.737) es claramente significativo y no se debe al azar (t=11.256 Sig.=0.000) lo que
certifica desde otra perspectiva la importancia de esta variable v9. Las otras dos, sin embargo, no
aaden prcticamente a lo que v9 aporta en solitario.
Sintaxis para el Ejercicio 2

3. Tomando el fichero ESCUEL.sav realizar un estudio completo en el que se muestre como la


variable v15. Valenta viene explicada por las variables v19 Pasar, v22 Hacer algo difcil y
bien, y v31 Compasinmediante el mtodo de Pasos sucesivos. Realizar tambin el mismo
estudio pero para los sujetos de clase social alta. Comparar ambos resultados.
Algunas soluciones numricas relevantes:
Para toda la muestra
Coeficientesa

Modelo
1
2

(Constante)
Compasin
(Constante)
Compasin
Hacer algo difcil
(Constante)
Compasin
Hacer algo difcil
"Pasar"

Coeficientes
estandarizad
os
Beta

Coeficientes no
estandarizados
B
Error tp.
4.233
.517
.380
.081
3.301
.659
.309
.086
.203
.091
2.375
.732
.277
.084
.248
.091
.205
.078

.408
.332
.205
.298
.250
.223

t
8.188
4.685
5.010
3.600
2.222
3.244
3.280
2.738
2.625

Sig.
.000
.000
.000
.000
.028
.002
.001
.007
.010

a. Variable dependiente: Valenta

Para los de clase social alta


Coeficientesa

Modelo
1

(Constante)
Compasin

Coeficientes no
estandarizados
B
Error tp.
1.925
1.107
.682
.157

Coeficientes
estandarizad
os
Beta
.609

t
1.739
4.346

a. Variable dependiente: Valenta

141
Universidad de Deusto - ISBN 978-84-9830-628-6

Sig.
.092
.000

Sintaxis para el Ejercicio 3

4. Del mismo fichero ESCUEL.sav cmo es explicada v14 por v9, v12, v30 y v29 mediante el
mtodo Introducir?. Realizar el mismo ejercicio slo para el grupo de hombres y slo para el grupo
de mujeres comparando los tres tipos de resultados.
Algunas soluciones numricas relevantes:
Para toda la muestra
Coeficientesa

Modelo
1

(Constante)
Anlisis-Sntesis
Destrezas Manuales
Poltica
Educacin deportiva

Coeficientes no
estandarizados
B
Error tp.
2.961
.749
.724
.070
-.090
.078
-.008
.067
-.039
.078

Coeficientes
estandarizad
os
Beta
.735
-.082
-.008
-.038

t
3.954
10.405
-1.155
-.123
-.505

Sig.
.000
.000
.251
.903
.615

a. Variable dependiente: Capacidad de crstica

Para el grupo de Hombres y el grupo de Mujeres


Coeficientesa

Sexo
HOMBRE

MUJER

Modelo
1

(Constante)
Anlisis-Sntesis
Destrezas Manuales
Poltica
Educacin deportiva
(Constante)
Anlisis-Sntesis
Destrezas Manuales
Poltica
Educacin deportiva

Coeficientes no
estandarizados
B
Error tp.
2.828
1.371
.744
.120
-.069
.191
.082
.143
-.213
.160
3.216
.927
.668
.095
-.084
.089
-.040
.078
.033
.090

Coeficientes
estandarizad
os
Beta
.824
-.052
.075
-.191
.647
-.087
-.044
.036

a. Variable dependiente: Capacidad de crstica

142
Universidad de Deusto - ISBN 978-84-9830-628-6

t
2.062
6.185
-.359
.569
-1.334
3.467
7.039
-.953
-.516
.361

Sig.
.050
.000
.723
.574
.194
.001
.000
.343
.607
.719

Sintaxis para el Ejercicio 4

5. Cmo es explicada la v23 del fichero CITEC.sav mediante la v25, v38, v40 y v43 mediante el
mtodo de Pasos sucesivos?
Algunas soluciones numricas relevantes:
Resumen del modelo
Modelo
1

R
R cuadrado
.111a
.012

R cuadrado
corregida
.011

Error tp. de la
estimacin
1,323

a. Variables predictoras: (Constante), Productos

Coeficientesa

Modelo
1

(Constante)
Productos

Coeficientes no
estandarizados
B
Error tp.
2.423
.114
.123
.035

Coeficientes
estandarizad
os
Beta
.111

t
21.222
3.556

Sig.
.000
.000

a. Variable dependiente: Cientficos peligrosos

Variables excluidasb

Modelo
1

Futuro
Economa competitiva
Beneficios

Beta dentro
-.049a
.007a
-.051a

t
-1.588
.218
-1.646

Sig.
.113
.827
.100

Correlacin
parcial
-.050
.007
-.052

a. Variables predictoras en el modelo: (Constante), Productos


b. Variable dependiente: Cientficos peligrosos

143
Universidad de Deusto - ISBN 978-84-9830-628-6

Estadsticos
de
colinealidad
Tolerancia
1.000
.998
.994

Sintaxis para el Ejercicio 5

6. Del mismo fichero y mediante el mtodo Introducir averiguar la dependencia de la v28 respecto de
las variables v21, v25, 29 y v42 con especial atencin a las correlaciones parciales y a la significacin
de los coeficientes de la ecuacin de regresin mltiple.
Algunas soluciones numricas relevantes:
Resumen del modelo
Modelo
1

R
R cuadrado
.308a
.095

R cuadrado
corregida
.091

Error tp. de la
estimacin
1,223

a. Variables predictoras: (Constante), Computers, Futuro,


Confortabilidad, Trabajo ms interesante

Coeficientesa

Modelo
1

(Constante)
Confortabilidad
Futuro
Trabajo ms interesante
Computers

Coeficientes no
estandarizados
B
Error tp.
2.000
.156
.081
.039
.210
.035
.140
.036
.061
.028

Coeficientes
estandarizad
os
Beta
.065
.200
.130
.066

a. Variable dependiente: Progreso

Sintaxis para el Ejercicio 6

144
Universidad de Deusto - ISBN 978-84-9830-628-6

t
12.794
2.052
5.949
3.892
2.203

Sig.
.000
.040
.000
.000
.028

8.10. FIABILIDAD DE LOS TEST


8.10.0. Frmulas y Aplicacin
8.10.0.1. Frmulas
Alfa () de Crombach

r2 de Friedman

S 2j

k
=
1 1 2
k 1
S

k = nmero de tems
S 2j =varianza de cada item

G 2j 3 N (k + 1) )
2

N k + k 1

N = nmero de sujetos
G = suma de los rangos de los sujetos en cada tem

r2 =

Q de Cochran (para datos dicotomizados)


Q=

Dos mitades

k (k 1)

S 2 =varianza de las puntuaciones totales

R=

12

kN

2 rip

(k 1)N 2

2
j

1 + rip

rip = coeficiente de correlacin entre las puntuaciones totales T cuadrado de Hotteling


obtenidas con la mitad de los items del test y las
puntuaciones totales obtenidas con la otra mitad.
T2 = traza | S A S e1 | = suma de los elementos
diagonales de la matriz resultante.
Guttman
SA = Matriz de Suma de Cuadrados Intergrupo
S2 +S2
S e1 = Matriz de Suma de Cuadrados del Error.
R = 2 1 1 2 2

N n
S12 =varianza de las puntuaciones de la primera mitad
F =T2
(N 1)
n

S 22 =varianza de las puntuaciones de la segunda mitad


n = grados de libertad = k-1

Prueba de aditividad de Tukey


Fnoadit =

SC noadit

SC resto

[(a 1) (b 1) 1]

8.10.0.2. Tipo de variables requeridas


La fiabilidad se utiliza para averiguar si el instrumento de medida (test, escalas,...) es consistente.
En el caso concreto de los test dicotmicos se ofrecen varias preguntas y se responde, a cada una,
verdadero o falso (adems del no sabe/no contesta). Con esto se pretende averiguar los aciertos de
un determinado sujeto y otorgarle una puntuacin con respecto al conjunto de sujetos que ha
contestado. En el caso de las escalas, las respuestas de cada sujeto pueden oscilar entre el Muy en
Desacuerdo y el Muy de Acuerdo.

Para que los resultados de los test o de las escalas tengan sentido es necesario que el instrumento de
medicin (el test) sea fiable, es decir, est compuesto por una batera de tems con capacidad para
medir en la misma direccin aportando puntuaciones robustas y slidas de modo que si el test o la
escala fuera respondida por segunda vez o tercera vez o ensimas veces los resultados alcanzaran
valores similares.
8.10.0.3. Utilidades e interpretacin.
Fiabilidad significa en trminos coloquiales poder fiarse uno de lo que se dice, de lo medido. As La
fiabilidad significa consistencia y constancia en la medida. Pero es importante tener en cuenta que

145
Universidad de Deusto - ISBN 978-84-9830-628-6

un instrumento puede ser fiable pero no vlido, esto es, un instrumento puede medir igual siempre
pero su medicin puede no ser verdadera.
Para el anlisis de fiabilidad se suele utilizar como estadstico el coeficiente de fiabilidad Alpha de
Cronbach y por lo general se considera que una fiabilidad es relevante cuando este coeficiente es
superior a 0.70.
La estrategia procedimental consistir en ir eliminando aquellos items que hacen disminuir el
coeficiente de fiabilidad y que pueden ser desechables al no medir lo mismo que el resto por lo que
en realidad estorban. Para averiguar si un item sobra se realiza el anlisis de fiabilidad con todos los
items y se averigua si la fiabilidad aumenta al eliminar ese tem. Si, por el contrario, la fiabilidad
disminuye significa que el item era importante y necesario.
Se acabar el proceso cuando los resultados de la fiabilidad no sufran un aumento aunque no
consideren otros tems.
8.10.1. Manejo del SPSS
La obtencin de la fiabilidad de un test o escala se obtiene PULSANDO en la opcin del men
Analizar, seleccionando Escalas y posteriormente PULSANDO en Anlisis de fiabilidad (Fig.
102).

Las operaciones citadas se realizan una vez localizado el fichero de datos PULSANDO en la opcin
del men principal Archivo, Abrir y PULSANDO en Datos con lo que podr buscarse donde est
el fichero deseado que aparecer en pantalla tras seleccionarlo y PULSANDO en Abrir de la
ventana de dilogo.
Figura 102.

Como resultado aparece en pantalla el siguiente cuadro (Fig. 103).


Figura 103.

146
Universidad de Deusto - ISBN 978-84-9830-628-6

A continuacin deben seleccionarse las variables o tems que formen parte de la escala cuyo
coeficiente se desee calcular. La seleccin se lleva a cabo marcando las variables dentro del primer
cuadro y, pulsando el botn que separa ambos cuadros, se pasan al de la derecha.
Debajo del cuadro que contiene el listado de variables aparece otro cuadro ms pequeo con los
distintos modelos con los que se puede calcular el coeficiente de fiabilidad. Los mtodos que para
ello ofrece el SPSS son los siguientes (Fig. 104):
Figura 104.

El mtodo Alfa (Crombach) realiza el clculo del coeficiente de fiabilidad por medio de la frmula
de alfa de Crombach.
El mtodo Dos mitades calcula el coeficiente de fiabilidad mediante la divisin de los elementos en
dos mitades utilizando dos mtodos diferentes: Sperarman-Brown y Guttman. (ATENCION: si no es
debidamente programado, el SPSS no realiza la divisin entre items pares e impares sino entre la
primera mitad de los tems y la segunda mitad de ellos)
El procedimiento Spearman-Brown estima el coeficiente de fiabilidad mediante el clculo de las
correlaciones entre las dos mitades. La utilizacin de este procedimiento exige homogeneidad de las
varianzas correspondientes a las dos mitades; por ello es necesario previamente a la aplicacin del
mismo una prueba de contraste de homogeneidad de las varianzas (mediante anlisis de varianza u
otros estadsticos).
El procedimiento Guttman realiza la estimacin del coeficiente de fiabilidad mediante la
comparacin de las varianzas de las dos mitades.
El mtodo Paralelo asume que todos los elementos tienen varianzas iguales y varianzas de error
iguales a lo largo de las rplicas.
El mtodo Estricto paralelo realiza los supuestos del modelo paralelo y tambin asume medias
iguales a lo largo de los elementos.
Eligiendo la opcin listar etiquetas de los elementos aparecern las etiquetas correspondientes a
las variables objeto de estudio.
El botn Estadsticos ofrece la siguiente ventana de dilogo (Fig. 105):

147
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 105.

El cuadro Descriptivos para ofrece las siguientes opciones:


-

Elemento: proporciona la media, desviacin tpica y el nmero de casos de cada variable o


tem.
Escala: proporciona los estadsticos para la escala analizada: la media de la escala (
compuesta por la suma de las medias de cada tem), la varianza (suma de las varianzas de
cada tem), la desviacin tpica y el nmero de variables de que se compone la escala.
Escala si se elimina elemento: ofrece el resumen de los estadsticos comparando cada tem
con la escala compuesta por los otros tems. Los estadsticos incluyen la media y varianza de
la escala si el tem fuera eliminado de la escala, la correlacin entre el tem y la escala
compuesta por los otros tems, y el alpha de Crombach si el tem fuera eliminado de la
escala.

En el cuadro Resmenes se puede optar por:


-

Media: la media conjunta de los items de la escala, la media mnima y mxima, el rango, la
diferemncia entre mxima y mnima y la varianza entre las medias.
Varianzas: la media de las varianzas de los tems, la media de varianza mnima y mxima, el
rango, la diferencia entre varianza mxima y mnima y la varianza de las mismas.
Covarianzas: la media de las covarianzas, la media de covarianza mnima y mxima, el
rango, la diferencia entre covarianza mxima y mnima y la varianza de las mismas.
Correlaciones: la media de las correlaciones, la media de mnima y mxima, el rango, la
diferencia entre mxima y mnima y la varianza de las mismas.

En el cuadro Entre-elementos aparece:


-

Correlaciones: la matriz de correlaciones entre los tems y los estadsticos de las


correlaciones
Covarianzas: la matriz de covariaciones y los estadsticos de correlaciones.

En el cuadro Tabla de Anova se tienen las siguientes opciones:


-

Ninguno.
Prueba F.
Chi-cuadrado de Friedman. Sujeto por sujeto se van asignando los rangos de cada uno de
ellos en las variables test y posteriormente por variables se suman estos rangos y se
promedian en toda la muestra.

148
Universidad de Deusto - ISBN 978-84-9830-628-6

Chi-cuadrado de Cochran.

Al final del cuadro aparece:


- T cuadrado de Hotelling. Es una generalizacin de la t de Student.
La suma de los productos de la forma (X i i )(X j j )s ij (n 1) de una muestra de n datos

que siguen la distribucin normal multidimensional con parmetros i ij siguen la distribucin


2 de Hotelling.
- Prueba de aditividad de Tukey. Idea un procedimiento para averiguar si la interaccin es
nula calculando Fnoadit que se distribuye segn F con 1 y (a-1)(b-1)-1 grados de libertad.

8.10.2. Ejercicios, Resultados, Interpretacin y Sintaxis


1. Calcular la fiabilidad de la subescala compuesta por los tems v26 a v33 del fichero de datos
ESCUEL.sav mediante el coeficiente de Cronbach y averiguar si tal fiabilidad puede
aumentarse eliminando algunos tems de baja aportacin.

Es muy conveniente una vez abierto el fichero de datos y antes de iniciar las operaciones comprobar
el estado de la(s) variable(s) que van a entra en el anlisis: etiquetas de las variables, tipo de
variable, formato de columna, y lo ms importante: los valores que no deben entrar en el anlisis
(valores perdidos).
Una vez realizadas las comprobaciones se PULSA secuencialmente Analizar, Escalas y Anlisis
de fiabilidad.
Se seleccionan a continuacin las variables que se van a incluir como pertenecientes a la escala, se
PULSA una vez y se transportan al recuadro situado a la derecha pulsando en el rectngulo que
separa a ambos. En la opcin Modelo se selecciona el mtodo alfa Fig. 106.
Figura 106.

A continuacin se PULSA el botn Estadsticos y en el cuadro Descriptivos para se selecciona la


casilla Elemento para obtener con ello la media, desviacin tpica y otros estadsticos de cada tem
as como Escala si se elimina elemento que servir como criterio para decidir qu items no incluir
en la escala a fin de obtener un coeficiente de fiabilidad ms alto que el inicial (Fig. 107).

149
Universidad de Deusto - ISBN 978-84-9830-628-6

Figura 107.

A continuacin se PULSA Continuar y en la ventana de dilogo Anlisis de fiabilidad (Fig. 106)


se PULSA Aceptar. Acto seguido aparecer en pantalla la pantalla Resultados Visor SPSS. En
este caso los resultados tal y como aparecen en el Spss son los siguientes:
Anlisis de fiabilidad
Estadsticos de fiabilidad
Alfa de
Cronbach
.644

N de
elementos
8

Estadsticos de los elementos

Ciencia-Tec.
Ver TV
Cultura
Educacin deportiva
Poltica
Compasin
Desarrollo
Educ.Sexual

Media
1.84
1.98
7.05
6.14
5.72
5.92
6.86
7.32

Desviacin
tpica
.776
.747
2.342
2.298
2.224
2.248
2.339
1.839

N
87
87
87
87
87
87
87
87

Estadsticos total-elemento

Ciencia-Tec.
Ver TV
Cultura
Educacin deportiva
Poltica
Compasin
Desarrollo
Educ.Sexual

Media de la
escala si se
elimina el
elemento
40.99
40.85
35.78
36.69
37.10
36.91
35.97
35.51

Varianza de
la escala si
se elimina el
elemento
68.546
65.966
50.405
57.519
58.745
47.829
49.964
54.765

Correlacin
elemento-tot
al corregida
.105
.327
.439
.221
.200
.567
.456
.453

Alfa de
Cronbach si
se eleimina
el elemento
.653
.632
.581
.650
.654
.539
.576
.583

La fiabilidad de esta subescala medida a travs del coeficiente es 0.644 pero del anlisis de los
diferentes tems se deduce que v26 y v30 presentan por una parte las menores correlaciones itemstest y, por otra, si se eliminan las subescalas resultantes aumentan la fiabilidad como puede
apreciarse en la columna de Alpha if Item is Deleted. Por ello, se va a calcular la fiabilidad de la
subescala pero sin contar con esos tems porque ms que aportar calidad a la medicin ms bien la
perjudican.

150
Universidad de Deusto - ISBN 978-84-9830-628-6

Efectivamente, calculada la fiabilidad siguiendo los mismo pasos anteriores pero tan slo con v27,
v28, v29, v31, v32 y v33 los resultados son:
Anlisis de fiabilidad
Estadsticos de fiabilidad
Alfa de
Cronbach
.670

N de
elementos
6

Estadsticos de los elementos

Ver TV
Cultura
Educacin deportiva
Compasin
Desarrollo
Educ.Sexual

Media
1.98
7.05
6.14
5.92
6.86
7.32

Desviacin
tpica
.747
2.342
2.298
2.248
2.339
1.839

N
87
87
87
87
87
87

Estadsticos total-elemento

Ver TV
Cultura
Educacin deportiva
Compasin
Desarrollo
Educ.Sexual

Media de la
escala si se
elimina el
elemento
33.29
28.22
29.13
29.34
28.40
27.94

Varianza de
la escala si
se elimina el
elemento
53.533
37.801
44.158
36.043
38.778
43.520

Correlacin
elemento-tot
al corregida
.280
.481
.252
.595
.443
.422

Alfa de
Cronbach si
se eleimina
el elemento
.674
.597
.685
.550
.613
.622

La fiabilidad de la subescala ha aumentado hasta 0.670 lo cual significa que, en efecto, varios tems
no aportaban prcticamente nada al sentido de la medicin del resto de los tems. Aunque en este
caso no se da un gran aumento de fiabilidad, en otras ocasiones tal aumento s es ms notorio e
importante lo cual sirve para determinar qu items debern formar definitivamente la escala de
medicin y qu items no.
Lgicamente, no siempre los items o variables eliminadas resultan inservibles o no aportan
mediciones interesantes. Simplemente ocurre que no estn conectadas/relacionadas con el resto de
los tems y, por tanto, miden cuestiones distintas de lo que miden los dems items. Por otra parte,
hay una cuestin importante referida a cuntos tems o variables deben/pueden ser eliminadas. La
respuesta no puede ser concreta ni pueden darse cifras porque todo depende de la fiabilidad inicial
de la escala o test, es decir de lo bien construida o elaborada que est. Por ello, el nmero de tems o
variables eliminables suele ser por lo general bastante reducido.
Debe mencionarse tambin la posibilidad de eliminar sujetos porque o bien han respondido de
forma claramente aleatoria o porque sus respuestas son todas iguales o, incluso, porque utilizan
demasiado el No Sabe/No Contesta codificado como cero en esa respuesta. Esta estrategia
metodolgica presenta el inconveniente de que puede alterarse la muestra de forma significativa si
el nmero de los sujetos que no se quieren tener en cuenta son numerosos.

151
Universidad de Deusto - ISBN 978-84-9830-628-6

Sintaxis para el Ejercicio 1

2. Con el fichero de datos DROGODE.sav y tomando las variables v9 a v21, realizar un estudio
completo de la FIABILIDAD del test intentando aumentarla. Realizar tambin ese estudio completo de
la fiabilidad del test para los Hombres que sean Poco Catlicos. Obtener el mximo de conclusiones
posibles.
Algunas conclusiones numricas relevantes:
Para toda la muestra:
Anlisis de fiabilidad
Estadsticos de fiabilidad
Alfa de
Cronbach
.919

N de
elementos
13

Estadsticos de los elementos

Txikitero
Borracho-finsemana
Herona
Porros-diario
Cocana
Bebe-aguanta
Cientfico
Bohemio
Tabaco
Joven-colocarse
Chica-coca-a veces
Anfetaminas-examen
Tranquilizantes

Media
4.95
5.99
7.42
6.75
7.43
6.20
7.69
5.23
5.49
6.68
6.90
5.79
5.33

Desviacin
tpica
2.061
1.947
1.739
1.615
1.774
1.924
1.684
1.949
1.978
1.703
1.735
1.851
2.065

N
101
101
101
101
101
101
101
101
101
101
101
101
101

152
Universidad de Deusto - ISBN 978-84-9830-628-6

Estadsticos total-elemento

Txikitero
Borracho-finsemana
Herona
Porros-diario
Cocana
Bebe-aguanta
Cientfico
Bohemio
Tabaco
Joven-colocarse
Chica-coca-a veces
Anfetaminas-examen
Tranquilizantes

Media de la
escala si se
elimina el
elemento
76.89
75.85
74.43
75.09
74.42
75.64
74.15
76.61
76.36
75.16
74.94
76.05
76.51

Varianza de
la escala si
se elimina el
elemento
263.418
252.468
252.847
263.902
252.465
252.372
257.028
246.259
251.772
252.835
249.376
248.908
244.412

Correlacin
elemento-tot
al corregida
.406
.624
.705
.540
.696
.635
.648
.732
.624
.723
.775
.728
.715

Para Hombres Poco Catlicos:


Anlisis de fiabilidad
Estadsticos de fiabilidad
Alfa de
Cronbach
.927

N de
elementos
13

Estadsticos de los elementos

Txikitero
Borracho-finsemana
Herona
Porros-diario
Cocana
Bebe-aguanta
Cientfico
Bohemio
Tabaco
Joven-colocarse
Chica-coca-a veces
Anfetaminas-examen
Tranquilizantes

Media
4.65
5.71
7.22
6.76
7.31
6.00
7.64
5.09
5.49
6.71
6.85
5.60
5.47

Desviacin
tpica
2.075
1.921
1.812
1.478
1.794
1.953
1.603
2.021
1.942
1.685
1.592
1.852
2.124

N
55
55
55
55
55
55
55
55
55
55
55
55
55

153
Universidad de Deusto - ISBN 978-84-9830-628-6

Alfa de
Cronbach si
se eleimina
el elemento
.924
.914
.911
.917
.912
.914
.913
.910
.914
.911
.909
.910
.911

Estadsticos total-elemento

Txikitero
Borracho-finsemana
Herona
Porros-diario
Cocana
Bebe-aguanta
Cientfico
Bohemio
Tabaco
Joven-colocarse
Chica-coca-a veces
Anfetaminas-examen
Tranquilizantes

Media de la
escala si se
elimina el
elemento
75.85
74.80
73.29
73.75
73.20
74.51
72.87
75.42
75.02
73.80
73.65
74.91
75.04

Varianza de
la escala si
se elimina el
elemento
271.904
263.533
258.914
273.527
261.052
266.625
264.372
255.989
262.166
262.163
260.971
258.640
246.665

Correlacin
elemento-tot
al corregida
.430
.616
.745
.613
.714
.552
.743
.705
.631
.745
.820
.732
.816

Alfa de
Cronbach si
se eleimina
el elemento
.931
.923
.918
.923
.919
.926
.919
.920
.923
.919
.917
.919
.915

Sintaxis para el Ejercicio 2

3. Con el fichero de datos CITEC.sav y tomando las variables v21 a v43, realizar un estudio
completo de la FIABILIDAD del test intentando aumentarla. Realizar tambin ese estudio para los
mayores de 40 aos. Comparar resultados.
Algunas conclusiones numricas relevantes:
Para toda la muestra:
Anlisis de fiabilidad
Estadsticos de fiabilidad
Alfa de
Cronbach
.622

N de
elementos
23

154
Universidad de Deusto - ISBN 978-84-9830-628-6

Estadsticos de los elementos


Media
2,04
3,56
2,80
3,56
2,30
2,74
3,25
3,21
2,49
2,45
3,49
2,24
3,34
3,36
3,99
3,89
2,03
3,07
2,82
2,30
1,61
3,62
2,17

Confortabilidad
Medio ambiente
Cientficos peligrosos
Recursos
Futuro
Ciencia-Fe
1salud, despus animales
Progreso
Trabajo ms interesante
Vida mejor
Importa en vida diaria
Cambio forma de vida
Nmeros dan suerte
Nueva tecnologia
Desarrollo industrial
Ms trabajo
Gobierno debe financiar
Productos
Nuevas invenciones
Economa competitiva
Curar enfermedades
Computers
Beneficios

Desviacin
tpica
1,024
1,334
1,331
1,291
1,221
1,374
1,499
1,283
1,189
1,203
1,399
1,177
1,442
1,211
1,166
1,245
1,057
1,197
1,156
1,075
,888
1,400
1,096

N
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021
1021

Estadsticos total-elemento

Confortabilidad
Medio ambiente
Cientficos peligrosos
Recursos
Futuro
Ciencia-Fe
1salud, despus animales
Progreso
Trabajo ms interesante
Vida mejor
Importa en vida diaria
Cambio forma de vida
Nmeros dan suerte
Nueva tecnologia
Desarrollo industrial
Ms trabajo
Gobierno debe financiar
Productos
Nuevas invenciones
Economa competitiva
Curar enfermedades
Computers
Beneficios

Media de la
escala si se
elimina el
elemento
64,29
62,78
63,54
62,77
64,04
63,59
63,09
63,12
63,85
63,89
62,85
64,10
63,00
62,98
62,34
62,45
64,30
63,26
63,52
64,04
64,72
62,71
64,17

Varianza de
la escala si
se elimina el
elemento
81.996
79.443
81.065
77.350
78.298
79.271
81.514
77.468
79.001
79.799
80.727
81.794
80.742
80.958
81.503
81.804
84.863
83.206
78.875
82.409
84.382
79.963
81.267

Correlacin
elemento-tot
al corregida
.202
.234
.165
.342
.324
.230
.112
.340
.301
.258
.163
.170
.153
.200
.186
.152
.041
.098
.320
.165
.099
.194
.218

Alfa de
Cronbach si
se eleimina
el elemento
.611
.607
.616
.594
.597
.608
.624
.594
.600
.605
.616
.615
.618
.611
.613
.617
.627
.623
.598
.615
.621
.612
.610

Para Mayores de 40 aos:


Anlisis de fiabilidad
Estadsticos de fiabilidad
Alfa de
Cronbach
.630

N de
elementos
23

155
Universidad de Deusto - ISBN 978-84-9830-628-6

Estadsticos de los elementos


Media
2,07
3,38
2,71
3,41
2,35
2,52
3,18
3,12
2,54
2,39
3,12
2,16
3,22
3,20
3,86
3,86
2,17
3,03
2,77
2,37
1,68
3,37
2,19

Confortabilidad
Medio ambiente
Cientficos peligrosos
Recursos
Futuro
Ciencia-Fe
1salud, despus animales
Progreso
Trabajo ms interesante
Vida mejor
Importa en vida diaria
Cambio forma de vida
Nmeros dan suerte
Nueva tecnologia
Desarrollo industrial
Ms trabajo
Gobierno debe financiar
Productos
Nuevas invenciones
Economa competitiva
Curar enfermedades
Computers
Beneficios

Desviacin
tpica
1,010
1,300
1,253
1,267
1,223
1,284
1,490
1,231
1,187
1,156
1,441
1,106
1,383
1,085
1,136
1,238
1,090
1,116
1,094
1,001
,892
1,422
1,076

N
503
503
503
503
503
503
503
503
503
503
503
503
503
503
503
503
503
503
503
503
503
503
503

Estadsticos total-elemento

Confortabilidad
Medio ambiente
Cientficos peligrosos
Recursos
Futuro
Ciencia-Fe
1salud, despus animales
Progreso
Trabajo ms interesante
Vida mejor
Importa en vida diaria
Cambio forma de vida
Nmeros dan suerte
Nueva tecnologia
Desarrollo industrial
Ms trabajo
Gobierno debe financiar
Productos
Nuevas invenciones
Economa competitiva
Curar enfermedades
Computers
Beneficios

Media de la
escala si se
elimina el
elemento
62,58
61,27
61,94
61,24
62,30
62,13
61,47
61,53
62,11
62,26
61,53
62,50
61,43
61,45
60,79
60,79
62,48
61,62
61,88
62,28
62,97
61,28
62,46

Varianza de
la escala si
se elimina el
elemento
77.949
78.473
78.592
75.184
73.858
77.359
79.058
74.281
74.265
75.804
78.257
77.956
78.285
79.845
80.112
80.025
80.119
81.454
77.517
78.984
80.461
77.931
78.058

Correlacin
elemento-tot
al corregida
.273
.159
.165
.321
.403
.214
.097
.379
.399
.332
.137
.238
.148
.145
.120
.103
.130
.056
.266
.216
.161
.155
.243

Alfa de
Cronbach si
se eleimina
el elemento
.613
.625
.624
.606
.596
.619
.635
.599
.597
.606
.629
.616
.627
.626
.629
.631
.627
.635
.613
.619
.624
.627
.616

Anlisis para el Ejercicio 3

156
Universidad de Deusto - ISBN 978-84-9830-628-6

4. Con el fichero de datos ESCUEL.sav y tomando las variables v5 a v33 realizar un estudio
completo de la FIABILIDAD del test intentando aumentarla. Realizar tambin ese estudio para las
mujeres comparando los resultados.
Algunas soluciones numricas relevantes:
Para toda la muestra:
Anlisis de fiabilidad
Estadsticos de fiabilidad
Alfa de
Cronbach
.906

N de
elementos
29

Estadsticos de los elementos

Conocerse
Hablar
Tcnicas de Estudio
Disfrutar
Anlisis-Sntesis
Valorarse
Capacidad de decisin
Destrezas Manuales
Trabajar en grupo
Capacidad de crstica
Valenta
Expresin corporal
Mtodos reljacin
Preguntas estpidas
"Pasar"
Detectar engaos
Escuchar
Hacer algo difcil
Errores
Guerra nuclear
Mundo
Ciencia-Tec.
Ver TV
Cultura
Educacin deportiva
Poltica
Compasin
Desarrollo
Educ.Sexual

Media
7.36
7.96
7.12
7.24
7.01
7.30
6.63
5.99
6.30
7.26
6.51
6.80
6.32
6.31
3.63
5.94
6.33
6.80
2.06
1.74
2.02
1.81
1.99
7.05
6.21
5.70
5.93
6.87
7.30

Desviacin
tpica
2.264
1.732
2.257
2.199
2.372
2.138
2.189
1.991
2.301
2.440
2.159
2.473
2.314
2.206
2.270
2.581
2.288
1.987
.700
.730
.744
.768
.752
2.384
2.239
2.238
2.232
2.379
1.861

157
Universidad de Deusto - ISBN 978-84-9830-628-6

84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84
84

Estadsticos total-elemento

Conocerse
Hablar
Tcnicas de Estudio
Disfrutar
Anlisis-Sntesis
Valorarse
Capacidad de decisin
Destrezas Manuales
Trabajar en grupo
Capacidad de crstica
Valenta
Expresin corporal
Mtodos reljacin
Preguntas estpidas
"Pasar"
Detectar engaos
Escuchar
Hacer algo difcil
Errores
Guerra nuclear
Mundo
Ciencia-Tec.
Ver TV
Cultura
Educacin deportiva
Poltica
Compasin
Desarrollo
Educ.Sexual

Media de la
escala si se
elimina el
elemento
160.13
159.52
160.37
160.25
160.48
160.19
160.86
161.50
161.19
160.23
160.98
160.69
161.17
161.18
163.86
161.55
161.15
160.69
165.43
165.75
165.46
165.68
165.50
160.44
161.27
161.79
161.56
160.62
160.19

Varianza de
la escala si
se elimina el
elemento
904.332
919.843
890.934
895.732
876.951
877.939
898.678
945.723
886.277
871.647
894.698
903.686
933.803
932.582
936.630
896.781
892.494
913.180
962.874
976.358
962.179
972.968
967.747
917.767
928.611
954.676
905.623
879.781
913.843

Correlacin
elemento-tot
al corregida
.527
.555
.632
.612
.702
.779
.592
.257
.654
.719
.633
.480
.297
.324
.284
.503
.610
.533
.410
.094
.399
.159
.275
.400
.348
.155
.525
.678
.567

Para Mujeres:
Anlisis de fiabilidad

Estadsticos de fiabilidad
Alfa de
Cronbach
.878

N de
elementos
29

158
Universidad de Deusto - ISBN 978-84-9830-628-6

Alfa de
Cronbach si
se eleimina
el elemento
.902
.902
.900
.900
.898
.897
.901
.907
.900
.898
.900
.903
.907
.906
.907
.903
.900
.902
.905
.907
.905
.907
.906
.905
.906
.909
.902
.899
.902

Estadsticos de los elementos

Conocerse
Hablar
Tcnicas de Estudio
Disfrutar
Anlisis-Sntesis
Valorarse
Capacidad de decisin
Destrezas Manuales
Trabajar en grupo
Capacidad de crstica
Valenta
Expresin corporal
Mtodos reljacin
Preguntas estpidas
"Pasar"
Detectar engaos
Escuchar
Hacer algo difcil
Errores
Guerra nuclear
Mundo
Ciencia-Tec.
Ver TV
Cultura
Educacin deportiva
Poltica
Compasin
Desarrollo
Educ.Sexual

Media
7.46
8.31
7.29
7.25
7.17
7.57
6.54
5.80
6.40
7.60
6.62
7.09
6.51
6.49
3.65
6.23
6.40
6.78
2.06
1.78
2.03
1.85
2.00
6.95
6.20
5.78
6.06
7.18
7.34

Desviacin
tpica
2.092
1.249
2.141
2.208
2.028
1.750
2.201
1.906
2.269
1.998
2.044
2.220
2.187
2.130
2.204
2.454
2.290
1.883
.704
.739
.749
.795
.750
2.452
2.195
2.118
2.142
1.983
1.726

N
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65
65

Estadsticos total-elemento

Conocerse
Hablar
Tcnicas de Estudio
Disfrutar
Anlisis-Sntesis
Valorarse
Capacidad de decisin
Destrezas Manuales
Trabajar en grupo
Capacidad de crstica
Valenta
Expresin corporal
Mtodos reljacin
Preguntas estpidas
"Pasar"
Detectar engaos
Escuchar
Hacer algo difcil
Errores
Guerra nuclear
Mundo
Ciencia-Tec.
Ver TV
Cultura
Educacin deportiva
Poltica
Compasin
Desarrollo
Educ.Sexual

Media de la
escala si se
elimina el
elemento
162.94
162.09
163.11
163.15
163.23
162.83
163.86
164.60
164.00
162.80
163.78
163.31
163.89
163.91
166.75
164.17
164.00
163.62
168.34
168.62
168.37
168.55
168.40
163.45
164.20
164.62
164.34
163.22
163.06

Varianza de
la escala si
se elimina el
elemento
664.215
686.460
647.535
629.163
638.180
639.862
627.309
678.556
627.156
632.350
638.984
662.810
676.504
673.523
680.001
655.518
640.813
656.959
693.102
706.772
690.299
701.126
697.150
656.970
668.131
695.897
647.977
642.765
656.684

Correlacin
elemento-tot
al corregida
.362
.299
.509
.664
.637
.731
.684
.256
.662
.709
.623
.349
.231
.267
.198
.366
.531
.488
.377
.007
.425
.138
.249
.355
.305
.065
.504
.605
.542

Alfa de
Cronbach si
se eleimina
el elemento
.875
.876
.872
.867
.868
.867
.867
.878
.867
.867
.869
.876
.879
.878
.880
.876
.871
.872
.876
.880
.876
.878
.877
.876
.877
.883
.872
.869
.871

159
Universidad de Deusto - ISBN 978-84-9830-628-6

Sintaxis para el Ejercicio 4

160
Universidad de Deusto - ISBN 978-84-9830-628-6

BIBLIOGRAFIA
1. FRECUENCIAS Y DESCRIPTIVOS (MEDIAS, DESVIACIN TIPICA, ETC)

CALVO, F. (1978). Estadstica Aplicada. Bilbao: Ediciones Deusto


CALVO, F. y SARRAMONA, J. (1983). Ejercicios de Estadstica Aplicados a las Ciencias
Sociales, Barcelona: CEAC.
CASAS SNCHEZ, J. M., GARCA PREZ, C., RIVERA GALICIA, L. F. y ZAMORA SANZ,
A. I.. (1998). Problemas de Estadstica Descriptiva, Probabilidad e Inferencia. Madrid:
Pirmide.
COLL, S., GUIJARRO, M. (1998). Estadstica aplicada a la historia y a las ciencias sociales.
Madrid: Pirmide.
FERNNDEZ CUESTA, C. y FUENTES GARCA, F. (1995). Curso de Estadstica Descriptiva.
Teora y Prctica. Barcelona: Ariel.
FERNNDEZ, M. J., GARCA, J. M.., et. al. (1992). Resolucin de Problemas de Estadstica
Aplicada a las Ciencias Sociales. Madrid: Sntesis.
GARCA BARBANCHO, A.. (1986), Estadstica Elemental Moderna. Barcelona: Ariel.
GOMEZ BARRANTES, M. (1998). Elementos de Estadstica Descriptiva. Madrid: Editorial UNED.
JUAN, J. et al. (2000). Problemas resueltos de estadstica. Madrid: Sntesis.
LPEZ DE LA MANZANARA, J. (1994), Problemas de estadstica. Madrid: Pirmide.
MARTN PLIEGO, F.,J. (2.004) Introduccin a la Estadstica Econmica y Empresarial. Madrid:
Thomson.
MONTERO LORENZO, J.M. (2007). Problemas resueltos de estadstica descriptiva para ciencias
socides. Madrid: Thompson Paraninfo.
MONTERO LORENZO, J.M. (2007). Estadstica Descriptiva. Madrid: Thompson Paraninfo.
NORTE CHECA, A. ( ). Estadstica Terica y Aplicada. Barcelona: PPU.
PREZ SUREZ, R.. (1993). Anlisis de datos econmicos I. Mtodos descriptivos. Madrid:
Pirmide.
PORTILLA (2004). Estadstica Descriptiva para Comunicadores. Pamplona: Eunsa.
PULIDO SAN ROMAN, A. (1992). Estadstica y Tcnicas de Investigacin Social. Madrid.
Pirmide.
PEA, D., ROMO, J. (1994) Introduccin a la estadstica para las ciencias sociales. Madrid: Ed.:
MacGraw Hill.
QUESADA, V., ISIDORO A., LPEZ, L.A. (1989). Curso y Ejercicios de Estadstica. Madrid:
Alhambra
TOMEO, V., UA, I. (1997). Doce Lecciones de Estadstica Descriptiva. Madrid: AC.
UA JUAREZ I., TOMEO PERUCHA V. (2.003) Lecciones de Estadstica Descriptiva. Madrid:
Thomson
VILES, E. (2001). Estadstica bsica para universitarios. Pamplona: EUNSA
WEINBERG, S. L., GOLDBERG, K.P. (1982). Estadstica Bsica para las Ciencias Sociales.
Mxico. Nueva Editorial Interamericana.

2. TABLAS DE CONTINGENCIA. ASOCIACIN ENTRE VARIABLES

AGRESTI, A.(1984). Analysis of ordinal categorical dat. Nueva York: Jojn Wiley and Sons.
AGRESTI, A.(1990). Categorical data analysis. Nueva York: Jojn Wiley and Sons.
AMON, J.(1980). Estadstica para psiclogos (vol.2). Madrid: Pirmide.
CALVO, F. (1978). Estadstica Aplicada. Bilbao: Deusto.
161
Universidad de Deusto - ISBN 978-84-9830-628-6

COBO, E.(1986). El anlisis de tablas de contingencia. Barcelona: Facultad de medicina. Univ. de


Barcelona.
COCHRAN, W. G. (1954). "Some methods for strengthening the common c2 tests". Biometrics, 10,
417-451.
COCHRAN, W. G.(1950). "The comparison of percentages in matched samples". Biometrika, 37,
256-266.
COCHRAN, W. G.(1952)."The c2 test of goodness of fit". Annals of Mathematical Statistics, 23,
315-345.
COHEN, J. (1960). "A coefficient of agreement for nominal scales". Educational and
Psychological Measurement, 20, 37-46.
DAVIS, J. A. (1980). Contingency tables analysis: proportions and flow graphs. En J.Alt (ed.)
Advanced in quantitative analysis. Quantity and cuality, Vol.1.
EVERITT, B. S. (1977). The analysis of contingency tables. Londres: Chapman and Hall.
FIENBERG, S. E. (1980). The analysis of cross-classified categorical data. Cambribge: MIT
Press.
FISHER, R. A. (1924). "The conditions under which c2 measures the discrepancy between
observations and hypothesis". Journal of the Royal Statistical Society, 87, 442-450.
FLEISS, J. L.(1981). Statistical methods for rates and proportions. Nueva York: John Wiley and
Sons.
FRIEDMAN, M. (1937). "The use of ranks to avoid the assumption of normality implicit in the
analysis of variance". Journal of the Amarican Statistical Association, 61, 1081-1096.
GABRIEL, K. R. (1969). "Simultaneous test procedures: Some theroy of multiple comparisons".
Annals of Mathematical Statistics, 40, 224-240.
GAMES, P. A. y HOWELL, J. F. (1976). "Pairwise multiple comparison procedures with unequal
ns and/or variances: A Monte Carlo study". Journal of Educational Statistics, 1, 113-125.
GOODMAN, L. A. y Kruskal, W. H.(1979). Measures of associaton for cross classifications.
Nueva York: Springer-Verlag.
GUILFORD, J. P. y FRUCHTER, B. (1984). Estadstica aplicada a la Psicologa y la Educacin.
Mxico: McGraw-Hill.
HABERMAN, S. J. (1973). "The analysis of residuals in cross-classification tables". Biometrics,
29, 205-220.
KKENDALL, M. G. (1963). Rank correlation methods. Londres: Griffin.
KENDALL, M. G. y BABINGTON-SMITH, B. (1939). "The problem of m rankings". The Annals
of Mathematical Statistics, 10, 275-287.
MANTEL, N. y BYAR, D. P. (1978). "Marginal homogeneity, symmetry and independence".
Comm. Stat. Theor. Meth., A7, 953-976.
McCULLAGH, P.(1980). Regression models for ordinal data. Journal of the Royal Statistical
Society, 42, 109-142.
McNEMAR, Q.(1947). Note on the sampling error of the difference between correlated proportions
or percentages. Psycometrika, 12, 153-75.
NEWMAN, D. (1939). The distribution of teh range in samples of a normal population, expressed
in terms of an independent estimate of standard deviation. Biometrika, 31, 20-30.
NEWMAN, J. y PEARSON, E. S. (1928). On the use and interpretation of certain test criteria for
purposes of statistical inference (2 parte). Biometrika, 20, 263-294.
PAGANO, M. Y HALVORSEN, K. T. (1981). "An algoritm for finding the exact significance
levels of RC tables". Journal of the American Statistical Association, 76, 931-934.
PALMER, A.L.(1999). Analisis de datos: etapa exploratoria. Madrid: Pirmide.
PARDO, A. y SAN MARTIN, R. (1998). Anlisis de datos en Psicologa II. Madrid: Pirmide.
RAO, J. K. y SCOTT, A.J. (1981). The analysis of categorical data from complex sample surveys:
chi-squared test of goodness-of-fit and independence in two-way tables. Journal of the
American Statistical Association, 76, 221-230.
162
Universidad de Deusto - ISBN 978-84-9830-628-6

RINCON (Del), D. y OTROS. (1995). Tcnicas de investigacin en ciencias sociales. Madrid:


Dykinson.
RUDAS, T. (1998). Odds ratio in the analysis of contingency tables. California: Sage.
RUIZ-MAYA, L. (1983). Mtodos estadsticos de investigacin. Madrid: I.N.E.
RUIZ-MAYA, L. y Otros. (1990). Metodologa estadstica para el anlisis de datos cualitativos.
Madrid: ICO-CIR.
SNCHEZ CARRION, J. J.(1995). Manual de anlisis de datos. Madrid: Alianza.
SLOANE, D. y MORGAN, P. (1996). "An introduction to categorical data analysis". Annual
review of sociology, 351-374.
SOMERS, R. H.(1962). "A new asymmetric measure of association for ordinal variables".
American Sociological Review, 27, 799-811.
SPEARMAN, C. (1904). "The proof and measurement of association between two things".
American Journal of Psychology, 15, 72-101.
TARONE, R. E.; GART, J. J. y HAUCK, W. W. (1983). "On the asymptotic relative efficiency of
certain non-iterative estimators of a common relative risk or odds ratio". Biometrika, 70, 519522.
THEIL, H. (1970). "On the estimation of relationships involving qualitative variables". American
Journal of Sociology, 76, 104-154.
WALLIS, W. A. (1939). "The correlation ratio for ranked data". Journal of the American Statistical
Association, 34, 533-538.
WICKENS, T. D. (1989). Multiway contingency tables analysis for the social sciences. New
Jersey: Lawrence Erlbaum.
YATES, F. (1934). "Contingency tables involving small numbers and the c2 test". Journal of the
Royal Statistical Society, supplement 1, 217-235.

3. ANLISIS DE VARIANZA DE UN FACTOR Y DE DOS FACTORES.

ARNAU, J. ( 1990). Diseos Experimentales Multivariables. Madrid: Alianza.


BOX, G.E.P. (1954a). "Some theorems on quadratic forms applied in the study of analysis of
variance problems: I. Effects of inequality of variance in the one-way classification". Annals of
Mathematical Statistics, 25, 290-302.
BOX, G.E.P. (1954a). "Some theorems on quadratic forms applied in the study of analysis of
variance problems: II. Effects of inequality of variance and of correlation between errors in the
two-way classification". Annals of Mathematical Statistics, 25, 484-498.
BRESLOW, N. y DAY, N.E. (1980). Statistical methods in cancer researcher. Vol I: The analysis
of case-control studies. Lyon: IARC.
BRESLOW, N. y DAY, N.E. (1987). Statistical methods in cancer researcher. Vol II: The design
and analysis of cohort studies. Lyon: IARC.
BRYK, A.S. y RAUDENBUSH, S.W. (1988). Heterogeneity of variance in experimental studies: A
challenge to conventional interpretations. Psychological Bulletin, 104, 396-404.
COCHRAN, W. G. y COX, G. M.(1980). Diseos experimentales. Mxico: Trillas.
DAVIS, C.S. (2002). Statistical Methods for the anlisis of repeated measurements. Springer
DELADO, J. (1992). Algunos problemas bsicos del anlisis de varianza. Salamanca: Universidad
de Salamanca.
DUNCAN, D.B. (1955). "Multiple range and multiple F test". Biometrics, 11, 1-42.
DUNN O, J. y CLARK, V. A.(1987). Applied statistics: analysis of variance and regression.
Nueva York: John Wiley and Sons.
DUNN, C. W. (1961). "Multiple comparison procedure for comparing several treatments with a
control". Journal of the American Statistical Association, 56, 52-64.
163
Universidad de Deusto - ISBN 978-84-9830-628-6

DUNNETT, C. W. (1955). "A multiple comparison procedure for comparing several treatments
with a control". Journal of the American Statistical Association, 50, 1096-1121.
DUNNETT, C. W. (1980). "Pairwise multiple comparison procedure for comparing several
treatments with a control". Journal of the American Statistical Association, 75, 795-800.
EDWARDS, A. L.(1985). Multiple regression and the analysis of variance and covariance. San
Francisco: Freeman.
EINOT, I. y GABRIEL, K. R. (1975). "A study of the powers of several methods of multiple
comparisons". Journal of the American Statistical Association, 70, 574-583.
FISHER, R. A. (1935). Statistical methods for research workers. Edimburgo: Oliver and Boyd .
GIRDEN, E. R. (1992). ANOVA Repeated Measures. California: Sage.
HAND, D. J. y TAYLOR, C. C. (1987). Multivariate analysis of variance and repeated measures.
Londres: Chapman and Hall.
HUITEMA, B. E. (1980). The analysis of covariance and alternatives. Nueva York: John Wiley
and Sons.
IVERSEN, G. R. y NORPOTH, H. (1976). Analysis of variance. Beverly Hills: Sage.
KEULS, M. (1952). "The use of studentized range in connection with an analysis of variance".
Euphytica, 1, 112-122.
KIRK, R. E. (1982). Experimental design. Procedures for the behavioral sciences. Belmont, CA:
Brooks/Cole.
KLOCKARDS, A. J. (1986). Multiple comparisons. Londres: Sage.
LEVENE, H. (1960). "Robust tests for the equality of variances". En J. Olkin (Ed.): Contributions
to probability and statistics. Palo Alto, CA: Stanford University Press.
LINDMAN, H. R. (1974). Analysis of variance in complex experimental designs. San Francisco:
Freeman & Co.
NARVAIZA, J. L. y OTROS. (2000). Estadstica aplicada a la gestin y a las ciencias sociales.
Anlisis de la Varianza y de la Regresin. Bilbao: Desclee de Brouwer.
NEWMAN, J. y PEARSON, E. S. (1928). On the use and interpretation of certain test criteria for
purposes of statistical inference. Biometrika, 20, 263-294.
RAO, C. R. (1973). Linear statistical inference and its applications. Nueva York: Wiley.
RIBA, A.(1989). Modelo lineal de anlisis de varianza. Barcelona: Herder.
RYAN, T. A. (1960). "Significance test for multiple comparisons of proportions, variances and
other statistics". Psychological Bulletin, 57, 318-328.
SAN MARTIN, R. y PARDO, A. (1989). Psicoestadstica. Contrastes paramtricos y no
paramtricos. Madrid: Pirmide.
SCHEFFE, H. A. (1953). "A method for judging all possible contrasts in the analysis of variance".
Biometrika, 40, 87-104.
SCHEFFE, H. A. (1959). The analysis of variance. Nueva York: Wiley.
SHAPIRO, S. S. y WILK, M. B. (1965). An analysis of variance test for normality (complete
samples). Biometrika, 52, 591-611.
SIDAK, Z. (1967). "Rectangular confidence regions for the means of multivariate normal
distributions". Journal of the American Statistical Association, 62, 626-633.
TAMHANE, A. C. (1977). "Multiple comparisons in model I one-way ANOVA with unequal
variances". Communications in Statistics, A6(1), 5-32.
TAMHANE, A. C.(1979). A comparison of procedures for multiple comparisons of means with
unequal variances. Journal of the American Statistical Association, 74, 471-480.
TEJEDOR, F. J. (1999). Anlisis de varianza: introduccin conceptual y diseos bsicos. Madrid:
Muralla.
TUKEY, J. W.(1953). The problem of multiple comparisons. Ditto: Princeton University.
WALD, A. y WOLFOWITZ, J. (1940). "On a test whether two samples are from the same
population". Annals of Mathematical Statistics, 11, 147-162.
WALLER, R.A. y DUNCAN, D. B. (1969). "A Bayes rule for the symetric multiple comparison
problem". Journal of the American Statistical Association, 64, 1484-1503.
164
Universidad de Deusto - ISBN 978-84-9830-628-6

WELSCH, B. L. (1938). "The significance of the difference between two means when the
population variances are unequal". Biometrika, 29, 350-362.
WELSCH, R. E.(1977). "Stepwise multiple comparison procedures". Journal of the American
Statistical Association, 72, 566-575.
WINER, B.J., BROWN, D.K. y MICHELS, K.M. (1971). Statistical Principles in Experimental
Design. New York: McGraw-Hill.

4. ANALISIS DE REGRESIN MLTIPLE Y LINEAL

ACHEN, C.H. (1982). Interpreting and using Regression. Beverly Hills: Sage.
ARNOLD, S. (1981). The Theory of Linear Models and Multivariate Analysis. Nueva York: John
Wiley & Sons.
BERRY W.D. y FELDMAN, S. Multiple Regression in Practice. Beverly Hills: Sage.
BIRKES, D. y DODGE, Y. (1993). Alternative methods of Regression. New York: John Wiley &
Sons.
BIRBAUM, I. (1981). An introduction to Causal Analysis in Sociology. London: McMillan Press.
BUNKE, O. y OTROS. (1986). Statistical Inference in Linear Models. Vol I. Chichester: John
Wiley & Sons.
CALVO, F. (1991). Ejercicios Resueltos de Estadstica con ayuda de Programas de Ordenador:
SPSS, PROGSTAD y STATVIEW. Bilbao: Universidad de Deusto, Bilbao, 1991.
CEHESSAT, R. (1975). Exercices Comments de Statisque et Informatique Appliqus. Paris:
Dunod.
COHEN, J. y COHEN, P. (1983). Applied Multiple Regression/Correlation Analysis for the
Behavior Sciences.New York: LEA.
COOK, R.D. (1977). "Detection of influential observations in linear regression". Technometrics,
19, 15-18.
DRAPER, N.R. and Smith, H. (1998). Applied Regression Analysis: New York, 3rd Edition: Wiley
& Sons.
HUTCHEDSON, G. y Sofroniu, N. (1999). The multivariate social scientist: introductory statistics
using generalized linear models. Londres: Sage.
KING, M. y GILES, D. (1985). Specification Analysis in the Linear Model. London: Routledge &
Kegan Paul.
MARAVALL, A. (1988). Two Papers on ARIMA Signal Extraction. Madrid: Banco de Espaa.
NETER, J. y WASSERMAN, W. (1974). Applied Linear Statistical Models, Regression, Analysis
of Variance and Experimental Designs.Illinois: Irwin Homewood.
PEDHAZUR, E. (1982). Multiple Regression in Behavioral Research. New York: Holt, Rinehart
and Winston.
RAO, C.R. (1983). Inferencia Estadstica Lineal. Vitoria: Gobierno Vasco.
RUIZ MAYA, L. (1989). Problemas de Estadstica. Madrid: Ediciones AC.
SCHRIVER, A. (1987). Theory of Linear and Integer Programming. Chichester: John Wiley &
Sons.

4. FIABILIDAD DE LOS TEST

AMERICAN PSYCHOLOGICAL ASSOCIATION, AMERICAN EDUCATIONAL RESEARCH


ASSOCIATION, AND NATIONAL COUNCIL ON MEASUREMENT IN EDUCATION
(1999). Standars for educational and psychological testing. DC: American Psychological
Association.
165
Universidad de Deusto - ISBN 978-84-9830-628-6

ANASTASI, A. (1988). Psychological Testing. New York: MacMillan Publishing Company.


ANGOFF, W.H. (1982): Use of difficulty and discrimination indices for detecting item bias. En
BERK, R.A. (Ed.) Handbook of methods for detecting item bias. Baltimore: John Hopkins
University Press.
BLISCHKE, W.R. and MURTHY, D.N.P. (2000). Reliability Modelling, Prediction and
Optimization. Chichester: Wiley.
CRONBACH, L.J. (1951): Coeficient apha and the internal structure of tests. Psycometrika.16.
FULLER, W.A. (1987): Measuremnent error models. New York: Wiley.
GUILFORD, J.P. (1956): Psycometric Methods. New York: McGraw-Hill.
GUTTMAN, L. (1984): Bases para elaborar escalas con datos cualitativos. En SUMMERS, G.F.
Medicin de Actitudes. Mxico: Trillas.
HAMBLETON, R.K. y SWAMINATHAN, H. (1985): Item response theory: principles and
applications. Boston: Kluwer-Nijhoff.
HANEY, W. y MADAUS, S. (1991). The evolution of ethical and technical standars for testing.
En R.K. Hambleton y J.N. Zaal (Eds). Advances in educational and psychological testing:
theroy and applications. Boston: Kluver Academic Publishers
HOUGAARD, P (2000). Analysis of Multivariate Survival Data. Springer
HOLLAND, P.W. y WAINER, H. (Eds) (1993). Differential item functioning. Hillsdale, NJ: LEA.
KLINE, P. (1993): The Handbook of Psycological Testing. Londres: Routledge.
KNOTT, M. y BARTHOLOMEW, D.J. (1993): Constructing measures with maximum
reliability. Psyhchometrika 58 (2).
LICKERT, R. (1984): Una tcnica para medir actitudes. En SUMMERS, G.F. Medicin de
Actitudes. Mxico: Trillas.
MUIZ, J. (1990): Teora de respuesta a los tems. Madrid: Pirmide.
NUNNALLY, J. C. (1967). Psychometric Theory (Chapters 6 and 7). New York: McGraw-Hill
Book Company.
RICHARDSON, M.W. y KUDER, G.F.(1939): The calculation of test reliability coefficients base
upon the method of rational equivalence. Journal of Educational Psychology. 30.
SANTISTEBAN, C. (1.990): Psicometra. Teora y prctica en la construccin de tests. Madrid:
Norma.
SERRANO, J. y Otros. (1995): Aportaciones recientes en medicin y evaluacin educativas.
Revista de Investigacin Educativa. 26.
SINHA, S.K. (1986): Reliability and life testing. New York. Halsted.
SUMMERS, G.F. (1984): Medicin de Actitudes. Mxico. Trillas.
TRAUB, R.E. (1997). Classical test theory in historical perspective. Educational measurement:
issues and practice. 16.
TREVISAN, M.S. and Others (1994): Estimating the optimum number of options per item using
and incremental option paradigm. Educational and Psycological Measurement. 54 (1).
THERNEAU,T,M. and GRAMBSCH, P. ( 2000). Modeling survival data. Springer

MANEJO Y USO DEL PROGRAMA ESTADSTICO: SPSS WINDOWS

ALVAREZ CACERES, R.. (1995). Estadstica multivariante y no paramtrica con SPSS.


Aplicacin a las ciencias de la salud. Madrid. Daz de Santos, cop.
BRYMAN, A. y CRAMER, D. (1997). Quantitative data analysis with SPSS for Windows: a guide
for social scientists. Londres: Routlege.
COORDSTON, R. y COOLMAN, A. (2000). A Crash Course in SPSS for Windows. Oxford:
:Blackwell Publishers.
DOMETRIUS, N. C.(1992). Social statistics using SPSS. Londres: Harper-Collins.
166
Universidad de Deusto - ISBN 978-84-9830-628-6

FERRAN, M. (1996): SPSS para Windows. Programacin y anlisis estadstico. Madrid:McGrawHill.


MEULMAN, J.J. and HEISER, W.J. (2004). SPSS Castegories 13.0. Chicago, IL: Spss Inc.
NORUSIS. Marija J. (2005). SPSS 13.0 Statistical Procedures Companion. Chicago: SPSS, Inc.
NORUSIS. Marija J. (2005). SPSS 13.0 Advanced Statistical Procedures Companion. Chicago:
SPSS, Inc.
PARDO MERINO, A.. (2002). SPSS 11. Gua para el anlisis de datos. Madrid. McGraw-Hill.
PARDO A. y RUIZ, M.A. (2002) SPSS 11 Gua para el anlisis de datos. Mc Graw Hill
PEREZ, C. (2001). Tcnicas estadsticas con SPSS. Madrid: Prentice Hall.
QUIROZ, G. y OTROS. (1987). SPSS Enfoque Aplicado. Mxico: MacGraw-Hill.
SNCHEZ CARRION, J.J. (1988). Introduccin al Anlisis de Datos con SPSS-PC(+). Madrid:
Alianza Universidad Textos.
SPSS Inc. (2005). SPSS 13.0. Base Users Guide. Prentice hall.
SPSS Inc. (2005). SPSS 13.0 Regression Models. Prentice hall.
SPSS Inc. (2005). SPSS 13.0 Student Version Chicago: SPSS, Inc.
SPSS Inc.(2005). SPSS 14.0: SPSS Advanced Models, SPSS Categories, SPSS Complex Samples,
SPSS Conjoint, SPSS Data Validation, SPSS Exact Tests, SPSS Maps, SPSS Missing Value
Analysis, SPSS Regression Models, SPSS Tables, SPSS Trends, and SPSS Classification Trees
VISAUTA VINACUA, B. (2001). Anlisis Estadstico con SPSS para Windows. Madrid: McGrawHill.
VOELKL, K. E. y GERBER, S. B. (1999). Using SPSS for Windows. Nueva York: Springer.

167
Universidad de Deusto - ISBN 978-84-9830-628-6

CODIGOS DE INTERPRETACIN
ENCUESTA-TEST EUROPEO DE CULTURA Y ACTITUDES
Fichero: CITEC.sav
SUJETOS = 1.021
VARIABLES = 43

VARIABLES DE IDENTIFICACION
V1.
V2.
V3.
V4.

Numero de Encuesta
Nacin (En el Fichero el dgito que aparece es el 12=Espaa)
Peso de la representatividad de cada sujeto en dato numrico
Edad (Recodificada)

V5.

Sexo

V6.

Use media (Grado de Informacin)

1. 15-24 aos

V7.
V8.

1. Hombre
1. Alta

2. 25-39 aos 3. 40-54 aos


2. Mujer
2. Media

4. Ms de 55 aos

0. NS/NC

0. No Sabe/No contesta
3. Regular

4. Baja

0. NS/NC

4. Alta

0. NS/NC

4. Estudiante

0. NS/NC

Leadership (Capacidad de liderazgo)


1. Baja

2. Regular

3. Media

Aos de Educacin (Recodificada)


1. 15 o menos 2. 16-19 aos 3. 20 o ms

ESCALA DE CONOCIMIENTOS CIENTIFICOS


ATENCION: - Desde la V9. hasta la Var.20 la codificacin es:
1. Acertado
2. No acertado

V9.
V10.
V11.
V12.
V13.
V14.
V15.
V16.
V17.
V18.
V19.
V20.

The centre of the earth is very hot


The oxygen we breathe comes from plantes
Radioactive milk can be made safe by boiling it
Electrons are samller than atoms
The continents on which we live have been moving their location for
millions of years and will continue to move in the future
It is the fathers gene which decides whether the baby is a boy or a girl
The earliest humans lived at the same time as the dinosaurs
Antibiotics kill viruses as well as bacteria
Lasers work by focusing sound waves
All radioactivity is man-made
Human beings, as we know them today, developed from earlier species of
animals
Does the earth go around the sun or does the sun go around the earth?

168
Universidad de Deusto - ISBN 978-84-9830-628-6

Codigo de Resp.
Acertada
1
1
1
1
2
1
2
1
2
2
1
1

ESCALA DE ACTITUDES ANTE EL DESARROLLO TECNOLOGICO


ATENCION: - Desde la V21. hasta la V.43 la codificacin es:
1. Muy de Acuerdo 2. De acuerdo 3. Indiferente 4. En desacuerdo

5. Muy en desacuerdo

0. NS/NC

A) ESCALA DE CONTENIDO GENERAL


V21.
V22.
V23.
V24.
V25.
V26.
V27.
V28.
V29.
V30.
V31.
V32.

Science and tecnology are making our lives healthier, easier and more comfortable
Scientific and tchnological research cannot play an important role in protecting the
environement and repairing it
Because of their knowledge, scientific researchers have a power that makes them dangerous
Thanks to scientific and technological advances, the Earths natural resources will be
inexaustible
Thanks to science and tchnology, there will be more oportunities for the future generations
We depend too much on science and not enough on faith
Scientifics should be allowed to do research that causes pain and injury to animals like dogs
and chimpanzees if it can produce new information about serious human health problems
Technological progrress will make possible higher levels of consumption and the same time,
and unpolluted environement
The application of science and new techonology, will make work more interesting
Most scientitist want to work on things that will make life better for the average person
For me, in my daily life, it is not important to know about science
Science makes aour way of life change too fast

B) ESCALA DE CONTENIDO PRCTICO


V33.
V34.
V35.
V36.
V37.
V.38.
V39.
V40.
V41.
V42.
V43.

Some numbers are especially lucky for some people


New Technology does not depend on basic scientific research
Scientific research does not make industrial products cheaper
On balance, computers and factory automotion will create more jobs than they will
eliminate
Even if brings inmediate benefits, scientific research... is necessary and... supported by the
governement
Scientific and tchnological research do not play an important role in industrial
development
New inventions will always be found counterat any harmful consequences of scientific
and technological development
Only by applyiing the most modern technology can our economy become more
competitive
Scientific and technological progress will help to cure illness such as AID, cancer...
Computers have made the use of bank services more compicated
The benefits of science are greater then any harmful effects it may have

169
Universidad de Deusto - ISBN 978-84-9830-628-6

ENCUESTA SOBRE LA CAMPAA : SEXUALIDAD SEGURA


FICHERO DE DATOS: CAMPAA.sav
SUJETOS = 171
VARIABLES = 26

Estamos realizando un estudio sobre las opiniones que pueda suscitar la campaa Sexualidad
Segura. Para ello, te agradeceramos que contestaras a las siguientes preguntas
Las siguientes frases hacen referencia a la campaa Sexualidad Segura. Lee cada frase y d si ests :
5 - Muy de acuerdo con la frase.
4 - De acuerdo con la frase.
3.- Indiferente, no me dice nada la frase.
.
2.- En desacuerdo con la frase.
1.- Muy en desacuerdo con la frase.

V1.

Es necesaria una asignatura en el colegio para explicar correctamente la


sexualidad a los adolescentes.......................................................................
1 2 3 4 5

V2.

El sexo aparece trivializado en la campaa................................................

1 2 3 4 5

V3.

Los catlicos deben rechazar esta campaa...............................................

1 2 3 4 5

V4.

Sera una irresponsabilidad del gobierno esconder la cabeza ante el hecho


1 2 3 4 5
de los embarazos no deseados y sus consecuencias..................................

V5.

Esta iniciativa servir para que muchos padres expliquen a sus hijos qu
es un condn, las relaciones sexuales, las enfermedades sexuales,
1 2 3 4 5
etc....................................................................................................................

V6.

Ms necesaria que esta campaa es una buena educacin sexual............

V7.

La campaa fomenta la promiscuidad sexual y da a los jvenes una falsa


seguridad.......................................................................................................
1 2 3 4 5

V8.

No se puede esperar comprensin o solidaridad de los obispos, cuando


slo admiten la castidad como mtodo anticonceptivo.............................
1 2 3 4 5

V9.

El condn no gusta a nadie, pero si de su uso se derivan beneficios, veo la


razn de poner reparos................................................................................
1 2 3 4 5

V10. Se hacen pocas campaas informativas......................................................


V11. La reaccin de la Iglesia y de los sectores catlicos ante la campaa, es sin
duda poco realista, desproporcionada.........................................................

V12. Con esta campaa se va a conseguir que cualquier chico que no tenga
relaciones crea que es un pardillo................................................................

1 2 3 4 5

1 2 3 4 5
1 2 3 4 5
1 2 3 4 5

V13. Es hora de usar imgenes y explicaciones claras y concisas, no


1 2 3 4 5
camufladas...........................................................................................
V14. Estas campaas son necesarias porque la sociedad debe estar
informada.......................................................................................................

170
Universidad de Deusto - ISBN 978-84-9830-628-6

1 2 3 4 5

V15. La campaa sirve para distraer la atencin de otros problemas ms 1 2 3 4 5


urgentes..........................................................................................................

V16. La campaa me parece bien, porque se va a mejorar la higiene y la


seguridad en las relaciones sexuales............................................................

V17. Con supuestas razones de higiene y salud pblica, se trata de esconder un


intento de fabricar un modelo de juventud...............................................

V18. A m me parece una iniciativa muy cuerda y muy oportuna, pero es una
pena que se haga tan tarde.........................................................................

V19. Con el nivel del SIDA y de abortos en adolescentes que Espaa tiene, me
parece una irresponsabilidad la crtica de esta campaa.........................

V20. El lema pntelo - pnselo no dice que se fornique sino que en caso de
hacerlo se haga con seguridad....................................................................

V21. La solucin de fomentar el uso del preservativo es de parche y muy a

1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5

corto plazo......................................................................................................

1 2 3 4 5

V22. Esta campaa convierte el amor en mera atraccin de cuerpos...............

1 2 3 4 5

V23. Respecto a las relaciones sexuales completas con personas del otro sexo , selecciona una opcin
de las siguientes :
1. Nunca he tenido
2. Slo espordicamente con la misma persona
3. Slo espordicamente con diferentes personas
4. De modo habitual y ms o menos estable
V24. Que estudios completados tienes?
1. Estudios bsicos (ninguno , primarios y Bachiller elemental , EGB , y / o F.P.I graduado escolar)
2. Estudios medios (Bachiller superior , B.U.P, R E M , y / o F.P.II)
3. Estudios superiores ( Titulacin media, Licenciatura o Doctorado)
V25. En cuestin de religin te consideras
1. Muy buen/a catlico/a
2. Catlico/a practicante
3. Catlico/a no muy practicante
4. Catlico/a no practicante
5. Indiferente
6. Ateo
7. Creyente de otra religin
8. Otros
V26. Nmero de Encuesta

171
Universidad de Deusto - ISBN 978-84-9830-628-6

MENTALIDAD DE LA SOCIEDAD ANTE EL PROBLEMA DE LAS DROGAS


FICHERO DE DATOS: DROGODE.sav
SUJETOS = 111
VARIABLES = 33

V1. Nmero de encuesta .


V2. Sexo
1. Hombre
2. Mujer
V3. En materia religiosa, cmo se considera usted?
1. No creyente
2. Muy catlico
3. Poco catlico
V4. Cual es su nivel de estudios ? (estudios acabados de mayor nivel)
1. Bsicos
2. Medios
3. Universitarios
V5. Podra decirme qu edad tiene Ud.?
1. Menos de 25 aos
2. Entre 26 - 35 aos
3. Entre 36 - 45 aos
4. Entre 46 - 55 aos
5. Ms de 56 aos

Dgame, por favor: segn la puntuacin de 1 a 9 (1= Nada toxicmano 9= Muy toxicmano) qu
opinin le merecen cada uno de estos casos?
V6.

El borracho que bebe excesivamente para olvidar las penas.. 1 2 3 4 5 6 7 8 9

V7.

El chico que bebe esas cervezas de litro en la calle................. 1 2 3 4 5 6 7 8 9

V8.

El yonki o persona que se droga diariamente........................... 1 2 3 4 5 6 7 8 9

V9.

El txikitero de todos los das....................................................... 1 2 3 4 5 6 7 8 9

V10. El que se emborracha todos los fines de semana...................... 1 2 3 4 5 6 7 8 9


V11. El joven que consume herona de vez en cuando..................... 1 2 3 4 5 6 7 8 9
V12. Una persona que fuma porros todos los das........................... 1 2 3 4 5 6 7 8 9
V13. Un agente comercial que consume cocana a menudo para
poder trabajar ms.................................................................... 1 2 3 4 5 6 7 8 9
V14. El seor que bebe mucho, pero aguanta sin emborracharse.. 1 2 3 4 5 6 7 8 9
V15. Un cientfico ( mdico , bilogo,...) que , como tiene heorna
a mano , la consume a menudo por gusto................................. 1 2 3 4 5 6 7 8 9
V16. Un bohemio ( un Hippie , un artesano , un artista ) que 1 2 3 4 5 6 7 8 9
fuma porros de vez en cuando...................................................
V17. Una seora que fuma ms de un paquete de tabaco al da.... 1 2 3 4 5 6 7 8 9
V18. El joven que toma tranquilizantes para colocarse con los
amigos.......................................................................................... 1 2 3 4 5 6 7 8 9

172
Universidad de Deusto - ISBN 978-84-9830-628-6

V19. Una chica que consume cocana de vez en cuando para


animarse...................................................................................... 1 2 3 4 5 6 7 8 9
V20. Un estudiante, que consume anfetaminas en exmenes......... 1 2 3 4 5 6 7 8 9
V21. El ama de casa que toma normalmente tranquilizantes para
dormir.......................................................................................... 1 2 3 4 5 6 7 8 9

Punte segn la misma escala de 1 a 9 cada una de las siguientes razones por las que se puede llegar
a consumir Alcohol.
ALCOHOL

OTRAS
DROGAS

Porque hay familias con muchos problemas, y alguno de sus


miembros puede llegar a refugiarse en el alcohol (o en la
droga)..................................................................................................

V22.
-----

------

Porque no quieren responsabilidades, slo quieren pasarlo bien


y conocer cosas nuevas......................................................................

V23.

V29.

----V24.

----V30.

-----

-----

V25.

V31.

----V26.

----V32.

-----

-----

V27.

V33.

-----

-----

Porque no todos pasamos por las mismas circunstancias,


muchas personas sufren mucho y se refugian en el
alcohol.................................................................................................
Por hacer lo mismo que hacen los amigos y compaeros, para
poder alternar y no ser un raro.......................................................
Porque hay gente que rechaza la hipocresa y las normas de
esta sociedad y una forma de mostrar su rebelda es
consumiendo drogas..........................................................................
Porque son vctimas de la crisis social, que estamos viviendo:
Paro, marginacin, consumismo, falta de valores..........................

Punte segn la misma escala de 1 a 9 cada una de las siguientes


razones por las que se puede llegar a consumir Otras Drogas

173
Universidad de Deusto - ISBN 978-84-9830-628-6

V28.

LO QUE NO ME ENSEARON EN LA ESCUELA


FICHERO: ESCUEL.sav
SUJETOS = 117
VARIABLES = 36

V1 . Nmero de encuesta...........

A continuacin se exponen algunos temas que en mayor o menor medida no se ensean en la escuela.
Valora Cada item de 1 a 9 , puntuando con 9 lo que ms echas en falta ( es decir, lo que menos te han
enseado ) y con 1 lo que menos echas en falta ( lo que ms te han enseado)
V2. Desarrollo de las capacidades artsticas ........................................ 1 2 3 4 5 6 7 8 9
V3. Conocer los derechos bsicos ante las injusticias:Educ.Cvica ...1 2 3 4 5 6 7 8 9
V4. Vida sana, amor al propio cuerpo ................................................. 1 2 3 4 5 6 7 8 9
V5. Conocerse a s mismo ...................................................................... 1 2 3 4 5 6 7 8 9
V6. Hablar en pblico ............................................................................ 1 2 3 4 5 6 7 8 9
V7. Tcnicas de estudio.......................................................................... 1 2 3 4 5 6 7 8 9
V8. Disfrutar de la vida ......................................................................... 1 2 3 4 5 6 7 8 9
V9. Anlisis sntesis ................................................................................ 1 2 3 4 5 6 7 8 9
V10. Valorarse a si mismo ..................................................................... 1 2 3 4 5 6 7 8 9
V11. Capacidad de decisin .................................................................. 1 2 3 4 5 6 7 8 9
V12. Destrezas manuales ....................................................................... 1 2 3 4 5 6 7 8 9
V13. Saber trabajar en grupo ............................................................... 1 2 3 4 5 6 7 8 9
V14. Capacidad de crtica ..................................................................... 1 2 3 4 5 6 7 8 9
V15. Valenta para enfrentarse (...) ...................................................... 1 2 3 4 5 6 7 8 9
V16. Baile , teatro,expresin corporal .................................................. 1 2 3 4 5 6 7 8 9
V17. Mtodos de relajacin ................................................................... 1 2 3 4 5 6 7 8 9
V18. No tener miedo de hacer preguntas estpidas ............................ 1 2 3 4 5 6 7 8 9
V19. No comprometerse tanto (pasar) ............................................. 1 2 3 4 5 6 7 8 9
V20. Detectar los engaos...................................................................... 1 2 3 4 5 6 7 8 9
V21. Escuchar atentamente................................................................... 1 2 3 4 5 6 7 8 9

174
Universidad de Deusto - ISBN 978-84-9830-628-6

V22. Elegir algo difcil y hacerlo bien .................................................. 1 2 3 4 5 6 7 8 9


V23. todos cometemos errores.................................................................... 1 2 3
V24. Guerra Nuclear ...................................................................................... 1 2 3
V25. Conocer nuestro planeta ........................................................................ 1 2 3
V26. Ciencia y Tecnologa .............................................................................. 1 2 3
V27. No pasarse la vida viendo televisin ..................................................... 1 2 3
V28. Cultura ........................................................................................... 1 2 3 4 5 6 7 8 9
V29. Poltica ............................................................................................ 1 2 3 4 5 6 7 8 9
V30. Compasin ..................................................................................... 1 2 3 4 5 6 7 8 9
V31. Educacin fsico deportiva ........................................................... 1 2 3 4 5 6 7 8 9
V32. Desarrollo de la afectividad .......................................................... 1 2 3 4 5 6 7 8 9
V33. Educacin sexual ........................................................................... 1 2 3 4 5 6 7 8 9
V34. Sexo:
1.Hombre
2.Mujer
V35. Clase social :
1.Clase social Alta
2.Clase social Media Alta
3.Clase social Media Baja
4.Clase Baja
V36. Centro en el que estudi en BUP:
1.Colegio Privado
2.Instituto

175
Universidad de Deusto - ISBN 978-84-9830-628-6

ENCUESTA DE SALUD ORGANICA Y PSICOSOCIAL


FICHERO: SALUD.sav
Sujetos = 222
Variables = 63

V1. Cul es su nivel de estudios? (Se refiere a estudios finalizados)


1 Analfabeto
2 Sin estudios(sabe leer y escribir)
3 Estudios primarios (EGB)
4 FP1, Bachiller elemental
5 FP2, Bachiller superior
6 Estudios superiores
7 Otros
0 NS/NC
V2. Abandon Vd sus estudios?
1 No
2 S
0 NS/NC
V3. Cuntos aos en total ha estado Vd estudiando, es decir, escolarizado?
____ Aos
V4. Actualmente tiene Vd alguna actividad o tarea ocupacional?
1 No
2 S
0 NS/NC
CONSUMO DE DROGAS
TIPO DE DROGA
Edad del primer Consumo ltimo
consumo regular Regular mes (*)

Alcohol
Tabaco
Alucingenos
(LSD, Acidos)
Opiceos
(Buprex)
Cocana
Cannabis
(Porro)
Herona
Tranquilizantes
(Transilium, Roinoles)
Anfetaminas
(Extasis, Estimulantes)

V5.
V7.
V9.

V6.
V8.
V10.

V11.

V12.

V13.
V15.

V14.
V16.

V17.
V19.

V18.
V20.

V21.

V22.

(*) - Frecuencia de consumo de droga en el ltimo mes:


0
1
2
3
4

NS/NC
Ninguno
Menos de una vez al mes
Entre 1 y 3 veces al mes
Una vez a la semana

5 Entre 2 y 3 veces por semana


6 entre 4 y 6 veces por semana
7 Una vez al da
8 Entre 2 y 3 veces al da
9 4 o ms veces al da

- Frecuencia de consumo de tabaco en el ltimo mes


0 NS/NC 1 Menos de 10 cigarrillos 2 Entre 11 y 20 3 Ms de 1 paquete

23. Le han detenido alguna vez la polica por motivos distintos de los polticos o sindicales?
1 S
2 No
0 NS/NC

176
Universidad de Deusto - ISBN 978-84-9830-628-6

24. Cunto tiempo ha cumplido condena en la crcel en toda su vida?


____ Meses
ESTADO DE SALUD PSICOPATOLOGICO
Codificacin V25-V52: 0 = NO AFECTADO 1 = SI AFECTADO
25. Se ha sentido perfectamente bien de salud y en plena forma?
26. Ha tenido la sensacin de que necesitaba un reconstituyente?
27. Se ha sentido agotado y sin fuerzas para nada?
28. Ha tenido la sensacin de que estaba enfermo?
29. Ha padecido dolores de cabeza?
30. Ha tenido sensacin de opresin en la cabeza o que la cabeza le va a estallar?
31. Ha tenido oleadas de calor o escalofros?
32. Sus preocupaciones le han hecho perder mucho sueo?
33. Ha tenido dificultades para seguir durmiendo de un tirn toda la noche?
34. Se ha notado constantemente agobiado y en tensin?
35. Se ha sentido con los nervios a flor de piel malhumorado?
36. Se ha asustado o ha tenido pnico sin motivo?
37. Ha tenido la sensacin de que todo se le viene encima?
38. Se ha notado nervioso y a punto de explotar constantemente?
39. Se las ha arreglado para mantenerse ocupado y activo?
40. Le cuesta ms tiempo hacer las cosas?
41. Ha tenido la impresin en conjunto de que est haciendo las cosas bien?
42. Se ha sentido satisfecho con su manera de hacer las cosas?
43. Ha sentido que est jugando un papel til en la vida?
44. Se ha sentido capaz de tomar decisiones?
45. Ha sido capaz de disfrutar de sus actividades normales de cada da?
46. Ha pensado que Vd es una persona que no vale para nada?
47. Ha venido viviendo la vida totalmente sin esperanza?
48. Ha tenido el sentimiento de que la vida no merece la pena vivirse?
49. Ha pensado en la posibilidad de "quitarse de en medio"?
50. Ha notado que a veces no puede hacer nada porque tiene los nervios desquiciados?
51. Ha notado que desea estar muerto y lejos de todo?
52. Ha notado que la idea de quitarse la vida viene repetidamente a la cabeza?
53. Puntuacin total desde la V.25 hasta V.52 (Suma de las respuestas1)
54. Ha sufrido Hepatitis?
1 = SI
2 = NO
55. El paciente est diagnosticado de SIDA?
1 = SI
2 = NO
56. Consumo medio de alcohol entre semana (Lunes a Jueves)
____ cc de Alcohol
57. Consumo medio de alcohol fin de semana (Viernes a Domingo)
____ cc de Alcohol
58. Consumo medio de alcohol por da
____ cc de Alcohol

177
Universidad de Deusto - ISBN 978-84-9830-628-6

59. Sexo
1 Hombre
2 Mujer
0 NS/NC
60. Cul es el lugar de nacimiento?
1 Logroo
2 Resto Provincia
0 NS/NC
61 Cul es su estado civil actual?
1 Soltero
2 Casado
3 Viudo
4 Separado
5 Divorciado
0 NS/NC
62. En la actualidad est viviendo con...
1 Sus padres
2 Familia propia
3 En pareja
4 Solo
5 Otros familiares
6 Con otras personas
7 Otros
0 NS/NC
63. Nmero de Encuesta

178
Universidad de Deusto - ISBN 978-84-9830-628-6

Serie Manuales didcticos

Deusto
Publicaciones

Universidad de Deusto

Das könnte Ihnen auch gefallen