Sie sind auf Seite 1von 46

ANLISIS DE DATOS EN PSICOLOGA II CUADERNO DE PRCTICAS DE SPSS

Ludgerio Espinosa Antonio Pardo Javier Revuelta Rafael San Martn

NDICE
1. Archivos de datos................................................................................................. 1 Lectura de datos con el SPSS ......................................................................... 1 Introduccin directa de los datos....................................................................... 2 Datos para las prcticas.................................................................................... 3 Guardar datos con el SPSS ............................................................................. 4 2. Anlisis descriptivos ........................................................................................... 5 Descriptivos..................................................................................................... 5 Frecuencias....................................................................................................... 7 Grficos............................................................................................................. 8 Notacin cientfica ............................................................................................ 9 3. Contrastes sobre medias ..................................................................................... 10 Prueba T.......................................................................................................... 10 Contraste sobre una media .................................................................. 10 Contraste sobre dos medias independientes ....................................... 12 Contraste sobre dos medias relacionadas............................................ 13 Ejercicios.......................................................................................................... 14 4. Anlisis de varianza de un factor en un diseo completamente aleatorizado .......................................................................................................... 15 ANOVA A EF CA ........................................................................................ 15 Comparaciones mltiples entre medias .......................................................... 16 Comparaciones de tendencia y F planeadas ....................................... 16 Comparaciones a posteriori................................................................... 18 Ejercicios.......................................................................................................... 19 5. Anlisis de varianza de un factor con medidas repetidas................................ 20 ANOVA A EF MR ........................................................................................ 20 Ejercicios.......................................................................................................... 22 6. Anlisis de varianza de dos factores.................................................................. 23 ANOVA AB EF CA ..................................................................................... 23 Ejercicios......................................................................................................... 26

7. Correlacin y regresin ..................................................................................... 27 Correlaciones ................................................................................................ 27 Regresin ...................................................................................................... 28 Ejercicios ....................................................................................................... 30 8. Contrastes no paramtricos .............................................................................. 31 Prueba de los signos (binomial) ..................................................................... 31 Contrastes para dos muestras........................................................................ 32 Dos muestras independientes, prueba de Mann-Whitney.................... 32 Dos muestras relacionadas, prueba de Wilcoxon ................................ 33 Contrastes para ms de dos muestras............................................................ 34 Ms de dos muestras independientes, prueba de Kruskal Wallis ........ 34 Ms de dos muestras relacionadas, prueba de Friedman.................... 35 9. Contrastes sobre proporciones.......................................................................... 36 Contraste sobre una proporcin...................................................................... 36 Contrastes sobre dos proporciones ................................................................ 37 Dos proporciones independientes ........................................................ 37 Dos proporciones relacionadas............................................................. 37 Ms de dos proporciones relacionadas............................................................38 Ejercicios ......................................................................................................... 38 10. Prueba X 2 de Pearson ....................................................................................... 39 Bondad de ajuste ........................................................................................... 39 Tablas de contingencia................................................................................... 40 Ejercicios ........................................................................................................ 43

Prctica 1 Archivos de datos

Esta prctica trata sobre la lectura y almacenamiento de datos con el programa SPSS. El objetivo es que el alumno aprenda estas operaciones utilizando unos datos de ejemplo que se presentan ms adelante y logre transcribirlos a un archivo SPSS. Los datos empleados aparecen en la pgina 3 de este cuadernillo y consisten en 8 variables medidas a 20 sujetos. Los datos corresponden a una terapia para el tratamiento del insomnio. Se ha observado que el insomnio es uno de los sntomas asociados a determinados trastornos de ansiedad. Para aliviarlo, en un gabinete psicolgico se propone una terapia para aumentar el nmero de horas dormidas. Se forman dos grupos de sujetos: al primer grupo se le aplica la terapia y al segundo no, y se observa el nmero de horas dormidas por los sujetos en tres noches consecutivas. Los datos aparecen recogidos en las variables Noche1, Noche2 y Noche3, que indican el nmero de horas dormidas en las tres noches. Adems se han recogido otras tres variables: Sexo, que toma los valores 0 para las mujeres y 1 para los hombres. Edad, con los valores 1 para los sujetos menores de 20 aos, 2 para los sujetos entre 20 y 25 aos, y 3 para los sujetos con mas de 25 aos. Finalmente, los datos incluyen tres variables relacionadas con las terapias que ha recibido el sujeto. Todas ellas toman los valores 1, si el sujeto ha recibido la terapia, y 0 en caso contrario. Las variables son Terapia1, que se refiere a la terapia contra el insomnio. Terapia2, que indica si el sujeto ha recibido terapia contra estados de ansiedad generalizada, y Terapia3, que indica si ha recibido terapia contra algn tipo de fobia. El primer paso para introducir los datos es abrir el programa SPSS. Al iniciar una sesin con el SPSS lo primero que nos encontramos es con el Editor de datos que es la ventana principal del SPSS pero no la nica, como veremos ms adelante.

Lectura de datos con el SPSS Existen varias formas de introducir datos en el SPSS. La ms usual consiste en introducir los datos directamente en el Editor de datos del SPSS, aunque tambin se pueden grabar en cualquier otra aplicacin y leerlos desde el SPSS. La primera tcnica es ms sencilla, por lo que es la recomendada en esta prctica. La segunda tcnica resulta til cua ndo ya tenemos los datos en otro formato (por ejemplo en Excel) y queremos analizarlos con el SPSS. Aqu solamente vamos a centrarnos en la primera.

Introduccin directa de los datos Una vez dentro del SPSS aparece la ventana del Editor de datos, cuyo aspecto es el siguiente:

Los datos se introducen colocando un sujeto en cada fila y una variable en cada columna. Para ello, simplemente se escriben las puntuaciones correspondientes a cada caso. Para moverse de una celda a otra se pulsan las teclas marcadas con flechas. Por ejemplo, en la prctica los datos de los 5 primeros sujetos se colocan del siguiente modo:
Aqu se muestra el contenido de la casilla donde est situado el cursor. En este caso en el sujeto n= 1

Pulsar para ver los datos

Pulsar para ver la definicin de las variables

Una vez escritos los datos es necesario dar nombre a las variables. El SPSS les da por defecto los nombres var00001, var00002, var00003, etc. Si se desea cambiar el nombre de una variable y definir sus caractersticas (por ejemplo nivel de medida, etiquetas de valores, formato de columna, definicin de valores perdidos, etc.) hay que pulsar con el ratn en la solapa Vista de variables . A continuacin aparece una ventana que contiene tantas filas como variables hay definidas en el editor de datos:

Desde esta ventana se puede modificar el nombre de la variable (teniendo en cuenta que no puede tener ms de 8 caracteres de largo ) adems de otras propiedades como el tipo (numrico, cadena, etc.), la anchura, el nmero de decimales, la etiqueta, el significado de los valores que admite (p.e. 0: mujer y 1: varn), los valores perdidos, etc. Para volver a visualizar los datos, se pincha en la solapa Vista de datos . Datos para las prcticas Noche 1 4.0 5.8 4.1 4.3 5.4 5.7 4.3 7.6 5.7 3.8 7.5 6.4 4.0 7.7 6.4 5.9 7.2 5.6 5.7 7.4 Noche 2 4.5 6.4 4.9 5.0 6.1 6.3 4.8 7.9 6.0 4.6 8.0 7.0 4.5 8.1 6.9 6.6 7.8 6.2 6.1 7.6 Noche 3 5.0 7.0 5.1 5.6 6.3 6.8 5.4 8.6 6.7 4.9 8.5 7.3 5.0 8.5 7.3 7.0 8.1 6.8 6.8 8.2 Sexo 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 Edad 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 Terapia1 0 0 0 0 0 1 0 1 1 0 1 1 0 1 1 1 1 1 1 1 Terapia2 1 1 0 1 0 0 1 0 1 1 0 1 1 1 0 0 1 1 0 1 Terapia3 0 0 0 1 1 0 1 1 0 1 0 0 1 1 1 1 1 0 0 1

Guardar datos con el SPSS Una vez introducidos los datos y cambiados los nombres de las variables se guarda el archivo en un disco. Para ello hay que pulsar una vez con el ratn sobre el men Archivo, y despus en la opcin Guardar:

Aparece un cuadro de dilogo en el cual se pregunta al usuario dnde y con qu nombre se guardarn los datos. Nosotros vamos a dar el nombre a:Terapia :
Pulsando aqu se despliega un men para indicar en qu unidad se guarda el archivo de datos

Escribir el nombre del archivo aqu

Pulsar para finalizar la operacin

De esta forma se le dice al programa que guarde un archivo con el nombre Terapia en la unidad a del ordenador, que es donde est el disco del usuario. Para abrir un archivo de datos desde el disco es necesario pulsar en el men Archivo y despus en Abrir.

Prctica 2 Anlisis descriptivos


En esta prctica vamos a repasar las funciones bsicas del SPSS (descriptivos, frecuencias y grficos), las cuales se vieron en detalle en las prcticas de la asignatura Anlisis de datos I.

Descriptivos
Para realizar anlisis descriptivos de los datos se utiliza el procedimiento Descriptivos , que proporciona distintos estadsticos de tendencia central, dispersin, asimetra y curtosis. Adems, permite obtener puntuaciones tpicas y guardarlas como nuevas variables. Para seleccionar el procedimiento descriptivos hay que escoger las opciones del men: Analizar > Estadsticos descriptivos > Descriptivos .

A continuacin aparece un cuadro de dilogo en el que se listan las variables del archivo de datos. Para indicar al SPSS cules son las variables que se desea analizar, se seleccionan estas variables de la lista pulsando sobre su nombre con el ratn. A continuacin, se pulsa sobre el botn flecha para trasladar las variables al cuadro de variables seleccionadas.

Pulsar este botn para trasladar las variables de un lado al otro

Los cuadros de dilogo de los procedimientos del SPSS poseen varios botones. Los botones comunes son Aceptar, Pegar, Restablecer, Cancelar y Ayuda. Se denominan de este modo porque aparecen en todos los cuadros de dilogo de los procedimientos. Los cuadros de dilogo pueden tambin contener algunos botones especficos del procedimiento estadstico que se est realizando. El cuadro de dilogo del procedimiento Descriptivos contiene el botn especfico denominado: Opciones... Los tres puntos significan que pulsando sobre este botn aparece un subcuadro de dilogo que permite seleccionar los estadsticos que se desea calcular. En este caso:

Para realizar el anlisis es necesario pulsar el botn Aceptar del cuadro de dilogo del procedimiento Descriptivos . El visor de resultados de SPSS mostrar los anlisis solicitados.

Frecuencias
El procedimiento Frecuencias proporciona la distribucin de frecuencias de una variable en forma de tabla y tambin en forma grfica, adems de varios estadsticos descriptivos. Para ejecutar este procedimiento es necesario seleccionar el men: Analizar > Estadsticos descriptivos > Frecuencias . Aparecer un cuadro de dilogo en el cual se indican las variables del archivo de datos. Al igual que en el procedimiento Descriptivos , el primer paso consiste en trasladar al recuadro Variables aquellas variables que se desea analizar.

Pulsando sobre el botn Estadsticos pueden seleccionarse diversos indicadores de tendencia central, dispersin, forma de la distribucin y percentiles. El botn Grficos se utiliza para indicar al SPSS que realice un grfico de barras, de sectores o un histograma. Por ejemplo, el grfico de barras de la variable Edad es el siguiente:
8 7 6 5 4

Frecuencia

3 2 1 0 1.00 2.00 3.00

EDAD

Grficos
El programa SPSS permite realizar distintos tipos de grficos a partir de la opcin del men: Grficos . A continuacin se muestran algunos grficos obtenidos a partir de los datos del ejemplo: - Grfico de lneas de las variables: Noche1, Noche2 y Noche3 por niveles de Edad. Mediante las opciones: Grficos > Lneas , y a continuacin: lneas mltiples, resmenes para distintas variables.
9

6
NOCHE1

Media

5 4 1.00

NOCHE2 NOCHE3

2.00

3.00

EDAD

- Diagramas de caja de la variable Noche1 por niveles de Terapia1. Mediante las opciones: Grficos > Diagramas de caja > Simples.
8 7 6 5

NOCHE1

4 3
N= 8 12

.00

1.00

Indica si se ha administrado la terapia

- Diagramas de caja de las variables Noche1, Noche2 y Noche3 por niveles de Terapia1. Mediante la opcin: Diagramas de caja > Agrupadas > Resmenes para distintas variables.

9 8 7 6 5 4 3
N= 8 8 8 12 12 12 NOCHE1 NOCHE2 NOCHE3

.00
Indica si se ha administrado la terapia

1.00

- Grfico de dispersin de las variables Noche1 y Noche2. Cada punto se corresponde con los valores de un mismo sujeto en ambas variables. Se obtiene mediante: Grficos > Dispersin > Simples.
8

NOCHE1

4 3 4 NOCHE2 5 6 7 8 9

Notacin cientfica
En muchas ocasiones las tablas de resultados del SPSS incluyen datos en la denominada notacin cientfica, debido a que los nmeros escritos de esta forma ocupan menos espacio que en la notacin tradicional. La notacin cientfica se utiliza para sealar la posicin del primer valor decimal. Por ejemplo, un nmero escrito en notacin cientfica del siguiente modo: 1.432E-02 significa lo siguiente en notacin tradicional: 1.432E 02 = 1.432 10 - 2 = 1.432 = 0.01432 100

Del mismo modo, el nmero 5274E+04 es igual a 52740000. 9

Prctica 3 Comparar medias


Dentro del men Analizar se encuentra el procedimiento Comparar medias que permite realizar distintos tipos de contrastes sobre una, dos y hasta J medias. El aspecto de dicho men es el siguiente:

Contraste sobre 1 media () Contraste sobre 2 medias (1-2) con muestras independientes Contraste sobre 2 medias (1-2) con muestras relacionadas Contraste sobre J medias (1=2= ...J ) con muestras independientes

Prueba T
Para comparar medias utilizando la prueba T hay tres opciones diferentes que permiten realizar contrastes de hiptesis sobre una media, dos medias con muestras independientes y dos medias con muestras relacionadas.

Contraste sobre una media Al seleccionar la opcin del men Prueba T para una muestra aparece un cuadro de dilogo con la lista de variables del archivo de datos. Para realizar el contraste hay que trasladar al cuadro Contrastar variables la variable cuya media se desea contrastar, indicar en Valor de prueba el valor de la media poblacional en la hiptesis nula y pulsar el botn Aceptar. Por ejemplo, si se quiere comprobar si la media poblacional de Noche1 es 5 se seleccionan las siguientes opciones:

H0 : = 5

10

Pulsando sobre el botn Opciones puede modificarse el nivel de confianza que por defecto es 0,95. El resultado del anlisis se muestra en el visor de resultados:

Estadstico de contraste

Nivel crtico

El SPSS proporciona dos tablas de resultados . En la primera aparecen el nmero de casos, la media, la desviacin tpica y el error tpico de la media ( X = S n 1 / n ). En la segunda tabla aparecen los resultados de la prueba T. En primer lugar el valor del estadstico de contraste. Los grados de libertad, el nivel crtico bilateral, la diferencia entre la media muestral y la media poblacional de la hiptesis nula y, por ltimo, los lmites inferior y superior del intervalo de confianza para la diferencia X . Cuando se realizan contrastes de hiptesis con el SPSS, la decisin sobre H0 debe tomarse a partir del nivel crtico, que es la probabilidad asociada al estadstico de contraste. El SPSS suele ofrecer el nivel crtico bilateral. En el ejemplo, el valor de T ha resultado ser 2,461 y nivel crtico bilateral 0,024. Esto significa que P(T -2,461) + P (T 2,461) = 0,024, lo que nos permite rechazar H0 con = 0,05. Esta decisin tambin puede tomarse a partir del intervalo de confianza para la diferencia de medias, el cual no incluye el valo r 0. En caso de haber deseado realizar un contraste unilateral, es necesario dividir por dos el nivel crtico bilateral. Continuando con el ejemplo, para contrastar la hiptesis: H0 : 5 H1 : > 5 Hay que dividir por dos el nivel crtico bilateral: 0,024 / 2 = 0,012, que es la probabilidad correspondiente al suceso: T 2,461. En este caso tambin se rechazara H0 con = 0,05.

11

Contraste sobre dos medias independientes A continuacin puede verse el cuadro de dilogo de esta prueba, en el que se ha indicado un contraste de las medias de Noche1 en los dos grupos de la variable Sexo:
Trasladar aqu la variable sobre la que se desee llevar a cabo un contraste

Para llevar a cabo el contraste es necesario indicar cmo estn definidos los dos grupos en el editor de datos

Adems es necesario indicar cul es el valor de la variable Sexo en cada grupo, para lo cual se pulsa el botn Definir grupos, con lo que aparece un subcuadro de dilogo. De este modo se indica que se van a comparar los dos grupos en los que Sexo toma los valores 0 (mujer) y 1 (varn):

La prueba T sobre dos medias independientes tiene dos versiones, dependiendo de si se asumen varianzas iguales o distintas. El SPSS ejecuta en primer lugar la prueba de Levene para contrastar la hiptesis nula de que las varianzas poblacionales de los dos grupos son iguales. A continuacin proporciona el resultado de las dos versiones de la prueba T.
Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas

F NOCHE1 Se han asumido varianzas iguales No se han asumido varianzas iguales .040

Sig. .843

t -1.001 -1.001

gl 18 18.00

Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Diferencia Error tp. Sig. de de la (bilateral) medias diferencia Inferior Superior .330 .330 -.590 -.590 .589 .589 -1.828 -1.828 .648 .648

12

Es responsabilidad del usuario escoger el resultado de una versin de la prueba T, en funcin del resultado del contraste sobre varianzas. El nivel crtico de cada contraste aparece en la columna Sig. La hiptesis nula de la prueba de Levene es H0 : 1 2 = 22 , es decir, que la varianza poblacional es igual en ambos grupos. En este ejemplo, el estadstico de contraste (con valor F = 0,40) no ha resultado significativo, segn indica el nivel crtico igual a 0,843. Por tanto, al mantenerse H0 puede asumirse que las varianzas son iguales. Puede verse que en la tabla de resultados aparecen dos valores de T. En este caso se utiliza el primero de ellos, correspondiente al supuesto de igualdad de varianzas (T = -1,001). De nuevo, la decisin sobre la hiptesis nula debe tomarse a partir del nivel crtico (igual a 0,33), que en este caso indica que el valor de T no es significativo y por tanto, que las medias de horas de sueo la primera noche son iguales en varones y mujeres.

Contraste sobre dos medias relacionadas Para comparar la media con dos muestras relacionadas es necesario seleccionar dos variables de la lista, tal y como se hace en el siguiente ejemplo para contrastar la hiptesis nula de que Noche1 y Noche2 tienen la misma media:

Primero se seleccionan las dos variables. Basta con hacer clic con el ratn en cada una.

La primera variable marcada aparece escrita en Variable 1; y la segunda en Variable 2.

Finalmente, la seleccin se traslada al cuadro variables relacionadas

A continuacin se pulsa sobre el botn flecha para trasladar las variables al cuadro de variables seleccionadas, y se pulsa Aceptar para que el SPSS realice el contraste. Los resultados obtenidos son los siguientes:
Prueba de muestras relacionadas Diferencias relacionadas 95% Intervalo de confianza para la Error tp. diferencia Desviacin de la tp. media Inferior Superior .164 3.656E-02 -.617 -.463

Media Par 1 NOCHE1 NOCHE2 -.540

t -14.769

gl 19

Sig. (bilateral) .000

13

Para realizar este contraste se calcula una nueva variable que es la diferencia entre las originales: D = noche1 - noche2. La salida de resultados muestra la media de la variable D, as como su desviacin tpica, el error tpico de la media y el intervalo de confianza. Tambin puede verse el estadstico de contraste T, los grados de libertad y el nivel crtico bilateral. Puesto que el nivel crtico vale p = 0,000 se rechaza H0 con un nivel de confianza de 0,99 y se concluye que la media en la poblacin de diferencia es significativamente distinta de cero. Es decir, existen diferencias significativas entre el promedio de horas dormidas por los sujetos la primera y la segunda noche.

EJERCICIOS: 1. Los resultados obtenidos por un gabinete psicolgico durante los ltimos 15 aos indican que los pacientes con insomnio duermen un promedio de 7 horas durante la tercera noche. Contraste dicha afirmacin utilizando = 0,05. 2. Se desea saber si los sujetos que han recibido la terapia 2 duermen durante la segunda noche el mismo nmero de horas que los que no la han recibido. Utilice = 0,01. 3. Se desea saber si los sujetos duermen ms horas durante la tercera noche que durante la primera (con = 0,05) 4. Contraste la hiptesis de que la media en horas dormidas durante la tercera noche para la poblacin de pacientes con insomnio es de 8 horas. ( = 0,99). 5. Una escuela de secundaria ha contratado a un psiclogo clnico para ingeniar una terapia que sirva para reducir el nivel de ansiedad de sus alumnos ante los exmenes. Para ello selecciona aleatoriamente a 8 alumnos y les mide su nivel de ansiedad en los exmenes de febrero con una escala de 1 a 10 puntos. A continuacin les aplica la terapia y vuelve a medir su nivel de ansiedad en los exmenes de Junio. Los resultados aparecen en la tabla inferior. Segn esto, Qu concluir el psiclogo sobre la eficacia de su terapia con = 0,01? Antes : Despus : 10 6 8 5 9 7 7 6 8 4 5 5 9 4 7 6

14

Prctica 4 Anlisis de varianza de un factor en un diseo completamente aleatorizado

ANOVA A EF CA
Existen distintos procedimientos en SPSS para realizar un anlisis de varianza de un factor en un diseo completamente aleatorizado. Uno de los ms directos y sencillos se encuentra dentro del men: Analizar > Comparar medias > ANOVA de un factor. Por ejemplo, para contrastar la hiptesis de igualdad de medias en la variable Horas (*) en los tres grupos de Edad, se indica:

Dentro del cuadro de dilogo ANOVA de un factor hay varios sub- mens. Pulsando el botn Opciones... puede indicarse que SPSS calcule los estadsticos descriptivos para las variables en los J grupos y tambin que compruebe el supuesto de homocedasticidad (homogeneidad de varianzas). Si se pulsa Aceptar, el resultado obtenido es el siguiente:
Descriptivos HORAS Intervalo de confianza para la media al 95% Lmite Lmite inferior superior 13.0198 17.7802 19.8130 24.6727 16.0185 21.0482 16.9574 20.5126

1.00 2.00 3.00 Total

N 7 7 6 20

Media 15.4000 22.2429 18.5333 18.7350

Desviacin tpica 2.5736 2.6273 2.3964 3.7982

Error tpico .9727 .9930 .9783 .8493

Mnimo 13.30 17.80 14.10 13.30

Mximo 19.50 24.30 20.70 24.30

Lo primero que aparece en el visor de resultados son los estadsticos descriptivos para los J grupos. Como se observa, el grupo que ms horas duerme es el 2 (edad entre 20-25 aos) y el que menos el 1 (edad < 20 aos).
(*)

Previamente hay que elaborar la variable Horas, que no es ms que la suma de las horas dormidas en las tres noches. Como se recordar de las prcticas de SPSS vistas en la a signatura Anlisis I, para ello hay que entrar en el men Transformar > Calcular del editor de datos de SPSS y definir la variable Horas = Noche1 + Noche2 + Noche 3.

15

A continuacin se muestra el resultado del test de Levene sobre homogeneidad de varianzas, cuya hiptesis nula es H0 : 1 2 =22 =32 . Puesto que el nivel crtico (p=0,694) es mayor que se mantiene la hiptesis nula sobre igualdad de varianzas. Por tanto, podemos asumir que se cumple el supuesto de homocedasticidad.
Prueba de homogeneidad de varianzas HORAS Estadstico de Levene .374

gl1 2

gl2 17

Sig. .694

Nivel crtico

A continuacin SPSS muestra la tabla-resumen del ANOVA:


ANOVA HORAS Suma de cuadrados 164.235 109.870 274.106 gl 2 17 19 Media cuadrtica 82.118 6.463 F 12.706 Sig. .000

Inter-grupos Intra-grupos Total

En dicha tabla aparecen las sumas de cuadrados inter- grupos, intra-grupos (error) y total. La tabla tambin contiene los grados de libertad, medias cuadrticas, estadstico de contraste F y su nivel crtico (Sig.). En este ejemplo, puesto que el nivel crtico es menor de 0,01 se rechaza la hiptesis nula del ANOVA (H0 : 1 = 2 = 3 ) y puede concluirse que existen diferencias significativas en el nmero medio de horas dormidas por los sujetos de cada edad.

Comparaciones mltiples entre medias


Comparaciones de tendencia y F planeadas Es necesario pulsar sobre el botn Contrastes, que se encuentra situado en el cuadro de dilogo del procedimiento ANOVA de un factor. En este ejemplo, como el nmero de medias es J=3 se podra realizar el contraste de tendencia lineal o cuadrtica. Si se quisiera realizar la comparacin de tendencia sobre el componente cuadrtico se indicara del siguiente modo:

16

El SPSS proporciona los resultados del componente indicado y tambin de los de orden inferior, en este ejemplo, puesto que J = 3, son el cuadrtico y el lineal:
ANOVA HORAS Suma de cuadrados 164.235 No ponderado Ponderado Desviacin No ponderado Ponderado Intra-grupos Total 31.719 37.835 126.400 126.400 126.400 109.870 274.106 gl 2 1 1 1 1 1 17 19 Media cuadrtica 82.118 31.719 37.835 126.400 126.400 126.400 6.463 F 12.706 4.908 5.854 19.558 19.558 19.558 Sig. .000 .041 .027 .000 .000 .000

Inter-grupos

(Combinados) Trmino lineal

Trmino cuadrtico

La tabla de resultados proporciona la F del ANOVA. Puede verse que su valor es 12,7 en este ejemplo (el mismo que en la salida de resultados comentada anteriormente). Adems proporciona la F del componente lineal en la fila denominada 'No ponderado', que toma el valor 4,9 y la del componente cuadrtico, que ha resultado ser 19,5. La columna Sig. se refiere a la hiptesis sobre cada tendencia, que se rechaza en ambos casos con p < 0,05 en la tendencia lineal y p < 0,01 en la cuadrtica; Por tanto la relacin entre ambas variables es cuadrtica. Para llevar a cabo comparaciones planeadas es necesario introducir los coeficientes directamente. Por ejemplo, para comparar la media en Horas del grupo 3 de Edad con la media de los grupos 1 y 2 tomados juntos, la hiptesis planteada sera: H0 : (-1) 1 + (-1) 2 + (2) 3 = 0 H1 : (-1) 1 + (-1) 2 + (2) 3 0 y en SPSS se indicara mediante:

Escribir aqu el valor de cada coeficiente y pulsar en Aadir

La salida de resultados incluye los coeficientes que se han utilizado en la comparacin, lo cual permite comprobar si han sido asignados correctamente a los grupos. Tambin incluye el estadstico T del contraste de medias, en sus dos versiones: asumiendo varianzas iguales y distintas. Puesto que la prueba de Levene indic igualdad de varianzas, el estadstico T vale -2,32 y su nivel crtico 0,819 por l o que se mantiene H 0 y no puede concluirse que existan diferencias significativas entre los sujetos de menos de 25 aos y los de ms de 25 aos. 17

Coeficientes de los contrastes Contraste 1 1.00 -1 EDAD 2.00 -1 3.00 2

Pruebas para los contrastes Contraste 1 Valor del contraste -.5762 -.5762 Error tpico 2.4810 2.4002 t -.232 -.240 gl 17 10.234 Sig. (bilateral) .819 .815

HORAS

Asumiendo igualdad de varianzas No asumiendo 1 igualdad de varianzas

Comparaciones a posteriori Al pulsar el botn Post Hoc aparece el cuadro de dilogo correspondiente a las comparaciones a posteriori:

Puede verse que permite seleccionar distintas pruebas: Tukey, Dunnett, Scheff, etc. Continuando con el ejemplo, al seleccionar la prueba de Tukey, la salida de SPSS muestra la tabla de resultados de dicha prueba. En la tabla puede verse la diferencia entre las medias de Horas en cada uno de los pares de grupos definidos por la variable Edad. Tambin se incluye el error tpico de la diferencia de medias, el nivel crtico asociado a dicha diferencia (Sig. ) y los lmites del intervalo de confianza. Como se observa, los resultados indican que existen diferencias significativas entre el grupo 1 y 2 (p < 0,01) y entre el 2 y 3 (p < 0,05).
Comparaciones mltiples Variable dependiente: HORAS HSD de Tukey Grupos (I) EDAD 1.00 2.00 3.00 (J) EDAD 2.00 3.00 1.00 3.00 1.00 2.00 Diferencia de medias (I-J) -6.8429* -3.1333 6.8429* 3.7095* 3.1333 -3.7095* Error tpico 1.3589 1.4144 1.3589 1.4144 1.4144 1.4144 Sig. .000 .097 .000 .045 .097 .045 Intervalo de confianza al 95% Lmite Lmite inferior superior -10.3289 -3.3568 -6.7617 .4951 3.3568 10.3289 8.114E-02 7.3379 -.4951 6.7617 -7.3379 -8.11E-02

*. La diferencia entre las medias es significativa al nivel .05.

18

EJERCICIOS:
1. Un psiclogo desea comprobar si existen diferencias en el nmero medio de horas dormidas por los pacientes con insomnio durante la primera noche en los tres grupos de edad considerados a). Selecciona el modelo de ANOVA ms apropiado, plantea la hiptesis pertinente y toma una decisin con = 0,05 b). Existe relacin entre la edad y el nmero de horas dormidas la primera noche? En caso afirmativo, Cul es la tendencia de dicha relacin? c). A qu edad los pacientes con insomnio duermen menos horas? ( = 0,05) d). Comprueba si el nmero de horas de sueo que duermen los sujetos de 20 a 25 aos difiere del nivel de los restantes considerados juntos ( = 0,01) 2. Repetir los apartados a, b, c y d del problema anterior pero referidos primero a la segunda noche y despus a la tercera. 3. Un psiclogo clnico desea evaluar la eficacia de un frmaco para reducir la ansiedad. Para ello selecciona al azar 15 pacientes de su consulta que sufren este problema y forma aleatoriamente tres grupos del mismo tamao. A cada grupo le administra aleatoriamente una dosis del frmaco (10 miligramos, 20 mg. y 30 mg). Al cabo de un tiempo les mide su nivel de ansiedad. Los resultados obtenidos se muestran en la siguiente tabla: (*) 10 mg. 20 mg. 30 mg. 7 4 2 8 4 3 8 5 2 9 6 2 8 6 1

a) Indica las variables que intervienen en el problema y la funcin que desempean b) Selecciona el modelo de ANOVA ms apropiado, plantea la hiptesis pertinente y toma una decisin con = 0,05 c) Existe relacin entre la dosis del frmaco y el nivel de ansiedad? d) En caso afirmativo: Interpreta grfica y estadsticamente el tipo de relacin e) Cuantifica el tamao de dicha relacin f) Entre qu dosis existen diferencias? g) Comprueba si el nivel de ansiedad con la dosis de 10 mg. difiere del nivel de las restantes consideradas juntas

(*)

Para resolver este ejercicio mediante el SPSS primero hay que introducir los datos correspondientes en el Editor de datos. Tngase que siempre ha de colocarse las variables como columnas y los sujetos como filas. El alumno puede comprobar como los clculos realizados a mano en clase coinciden con los resultados que ofrece el SPSS.

19

Prctica 5 Anlisis de varianza de un factor con medidas repetidas


En el tema anterior hemos visto el men Comparar medias para llevar a cabo ANOVAS de un factor. En SPSS hay otro men que puede utilizarse para llevar a cabo cualquier tipo de ANOVA. Se trata del men Analizar -> Modelo lineal general, cuyo aspecto es el siguiente:

Modelo A-EF-CA con 1 o ms factores y una VD

Modelo A-EF-MR con 1 o ms factores y 1 o ms VD

Utilizando el Procedimiento Univariante puede llevarse a cabo un ANOVA A-EF-CA como el del tema anterior (veremos este men en detalle al hablar del ANOVA de 2 factores en un diseo completamente aleatorizado).

ANOVA A EF MR
Para realizar un ANOVA de un factor en un diseo de medidas repetidas se ejecuta la opcin del men: Analizar > Modelo lineal general > Medidas repetidas . El objetivo es comparar las medias de distintas variables medidas sobre los mismos sujetos. Por ejemplo, supongamos que se desea comparar las medias de Noche1, Noche2 y Noche3 con el objeto de determinar la evolucin del nmero de horas dormidas en noches sucesivas. Por tanto, tenemos un factor intra-sujetos con J = 3 niveles. Cuando se selecciona el procedimiento Medidas repetidas aparece un cuadro de dilogo en el que se indica cuantas variables se van a comparar. En nuestro caso, son tres variables, luego:

Definir el nmero de niveles y pulsar en Aadir . A continuacin pulsar en Definir .

20

A continuacin se pulsa sobre el botn Aadir para que el SPSS interprete que se ha definido un factor intra-sujetos (denominado en el ejemplo Factor1) con tres niveles diferentes. Despus de Aadir se pulsa el botn Definir para indicar al SPSS cules son las variables que forman cada uno de los niveles de Factor1 , en este caso tres niveles. Al igual que en otros procedimientos, el SPSS muestra un cuadro de dilogo con todas las variables del archivo de datos. En este cuadro se seleccionan las variables que forman los grupos del factor intra-sujetos, que en el ejemplo son Noche1, Noche2 y Noche3:

A continuacin, pulsando sobre el botn flecha se trasladan estas variables al cuadro denominado Variables intra-sujetos. De este modo se ha indicado cules son los tres niveles del factor intra-sujetos Factor1 . El SPSS proporciona distintas tablas de resultados. La tabla correspondiente a la F del factor intrasujetos se denomina Pruebas de efectos intra-sujetos :
Pruebas de efectos intra-sujetos. Medida: MEASURE_1 Suma de cuadrados tipo III 10.416 10.416 10.416 10.416 .444 .444 .444 .444 Media cuadrtica 5.208 5.542 5.208 10.416 1.168E-02 1.243E-02 1.168E-02 2.337E-02

Fuente FACTOR1

Error(FACTOR1)

Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior Esfericidad asumida Greenhouse-Geisser Huynh-Feldt Lmite-inferior

gl 2 1.880 2.000 1.000 38 35.712 38.000 19.000

F 445.730 445.730 445.730 445.730

Significacin .000 .000 .000 .000

La tabla contiene la suma de cuadrados Inter-grupos y Error con los correspondientes grados de libertad, medias cuadrticas, el estadstico de contraste F y el nivel crtico. El SPSS ofrece los resultados bajo varios estadsticos segn si se cumple o no el supuesto de esfericidad.

21

Como puede verse en el cuadro de dilogo y en el visor de resultados, este procedimiento tiene muchas ms opciones adems de las indicadas. Por ejemplo, pueden realizarse pruebas de tendencia, comparaciones entre medias, grficos, etc. Asimismo, desde este men t ambin puede realizarse un ANOVA con medidas repetidas en ms de un factor y con medidas repetidas slo en algunos de ellos (diseos mixtos).

EJERCICIOS:
1. Supngase que se vuelve a medir las horas dormidas por los sujetos transcurrido un mes y se obtienen los siguientes resultados: Sujeto Horas Sujeto Horas 1 7.53 11 7.51 2 6.42 12 8.82 3 9.39 13 5.79 4 7.18 14 7.16 5 7.49 15 6.54 6 9.20 15 7.12 7 7.24 17 6.10 8 7.11 18 8.93 9 8.37 19 9.19 10 6.29 20 5.99

Segn estos datos, puede afirmarse que la terapia sigue teniendo efecto transcurrido un mes con un nivel de confianza del 95%?

2. Un profesor de matemticas de una facultad evala su asignatura a partir de tres controles que se realizan a lo largo del curso y hacen media con la nota del examen final. El profesor desea saber si el rendimiento de los alumnos ha ido aumentando en cada uno de los controles. Para ello selecciona aleatoriamente una muestra de 5 alumnos. Sus calificaciones obtenidas en los tres controles se muestran en la siguiente tabla: Control 1 Control 2 Control 3 5 6 7 4 5 6 5 6 8 3 4 5 1 3 4

a) Indica las variables que intervienen en el problema y la funcin que desempean b) Selecciona el modelo de ANOVA ms apropiado, plantea la hiptesis pertinente y toma una decisin con = 0,05 c) Existen diferencias entre las calificaciones en los controles?

22

Prctica 6 Anlisis de varianza de dos factores


El programa SPSS ofrece buenas posibilidades para realizar anlisis de varianza en diseos factoriales, con efectos fijos, aleatorios y mixtos. Los procedimientos se agrupan en la opcin del men: Analizar > Modelo lineal general.

ANOVA AB EF CA
Permite realizar anlisis de varianza con mas de un factor, incluyendo factores de efectos fijos y aleatorios, adems de anlisis de covarianza (ANCOVA). Supongamos que quisiera realizarse un ANOVA factorial de la variable Horas , utilizando como variables independientes el sexo del sujeto y su edad. Esto se especificara del siguiente modo en el cuadro de dilogo del procedimiento Univariante :

Pulsando en el botn Aceptar, el SPSS realiza en ANOVA indicado y ofrece los resultados:
Estadsticos descriptivos Variable dependiente: HORAS EDAD 1.00 SEXO Mujer Varn Total 2.00 Mujer Varn Total Mujer Varn Total Total Mujer Varn Total Media 15.0250 15.9000 15.4000 21.6333 22.7000 22.2429 17.7000 19.3667 18.5333 17.8100 19.6600 18.7350 Desv. tp. 2.4295 3.2187 2.5736 3.3501 2.3819 2.6273 3.3061 1.1590 2.3964 3.9006 3.6525 3.7982 N 4 3 7 3 4 7 3 3 6 10 10 20

En Opciones... se han solicitado los estadsticos descriptivos, la prueba de homogeneidad y las estimaciones de tamao del efecto. El SPSS ofrece las medias y desviaciones tpicas para las JK combinaciones de variables. Como se observa, quienes duermen ms horas son los varones con edades entre 20-25 aos.

3.00

23

Contraste de Levene sobre la igualdad de las varianzas error Variable dependiente: HORAS F gl1 .799 5

gl2 14

Significacin .569

A continuacin la prueba de homocedasticidad o igualdad de varianzas, supuesto que se cumple al mantener H0.

Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos. a. Diseo: Intercept+EDAD+SEXO+EDAD * SEXO

La salida de resultados incluye la tabla-resumen del ANOVA y las medidas del tamao del efecto:
Pruebas de los efectos inter-sujetos Variable dependiente: HORAS Suma de cuadrados tipo III 171.665a 6881.949 154.430 7.102 .537 102.441 7294.110 274.106 Media cuadrtica 34.333 6881.949 77.215 7.102 .268 7.317 Eta cuadrado .626 .985 .601 .065 .005

A B AB E T

Fuente Modelo corregido Intercept EDAD SEXO EDAD * SEXO Error Total Total corregida

gl 5 1 2 1 2 14 20 19

F 4.692 940.516 10.553 .971 .037

Significacin .010 .000 .002 .341 .964

a. R cuadrado = .626 (R cuadrado corregida = .493)

Y
i j k

2 ijk

Los estadsticos de contraste F correspondiente a los efectos de las variables Edad y Sexo, as como a la interaccin entre ambas ( Edad * Sexo), aparecen en las filas etiquetadas con el nombre de la variable. La decisin sobre H0 se toma a partir del punto crtico. Puede verse que se rechaza la hiptesis nula correspondiente a la variable Edad y se mantiene la correspondiente a Sexo y la interaccin Edad* Sexo. Para realizar un grfico con los efectos de los factores hay que pulsar el botn Grficos del cuadro de dilogo del procedimiento Univariante . De este modo, aparece un subcuadro de dilogo en el que se especifica la forma en que se realizan uno o mas grficos. Por ejemplo:

Trasladar factor a una de las casillas

Aadir grfico a la lista

24

De este modo se ha especificado un grfico de los valores de Horas por Edad, con lneas distintas para cada nivel de Sexo. A continuacin hay que pulsar el botn Aadir para que este grfico se incluya en la lista de grficos que se van a realizar. La salida de resultados del ANOVA incluye todos los grficos que se hayan especificado. En nuestro caso:
Medias marginales estimadas de HORAS
24 22 20 18
SEXO

Medias marginales estimadas

16 14 1.00

Mujer Varn

2.00

3.00

EDAD

El cuadro de dilogo del procedimiento Univariante incluye tambin el botn Post Hoc, que se utiliza para realizar contrastes a posteriori sobre los factores de efectos fijos. Para realizar la prueba de Tukey sobre los niveles de Edad, se indicara:

Los resultados de la prueba de Tukey aparecen junto con los del ANOVA. La tabla muestra las diferencias entre cada par de medias de la variable Horas en los grupos de sujetos definidos por Edad y Sexo. Adems se incluye el error tpico de cada diferencia, el nivel crtico y el intervalo de confianza para la diferencia de medias.

25

Comparaciones mltiples Variable dependiente: HORAS DHS de Tukey Intervalo de confianza al 95%. Lmite Lmite inferior superior -10.6272 -3.0585 -7.0722 .8055 3.0585 10.6272 -.2293 7.6484 -.8055 7.0722 -7.6484 .2293

Diferencia entre Error (I) EDAD (J) EDAD medias (I-J) tp. Significacin 1.00 2.00 -6.8429* 1.4459 .001 3.00 -3.1333 1.5049 .130 2.00 1.00 6.8429* 1.4459 .001 3.00 3.7095 1.5049 .066 3.00 1.00 3.1333 1.5049 .130 2.00 -3.7095 1.5049 .066 Basado en las medias observadas. *. La diferencia de medias es significativa al nivel .05.

EJERCICIOS:
1. Supongamos que se dispone de los datos sobre si los sujetos considerados son fumadores (1) o no lo son (0) Sujeto Fuma 1 1 2 0 3 1 4 1 5 1 6 0 7 1 8 0 9 10 11 12 13 14 15 15 17 18 19 20 1 1 0 0 1 0 0 0 0 1 0 0

contrasta el efecto de las variables Edad y Fumar sobre el nmero de horas dormidas con = 0,05 2. Un gabinete de psicologa clnica pretende estudiar la eficacia de cuatro terapias (psicoanaltica, conductista, cognitivista y gestltica) en el tratamiento de los trastornos del sueo. Para ello asigna aleatoriamente a un grupo de 24 pacientes (mitad varones, mitad mujeres) a cada terapia y mide las horas que duermen transcurrido un mes despus de la terapia. Los resultados obtenidos son los siguientes: Psicoanaltica Conductista Cognitivista Gestltica 4 8 8 6 Varones 5 3 7 7 9 8 5 5 Mujeres 4 3 6 7 7 8 4 5 4 5 6 3

1) Qu puede concluirse con = 0,01? 2) Qu terapia recomendaras a un paciente que acudiera a tu consulta con insomnio? 3) Representa grficamente la interaccin e interpreta el resultado 3. Con los datos del fichero de las prcticas, contrasta el efecto de las variables noche y sexo sobre el nmero de horas dormidas con = 0,05

26

Prctica 7 Correlacin y Regresin

La correlacin y regresin lineales permiten evaluar la existencia de relaciones lineales entre variables. Sin necesidad de calcular ningn estadstico, es posible elaborar un grfico de dispersin que informe sobre la posibilidad de que se d este tipo de relacin. Por ejemplo, mediante el procedimiento: Grficos > Dispersin > Simples es posible elaborar el siguiente grfico de dispersin de las variables Noche2 y Noche3:
9

NOCHE2

5 4 4 NOCHE3

Cada punto del grfico se corresponde con las puntuaciones de un sujeto en ambas variables. El grfico sugiere que existe una relacin lineal directa (o positiva) entre ambas, de modo que los sujetos que duermen ms la segunda noche tambin lo hacen la tercera. Para comprobar si esta relacin es estadsticamente significativa se utilizan los procedimientos Correlaciones y Regresin lineal.

Correlaciones
El procedimiento Correlaciones permite calcular la matriz de correlaciones de un conjunto de variables. Para calcular la correlacin de Pearson se ejecuta el procedimiento: Analizar > Correlaciones > Bivariadas . Por ejemplo, para calcular las correlaciones entre las tres noches se indica:

27

Pulsando en el botn Opciones pueden obtenerse los estadsticos descriptivos y la matriz de covarianzas. Segn puede verse en el cuadro de dilogo, este procedimiento tambin permite calcular la correlacin de tau de Kendall y la de Spearman, que utilizan nicamente las propiedades ordinales de los datos. Al pulsar en Aceptar, el SPSS muestra la matriz de correlaciones entre las tres variables:
r12 y nivel crtico para H0 : 12 =0 Correlaciones NOCHE1 NOCHE2 1.000 .994** . .000 20 20 NOCHE2 .994** 1.000 .000 . 20 20 NOCHE3 .996** .992** .000 .000 20 20 **. La correlacin es significativa al nivel 0,01 (bilateral). NOCHE1 Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N NOCHE3 .996** .000 20 .992** .000 20 1.000 . 20

Adems de los coeficientes de correlacin de Pearson (rij) para cada combinacin de las variables incluidas, la tabla incluye el nivel crtico que permite tomar una decisin respecto a cada hiptesis nula: Ho : ij = 0. La ltima fila de la tabla contiene el nmero de casos.

Regresin
El procedimiento Analizar > Regresin lineal permite obtener la regresin lineal simple y mltiple. Por ejemplo, para estimar los parmetros del modelo:

Noche2i = + Noche3i + E i
Se indica:

28

Los resultados muestran el coeficiente de determinacin (R cuadrado ) en la tabla Resumen del modelo. Se observa que el modelo estimado para noche2 explica el 98,30% de la varianza. La tabla de regresin en formato ANOVA muestra la descomposicin de la suma de cuadrados total en la parte debida a la regresin y el error:
Resumen del modelo Modelo 1 R R cuadrado R cuadrado corregida Error tp. de la estimacin a .992 .984 .983 .163 a. Variables predictoras: (Constante), NOCHE3
b ANOVA

Modelo 1

Regresin Residual Total

Suma de cuadrados 28.528 .477 29.006

gl 1 18 19

Media cuadrtica 28.528 2.653E-02

F 1075.435

Sig. .000a

a. Variables predictoras: (Constante), NOCHE3 b. Variable dependiente: NOCHE2

En el ejemplo, el nivel crtico asociado a la F del ANOVA permite rechazar la hiptesis nula de que no existe relacin lineal entre las variables (H0 : = 0). A continuacin aparecen los valores estimados para los parmetros:
a Coeficientes

Modelo 1

(Constante) NOCHE3

Coeficientes no estandarizados B Error tp. -.331 .204 .978 .030

Coeficientes estandarizados Beta .992

t -1.620 32.794

Sig. .123 .000

Estadstico de contraste T y nivel crtico para H0 : = 0

a. Variable dependiente: NOCHE2

La tabla de coeficientes muestra los trminos de la ecuacin de regresin. El trmino denominado Constante es el origen A de la ecuacin (estimador de ). La pendiente B 29

(estimador de ) aparece en la fila de la tabla indicada por NOCHE3. Los valores de A y B se muestran en la primera columna (noche2 = -0,331 + 0,978 noche3), a continuacin el error tpico de estimacin y los valores de A y B en caso de que se utilicen puntuaciones tpicas. Por ltimo, aparece el valor del estadstico t de contraste de las hiptesis nulas = 0 y = 0. La ltima columna contiene el nivel crtico.

EJERCICIOS: 1. Existe relacin entre el promedio de horas dormidas durante las tres primeras noches y las horas dormidas un mes despus de la terapia? 2. Calcular la regresin de la variable horas dormidas transcurrido un mes despus de la terapia sobre la variable horas dormidas durante la tercera noche. a) Cul es la proporcin de varianza en comn entre las variables? b) Representa grficamente la relacin entre variables

30

Prctica 8 Contrastes no paramtricos


Los contrastes no paramtricos se ejecutan mediante la opcin del men: Analizar > Pruebas no paramtricas .

Prueba de los signos (binomial)


En el SPSS se ejecuta mediante la opcin Prueba binomial. Por ejemplo supongamos que se desea contrastar la hiptesis de que la mediana de la variable Noche2 es 7,5. Esto se indica del siguiente modo en el cuadro de dilogo de la prueba binomial:

En la casilla denominada Punto de corte se ha introducido el valor para la mediana en la hiptesis nula, en Contrastar proporcin el valor 0,5, que es la proporcin de sujetos con puntuaciones menores o iguales que 7,5, segn la hiptesis nula. La salida de resultados se basa en el estadstico de contraste n+.
Prueba binomial Proporcin observada .75 .25 1.00 Prop. de prueba .50 Sig. exacta (bilateral) .041

NOCHE2

Grupo 1 Grupo 2 Total

Categora <= 7.5 > 7.5

N 15 5 20

En el ejemplo, la tabla indica que 15 sujetos obtuvieron puntuaciones iguales o menores que 7,5. Esto se corresponde con el 75% de los sujetos de la muestra, mientras que el porcentaje esperado bajo H0 es el 50%. El valor del nivel crtico bilateral es 0,041, y se utiliza para tomar una decisin sobre H0 . La prueba binomial tambin permite realizar contrastes sobre cualquier otro centil, basta con cambiar la proporcin introducida en la casilla Contrastar proporcin. Por ejemplo, para contrastar la hiptesis de que el centil 90 de la variable Horas es el valor 20, se indica: 31

La opcin Definir la dicotoma especifica que se va a comprobar si el 90% de los sujetos tienen valores iguales o menores que 20.

Contrastes para dos muestras


Dos muestras independientes, prueba de Mann-Whitney Seleccionando los contrastes 2 Muestras independientes aparece un cuadro de dilogo en el que se especifican las variables y el tipo de contraste. Para contrastar la hiptesis de que el valor esperado de Noche2 es igual en los dos grupos de la variable Terapia1, se indica:

Mediante el botn Definir grupos es necesario indicar que los dos grupos de la variable Terapia1 son los correspondientes a los valores 0 y 1. La salida de resultados muestra distintas tablas. Una de ellas contiene la suma de los rangos asignados a las puntuaciones en Noche2 en los dos grupos de Terapia1 :

32

Rangos Rango promedio 5.19 14.04 Suma de rangos 41.50 168.50

NOCHE2

TERAPIA1 .00 1.00 Total

N 8 12 20

En una tabla separada aparece el estadstico de contraste U de Mann-Whitney y el nivel crtico.


Estadsticos de contrasteb NOCHE2 5.500 41.500 -3.281 .001 .000a

U de Mann-Whitney W de Wilcoxon Z Sig. asintt. (bilateral) Sig. exacta [2*(Sig. unilateral)]

a. No corregidos para los empates. b. Variable de agrupacin: TERAPIA1

Dos muestras relacionadas, prueba de Wilcoxon Se encuentran en la opcin 2 Muestras relacionadas . Por ejemplo, los sujetos del grupo Noche1 son los mismos que los de Noche2, por lo que ambas son muestras relacionadas. Para comprobar que sus medianas son iguales se indica:

Rangos Rango promedio .00 10.50 Suma de rangos .00 210.00

NOCHE2 NOCHE1

Rangos negativos Rangos positivos Empates Total a. NOCHE2 < NOCHE1 b. NOCHE2 > NOCHE1 c. NOCHE1 = NOCHE2

N 0a 20b 0c 20

b Estadsticos de contraste

Z Sig. asintt. (bilateral)

NOCHE2 NOCHE1 -3.936a .000

a. Basado en los rangos negativos. b. Prueba de los rangos con signo de Wilcoxon

33

Contrastes para ms de dos muestras


Ms de dos muestras independientes, prueba de Kruskal Wallis Se especifica mediante la opcin K Muestras independientes. A continuacin puede verse como contrastar la hiptesis de que la mediana de Noche3 es la misma en los tres grupos de edad:

Mediante Definir rango se ha indicado que los grupos de Edad vienen definidos por los valores 1 a 3. La salida de resultados muestra la suma de rangos en cada grupo de Edad y el valor del estadstico X2 .
Rangos EDAD 1.00 2.00 3.00 Total N 7 7 6 20 Rango promedio 5.64 15.64 10.17

NOCHE3

Estadsticos de contrastea,b NOCHE3 10.088 2 .006

Chi-cuadrado gl Sig. asintt.

a. Prueba de Kruskal-Wallis b. Variable de agrupacin: EDAD

34

Ms de dos muestras relacionadas, prueba de Friedman Se especifica mediante la opcin K Muestras relacionadas . En el ejemplo, las variables de la s tres noches estn formadas por los mismos sujetos, por lo que son relacionadas. Del siguiente modo se comprueba si sus medianas son iguales:

La salida de resultados muestra el nmero de casos, estadstico de contraste X2 , los grados de libertad y el nivel crtico.
Estadsticos de contrastea N Chi-cuadrado gl Sig. asintt. 20 40.000 2 .000

a. Prueba de Friedman

2 El nivel crtico asociado al estadstico X permite rechazar la hiptesis nula de igualdad de medianas en las tres variables.

35

Prctica 9 Contrastes sobre proporciones


Los procedimientos para realizar contrastes sobre proporciones se encuentran dentro del men Analizar > Pruebas no paramtricas .

Contraste sobre Contraste sobre 1 - 2 independientes Contraste sobre 1 - 2 relacionadas Contraste sobre J proporciones relacionadas

El procedimiento particular vara dependiendo del nmero de grupos y de si estn relacionados.

Contraste sobre una proporcin


Este contraste es equivalente a la prueba no paramtrica binomial, vista en la prctica anterior. Por ejemplo, para contrastar la hiptesis de que la proporcin de sujetos que reciben la terapia 2 es 0,60 se indica:
Prueba binomial TERAPIA2 Grupo 2 .00 8 .4

Categora N Prop. observada Prop. de prueba Sig. exacta (unilateral)

Grupo 1 1.00 12 .6 .6 .584


a

Total 20 1.0

a. La hiptesis alternativa establece que la proporcin de casos del primer grupo sea < .6.

El nivel crtico unilateral aparece en la ltima fila de la tabla de resultados. Utilizando = 0,05 no puede rechazarse la hiptesis de que la verdadera proporcin de sujetos que recibe la terapia 2 es 0,60.

36

Contrastes sobre dos proporciones


Dos proporciones independientes Este tipo de contrastes se realizan mediante la prueba 2 sobre igualdad de proporciones, que se comenta en la siguiente prctica. Dos proporciones relacionadas La prueba de McNemar se encuentra disponible en el procedimiento: Analizar > Pruebas no paramtricas > 2 Muestras relacionadas . Por ejemplo, sabemos que los sujetos de esta muestra pueden haber recibido terapia contra el insomnio, as como otras dos terapias contra situaciones de ansiedad generalizada y fobias. Se desea comprobar si los sujetos que reciben la segunda terapia es mas probable que reciban tambin la tercera. Esto indicara que los individuos que presentan un trastorno tienen mayor probabilidad de presentar el otro. El contraste se realiza mediante la el procedimiento Analizar > Pruebas no paramtricas > 2 Muestras relacionadas . El cuadro de dilogo de este procedimiento permite escoger distintas pruebas. En concreto, para realizar la prueba de McNemar sobre las variables Terapia2 y Terapia3 se indica:
Se seleccionan dos variables (en el ejemplo: Terapia 2 y 3). Se desea estudiar si la proporcin de sujetos en ambas es igual o no:

H0 : 1 - 2 = 0 H1 : 1 - 2 0

Sealar la prueba de McNemar; pues es la que contrasta hiptesis sobre 2 prop orciones relacionadas

El visor de resultados muestra la tabla de contingencia de ambas variables y los estadsticos de contraste:
TERAPIA2 y TERAPIA3 TERAPIA3 TERAPIA2 0 1 0 4 5 1 4 7
N Sig. exacta (bilateral) b. Prueba de McNemar Estadsticos de contraste b TERAPIA2 y TERAPIA3 20 1.000 a Resultado del test de la hiptesis. Como p > , se mantiene H0; es decir, no existen diferencias significativas entre la proporcin de sujetos que reciben la terapia 2 y la 3.

a. Se ha usado la distribucin binomial.

37

Ms de dos proporciones relacionadas Para realizar la prueba Q de Cochran con el SPSS se escoge la opcin: Analizar > Pruebas no paramtricas > K Muestras relacionadas . Por ejemplo, si quisiera contrastarse la hiptesis de que la proporcin de sujetos que reciben alguna de las tres terapias es la misma, se indica:

La salida de resultados muestra la distribucin de frecuencias de cada variable y el estadstico de contraste Q:


Frecuencias Valor TERAPIA1 TERAPIA2 TERAPIA3 0 8 8 9 1 12 12 11 Estadsticos de contraste N Q de Cochran gl Sig. asintt. 20 .125a 2 .939 Resultado del contraste de hiptesis. Como p = 0,939 > , se mantiene H0; es decir, no existen diferencias significativas entre las proporciones de sujetos que reciben cada terapia.

a. 0 se trata como un xito.

EJERCICIOS: 1. La proporcin de sujetos que reciben la terapia contra estados de ansiedad generalizada supera el valor 0,55? ( = 0,05) 2. Puede afirmarse que la proporcin de sujetos que recibe la terapia para reducir el insomnio difiere de la que la que recibe la terapia para combatir la ansiedad generalizada? ( = 0,05) 3. Puede afirmarse que al menos mitad de los sujetos han recibido la terapia contra el insomnio? ( = 0,01)

38

Prctica 10 Prueba X de Pearson


2

X2 sobre Bondad de ajuste


Para comprobar el ajuste de la distribucin de frecuencias de una variable discreta a una distribucin terica se utiliza la prueba X2 que se encuentra disponible en Analizar > Pruebas no paramtricas > Prueba Chi-cuadrado . A modo de ejemplo se va a comprobar el ajuste de la variable Edad a una distribucin uniforme. Utilizando el procedimiento Frecuencias puede obtenerse la distribucin de frecuencias de esta variable (H0 : 1 = 2 = 3 ).
EDAD Frecuencia 7 7 6 20 Porcentaje 35.0 35.0 30.0 100.0 Porcentaje vlido 35.0 35.0 30.0 100.0 Porcentaje acumulado 35.0 70.0 100.0

Vlidos

1.00 2.00 3.00 Total

Vemos que hay 7 sujetos en los niveles 1 y 2 de Edad, y 6 en el nivel 3. La distribucin uniforme asume que la frecuencia de sujetos es la misma en todos los niveles de edad. Para comprobar si la desviacin respecto a este supuesto es estadsticamente significativa, se utiliza el procedimiento chi-cuadrado. Al escoger el procedimiento Analizar > Pruebas no paramtricas > Prueba Chi-cuadrado aparece el cuadro de dilogo de la prueba X2 . En el ejemplo se utiliza la variable Edad luego:

Aqu se indican las categoras de la variable. Por ejemplo: 0 y 1.

Aqu se indica la frecuencia mi = n i para cada categora: Por ejemplo 1 = 20 0,4 = 8 2 = 20 0,5 = 10 3 = 20 0,1 = 2 Las frecuencias se introducen en orden ascendente: m 1, m 2 ,... Como en el ejemplo el modelo a contrastar es el uniforme, se selecciona: Todas las categoras iguales

En el ejemplo, se selecciona la variable Edad y la opcin Todas las categoras iguales, que indica que la frecuencia esperada de todos los valores de Edad es la misma, y por tanto que se est comprobando el ajuste a una distribucin uniforme [H0 : f (x ) = M(n = 20, = 1/3)].

39

La salida de resultados muestra una tabla con las frecuencias esperadas, observadas y las residuales (la diferencia entre ambas) y otra con el valor del estadstico de contraste X2 , los grados de libertad y el nivel crtico:
EDAD

ni m i ei = ni m i

N observado N esperado Residual

1.00 7 6.7 .3

2.00 7 6.7 .3

3.00 6 6.7 -.7

Total 20

Estadsticos de contraste EDAD .100 2 .951

Estadstico X 2 =

i =1

2 (nj - m j)

m i

Chi-cuadradoa gl Sig. asintt.

N. crtico [P(X2 0,1) = 0,951] > . Se mantiene H0; Luego la variable edad se distribuye segn el modelo uniforme

a. 0 casillas (.0%) tienen frecuencias esperadas menores que 5. La frecuencia de casilla esperada mnima es 6.7.

Este procedimiento tambin permite comprobar el ajuste a cualquier otra distribucin discreta. Para ello hay que indicar directamente la frecuencia esperada para cada valor. Por ejemplo, si se quiere comprobar que la frecuencia esperada de los niveles 1, 2 y 3 de Edad es 7, 5 y 8 respectivamente [es decir, H0 : f (x ) = M(n = 20, 1 = 0,35, 2 = 0,25, 3 = 0,40)]:

Tablas de contingencia
Las tablas de contingencia contienen la distribucin conjunta de dos o ms variables, y se han estudiado en relacin con los contrastes sobre independencia e igualdad de proporciones. En el SPSS se pueden llevar a cabo mediante el procedimiento Analizar > Estadsticos descriptivos > Tablas de contingencia. Vamos a obtener la tabla de contingencia de las variables Terapia1 y Edad. Esto se indica:

40

La salida de resultados del SPSS muestra la tabla:


Tabla de contingencia TERAPIA1 * EDAD Recuento 1.00 5 2 7 EDAD 2.00 2 5 7 3.00 1 5 6 Total 8 12 20

TERAPIA1 .00 1.00 Total

Cada casilla contiene el nmero observado de sujetos que obtienen un determinado par de valores en Terapia1 y Edad. Por ejemplo, hay 2 sujetos el grupo 1 de Edad y que reciben la terapia1, el nmero total de sujetos en la categora 3 de Edad es 6, etc. Para calcular el valor de X2 (y contrastar la hiptesis H0 : X e Y son independientes) se pulsa en el botn Estadsticos del cuadro de dilogo del procedimiento tablas de contingencia, cuyo aspecto es el siguiente:
Estadstico

X2=

2 ( n ij - m ij )

i =1 j =1

m ij

Otros indicadores de asociacin para dos variables cualitativas: C = X 2 /( X 2 + n) = X 2/n V = X 2 / n (k 1)

41

Este ejemplo se puede interpretar tambin como un contraste de igualdad de proporciones, en el que se compara la distribucin de la variable Terapia1 (variable dicotmica) en cada grupo de Edad (J = 3). El valor del estadstico aparece del siguiente modo en los resultados:
Valor del Estadstico Pruebas de chi-cuadrado Valor .833b .208 .840 gl 1 1 1 Sig. asinttica (bilateral) .361 .648 .359 .374 Sig. exacta (bilateral) Sig. exacta (unilateral) Resultado del test de la hiptesis: mantener H0 luego la variable edad se distribuye igual en cada grupo de terapia1.

X2

Chi-cuadrado de Pearson a Correccin por continuidad Razn de verosimilitud Estadstico exacto de Fisher Asociacin lineal por lineal N de casos vlidos

.650

.325

.792 1 20 a. Calculado slo para una tabla de 2x2.

b. 2 casillas (50.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 4.00.

El valor de X2 est en la primera lnea del cuadro, junto con los grados de libertad y el nivel crtico (P(X2 0,833) = 0,361). Los ndices de asociacin basados en chi-cuadrado aparecen en otra tabla diferente. En este caso puesto que las variables son independientes, estos ndices adoptan valores muy pequeos.
Medidas simtricas

Nominal por nominal N de casos vlidos

Phi V de Cramer Coeficiente de contingencia

Valor .204 .204 .200 20

Sig. aprox. .361 .361 .361

a. Asumiendo la hiptesis alternativa. b. Empleando el error tpico asinttico basado en la hiptesis nula.

Es posible obtener tablas de contingencia con ms de dos variables utilizando la casilla inferior del cuadro de dilogo. Por ejemplo, del siguiente modo se especifica una tabla de contingencia con las variables Edad, Terapia1 y Sexo :

42

La salida de resultados muestra la tabla de contingencia de las tres variables:


Tabla de contingencia TERAPIA1 * EDAD * SEXO Recuento SEXO Mujer 1.00 3 1 4 2 1 3 EDAD 2.00 1 2 3 1 3 4 3.00 1 2 3 3 3 Total 5 5 10 3 7 10

TERAPIA1 Total TERAPIA1 Total

.00 1.00 .00 1.00

Varn

Lo que no permite el procedimiento Tablas de contingencia es realizar el anlisis estadstico de ms de dos variables cualitativas. Dicho anlisis se se lleva a cabo mediante los modelos loglineales y modelos logit .

EJERCICIOS: 1. Uno de los psiclogos del gabinete que est trabajando con estos pacientes con problemas de insomnio opina que, en la poblacin, el 60% de los pacientes son varones. Comprueba esta hiptesis con = 0,05. 2. Obtener la tabla de distribucin conjunta para los pacientes fumadores y no fumadores en la variable edad. Puede afirmarse que existe relacin entre ambas variables con = 0,01? 3. Puede afirmarse que el porcentaje de varones que han recibido a l terapia contra el insomnio es diferente que el porcentaje de mujeres que la han recibido? ( = 0,01) 4. Existe relacin entre las variables fumar y recibir terapia contra el insomnio? ( = 0,05)

43

Das könnte Ihnen auch gefallen