Sie sind auf Seite 1von 55

UNIVERSIDAD PERUANA LOS ANDES

ESCUELA DE POST GRADO

MAESTRIA EN CIENCIAS DE LA SALUD

ESTADISTICA E INFORMATICA APLICADA


Dra. Ing. Iris Carrasco Díaz.
VISION GENERAL DEL SPSS
(Statistical Package for the Social Sciences)

SPSS
Es una herramienta que permite operar bases de datos de gran magnitud y
efectuar estadísticos muy complejos en las investigaciones.

Pasos básicos en el análisis de datos:

Creación de una base de datos desde SPSS o mediante la captura


de los datos desde otro archivo
Selección de las variables para los distintos análisis.
Análisis de los resultados.

Cuando se accede al programa SPSS se activan dos ventanas: el editor de


datos y el visor de resultados.

Luzmila Lourdes Garro


EDITOR DE DATOS
Se activa automáticamente cuando se inicia la
sesión

Barra de menú

Barra de
herramientas

Ingreso de datos

Definen las variables


Barra de menú
Contienen una serie de menús desplegables que controlan las acciones del programa. Se
encuentran situadas en la parte superior de cada ventana.

Archivo Crea nuevos archivos de datos, abre, guarda,


importar y exporta todo tipo de archivos, etc.

Permite (cortar, copiar, pegar, buscar, seleccionar,


Editar reemplazar, etc.) el contenido de un archivo; y
deshacer y rehacer acciones de edición.

Controla el aspecto de las distintas ventanas SPSS


Ver mediante una serie de opciones que permiten
personalizar la barra de herramientas, seleccionar el tipo y
tamaño de las fuentes utilizadas, etc.
Barra de menú
Fusiona archivos de datos, traspone las filas y las
Datos columnas, selecciona parte de un archivo, divide el
archivo en subgrupo, inserta filas o columnas
nuevas, etc.

Crea variables nuevas y cambia los valores de las


Transformar variables ya existentes, tiene una gran cantidad
de funciones.

Analizar Contiene todos los procedimientos estadísticos.

Genera todo tipo de gráficos: de barras, de


Gráfico líneas, de sectores, diagramas de dispersión,
histogramas, gráficos de control de calidad, etc.
Barra de menú

Permite obtener información sobre las


Utilidades variables o sobre el archivo de datos, ejecuta
procesos.

Permite cambiar de una ventana a otra


Ventana dentro del SPSS y minimizar todas las
ventanas abiertas.

Ofrece ayuda general sobre las funciones más


importantes del SPSS y proporciona acceso a la
Ayuda página principal de SPSS en Internet. También
contiene el Tutorial y el Asesor estadístico del
programa.
Barra de herramientas
Contiene íconos de las funciones más utilizadas, permite el acceso rápido a una
serie de funciones en el programa.
Luzmila Lourdes Garro
VISOR DE RESULTADOS
Se habilita al efectuar algún procedimiento de
cálculo

Muestra Muestra los resultados (tablas, gráficos y


los procedimientos en texto) y permite editar y guardar para su
el orden que se efectuaron uso posterior. |
PRUEBAS ESTADÍSTICAS

VARIABLE CUANTITATIVA VARIABLE CUALITATIVA


Discreta Continua Nominal Ordinal

¿Normalidad? ESTADÍSTICA NO
NO
¿Homogeneidad?
PARAMÉTRICA
SI

ESTADÍSTICA
PARAMÉTRICA

Luzmila Lourdes Garro


Normalidad de datos Variable: cuantitativa

Kolmogórov-Smirnov (K- S)→ n ≥ 50 Shapiro- Wilk (S - W) → n ≤ 50


H0: El conjunto de datos se aproximan a una distribución normal.
HIPÓTESIS P > 0,05
Ha: El conjunto de datos no se aproximan a una distribución
normal. Mal ajuste si p < 0,05
En SPSS Analizar > estadísticos descriptivos > explorar > pasar la variable
cuantitativa a lista de dependientes > gráficos con prueba de
normalidad >continuar > aceptar
Pruebas de normalidad

Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
*
edad .091 56 ,200 .985 56 .697

Según la prueba de Kolmogorov-Smirnov la variable edad tiene


distribución normal ya que el valor de p = 0,200 > 0,05 por lo que se
acepta la hipótesis nula, y sigue una distribución normal.
Kolmogórov-Smirnov (K- S)→ n ≥ 50

Regla de decisión: Si p ≤ 0.05 se rechaza Ho y hay diferencia significativa.


Si signific. < 0,05 no sigue la ley normal. Si signific. > 0,05 Sigue la ley normal.
Test de normalidad Shapiro-Wilk Shapiro- Wilk (S - W) → n ≤ 50
Para constrastar la normalidad, vamos a usar el test de Shapiro-Wilk.
El p-valor de ambas variables (0.3219 y 0.2039) se sitúa por encima de 0.05
(p>0,05). Esto significa que aceptamos la hipótesis nula y consideramos que
ambas se distribuyen siguiendo una distribución normal.

Test de homocedasticidad F de Fisher


Para contrastar la homocedasticidad (o igualdad de varianzas), usamos el test
F de Fisher.
El p-valor (0.4461) es mayor que 0.05, aceptando la hipótesis nula de
igualdad de varianzas.
Homogenidad de varianza
Test de Levene

H0: El conjunto de datos tienen varianzas iguales. P > 0,05


HIPÓTESIS
Ha: El conjunto de datos tienen varianzas diferentes. P < 0,05
Analizar > comparar medias > ANOVA de un factor > Pasar la variable
cuantitativa continua a lista de dependientes > y la variable
cualitativa a factor > opciones > prueba de homogeneidad de varianza
En SPSS >continuar > aceptar

Prueba de homogeneidad de varianzas


Edad
Estadístico
de Levene df1 df2 Sig.
.475 12 36 .916

Según la prueba de Levene la variable edad tiene homocestacidad ya que el valor


de p = 0,916 > 0,05 por lo que se falla en rechazar la hipótesis nula. Por lo tanto
la variable edad tiene varianzas iguales.
Regla de decisión: Si p ≤ 0.05 se rechaza Ho y hay diferencia significativa.
Si signific. < 0,05 hay diferencia significativa. Si signific. > 0,05 no hay diferencia de varianzas.
T de student para una muestra
En esta prueba se evalúa la hipótesis nula de que la media de la población
estudiada es igual a un valor especificado
HIPÓTESIS H0: El promedio de las edades de los pacientes que sufren
crisis hiperglicémica es igual de 40 años.
Nivel de
significancia: Ha: El promedio de las edades de los pacientes que sufren
α = 0.05
crisis hiperglicémica es diferente 40 años.
Normalidad: √ Homocestacidad: √

En SPSS
Analizar > comparar medias > prueba T para una media >pasar la variable
edad a variables > valor de la prueba 40 > aceptar
Prueba de muestra única

Valor de prueba = 40

95% de intervalo de
confianza de la diferencia
Sig. Diferencia
t gl (bilateral) de medias Inferior Superior
Edad 8.850 55 .000 18.643 14.42 22.86

Regla de decisión: Si p ≤ 0.05 se rechaza Ho y hay diferencia significativa.


Si signific. < 0,05 hay diferencia significativa. Si signific. > 0,05 no hay diferencia significativa.
T de student para una muestra
PRUEBA T PARA UNA MUESTRA.
Contrasta si la media de una población difiere significativamente de un
valor dado conocido o hipotetizado.

La prueba calcula estadísticos descriptivos para las variables de contraste


junto con la prueba t.

Por defecto, el SPSS incluye el intervalo de confianza del 95% para la


diferencia entre la media de la variable de contraste y el valor
hipotetizado de la prueba.
EL RESULTADO OBTENIDO PONE DE MANIFIESTO QUE LA MEDIA DE LAS COMPETENCIAS
INFORMACIONALES DE NUESTRO GRUPO ES SIGNIFICATIVAMENTE INFERIOR A LA MEDIA
TEÓRICA PUESTO QUE P=0,001, YA QUE LA MEDIA OBTENIDA ES DE 27,9 Y LA MEDIA
TEÓRICA ES DE 30.
T de student para muestras relacionadas
Diferencia pre-post experimental (un grupo de sujetos, 1 sola muestra)

HIPÓTESIS H0: No existe diferencia en el rendimiento académico del área de Ciencia,


Tecnología y Ambiente después de aplicar el programa X. p > 0,05

Nivel de significancia: Ha: Existe diferencia en el rendimiento académico del área de Ciencia,
α = 0.05
Tecnología y Ambiente después de aplicar el programa X. p < 0,05

Normalidad: √ Homocestacidad: √
Analizar > comparar medias > prueba T para muestra relacionada > trasladar
En SPSS
las variables Rendimiento académico antes y después a variable 1 y2>
aceptar
Diferencias emparejadas

Desviación Media de error confianza de la Sig.


Media estándar estándar Inferior Superior t gl (bilateral)
Después del
programa -
5.125 2.139 .338 4.441 5.809 15.156 39 .000
Antes del
programa

Regla de decisión: Si p ≤ 0.05 se rechaza Ho y hay diferencia significativa.


Si signific. < 0,05 hay diferencia significativa. Si signific. > 0,05 no hay diferencia
Antes de aplicar dicho contraste hemos comprobado la Normalidad (prueba de Kolmogorov
con una p de 0,120) de la variable post-test, la cual ha resultado correcta.
PRUEBA T PARA DOS MUESTRAS
RELACIONADAS.
Existe una segunda alternativa para contrastar dos medias. Esta se refiere al
supuesto caso en el que las dos poblaciones no sean independientes, es decir, el
caso en el que se trate de poblaciones relacionadas. Esta situación se encuentra,
por ejemplo, en los diseños apareados,
• Diseños en los que los mismos individuos son observados antes y después de
una determinada intervención PRE_POST INTERVENCIÓN.
• Diseños en los que las muestras son emparejadas de acuerdo a una serie de
variables para controlar su efecto (como, por ejemplo, en los diseños de
CASOS Y CONTROLES).
Para la realización de este análisis, las dos muestras deben estar en dos variables
distintas de la matriz de datos y debe formarse la pareja de muestras antes de
poder añadir la comparación a la lista de variables relacionadas. Por lo tanto,
compara las medias de dos variables en un solo grupo. El resultado incluye
estadísticos descriptivos de las variables que se van a contrastar, la correlación
entre ellas, estadísticos descriptivos de las diferencias emparejadas, la prueba t y
el intervalo de confianza del 95%.
T de student para muestras relacionadas

Regla de decisión: Si p ≤ 0.05 se rechaza Ho y hay diferencia significativa.


Si signific. < 0,05 hay diferencia significativa. Si signific. > 0,05 no hay diferencia
T de student para muestras relacionadas
Para la realización de la prueba t para muestras relacionadas, hemos escogido la variable
TotalTestpre, la puntuación total de cada individuo al inicio del estudio y la variable
TotalTestpro que vuelve a ser la puntuación total de cada individuo pero medida al final de
la formación. Ambas variables se han seleccionado solo para el grupo del colegio público.
Resultados: Partimos de que nuestra hipótesis en este caso es que los resultados del
posttest serán superiores a los resultados del pre-test, puesto que la muestra en el periodo
de tiempo transcurrido entre uno y otro ha pasado por un proceso de formación de
competencias informacionales. Queremos comprobar si hay diferencias significativas entre
ambas puntuaciones.
En primer lugar aparecen los estadísticos propios del análisis. En la parte inferior figura la
diferencia de medias, la desviación típica de las diferencias y el error típico de la diferencia
de medias. A continuación, aparecen los resultados propios del análisis de la t de Student: la
t muestral, los grados de libertad y la probabilidad asociada a la t muestral; y también el
coeficiente de correlación entre las dos variables y su significación.
Comprobamos que en los resultados de nuestro caso sí hay diferencias significativas puesto
que la significación bilateral es menor que 0,05, por lo que concluimos que el programa de
formación recibido por los estudiantes ha mejorado sus competencias. Se ha pasado de
una puntuación de 27,36 en el test inicial a una puntuación de 31,7 en el test final, lo cual
plantea una diferencia significativa.
T de student para muestras independientes
Diseño cuasi experimental (dos grupos)

HIPÓTESIS H0: No existe diferencia en el nivel d comprensión lectora entre el grupo


control y experimental después de aplicar el programa X. P > 0,05

Nivel de significancia: Ha: Existe diferencia en el nivel d comprensión lectora entre el grupo
α = 0.05 control y experimental después de aplicar el programa X. P < 0,05

Normalidad: √ Homocestacidad: √
En SPSS
Analizar > comparar medias > prueba T para muestras independientes >
trasladar las variables a variables a contrastar pretest y post test y a variable
de agrupación grupo (control y experimental) > definir grupos 1 y 2 > aceptar
prueba t para la igualdad de medias
Test Grupo Sig. Diferencia
t gl (bilateral) de medias
control
Pre ,472 38,000 ,639 ,400
experimental
control
Post - 4,117 38,000 0,000 -3,100
experimental

Regla de decisión: Si p ≤ 0.05 se rechaza Ho y hay diferencia significativa.


Fuente: base de datos
Si signific. < 0,05 hay diferencia significativa. Si signific. > 0,05 no hay diferencia
PRUEBA T PARA DOS MUESTRAS
INDEPENDIENTES.
Esta opción debe utilizarse cuando la comparación se realice entre las
medias de dos poblaciones independientes (los individuos de una de las
poblaciones son distintos a los individuos de la otra) como, por ejemplo,
en el caso de la comparación de las poblaciones de hombres y mujeres.
Por lo tanto, compara las medias de una variable para dos grupos de
casos.
La matriz de datos debe estar configurada como es habitual, es decir,
existe una columna para los datos de la variable de interés y una segunda
columna con los códigos que definen las poblaciones objeto de
comparación. La prueba calcula estadísticos descriptivos para cada grupo
además de la prueba de Levene para la igualdad de varianzas, así como
los valores de t para varianzas iguales y desiguales y el intervalo de
confianza del 95% para la diferencia de medias.
T de student para muestras
independientes

Regla de decisión: Si p ≤ 0.05 se rechaza Ho y hay diferencia significativa.


Si signific. < 0,05 hay diferencia significativa. Si signific. > 0,05 no hay diferencia
Antes de analizar los resultados del contraste de la diferencia de medias, es conveniente detenerse para
valorar la comparación de las varianzas de ambos grupos (basándose en el estadístico F de Snedecor) a
través de la prueba de Levene. La prueba de Levene debe arrojar una significación mayor de 0,05 (0,352 >
0,05) para que se cumpla el requisito de homocedasticidad (expresado en la tabla como “se han asumido
varianzas iguales” a través del estadístico F). Una vez comprobado este dato nos fijamos en la significación
bilateral de la prueba t, el cual es igual a 0,309 y, por lo tanto, mayor que 0,05, con lo cual no se cumple la
hipótesis alternativa, lo que viene a decir que no hay diferencias significativas en cuanto a hombres y
mujeres respecto a las puntuaciones obtenidas en el test de competencias. O dicho de otra forma, el sexo
no influye en las competencias informacionales.
ANOVA
Comparar más de dos grupos(variable cuantitativa)
H0: No existe diferencia significativa entre las diferentes
HIPÓTESIS estrategias.
Nivel de significancia: Ha: Existe diferencia significativa entre las diferentes estrategias. .
α = 0.05

Normalidad: √ Homocestacidad: √

Analizar > comparar medias > medias > trasladar las variables Calificación de estrategias a dependientes y tipo a lista
En SPSS de independiente> opciones > trasladar estadísticos > continuar > aceptar

1
Informe Paso
Rendimiento
académico

Error
estánda
Desviación r de la
Tecnicas N Media estándar Mínimo Máximo media
Estrategia A 12 7.33 3.473 3 15 1.003
Estrategia B 12 13.00 3.977 7 19 1.148
Estrategia C 12 15.83 2.167 12 19 .626
Total 36 12.06 4.804 3 19 .801
ANOVA

2
Paso
ANOVA
3
Paso
U de Mann Whitney
Comparación de dos muestras independientes (nivel ordinal de la variable)

H0: No existe diferencia en el rendimiento académico del grupo


HIPÓTESIS
control y experimental después del programa x

Nivel de significancia: Ha: Existe diferencia en el rendimiento académico del grupo


α = 0.05 control y experimental después del programa x

En SPSS Analizar > pruebas no paramétricas > cuadro de diálogos > dos muestras
independientes > trasladar las variables > definir grupos > aceptar

En el pretest las condiciones


iniciales son iguales

En el postest hay
diferencia del grupo
control y experimental
(nivel ordinal de la variable)
Se acepta la H1, que significa que la experiencia docente influye en la
utilidad que el profesorado atribuye a las TIC en la enseñanza (sig. 0,005
< 0,05). El profesorado que tiene menos de 5 años de experiencia las
considera más útiles.
Wilcoxon
Diferencia entre dos mediciones (nivel ordinal de la variable)

H0: No existe diferencia en el rendimiento académico antes y


HIPÓTESIS
después del programa x

Nivel de significancia: Ha: Existe diferencia en el rendimiento académico antes y después


α = 0.05 del programa x

En SPSS Analizar > pruebas no paramétricas > cuadro de diálogos > dos muestras
relacionadas > trasladar las variables > aceptar
Wilcoxon

(nivel ordinal de la variable)


Se acepta la H1, por lo que concluimos que hay diferencias en la valoración que los
docentes hacen de la utilidad de las TIC en la enseñanza entre antes y después de la
implantación del EEES (sig.0,001<0,05). El profesorado consideraba más útiles las TIC en la
enseñanza antes de la implantación del EEES (23,91).
H de Kruskal Wallis
Comparación de dos muestras independientes (nivel ordinal de la variable)

H0: El uso de estrategias de enseñanza no es diferente a la


HIPÓTESIS
enseñanza tradicional.

Nivel de significancia: Ha: El uso de estrategias de enseñanza es diferente a la enseñanza


α = 0.05 tradicional.

En SPSS Analizar > pruebas no paramétricas > cuadro de diálogo antiguos > K muestras
independientes > trasladar las variables > definir grupos > valor mínimo 1 y
valor máximo 2 (si son 2 muestras) > aceptar

Estadísticos de pruebaa,b
Estrategias de enseñanza Enseñanza tradicional
Chi-cuadrado 15.114 7.497
gl 3 3
Sig. asintótica .002 .058
a. Prueba de Kruskal Wallis
b. Variable de agrupación: Secciones
Wilcoxon

(nivel ordinal de la variable)


Se acepta la H1 y se concluye que el área de estudio a la que pertenece el profesorado
influye en la utilidad que le atribuya a las TIC en la enseñanza (sig. 0,000<0,05). El
profesorado de las áreas de ciencias naturales (52,98) y de las áreas técnicas (56,50)
considera que las TIC son más útiles que el resto de profesorado.
rho de Spearman
Relación de variables ( cualitativa - ordinal)

H0:No Existe relación significativa entre la estrategia de promoción


HIPÓTESIS
y el fortalecimiento de la capacidad empresarial exportadora.

Nivel de significancia: Ha: Existe relación significativa entre la estrategia de promoción y


α = 0.05
el fortalecimiento de la capacidad empresarial exportadora.

En SPSS Analizar > Correlaciones > bivariadas > seleccionar Spearman >
trasladar las variables > aceptar

Correlaciones
Fortalecimiento
Estrategia de de la capacidad
promoción empresarial
exportadora
Coeficiente de
1.000 ,725**
Estrategia de correlación
promoción Sig. (bilateral) .000
Rho de N 84 84
Spearman Fortalecimiento Coeficiente de
,725** 1.000
de la capacidad correlación
empresarial Sig. (bilateral) .000
exportadora N 84 84
Fuente: elaboración propia del autor
r de Pearson
Relación de variables ( cuantitativa - ordinal)

HIPÓTESIS H0: No Existe relación significativa entre el puntaje obtenido por


los alumnos del V ciclo de educación primaria, en comprensión de
lectura y solución de problemas matemáticos .
Nivel de significancia:
α = 0.05 Ha: Existe relación significativa entre el puntaje obtenido por los
alumnos del V ciclo de educación primaria, en comprensión de
lectura y solución de problemas matemáticos .
En SPSS Analizar > Correlaciones > bivariadas > seleccionar pearson >
trasladar las variables > aceptar
Resolución de
Comprensión problemas
lectora matemático
Correlación de 1 ,888**
Comprensión Pearson
lectora Sig. (bilateral) .000
N 60 60
Correlación de ,888** 1
Solución de Pearson
problemas Sig. (bilateral) .000
matematico
N 60 60
Prueba Chi - Cuadrado
Asociación de variables ( nominal u ordinal)

HIPÓTESIS H0: El rendimiento académico no esta asociado con la autoestima.

Nivel de significancia: Ha: El rendimiento académico esta asociado con la autoestima.


α = 0.05

Analizar > estadísticos descriptivos > tabla de contingencia > trasladar las
En SPSS
variables > estadísticos > Chi cuadrado > continuar > fila > continuar > Aceptar
( nominal u ordinal)
No se rechaza la Ho, lo que significa que no hay relación entre el sexo y
los años de experiencia docente (sig.0,361> 0,05).
Prueba de Friedman (k muestras relacionadas)
No se rechaza la Ho y se concluye que el profesorado considera igual de
útiles las TIC en la docencia, en el aprendizaje y en la gestión
(sig.0,417>0,05).

Das könnte Ihnen auch gefallen