Beruflich Dokumente
Kultur Dokumente
DE SPSS
Laboratorio de Psicologa
Instituto de Psicologa
Universidad del Valle
0
Pgina
Contenido
1
Pgina
Captulo 1: Introduccin al SPSS
El Statistical Package for the Social Sciences (SPSS) 1 es un programa informtico diseado
para realizar anlisis estadsticos, tanto a nivel descriptivo como a nivel inferencial muy
usado en las ciencias sociales. Este programa permite realizar anlisis y grficos
estadsticos sin tener que conocer la mecnica de los clculos ni la sintaxis de los comandos
del sistema, facilitando el procesamiento de datos.
Para ingresar al programa puede hacerlo de dos formas (Figura 1 y Figura 2):
1)
Haciendo Clic en el
cono de acceso
directo que se
encuentra en el
escritorio de su
computador
IBM SPSS
Statistics 23
1
Esta gua fue realizada con la versin 23 de IBM Statistics SPSS, sin embargo, la estructura y
funciones del programa son similares a la de versiones anteriores.
2) Luego, clic en Todas las
aplicaciones o Todos los programas
1) Haz clic en el botn
Inicio (Dependiendo el tipo de sistema
operativo del ordenador
3) Busque y seleccione
la opcin IBM SPSS
Statistics
4) Finalmente, busque y
seleccione la opcin IBM
SPSS Statistics 23
4
Pgina
La versin 23 de SPSS y las anteriores cuentan con opciones de ayuda para facilitar el uso del
programa. Se pueden llevar a cabo diferentes tutoriales de los que se encuentran en las Guas de
aprendizaje para informarse mejor sobre las posibilidades en el procesamiento de datos que tienen el
software. Basta con escoger la opcin que sea de inters profundizar, dar clic en el botn Aceptar y
SPSS lo redirigir a la pgina web del programa para que pueda obtener mayor asistencia. (Figura 6)
5
Pgina
Figura 6: Guas de aprendizaje de SPSS
6
Pgina
Adems de la hoja de SPSS, otra de las ventanas que se despliega es el visor de resultados (Figura 9).
En l se muestran todas las operaciones que se han realizado en el programa durante el tiempo que se lo
ha usado.
7
Pgina
Existen varias maneras de ingresar archivos en SPSS, dos de las ms usadas son: a) la importacin de
archivos desde Excel (Figura 10) y b) el ingreso directamente al editor (desde un archivo anterior o
desde la creacin de un nuevo archivo).
8
Pgina
Antes de abrir el archivo se debe tener en cuenta que es posible que la base de datos tenga varias hojas
de clculo, por lo que se debe seleccionar la hoja en la cual estn los datos que desea importar. Por
ejemplo, en la Figura 11 se escogi la Hoja 1 de la base de datos Base Sumas Taller 2 SPSS. Despus
de esto se debe dar clic en Aceptar.
9
Pgina
Figura 12: Seleccin de hoja de clculo de Excel que se importar a SPSS.
10
Pgina
La longitud del nombre no debe exceder los 64 caracteres (8 caracteres en la versin 11y
anteriores)
Cada nombre de variable debe ser nico; no se permiten duplicados. Los nombres de variables
no distinguen maysculas de minsculas.
Debe comenzar con una letra. Los dems caracteres pueden ser letras, dgitos, puntos o los
smbolos @, #, _ $.
Los nombres de variables no pueden terminar en punto
Se deben evitar los nombres de variable que terminan con subrayado (para evitar conflictos con
las variables creadas automticamente por algunos procedimientos).
No se pueden utilizar espacios en blanco ni caracteres especiales (por ejemplo, , !, *)
No pueden utilizarse las palabras: ALL, LT, AND, NE, BY, NOT, EQ, OR, GE, TO, GT,
WITH, LE.
El archivo no debe tener negrilla.
Ni las celdas ni las letras y/o nmeros de la base de datos deben tener colores.
Es recomendable que los datos perdidos (missing) tengan un cdigo en la base de Excel.
El archivo debe tener el mismo color de fuente (negro) y adems el mismo formato.
Es necesario que la primera fila sea la nica con los nombres de las variables y no haya celdas
combinadas.
11
Pgina
Captulo 3: Vistas de SPSS
En la vista de datos (Figura 12) de SPSS se ingresan los datos con los que se construir la base. Esta
vista, como se mencion antes tiene apariencia similar a una base de datos de Excel. Sin embargo,
las casillas del editor de datos no pueden contener frmulas. Aqu las filas representan casos y las
columnas variables.
12
Pgina
Figura 15: Vista de variables
La vista de variables (Figura 16) contiene descripciones de los atributos o caractersticas de cada
variable del archivo de datos. En este punto (Figura 14) las filas corresponden a las variables y las
columnas son los atributos o caractersticas de las variables.
La columna Tipo especifica el tipo datos que contiene la variable. Los valores de estas variables, en
funcin del tipo seleccionado sern visualizados segn un patrn determinado y slo
estarn disponibles para estas variables aquellas operaciones que son esperables para el tipo de que
13
se trate en cada caso. Las opciones que se presentan en esta columna son las siguientes:
Pgina
Figura 17: Tipo de Variable
Numrico. Variable cuyos valores son nmeros. Los valores se muestran en el formato
numrico estndar, utilizando los delimitadores decimales especificados en la
Configuracin Regional del Panel de control.
Coma. Define una variable numrica cuyos valores se muestran con comas de separacin
cada tres posiciones y con un punto como separador de la parte decimal. El editor de datos
acepta los valores numricos para las variables con comas con o sin las comas.
Punto. Define una variable numrica cuyos valores se muestran con puntos de separacin
cada tres posiciones y con una coma como separador de la parte decimal.
Notacin cientfica. Define una variable numrica cuyos valores se muestran con una E
intercalada y un exponente con signo que representa una potencia de base diez. El editor de
datos acepta para estas variables valores numricos con o sin el exponente. El exponente
puede ir precedido de E o D con un signo opcional, o por el signo solamente. Por ejemplo,
123, 1,23E2, 1,23D2, 1,23E+2, o incluso 1,23+2.
Fecha. Es una variable numrica cuyos valores se muestran en uno de los diferentes
formatos de fecha-calendario u hora-reloj. Seleccione una plantilla de la lista desplegable.
Puede introducir las fechas utilizando como delimitadores: barras, guiones, puntos, comas o
14
espacios en blanco. El rango de siglo para los aos de dos dgitos se toma de las opciones de
Pgina
15
Pgina
Figura 18: Etiquetas del valor
La columna Perdidos Se trata de valores que no son considerados a la hora de realizar
determinados anlisis estadsticos. Los valores perdidos pueden ser:
La columna Columnas modifica el ancho de la columna en la que se presentan los datos. Los anchos
de columna tambin se pueden cambiar en la Vista de datos pulsando y arrastrando los bordes de la
columna.
La columna Alineacin Controla la presentacin de los valores de los datos y/o de las etiquetas de
valor en la Vista de datos. La alineacin por defecto es derecha para las variables numricas e
izquierda para las variables de cadena. Esta configuracin afecta slo a la presentacin en la Vista
de datos
Los porcentajes son medidas relativas que establecen una relacin de parte-todo (que siempre es 100) y
permiten comparar grupos de diferente tamao (N).
Estos se calculan usualmente como:
Pi = (Ni/N)*100
Pi = es el porcentaje de la i-sima categora
Ni = es la frecuencia absoluta de la i-sima categora
N = corresponde al nmero total de elementos o base
Por ejemplo, si se tiene una muestra de 40 personas -40 podra ser nuestro N- y 30 de ellas son mujeres y
10 hombres, para determinar el porcentaje de las primeras en el grupo, entonces se tiene que:
N = 40
N1 = 30 (la categora 1 corresponde a mujeres)
N2 = 10 (la categora 2 corresponde a hombres)
Entonces:
P1 (porcentaje de mujeres) = (N1/N)*100 = (30/40)*100 = 75%
Los resultados muestran que el 75% de los sujetos del grupo son mujeres.
As que:
P2 (porcentaje de hombres) = (N2/N)*100 = (10/40)*100 = 25%
El 25% son hombres.
Podemos suponer que tenemos datos sobre los 40 sujetos, por ejemplo, tenemos su orientacin poltica
as:
19
Pgina
Tabla 1:
Frecuencias absolutas de orientacin poltica y gnero
En este caso, si se quiere averiguar la distribucin de la orientacin poltica en las mujeres tengo que:
Pj/i (porcentaje de categora j en la categora i) = (Nj/i / Ni)*100
P1/1 (porcentaje de izquierda 1 dado que se es mujer 1 )= (20/30)*100 = 66,6%
P2/1 (porcentaje de centro 2 dado que se es mujer 1 )= (5/30)*100 = 16,7%
P3/1 (porcentaje de derecha 2 dado que se es mujer 1 = (5/30)*100 = 16,7%
En el caso de los hombres:
P1/2 (porcentaje de izquierda 1 dado que se es hombre 2 )= (0/10)*100 = 0%
P2/2 (porcentaje de centro 2 dado que se es hombre 2 )= (5/10)*100 = 50%
P3/2 (porcentaje de derecha 2 dado que se es hombre 2 )5/10)*100 = 50%
En este ejemplo hemos cambiado la base sobre la que se calcula el porcentaje. En el primer caso la base
era 40 (# de sujetos); para los clculos de hombre y mujer hemos usado como base 30 (# de mujeres) y 10
(# de hombres). Esto sugiere que debemos tener cuidado sobre la base que se ha tomado para poder
interpretar los datos.
20
SPSS brinda diversas maneras de calcular y representar porcentajes. La primera forma se trata de la
Pgina
funcin Frecuencias.
Forma 1
Se calcular la distribucin de las variables sociodemogrficas presentes en la base 002 14 FEBRERO
2016, para lo cual se deben seleccionar las opciones Analizar > Estadsticos descriptivos > Frecuencias Comentario [JCBB1]: Hay que
cambiar esta por la base de datos
(Figura 19) chilena, ya que no se tiene
autorizacin para dejar esta en la base
de datos general. Por lo tanto, algunos
pantallazos no se pueden usar.
Una vez seleccionada la funcin, aparecer el cuadro de dilogo Frecuencias (ver Figura 2), en cual se
seleccionar la(s) variable(s) a la(s) cual(es) se le(s) desea realizar el anlisis de frecuencias y porcentajes.
La forma de hacerlo es arrastrando la variable, de la lista de las variables, al cuadro del lado derecho
Variables. Igualmente, se debe seleccionar la opcin Mostrar tablas de frecuencias para que los
resultados incluyan la tabla con el anlisis de frecuencia. Si se quiere generar en el mismo paso un grfico,
se puede seleccionar la opcin Grficos y aparecer la interfaz Frecuencias: Grficos (ver Figura 20)
21Pgina
Figura 20. A: Funcin Frecuencias para representar las variables municipio, tipo de encuesta, sexo,
edad, estrato socioeconmico y educacin. B: Funcin Frecuencia: Grficos.
Las opciones de grficos propuestas corresponden a Ninguna -sugiere que no se realizar un grfico-
Grficos de barras, Grficos de sectores e Histogramas. Para el caso de la variables nominales y
ordinales analizadas, los grficos adecuados son las barras y los sectores (en este caso, se escogen las
barras). Para establecer qu representarn las barras se encuentra la opcin Valores del grfico que
muestra las opciones: Frecuencias -conteo del nmero de casos - y Porcentajes -representa la relacin
(Ni/N)*100, donde N es el nmero total de casos observados en la variable seleccionada. Usualmente,
el estadstico que se trabaja es el porcentaje. Para finalizar se selecciona Continuar y Aceptar.
Como resultado de la operacin se genera un nuevo archivo Resultados 1 donde aparecern ocho tablas y
siete grficos:
22
Pgina
Figura 21. Hoja de resultados con las tablas y grficas generadas mediante la funcin Frecuencias
La primera tabla que se encuentra en la hoja de resultados es la llamada Estadstico. En esta se presenta el
nmero de casos Validos, que corresponde al nmero de casos en los que se tiene informacin, si no hay
informacin se considera un dato Perdido. Para cada una de las variables analizadas hay 1917 casos
(sujetos) con informacin y no se presentan casos perdidos.
Tabla 2:
Estadsticos de las variables municipio, tipo de encuesta, sexo, edad, estrato socioeconmico, educacin
terminada.
23
Pgina
La dems tablas muestran la frecuencia de cada categora (Ni) y el porcentaje (Pi). En la columna
Porcentaje Vlido se reporta el valor porcentual a partir de los casos en los que se posee informacin y
Porcentaje se tiene en cuenta la cantidad de valores perdidos. Para la variable Municipio, por ejemplo, el
nmero de casos (1917) no difiere del nmero de casos vlidos (1917), por lo que los porcentajes son
iguales en ambas columnas (ver Tabla 3). Sin embargo, si se tuvieran (16) casos perdidos los clculos de
la columna Porcentaje seran diferentes a los de Porcentaje vlido, ya que se el valor en la primera se
calculara sobre el total de casos, mientras que en la segunda sobre 1901 (ver Tabla 4). La columna
Porcentaje acumulado solo se aplica para las variables que tienen orden (ordinales y escala).
Tabla 3:
Distribucin de los municipios sin casos perdidos.
24
Pgina
Tabla 4:
Distribucin de los municipios con casos perdidos.
Forma 2:
El ejemplo anterior aplica cuando se calculan los porcentajes de una sola variable, pero en algunos casos
se puede hacer cruces de variables para establecer relaciones entre las variables, para ello se usar la
funcin Tablas Personalizadas. Para lo cual se seleccionar la ruta Analizar > Tablas > Tablas
personalizadas...
25
Por ejemplo, para cruzar Educacin terminada y los guerrilleros son vctimas del conflicto armado. Se
puede arrastrar la Educacin terminada a la opcin Filas y los guerrilleros son vctimas del conflicto
armado A las columnas
26
Pgina
Figura 24. Seleccin de las variables en las filas y columnas
Una vez seleccionadas las dos variables la interfaz mostrar una tabla con filas y columnas con el
Recuento como estadstico, como la intencin es poder comparar la Educacin terminada y los
guerrilleros son vctimas del conflicto armado, se recomienda el uso del porcentaje. Para ello se debe
activar la opcin Definir N% Estadsticos de resumen (si la opcin no se encuentra activa, se puede
seleccionar con el cursor el Gnero, la tabla se coloreara de amarillo y se resaltara con amarillo la opcin
Recuento).
27
Pgina
Figura 26. Interfaz de Estadsticos de resumen
En la interfaz aparece la opcin Estadsticos, con una lista de posibles anlisis estadsticos, en la derecha
se observa la opcin Visualizacin que muestra el estadstico Recuento activo. A su vez en la tabla
aparecer como etiqueta Recuento y el formato de nmeros enteros (nnnn) con 0 decimales. Para
seleccionar el porcentaje se debe buscar en la lista de Estadsticos la opcin de % del N de fila (en este
caso se selecciona la fila para que el programa calcule los porcentajes de cada nivel de Educacin
terminada para calcular el N de cada nivel de educacin). Una vez seleccionado el % del N de fila se da
clic en Aplicar a seleccin y luego Aceptar.
28
Pgina
Figura 27. Interfaz de Estadsticos de resumen
Como resultado se genera una tabla que cruza las variables Educacin terminada y los guerrilleros son
vctimas del conflicto armado, que permite observar la relacin entra las dos y comparar entre el nivel de
educacin. En la tabla se puede notar que la sumatoria de los porcentajes en las fila de cada una de los
niveles de la variable EDUCACIN TERMINADA debe dar 100%. Por ejemplo la sumatoria de los
porcentajes en la fila de NINGUNA es 100% (36.7+ 22.4+ 24.5+ 14.3+ 2.0= 99.9%, por aproximacin
100%). Esto mismo calcula el programa en los otros niveles de la variable (PRIMARIA,
BACHILLERATO, TCNICO/TECNOLGICO, PROFESIONAL, POSTGRADO, NS/NR ) debido a
que seleccionamos % del N de fila para calcular los porcentajes de cada fila.
Tabla 5: Cruce de variables educacin terminada y los guerrilleros son vctimas del conflicto armado
Una forma alternativa de realizar el cruce entre dos variables es a travs de la opcin Analizar>
Estadsticos descriptivos > tablas cruzadas
29
Pgina
Figura 28. Tablas Cruzadas
En la interfaz de tablas cruzadas, deber seleccionar una variable para las filas, en este caso Educacin
terminada y una variable para las columnas para el anlisis en curso los guerrilleros son vctimas del
conflicto armado. Esta opcin elaborar una tabla, las filas correspondern a los niveles que toma la
variable Educacin terminada ((PRIMARIA, BACHILLERATO, TCNICO/TECNOLGICO,
PROFESIONAL, POSTGRADO, NS/NR ), y en las columnas se observa los niveles que toma la variable
los guerrilleros son vctimas del conflicto armado (Totalmente en desacuerdo, desacuerdo, de acuerdo,
completamente de acuerdo, NS/NR), es decir, es una tabla cruzada de 6 x 5, seis valores en la variable de
las filas y cinco valores en la variable de la columna.
Para finalizar seleccionamos Mostrar los grficos de barras agrupadas, lo cual nos presentara el grfico
de frecuencias y seleccionamos Aceptar
31
Tabla 6:
Resumen de procesamiento de casos en tablas cruzadas
Tabla 7:
Tabla cruzada educacin terminada y los guerrilleros son vctimas del conflicto armado
Otro ejemplo de tablas personalizadas sera, cruzar Los guerrilleros son vctimas del conflicto armado y
Los soldados del Ejrcito Colombiano son vctimas del conflicto armado. Se puede arrastrar Los
guerrilleros son vctimas del conflicto armado a la opcin Filas y Los soldados del Ejrcito Colombiano
son vctimas del conflicto armado a las columnas 32
Pgina
Figura 32. Seleccin de las variables en las filas y columnas
Una vez seleccionadas las dos variables la interfaz mostrar una tabla con filas y columnas con el
Recuento como estadstico. Como la intencin es poder comparar la Los guerrilleros son vctimas del
conflicto armado y Los soldados del Ejrcito Colombiano son vctimas del conflicto armado, se
recomienda el uso del porcentaje. Para ello se debe activar la opcin Definir N% Estadsticos de resumen
(si la opcin no se encuentra activa, se puede seleccionar con el cursor la variable de la fila y en la tabla se
colorer de amarillo la opcin Recuento).
33
Pgina
Como resultado se genera una tabla que cruza las variables Los guerrilleros son vctimas del conflicto
armado y Los soldados del Ejrcito Colombiano son vctimas del conflicto armado, que permite
observar la relacin entra las dos y comparar. En la tabla se puede notar que la sumatoria de los
porcentajes en las fila de cada una de los niveles de la variable Los guerrilleros son vctimas del
34
conflicto armado debe dar 100%. Por ejemplo la sumatoria de los porcentajes en la fila de
Pgina
COMPLETAMENTE EN DESACUERDO es 100% (64.2+ 12.5+ 6.9+ 14.7+ 1.7= 100%). Esto mismo
calcula el programa en los otros niveles de la variable.
Tabla 8:
Cruce de las variables Los guerrilleros son vctimas del conflicto armado y Los soldados del Ejrcito
Colombiano son vctimas del conflicto armado
Otra forma de representar el cruce de dos variables es a travs de grficos, para ellos se puede seguir la
ruta Grficos > Generador de Grficos
El grfico tendr 3 cuadros con lneas punteadas que definirn las caractersticas del grfico final Eje
x?, Agrupar en X: establecer color y Eje y?, en el primero Eje x? se seleccionar la variable principal
que se desea comparar en este caso SEXO, para ello s arrastra la Variables al recuadro, esta seleccin
genera que el eje x del grafico se divida en cuatro grupos de barras, Masculino, Femenino, Otros y
NS/NR. Una vez seleccionada la variable principal (Sexo) se seleccionara la variable a comparar (Puedo
tener como vecino a una persona desmovilizada de la guerrilla) y se desplaza Agrupar en X, est
seleccin har que cada SEXO (Masculino, Femenino, Otros y NS/NR) se produzcan barras e Igualmente
para los valores de la variable Puedo tener como vecino a una persona desmovilizada de la guerrilla.
36
Pgina
Al desplegar la pestaa Denominador para calcular el porcentaje se pueden observar tres opciones:
Total global, Total para cada categora del eje X, y Total para cada categora de la variable de la
leyenda. Si se selecciona Total global los porcentajes se calcularan sobre el nmero total de casos; en
Total para cada categora del eje X, como habamos seleccionado la variable Sexo para el eje X, los
porcentajes se calcularan sobre cada categora de la variable sexo, en este caso Femenino (100%)
masculino (100%) Otros (100%) y NS/NR (100%). Finalmente, si se selecciona Total para cada
categora de la variable de la leyenda los porcentajes se calculan sobre los valores de la variable
Puedo tener como vecino a una persona desmovilizada de la guerrilla. Como intentamos comparar
los Sexos, seleccionamos la opcin Total para cada categora del eje X .
37
Pgina
Figura 39. Denominador para calcular el porcentaje
Generando:
Grfico 1. Cruce entre sexo y Puedo tener como vecino a una persona desmovilizada de la guerrilla
Grfico 2. Cruce entre educacin terminada y Los guerrilleros sin vctimas del conflicto armado
39
Pgina
Generador de grficos de barras apiladas
Cruce de EDUCACIN TERMINADA vs Puedo tener como vecino a una persona desmovilizada de la
guerrilla, para ellos se puede seguir la ruta Grficos > Generador de Grficos.
El grfico tendr 3 cuadros con lneas punteadas que definirn las caractersticas del grfico final Eje
40
x?, Agrupar en X: establecer color y Eje y?, en el primero Eje x? se seleccionar la variable principal
Pgina
que se desea comparar en este caso EDUCACIN TERMINADA, para ello se arrastra la Variables al
recuadro. Esta seleccin genera que el eje x del grfico se divida en seis grupos de barras, primaria,
bachillerato, tcnico/tecnolgico, profesional, postgrado, ns/nr. Una vez seleccionada la variable principal
(Educacin Terminada) se seleccionara la variable a comparar (Puedo tener como vecino a una persona
desmovilizada de la guerrilla) y se desplaza Agrupar en X, est seleccin har que cada categora de la
Educacin Terminada (primaria, bachillerato, tcnico/tecnolgico, profesional, postgrado, ns/n) se
produzcan barras e Igualmente para los valores de la variable Puedo tener como vecino a una persona
desmovilizada de la guerrilla.
Como se puede ver en la Figura 24 en el eje Y aparece el estadstico Recuento, esto quiere decir que el
grfico presenta las frecuencias absolutas o frecuencia de ocurrencia, para comparar vamos a usar los
porcentajes. Para que el grfico represente los porcentajes se utiliza la interfaz Propiedades del
elemento y desplegamos Estadsticos y seleccionamos Porcentaje (?), esto activara la opcin Establecer
parmetros. Al seleccionar Establecer parmetros se activara el cuadro Propiedades del elemento:
Establecer parmetros.
41
Pgina
Figura 44. Propiedades del elemento
Al desplegar la pestaa Denominador para calcular el porcentaje se pueden observar tres opciones:
Total global, Total para cada categora del eje X, y Total para cada categora de la variable de la
leyenda. Si se selecciona Total global los porcentajes se calcularan sobre el nmero total de casos; en
Total para cada categora del eje X, como habamos seleccionado la variable EDUCACIN
TERMINADA, para el eje X, los porcentajes se calcularan sobre cada categora de la variable, en este
caso primaria (100%), bachillerato (100%), tcnico/tecnolgico (100%), profesional (100%), postgrado
(100%), ns/nr (100%). Finalmente, si se selecciona Total para cada categora de la variable de la
leyenda los porcentajes se calculan sobre los valores de la variable Puedo tener como vecino a una
persona desmovilizada de la guerrilla. Como intentamos comparar los niveles de educacin,
seleccionamos la opcin Total para cada categora del eje X
42
Pgina
Figura 45. Denominador para calcular el porcentaje
Finalmente se sigue la ruta Continuar > Aplicar > Aceptar.
Generando:
43
Pgina
Grfico 2. Cruce entre Educacin alcanzada y Puedo tener como vecino a una persona desmovilizada de
la guerrilla
44
Pgina
Captulo 5: Segmentar archivo
SPSS tambin permite realizar anlisis de datos dividiendo el archivo segn la variable que se defina, de
esta manera se obtienen estadsticos diferenciados para cada uno los niveles de la variable de inters. Para
hacer esto se debe ingresar en la opcin Datos Segmentar archivo.
Al seleccionar Segmentar archivo, se abre una interfaz en la que aparece al lado derecho los nombres de
variables con las que se est trabajando y al lado izquierdo tres opciones: Analizar todos los casos, no
crear grupos; Comparar los grupos y Organizar los resultados por grupos. Como es de inters ver la
opinin con respecto a proposicin Los guerrilleros son vctimas del conflicto armado en funcin de la
Educacin, se selecciona la segunda opcin y se arrastra al recuadro Grupos basados en: la variable
Educacin terminada. Finalmente se da clic en Aceptar. 45
Pgina
Figura 48. Interfaz de la segmentacin del archivo.
Cuando se ha realizado esto, se puede proceder a analizar la opinin con respecto a Los guerrilleros son
vctimas del conflicto armado, para lo que se puede emplear la opcin Analizar Estadsticos
Descriptivos Frecuencias.
Figura 49. Estadsticos de la proposicin Los guerrilleros son vctimas del conflicto armado
Un vez realizada el anlisis, en la hoja de resultados se muestran los anlisis para cada nivel de la variable
EDUCACIN TERMINADA en una seccin de la tabla (ver Tabla 8) y en un grfico aparte (ver Figura
31).
46
Tabla 8: Opinin con respecto a Los guerrilleros son vctimas del conflicto armado para cada nivel de
Pgina
educacin terminada.
Pgina
47
48
Pgina
Figura 50. Grficos de opinin sobre la proposicin Los guerrilleros son vctimas del conflicto armado
Captulo 6: Transformar: Recodificar variables
Mediante esta funcin SPSS permite reemplazar los valores iniciales de una variable por otros, dando dos
opciones para hacerlo: Recodificar en la misma variable y Recodificar en distintas variables. En la
primera opcin, el programa modifica los datos dentro de la misma variable reemplazando los antiguos
por los que se le indican, mientras que en la segunda, crea una nueva variable en la que se asignan valores
nuevos teniendo en cuenta los viejos. Cuando no se quiere perder la informacin inicial, es recomendable
usar la segunda opcin de recodificacin. El procedimiento a seguir en SPSS es el siguiente:
Transformar Recodificar en distintas variables y se da clic en la opcin.
En este caso se reemplazarn los valores de las variables Los guerrilleros son vctimas del conflicto
49
Figura 52. Reemplazo de los valores de Los guerrilleros son vctimas del conflicto armado y Las vctimas
tienen responsabilidad en el proceso de reconciliacin
Para iniciar, se deben pasar de la lista del lado izquierdo al cuadro Variable numrica -> Variable de
resultado las variables que se desean recodificar, asignarles nombre en donde dice Variable de resultado
(la etiqueta es opcional) y dar clic en cambiar. Finalizado este procedimiento, se ingresa en el botn
valores antiguos y nuevos y se indican cmo sern reemplazados los valores.
50
Pgina
Figura 53. Valores antiguos a nuevos de las variables.
Se finaliza el procedimiento dando clic en Continuar y Aceptar. Al final de la base de datos se generan
las nuevas variables recodificadas.
51
Pgina
Figura 54. Nuevos valores de las variables recodificadas
52
Pgina
Captulo 7: Medidas de tendencia central, dispersin y posicin
Para realizar el anlisis de Media, Mediana y Desviacin Tpica de las variables a00AP1, a00AP2,
a00AP3 y a00AP4, se utiliza la opcin de Tablas Personalizadas. Para lo cual se seleccionar la ruta
Analizar > Tablas > Tablas personalizadas.
Se arrastra las variables a00AP1, a00AP2, a00AP3 y a00AP4 a las Filas y en las columnas se deja para los
estadsticos de media, medina y Desviacin Tpica (DT) para cada una de las variables.
53
Pgina
Figura 56. Seleccin de las variables en las filas y columnas
Una vez seleccionadas las variables la interfaz mostrar una tabla con filas y columnas con el Media
como estadstico. La intencin es realizar anlisis de medidas de tendencia central de cada una de las
variables, se debe activar la opcin Definir N% Estadsticos de resumen (si la opcin no se encuentra
activa, se puede seleccionar con el cursor las filas, para que la tabla sea coloreada de amarillo y se
resaltara con amarillo la opcin media).
54
Pgina
Figura 57. Seleccin Estadsticos de resumen
En la interfaz aparece la opcin Estadsticos, con una lista de posibles anlisis estadsticos, en la derecha
se observa la opcin Visualizacin que muestra el estadstico de Media activo. A su vez en la tabla
aparecer como etiqueta media y el formato nnnn con 0 decimales. Para seleccionar la mediana y DT se
debe buscar en la lista de Estadsticos la opcin de mediana y Desviacin estndar. Una vez
seleccionados las otras dos opciones, se da clic en Aplicar a seleccin y luego Aceptar
55
Pgina
El ejemplo anterior aplica cuando se calculan Las medidas de Tendencia Central de cuatro variables, pero
en algunos casos se puede hacer cruces de variables para establecer relaciones entre las variables, para ello
se usar la funcin Tablas Personalizadas. Para lo cual se seleccionar la ruta Analizar > Tablas >
Tablas personalizadas.
Por ejemplo, se puede cruzar la variable pausa ubicada en las filas y las variables a00AP1, a0cAP1,
56
Una vez seleccionadas las variables la interfaz mostrar una tabla con filas y columnas con Media como
estadstico. La intencin es realizar anlisis de medidas de tendencia central sobre la variables variables
a00AP1, a0cAP1, abcAP1 en relacin con las categoras de la variable PAUSA, se debe activar la opcin
Definir N% Estadsticos de resumen (si la opcin no se encuentra activa, se puede seleccionar con el
cursor las filas)
58
Pgina
Tabla 10:
Media, Mediana y DT de las variables a00AP1, a0cAP1, abcAP1, en relacin con las categoras de la
variable PAUSA
Otra forma de representar medidas de tendencia central es a travs de grficos, en este caso medias para
las variables abcAP1, abcAP2, abcAP3 y abcAP4 ellos se puede seguir la ruta Grficos > Generador de
Grficos (Figura 45).
El grfico tendr 2 cuadros con lneas punteadas que definirn las caractersticas del grfico final Eje
x? y Eje y?, Para que aparezca en el Eje x? las variables las abcAP1, abcAP2, abcAP3 y abcAP4 se
deben juntas por funcin agregar en el Eje y? generando la variable INDEX para el Eje x? (variables
abcAP1, abcAP2, abcAP3 y abcAP4 juntas por funcin agregar). Por lo tanto se debe arrastrar las
variables al Eje y? para que se despliega el cuadro que dice Crear grupo de resumen (al lado derecho
de la figura 47) para crear la Categora INDEX para el eje X. Y se da clic en Aceptar.
60
Figura 67. Generador de grafico de lneas a partir de las variables agrupadas en INDEX
Generando:
61
Pgina
Ahora vamos a representar un cruce de variables, para ver las medias de las variables abcAP1, abcAP2,
abcAP3 y abcAP4 cruzadas con PAUSA a partir de Grficos > Generador de Grficos.
El grfico tendr 2 cuadros con lneas punteadas que definirn las caractersticas del grfico final Eje
x? y Eje y?, ?, en el primero Eje x? se seleccionar la variable a comparar PAUSA, para ello se
arrastra la Variables al recuadro Por lo tanto se debe arrastrar las variables (abcAP1, abcAP2, abcAP3 y
62
abcAP4 )al Eje y? para que se despliega el cuadro que dice Crear grupo de resumen (al lado derecho
Pgina
Como se puede observar en la figura 47 en el Eje x? se cre la variable INDEX (abcAP1, abcAP2,
abcAP3 y abcAP4 juntas) Y en el Eje y se calcula la media de cada una de los niveles que tiene la
variable INDEX. Finalmente en establecer color esta la variable PAUSA. Aceptar para generar el
grafico.
63
Pgina
Figura 71. Generador de grafico de lneas a partir de las variables agrupadas en INDEX y Pausa
Generando:
Otra forma de representar variables de tipo escala es a travs de Histogramas. En este caso se usar uno
para la variable abcAP4. Para ellos hay que seguir la ruta Grficos > Generador de Grficos. Al hacer la
seleccin se presentara la interfaz de generador de grficos que permite la construccin de diversos tipos
de representaciones, para el caso de este ejercicio se debe seleccionar en Elegir en Galera la opcin
Histogramas. Una vez seleccionada, se ubica la variable que se quiere graficar en el eje X. A este tipo de
grficos se les puede aadir la curva de distribucin normal. Para mostrar dicha curva, se debe habilitar en
Propiedades del elemento la opcin Mostrar curva normal y clic en Aplicar. Finalmente, para generar
el grfico se da clic en Aceptar.
64
Pgina
Figura 71. Realizacin de
un histograma
Para graficar mediante histograma la variable a00AP4, se realiza el mismo procedimiento anterior y como
Pgina
resultado se obtiene:
Grfico 5: Distribucin de la variable a00AP4
SPSS tambin permite representar grficamente medidas de posicin, tales como los cuartiles, a partir de
los diagramas de caja. Para representa la variable abcAP4 mediante esa funcin se debe ir a Grficos
Generador de grficos y se selecciona la opcin Diagrama de caja, ubicada en la parte inferior
izquierda de la interfaz de grficos. Una vez seleccionado, aparecern tres opciones de este tipo de
diagramas: diagrama de caja simple, diagrama de caja agrupado y diagrama de caja 1-D. Como se
quiere graficar una sola variable se escoge la primera opcin, con doble clic o arrastrndola a la parte
superior. La variable que se desea graficar se ubica en el eje Y. Para finalizar se da clic en Aceptar
66
Pgina
Figura 72. Realizacin del
diagrama de caja de la
variable abcAP4.
anterior y se aade la variable pausa en el eje X de la siguiente manera (ver Figura 50).
Figura 73. Realizacin del diagrama de caja de la variable abcAP4 y la pausa.
68
El software permite operar con las variables que se tienen en la base de datos y hacer clculos sobre
ellas. Mediante la funcin Calcular variable, SPSS permite sumar, restar, calcular promedios,
desviaciones y dems, sobre la informacin que se posee. Para calcular el promedio de las diferentes
aplicaciones de la variable abc (abcAP1, abcAP2, abcAP3 y abcAP4), por ejemplo, se debe ir a
Transformar Calcular variable y dar doble clic. Cuando se selecciona, se abre una ventana en la que
se muestra al lado izquierdo un recuadro donde se debe nombrar la nueva variable que se va a crear,
debajo de eso, el listado de variables de la base de datos con la que estamos trabajando y al lado derecho
las opciones para realizar los clculos (ver Figura 52).
programa puede realizar. Como el fin de este ejemplo es calcular el promedio de las aplicaciones de abc,
se busca la opcin Estadsticas. Una vez seleccionada, en el recuadro Funciones y variables especiales
aparecen algunos estadsticos de tendencia central y de dispersin tales como media (Mean), mediana
(Median), desviacin estndar (Sd), varianza (Variance) y otras. Para calcular el promedio se selecciona
MEAN. Cuando se ha hecho esto, en el recuadro Expresin numrica aparece la funcin que
seleccionamos. Para que el programa haga el clculo debemos ingresar el nombre de las variables entre
parntesis, separndolos con coma (ver Figura 53). Para finalizar se da clic en Aceptar.
Como resultados del clculo, en la base de datos se crea una nueva variable con el nombre que le
asignamos, en este caso Promedio que contiene los valores de la operacin que solicitamos
70
Pgina