Beruflich Dokumente
Kultur Dokumente
PRCTICA 1:
ESTADSTICA DESCRIPTIVA CON SPSS
OBJETIVOS
INTRODUCCIN
SPSS es un programa que permite hacer clculos estadsticos. El nombre del programa es
un acrnimo de Statistical Package for the Social Sciences, puesto que inicialmente se cre
como un programa estadstico orientado al mbito de las ciencias sociales. Hoy en da es
muy usado, no slo en este mbito, sino tambin en las empresas de investigacin de
mercados, en investigaciones mdicas, educativas, de compaas de seguros,
gubernamentales, etc. Su capacidad para trabajar con grandes bases de datos y un sencillo
interfaz lo hacen uno de los programas estadsticos ms usados.
Antes de entrar en aspectos tcnicos, conviene tener claro que SPSS realiza tres funciones
esenciales:
1. lee datos,
2. analiza esos datos (estadsticos de tendencia central, de variabilidad, etc.),
3. muestra los resultados obtenidos tras los anlisis.
Lo nico que no hace SPSS es darnos la interpretacin de los resultados, esta es la tarea del
investigador.
MANEJO DE SPSS
1
Matemticas II (Grado en Qumica, UR)
En la ms pequea se nos pregunta qu deseamos hacer con el programa: abrir una base de
datos ya existente, abrir otro tipo de fichero, ejecutar el tutorial, etc. De momento, como
vamos a estudiar ms detenidamente todas las opciones del programa, cerramos esa
ventana. La ventana que aparece es la ventana del editor de datos de SPSS y que consta de
arriba a abajo de los siguientes elementos:
Si ahora desplegamos cada uno de los mens de la barra de mens van apareciendo las
distintas posibilidades que el programa nos da para trabajar. Comentaremos, muy por
encima, cules son stas:
2
Matemticas II (Grado en Qumica, UR)
SPSS permite crear un archivo de datos o abrir uno ya existente. Esta segunda opcin es
particularmente interesante ya que permite abrir no slo bases de datos creadas con SPSS
(en cualquiera de sus versiones), sino tambin otras creadas en hojas de clculo (Excel, ...),
ficheros de bases de datos (dBASE, ...) e incluso distintos formatos de ficheros escritos en
cdigo ASCII.
Vamos a comenzar viendo cmo crear un archivo de datos nuevo. Estos se crean desde la
ventana del editor de datos de SPSS a la que se accede con la seleccin del men
Archivo/Nuevo/Datos. La parte fundamental de esta ventana es una tabla de doble entrada
o matriz rectangular. En ella:
Cada fila es un caso. Por ejemplo, cada persona que responde a un cuestionario es un
caso.
Cada columna es una variable. Por ejemplo, cada pregunta de un cuestionario es una
variable.
Cada celda, interseccin de una fila con una columna, guardar el valor que una
variable toma en un caso concreto. Por ejemplo, la respuesta que determinada persona
da a una determinada pregunta. Inicialmente las celdas estn vacas.
Bsicamente los pasos a seguir para poder trabajar con unos datos sern:
Para ilustrar estos pasos y otros que veremos a continuacin, trabajaremos en esta prctica
con los siguientes datos:
3
Matemticas II (Grado en Qumica, UR)
Salario Salario
Categora Sexo Antigedad Edad
inicial final
Administrativo Hombre 375 5 780 34
Directivo Hombre 1910 6 3240 49
Servicios Mujer 215 12 510 52
Administrativo Mujer 290 15 985 43
Directivo Mujer 1080 17 2650 40
Administrativo Hombre 325 8 990 31
Servicios Mujer 290 7 756 27
Administrativo Hombre 880 10 1490 37
Servicios Mujer 235 19 660 49
Administrativo Hombre 280 13 1020 35
Servicios Hombre 215 18 750 53
Administrativo Mujer 750 6 1380 30
Antes de empezar a introducir datos tenemos que definir la estructura de los mismos:
cuntas variables hay, de qu tipo son, etc.
Cada una de las variables que aparecen en nuestro fichero de datos debe ser previamente
definida, lo que incluye dar un nombre que permita identificar la variable, sealar el tipo de
datos que va a almacenar, etc.
En la ventana del editor de datos observamos que en la parte inferior izquierda hay dos
pestaas: Vista de datos y Vista de variables. En la Vista de datos la parte superior de
todas las columnas aparece encabezada con la palabra var, es as como SPSS llama a todas
las variables por defecto. Debemos modificar estos nombres y completar la definicin de
las variables. Lo haremos desde la Vista de variables, a la que se puede acceder desde las
pestaas inferiores de la ventana o bien haciendo doble clic en la parte superior de
cualquier columna. La ventana que aparece es la siguiente:
4
Matemticas II (Grado en Qumica, UR)
Para cada una de las variables se necesita dar un nombre y un tipo, pero tambin
pueden ser incluidas otras caractersticas de las variables como la asignacin de
etiquetas, la especificacin de valores perdidos, el cambio en la alineacin o el
ancho de columna. Describimos a continuacin las ms significativas.
Se aconseja llamar a las variables con nombres significativos, por ejemplo, la variable
Antigedad guardar los datos correspondientes a la antigedad de los trabajadores de la
empresa. Es importante tener en cuenta que no sirve cualquier nombre porque tienen que
cumplirse ciertas reglas:
El nombre debe comenzar por una letra. El resto de los caracteres pueden ser letras,
dgitos, puntos o los smbolos @, #, _ o $.
Los nombres de variable no pueden terminar en punto.
Se deben evitar los nombres de variable que terminan con subrayado (para evitar
conflictos con variables creadas automticamente por varios procedimientos).
La longitud del nombre no debe tener ms de 64 caracteres.
Los espacios en blanco y los caracteres especiales (por ejemplo, !, ?, y *) no se
pueden utilizar.
Cada nombre de variable debe ser exclusivo; no se permiten duplicados. Los nombres
de variable no distinguen a las maysculas y las minsculas. Por ejemplo, los
nombres Antigedad, antigedad y ANTIGEDAD son iguales en SPSS.
Hay ciertas palabras clave reservadas que no pueden utilizarse como nombres de
variable, como son: ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO,
WITH.
5
Matemticas II (Grado en Qumica, UR)
Una vez establecido el nombre de la variable, se debe indicar el tipo de datos que va a
almacenar. Por ejemplo, la variable Antigedad va a almacenar datos de tipo numrico.
Variables numricas: Aquellas que admiten cualquier nmero como valor vlido,
pudiendo ir precedido del signo ms o menos. Su longitud mxima es de 40
caracteres, de los cuales 16 pueden ser cifras decimales. El signo y la coma o el
punto decimal deben contabilizarse a la hora de definir la longitud de la variable.
Variables con coma: Este formato de entrada de datos aade al anterior la coma
como separador de los miles y el punto como separador de la parte entera y de la
decimal.
Variables con punto: En este caso, se emplea al punto para separar miles y la coma
para los decimales.
Variables numricas con notacin cientfica: Son valores aceptables los nmeros y
las letras D y E, y los signos + y -.
Variables tipo fecha: Distintos formatos para las variables que guardan datos
temporales. Internamente siempre se guarda en segundos.
Variables con formato Dlar: Este formato aade el smbolo $ y el punto como
separador de miles.
Variables con formato de moneda personalizada: Si a travs del cuadro de dilogo
Opciones del men Edicin se han creado formatos especficos para este tipo de
variables, mediante esta opcin se puede elegir uno de ellos.
Variables alfanumricas: Son del tipo que se describen como variables cadena.
Admiten tanto letras como nmeros o smbolos. En su definicin debe especificarse
la longitud mxima. Si la sucesin de caracteres introducidos como valor de la
variable tiene una longitud menor a la mxima que se impone, SPSS completa
aadiendo caracteres en blanco a la derecha.
Por defecto, SPSS define las variables con el tipo numrico en formato 8.2. Eso significa
que la anchura permitida es de 8 caracteres y dos posiciones decimales. Pero, cuidado,
porque estos valores son slo a efectos de aparicin en el editor de datos. En otras palabras,
es posible introducir un valor (numrico, eso s) que exceda estos lmites o que, por
ejemplo, no tenga valores decimales. SPSS operar internamente como una variable de tipo
real, pero externamente aparecer el valor que ms se acerque al formato establecido. Pese
a lo comentado anteriormente, hay ocasiones en las que SPSS, para efectuar clculos,
utiliza el valor del editor y no el valor interno. Ah se pueden producir errores. Por eso, es
mejor tratar de definir el formato que ms se ajuste al tipo de datos que vamos a manejar
posteriormente. El sistema es bastante flexible y admite algunas modificaciones.
Adems del nombre y del tipo, pueden definirse otras caractersticas interesantes para las
variables como son el etiquetado de variables y valores y el formato de columnas.
6
Matemticas II (Grado en Qumica, UR)
Desde la columna Valores, se accede a un cuadro de dilogo donde se escribe el cdigo del
valor de la variable en el cuadro valor y a continuacin el texto de la etiqueta en el cuadro
Etiqueta. Despus se pulsa el botn Aadir, con lo que el valor y su etiqueta pasan a
formar parte de la lista que se guarda en la parte inferior de la ventana. El proceso se repite
para todos los valores de la variable que se quieran codificar. Una vez acabado el proceso
se pulsa el botn Aceptar y el control vuelve al cuadro inicial. Tambin se pueden cambiar
o eliminar.
Cuando introduzcamos datos lo haremos con los valores, y sin embargo lo que aparecer en
pantalla sern las etiquetas correspondientes a esos valores. El dato que internamente se
guarda es el valor y no el de la etiqueta, esto puede ser importante para la definicin de la
variable. Para que en la ventana del Editor de datos se vean las etiquetas y no los valores
hay que tener activada la opcin del men Ver/Etiquetas de valor.
EJERCICIO 2 Pon etiquetas de variable a las variables Salario inicial y Salario final
donde se indique que dichos salarios estn dados en euros. Modifica el tamao de estas
columnas para que pueda visualizarse bien el nombre.
EJERCICIO 3 Para ahorrarnos la tarea de introducir las palabras que aparecen en las
variables Categora y Sexo, pon etiquetas de valor en dichas variables de modo que una
vez realizado tan slo haya que introducir A para indicar que es un Administrativo
(A=Administrativo), D para un directivo, S para alguien del sector Servicios, H para un
Hombre y M para una Mujer.
7
Matemticas II (Grado en Qumica, UR)
Una vez definidas las variables, llega el momento de introducir los datos. Suele ser una
tarea tediosa y por eso hay que poner especial cuidado porque es en esta etapa donde suelen
cometerse ms errores. Los datos podemos introducirlos en el orden que queramos: por
filas, por columnas, etc.
EJERCICIO 4 Introduce los datos. Ten en cuenta que, al haber creado etiquetas de valor
para las variables Categora y Sexo no tienes por qu introducir la palabra que figura en los
datos, bastar con introducir el valor correspondiente.
Para trabajar con un archivo de datos previamente creado y guardado, se abrir desde el
men Archivo/Abrir.
Observa que una vez guardado el fichero, aparece una pantalla denominada Visor en la que
se comunica que se ha efectuado tal operacin. Si no cerramos esta ventana, irn
apareciendo tablas con resultados estadsticos, grficos, etc. Este fichero puede guardarse y
tiene extensin .spv.
Modificacin de un archivo
Se pueden tambin insertar nuevos casos. Para ello nos ponemos en un nmero de caso y
elegimos la opcin Datos/Insertar caso. Se insertar un caso por encima del seleccionado.
8
Matemticas II (Grado en Qumica, UR)
9
Matemticas II (Grado en Qumica, UR)
Una vez decidido el nombre, el siguiente paso es la expresin numrica que va a permitir
calcular los valores de la misma. Tal expresin puede constar de los siguientes elementos:
nombres de variables del fichero original (que se encuentran descritas en un cuadro a la
izquierda), constantes, operadores y funciones. Esa expresin se escribe en el cuadro
titulado Expresin numrica. Se puede teclear directamente o bien ayudarse de los
elementos que se presentan en el cuadro como la calculadora, los nombres de las variables,
y las funciones. A los smbolos habituales de la calculadora se aaden otros, igual menos
conocidos, como por ejemplo, & (AND), | (OR), (NOT).
EJERCICIO 7 Crea y guarda en el mismo fichero una variable llamada incremento medio
anual que calcule el incremento salarial medio anual para cada uno de los empleados.
EJERCICIO 8 Crea y guarda en el mismo fichero una variable llamada dlares que
indique el salario final en dlares. Para ello tendremos en cuenta el siguiente cambio: 1
euro = 1.26381 dlares. Exprsalo en el formato apropiado a este tipo de moneda.
Un caso especial de generacin de nuevas variables aparece cuando se quiere que las
modificaciones no afecten a todos los casos, sino slo a aquellos que cumplen una
determinada condicin. Los nuevos valores slo se calculan para los casos que verifiquen
una condicin, condicin que se escribir tras pulsar el botn Si la opcin
En el cuadro de dilogo que aparece, por defecto, la opcin indicada es la de Incluir todos
los casos. Si queremos que la frmula descrita en la anterior ventana slo afecte a los
valores que satisfacen una determinada condicin, debemos elegir la opcin Incluir si el
caso satisface la condicin y completar el cuadro anexo con la condicin.
10
Matemticas II (Grado en Qumica, UR)
Otra opcin que permite generar nuevas variables a partir de las ya existentes es la
de los mens Transformar/Recodificar en las mismas variables y
Transformar/Recodificar en distintas variables... Estas opciones permiten recodificar
los valores de las variables. Ambas incluyen la opcin condicional para poder recodificar
slo determinados valores.
EJERCICIO 10 Crea una nueva variable llamada cdigo_antigedad que codifique los
valores de la variable antigedad. Los valores de la nueva variable sern novato (si la
antigedad es menor o igual a 7 aos), experto (si est entre 8 y 15 aos) y veterano (si es
mayor de 15 aos).
ANLISIS DESCRIPTIVO
Del cuadro de la izquierda se seleccionan las variables que queremos estudiar y se pasan al
cuadro de la derecha. Por defecto siempre aparece la opcin Mostrar tablas de frecuencias,
que podemos desactivar y activar sin ms que pinchar en la marca que hay a su izquierda.
11
Matemticas II (Grado en Qumica, UR)
Aqu aparecen las medidas de tendencia central habituales: media, mediana y moda.
Tambin aparecen las medidas de dispersin: la desviacin tpica, la varianza (en realidad
es la cuasivarianza, que resulta de dividir el sumatorio por N-1 en lugar de N), el rango, el
mnimo, el mximo y el error tpico de estimacin de la media. En cuanto a la forma de la
distribucin, facilita los coeficientes de asimetra y curtosis. Adems da la posibilidad de
obtener los valores de los cuartiles y de varios percentiles utilizando los botones de Aadir,
Cambiar o Eliminar en el apartado correspondiente a los percentiles.
Desde el segundo botn Grficos del cuadro de dilogo Frecuencias se accede al cuadro
12
Matemticas II (Grado en Qumica, UR)
EJERCICIO 12 Construye una tabla de frecuencias para la variable Edad, calcula los
estadsticos: media, mediana, moda, desviacin tpica, coeficiente de asimetra y curtosis y
realiza un histograma incorporando la curva normal al grfico.
EJERCICIO 13 Repite el ejercicio anterior con la variable Salario final. Aade tambin el
histograma de frecuencias relativas.
EJERCICIO 14 Recodifica la variable Salario final en otra llamada Salario FinalRE que
tome como valor de marca el punto medio de cada uno de los siguientes intervalos: 300-
599.99, 600-1099.99, 1100-1799.99, 1800-4000. Ahora repite el ejercicio 12 con la variable
Salario FinalRE.
GRFICOS
Los tipos de grficos a los que podemos acceder desde el botn Grficos del cuadro de
dilogo Frecuencias son muy limitados. Desde el men Grficos/Generador de
grficos podemos acceder a un catlogo mayor: barras, lneas, reas, sectores, etc.
13
Matemticas II (Grado en Qumica, UR)
EJERCICIO 16 El siguiente grfico representa la media del salario inicial y del salario
final para cada una de las categoras de empleado de la empresa.
Notad que, al igual de lo que ocurra con los resultados obtenidos, los grficos tambin
aparecen en la ventana del editor de resultados.
14
Matemticas II (Grado en Qumica, UR)
Cualquier grfico puede modificarse cambiando colores, rellenos, etc. Para ello debemos
editarlo, haciendo un doble clic sobre el grfico. Aparece entonces la ventana del editor de
grficos desde la cual se pueden realizar las modificaciones.
Las modificaciones pueden llevarse a cabo a travs de las opciones de los mens de la
ventana o bien, seleccionando el elemento a modificar y eligiendo desde el men contextual
(botn derecho) la opcin Ventana propiedades. Para cada objeto del grfico, las
propiedades que pueden ser modificadas son diferentes.
EJERCICIO 18 Modifica el color y la trama de las barras, la escala del eje de ordenadas,
el orden en el que aparecen las barras y la trama de relleno, de manera que el grfico
anterior quede de la siguiente forma:
15
Matemticas II (Grado en Qumica, UR)
Los tipos de grficos son muy variados: barras, sectores, circulares, histogramas, etc.
16
Matemticas II (Grado en Qumica, UR)
17