Sie sind auf Seite 1von 26

ESTADSTICA DESCRIPTIVA CON SPSS

(2602) Estadstica Econmica Joaqun Alegre y Magdalena Cladera

SPSS es una aplicacin para el anlisis estadstico. En este material se presentan los procedimientos bsicos de este programa para la gestin y el anlisis descriptivo de datos. Concretamente, los contenidos son los siguientes: 1. Entorno de trabajo .........................................................................1 2. Etiquetado de las variables y los valores .......................................4 3. Seleccin de casos ........................................................................7 4. Transformacin de las variables ....................................................9 5. Anlisis descriptivo de variables cualitativas................................12 6. Anlisis descriptivo de variables cuantitativas .............................15 6.1. Distribucin de frecuencias e histograma .............................15 6.2. Estadsticos descriptivos ......................................................15 7. Asociacin de variables cualitativas.............................................21 8. Correlacin...................................................................................24

1. ENTORNO DE TRABAJO Tipos de archivos Archivos de datos. Extensin .sav. Resultados: Extensin .spo. Sintaxis: Extensin .sps.

Importacin de datos desde Excel Es suficiente con abrir el archivo desde SPSS. Si el archivo tiene varias hojas debe indicarse cual es la que quiere utilizarse, as como el rango de celdas en el que se encuentran los datos que desean importarse, si ste es distinto al que aparece por defecto. Una vez abierto, se guarda con extensin .sav. Ejemplo 1. En la Figura 1, Figura 2 y Figura 3 se presentan los pasos a seguir para abrir el archivo EDT02.xls desde SPSS.

Figura 1

Figura 2

Figura 3

Exportacin de datos a Excel Es suficiente con, desde SPSS, guardar el archivo que se desea exportar con extensin *.xls. Ejemplo 2. En la Figura 4 y la Figura 5 se presentan los pasos a seguir para guardar el archivo EDT02.sav como archivo de Excel.
Figura 4

Figura 5

2. ETIQUETADO DE LAS VARIABLES Y LOS VALORES Cada una de las variables de una base de datos de SPSS tiene un nombre que puede tener hasta ocho caracteres. Un nombre tan corto puede ser poco informativo, de manera que resulta conveniente especificar, adems, una etiqueta para la variable, es decir, una definicin que permita identificar fcilmente su contenido. Por otra parte, tambin es de gran utilidad a la hora de interpretar los resultados de los anlisis estadsticos, tener etiquetados los valores de las variables cualitativas, es decir, asociar a cada uno de los valores una definicin que exprese su significado. Vista de datos y Vista de variables En un archivo de datos de SPSS hay dos pestaas: Vista de datos (Figura 6), en la que se tienen los valores de las variables para cada observacin. Vista de variables (Figura 7), en la que se presenta la informacin sobre diversas caractersticas de las variables (nombre, tipo, anchura, decimales, etiqueta, valores perdidos, columnas, alineacin, medida).

Figura 6

Figura 7

El etiquetado de las variables y los valores se lleva a cabo desde la pestaa Vista de variables, tal y como se explicar a continuacin.
5

Etiquetado de las variables El etiquetado de una variable consiste en especificar una definicin, lo ms breve y clara posible, que permita identificar con claridad el significado de dicha variable. Ejemplo 3. En la Figura 8 se muestra como la variable das se ha etiquetado con la expresin Das de estancia en las Islas.
Figura 8

Haciendo clic se puede modificar el nombre de la variable

Haciendo clic se puede escribir la etiqueta de la variable

Etiquetado de los valores Las categoras de una variable cualitativa suelen representarse por valores numricos. El etiquetado de los valores consiste en especificar para cada uno de ellos una breve definicin que permita identificar cual es la categora de la variable que representan. Ejemplo 4. En la Figura 9 se muestra el procedimiento de etiquetado de los valores de la variable edad, para indicar que el valor 1 se corresponde con Menores de 30 aos, el valor 2 con Entre 30 y 45 aos, etc.

Figura 9

3. SELECCIN DE CASOS En ocasiones interesa trabajar slo con una parte de los datos, con aquellos que cumplen determinadas caractersticas, para lo que es til la opcin Seleccionar casos del men Datos. Ejemplo 5. De la Figura 10 a la Figura 12 se muestra como se seccionaran las observaciones correspondientes a los turistas menores de 30 aos.
Figura 10

Figura 11

En este cuadro se escribe la condicin que deben cumplir los datos que se van a seleccionar

Figura 12

!!! Si se activa esta opcin se perdern de forma irrecuperable todas las observaciones que no se seleccionen

Para volver a trabajar con todas las observaciones se activa la opcin Todos los casos en el cuadro de dilogo de la Figura 13.

Figura 13

4. TRANSFORMACIN DE LAS VARIABLES Las opciones Calcular y Recodificar del men Transformar permiten realizar transformaciones en las variables o crear nuevas variables a partir de las ya existentes en la base de datos. Ejemplo 6. En la Figura 14 se ilustra como utilizar la opcin Calcular para obtener una variable que contenga el gasto en euros (geuros) a partir de la variable de gasto en pesetas (gtotal).

Figura 14

Expresin utilizada para el clculo de la nueva variable

Nombre de la nueva variable

La opcin Recodificar permite, por ejemplo, agrupar un conjunto de valores de una variable categrica, agrupar en intervalos una variable cuantitativa, cambiar la codificacin de los valores, etc. Existen dos opciones: Recodificar en la misma variable. Se substituye la variable original por la/s variable/s recodificada/s. Recodificar en distintas variables. Se mantiene la variable original y se aade/n la/s variable/s con la nueva codificacin. Ejemplo 7. De la Figura 15 a la Figura 17 se muestra el procedimiento a seguir para recodificar la variable nacionalidad, de manera que los valores superiores a 4 queden recogidos en una nica categora representada por el valor 5. En primer lugar se selecciona Recodificar En distintas variables del men Transformar.

10

Figura 15

2
Nombre y etiqueta de la nueva variable

3
Figura 16

Tomarn valor 5 en la variable recodificada

Los valores superiores a 4 en la variable original

2
Figura 17

Se quedan igual en la variable recodificada

El resto de valores (1 a 4) de la variable original

11

Si en algn momento se quiere un resumen de las variables contenidas en una base de datos de SPSS, sus caractersticas y su etiquetado, se puede obtener seleccionando la opcin Mostrar informacin de datos del men Archivo, o bien seleccionando la opcin Informacin del archivo del men Utilidades. Por otra parte, para ver en la base de datos las etiquetas de los valores, se tiene que seleccionar la opcin Etiquetas de valor en el men Ver. 5. ANLISIS DESCRIPTIVO DE VARIABLES CUALITATIVAS La opcin Frecuencias del men Analizar Estadsticos Descriptivos permite obtener distribuciones de frecuencias, representaciones grficas de dichas distribuciones, y los estadsticos descriptivos ms utilizados. Ejemplo 8. De la Figura 18 a la Figura 22 se expone el procedimiento a seguir para realizar un anlisis descriptivo bsico de la variable edad. Los resultados que se obtienen son los de la Figura 23.
Figura 18

1 2

12

Figura 19

Figura 20

Figura 21

13

Figura 22

Figura 23
Estadsticos EDAD N Mediana Moda Vlidos Perdidos 575 3 2,00 1
EDAD Frecuencia MENOS DE 30 AOS 263 ENTRE 30 Y 45 204 ENTRE 45 y 60 87 MS DE 60 AOS 21 Total 575 Sistema 3 578 Porcentaje 45,5 35,3 15,1 3,6 99,5 ,5 100,0 Porcentaje vlido 45,7 35,5 15,1 3,7 100,0 Porcentaje acumulado 45,7 81,2 96,3 100,0

Vlidos

Perdidos Total

EDAD
Perdido MS DE 60 AOS ENTRE 45 y 60

MENOS DE 30 AOS

ENTRE 30 Y 45

14

6. ANLISIS DESCRIPTIVO DE VARIABLES CUANTITATIVAS 6.1. Distribucin de frecuencias e histograma Para obtener la distribucin de frecuencias de una variable cuantitativa es conveniente agrupar los valores en intervalos. Posteriormente puede obtenerse la distribucin de frecuencias y su representacin grfica de la forma descrita en el epgrafe anterior. Otra forma de representar grficamente la distribucin de frecuencias de una variable cuantitativa es mediante un histograma. Para obtenerlo puede utilizarse una de estas dos alternativas: Se sigue el procedimiento descrito en el epgrafe 5, y en el cuadro de dilogo de la Figura 21 se activa la opcin Histogramas. Se selecciona la opcin Histograma del men Grficos. En ambos casos se obtiene el mismo resultado. Ejemplo 9. En la Figura 24 se tiene el histograma del gasto total.
Figura 24

GASTO TOTAL PC Y DIA


60 50

40

30

20

Frecuencia

10 0

Desv. tp. = 4720,52 Media = 10353,9 N = 535,00


0 0, 00 , 0 25 00 0 ,0 23 0 00 , 0 21 00 0 ,0 19 00 0 ,0 17 00 0 ,0 15 00 0 ,0 13 00 0 11 0,0 0 90 0,0 0 70 0,0 0 50 0,0 0 30 0,0 0 10

GASTO TOTAL PC Y DIA

6.2. Estadsticos descriptivos El procedimiento expuesto en el epgrafe 5 tambin permite obtener los principales estadsticos descriptivos de una variable cuantitativa. Los estadsticos que interese obtener se seleccionan en el cuadro de dilogo de la Figura 19. Alternativamente, se puede utilizar la opcin Estadsticos descriptivos Descriptivos del men Analizar.

15

Ejemplo 10. Para obtener un resumen de los principales estadsticos descriptivos de la variable das puede procederse de la forma que se muestra en la Figura 25 y la Figura 26. Los resultados que se obtienen son los de la Figura 27.
Figura 25

Figura 26

16

Figura 27
Estadsticos descriptivos DAS DE ESTANCIA N Rango Mnimo Mximo Media Desv. tp. Varianza Asimetra Curtosis N Estadstico 578 28 2 30 10,19 3,983 15,862 ,882 1,892 578 Error tpico

,17

,102 ,203

N vlido (segn lista)

Otra alternativa, algo ms completa que las anteriores, consiste en seleccionar la opcin Estadsticos descriptivos Explorar del men Analizar. Esta opcin permite obtener un resumen de los principales estadsticos descriptivos de posicin central y de dispersin, percentiles, valores extremos, y representaciones grficas como el histograma o el diagrama de caja. Ejemplo 11. De la Figura 28 a la Figura 31 se muestra la utilizacin de la opcin Explorar para obtener los principales instrumentos que permiten realizar un anlisis descriptivo de la variable das. Los resultados que se obtienen son los de la Figura 32.
Figura 28

17

Figura 29

Figura 30

Figura 31

18

Figura 32

Explorar
Resumen del procesamiento de los casos Casos Perdidos N Porcentaje 0 ,0%

DAS DE ESTANCIA

Vlidos N Porcentaje 578 100,0%

Total N Porcentaje 578 100,0%

Descriptivos DAS DE ESTANCIA Media Intervalo de confianza para la media al 95% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Estadstico 10,19 9,86 10,51 10,07 8,00 15,862 3,983 2 30 28 7,00 ,882 1,892 Error tp. ,166

Lmite inferior Lmite superior

,102 ,203

Percentiles Promedio ponderado(definicin 1) DAS DE ESTANCIA 5 10 25 50 75 90 95 DAS DE ESTANCIA 25 50 75 6,00 7,00 7,00 8,00 14,00 14,00 14,00 7,00 8,00 14,00

Bisagras de Tukey

19

Valores extremos Nmero del caso 307 331 340 43 102 360 111 110 550 540 Valor 30 30 30 21 21a 2 2 2 3 3b

DAS DE ESTANCIA Mayores

Menores

1 2 3 4 5 1 2 3 4 5

a. En la tabla de valores extremos mayores slo se muestra una lista parcial de los casos con el valor 21. b. En la tabla de valores extremos menores slo se muestra una lista parcial de los casos con el valor 3.

DAS DE ESTANCIA
Histograma
300

200

100

Frecuencia

Desv. tp. = 3,98 Media = 10,2 0 2,5 7,5 5,0 12,5 17,5 22,5 27,5 10,0 15,0 20,0 25,0 30,0 N = 578,00

DAS DE ESTANCIA
40

30

307 331 340

20

10

-10
N= 578

DAS DE ESTANCIA

20

7. ASOCIACIN DE VARIABLES CUALITATIVAS La distribucin de frecuencias conjunta de dos variables cualitativas, as como las medidas estadsticas que permiten analizar su asociacin, tanto si se trata de variables nominales como de variables ordinales, se pueden obtener mediante la opcin Descriptivos Tablas de contingencia del men Analizar. Ejemplo 12. El procedimiento a seguir para el anlisis de la asociacin entre la edad y la intencin de retorno se muestra en la Figura 33 a la Figura 36. Los resultados que se obtendran son los presentados en la Figura 37.
Figura 33

21

Figura 34

Figura 35

22

Figura 36

Figura 37
Resumen del procesamiento de los casos Casos Perdidos N Porcentaje 35 6,1%

N PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA * EDAD

Vlidos Porcentaje 543 93,9%

Total Porcentaje 578 100,0%

Tabla de contingencia PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA * EDAD EDAD ENTRE ENTRE 30 Y 45 45 y 60 158 73 156,8 70,9 34,9% 84,0% 29,1% 30 31,2 33,3% 16,0% 5,5% 188 188,0 34,6% 100,0% 34,6% 16,1% 85,9% 13,4% 12 14,1 13,3% 14,1% 2,2% 85 85,0 15,7% 100,0% 15,7%

PIENSA VOLVER A SI PASAR LAS VACACIONES EN NUESTRA ISLA

NO

Total

Recuento Frecuencia esperada % de PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA % de EDAD % del total Recuento Frecuencia esperada % de PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA % de EDAD % del total Recuento Frecuencia esperada % de PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA % de EDAD % del total

MENOS DE 30 AOS 205 208,6 45,3% 82,0% 37,8% 45 41,4 50,0% 18,0% 8,3% 250 250,0 46,0% 100,0% 46,0%

MS DE 60 AOS 17 16,7 3,8% 85,0% 3,1% 3 3,3 3,3% 15,0% ,6% 20 20,0 3,7% 100,0% 3,7%

Total 453 453,0 100,0% 83,4% 83,4% 90 90,0 100,0% 16,6% 16,6% 543 543,0 100,0% 100,0% 100,0%

23

Pruebas de chi-cuadrado Valor ,826a ,835 ,738 543 gl 3 3 1 Sig. asinttica (bilateral) ,843 ,841 ,390

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

a. 1 casillas (12,5%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 3,31.
Medidas direccionales Valor ,000 Error tp. a asint. ,000 T aproximada .b
b

Sig. aproximada

Nominal por nominal

Lambda

Tau de Goodman y Kruskal

Simtrica PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA dependiente EDAD dependiente PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA dependiente EDAD dependiente

.b
b

,000

,000

,000

,000

.b

.b
c

,002

,003

,844

,001

,002

,765c

a. Asumiendo la hiptesis alternativa. b. No se puede efectuar el clculo porque el error tpico asinttico es igual a cero. c. Basado en la aproximacin chi-cuadrado.
Medidas simtricas Valor Nominal por nominal N de casos vlidos Coeficiente de contingencia ,039 543 Sig. aproximada ,843

a. Asumiendo la hiptesis alternativa. b. Empleando el error tpico asinttico basado en la hiptesis nula.

8. CORRELACIN Para obtener una matriz de correlaciones entre dos o ms variables se dispone de la opcin Correlaciones Bivariadas del men Analizar. Ejemplo 13. En la Figura 38 se tiene el cuadro de dilogo utilizado para solicitar la matriz de correlaciones de las variables de satisfaccin, y en la Figura 39 se tienen los resultados obtenidos.

24

Figura 38

25

Figura 39
Correlaciones NIVEL DE NIVEL DE NIVEL DE NIVEL DE SATISFACCI SATISFACCI NIVEL DE NIVEL DE SATISFACCI SATISFACCI N CALIDAD N CALIDAD SATISFACCI SATISFACCI ALOJAMIENT MEDIOAMBIE N PRECIO N PRECIO N GLOBAL N PLAYAS COMIDAS OCIO O NTE 1 ,417** ,481** ,472** ,314** ,342** . ,000 ,000 ,000 ,000 ,000 531 509 491 491 498 458 ,417** 1 ,273** ,390** ,199** ,207** ,000 . ,000 ,000 ,000 ,000 509 533 504 506 513 476 ,481** ,273** 1 ,520** ,223** ,214** ,000 ,000 . ,000 ,000 ,000 491 NIVEL DE SATISFACCIN Correlacin de Pearson CALIDAD Sig. (bilateral) MEDIOAMBIENTE N NIVEL DE SATISFACCIN Correlacin de Pearson PRECIO COMIDAS Sig. (bilateral) N NIVEL DE SATISFACCIN Correlacin de Pearson PRECIO OCIO Sig. (bilateral) N **. La correlacin es significativa al nivel 0,01 (bilateral). ,472** ,000 491 ,314** ,000 498 ,342** ,000 458 504 ,390** ,000 506 ,199** ,000 513 ,207** ,000 476 514 ,520** ,000 500 ,223** ,000 498 ,214** ,000 464 500 1 . 514 ,280** ,000 499 ,297** ,000 467 498 ,280** ,000 499 1 . 522 ,761** ,000 474 464 ,297** ,000 467 ,761** ,000 474 1 . 481

NIVEL DE SATISFACCIN Correlacin de Pearson GLOBAL Sig. (bilateral) N NIVEL DE SATISFACCIN Correlacin de Pearson PLAYAS Sig. (bilateral) N NIVEL DE SATISFACCIN Correlacin de Pearson CALIDAD ALOJAMIENTO Sig. (bilateral) N

26

Das könnte Ihnen auch gefallen