Sie sind auf Seite 1von 67

Republica bolivariana de Venezuela Ministerio de la defensa para el poder popular Universidad gran mariscal de Ayacucho Ncleo El Tigre, edo.

Anzotegui.

SPSS
INTEGRANTES: Andrea Almeida C.I. 20.548.202 Katerin Carbonell C.I.18.981.524

El Tigre, Abril 2010.

INTRODUCCION
En el mundo moderno, la necesidad de tomar decisiones ms acertadas nos obliga a conocer mejor los factores que influyen en cada suceso; es por este motivo que el anlisis de datos aparece como una herramienta fundamental para comprender las causas y consecuencias del comportamiento de nuestro entorno, brindndonos las bases para optimizar los esfuerzos y recursos y as orientarlos a mejores resultados.

Con el desarrollo de nuevas tecnologas, los clculos estadsticos dejaron de ser una ardua tarea digna de un genio y se han convertido en una labor relativamente sencilla que cualquier persona puede realizar. En la actualidad existen en el mercado diversos software para el anlisis de datos, destacndose entre ellos el paquete estadstico SPSS principalmente por su gran capacidad, la facilidad de uso y su adaptabilidad a la mayora de las ramas de la ciencia y los negocios.

A pesar de la utilidad del SPSS, en Latinoamrica su uso ha permanecido reservado a slo algunos sectores, fundamentalmente por la aparente complejidad de manejo, as como la dificultad para acceder a los diferentes manuales, cursos o tutoriales.

El SPSS (Statistical Package for Social Science) tambin es un programa u herramienta muy bien utilizada para el dominio y anlisis de informacin, proveniente por ejemplo de encuestas. Es un completo sistema de anlisis de datos. SPSS puede adquirir datos de prcticamente cualquier tipo de archivo y de bases de datos externas y utilizarlos para generar informes tabulares, grficos y diagramas de las distribuciones y de las tendencias, estadsticos descriptivos y complejos anlisis estadsticos. El editor de datos le ofrece una herramienta simple y eficaz con un diseo del tipo hoja de clculo, que le permitir introducir datos y examinar el archivo de datos de trabajo. Los grficos, de alta resolucin y con calidad de presentacin, son una parte esencial e integrada del sistema Base. La mayora de los datos del sistema SPSS Base y de la opcin SPSS Tablas toman la forma de tablas pivote, que resultan sumamente flexibles y que pueden modificarse rpidamente para despus copiarlas directamente en otras aplicaciones. El SPSS posee una estructura de tipo modular que incluye un mdulo Base, adems de una serie de mdulos opcionales como son: Estadsticas Profesionales; Estadsticas Avanzadas; Tablas; Tendencias; Categoras; Lisrel, etc... El mdulo Base forma el ncleo del sistema y como tal debe permanecer residente en memoria. En l se encuentran los comandos de lectura y transformacin de datos y ficheros, los cuales nos permiten acceder a una gran variedad de fuentes de datos como son dBase, Lotus, Excel y a travs de ODBC, Access Paradox, SQL Server, Oracle y otros muchos. Tambin dispone de las herramientas encargadas de realizar procedimientos

estadsticos bsicos como anlisis exploratorio de datos, tablas de contingencia, comparacin de medias, anlisis de la varianza, pruebas no paramtricas, correlacin y regresin lineal mltiple, as como tcnicas de anlisis factorial, discriminante, de conglomerados y clculo de proximidades. Este curso se centrar sobre todo en estos procedimientos que contiene el mdulo Base, ya que los restantes mdulos estn destinados a otros procedimientos estadsticos ms avanzados.

VERSIONES DEL SPSS SPSS Inc. desarrolla un mdulo bsico del paquete estadstico SPSS, del que han aparecido las siguientes versiones:

SPSS-X (para grandes servidores tipo UNIX) SPSS/PC (1984, en DOS. Primera versin para computador porttil) SPSS/PC+ (1986 (en DOS) SPSS for Windows 6 (1992) / 6.1 para Macintosh SPSS for Windows 7 SPSS for Windows 8 SPSS for Windows 9 SPSS for Windows 10 / for Macintosh 10 (2000) SPSS for Windows 11 (2001) / for Mac OS X 11(2002) SPSS for Windows 11.5 (2002) SPSS for Windows 12 (2003) SPSS for Windows 13 (2004): Permite por primera vez trabajar con mltiples bases de datos al mismo tiempo.

SPSS for Windows 14 (2005) SPSS for Macintosh 13 (2006) SPSS for Windows 15 (2006) SPSS for Windows 16 (Octubre de 2007): En la lista de usuarios de SPSS "SPSSX (r) Discussion [SPSSX-L@LISTSERV. UGA. EDU]" varios funcionarios de la empresa anunciaron previamente la salida de la versin 16 de este software. En ella se incorpor una interfaz basada

en Java que permite realizar algunas mejoras en las facilidades de uso del sistema.

SPSS for Macintosh 16 SPSS for Linux 16 SPSS for Windows 17 (2008): Incorpora aportes importantes como el ser multilenguaje, pudiendo cambiar de idioma en las opciones siempre que queramos. Tambin incluye modificaciones en el editor de sintaxis de forma tal que resalta las palabras claves y comandos, haciendo sugerencias mientras se escribe. En este sentido se aproxima a los sistemas IDE que se utilizan en programacin.

MDULOS DEL SPSS El sistema de mdulos de SPSS, como los de otros programas (similar al de algunos lenguajes de programacin) provee toda una serie de capacidades adicionales a las existentes en el sistema base. Algunos de los mdulos disponibles son:

Modelos de Regresin Modelos Avanzados


o

Reduccin de datos: Permite crear variables sintticas a partir de variables colineales por medio del Anlisis Factorial.

Clasificacin: Permite realizar agrupaciones de observaciones o de variables (cluster analysis) mediante tres algoritmos distintos.

Pruebas no paramtricas: Permite realizar distintas pruebas estadsticas especializadas en distribuciones no normales.

Tablas: Permite al usuario dar un formato especial a las salidas de los datos para su uso posterior. Existe una cierta tendencia dentro de los usuarios y de los desarrolladores del software por dejar de lado el sistema original de TABLES para hacer uso ms extensivo de las llamadas CUSTOM TABLES.

Tendencias Categoras: Permite realizar anlisis multivariados de variables normalmente categoras. Tambin se pueden usar variables mtricas siempre que se realice el proceso de recodificacin adecuado de las mismas.

Anlisis Conjunto: Permite realizar el anlisis de datos recogidos para este tipo especifico de pruebas estadsticas.

Mapas: Permite la representacin geogrfica de la informacin contenida en un fichero (descontinuado para SPSS 16).

Pruebas Exactas: permite realizar pruebas estadsticas en muestras pequeas.

Anlisis

de

Valores

Perdidos:

Regresin

simple

basada

en

imputaciones sobre los valores ausentes.

Muestras Complejas: permite trabajar para la creacin de muestras estratificadas, por conglomerados u otros tipos de muestras.

SamplePower (clculo de tamaos muestrales) rboles de Clasificacin: Permite formular rboles de clasificacin y/o decisin con lo cual se puede identificar la conformacin de grupos y predecir la conducta de sus miembros.

Validacin de Datos: Permite al usuario realizar revisiones lgicas de la informacin contenida en un fichero.sav. y obtener reportes de los valores considerados extraos. Es similar al uso de sintaxis o scripts para realizar revisiones de los ficheros. De la misma forma que estos mecanismos es posterior a la digitalizacin de los datos.

SPSS Programmability Extension (SPSS 14 en adelante). Permite utilizar el lenguaje de programacin Python para un mejor control de diversos procesos dentro del programa que hasta ahora eran realizados principalmente mediante scripts (con el lenguaje SAX Basic). Existe tambin la posibilidad de usar las tecnologas .NET de Microsoft para hacer uso de las libreras del SPSS. Aunque algunos usuarios han

cuestionado sobre la necesidad de incluir otros lenguajes, la empresa no tiene esto entre sus objetivos inmediatos. Desde el SPSS/PC hay una versin adjunta denomina SPSS Student que es un programa completo de la versin correspondiente pero limitada en su capacidad en cuanto al nmero de registros y variables que puede procesar. Esta versin es para fines de enseanza del manejo del programa.

MANEJO SPSS tiene un sistema de ficheros en el cual el principal son los archivos de datos (extensin. SAV). Aparte de este tipo existen otros dos tipos de uso frecuente:

Archivos de salida (output, extensin. SPO): en estos se despliega toda la informacin de manipulacin de los datos que realizan los usuarios mediante las ventanas de comandos. Son susceptibles de ser exportados con varios formatos (originalmente HTML, RTF o TXT, actualmente la versin 15 incorpora la exportacin a PDF junto a los formatos XLS y DOC que ya se encontraban en la versin 12).

Archivos de sintaxis (extensin. SPS): Casi todas las ventanas de SPSS cuentan con un botn que permite hacer el pegado del proceso que el usuario desea realizar. Lo anterior genera un archivo de sintaxis donde se van guardando todas las instrucciones que llevan a cabo los comandos del SPSS. Este archivo es susceptible de ser modificado por el usuario. Muchos de los primeros usuarios del SPSS suelen escribir estos archivos en vez de utilizar el sistema de pegado del programa.

Existe un tercer tipo de fichero: el fichero de scripts (extensin. SBS). Este fichero es utilizado por los usuarios ms avanzados del software para generar rutinas que permiten automatizar procesos muy largos y/o complejos. Muchos de estos procesos suelen no ser parte de las salidas estndar de los comandos del SPSS, aunque parten de estas salidas. Buena parte de la funcionalidad de los archivos de scripts ha sido ahora asumida por la insercin del lenguaje de programacin Python en las rutinas de sintax del

SPSS. Procedimientos que antes solo se podan realizar mediante scripts ahora se pueden hacer desde el sintax mismo. El programa cuando se instala trae un determinado nmero de ejemplos o utilidades de casi todos los ficheros en cuestin. Estos son usados para ilustrar algunos de los ejemplos de uso del programa.

FICHERO DE DATOS DE SPSS Los ficheros de datos en formato SPSS tienen en Windows la extensin. SAV. Al abrir un fichero de datos con el SPSS, vemos la vista de datos, una tabla en la que las filas indican los casos y las columnas las variables. Cada celda corresponde al valor que una determinada variable adopta en un cierto caso. Adems de esta vista de datos, en las ltimas versiones del programa existe una vista de variables en la que se describen las caractersticas de cada una. En esta vista las filas corresponden a cada variable y las columnas nos permiten acceder a sus caractersticas:

Nombre, limitado a 8 caracteres. Tipo de variable (comprese este listado de opciones con los tipos de variables estadsticas existentes)
o o

Numrico, nmero en formato estndar) Coma decimal, nmero con comas cada tres posiciones y con un punto como delimitador de los decimales

Punto decimal, nmero con puntos cada tres posiciones y con una coma como lmite delimitador de los decimales.

Notacin cientfica, nmero que se expresa con un formato tal que se sigue de una E y un nmero que expresa la potencia de 10 a la que se multiplica la parte numrica previa

o o

Fecha Moneda dlar, formato numrico con el que se expresan cantidades en dlares

Moneda del usuario, formato numrico con el que se expresan cantidades en la moneda definida en la pestaa de monedas del cuadro de dilogo "Opciones"

Cadena de caracteres o variable alfanumrica

Tamao total Tamao de la parte decimal Etiqueta de la variable Etiquetas para los valores Valores perdidos Espacio que ocupa en la vista de datos Alineacin de la variable en la vista de datos Escala de medicin.

Algunos usuarios pasan por alto las caractersticas de las variables cuando se trabaja en la base de datos. Sin embargo, cuando se utilizan scripts o Python las caractersticas de las variables pueden tomar gran relevancia en la construccin de procedimientos ad-hoc.

FICHERO DE SINTAXIS DE SPSS

Se pueden generar estos archivos de sintax con la ayuda del programa mismo, pues en casi todas las ventanas donde se realizan tareas en el SPSS existe un botn "Paste". Este botn cierra la ventana en cuestin y guarda la sintaxis de las acciones seleccionadas en dicha ventana. Una vez salvado este archivo es susceptible de modificacin. La sintaxis tal cual se presenta a continuacin fue producida directamente con el SPSS. Este programa le da un formato legible a la sintaxis, formato que el software en algunos casos no requiere para su correcto uso. Otra peculiaridad de las sintaxis del SPSS es que no son "case sensitive". Ante lo cual es comn ver sintaxis escritas en solo maysculas, solo minsculas o bien una combinacin propia de cada usuario. Esta situacin se modifica para aquellas personas que hacen uso de Python dentro de sus sintaxis, pues este es un lenguaje sensitivo a las variaciones entre maysculas y minsculas. Esto obliga a estos usuarios a escribir sintaxis con mayor cuidado.

Una de las ventajas de este paquete es su facilidad en el manejo ya que mediante el despliegue de un men interactivo permite realizar todo tipo de operaciones sobre los datos como as tambin aplicar distintas tcnicas estadsticas. Los pasos bsicos en el anlisis de datos utilizando este paquete son: Creacin de la base de datos desde SPSS o bien la captura de los datos desde otro archivo. Seleccin de los procedimientos de anlisis a emplear. Seleccin de las variables para los distintos anlisis. Anlisis de los resultados.

En este documento se desarrollan estos cuatro pasos poniendo especial nfasis en el primero de ellos, la manipulacin de datos y el anlisis descriptivo de los mismos. A continuacin algunas caractersticas generales del programa, la forma en que se inicia una sesin y se cargan los datos, de que manera se pueden transformar los datos, como re codificar variables, ordenar los datos, particionar y unir bases de datos. Por ltimo se presentan algunos procedimientos estadsticos que ofrece el programa y que se consideran de utilidad para el trabajo particular.

Pantallas bsicas: Durante el transcurso de una sesin en SPSS se activan bsicamente dos pantallas: la que corresponde al editor de datos y el visor de resultados.

La primera de ellas se activa automticamente cuando se inicia la sesin, mientras que la otra se habilita al efectuar algn procedimiento. Esta ltima se encuentra subdividida en dos partes: a la izquierda de la pantalla aparece una estructura de rbol que muestra los procedimientos realizados y en que orden se efectuaron. A la derecha aparecen los resultados propiamente dichos, tales como tablas de frecuencias, grficos, los resultados del clculo de medidas descriptivas, etc.

Por supuesto, para obtener resultados de cualquier tipo es preciso tener cargado un conjunto de datos, ya sea mediante el ingreso directo de los mismos o mediante la captura de la informacin a partir de otro archivo.

Otra caracterstica del programa que facilita su utilizacin es el uso de ventanas de dilogo que permiten elegir las variables a utilizar y especificar las opciones del procedimiento. Al respecto, todas estas ventanas funcionan de la misma manera: en general, a la izquierda aparece un cuadro donde se muestra la lista de variables del archivo disponibles para el procedimiento que se desea realizar.

Simplemente se marcan haciendo un click con el botn izquierdo del mouse arriba del nombre de la variable que corresponde quedando marcada con lo cual se habilita el botn flecha que permite pasar de cuadro esa variable, o directamente con un doble click del mouse. De la misma manera, cuando las especificaciones mnimas del procedimiento ya estn completas se habilita el botn ACEPTAR (OK). Si esto no ocurre, significa que hay alguna especificacin incorrecta o incompleta por lo cual hay que revisar las opciones y variables ingresadas.

Inicio de una sesin:

Para comenzar una sesin en SPSS se hace simplemente un doble click sobre el cono correspondiente al programa y automticamente se activa la ventana de edicin de datos cuyo aspecto es semejante al de una planilla de clculo.

Como se dijo anteriormente, el primer paso en cualquier anlisis consta o bien en la carga de los datos directamente o si stos estn grabados en otro archivo (supongamos en una planilla de clculo EXCEL), en la captura de los mismos.

SPSS organiza la informacin de la siguiente manera: cada una de las filas constituye un caso o individuo y cada columna representa una variable o atributo observado en el individuo. De esta manera, al final de la carga de

datos se obtiene una matriz de datos con n filas y p columnas (n = cantidad de individuos, p = cantidad de variables).

Teniendo en cuenta este formato que utiliza el programa, se comienza la carga en la primera fila y primera columna de la planilla y no es aconsejable dejar filas en blanco intercaladas con filas completas ya que el programa asume que para esos individuos no se tiene informacin (valores perdidos del sistema). Ms an, si durante la carga de los datos quedan celdas sin ningn dato, el programa asigna un punto . indicando que es un valor perdido para ese individuo y variable en cuestin.

Otra caracterstica del programa es que mantiene activo slo un archivo de datos a diferencia de una planilla de datos en el que se pueden tener mltiples hojas activas.

Carga directa de los datos:

Para comenzar a cargar informacin en un archivo SPSS es preciso tener en cuenta las caractersticas de variable que aparecen en el sistema definidas por omisin. El formato es de tipo numrico, con ocho caracteres de extensin para la parte entera y dos posiciones para la parte decimal, escala de medida numrica (escala de razn) y alineacin a la derecha de las celdas.

Si el formato mencionado no se corresponde con el de la informacin que se desea ingresar, es posible cambiar alguno/s de estos atributos utilizando la opcin DEFINIR VARIABLE (en ingls, define variable)

disponible en el men desplegable DATOS (data) de la barra de menes o posicionado con el mouse sobre el encabezado de la columna (variable) en cuestin utilizando el botn derecho del mouse.

La ventana de dilogo que se despliega es la siguiente:

Como se ve, es posible cambiar el nombre de la variable que el sistema asigna por default (VAR00001) por el que el usuario desee, teniendo en cuenta que ste no puede superar los 8 caracteres de extensin, no se hace distincin entre minsculas y maysculas y que no es posible nombrar de la misma manera dos o ms variables en la misma base.

Adems en esta ventana aparecen cuatro botones: TIPO, ETIQUETAS, VALORES PERDIDOS y FORMATO DE COLUMNA. El primero de ellos se utiliza

para elegir el tipo de variable que se desea definir, a saber: numrico, fechas, moneda, notacin cientfica, alfanumrico, entre otros.

El segundo botn muestra la siguiente ventana y permite ingresar una etiqueta de variable cuya extensin puede alcanzar los 256 caracteres de extensin y a su vez, tambin es posible definir etiquetas de valor para cada valor distinto que tome la variable si es preciso, por ejemplo:

Por ltimo los botones VALORES PERDIDOS y FORMATO DE COLUMNA ofrecen distintas opciones para la definicin de valores faltantes y algunas caractersticas con respecto al ancho de la columna y tipo de alineacin respectivamente.

Un aspecto interesante cuando se cargan estos datos es que si se utiliza el modo ETIQUETAS (disponible en el men VISTA ETIQUETAS DE VALOR o en ingls VIEW VALUE LABELS) es posible ver en el visor de datos el rtulo que se corresponde con los valores ingresados. Adems como opcin de carga de datos es posible en lugar de tipear el valor de la variable, elegir del conjunto de rtulos definidos cual es el valor que se desea ingresar. Para ello, con el cursor en la celda en cuestin y el modo etiquetas activado, con el botn derecho del mouse se despliega un men con la opcin Elegir valores desde las etiquetas (en ingls, pick values from labels).

Suponiendo que la variable a ingresar sea el sexo, cuyos valores y rtulos sean 1= femenino y 2= masculino respectivamente, se pueden cargar los valores 1 o 2 directamente, o bien eligiendo del conjunto de rtulos los valores femenino o masculino. De esta manera, siempre se cargarn valores vlidos para la variable lo cual resulta muy importante para no cometer errores que afecten la consistencia de los datos codificados.

Por ltimo, stas etiquetas sern utilizadas como rtulos en las salidas de los distintos procedimientos que se apliquen como ser tablas de frecuencias o grficos.

Importacin de datos a partir de una planilla de clculo:

Si la planilla a importar est grabada en formato Excel 5 o superior pero los datos estn contenidos en una sola hoja de clculo, primero hay que grabarla en versin Excel 4 y luego proceder a su captura. Para ello, se utiliza la opcin ARCHIVO ABRIR (FILE OPEN) de la barra de menes y seleccionar la extensin .xls (archivo excel) como as tambin especificar en que subdirectorio est guardada la planilla. Una vez marcada la hoja que se desea abrir, el programa muestra una ventana de dilogo como la que aparece a continuacin:

Como es comn que en la primera fila de la planilla Excel aparezcan los encabezados con los nombres de las variables, cuando se capturan los datos es necesario aclararlo haciendo click en el cuadradito leer nombres de variables que aparece a la izquierda de la ventana de dilogo si es que efectivamente en la primera fila de la planilla se encuentran los nombres de las columnas. Por otra parte, si la informacin que se desea recuperar est

grabada en un rango de la hoja, puede especificarse el rango en cuestin en el rengln que aparece en la misma ventana, por ejemplo, A1:W290.

Por otra parte, si los datos que se necesitan estn grabados en un archivo EXCEL 5.0 o superior y adems estn ordenados en dos o ms hojas de clculo, o bien solo se desea importar un subgrupo de registros que cumplan ciertas condiciones, la forma de recuperar estos datos es creando una consulta.

Para ello, seleccionando del men ARCHIVO la opcin CAPTURA DE BASES DE DATOS NUEVA CONSULTA (DATABASE CAPTURE NEW QUERY).

En este momento se despliega un asistente que permite ir armando paso a paso la consulta deseada, siguiendo la secuencia utilizando los botones siguientes y atrs que aparecen al pie de la ventana de dilogo.

Como puede verse en el cuadro, permite la importacin de datos grabados en distintos formatos: planillas Excel, Bases de datos Microsoft Access, archivos de texto entre otros.

En este curso se ver especficamente la captura de datos provenientes de planillas de clculo Excel.

Una vez seleccionado el archivo a importar, aparecen en la ventana izquierda todas las hojas que lo componen para su seleccin. En esta ventana, haciendo click en el signo + se despliega la lista de variables que componen la hoja, con lo cual se puede elegir un subgrupo de ellas para importarlas a SPSS.

Por otra parte, si se desea trabajar con la hoja completa, haciendo doble click sobre el nombre de la misma, automticamente quedan todas las variables seleccionadas para su importacin.

Adems, si lo que se tiene en cada hoja de clculo son distintas variables para el mismo conjunto de registros (individuos) y existe una variable que permita relacionar los registros de cada hoja, es posible identificar tales relaciones cuando se genera la consulta para que los datos correspondientes al mismo individuo sean importados en un solo registro.

Otra de las posibilidades que ofrece el programa es importar los datos que cumplan con cierta condicin, lo cual puede hacerse desde la siguiente pantalla:

Con el cursor ubicado en la primera celda de la columna Expresin 1, se despliega una lista con todas las variables del archivo, de la cual se puede elegir una de ellas para escribir la primera condicin que se desea que cumplan los registros a importar basados en esta variable elegida. La columna relacin permite elegir entre un conjunto de smbolos tales como igual, distinto, mayor, menor, mayor o igual y menor o igual para poder escribir la condicin deseada. En la columna Expresin 2 nuevamente es posible elegir entre el conjunto de variables disponibles o bien ingresar un valor para la variable seleccionada en Expresin 1. Si se desea incorporar ms de una condicin, stas se van vinculando eligiendo de la columna conector la opcin y u o segn se desea que las condiciones se cumplan simultneamente o al menos una de las condiciones se cumpla para la importacin de los datos.

Si el usuario as lo desea, puede guardar estas especificaciones en un archivo para que la prxima vez que desee trabajar con este conjunto de datos, el programa realice la seleccin e importacin directamente. Las especificaciones de la consulta pueden guardarse en un archivo con extensin .spq. En esa ocasin, deber utilizar la opcin CAPTURA DE BASES DE DATOS CORRER CONSULTA (DATABASE CAPTURE RUN QUERY).

Con los datos ya capturados, pueden realizarse cambios de formato de variables y definir rtulos tanto para las variables como as tambin para los valores que asumen siguiendo los pasos antes detallados.

Transformacin de valores de los datos: A diferencia de una planilla de clculo, SPSS no permite el ingreso de frmulas como valor de una celda. Si es necesario definir nuevas variables que resultan de operaciones a partir de variables ya existentes puede utilizarse el men TRANSFORMAR, eligiendo la opcin CALCULAR VARIABLE (TRANSFORM COMPUTE VARIABLE). ventana de dilogo: A continuacin se muestra la

Esta opcin permite efectuar operaciones de tipo matemticas, lgicas e inclusive incluir restricciones utilizando el botn SI... En la ventana Variable de destino se debe especificar el nombre de la nueva variable y en Expresin numrica se pueden incluir variables ya existentes marcndolas con un click y apretando la flecha de la derecha para pasarlas de ventana, como as tambin se puede escoger alguna de las funciones que aparecen a la derecha y pasarlas a la ventana de expresin utilizando la flecha superior.

Una vez completada la expresin, se presiona ACEPTAR y en el editor de datos aparecer la nueva variable.

Recodificacin de variables: Otra posibilidad que permite el programa es cambiar los valores que asume una de las variables, ya sea por medio de una reasignacin de valores sobre la misma variable o bien creando una nueva variable.

Por ejemplo, para la variable sexo se tienen definidos dos valores de la siguiente manera: 1 = femenino 2 = masculino. En algn momento puede surgir la necesidad de cambiar esa asignacin a esta otra: 1 = femenino - 0 =masculino. Para ello, con la opcin TRANSFORMAR RECODIFICAR (TRANSFORM RECODE...) y eligiendo alguna de las dos opciones: que la recodificacin la realice en la misma variable o que genere otra distinta, aparecer segn corresponda alguna de las ventanas de dilogo siguientes:

Como puede observarse en ambas ventanas aparece un botn VALORES NUEVOS Y VIEJOS (OLD AND NEW VALUES) en el que se ingresa la nueva codificacin de la variable. Otra de las opciones disponibles es definir alguna restriccin al cambiar la codificacin, utilizando el botn SI... que se presenta para tal fin. En el caso de recodificar la variable en cuestin definiendo una nueva, la ventana de dilogo permite adems de especificar el nombre de la nueva variable, la posibilidad de definir una etiqueta para esta ltima. Como siempre, una vez definidas todas las opciones se pulsa el botn ACEPTAR.

Como cambiar el orden de los datos: Otra herramienta de inters cuando se trabaja con un gran conjunto de datos es la que refiere al orden en que se visualizan los datos e inclusive algunos procedimientos requieren que los datos estn ordenados de acuerdo a ciertos criterios antes de realizar la operacin en cuestin. As, SPSS por medio de la opcin DATOS ORDENAR CASOS (DATA SORT CASES) permite cambiar el orden de las observaciones de la base. Esta operacin

puede realizarse utilizando como criterios de orden tanto variables numricas como alfanumricas, en orden ascendente o descendente. Adems se permite incluir ms de un criterio (variable) de orden. Por ejemplo, puede ser necesario querer ordenar la base segn categora de empleo (1 criterio) Y edad (2 criterio). De esta manera, el programa comienza ordenando los registros segn los valores de la primera variable y para los valores repetidos de sta, se ordenan los datos utilizando la segunda variable seleccionada.

Seleccin de casos: Cuando se present el mdulo de captura de datos desde otros archivos, se mencion la posibilidad de importar solo un subgrupo de individuos de la base incluyendo en la consulta una restriccin.

Otra posibilidad para seleccionar solo un grupo de individuos es por medio de la opcin DATOS SELECCIONAR CASOS (DATA SELECT CASES)

Aparecer una ventana de dilogo como la que se presenta ms adelante en la cual se puede optar entre distintas alternativas. La primera de ellas es seleccionar todos los casos y es el modo en que se encuentra SPSS por omisin.

La segunda alternativa es definir una condicin a partir de los valores de una o ms variables del archivo para elegir los casos que cumplan con ella. Al elegir esta opcin se activa el botn SI... (IF...) para poder ingresar la condicin en cuestin.

La tercera posibilidad que ofrece la ventana es la seleccin aleatoria de casos, ya sea un porcentaje del archivo o un nmero exacto de casos. Si dentro del conjunto de variables alguna de ellas ha sido definida utilizando la opcin definir fechas es posible seleccionar casos utilizando dicha variable.

Por ltimo, si se cuenta con una variable dicotmica, es decir que solo tome valores 0 o 1 indicando ausencia o presencia de cierto atributo, la misma puede utilizarse como variable de filtrado.

Al pie de la ventana de dilogo aparecen dos burbujas que permiten optar entre solo filtrar los casos no seleccionados, es decir en la ventana de edicin de datos, los casos no seleccionados aparecern con el nmero de fila tachado, o bien reemplazar el archivo de datos actual por aquel en que slo aparecen los casos seleccionados. Una de las precauciones que deben tenerse cuando se utiliza esta opcin es que si se graba este archivo sin cambiar el nombre del mismo, no podrn recuperarse los casos borrados. En cambio, si se eligi el modo filtrado, usando nuevamente la ventana de dilogo de seleccin de casos y eligiendo la opcin seleccionar todos los casos, se recuperan los datos originales para su uso. Pegado de Bases: agregado de variables: Puede ocurrir que en alguna oportunidad se generen ms de una base a partir de la informacin de una encuesta. Por ejemplo, puede tenerse una base que contenga nicamente los datos personales de las personas encuestadas y otra base en la que se registran las variables de un mdulo especfico de una encuesta. Si en algn momento se necesita tener toda la informacin en un solo archivo, esto puede hacerse utilizando la opcin DATOS FUNDIR ARCHIVOS AGREGAR VARIABLES (DATA MERGE FILES ADD VARIABLES).

Para realizar a cabo esta operacin es necesario tener ciertas precauciones. Como puede verse en la ventana de dilogo, se identifican las variables del archivo activo con un (*) mientras que las variables del otro archivo (archivo externo) se identifican con (+). Para llevar a cabo este agregado de variables, es posible aparear los registros de ambas bases si lo que se intenta es agregar nueva informacin para el mismo conjunto de registros de la base que se encuentra activa. Para ello es preciso que ambos archivos tengan al menos una variable o un conjunto de ellas que permitan identificar claramente cada registro (individuo) y que adems estn ordenados con el mismo criterio y en orden ascendente. De otra manera, el programa pegar las nuevas columnas al archivo sin ningn apareamiento de los registros.

Por otro lado, pueden elegirse cules son las variables que se desean incluir en el nuevo archivo y renombrar alguna de ellas si es que hace falta.

No necesariamente ambos archivos tendrn los mismos individuos, con lo cual se ofrecen tres opciones: que ambos archivos aporten individuos para el nuevo fichero de datos, tomar como base el archivo externo o bien tomar como base los casos presentes en el archivo activo. Para esto es necesario que en ambas bases se tenga una variable de identificacin de individuos (variable clave) y que ambas bases estn ordenadas de la misma manera segn esa variable clave. Pegado de Bases: agregado de individuos: Otra posibilidad es que se tengan en dos bases distintas, dos grupos de individuos diferentes y que en algn momento se desee juntarlos en una base comn. En este caso, debe tenerse la seguridad que ambas bases tengan la misma estructura, es decir las mismas variables definidas con el mismo nombre, formato y longitud. En ese caso, utilizando la ventana de dilogo que se despliega al seleccionar la opcin DATOS FUNDIR ARCHIVOS AGREGAR CASOS (DATA MERGE FILES ADD CASES) se puede seleccionar el archivo que se desea pegar con la base activa.

Si existieran variables no coincidentes en ambos archivos, las variables del archivo activo se identifican utilizando (*) y las del archivo externo con (+). Tambin se encuentra disponible la opcin de renombrar alguna variable si as se desea. Otra posibilidad es la de casar variables que aparecen en los dos archivos pero con nombres distintos o con distintos formatos. Para ellos se seleccionan las dos variables en cuestin, se pulsa el botn EMPAREJAR (PAIR) y aparecern en la ventana de la derecha indicando que esa variable aparecer en el nuevo archivo y se utilizar como nombre de la variable el utilizado en el archivo activo. Se finaliza la operacin pulsando ACEPTAR.

Generacin de un archivo resumen: Si se desea generar a partir de la base de datos un nuevo archivo que resuma informacin de los individuos al guardar informacin agregada (por ejemplo generar registros con valores promedios de alguna caracterstica segn grupos de individuos u otra medida que resuma informacin del grupo al cual representa). Para esto, se selecciona la opcin DATOS AGREGAR (DATA AGGREGATE...) y se despliega la siguiente ventana de dilogo:

Como puede verse aparecen dos cuadros, uno en el que se definen las variables de corte o agrupamiento, por ejemplo, categora de empleo y clasificacin de minora. Ms abajo aparece el cuadro de variables

agregadas, por ejemplo el salario. Con respecto a las variables elegidas en este cuadro, debe tenerse la precaucin de que las mismas sean numricas (de otro forma no tendra sentido calcular promedios, mximos, mnimos, etc.). Pulsando la tecla funcin que aparece debajo del cuadro de variables agregadas es posible elegir que informacin se desea guardar. Entre las opciones figuran el promedio (es la opcin que aparece en la figura), el valor mximo, el mnimo, desvo estndar, entre otros. Otra informacin disponible para ser incluida es la cantidad de casos que se presenta en cada grupo definido o dicho de otra manera, es posible definir una nueva variable que seale que un registro en cuestin resume la informacin de N_BREAK

individuos de la base original. Para ello se tilda esta opcin en el cuadradito que aparece al pie de la ventana de dilogo y si bien N_BREAK es el nombre que el programa asigna por default, es posible cambiarlo. Tambin puede optarse entre crear un nuevo archivo de datos y elegir el nombre del mismo como as tambin donde almacenarlo (utilizando el botn ARCHIVO) o bien, reemplazar el archivo actual. Nuevamente, si se opta por esto ltimo debe tenerse la precaucin de guardar el nuevo archivo con un nombre distinto al fichero que le dio origen, ya que se perder la informacin original.

Divisin del archivo de datos. Si se desean realizar anlisis separados para subgrupos del archivo es posible dividir la base utilizando la opcin DATOS SEGMENTAR ARCHIVO (DATA SPLIT FILE) basndose en los valores de una o ms variables de agrupamiento (pueden utilizarse hasta 8 variables). Si se seleccionan varias variables de agrupamiento, es necesario que la base completa est ordenada con el mismo criterio de agrupamiento definido. Es por esto que aparecen dos burbujas que permiten indicar si los datos ya estn ordenados de acuerdo a esos criterios o si es necesario ordenar los datos para luego realizar la segmentacin del archivo.

Esta operacin permite definir distintos grupos que sern utilizados posteriormente para anlisis de tipo comparativo.

Anlisis de la Informacin: estadsticas descriptivas. Una prctica usual en todo estudio es la de realizar un primer anlisis descriptivo de la informacin recopilada. Para ello, SPSS ofrece varias herramientas, entre ellas la construccin de tablas de frecuencias, clculo de algunas medidas como ser promedios, medianas, modos, desvos estndar, etc. adems de la posibilidad de construir grficos que ayudan a la visualizacin de los resultados obtenidos.

Construccin de Tablas de Frecuencias: Utilizando la opcin ANALIZAR ESTADISTICAS DESCRIPTIVAS FRECUENCIAS aparecer una ventana de dilogo como la siguiente la cual permitir seleccionar para que variable o grupo de variables se desea informacin resumen.

En primer lugar permite la opcin de imprimir una tabla de frecuencias para las variables seleccionadas.

En la parte inferior de la ventana aparecen tres botones que ofrecen nuevas ventanas con opciones. El primero de ellos, ESTADISTICAS permite marcar el clculo de percentiles, medidas de tendencia central, medidas de dispersin y algunas relacionadas con la forma de la distribucin de los datos.

Si se hace un click en el botn grficos, es posible optar entre no incluir grficos en la salida del procedimiento o incluir grficos de barras o grficos de sectores, adecuados en el caso de tener variables con valores de tipo discreto o bien, datos categricos. En cambio si la variable en estudio es de tipo continua, el grfico ms apropiado es el histograma. Tambin es posible elegir si lo que se quiere graficar son frecuencias o porcentajes. Por ltimo, el

botn formato est destinado a opciones de orden. Los dos criterios disponibles son ordenar de acuerdo a los valores de la variable o segn frecuencias observadas. Anlisis exploratorio de los datos: SPSS ofrece otras dos opciones interesantes para el anlisis de los datos. Una de ellas se encuentra en el men ANALIZAR ESTADISTICAS DESCRIPTIVAS DESCRIPTIVAS.

Esta ventana ofrece el clculo de las mismas medidas que antes, pero con la posibilidad de estandarizar los datos previamente. Esto permite bsicamente comparar datos de variables cuyas unidades de medidas son diferentes ya que el estandarizado anula este efecto.

Otra opcin se dispone en el men ANALIZAR ESTADISTICAS DESCRIPTIVAS EXPLORAR. En la ventana que se despliega aparecen las todas las variables disponibles para marcarla pasarlas al rengln que

corresponda. A la derecha hay tres cuadros: el primero, dependientes, es al que enviarse los nombres de las variables para la que se desea la informacin requerida.

Ms abajo, en el cuadro factores es posible utilizar una variable para definir grupos y obtener anlisis separados para cada uno de ellos. Por ltimo, en el rengln inferior es posible seleccionar una variable para etiquetar o clasificar los casos de acuerdo a las clases de esa variable.

Tambin se presentan tres botones: el de ESTADISTICOS permite elegir que informacin estadstica se desea reportar en la salida. Adems de los estadsticos que se ofrecen en el men FRECUENCIAS o DESCRIPTIVAS es posible optar por estadsticos robustos e inclusive listar valores extremos. Esta ltima opcin es realmente til cuando se conoce poco sobre la variable

en estudio y tambin, cuando se tiene pensado aplicar alguna tcnica que pueda ver afectados sus resultados por la presencia de datos atpicos o raros.

El botn GRAFICOS ofrece la posibilidad de hacer grficos de caja, histogramas y grficos de tallo y hoja. Adems, es posible realizar un test no paramtrico para estudiar la normalidad de la/s variable/s y elegir alguna transformacin sobre los datos si fuera necesario. Estas opciones son bastantes avanzadas por lo que se recomienda su utilizacin guiados por algn estadstico ya que apuntan principalmente a estudiar el supuesto de normalidad de los datos.

Con respecto al botn OPCIONES es posible elegir que actitud tomar con respecto a los valores faltantes que aparezcan en el archivo. Estas opciones son excluir los casos con faltantes de todos los anlisis, excluirlos nicamente para las variables en los que aparezca el faltante o crear una categora adicional para los faltantes.

Tablas de contingencia: Se accede a este procedimiento a travs del men ANALIZAR ESTADISTICAS DESCRIPTIVAS TABLAS DE CONTINGENCIA. Ofrece la posibilidad de crear tablas con dos o ms criterios de clasificacin como as tambin algunas pruebas y medidas de asociacin para tablas de dos clasificaciones. En este curso slo se ver este procedimiento con fines

descriptivos ya que para la utilizacin de los valores de las pruebas mencionadas es necesario tener en cuenta ciertos aspectos referidos al diseo del estudio y poder determinar as si los supuestos que se requieren para que los resultados de los tests sean vlidos se cumplen o no.

La ventana de dilogo que se despliega es la siguiente

Como siempre, a la izquierda aparece la lista con las variables del archivo las cuales pueden pintarse y pasarse hacia los cuadros de la derecha segn sea necesario. El cuadro superior Filas se utiliza para definir la/s variable/s que se definen como clasificacin Fila de la tabla, al igual que las variables que se pasan al cuadro columnas.

Como variables de capa deben marcarse aquellas variables para las que se quieren tablas cruzadas de Filas x Columnas separadas para cada

una categora de la/s variable/s de capa. Por ejemplo, si se desea construir una tabla de duracin de la carrera segn el plan de estudio de la carrera elegida separada para cada sexo, en Filas se incluira la variable DURAC; en Columnas se ingresa PLAN y como Capa se incluye la variable SEXO.

Al pie de la ventana de dilogo aparecen tres botones. Las opciones que ofrece el botn ESTADISTICOS se refieren a distintas medidas de asociacin entre las variables de la tabla clasificadas de acuerdo a la escala de medida de las variables en cuestin.

El botn CASILLAS se utiliza para definir que tipo de informacin se requiere en el cuerpo de la tabla. Se pueden incluir frecuencias observadas (contando los casos a partir del archivo de datos), frecuencias esperadas (son las que resultaran si un modelo de asociacin supuesto fuera cierto y se las utilizan para ver si ese modelo se ajusta a los datos observados), porcentajes con respecto a totales por fila, por columna o el total general y residuos (la diferencia entre las frecuencias observadas y esperadas).

Por ltimo, el botn FORMATO permite definir el orden de las filas segn los valores de la variable fila.

Generacin de tablas con medidas de resumen:

Otra de las opciones que ofrece el programa para presentar cuadros con informacin resumen acerca de una variable o grupo de variables son las

que se presentan en el men ANALIZAR ESTADSTICAS DESCRIPTIVAS TABLAS USUALES TABLAS BSICAS (ANALIZE DESCRIPTIVE STATISTICS CUSTOM TABLES BASIC TABLES).

La ventana de dilogo que se despliega es la siguiente:

En la ventana superior se ingresa la variable o grupo de variables para las que se desea resumir informacin, por ejemplo la media, mediana y modo.

A su vez, se pueden elegir variables de corte o agrupamiento para presentar la informacin requerida. De esta forma se seleccionan las variables cuyos valores formarn los grupos y se disponen en las casillas correspondientes a filas, columnas y si es preciso en tablas separadas para valores distintos de alguna/s variable/s.

En el botn ESTADSTICAS (STATISTICS) se encuentran las medidas disponibles que sern presentadas en la tabla. Entre ellas se cuentan el promedio, la mediana, el modo, varianza, desvo standard, porcentajes con respecto a las filas, columnas, etc.

El botn LEYENDAS (LAYOUT) permite elegir de qu manera aparecen los encabezados de la tabla y los ttulos indicando las medidas que se presentan entre otras.

El botn TOTALES como su nombre lo indica permite agregar totales a la tabla, ya sean para cada variable de agrupamiento o marginales de cada tabla. Por ltimo, los botones FORMATO y TITULOS permiten definir de qu manera se sealan los valores faltantes en la tabla como as tambin agregar ttulos explicativos respectivamente.

Una vez que se completan todas las especificaciones, la tabla aparece en el visor de resultados. Si se eligi alguna variable en la casilla tablas separadas, este procedimiento genera tablas distintas para cada valor distinto de la variable elegida pero en la ventana de resultados solo aparece una de ellas. Para ver las restantes, simplemente es preciso hacer doble click en la tabla y aparecer un en la esquina superior izquierda una leyenda con el nombre de la variable que define las tablas separadas y a que valor de sta corresponde la tabla que se encuentra visible, acompaado por una flecha la

cual permite desplegar el resto de los valores que toma la variable para poder ver las restantes tablas. De esta manera puede observarse las distintas tablas que genera el procedimiento.

Otra opcin, un poco ms sofisticada para construir tablas de este tipo se encuentra en el men ANALIZAR ESTADSTICAS DESCRIPTIVAS TABLAS USUALES TABLAS GENERALES (ANALIZE DESCRIPTIVE

STATISTICS CUSTOM TABLES GENERAL TABLES).

En este caso la ventana de dilogo es la siguiente.

El funcionamiento de esta ventana es bastante parecido al presentado anteriormente en el sentido que permite construir tablas con informacin resumen sobre una variable o grupo de ellas discriminada de acuerdo a variables de corte o agrupamiento que definan filas y columnas a partir de los valores distintos en estas variables.

Una caracterstica distintiva es que cada vez que se selecciona una variable para las casillas filas, columnas o leyenda es que estn disponibles dos burbujas para elegir si los valores de la variable seleccionada definen grupos o si para esta variable se presentan valores de resumen.

A su vez, si en alguna casilla se eligen dos o ms variables tambin es posible elegir entre anidar (Nest) los valores distintos de las mismas para definir grupos que resulten de combinar los valores de cada una de ellas o si se desea que se las trate por separado (UnNest).

Otra de los botones disponibles permite agregar a la tabla los totales que correspondan a las variables que se eligen para definir grupos, si es que se desea.

Por ltimo, para las variables que se desean resumir (mostrar medidas descriptivas de resumen) utilizando el botn EDITAR ESTADSTICAS (EDIT STATISTICS) se puede elegir que medida/s se desean presentar.

Si se desean tablas separadas de acuerdo a los valores distintos de alguna/s variable/s es preciso indicarlo en la casilla LEYENDA, y en la ventana de resultados se ver slo una de las tablas y las restantes se pueden mostrar haciendo doble click sobre la tabla y eligiendo de las opciones que despliegan en la leyenda se recorren todas las tablas generadas.

Creacin de Grficos Descriptivos: Otra forma de crear grficos en SPSS es utilizando el men grficos, el cual despliega una serie de opciones que permite elegir el tipo de grfico deseado. Entre ellos es posible crear grficos de lneas, de barras, sectores, histogramas, etc. Como siempre, cada opcin despliega ventanas de dilogo en las que se ingresa/n la/s variable/s a graficar y distintas opciones.

Si se desea obtener rpidamente una idea de los grficos disponibles en el paquete como as tambin una ayuda rpida sobre cmo realizar el grfico deseado, en la opcin GALERA (GALLERY) aparece una ventana con las distintas opciones y la posibilidad de hacer doble click sobre el grfico de inters y obtener as una breve descripcin del tipo de grfico y la forma de generarlo en SPSS.

La salida aparece en el visor de resultados y se permite la edicin del mismo haciendo simplemente un doble click en cualquier parte del mismo y se desplegar una barra de herramientas con opciones para el cambio de efectos de relleno, escala, tipo de lneas, marcadores de valores, definicin de ttulos y etiquetas, etc. Anlisis de regresin: Esta tcnica estadstica es quiz una de las ms utilizadas en diversas reas de estudio, tales como la economa, biologa, fsica, ciencias sociales, etc.

El anlisis de regresin es la metodologa estadstica para predecir valores de una o ms variables respuesta (tambin llamada variable dependiente) a partir de una o ms variables explicativas (variables independientes o predictoras).

Sea X1, X2 ... Xp un conjunto de p variables explicativas que se piensan relacionadas con la variable respuesta Y. Por ejemplo para p=2:

Y= tiempo de reparto X1 = cantidad de productos. X2 = distancia recorrida.

El modelo de regresin clsico establece que Y est compuesto por una media, la cual depende de manera continua de las Xs y un error aleatorio que da cuenta del error de medida y el efecto de variables no consideradas explcitamente en el modelo. Por ltimo se considera que los valores de las variables explicativas son fijos y que el error es una variable aleatoria cuyo comportamiento est caracterizado por ciertos supuestos distribucionales.

Especficamente el modelo de regresin lineal con dos variables explicativas puede expresarse de la siguiente manera: Y = 0 + 1 X1 + 2 X2 +

Dicho en otras palabras, la respuesta puede expresarse por una media que depende de las variables explicativas o independientes + un trmino de error aleatorio.

Para finalizar los supuestos que se hacen sobre los residuos o errores aleatorios son los siguientes: - La esperanza de los errores es igual a cero. - La varianza de los errores es constante igual a 2.

- Los errores son no correlacionados - Los errores se distribuyen igual e independientes segn una distribucin normal.

Para realizar un Anlisis de regresin utilizando el programa SPSS es preciso hacerlo desde la opcin ANALIZAR REGRESIN LINEAL (analic regression linear). Con esta opcin es posible estimar los coeficientes s del modelo de regresin planteado, obtener valores ajustados y residuales del modelo de regresin, calcular la tabla de anlisis de la varianza (ANOVA) que permite probar la bondad del modelo planteado y otras medidas adicionales para evaluar el ajuste. La ventana de dilogo que aparece es la que se muestra a continuacin:

En la casilla Dependiente (dependent) se ubica el nombre de la variable que se quiere explicar por un modelo de regresin, (variable Y, dependiente o respuesta) y en la casilla de Independientes las correspondientes variables explicativas o Xs.

Con respecto al mtodo hace referencia a distintas opciones que dispone el programa para incluir las variables Xs al modelo y estas opciones se utilizan bsicamente cuando se desea encontrar el mejor modelo de regresin para una variable Y. En este curso solo utilizaremos la opcin ENTER, es decir todas las variables que se seleccionan como independientes o explicativas ingresan al modelo de regresin que se est ajustando.

Otra de las posibilidades que ofrece la ventana es la de ajustar el modelo propuesto para un grupo de los casos basndose en los valores de la variable que se seleccione en la casilla Variable de Seleccin (Selection Variable). Si esta casilla se deja en blanco, todas las observaciones del archivo se utilizarn para el ajuste del modelo. Por ltimo, es posible utilizar los valores o etiquetas de alguna variable para identificar casos en los grficos que se efecten indicando dicha variable en la casilla Etiqueta de casos (Case labels).

En el botn ESTADISTICAS (Statistics) se encuentran disponibles distintas opciones acerca de que informacin aparecer en la ventana de salida o resultados: entre ellas se encuentran las estimaciones de los parmetros del modelo, intervalos de confianza para los parmetros,

varianzas y covarianzas de los mismos. Con respecto al ajuste por default aparece el cuadro de anlisis de la varianza, medidas descriptivas, correlaciones, etc. Tambin aparecen algunas medidas referidos a los residuos que aportan informacin al momento de corroborar los supuestos del modelo basndose en los residuos del ajuste.

En el botn GRAFICOS (Plots) es posible definir grficos de dispersin, probabilsticos normales e histogramas que ayudan a la evaluacin del modelo. Por otro lado, utilizando el botn GRABAR (save) se pueden generar nuevas variables donde se graben los valores ajustados por el modelo de regresin, residuales, algunas estadsticas de diagnstico, entre otras.

Introduccin al Anlisis de series de tiempo:

Referido al tema Series de tiempo, el programa SPSS cuenta con varios procedimientos, entre ellos suavizado exponencial, modelos ARIMA, e inclusive un mdulo con opciones para ajustar series estacionalmente utilizando el programa X11 Arima.

Bsicamente es preciso antes de utilizar alguno de estos mens generar fechas utilizando la opcin DATOS DEFINIR FECHAS e indicar el tipo de fecha que se desea generar (en general, ao y mes) y desde que perodo se desea generar tales fechas. Si se elige el formato ao y mes, el

programa genera automticamente una variable indicadora del ao, otra para el mes y una tercera indicadora de perodo que es la que se utiliza generalmente para el eje del tiempo en los grficos que se construyan.

Para seleccionar alguno de estos procedimientos es necesario tener una idea previa acerca de los posibles efectos que tenga la serie a analizar, ya sea estacionalidad, tendencia o ambos.

La ventana de dilogo correspondiente al suavizado exponencial (exponential smoothing) permite ajustar modelos simples sin tendencia ni estacionalidad (simple), modelos que slo presentan tendencia lineal (Holt), modelos con tendencia lineal y estacionalidad usuario (Custom). (Winters) y modelos definidos por el

Por su parte, la opcin Autorregresin (autorregression ) permite el ajuste de un modelo de regresin cuyos residuos siguen el comportamiento de un proceso autorregresivo de primer orden.

El men ARIMA permite el ajustar las series utilizando modelos autorregresivos-promedios mviles, teniendo el usuario que definir el orden de los procesos autorregresivos y promedios mviles respectivamente. Para ello es importante comenzar el anlisis observando la funcin de autocorrelacin para tener una idea del posible orden de los polinomios mencionados.

Las ventanas de dilogo que se despliegan para cada una de las opciones que ofrece el submen de series de tiempo son las siguientes:

- Suavizado Exponencial: en esta ventana es posible elegir ajustar una serie de tiempo ya sea que la misma no tenga tendencia ni estacionalidad (modelo simple), solo tenga tendencia (modelo Holt), que tenga tendencia lineal y estacionalidad (modelo Winters) o un modelo definido por el usuario (custom). Si la serie tiene estacionalidad, puede mejorarse el ajuste si primero se estiman los coeficientes estacionales con la opcin DESCOMPOSICION ESTACIONAL de este mismo submen e indicndolo en la casilla Factores estacionales (Seasonal Factors). Utilizando el botn Gravar (save) es posible indicar que se guarden tanto los valores ajustados de la serie por el modelo utilizado como as tambin los residuos del

ajuste. Por otro lado, el botn Parmetros (parameters) permite indicar si se ajustar la serie utilizando valores de parmetros fijados por el usuario o si se desea que el programa los estime iterativamente.

- Ajuste de modelos ARIMA: Esta ventana de dilogo permite ajustar modelos Autorregresivos Promedios mviles integrados. En el caso de ajustar una sola serie se define como variable dependiente a la serie que se desea ajustar y se completan las casillas correspondientes al orden correspondiente a la parte autorregresiva (p), diferencias (d) o promedios mviles (q), tanto para la parte ordinaria como la parte estacional (seasonal).

Desestacionalizacin utilizando el mdulo X11Arima: El programa SPSS permite ajustar series estacionalmente utilizando las opciones del paquete X11Arima. Para ello es preciso elegir la opcin que lleva este nombre en el submen de Series de Tiempo y la ventana de dilogo se presenta a continuacin:

En la casilla Variables se ingresa el nombre de la serie que se desea estudiar. Si se desea identificar el modelo ARIMA que ajusta los datos se marca en la casilla ARIMA, lo mismo ocurre si se desea corregir los valores extremos de la serie (modify extremes). Adems, en la esquina superior derecha estn las opciones para elegir entre modelos multiplicativos y/o aditivos.

Por otra parte, hay botones que permiten elegir distintas opciones para modelar la serie teniendo en cuenta el efecto das de actividad (trading days), como as tambin elegir los distintos filtros (promedios mviles) para la componente estacional y tendencia-ciclo.

Para terminar tambin dispone un botn para seleccionar que nuevas variables se desean guardar en la hoja de datos activa (serie estacionalmente ajustada, factores estacionales, tendencia-ciclo y residuales).

CONCLUCION
El conocimiento y utilizacin de software estadstico es indispensable hoy en da para una investigacin seria en ciencias. Tambin la toma de decisiones dentro de muchas organizaciones se sustenta en un anlisis preciso de datos, y deber utilizar este tipo de software.

Bien sea para describir o generalizar los datos obtenidos en nuestras investigaciones, bien para la bsqueda de informacin y toma de decisiones en otros contextos, es esencial un buen anlisis de datos. El SPSS (Statistical Package for the Social Sciences), al que injustamente se suele reducir a programa de anlisis estadstico, permite un tratamiento integrado de todas las fases que conlleva el anlisis de datos.

BIBLIOGRAFA
- SPSS inc. (1997) Gua del usuario del sistema base de SPSS para Windows. - Visauta Vinacua, B. (1997) Anlisis estadstico con SPSS para

Windows. Volumen I Estadstica Bsica.. Ed. Mc Graw Hill. - Visauta Vinacua, B. (1997) Anlisis estadstico con SPSS para

Windows. Volumen II Estadstica Multivariante. B.. Ed. Mc Graw Hill.

ANEXOS

Das könnte Ihnen auch gefallen