Sie sind auf Seite 1von 8

ESTADISTICA Y TECNICA DE CAMPO

Prof. Yajaira Briceño V.


GUIA 1. BASE DE DATOS

Codificación y construcción de archivos de datos: organización

Una vez que se ha recogido la información necesaria para alcanzar los objetivos de
nuestra investigación es necesario organizarla y presentarla de modo que resulte útil e
informativa. Con este fin, debemos construir nuestro archivo de datos. Actualmente lo que
se hace es proceder a digitalizar los datos; es decir, registrar los datos en una plantilla
informática diseñada para tal fin, tal como la hoja del Excel o el visor de datos del SPSS.
La codificación puede realizarse antes o después de la digitalización del fichero. Si
nos interesa la información original, es preferible hacer la codificación una vez construida
la base de datos. Si deseamos tener todas las variables en forma numérica procedemos a
la codificación previamente.
Un software como el SPSS nos permite hacer nuestro “libro de códigos” dentro del
mismo. El libro de códigos es un documento que recoge toda la información sobre el
significado de los códigos, a fin de evitar posibles confusiones. Por ejemplo femenino = 1 y
masculino =2.
El software SPSS

En este curso utilizaremos el software SPSS (Statistical Product and Service


Solutions), potente herramienta de tratamiento de datos y análisis estadístico. Es
necesario instalar el software, siguiendo las instrucciones que aparecen en el CD, para
continuar con esta y las sesiones siguientes del curso.
El SPSS funciona mediante menús desplegables y cuadros de dialogo que permiten
hacer la mayor parte del trabajo con el puntero del ratón. Al abrir el programa aparece una
ventana de aspecto similar a una hoja de cálculo: el editor de datos. Si aparecen otras
ventanas se recomienda cerrarlas para quedar frente al editor de datos.

El editor de datos

El editor de datos es la ventana principal del SPSS, pero no la única. Tenemos


también la ventana del visor de resultados y la ventana del editor de sintaxis. El editor de
datos tiene dos vistas: la vista de datos y la vista de variables a las cuales se puede acceder
pulsando en la pestaña correspondiente en la parte inferior izquierda de la ventana.
La vista de datos tiene una barra de menús y una barra de herramientas en la parte
superior de la ventana y una barra de estado en la parte inferior de la ventana.
La barra de menús

Contiene una serie de menús desplegables que permiten controlar la mayoría de


las acciones que ejecuta el SPSS. Estos menús son los siguientes:
Archivo: desde este menú pueden crearse, abrirse o guardarse archivos de datos, de
resultados o de sintaxis, importar o exportar archivos desde o hasta otros programas,
imprimir archivos, recuperar archivos usados recientemente y otras facilidades que
pueden examinarse al desplegar el menú.
Edición: contiene las funciones usuales de un menú de edición: cortar, pegar o eliminar.
También permite insertar variables o casos.
Ver: controla el aspecto de las distintas ventanas del SPSS que permiten mostrar u ocultar
barras, seleccionar el tipo y tamaño de las fuentes, entre otras.
Datos: permite el manejo de la base de datos, así como también fusionar archivos de
datos.
Transformar: permite crear variables nuevas y cambiar los valores de las variables ya
existentes, construir tablas de frecuencias con datos agrupados, entre otras funciones.
Analizar: contiene todos los procedimientos estadísticos, a saber: informes, estadísticos
descriptivos, tablas, comparar medias, modelo lineal general, etc.
Gráficos: desde este menú se genera todo tipo de gráficos: histogramas, barras, sectores,
diagramas de dispersión, etc.
Utilidades: permite obtener información sobre las variables o sobre el archivo de datos,
controlar las variables que aparecen en las listas de variables de los cuadros de diálogo,
ejecutar procesos y editar las barras de menús.
Ventana: permite cambiar de una ventana a otra dentro del SPSS
Ayuda (?): ofrece ayuda sobre las funciones más importantes, tiene un tutorial que indica
paso a paso los procedimientos de análisis y un asesor estadístico que ayuda en la
interpretación de los resultados.

La barra de herramientas

Contiene un conjunto de botones_iconos que permiten ejecutar en forma rápida


algunas de las funciones del SPSS. Al colocar el cursor sobre cada una de ellas se abre
automáticamente un recuadro que indica la función asociada a esa herramienta.

La barra de estado

Ofrece información sobre diferentes aspectos del SPSS. Sobre el estado de la


licencia, si está inactivo el programa muestra el mensaje SPSS el procesador está
preparado. Indica también si el archivo de datos está filtrado, ponderado o segmentado.
En la figura 1 se muestra el visor de datos tal y como aparecería para una primera sesión,
es decir, con la vista de datos vacía.

Figura 1. Visor de datos del SPSS

Sesión con el SPSS

En una sesión estándar las tareas básicas con el SPSS suelen ser tres:
 Abrir un archivo de datos
 Ejecutar un procedimiento estadístico
 Examinar los resultados

Abrir un archivo de datos


Una vez abierto el editor de datos la primera acción será introducir datos para crear
una base de datos o abrir un archivo de datos existente. Para abrir un archivo de datos el
procedimiento es el que sigue:
 En la barra de menús oprimir Archivo y seleccionar la opción Abrir, del
recuadro que aparece seleccionar la opción Datos.
 Inmediatamente se abre un cuadro de diálogo, se busca el nombre de la
carpeta donde está el archivo.sav y aparecerán listados los archivos con
extensión sav , siempre y cuando en el selector de tipo aparezca SPSS
(*.sav)
 Se pulsa sobre el archivo que queremos abrir y se oprime aceptar.
 Aparece una ventana de resultados que debemos minimizar y nos queda la
ventana del editor de datos en la vista de datos.
Si oprimimos la pestaña vista de variables observaremos que tenemos todas las
variables perfectamente caracterizadas según lo que especifica cada una de las columnas
correspondientes.
Creación de una base de datos

El software SPSS nos permite crear bases de datos de dos maneras distintas:
introduciendo directamente los datos mediante el teclado o importando la información de
alguna fuente externa tal como un archivo de texto o de una hoja de cálculo.
Si nos disponemos a crear una base o archivo de datos introduciendo la
información directamente en el editor tendremos que una vez abierto el programa nos
aparecerá en pantalla la ventana que aparece en la Figura 4. Oprimimos la opción
introducir datos y tendremos en pantalla el editor de datos.
El editor de datos es la ventana SPSS que contiene el archivo de datos en se basan
todos los análisis. Salir del editor de datos equivale a salir del SPSS.
El editor de datos permite visualiza dos ventanas distintas mediante dos pestañas
situadas en la parte inferior izquierda del editor. La vista de datos que es el editor de datos
y la vista de variables que representa el editor de variables.

El editor de datos tiene la siguiente estructura:

 Las filas representan los casos, generalmente son los sujetos estudiados o
encuestados.
 Las columnas representan las variables, generalmente preguntas del
cuestionario.
 Cada casilla contiene un valor que corresponde a un determinado caso en
una variable específica.
 El archivo es rectangular y su tamaño viene determinado por el número de
casos y de variables.

Figura 4. Ventana de inicio del SPSS


Lo ideal es comenzar por el editor de variables donde se dará toda la información
acerca de las variables:

Nombre: indica el nombre de la variable. Para los nombres de variable se aplican las
siguientes normas:

 Cada nombre de variable debe ser único; no se permiten duplicados.


 Los nombres de variable pueden tener una longitud de hasta 64 bytes y el primer
carácter debe ser una letra o uno de estos caracteres: @, # o $. Los caracteres
posteriores puede ser cualquier combinación de letras, números, un punto (.) y
caracteres que no sean signos de puntuación. Los nombres de variables no pueden
contener espacios en blanco.
Tipo: indica el tipo de variable según se indica a continuación

 Numérico. Una variable cuyos valores son números. Los valores se muestran en
formato numérico estándar. El Editor de datos acepta valores numéricos en
formato estándar o en notación científica.
 Coma. Una variable numérica cuyos valores se muestran con comas que delimitan
cada tres posiciones y con el punto como delimitador decimal. El Editor de datos
acepta valores numéricos para este tipo de variables con o sin comas, o bien en
notación científica. Los valores no pueden contener comas a la derecha del
indicador decimal.
 Punto. Una variable numérica cuyos valores se muestran con puntos que delimitan
cada tres posiciones y con la coma como delimitador decimal. El Editor de datos
acepta valores numéricos para este tipo de variables con o sin puntos, o bien en
notación científica. Los valores no pueden contener puntos a la derecha del
indicador decimal.
 Notación científica. Una variable numérica cuyos valores se muestran con una E
intercalada y un exponente con signo que representa una potencia de base 10. El
Editor de datos acepta para estas variables valores numéricos con o sin el
exponente.
 Fecha. Una variable numérica cuyos valores se muestran en uno de los diferentes
formatos de fecha-calendario u hora-reloj. Seleccione un formato de la lista. Puede
introducir las fechas utilizando como delimitadores: barras, guiones, puntos, comas
o espacios.
 Dólar. Una variable numérica que se muestra con un signo dólar inicial ($), comas
que delimitan cada tres posiciones y un punto como delimitador decimal. Se
pueden introducir valores de datos con o sin el signo dólar inicial.
 Moneda personalizada. Una variable numérica cuyos valores se muestran en uno
de los formatos de moneda personalizados que se hayan definido previamente en
la pestaña Moneda del cuadro de diálogo Opciones.
 Cadena. Una variable cuyos valores no son numéricos y, por lo tanto, no se utilizan
en los cálculos. Los valores pueden contener cualquier carácter siempre que no se
exceda la longitud definida. Las mayúsculas y las minúsculas se consideran
diferentes. Este tipo también se conoce como variable alfanumérica.

Anchura: especifica el número de dígitos de la variable

Decimales: indica el número de decimales

Etiqueta: especifica el significado de la variable. Para asignar etiqueta a una variable se


sitúa el cursor en la casilla correspondiente y se teclea. La etiqueta puede contener 256
caracteres y puede contener cualquier carácter del teclado, incluso espacios en blanco. La
etiqueta aparecerá en las tablas de resultados tal como fue introducida.

Valores: indica el significado de cada valor numérico de la variable. Se pueden asignar


etiquetas de valor descriptivas a cada valor de una variable. Este proceso es especialmente
útil si el archivo de datos utiliza códigos numéricos para representar categorías que no son
numéricas (por ejemplo, códigos 1 y 2 para hombre y mujer). Para asignar etiquetas a los
valores de una variable se procede como se indica:

 Se sitúa el cursor en la columna valores sobre la casilla correspondiente a la


variable cuyos valores se desean etiquetar y se pulsa el botón puntos suspensivos
que se activa en esa casilla para acceder al cuadro de diálogo Etiquetas de valor
que muestra la Figura 5.
 Se escribe el valor de la variable en el cuadro de texto Valor (por ejemplo 1).
 Se escribe la etiqueta que se le quiere asignar a ese valor en el cuadro de texto
Etiqueta (por ejemplo hombre).
 Se pulsa el botón Añadir para trasladar el valor y su etiqueta a la lista.
 Se repite la operación para cada valor. Al final todos los valores y sus respectivas
etiquetas aparecerán listados en el cuadro inferior.
 Los botones Cambiar y Borrar permiten modificar y eliminar, respectivamente,
etiquetas previamente definidas.

Figura 5. Cuadro de diálogo Etiquetas de valor

Perdidos: define los valores de los datos definidos como perdidos por el usuario. Por
ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se
niegue a responder de los datos perdidos porque la pregunta no afecta a dicho
encuestado. Los valores de datos que se especifican como perdidos por el usuario
aparecen marcados para un tratamiento especial y se excluyen de la mayoría de los
cálculos.

 Las especificaciones de valores perdidos definidos por el usuario se guardan junto


con el archivo de datos. No es necesario volver a definir los valores definidos como
perdidos por el usuario cada vez que se abre un archivo de datos.
 Se pueden introducir hasta tres valores perdidos (individuales) de tipo discreto, un
rango de valores perdidos o un rango más un valor de tipo discreto.
 Sólo pueden especificarse rangos para las variables numéricas.
 No se pueden definir valores perdidos para variables de cadena larga (variables de
cadena de más de ocho caracteres).

Columnas: especifica el ancho de la columna

Alineación: indica el lugar que ocupará en la columna el valor de la variable

Medida: especifica el nivel de medida como Escala (datos numéricos de una escala de
intervalo o de razón), Ordinal o Nominal. Los datos nominales y ordinales pueden ser de
cadena (alfanuméricos) o numéricos.

 nominal. Una variable puede ser tratada como nominal cuando sus valores
representan categorías que no obedecen a una ordenación intrínseca.
 ordinal. Una variable puede ser tratada como ordinal cuando sus valores
representan categorías con alguna ordenación intrínseca.
 escala. Una variable puede ser tratada como de escala cuando sus valores
representan categorías ordenadas con una métrica con significado, por lo que son
adecuadas las comparaciones de distancia entre valores.

Una vez que se han introducido todas las variables con sus respectivas especificaciones
pasamos a la ventana del editor de datos pulsando la respectiva pestaña. Una vez en el
editor de datos procedemos a introducir los datos, lo cual puede hacerse mediante dos
estrategias: introduciendo el dato directamente en la casilla deseada o introduciendo el
dato en el Display del editor de datos.

Si deseamos salir de la sesión, ya sea porque hemos completado la base de datos o


no, debemos guardar el archivo. Para ello oprimimos Archivo en la barra de menús y en
esa ventana seleccionamos Guardar como.
Se abrirá la ventana Guardar datos como. En el cuadro correspondiente a Guardar
escribiremos la ubicación donde queremos guardar el archivo de datos. En el cuadro
correspondiente a nombre escribiremos el nombre que identificará al archivo. En el cuadro
tipo aparecerá por defecto sav (SPSS). Si quisiéramos guardarlo como otro tipo oprimimos
en ese recuadro y se desplegará un conjunto de opciones entre las que podemos escoger.

Das könnte Ihnen auch gefallen