Beruflich Dokumente
Kultur Dokumente
INSTRUCTIVO PARA EL
PROCESAMIENTO DE DATOS
EN EXCEL
CATEDRA DE BIOESTADISTICA
-2008-
Guía para el procesamiento de datos en Excel
Este es un instructivo para aprender a confeccionar una planilla de datos en Excel y utilizar
Tablas Dinámicas (TD). Se usarán TD para confeccionar tablas de frecuencias a partir de la
planilla de datos construida.
Para una mayor claridad se indicará los pasos para el uso de las herramientas a través de
ejemplos concretos como el siguiente:
La construcción de la planilla de datos se debe realizar en Microsoft Excel (la Cátedra cuenta
con la Versión 2003), teniendo en cuenta las siguientes indicaciones:
1. Comenzar el llenado desde la primera fila (1º renglón) y primera columna (columna A),
evitando dejar filas y/o columnas en blanco. Evitar usar detalles de diseño, como “combinar
celdas”, cambiar “orientación del texto”, etc.
2. Cada variable definida en el protocolo debe ir en una columna diferente. En la primera fila
de cada una de las columnas indicar el nombre de la variable. Cada variable debe tener un
nombre diferente.
3. Los datos de cada unidad de observación (individuos) se vuelcan en una fila diferente,
comenzando desde la segunda fila, puesto que en la primera fila estará puesto el nombre
de la variable.
4. Se reserva la primera columna para asignar un número identificador del individuo, este
número debe ser indicado también en la encuesta o ficha de recolección de datos del
individuo en cuestión, con el objetivo de poder identificar los datos recolectados que
corresponden a cada encuesta.
5. Para aquellas preguntas donde un individuo puede seleccionar más de una respuesta cada
una de estas respuestas deberá ocupar una columna diferente. En el ejemplo planteado,
en la pregunta referida a Fuentes de información, un individuo puede tener más de una
respuesta, por lo cual cada respuesta posible ocupará una columna diferente (columnas G
a K de la figura 1).
6. Es conveniente utilizar códigos numéricos para identificar cada categoría de las diferentes
variables cualitativas, a los efectos de emplear dichos códigos para ingresar los datos de
las encuestas en la planilla.
La base de datos del ejemplo se muestra en la figura 1, considerando un total de 10 madres
o tutores. Para su construcción se utilizaron los siguientes códigos.
1
Tabla Nº 1: Códigos usados en las base de datos del ejemplo
Variable Categorías Códigos
Sexo Masculino 1
Femenino 2
Instrucción Analfabeto 1
Primario incompleto o 2
completo
Secundario incompleto o 3
completo, mayor instrucción.
Conocimiento Bueno 1
Regular 2
Malo 3
Información Si recibió 1
No recibió 0
Personal de Si recibió 1
salud No recibió 0
Si recibió 1
Familia
No recibió 0
Si recibió 1
Fuentes de Amigos
información No recibió 0
Medios de Si recibió 1
comunicación
No recibió 0
(TV)
Si recibió 1
otros
No recibió 0
2
Se destaca que cuando no se tiene información de una variable para un individuo en
particular la celda correspondiente debe quedar vacía, sin puntos, sin espacios, sin ningún otro
caracter. En el ejemplo, los valores 0 de la variable información previa sobre SBO, indican que
esos individuos “no” recibieron información sobre SBO, por lo cual no respondieron las
siguientes preguntas referidas a las fuentes. Es por ello que quedan vacías las celdas para las
distintas fuentes de información en los individuos que no recibieron información (ver figura 1).
Una vez completada la base de datos se debe proceder a hacer el análisis descriptivo de la
información a través de tablas de frecuencia y gráficos.
1. En la hoja de cálculo que contiene la base de datos, situarse en la primera fila y primera
columna. Luego, abrir el menú Datos y seleccionar Informe de tablas y gráficos
dinámicos.
Figura 2
Se abrirá un asistente para tablas y gráficos dinámicos que consta de tres pasos. En el
primer paso se le pedirá que indique donde están sus datos y qué tipo de informe desea crear.
Su base de datos está en Excel y solo utilice esta herramienta para crear tablas dinámicas y no
gráficos dinámicos, estas opciones están marcadas por defecto (Lista o base de datos de
Microsoft Excel y Tabla dinámica). Luego hacer clic en el botón Siguiente.
3
Figura 3
2. En el segundo paso del asistente para tablas y gráficos dinámicos le pedirán que
indique en que celdas de la hoja de calculo de Excel se encuentran sus datos, por defecto se
marcarán todas las celdas en donde están, desde la celda que contiene el nombre de la
primera columna hasta la celda que contiene el código de la ultima variable (o columna) para el
ultimo individuo cargado. Si no se marca automáticamente hacer click en el icono y marcar
el área correspondiente a sus datos en la hoja de cálculo y hacer nuevamente click en dicho
icono. Luego, hacer click en el botón Siguiente.
Figura 4
3. En el paso 3 del asistente le piden que indique donde quiere situar su tabla dinámica,
seleccione una hoja de cálculo nueva. Luego, hacer click en el botón Finalizar.
Figura 5
4. En una nueva hoja en el mismo libro donde están sus datos aparecerá, a la derecha de
la hoja, una lista de las variables que Ud. tiene en la base de datos y un esquema de una tabla
en blanco como se muestra en la Figura 6.
4
Figura 6
Si se desea construir la tabla de frecuencia de una sola variable, se arrastra con el mouse,
desde la lista de variables, la variable de interés hacia columna o fila del esquema de la tabla
(Figura 7).
Suponga que la variable de interés sea conocimiento, al arrastrar con el mouse la variable
conocimiento a fila, se obtiene lo siguiente:
Figura 7
5
Figura 8
Figura 9
6
Figura 10
Para realizar el gráfico de la variable conocimiento construir otra tabla reemplazando los
códigos con los nombres de las categorías de la variable y copiar la frecuencias absolutas
directamente de la tabla dinámica Una vez realizada la tabla como se muestra en la figura 11
“cortar” la misma y “pegarla” en una hoja nueva del mismo archivo.
Se puede realizar el gráfico de esta variable con las frecuencias absolutas o con las
frecuencias porcentuales. Si se desea realizar el gráfico con frecuencias porcentuales se
deberá calcular dichos porcentajes y recién graficar como se muestra en la figura 12.
Figura 11
7
Figura 12
Se destaca que en las barras se agregaron rótulos con los valores de las frecuencias. El
título y número del gráfico no se incorpora dentro del recuadro del grafico de Excel sino que se
agregan directamente en Word.
Para continuar trabajando con la tabla dinámica, en el caso que se oculte la lista de
variables, hacer clic en cualquier lugar de la tabla dinámica y aparecerá nuevamente el listado
de variables a la derecha. Para construir una nueva tabla de frecuencias tendrá que reemplazar
la/s variable/s utilizada/s (ej: conocimiento) debiendo arrastrar la variable que no desea utilizar
desde la tabla hacia la lista de variables y realizando todo el proceso explicado anteriormente
para la nueva variable que desea describir.
8
Figura 13
Las celdas vacías indican que no hubo frecuencia en esa celda, por ejemplo se observa
que no hubo ningún individuo con conocimiento bueno que sea analfabeto.
Para graficar esta tabla se usará el gráfico de barras proporcionales. Es importante
destacar que cada barra llega al 100% en el eje vertical del gráfico y no se tuvieron que
calcular los porcentajes con anterioridad a la confección del gráfico, además es importante que
se muestre la leyenda del gráfico. Se deben agregar rótulos en el gráfico, estos aparecen en
frecuencias absolutas. Estos rótulos son necesarios para que los docentes de la cátedra
puedan realizar el cálculo del test de asociación correspondiente. (Figura 14).
Figura 14
9
Nota: El gráfico Nº1 presentado en la Figura 14 se obtuvo considerando en el paso 2 de 4 del
asistente de gráficos a las series como filas (es decir los porcentajes están calculados en base
a los totales de cada categoría de la variable nivel de instrucción). Si en ese paso se cambia la
opción “filas” por la opción “columnas” el programa Excel cambia la forma de leer los datos de
la tabla y toma como base para los porcentajes a los totales de las categorías de la variable
conocimiento (gráfico Nº 2).
La dirección que se debe elegir depende de las variables en cuestión. Según su
conocimiento debe identificar cuál es la variable explicativa (factor) y cuál es la variable
respuesta. Las categorías de la variable explicativa deben mostrarse en el eje horizontal y las
categorías de la variable respuesta deben aparecer en la leyenda. En el ejemplo se piensa que
el nivel de instrucción podría explicar el conocimiento sobre SBO, por lo que el gráfico correcto
es el gráfico Nº 1 en figura 14.
Figura 15
Una vez realizado este procedimiento tendrá que ordenar todos los casos según la variable
continua (edad en el ejemplo) en forma ascendente, para lo cuál deberá seleccionar el rango
de datos, desde la celda que contiene el nombre de la primera columna hasta la celda que
contiene el código de la última variable (o columna) para el último individuo cargado. Luego en
el menú “Datos” seleccione “Ordenar”, en “Ordenar por” elija la variable continua (edad) y la
opción ascendente. Cuando se pide que indique si el rango de datos tiene fila de
encabezamiento debe indicar que si. Finalice haciendo clic en “Aceptar”. (Figura 16)
10
Figura 16
Figura 17
Para realizar una tabla de frecuencias con la nueva variable usando tablas dinámicas
existentes, debe actualizar los datos. Esto puede hacerse colocándose en el cuerpo de la tabla
y realizar clic derecho y seleccionar “actualizar datos” (ver figura 18)
11
Figura 18
Después de este procedimiento aparecerá la variable grupo etáreo junto con las demás
variables a la derecha de la tabla como se muestra en la figura 19, y podrá ser usada para el
análisis que desee.
Figura 19
12