Sie sind auf Seite 1von 13

UNIVERSIDAD NACIONAL DE TUCUMAN FACULTAD DE MEDICINA

INSTRUCTIVO PARA EL
PROCESAMIENTO DE DATOS
EN EXCEL

CATEDRA DE BIOESTADISTICA

► Lic. Jorgelina MENA (JTP)

► Lic. Adriana PEREZ RENFIGES (JTP)

► Lic. Natalia María SANCHEZ (JTP)

-2008-
Guía para el procesamiento de datos en Excel

Con la elaboración de la presente guía, la Cátedra de Bioestadística, espera transmitir a los


alumnos que realizan la Pasantía Rural las herramientas básicas para la construcción de la
planilla de datos y tablas de frecuencias necesarias para realizar el análisis descriptivo de los
datos del trabajo final.

Este es un instructivo para aprender a confeccionar una planilla de datos en Excel y utilizar
Tablas Dinámicas (TD). Se usarán TD para confeccionar tablas de frecuencias a partir de la
planilla de datos construida.
Para una mayor claridad se indicará los pasos para el uso de las herramientas a través de
ejemplos concretos como el siguiente:

EJEMPLO: Suponga que desea conocer el grado de conocimiento sobre Síndrome


Bronquial Obstructivo (SBO) en madres o tutores de niños menores de 5 años que concurren al
consultorio de pediatría de un cierto hospital y su asociación con el nivel de instrucción. Las
variables estudiadas fueron: edad madre/tutor (medida en años); sexo madre/tutor;
instrucción registrada como analfabeto, primario (completo e incompleto), secundario
(completo e incompleto) o mayor instrucción; conocimiento sobre SBO clasificada en bueno,
regular o malo, si recibió o no información previa sobre SBO y fuentes de información
considerándose las categorías: personal de salud, familiares, amigos, medios de comunicación
(tv) y otros.

Pasos para la elaboración de la planilla de datos o base de datos.

La construcción de la planilla de datos se debe realizar en Microsoft Excel (la Cátedra cuenta
con la Versión 2003), teniendo en cuenta las siguientes indicaciones:

1. Comenzar el llenado desde la primera fila (1º renglón) y primera columna (columna A),
evitando dejar filas y/o columnas en blanco. Evitar usar detalles de diseño, como “combinar
celdas”, cambiar “orientación del texto”, etc.
2. Cada variable definida en el protocolo debe ir en una columna diferente. En la primera fila
de cada una de las columnas indicar el nombre de la variable. Cada variable debe tener un
nombre diferente.
3. Los datos de cada unidad de observación (individuos) se vuelcan en una fila diferente,
comenzando desde la segunda fila, puesto que en la primera fila estará puesto el nombre
de la variable.
4. Se reserva la primera columna para asignar un número identificador del individuo, este
número debe ser indicado también en la encuesta o ficha de recolección de datos del
individuo en cuestión, con el objetivo de poder identificar los datos recolectados que
corresponden a cada encuesta.
5. Para aquellas preguntas donde un individuo puede seleccionar más de una respuesta cada
una de estas respuestas deberá ocupar una columna diferente. En el ejemplo planteado,
en la pregunta referida a Fuentes de información, un individuo puede tener más de una
respuesta, por lo cual cada respuesta posible ocupará una columna diferente (columnas G
a K de la figura 1).
6. Es conveniente utilizar códigos numéricos para identificar cada categoría de las diferentes
variables cualitativas, a los efectos de emplear dichos códigos para ingresar los datos de
las encuestas en la planilla.
La base de datos del ejemplo se muestra en la figura 1, considerando un total de 10 madres
o tutores. Para su construcción se utilizaron los siguientes códigos.

1
Tabla Nº 1: Códigos usados en las base de datos del ejemplo
Variable Categorías Códigos
Sexo Masculino 1
Femenino 2
Instrucción Analfabeto 1
Primario incompleto o 2
completo
Secundario incompleto o 3
completo, mayor instrucción.
Conocimiento Bueno 1
Regular 2
Malo 3
Información Si recibió 1
No recibió 0
Personal de Si recibió 1
salud No recibió 0
Si recibió 1
Familia
No recibió 0
Si recibió 1
Fuentes de Amigos
información No recibió 0
Medios de Si recibió 1
comunicación
No recibió 0
(TV)
Si recibió 1
otros
No recibió 0

Nota: La variable edad, por tratarse de una variable cuantitativa, no se


codifica, sino que se vuelca en la planilla de datos la edad exacta de cada
encuestado; salvo que para algún análisis posterior se requiera su
categorización como se explica al final de la guía.

Figura 1: Planilla de datos del ejemplo

2
Se destaca que cuando no se tiene información de una variable para un individuo en
particular la celda correspondiente debe quedar vacía, sin puntos, sin espacios, sin ningún otro
caracter. En el ejemplo, los valores 0 de la variable información previa sobre SBO, indican que
esos individuos “no” recibieron información sobre SBO, por lo cual no respondieron las
siguientes preguntas referidas a las fuentes. Es por ello que quedan vacías las celdas para las
distintas fuentes de información en los individuos que no recibieron información (ver figura 1).

Una vez completada la base de datos se debe proceder a hacer el análisis descriptivo de la
información a través de tablas de frecuencia y gráficos.

Pasos para la confección de tablas de frecuencia a través del uso de la herramienta


“Informes de Tablas Dinámicas de Excel”:

1. En la hoja de cálculo que contiene la base de datos, situarse en la primera fila y primera
columna. Luego, abrir el menú Datos y seleccionar Informe de tablas y gráficos
dinámicos.

Figura 2

Se abrirá un asistente para tablas y gráficos dinámicos que consta de tres pasos. En el
primer paso se le pedirá que indique donde están sus datos y qué tipo de informe desea crear.
Su base de datos está en Excel y solo utilice esta herramienta para crear tablas dinámicas y no
gráficos dinámicos, estas opciones están marcadas por defecto (Lista o base de datos de
Microsoft Excel y Tabla dinámica). Luego hacer clic en el botón Siguiente.

3
Figura 3

2. En el segundo paso del asistente para tablas y gráficos dinámicos le pedirán que
indique en que celdas de la hoja de calculo de Excel se encuentran sus datos, por defecto se
marcarán todas las celdas en donde están, desde la celda que contiene el nombre de la
primera columna hasta la celda que contiene el código de la ultima variable (o columna) para el
ultimo individuo cargado. Si no se marca automáticamente hacer click en el icono y marcar
el área correspondiente a sus datos en la hoja de cálculo y hacer nuevamente click en dicho
icono. Luego, hacer click en el botón Siguiente.

Figura 4

3. En el paso 3 del asistente le piden que indique donde quiere situar su tabla dinámica,
seleccione una hoja de cálculo nueva. Luego, hacer click en el botón Finalizar.

Figura 5

4. En una nueva hoja en el mismo libro donde están sus datos aparecerá, a la derecha de
la hoja, una lista de las variables que Ud. tiene en la base de datos y un esquema de una tabla
en blanco como se muestra en la Figura 6.

4
Figura 6

Si se desea construir la tabla de frecuencia de una sola variable, se arrastra con el mouse,
desde la lista de variables, la variable de interés hacia columna o fila del esquema de la tabla
(Figura 7).
Suponga que la variable de interés sea conocimiento, al arrastrar con el mouse la variable
conocimiento a fila, se obtiene lo siguiente:

Figura 7

5. Luego se arrastra la misma variable a datos (cuerpo de la tabla) y se obtiene lo


siguiente

5
Figura 8

6. Por último, en el encabezado de la tabla no siempre aparece la operación que uno


desea que el programa realice con los datos. En este ejemplo aparece suma de conocimiento
lo que significa que el programa sumará los códigos utilizados en cada categoría, cuando en
realidad lo que se desea es que cuente el número de veces que aparece cada categoría. Para
seleccionar la operación adecuada, hacer doble click en suma de “variable” (conocimiento), se
abrirá una nueva ventana (Figura 9) y dentro de ella elegir cuenta y luego aceptar.

Figura 9

En la figura 10 se observa la tabla de frecuencias de la variable de interés.

6
Figura 10

Para realizar el gráfico de la variable conocimiento construir otra tabla reemplazando los
códigos con los nombres de las categorías de la variable y copiar la frecuencias absolutas
directamente de la tabla dinámica Una vez realizada la tabla como se muestra en la figura 11
“cortar” la misma y “pegarla” en una hoja nueva del mismo archivo.
Se puede realizar el gráfico de esta variable con las frecuencias absolutas o con las
frecuencias porcentuales. Si se desea realizar el gráfico con frecuencias porcentuales se
deberá calcular dichos porcentajes y recién graficar como se muestra en la figura 12.

Figura 11

7
Figura 12

Se destaca que en las barras se agregaron rótulos con los valores de las frecuencias. El
título y número del gráfico no se incorpora dentro del recuadro del grafico de Excel sino que se
agregan directamente en Word.
Para continuar trabajando con la tabla dinámica, en el caso que se oculte la lista de
variables, hacer clic en cualquier lugar de la tabla dinámica y aparecerá nuevamente el listado
de variables a la derecha. Para construir una nueva tabla de frecuencias tendrá que reemplazar
la/s variable/s utilizada/s (ej: conocimiento) debiendo arrastrar la variable que no desea utilizar
desde la tabla hacia la lista de variables y realizando todo el proceso explicado anteriormente
para la nueva variable que desea describir.

Asociaciones de dos variables


Para analizar si existe asociación entre dos variables se debe construir una tabla de
frecuencia conjunta de las dos variables a asociar, se arrastra una variable a la fila de la tabla
dinámica (por ejemplo conocimiento) y la otra variable a columna (por ejemplo instrucción).
Luego se arrastra cualquiera de las dos variables a datos. En el encabezado de la tabla debe
figurar cuenta y no suma como se indicó en el paso 6.

8
Figura 13

Las celdas vacías indican que no hubo frecuencia en esa celda, por ejemplo se observa
que no hubo ningún individuo con conocimiento bueno que sea analfabeto.
Para graficar esta tabla se usará el gráfico de barras proporcionales. Es importante
destacar que cada barra llega al 100% en el eje vertical del gráfico y no se tuvieron que
calcular los porcentajes con anterioridad a la confección del gráfico, además es importante que
se muestre la leyenda del gráfico. Se deben agregar rótulos en el gráfico, estos aparecen en
frecuencias absolutas. Estos rótulos son necesarios para que los docentes de la cátedra
puedan realizar el cálculo del test de asociación correspondiente. (Figura 14).

Figura 14

9
Nota: El gráfico Nº1 presentado en la Figura 14 se obtuvo considerando en el paso 2 de 4 del
asistente de gráficos a las series como filas (es decir los porcentajes están calculados en base
a los totales de cada categoría de la variable nivel de instrucción). Si en ese paso se cambia la
opción “filas” por la opción “columnas” el programa Excel cambia la forma de leer los datos de
la tabla y toma como base para los porcentajes a los totales de las categorías de la variable
conocimiento (gráfico Nº 2).
La dirección que se debe elegir depende de las variables en cuestión. Según su
conocimiento debe identificar cuál es la variable explicativa (factor) y cuál es la variable
respuesta. Las categorías de la variable explicativa deben mostrarse en el eje horizontal y las
categorías de la variable respuesta deben aparecer en la leyenda. En el ejemplo se piensa que
el nivel de instrucción podría explicar el conocimiento sobre SBO, por lo que el gráfico correcto
es el gráfico Nº 1 en figura 14.

Categorización de variables continuas


En caso de querer categorizar una variable continua como por ejemplo la variable edad, se
requerirá insertar una nueva columna después de la variable que le interesa categorizar. Esto
se logra ubicando el cursor en la posición en la que se desea la nueva columna (columna C de
la figura 1), luego en el menú “Insertar” seleccionar “Columnas”. A la nueva columna otórguele
un nombre que distinga esta variable categorizada de la original, en el ejemplo “grupo
etáreo”.(Figura 15)

Figura 15

Una vez realizado este procedimiento tendrá que ordenar todos los casos según la variable
continua (edad en el ejemplo) en forma ascendente, para lo cuál deberá seleccionar el rango
de datos, desde la celda que contiene el nombre de la primera columna hasta la celda que
contiene el código de la última variable (o columna) para el último individuo cargado. Luego en
el menú “Datos” seleccione “Ordenar”, en “Ordenar por” elija la variable continua (edad) y la
opción ascendente. Cuando se pide que indique si el rango de datos tiene fila de
encabezamiento debe indicar que si. Finalice haciendo clic en “Aceptar”. (Figura 16)

10
Figura 16

A continuación los individuos aparecerán en el ejemplo ordenados de menor a mayor edad.


Ahora usted deberá formar los grupos de la variable continua (edad) y codificar los mismos. En
el ejemplo se consideraron los siguientes grupos de edad: 20 a 29 (codificado como 1); 30 a 39
(codificado como 2) y 40 a 49 años (codificado como 3). Luego deberá completar la columna de
la nueva variable con los códigos considerados según corresponda. (Figura 17)

Figura 17

Para realizar una tabla de frecuencias con la nueva variable usando tablas dinámicas
existentes, debe actualizar los datos. Esto puede hacerse colocándose en el cuerpo de la tabla
y realizar clic derecho y seleccionar “actualizar datos” (ver figura 18)

11
Figura 18

Después de este procedimiento aparecerá la variable grupo etáreo junto con las demás
variables a la derecha de la tabla como se muestra en la figura 19, y podrá ser usada para el
análisis que desee.

Figura 19

12

Das könnte Ihnen auch gefallen