Beruflich Dokumente
Kultur Dokumente
Anlisis de Datos
2
Formulacin del cuestionario
Reglas bsicas:
Ser especfico.
Usar palabras simples.
Armar preguntas cortas.
No generar un dilogo con el entrevistado.
No ser excesivamente especfico.
3
Tipos de preguntas: De respuesta
abierta
Estas preguntas no proveen respuestas opcionales.
4
Tipos de preguntas: De respuesta abierta
Estas preguntas pueden ser tiles cuando:
El entrevistador no conoce el tema a fondo,
Cuando queremos obtener mayor informacin sobre la respuesta a
una pregunta anterior. Por ejemplo, si respondi s en la pregunta
anterior, podra explicar por qu?
Para evaluar comportamientos rutinarios, por ejemplo, cuntas
horas mira TV por da?
Cuando se necesita informacin precisa, como la provincia de
nacimiento.
Para darle una oportunidad al entrevistado de expresarse. Por
ejemplo, al final de la encuesta, hay algo ms que le gustara
comentar respecto de este tema?
5
Tipos de preguntas: De opciones
ordenadas
El club necesita ms canchas de tenis
completamente en desacuerdo
Cul es su edad?
Menos de 25
medianamente en desacuerdo entre 25 y 35
ni de acuerdo ni en desacuerdo entre 36 y 50
medianamente de acuerdo entre 51 y 65
completamente de acuerdo ms de 65
8
Estructura de una pregunta:
Comparaciones
Respuesta abierta:
En su opinin, qu problemas tuvo que afrontar la
agricultura durante los 90s?
Es ideal para focus groups y para otro tipo de entrevistas
exploratorias.
Sirve para identificar distintos tipos de respuestas que
pueden ser posteriormente utilizadas en cuestionarios ms
estructurados.
Raramente puede darnos alguna idea sobre que porcentaje de
personas poseen pensamientos o caractersticas particulares.
9
Estructura de una pregunta:
Comparaciones
Respuesta con opciones ordenadas:
Durante los 90s la agricultura sufri algunos problemas.
En su opinin, qu tan serio fue cada uno de ellos?
A- Problemas ambientales muy serio serio poco serio
B- Problemas econmicos muy serio serio poco serio
C- Problemas polticos muy serio serio poco serio
10
Estructura de una pregunta:
Comparaciones
Respuesta con opciones:
En su opinin, cul de los siguientes problemas que
afectaron a la agricultura durante los 90s es el ms
serio?
A- Problemas ambientales
B- Problemas econmicos
C- Problemas polticos
El entrevistado debe elegir el problema que considera
ms importante dentro de una lista predefinida.
11
Estructura de una pregunta:
Comparaciones
Respuesta con opciones, parcialmente abierta:
En su opinin, cul de los siguientes problemas que
afectaron a la agricultura durante los 90s fue el ms serio?
A- Problemas ambientales
B- Problemas econmicos
C- Problemas polticos
D- Otro (especificar):___________________
En este caso, la situacin es similar a la anterior, pero se
permite que el encuestado tenga la libertad de elegir algn
otro problema que no ha sido considerado.
12
Secuencia del cuestionario
Preguntas introductorias: Las primeras preguntas deben
estar relacionadas al tema principal de investigacin y
deben despertar el inters del encuestado.
Preguntas relacionadas: Deben agruparse en secciones
del cuestionario.
Preguntas sensitivas: Se recomienda incluirlas hacia el
final del cuestionario.
Preguntas importantes: Es deseable incorporar tests sobre
la calidad de las respuestas a estas preguntas.
Secuencia lgica: Siempre debe respetarse.
13
Diseo de Cuestionario
1) Con que frecuencia visita el shopping? 4) Cual de las promociones del shopping recuerda?
Diaria Pascuas
3 por semana Da del padre
1 por semana
Da de la madre
1 por mes
2) Cual es el motivo de la visita? Da del amigo
Compras Navidad
Entretenimientos Ninguna
Otros 5) Y qu recuerda?
3) Es usted de participar en promociones?
No
Premios
Por que? Juegos
No me interesan Nada
No creo en ellas 6) Particip?
No me gustan los premios Si
Otros No
Si Sigue el cuestionario con otras preguntas.
14
Resultados
Participa en promociones?
27%
No
73% Si
n = 200
15
Resultados
Figura 2
25%
No participa en las
promociones del
shopping
Participa en las
promociones del
shopping
75%
n = 200
16
Resultados
Participa en promociones y ademas...
70
63
60
50
37
40
%
30
20
10
0
No participa en las promociones Participa en las promociones
del shopping del shopping
17
Diseo de Cuestionario
0) Presentacin general y datos personales.
1) Con que frecuencia visita el shopping? 4) Cual de las promociones del shopping recuerda?
Diaria Pascuas
3 por semana
Da del padre
Da de la madre
1 por semana Da del amigo
1 por mes Navidad
2) Cual es el motivo de la visita? Ninguna
Compras 5) Y qu recuerda?
Premios
Entretenimientos
Juegos
Otros
Nada
3) Es usted de participar en promociones? 6) Particip?
No Si
Distintas opciones de No
por que. (Fin Sigue el cuestionario con otras preguntas.
entrevista)
Si (Pase a pregunta 4)
18
Resultados
Participa de promociones?
Shopping
17%
No Si
73%
27%
Otras
10%
19
Algunas consideraciones especiales
Muchas veces los encuestados responden de forma
apresurada. Ello puede generar errores de medicin.
20
Diseo cognitivo: Ejemplo
Queremos responder a la siguiente pregunta:
Utiliz el cinturn de seguridad la ultima vez que anduvo en
auto como acompaante?
Bajo un diseo cognitivo, esta pregunta se divide en tres:
Cundo fue la ltima vez que viajo en auto como acompaante?
Hoy Ayer Anterior a ayer
Qu tan largo fue el viaje?
1 KM Entre 1 y 2 KM Mas de 2 KM
Us cinturn de seguridad?
Todo el tiempo Parte del tiempo No lo utilizo
21
Tipos de Datos
D a to s
C a t e g r ic o s C u a n t it a t iv o s
O r d in a le s N o m in a le s
22
Variables discretas y
continuas
Una variable es discreta si toma solo un
nmero contable de valores. Una variable es
contnua si la misma toma un nmero
incontable
Variable de valores.
discreta Variable continua
23
Estadstica Descriptiva
Abarca la agrupacin, resumen y presentacin
de los datos para permitir su interpretacin y
poder tomar decisiones basadas en dicha
interpretacin.
24
Variables Categricas
25
Variables cuantitativas
Las variables cuantitativas continuas toman un
nmero considerable de valores.
26
Histograma: distribucin del salario horario en
el Gran Buenos Aires
2 00
1 60
1 20
80
40
0
0 1 2 3 4
27
Medidas de Posicin Central:
Usualmente, nuestra atencin se centra en
dos aspectos de las medidas de posicin
central:
28
Medidas de Posicin Central: la media
30
La Moda
La Moda es el valor que ocurre con
mayor frecuencia en un grupo de
observaciones. Cuando la muestra
El modo es grande, los datos
se agrupan en intervalos
y obtenemos el
Intervalo modal
31
Media y Mediana
La media es sensible a observaciones extremas y a outliers.
32
Distribuciones simtricas y
asimtricas
Una distribucin es simtrica si el lado derecho e
izquierdo del histograma con respecto a la mediana son
aproximadamente iguales.
Un distribucin es asimtrica hacia la derecha si el lado
derecho del histograma se extiende sobre un mayor
nmero de valores (intervalos) que el lado izquierdo.
Una distribucin es asimtrica hacia la izquierda si el
lado izquierdo del histograma se extiende sobre un mayor
nmero de valores (intervalos) que el lado derecho.
33
Aspecto general de una
La figura muestra la distribucin de ventas de
distribucin
libros por individuo en la feria del libro. Esta
distribucin es asimtrica hacia la derecha. Es
decir hay muchas ventas de 3 o 4 libros y pocas
ventas de 10 libros.
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12
34
Medidas de dispersin
Caracterizar una distribucin solamente a travs de una
medida central no es apropiado.
35
Medidas de dispersin
Rango
36
Medidas de dispersin
El rango depende slo de las observaciones
mxima y mnima, que podran ser observaciones
atpicas.
Podramos mejorar nuestra descripcin de la
dispersin fijndonos, por ejemplo, tambin en la
dispersin del 50% de los valores centrales de
nuestros datos.
Un conjunto de estadsticos de utilidad son los
cuartiles de una distribucin.
37
Cuartiles
Para calcular los cuartiles de una distribucin
debemos:
38
Cuartiles
Los cuartiles son medidas de tendencia no central de una
distribucin.
Q1 Q2 Q3
El segundo cuartil de una distribucin es su mediana.
40
Diagrama de caja
Los cinco nmeros resumen de una distribucin son
representados grficamente por un diagrama de caja.
L - Observacin mxima
Q3 - Tercer cuartil
Q2 - Mediana
Q1 - Primer cuartil
S - Observacin mnima
41
Diagrama de caja
Los lados inferior y superior de la caja van del primer al
tercer cuartil. Por tanto, la altura de la caja es la
amplitud del 50% de los datos centrales.
El segmento del interior de la caja indica la mediana.
Los extremos de los segmentos perpendiculares a los
lados superior e inferior indican, respectivamente, los
valores mximo y mnimo de la distribucin.
S Q1 Q2 Q3 L
42
Una medida de dispersin: La varianza
La varianza s2 de un conjunto de observaciones es el
promedio de los cuadrados de la desviaciones de las
observaciones respecto a su media. Formalmente:
( x1 x ) ( x 2 x ) ... ( x n x )
2 2 2
s
2
De forma compacta:
n 1
1
s
2
n 1
( x i x ) 2
43
El desvo estndar
La desviacin tpica es la raz cuadrada positiva
de la varianza s2:
1
s
n 1
i
( x x ) 2
44
Coeficiente de variacin
El coeficiente de variacin es una medida de dispersin relativa.
Muestra la dispersin de una distribucin en relacin a su media.
Se utiliza para comparar distintas distribuciones.
Su frmula es:
45
Medidas de asociacin en variables
cuantitativas
(x i x)(y i y)
Covarianza muestral cov(X, Y)
n -1
46
Coeficiente de Correlacin
+1 Correlacin lineal positiva fuerte
El valor se encuentra cerca de 1 COV(X,Y)>0
47
Medidas de Asociacin en
Variables Categricas
Tablas de Contingencia
El objetivo de la tabulacin cruzada es identificar la
relacin que existe entre dos variables. Con los datos de
una muestra podemos observar si existe alguna relacin
entre dos variables y la pregunta que surge naturalmente
es si esta relacin es verdadera o es el resultado del error
muestral.
Las tablas de contingencia son tabulaciones cruzadas
entre dos variables X e Y con r y c categoras
respectivamente. Es decir que la tabla de contingencia
entre X e Y tendr r filas y c columnas.
48
Tablas de Contingencia y
Medidas de Asociacin
Para identificar si existe relacin entre dos variables categricas se
utiliza un test de hiptesis conocido como el test Chi-cuadrado de
Pearson. La hiptesis nula del test es que las dos variables
analizadas son independientes. La hiptesis alternativa es que las
variables no son independientes, es decir que existe una relacin
entre las dos variables.
Por ejemplo, la siguiente tabla de contingencia muestra la
tabulacin cruzada de la variable ingreso anual (dividido en tres
categoras) y la ltima marca de coche comprada (dividida en tres
marcas).
49
Tablas de Contingencia y
Medidas Marca
de Asociacin
del ltimo auto comprado
Ford Toyota Renault Total
Ingreso anual
51
Tablas de Contingencia y
Medidas de Asociacin
Si ingreso y marca son independientes, la probabilidad
del evento conjunto "A1: ganar menos de 20,000$" y
"B1: comprar marca Ford" es el producto de esas dos
probabilidades:
52
Tablas de Contingencia y
Medidas de Asociacin
Por lo tanto:
53
Tablas de Contingencia y Medidas
de Asociacin
En general la frmula del valor esperado es:
Eij = (NAi*NBj)/N.
54
Tablas de Contingencia y
Medidas de Asociacin
Este proceso se puede repetir para cada una de las entradas
de la tabla. Una vez hecho esto el estadstico Chi-cuadrado
se calcula con la siguiente frmula:
r c O ij E ij
2
2
i 1 j 1 E ij
56
Tablas de Contingencia y
Medidas de Asociacin
El estadstico de Pearson nos dice si dos variables son
independientes una de otra pero no nos dice nada
acerca de la naturaleza de la relacin.
57
Tablas de Contingencia y
Medidas de Asociacin
El coeficiente de contingencia se calcula
fcilmente desde el estadstico de Pearson:
C
2
n
58
Tablas de Contingencia y
Medidas de Asociacin
El coeficiente de contingencia es una extensin del
coeficiente al caso de que al menos una de las
variables presente ms de dos categoras. Toma
valores entre 0 y Cmax, donde si r y c son el nmero
de categoras de cada una de las variables:
59
Medidas de Asociacin para
Tablas de 2x2
Cuando analizamos variables dicotmicas
(adoptan solo los valores 0, 1) el estadstico
de Pearson puede ser poco preciso. En esos
casos se suelen utilizar otras medidas de
asociacin.
60
Medidas de Asociacin para
Tablas de 2x2
El Coeficiente Phi ()
Es una medida del grado de asociacin entre
dos variables dicotmicas basada en el
estadstico Chi-cuadrado de Pearson.
Este coeficiente toma valores en el intervalo
cero-uno. Valores prximos a cero indican
poca asociacin entre las variables y valores
cercanos a uno indican una fuerte asociacin.
61
Medidas de Asociacin para
Tablas de 2x2
Puede ser calculado utilizando el estadstico
Chi-cuadrado de Pearson con la siguiente
frmula:
= (2/N)1/2
62
GRACIAS
Consultores de Investigacin
Pgina Web: conasin.es.tl
Correos: paholitacalderon@yahoo.es
alzamoradelosgodos@yahoo.es
Telefonos:
992740368 63