Sie sind auf Seite 1von 38

Anlisis de datos: Mtodos

estadsticos
Act. Lyssett BellatoGil
Preparacin y sntesis de datos
I. Correccin
II. Codificacin
III. Tabulacin
IV. Sntesis estadstica
V. Sntesis grfica
Correccin
Examina los datos iniciales para cerciorarse
de que la informacin sea exacta.
Se realiza este examen para precisar que las
respuestas sean legibles, coherentes y
completas
Correccin
Son legibles las respuestas?
1. Volver al entrevistador o al sujeto para que nos
aclare.
2. Tratar de inferir otras contestaciones
3. Desecharla por completo
Tiende a ocurrir cuando empleamos preguntas
abiertas y el respondiente llena el cuestionario
sin que estpresente el encuestador.
Correccin
Son coherentes las respuestas?
Demuestra incongruencia el respondiente sobre la
escolaridad diciendo actualmente curso el ltimo
ao de enseanza media y luego indica que su
ocupacin es profesor universitario
Es intencional redactar en dos formas distintas con
objeto de atrapar a quienes ofrecen
contestaciones incongruentes.
Correccin
Se aconseja eliminar todas las respuestas
incongruentes a menos que podamos
averiguar cules tienen mayores
probabilidades de ser verdicas.
Correccin
Estn completas las respuestas?
El error por falta de respuesta puede existir en
preguntas individuales y tambin en el
cuestionario entero.
Se tiene un problema especial, ya que es imposible
saber si el sujeto simplemente omitila
contestacin, no conoca la respuesta o bien la
conoca pero no quera compartir el secreto con el
investigador.
Correccin
Toma en serio su papel el respondiente?
Este tipo de respondiente es fcil de detectar,
de modo que podemos prescindir de su
cuestionariosin perder informacin til.
Correccin en el campo
Se lleva a cabo en la trinchera donde los
entrevistadores hacen una pausa para
completar las oraciones inconclusas,
terminar las abreviaturas y redondear otras
ideas o puntos que eran importantes para la
entrevista.
Se debe realizar inmediatamente despus de
finalizada la entrevista.
Codificacin
Es la asignacin de respuestas a las
categoras e incluye la identificacin de
cada respuesta con un nmero asociado a
esa categora.
Hay dos procedimientos de codificacin:
precodificacin y poscodificacin.
Codificacin
Precodificacin:
Es apropiada en las preguntas dicotmicas y de
opcin mltiple, que slo tienen una escasa
seleccin de respuestas.
Poscodificacin:
Cuando las respuestas son de tipo abierto, con
preguntas no estructuradas.
Se asignan las respuestas a categoras seleccionadas
despus de recabar los datos.
Ejemplo de poscodificacin
Cuando veo un automvil Porsche, de inmediato pienso en........
1. cunto me divertira si tuviera uno
2. es injusto nuestro sistema social, en l slo algunos tienen
suficiente dinero para comprarse un auto de esos
3. carrera de autos
4. los autos pequeos y lo peligrosos que son
5. la balanza de pagos en mi pas
6. los riesgos que encierra conducirlo
7. mi hermano, l estloco por los autos deportivos
Ejemplo de poscodificacin
8. el precio de una pliza de seguros de un auto de esos
9. en los ricos
10. en los obreros de las fbricas que estn sin empleo
11. todos estos trabajadores de la industria siderrgica que estn sin
empleo
12. lo que cuesta hacer uno de esos autos
13. en la sorpresa que se llevara mi pareja si me viera conduciendo
uno
14. ir al cine
15. levantar la mano y pedir un paseo al que conduce uno de esos
autos
Ejemplo de poscodificacin
Deseo conducir un Porsche o de poseer uno:
Respuestas 1, 6, 13, 15
Comentario socioeconmico negativo:
Respuestas 2, 5, 9, 11
Inconveniencia o desventajas de poseer uno:
Respuestas 4, 8, 10, 12
Otros:
Respuestas 3, 7
Respuesta irrelevante o humorstica:
Respuesta 14
Tabulacin
Contar cuntas tenemos en cada categora.
Tabulacin sencilla y tabulacin cruzada.
El recuento y la sntesis de las respuestas
pueden hacerse manualmente o con una
computadora, segn el volumen de datos y
la disponibilidad de programas adecuados.
Tabulacin sencilla
Tabulacin marginal o con un solo criterio
en una distribucin de frecuencia de cuntas
respuestas haba en cada categora.
Tabulacin cruzada
Investigaciones de mercado representan
importantes relaciones entre variables.
Permite al analista identificar
estadsticamente las relaciones
significativas entre variables.
Medidas de centralidad
Moda, mediana y media
Supongamos que el fabricante de un rastrillo desechable ha
realizado un estudio para saber cuntas rasuradas pueden
hacerse con l, obteniendo los siguientes resultados de una
muestra de 11 hombres:
Medidas de centralidad
Persona nmero Nmero de rasuradas
1 11
2 9
3 6
4 14
5 12
6 8
7 14
8 10
9 7
10 14
11 9
Moda
Es el valor que ocurre con ms frecuencia. Es la
ms tpica de las respuestas.
Nmero de rasuradas No. Personas que obtuvieron esas rasuradas
6 1
7 1
8 1
9 2
10 1
11 1
12 1
13 0
14 3
Moda
La moda es 14 rasuradas.
El fabricante puede hacer que en la publicidad del
producto se afirme que el rastrillo desechable en
una prueba de consumidores brind a los usuarios
un promedio de 14 rasuradas
La debilidad potencial de la moda es la posibilidad
de que la medicin anotada con mayor frecuencia
tal vez no sea muy representativa del conjunto
entero de resultados.
Mediana
El valor de la mediana en un conjunto de
datos es el que tiene la misma cantidad de
respuestas por encima y por debajo.
Si las respuestas se enumeran en orden de
rangos desde la ms grande hasta la ltima,
la mediana serla que se halle en la mitad.
14, 14, 14, 12, 11, 10, 9, 9, 8, 7, 6
10 es el nmero promedio de rasuradas obtenidas por la muestra de 11
hombres. Cinco lograron ms de 10, en tanto que ptros cinco lograron
menos de 10.
Mediana
Casos con nmero par de respuestas, se necesita
slo tomar el promedio de dos respuestas que
juntas se encuentren en la mitad.
La medianasuele ser ms representativa que la
moda.
Por basarse en un rango ordinal de los datos, est
menos expuesta a puntuaciones demasiado altas o
bajas.
Media
Es la medida de mayor usode la centralidad
de un conjunto de datos.
Designa en estadstica la suma de los datos
dividida entre el nmero de puntos de los
datos.
En el ejemplo del rastrillo desechable la
media de las rasuradas es 10.36 rasuradas
por persona.
Media
Otro atributo de la media consiste en que se
presta a hacer generalizaciones estadsticas
de la muestra a la poblacin.
Se emplea para estimar y construir un
intervalo de confianza para la media de la
poblacin.
La principal debilidad es su susceptibilidad
a mostrar valores extremos.
Las escalas de medicin son:
Moda: Escala nominal de datos
Mediana: Escala ordinal de datos
Media: Escala de intervalos o razn
Medidas de dispersin
Rango, varianza y desviacin estndar.
Rango, es la ms elemental y consiste en la
distancia entre los dos valores extremos.
Un individuo logr apenas 6 rasuradas, en
cambio otro pudo rasurarse 14 veces, el
intervalo es:
14 6 =8 rasuradas es la diferencia
Rango
Como el rango pone de relieve los valores
ms extremos, no influye en l lo que
podramos calificar de dispersin tpica de
los datos.
Varianza y desviacin estndar
La desviacin estndar puede utilizarse para hacer
generalizaciones estadsticas a partir de la muestra
y aplicarlas a la poblacin de donde la extrajimos.
Varianza =s = (X-X ) =82.55 =8.26
n 1 10
Desviacin estndar =s = (X-X ) =82.55 =2.87
n 1 10
Varianza y desviacin estndar
Al calcular la varianza y desv. estndar de la
muestra el procedimiento consiste en usar (n-1)
como divisor.
Tratndose de muestras grandes, restarle 1 a n no
tiene mucha importancia.
Si los datos representan a todos los miembros de
la poblacin, conviene entonces utilizar slo n.
Como la mayor parte de los estudios de inv. de
mercados se refieren a muestra y no a poblaciones
enteras, usaremos (n-1).
Porcentajes
Representan la proporcin de los elementos
de la muestraque caen dentro de varias
categoras.
Es til en sondeos de opinin pblica.
Se expresan en funcin del porcentaje de
respondientes que favorece un punto de
vista u otro, o bien que posee ciertas
caractersticas.
Sntesis grfica
Adems de calcular los descriptores
estadsticos, los datos se pueden resumir en
una forma ms grfica.
Son sumamente tiles para persuadir al
empleado o al cliente sobre puntos
importantes de la investigacin.
Tipos de grficas
De barras(datos de una distribucin de
frecuencias)
De pie o de secciones(crculo dividido en
secciones)
Pictograma(dibujos o smbolos para
representar las frecuencias)
Bosquejo(barras con la informacin dentro
de cada una de ellas
Tcnicas paramtricas
Suponen que las variables que van a
estudiarse por lo menos a la escala de
intervaloy que las observaciones provienen
de una poblacin que tiene una distribucin
normal.
Tcnicas no paramtricas
Suponen que las variables son slo de
escala nominal u ordinal.
Anlisis estadstico
1. Intervalos de confianza
2. Pruebas de significancia
3. Comparacin de dos medias
4. Anlisis de J i cuadrada
5. Anlisis de varianza
6. Anlisis de regresin y correlacin
Intervalo de confianza
Expresa la aproximacin del valor
verdadero de la poblacin que estamos
tratanto de estimar.
X
media
Z s/ n
Donde
X
media
=media muestral
Z =nivel de confianza que deseamos
s =desviacin estndar
n =tamao de la muestra
Ejemplo de intervalo de confianza
Supongamos que hemos encuestado a 1000 personas y que
la persona promedio de la muestra gasta $8.37 semanales
en diversiones; la desv. estndar es de $5.25. Si deseamos
un nivel de confianza del 95% tenemos:
8.37 1.96 (5.25/ 1000 =8.37 .33
Intervalo de confianza de $8.04 - $8.70
Tendremos una seguridad del 95% de estar dentro de 35
centsimas de la media real de la poblacin o bien un error
probable es de 33 centsimas o menos.

Das könnte Ihnen auch gefallen