Beruflich Dokumente
Kultur Dokumente
PRESENTACIÓN
INTERPRETACION DE
INTERPRETACION DE
DATOS ESTADÍSTICOS
DATOS ESTADÍSTICOS YY
REPRESENTACIONES
REPRESENTACIONES
GRÁFICAS
GRÁFICAS
Objetivo
Manejar métodos
Manejar métodos yy
procedimientos
procedimientos
estadísticos de
estadísticos de obtención,
obtención,
organización,
organización,
presentación, descripción,
presentación, descripción,
analisis e
analisis e interpretación
interpretación de
de
datos, como
datos, como elementos
elementos
requeridos para
requeridos para la
la toma
toma de
de
decisiones en
decisiones en forma
forma
científica
científica
¿QUÉ ES LA ESTADÍSTICA?
La Estadística es la ciencia
que se ocupa de los métodos
y procedimientos para
recoger, clasificar, resumir y
analizar los datos.
Estadística
Estadística Estadística
Descriptiva Inferencial
Se ocupa de la colección y
clasificación de información,
mas específicamente de la
recopilación, organización y
analisis de datos sobre
alguna característica de
ciertos individuos
pertenecientes a la
POBLACION O
UNIVERSO..
EJEMPLO DE ESTADÍSTICA DESCRIPTIVA
Muestreo de juicio
Ejercicio
Suponga que usted es contratado por una agencia de
turismo, la cual está interesada en conocer los hábitos
turísticos de los visitantes de la ciudad de Culiacán, …,
con el propósito de ofrecer un mejor servicio.
Para tal fin, usted procedió a elaborar un cuestionario
dirigido a los turistas de la zona, el cual va aplicarse en
una temporada alta, como diciembre.
Para su encargo, usted necesita encuestar una muestra
de turistas y para ello tomará un tamaño de muestra
mediante un sistema de muestreo aleatorio simple, cuyo
modelo es: 2 2
Z S
n 2
2
Para este caso, usted ha decidido tomar un margen de confiabilidad de 95%
(1 - ) que corresponde a Z =1.96 con desviación estándar S = 0.4, un error
de estimación E = 5% . Calcule el número de turistas por encuestar, si la
población (N) de turistas no se conoce. 246 turistas
Ejercicio
Ahora suponga que conoce el tamaño de la
población (N), entonces el tamaño de la
muestra, mediante el sistema de muestreo
aleatorio simple, será:
S2
n
2
S 2
2
Z N
Suponga que el número total de turistas que visitan la ciudad de
Culiacán, cuando se realiza la encuesta, es de 2000. ¿Cuál será
el tamaño de la muestra? 219 turistas
Para este caso, usted ha decidido tomar un margen de confiabilidad de 95%
(1 - ) que corresponde a Z = 1.96, con desviación estándar S = 0.4, un error
de estimación E = 5% .
Muestreo proporcional
Ejercicio
Suponga que un compañía de seguros cuenta con 200
asegurados en todo el país. Por una investigación piloto
se supo que 73% de las personas aseguradas declaran
una excelente aceptación de los seguros de la empresa.
Ésta desea conocer el grado de aceptación de un nuevo
producto con un margen de confiabilidad de 95% y un
error de stimación de 5%. Calcule el tamaño de muestra
de los asegurados para este nuevo tipo de producto.
Z2 2 PQN
n
2 N 1 Z 2 PQ
121 de sus asegurados para
La empresa necesita entrevistar a _____
conocer el grado de aceptación ed us nuevo producto.
Ejemplo
Un estudio d e mercado pretende encuestar a niños(as) respecto al consumo de una
cierta golosina, en determinada zona urbana. Se sabe que hay 480 niños(as) en la
zona.
Calcula el tamaño de la muestra para garantizar un nivel de confianza del 95%, y un
porcentaje de error de 4%.
Fórmula:
Solución:
Para que el nivel de confianza sea igual al 95%, se tiene que p(Z)=0.95 si Z=1.96, y
pensando que la variabilidad es p=q=0.5 ya que no se proporciona este dato.
Sustituimos:
Muestra probabilística estratificada de
alumnos del tecnológico
Carrera Total población Muestra
Ing. Industrial 2,157
Ing. Bioquímica 273
Ing. Mecánica 746
Ing. Eléctrica 319
Ing. Electrónica 399
Ing. Sistemas 727
Computacionales
Ing. Mecatrónica 467
Ing. TIC´s 169
Ing. Gestión 489
Ing. Ambiental 26
Ing. Energías Renovables 168
Cuando NO se conoce el tamaño de la
población:
Formula:
Donde:
n es el tamaño de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
E es la precisión o error
Ejemplo
Se desea realizar un estudio sobre la compra de un complemento
alimenticio basado en soya para mujeres. El estudio no tiene
antecedentes, pero se desea garantizar un nivel de confianza de
95% y un porcentaje de error máximo de 5%, ¿cuál debe ser el
tamaño de la muestra?
DEFINICIONES BÁSICAS
estadísticas:
Alumno matriculado
Docente Universitario
VARIABLE
Es un símbolo, que
representa las “variaciones”
de los datos, entre una
unidad y otra, respecto de la
característica que se esta
midiendo o fenómeno que
se esta estudiando.
Numero de conflictos, en el
trabajo ocurridos en veinte
ciudades de un país.
Identificar:
Población : ciudades del pais
Tamaño de la población : 20
Unidad Estadística : ciudad
Variable : Numero de conflictos
EJERCICIO DE APLICACIÓN 02
POBLACION, UNIDADES ESTADISTICAS Y
VARIABLES
Con el propósito de estimar la demanda
futura de los consumidores en la ciudad
LEON, se consulta sobre el volumen de
ventas mensuales en los 150 locales
comerciales existentes en LEON
Identificar:
Población :
Tamaño de la población :
Unidad Estadística :
Variable :
INDICADOR ESTADÍSTICO
REGISTROS ADMINISTRATIVOS
Aduanas, Migraciones, Registros Civiles, Ministerios,
Industrias, Hospitales, Universidades, etc.
CENSOS
( INEGI, SEP, ECONÓMICOS, etc. )
DISEÑOS DE EXPERIMENTOS
En Agricultura, Medicina, Biología, Psicología, Química, etc.
CENSO
Enumeración completa, es otra forma de
estudiar las unidades estadísticas.
EJEMPLOS
Encuesta Nacional De Hogares (Salud, Educación,
Violencia, Empleo, Ingresos, Gastos, Prog. Soc.)
Encuesta Demográfica y Salud Familiar
Encuesta Económica Anual
Encuesta de Precios
Encuestas de Opinión Pública
METODOS DE RECOLECCIÓN
ENTREVISTA
CORREO CONVENCIONAL
CORREO ELECTRÓNICO
AUTOEMPADRONAMIENTO
DEFINICIONES BÁSICAS
VARIABLE:
Es una característica de interés que se desea estudiar, la cual
puede ser medida.
En el INEGI se ha definido:
CARACTERÍSTICAS MIEMBROS HOGAR: Edad, Sexo, Estado
Civil,
EJEMPLO:
EJEMPLO:
EJEMPLO :
Una Encuesta de Hogares de Empleo e Ingresos, en el
mes de Marzo 2010 :
El ingreso promedio mensual es de $4,985.
La tasa de desempleo es de 9.3 %.
Edad promedio de trabajadores es de 32 años.
El promedio de años de estudio es de 10.5
76% de hogares tienen teléfono fijo.
El Promedio de hijos por hogar es de 2.3.
CLASIFICACION DE
VARIABLES
CUALITATIVAS CUANTITATIVAS
ATRIBUTOS NUMERICO
Continúa
Discreta
VARIABLE CUALITATIVA
Son aquellas variables que no aparecen en forma
numérica, sino como categorías o atributos y tiene
sentido cuando se usa bajo escala nominal u ordinal.
EJEMPLOS:
Religión: Religion:
Católica Ateo
Protestante Mormon
Ateo Católica
Musulmana Protestante
Mormon Musulmana
VARIABLE DISCRETA:
Ejemplos
VARIABLE CONTÍNUA :
Ejemplos
Persona:
Estatura, peso, etc.
Ingreso, gastos, etc.
Hogar:
Ingresos por hogar.
Gastos por hogar en alimentación.
Monto de alquiler por hogar.
Establecimiento comercial:
Valor de las ventas por establecimiento.
Valor de las compras por establecimiento.
Gastos (electricidad, agua, teléfono)
ORGANIZACIÓN DE
DATOS
ORGANIZACIÓN DE DATOS DE VARIABLES CUALITATIVAS Y CUANTITATIVAS
Codificación y Tabulación :
La codificación facilita la tabulación y el conteo. (obtención de
una buena información).
La codificación de las respuestas da lugar a categorías o
modalidades.
Es recomendable que los cuestionarios tengan las
alternativas de respuesta precodificadas.
Si el cuestionario tiene preguntas abiertas (respuesta libre),
estas previamente debe ser clasificadas en categorías.
PRESENTACIÓN DE LOS DATOS
Tipos de frecuencia:
Absoluta
Relativa
I. CASO CUALITATIVO : SEXO
Ejemplo 1:
Una Población formada por 1800 personas.
35
30
25
Casa Indep
20 Dpto edif.
15 Viv. quinta
Casa vecind
10 Otro
5
0
Número Viviendas
EJEMPLO 3:
Se entrevistaron a 600 personas mayores de 18 años, respecto si
estaban de acuerdo con la política del gobierno
OPINIÓN # De FRECUENCIA % De
personas RELATIVA personas
(1) Muy de 40 0.067 6.7 %
acuerdo
(2) De 35 0.058 5.8 %
acuerdo
(3) En 500 0.833 83 %
desacuerdo
(4) No sabe / 25 0.042 4.2 %
No opina
Total 600 1.00 100 %
EJEMPLO 4:
Se entrevistaron a 500 personas mayores de 18 años, respecto al
nivel de confianza en las instituciones
OPINIÓN # %
PERSONAS PERSONAS
(1) Iglesia católica 116 23.2 %
(2) Universidades 94 18.8 %
(3) PROFECO 55 11.1 %
(4) Medios de comunicación 49 9.7 %
(5) Sindicatos de trabajadores 11 2.2 %
(6) Ninguna institución / No 175 35.0 %
sabe/ no opina
Total 500 100 %
II. CASO CUANTITATIVO DISCRETO:
Ejemplo 1:
# de personas por hogar, de 50 hogares
CANTIDAD
# DE PERSONAS CONTEO (FRECUENCIA)
POR HOGAR HOGARES
1 ||||| ||||| 21
||||| |||||
2 ||||| ||||| 20
||||| |||||
3 ||||| || 8
||||| |||||
4 | 1
II. EJEMPLO 1:
Distribución de frecuencias del Número de Personas por Hogar
Xi fi hi=fi / Fi Hi
(# de
personas
(Frecuencia
Absoluta)
N (Frecuencia
Absoluta
(Frecuencia
relativa
por (# Hogares) (Frecuencia Acumulada) acumulada)
hogar) Relativa) (% Acum.
(Acum.hogares)
(% hogares)
Hogares)
1 21 42 % 21 42 %
2 20 40 % 41 82 %
3 8 16 % 49 98 %
4 1 2% 50 100 %
TOTAL 50 Hog 100 % ------ ------
II. EJEMPLO 2:
Caso Cuantitativo Discreto: # de personas ocupadas , de 100 empresas
xi fi hi=fi /n Fi Hi
# Pers. # Frec.Relati Acum. Acum.
Ocup. Empresas -va Emp. Frec.
Relat.
1 5 0.05 5 0.05
2 14 0.14 19 0.19
3 18 0.18 37 0.37
4 25 0.25 62 0.62
5 20 0.20 82 0.82
6 10 0.10 92 0.92
7 5 0.05 97 0.97
8 3 0.03 100 1.00
TOTAL T = 100 1
II. EJEMPLO 2:
Gráfico de Bastones y Polígono de Frecuencias:
Xi: # de personas ocupadas,
n = 100 empresas
f
i
- 0.25
X
0 1 2 3 4 5 6 7 8
# de personas ocupadas
III. CASO CUANTITATIVO CONTÍNUO:
Ejemplo1:
Consumo mensual de agua (metros cúbicos)
N = 36 hogares, en área urbana
38.10 36.20 36.70 34.00
34.90 33.98 34.60 34.50
33.80 31.57 31.54 36.96
37.85 36.80 36.00 30.16
36.88 36.23 34.55 38.24
36.57 35.93 33.20 35.47
37.10 36.20 33.00 35.61
33.15 33.29 32.91 30.00
35.40 31.60 39.99 34.51
III. CASO CUANTITATIVO CONTÍNUO:
0.37
0.19
0.05
X
1 2 3 4 5 6 7 8
# de personas
INTERVALO Y RANGO
polígono de
de frecuencias
30 I 40
i
HISTOGRAMA Y POLÍGONO DE
FRECUENCIAS
III. OJIVA:
FRECUENCIAS ACUMULADAS
1 -F
0.76 -
Ojiva
B
0.48 -
A
0.24 -
0.08
ne s d -
ne cisio
Reporte de
go e
c io
De
resultados
Análisis de datos cuantitativos
Distribución de frecuencias
Media
Medidas de tendencia central Mediana
Moda
Estadística descriptiva Medidas de variabilidad Rango
Desviación estándar
Gráficas Varianza
Puntuaciones Z
Coef. Correlación
Regresión lineal
Análisis paramétrico Prueba t
Diferencia de proporcione
ANOVA
Análisis de covarianza
Estadística inferencial
-estima parámetros y prueba Chi cuadrada
Hipótesis Análisis no paramétrico Coef.
-Se basa en la distribución muestral Sperman/Kendall
Tabulaciones
cruzadas
Tips para tablas y gráficos
Redondeo de Números redondeados son más fáciles de
números comparar
Seguir patrones Ordenar los números de mayor a menor en las tablas,
y de izquierda a derecha
Usar promedios, totales Los promedios dan un punto de comparación
o porcentajes Los totales brindan imagen global; Porcentajes
muestran proporciones
Comparar escalas Convertir los números a una escala común cuando
parecidas en una sola estén en diversas escalas (Ej. Gramos vs onzas;
tabla salarios mensuales vs salarios semanales)
Escoger simplicidad Varias tablas pequeñas revelan patrones mejor que
sobre complejidad una única tabla compleja.
Usar diseños que guíen Las tablas deben tener menos columnas que
la vista hacia números renglones. Alinea a la derecha los encabezados de
que deban ser columna y los número. Agrupa los números con marco
comparados para separar excepto si van a ser comparados.
Resume cada gráfico Escribe la explicación de cada gráfico presentado.
Etiqueta y escribe títulos Títulos deben ser explicativos: qué, donde, cuando y
para mejorar la unidad de medición; evita abreviaturas; evita pie de
Tablas o líneas de frecuencia, barras y
pays
Tablas de frecuencia: formato para
registrar
Variable datos
Valor Frecuencia Porcentaje Acumulado
Programa A 1 10 10 10
Programa B 2 8 8 18
Programa C 3 7 7 25
Programa D 4 13 13 38
Radio A 5 24 24 62
Radio B 6 4 4 66
Radio C 7 11 11 77
Revista A 8 6 6 83
Revista B 9 7 7 90
Espectacula 10 10 10 100
r
Gráficas de línea
Son utilizadas para mostrar series de
tiempo y distribuciones.
Guía de diseño:
Poner las unidades de tiemo en el eje de
las X (horizontal)
Cuando se muestre más de una línea usar
diferentes tipos de líneas.
No usar más de cuatro líneas en una sola
gráfica
Usar una línea sólida (no punteada) para
Gráfica de línea para ilustrar frecuencias
24
13
11
10 10
8
7 7
6
4
1 2 3 4 5 6 7 8 9 10
Gráficas tipo “Pay”
Grafica el 100% de los datos
Siempre etiqueta las “rebanadas” con el porcentaje o
cantidad que se representa.
Pon la rebanada más grande hacia las 12 y mueve en
dirección de las manecillas del reloj en orden
descendente.
Usa colores claros para grandes rebanadas y más oscuros
para rebanadas pequeñas
No uses gráficas de pay para mostrar evolución en el
tiempo como único medio, compleméntelos con otras
gráficas de área.
Gráficas de barras
Usar eje de las X (horizontal) para
representar tiempo
Usar eje de las Y (vertical) para
representar unidades o variables
asociadas al crecimiento.
Las barras verticales son utilizadas para
series de tiempo y para clasificaciones
cuantitativas.
Las barras horizontales se usan con
Histogramas
Se utilizan cuando es posible agrupar
los valores de una variable en
intervalos.
Se construyen con barras o asteriscos
que representan valores y donde cada
valor ocupa una misma cantidad de
área.
Son útiles para:
Desplegar todos los intervalos en una
distribución
Ejemplo de histograma
N Válidos 108
Faltante 1
Sesgo 1.290
Error estándar del sesgo .233
Curtosis 2.004
Error estándar de la curtosis .461
Gráficos de tallo y hojas
Es un gráfico relacionado al histograma.
Puede ser construido a mano fácilmente al igual que en un
paquete computacional.
Presenta los valores actuales que pueden ser revisados
directamente.
Preserva la distrubución de los valores dentro del intervalo
y preserva el orden de rango a través de medias, cuatriles
y otros estadísticos.
Facilidad de visualización de los patrones en los datos
5|455666788889
6|12466799
Diagramas de Pareto
Es un gráfico cuyos porcentajes suman 100%.
Tiene que ver con la regla 80-20%: el 80% de la mejora
en calidad o desempeño puede esperarse que dé al
eliminar el 20% de las causas de calidad inaceptable o
desempeño.
Boxplots
Es una técnica utilizada en el análisis exploratorio.
Proporciona una imagen visual diferente de la distribución,
localización, ancho, forma, longitud y datos fuera de rango.
Comprende extensiones del resumen de la distribución: mediana,
cuartiles superiores e inferiores y la observación mayor y la menor.
Elementos:
1. 50% de los valores
2. Línea central que señale la media
3. Extremos de la caja (Hings)
Tabulación cruzada
Es una técnica para comparar datos de
dos o más variables categóricas como
sexo y asignación de puesto.
Se usa con variables sociodemográficas
y las variables del estudio
Se hace mediante el programa SPSS