Beruflich Dokumente
Kultur Dokumente
CONCEPTOS BÁSICOS.
CLASIFICACIÓN DE LA ESTADÍSTICA.
TIPOS DE VARIABLES.
NIVELES DE MEDICIÓN.
RECOPILACIÓN DE DATOS.
CONCEPTOS ESTADÍSTICOS:
Definición de Estadística:
Ciencia que se ocupa de facilitar la toma de decisiones acertadas frente a una
incertidumbre y por lo tanto, desarrolla y utiliza técnicas para la recolección cuidadosa,
presentación efectiva y el análisis correcto de la información numérica.
RAMAS DE LA ESTADÍSTICA:
Estadística
Descriptiva o
deductiva: estudia las
características de un
conjunto de datos.
Inferencial o
inductiva: analiza los
datos para establecer
generalidades.
Conocimiento Conocimiento
exacto. aproximado.
Mucho tiempo
Rápido
requerido.
Parámetro: es Estadístico: es
cualquier medida
descriptiva de la
Población Muestra cualquier medida
descriptiva de la
población completa. muestra y sirve
para estimar el
Grande (si parámetro de la
Finita tiene 30 o más
elementos) población.
Infinita Pequeña
OBTENCIÓN DE DATOS:
Muestreo: es el proceso estadístico que permite seleccionar algunos elementos de la población.
Técnica de muestreo: conocido también como diseño de experimento, son las técnicas para
realizar el muestreo y que dependerán cada caso, cual usar. Alguna de ellas son:
Muestreo
• Los datos sólo • En este nivel los • Cuando los datos • Éste es el nivel más
pueden contarse o datos presentan un son mutuamente completo de los
clasificarse. Deben orden o jerarquía. excluyentes y datos, son
ser mutuamente pueden agruparse perfectamente
excluyentes. en clasificaciones comparables entre
exhaustivas, sí.
además de que la • Se diferencia de la
unidad de medición escala por
es una constante. intervalos
• En esta escala el únicamente porque
cero es arbitrario, tiene un punto
es decir, no indica cero natural, es
la ausencia de la decir, ausencia de
característica de la característica de la
medida. medida.
EJEMPLO: ¿ESCALA DE MEDICIÓN?
Parámetro
Promedio de todas las arandelas producidas, 2.5 centímetros.
Estadístico.
Promedio de las arandelas de la muestra.
ESTADÍSTICA
DESCRIPTIVA.
RECOPILACIÓN DE DATOS:
Una distribución de
frecuencia es una tabla que
presenta el número de
elementos que pertenecen a
cada una de las clases o
categorías en las que se
divide un grupo de datos
para estudiarlos.
DISTRIBUCIÓN DE FRECUENCIAS SIMPLES:
Datos ordenados
515 542 643 696 700
704 739 782 784 814
832 956 987 1 023 1 023
1 052 1 296 1 333 1 475 1 482
EJEMPLO 4: DATOS AGRUPADOS
Del análisis de resistencia de 30 bloques de concreto se obtuvieron los resultados que se indican a
continuación.
Ordene la información proporcionada en el cuadro de frecuencias.
Interprete algunos de los valores.
Datos ordenados
22.7 22.7 23.1 26.3 26.4 29.4
29.8 30.3 30.5 35.1 37.7 39.2
39.4 42.9 43.6 45.6 48.3 48.4
52.3 52.9 56.3 58.2 58.9 60.4
62.8 64.9 65.3 68.1 68.4 70.4
REPRESENTACIÓN GRÁFICA:
Descortesía de personal
Quejas principales
Falta de retroalimentación
Repuestos caros
Servicio caro
30.00%
25.00%
20.00%
15.00%
10.00%
5.00%
0.00%
Queja principal
GRÁFICA DE PASTEL, CIRCULARES O SECTORES
Se usan para mostrar como una cantidad total se reparte en un grupo de categorías.
Variables cualitativas en porcentajes o cifras absolutas.
PORCENTAJE DE QUEJAS
16% 19%
10%
31% 9%
7%
Límites Límites
aparentes reales Xi f F fr Fr f% F%
0.2-1.5 0.15-1.55 0.85 17 17 17/50 17/50 34 34
1.6-2.9 1.55-2.95 2.25 11 28 11/50 28/50 22 56
3.0-4.3 2.95-4.35 3.65 7 35 7/50 35/50 14 70
4.4-5.7 4.35-5.75 5.05 6 41 6/50 41/50 12 82
5.8-7.1 5.75-7.15 6.45 4 45 4/50 45/50 8 90
7.2-8.5 7.15-8.55 7.85 3 48 3/50 48/50 6 96
8.6-9.9 8.55-9.95 9.25 2 50 2/50 1 4 100
16
14
12 11
10
8 7
6
6
4
4 3
2
2
0 0
0
17 0.85 14
Número de clientes
11 2.25 12
11
7 3.65 10
6 5.05 8
7
4 6.45 6 6
3 7.85 4 4
3
2 9.25
2 2
0 0 0
0.85 2.25 3.65 5.05 6.45 7.85 9.25
Tiempo promedio por transacción (min) Marcas de clase
FRECUENCIAS ACUMULADAS U OJIVA
1.55 17 45
41
2.95 28
35
4.35 35
28
5.75 41
7.15 45 17
8.55 48
9.95 50
0
0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95
Tíempo de transacción (min)
OJIVA DESCENDENTE
Ojiva descendente (mayor que)
Tiempo por transacción bancaria
60
Límites reales Fa
0.15 50 50 50
1.55 33
No. de clientes
40
2.95 22
30
33
4.35 15
5.75 9 20 22
7.15 5 15
10 9
8.55 2
5
9.95 0 0 2 0
0.15 1.55 2.95 4.35 5.75 7.15 8.55 9.95
Tiempo de transacción (min)
GRÁFICAS LINEALES
Sirven para representar las series de tiempo, porque reflejan la dirección del cambio.
Eje horizontal: escala de tiempo
Proyecciones de crecimiento de población
25
Edad de 85 años o más (millones)
20
15
10
0
2010 2020 2030 2040 2050
Año
GRÁFICA DE PUNTOS
Muestra pequeños conjunto de datos cuantitativos.
Eje horizontal: valores de la variable estudiada.
Constituye un sencillo y gráfico método de análisis que permite ver entre las causas
más importantes de un problema (pocos vitales) y las que no lo son (muchos
triviales).
Entre sus ventajas es que permite centrarse en los aspectos cuya mejora tendrá más
impacto, optimizando por tanto los esfuerzos.
Es decir, este diagrama establece que un 20% de las fuentes causan el 80% de
cualquier problema.
EJEMPLO:
En una empresa textil
se desea analizar el
número de defectos en
los tejidos que fabrica.
En la tabla siguiente se
muestran los factores
que se han identificado
como causantes de los
mismos así como el
número de defectos
asociado a ellos:
PASOS A SEGUIR:
Primero debemos
ordenar los datos en
forma decreciente:
PASOS A SEGUIR:
El hotel Brisas del mar, ha recibido en el último semestre numerosas quejas sobre el
servicio. Esto está afectando negativamente al desempeño del sistema de gestión de
calidad, repercutiendo negativamente en la satisfacción del cliente. Las quejas son
variadas, así que los responsables de procesos se reúnen y deciden hacer un diagrama
de Pareto para determinar la causa predominante y trabajar sobre ella.
El equipo de trabajo recopila las posibles causas del problema a través de listas de
verificación, resultados de encuestas, quejas, etc. y también la frecuencia con la que
ocurren.
TABLA DE DATOS:
Es un valor que deja por debajo de él un número de casos igual al que deja por
arriba.
No presenta el problema de estar influida por los valores extremos, pero no utiliza
en su cálculo todos los valores de la serie de datos.
MODA:
La moda también es menos afectada por los valores atípicos, pero si no hay moda o si el
conjunto de datos es bimodal su uso puede ser confuso.
Datos simples
Se tienen algunas características de un grupo de 12 personas. Estas características
son:
Edad (años): 22,24,25,26,27,28,28,29,30,31,33,34
Ingreso anual: 8000-8200-9000-10 000-11 000-12 000-12 300-12 500-13 000-13 500-
86 000-97 000
Número de zapato: 8 ½-9- 9 ½ - 9 ½ - 9 ½ 9 ½ -10-10-10 ½-10 ½ -11-11 ½
¿Cuál es la edad promedio, ingreso anual promedio y número de zapato promedio
para este grupo?
EJEMPLO 7:
Temperatura (°C) Número de alambres
Datos agrupados 27.5-32-5 1
Los siguientes datos 32.5-37.5 2
corresponden a la 37.5-42.5 5
temperatura de secado 42.5-47.5 12
en la fabricación del
47.5-52.5 24
alambre barnizado al
horno: 52.5-57.5 7
57.5-62.5 3
Calcule las tres
62.5-67.5 2
medidas de tendencia
central.
MEDIDAS DE TENDENCIA NO CENTRAL (FRACTILOS)
Se utiliza cuando algunos de los valores por promediar son más importantes que
otros, por lo que a cada uno de los valores de frecuencia se le asigna un valor de
peso, el cual depende de la importancia que el investigador quiera darle.
Donde:
w_ son las ponderaciones de cada valor X
X_ son los valores observados 𝑤𝑖 𝑥𝑖
𝑋𝑝 =
𝑤𝑖
EJEMPLO 11:
Al seleccionar a su personal, una empresa considera que los conocimientos tienen una importancia
relativa de 50, la puntualidad 30 y la presentación 20. Cinco solicitantes de empleo obtuvieron las
calificaciones que se presentan en la tabla siguiente:
¿Cuál de ellos obtuvo la mejor calificación global?
𝑛
𝑋𝑔 = 𝑥1 . 𝑥2 … 𝑥𝑛
EJEMPLO 13:
Nos permiten medir la dispersión en términos de la diferencia entre dos valores seleccionados del
conjunto de datos.
Rango: Es fácil de entender y calcular, pero su utilidad es limitada, pues sólo toma en cuenta el valor
más grande y el valor más pequeño y ninguna otra observación del conjunto de datos.
Rango Intercuartílico: Mide qué tan lejos de la mediana se debe ir en cualquiera de las dos
direcciones, antes de recorrer una mitad de los valores del conjunto de datos. (Percentil 75 y
percentil 25)
Rango Interpercentílico: Medida de dispersión que calcula la diferencia en los extremos de la
distribución (percentil 90 y percentil 10) .
MEDIDAS DE DESVIACIÓN PROMEDIO:
Determine que proveedor parece más confiable por medio de la desviación estándar.
Compañía A Compañía B
Resistencia f Resistencia f
15.0-18.0 50 25.0-27.5 50
18.0-21-0 200 27.5-30.0 200
21.0-24.0 500 30.0-32.5 500
24.0-27.0 200 32.5-35.0 200
27.0-30.0 50 35.0-37.5 50
DISPERSIÓN RELATIVA (CV)
Características
La forma es la manera en que los datos se distribuyen, es decir, la forma
de la curva que representa a la serie de datos.