You are on page 1of 42

PROBABILIDAD Y ESTADÍSTICA IN D U S T R I A L

HUMBERTO VILLALOBOS TORRES UNIVERSIDAD T ÉCNICA FEDERICO S ANTA M ARÍA D E PA R T A M E N T O D E M AT E M Á T I C A S

24/06/2013

INTRODUCCIÓN
La gran cantidad de datos que nos presenta la vida diaria (televisión, periódicos, publicidad) hace necesario que cada integrante de una sociedad se pregunte:
¿Porqué es necesario el análisis de datos? ¿Existe alguna estructura en los datos? ¿Existe algún dato anómalo? ¿Se puede sintetizar (resumir) los datos de manera conveniente? ¿Existen grupos de datos diferentes? ¿Es posible poder predecir el valor de un atributo, basado en las mediciones de otros valores?, etc...
Elaborado por: Humberto Villalobos Torres
24/06/2013

INTRODUCCIÓN
Es de vital importancia tener métodos confiables y efectivos que nos permitan organizar datos, para transformarlos en información que nos permita tomar mejores decisiones. La Estadística, se ocupa de:
Métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos. Realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
Elaborado por: Humberto Villalobos Torres
24/06/2013

PROCESO

DE

MEDICIÓN

Elaborado por: Humberto Villalobos Torres

24/06/2013

hechos u objetos del mundo real. Elaborado por: Humberto Villalobos Torres 24/06/2013 .PROCESO DE MEDICIÓN La medición es la asignación de símbolos (números) a sucesos.

se presenta un error de medición. • Nº de ventas por región • Tiempos de atraso en entregas • Nº de reclamos • Ingresos por venta Elaborado por: Humberto Villalobos Torres 24/06/2013 Entre días Entre Personas .PROCESO DE MEDICIÓN Si esta relación entre los objetos o sucesos del mundo real es tergiversada.

2. 3. 6. sistema numérico: 0. Símbolos o Códigos Unicidad Orden Diferencias Equitativas Razones Equitativas Elaborado por: Humberto Villalobos Torres Clasifica + Orden + Distancia + Comparación Nominal Ordinal Intervalar Razón 24/06/2013 . 4. 5. 1.PROCESO DE MEDICIÓN Cuando se habla de mediciones. 7. lo habitual es pensar en números. 9. 8.

¿CÓMO OBTENER DATOS? • Censar Población Sub-conjunto de la Población 24/06/2013 Datos • Muestra Elaborado por: Humberto Villalobos Torres .

El segundo es la cantidad de variación en los datos. El primero es el tamaño de la muestra seleccionada de la población. por tanto. Elaborado por: Humberto Villalobos Torres 24/06/2013 .CARACTERÍSTICAS DE MUESTRAS Conceptos Básicos de muestreo Dos factores afectan la cantidad de información contenida en la muestra y. afectan la precisión del procedimiento de hacer inferencias. la variación frecuentemente puede ser controlada por el método de selección de la muestra.

TIPOS DE MUESTREO Muestreos No Probabilísticos Muestreos Probabilísticos Encuesta ¿Está ud. de acuerdo con que la crisis económica europea tendrá un menor impacto en Chile? Elaborado por: Humberto Villalobos Torres 24/06/2013 .

Las observaciones tienen asignado un costo.TÉCNICAS BÁSICAS DE MUESTREO El procedimiento para seleccionar la muestra se denomina diseño de muestreo. Elaborado por: Humberto Villalobos Torres 24/06/2013 . en que cada uno de los elementos de la población de interés. un diseño que proporcione un estimador preciso. para un tamaño de muestra fijo. produce un ahorro en el costo del experimento. A las muestras aleatorias se les denomina también muestras probabilísticas. y frecuentemente igual. tiene una probabilidad conocida. Diseños básicos de Muestreo Aleatorio El muestreo aleatorio es aquél. de ser elegido en la muestra.

Una muestra aleatoria simple es aquella en la que los elementos se escogen en forma individual y al azar de la totalidad de la población. Elaborado por: Humberto Villalobos Torres 24/06/2013 . La selección al azar es similar a la que se realiza en la extracción aleatoria de números en una lotería. Los elementos de la población no presentan grandes variaciones entre grupos naturales que pudiesen formarse en ésta.TÉCNICAS BÁSICAS DE MUESTREO Muestreo aleatorio simple o muestreo al azar irrestricto.

TÉCNICAS BÁSICAS DE MUESTREO Muestreo aleatorio estratificado Se clasifican los elementos de la población en subgrupos según la o las características importantes. Puede utilizarse este tipo de muestreo para asegurar una representación proporcional de diversos subgrupos en la muestra. Se obtiene por separado una muestra aleatoria simple o sistemática de cada estrato. Elaborado por: Humberto Villalobos Torres 24/06/2013 .

se eligen al azar los subgrupos que forman la muestra. difíciles de descomponer para llegar al elemento informativo. Es un tipo de muestreo aleatorio en el que los elementos de la población están en forma natural en subgrupos. Elaborado por: Humberto Villalobos Torres 24/06/2013 . Los elementos de la poblaciones se encuentran en pequeños grupos.TÉCNICAS BÁSICAS DE MUESTREO Muestreo aleatorio de conglomerados. Así.

24/06/2013 Elaborado por: Humberto Villalobos Torres .TÉCNICAS BÁSICAS DE MUESTREO Muestreo aleatorio sistemático. • • Líneas de Producción. Llegadas de Clientes. Los elementos a muestrear se presentan ordenados de forma natural. Es una muestra aleatoria en la cual se eligen los elementos de la población a intervalos uniformes.

). Elaborado por: Humberto Villalobos Torres 24/06/2013 .) Organización de datos Una manera de acomodar los datos es construir un arreglo ordenado. etc. organizando los datos con un orden natural. cuyo fin es permitir realizar un diagnóstico de éstos (Estadística Descriptiva).cuando la escala de medición lo permite. Datos No Agrupados (Dispersos – a granel. Datos Agrupados (Tablas. etc. gráficos.RESUMEN DE DATOS Análisis Exploratorio de Datos (DAE) Son un conjunto de técnicas encaminadas a la visualización de los datos mediante tablas o gráficos y la determinación de un conjunto de indicadores descriptivos de diversas características de los datos. esto es.

. las cuales se simbolizan por: C1.RESUMEN DE DATOS Las respuestas observadas en la población (muestra)... . • Frecuencia Absoluta: • Frecuencia Relativa: • Frecuencia Absoluta Acumulada: • Frecuencia Relativa Acumulada: Elaborado por: Humberto Villalobos Torres ⇒ ⇒ ⇒ ⇒ ni fi Ni Fi 24/06/2013 . donde k es la cantidad de categorías (respuestas) distintas. Ck. C2. se denominaran clases.

RESUMEN DE DATOS APLICACIÓN 1: Suponga el caso que es de interés determinar la frecuencia de las facturas que llegan a la empresa producto de trabajos realizado por los contratistas de obras menores. Elaborado por: Humberto Villalobos Torres 24/06/2013 .

Los datos son: Elaborado por: Humberto Villalobos Torres 24/06/2013 . Regulares (R). Estos son clasificados como: Malos (M). el interés es determinar la clasificación de éstos según su cumplimiento en el pago. Buenos (B) y excelentes (E).RESUMEN DE DATOS APLICACIÓN 2: En un conjunto de clientes.

donde ‘n’ es la cantidad de datos que se desea organizar. Elaborado por: Humberto Villalobos Torres 24/06/2013 . donde: k = 3.RESUMEN •Datos Continuos DE DATOS Muchas datos distintos Regla de Sturges: Permite mostrar un referencial para el número de clases.3 log(n) + 1 .

Para la determinación de los límites de las clases. se debe calcular el rango (RD). el cual se calcula como: LI1 = Mínimo {xi} − Elaborado por: Humberto Villalobos Torres D 2 24/06/2013 . que es la multiplicación entre la cantidad de clases que se están utilizando y la amplitud. Rango de la Tabla: Una vez determinada la amplitud a. se comienza con el límite Inferior de la primera clase.RESUMEN DE DATOS Amplitud: Para determinar ‘a’. LI1. la amplitud de las clases. se procede a determinar el rango de la tabla (RT).

RESUMEN DE DATOS APLICACIÓN 3: Considere los datos de tiempos de espera (en segundos) para una línea telefónica de atención al cliente.2 – 59 = 1.2 24/06/2013 Elaborado por: Humberto Villalobos Torres .6 = 60. 47 34 55 53 25 42 55 52 Tiempos (Segundos) 43 33 … 55 48 48 42 … 48 63 65 36 … 39 11 45 44 … 56 54 66 44 … 54 54 54 70 … 44 52 70 34 … 52 32 57 41 … 43 35 … … … … … … … … Rango de la Muestra: RM = 70 – 11 = 59 Amplitud: a = (59 + 1)/7 Rango de la Tabla : RT: k x a = 7 x 8.2 Diferencia : D = RT – RM = 60.

1 57.5 49.42% 11 9.0 [ 27.4 [ 62.00% 24/06/2013 Elaborado por: Humberto Villalobos Torres .0 − − − − − − − 19.0 [ 27.27% 13.2 [ 44.8 [ 53.80% 91.9 40.3 1 0.33% 30 25.64% 10 8.6 ] 14.4 [ 62.0 [ 70.40% 22 18.85% 4.6 [ 36.67% 32.80% 39 33.) Frecuencia Marca Frecuencia Acumulada de Clase Absoluta Relativa Absoluta Relativa [ 10..RESUMEN DE DATOS APLICACIÓN 3: Considere los datos de tiempos de espera (en segundos) ..56% Marca de Clase = mi 1 5 16 38 77 107 117 0.47% 65.85% 4 3.7 23.44% 100. Tiempos (seg.7 66.8 [ 53.3 31.6 [ 36.4 [ 19.2 [ 44.

esta formado los dígitos restantes. 5 ↑ tallo 48 ↑ hoja 54 ↑ tallo 8 ↑ hoja 24/06/2013 Elaborado por: Humberto Villalobos Torres .RESUMEN DE DATOS En el diagrama de tallo y hoja. el tallo .la primera parte de número . mientras que la hoja.es el que presenta menor variación.

5 74.9 95.1 66.4 73.7 24/06/2013 Elaborado por: Humberto Villalobos Torres .2 67.8 69.2 84.2 82.6 72.5 78.8 75.0 68.9 71.2 76.8 68. usted considera necesario leer fielmente el periódico ‘Estrategia’. Un reporte reciente de éste.8 70. mostró los datos sobre el porcentaje de ejecutivos de la plana gerencial de las 27 mayores corporaciones presentes en Chile que sufren problemas por el grado de stress alcanzado por ellos: 59.9 73.8 80.7 71.RESUMEN DE DATOS • APLICACIÓN 4: Como consultor económico privado.7 70.4 71.7 86.1 76.4 72.5 78.4 76.

9 3 6.0 8.2 8.2 1.4 4.RESUMEN DE DATOS • APLICACIÓN 4: Como consultor económico privado.8 10 5.7 2.9 8.9 3.7 8.8 4.2 2.2 1.5 2.7 6 0.8 5 0.5 6.4 1.4 9.8 1 Elaborado por: Humberto Villalobos Torres 24/06/2013 Tallo 5 *6 6 *7 7 *8 8 *9 9 Hoja 9.1 0.1 3.4 6.6 6.8 1 0 5.7 7. usted considera necesario leer … 1 0 6.5 fi .

RESUMEN DE DATOS Representaciones gráficas El objetivo principal de una representación gráfica es mostrar alguna(s) característica(s) de interés de la población bajo estudio. o Ser una representación rápida. Dependen del tipo de datos o Cualitativo o cuantitativo o Discreto o continuo o Tipo de escala Elaborado por: Humberto Villalobos Torres 24/06/2013 . mediante los resultados muestrales que cumpla con: o Ser una representación simple.

todas del mismo peso. de los resultados asociados al tipo de yacimientos se tiene los siguientes resultados: 7 5 4 3 2 1 0 LP LM PML PMI MM GM Tipo de Yacimiento Elaborado por: Humberto Villalobos Torres Tipo de Yacimiento Frecuencia 6 LP • Artesanal local pequeña (LP) • PML Artesanal local mayor (LM) • Pequeña minería consumo LM local (PML) MM • Pequeña minería consumo local PMI e internacional (PMI) GM • Mediana capacidad (MM) 0 minería 1 2 (GM) 3 4 5 6 7 • Gran Frecuencia 24/06/2013 .RESUMEN DE DATOS • APLICACIÓN 5: Un geólogo recolectó 26 muestras. para la búsqueda de minerales en una región.

24/06/2013 Elaborado por: Humberto Villalobos Torres .RESUMEN DE DATOS • APLICACIÓN 5: Un geólogo recolectó 26 muestras. todas del mismo peso. para la búsqueda de …. LP LM PML PMI LP MM LM PML PMI MM GM GM El efecto de la tercera dimensión la mayoría de las veces distorsiona la realidad.

3 31..5 49.7 66.3 14.3 31.RESUMEN DE DATOS APLICACIÓN 3: Considere los datos de tiempos de espera (en segundos) .7 66.9 40.3 Tiempos de Espera Tiempo de Espera Elaborado por: Humberto Villalobos Torres 24/06/2013 .1 57.7 23. 45 40 35 Histograma de Frecuencia Frecuancia Acumulada 120 100 80 60 40 20 0 Frecuencia Acumulada F re c u e n c i a 30 25 20 15 10 5 0 14.7 23..5 49.9 40.1 57.

53 Porcentaje 24/06/2013 . Rentabilidad 8 6 4 2 0 -2 -4 -6 Tiempo Patrones en el tiempo Elaborado por: Humberto Villalobos Torres ene-06 feb-06 mar-06 abr-06 may-06 jun-06 jul-06 ago-06 sep-06 oct-06 -0. intenta determinar si la rentabilidad de Fondo Mutuo XZ.65 -0.RESUMEN DE DATOS • APLICACIÓN 6: Una economista.14 -1.96 nov-06 dic-06 ene-07 feb-07 mar-07 abr-07 may-07 jun-07 jul-07 ago-07 -1.34 3.48 5. donde obtuvo los siguientes datos: Tiempo Rent.78 2. Tiempo Rent.06 -4.69 1.26 -3.02 5.68 3.34 0.12 5.08 -2.32 6.38 2.31 -1.14 -4. mantiene un precio estable en el tiempo.38 -2.

RESUMEN Indicadores o Gestión o Calidad DE DATOS Resúmenes Tipos Comunes de Indicadores o o o o o Indicadores de Localización (Posición) Indicadores de Concentración (Economía) Indicadores de Variabilidad Indicadores de Forma Indicadores de Asociación 24/06/2013 Elaborado por: Humberto Villalobos Torres .

INDICADORES DE LOCALIZACIÓN Tendencia Central Media (Promedio) 1 X = ∑ Xi n i =1 Mediana n 1 X = ∑ ni mi n i =1 n  ai Me = Li +  − Ni −1  2  ni 24/06/2013 k Me = ɺ X n + 1     2   Elaborado por: Humberto Villalobos Torres .

50% Emis Ltda.75% Elaborado por: Humberto Villalobos Torres 24/06/2013 .50% Smith y CIA. Datos Cualitativos APLICACIÓN 1: Suponga el caso que es de interés determinar la … Frecuencias Frecuencias Empresa Absoluta Relativa 10 31.25% Baker & Jones Brown e Hijos 4 12. 6 18. 12 37.INDICADORES DE LOCALIZACIÓN Moda: Es la medida que está dada por el valor o clase que se presenta con mayor frecuencia.

INDICADORES DE LOCALIZACIÓN APLICACIÓN 2: En un conjunto de clientes … son clasificados como: Malos (M). Regulares (R). Buenos (B) … Clasificación Malo Regular Buenos Excelentes Frecuencias Frecuencias Acumuladas Absoluta Relativa Absoluta Relativa 16% 8 8 16% 18% 17 9 34% 46% 40 23 80% 20% 50 10 100% 24/06/2013 Elaborado por: Humberto Villalobos Torres .

7% 8 2 3. le interesa es determinar el número de veces que éstos se han atrasado en el pago de su cuenta.INDICADORES DE LOCALIZACIÓN APLICACIÓN 7: Suponga que un conjunto de clientes.3% 24/06/2013 .7% 3 3 0 3 0 0 0 1 8 0 13.3% 0 0 3 2 3 3⁞ 0 0⁞ ⁞ 7 4 6. Los datos son los siguientes: 0 0 7 2 0 0 0 0 2 0 3 8 4 2 3 0 4 0 7 0 7 0 1 0 0 0 0 4 Frecuencias Número de 1 4 0 0 Absoluta 0 0 0 0 Relativa Atrasos 0 32 53.3% 2 4 6. Elaborado por: Humberto Villalobos Torres .3% 4 5 8.4% 4 1 1 1 0 7 3 0 5 8 8.

9 95.5 74.4 73.5 + 78.2 71.1 76.4 76. usted considera necesario leer fielmente … 59..2 76. 60 n 27 i =1 n 24/06/2013 .8 75.8 68.5 78.8 70. + 80.6 72.10 10 − 5 Mo = 70 + ×5 = 72.9 73. 7 X= ∑ = = 74.8 69.8 80. 78 10 − 5 + 10 − 6 Elaborado por: Humberto Villalobos Torres xi 59.7 71.4 82. 0 + 68.INDICADORES DE LOCALIZACIÓN • APLICACIÓN 4: Como consultor económico privado.7 Me = X (14) = 73.0 68.9 71..7 86.4 72.7 70.2 84. 4 + .1 66.2 67.5 78.

5[ 10 [11.5[ 48 [17. presenta la distribución de los sueldos* en esta fábrica: Planta Sur Sueldo [M$/d] % de Obreros [8.5[ 10 [20.5 – 23.0 × 4 X= 100 = 15. La tabla siguiente.5 – 17.5[ 20 [14.98  50 − 30  Me = 14..5 – 20. +26..75  48  48 − 20   Mo = 14.5 +   × 3. se dedica a exportación de muebles. 77  48 − 20 + 48 − 10  Elaborado por: Humberto Villalobos Torres 24/06/2013 .0 × 10+ ..5] 4 10. 0 = 15.5 – 14.5[ 8 [23.0 = 15.A.INDICADORES DE LOCALIZACIÓN APLICACIÓN 8: La Planta Sur de la fábrica de muebles Hoti S.5 +   × 3.5 – 28.5 – 11.

INDICADORES DE LOCALIZACIÓN Los cuantiles se pueden clasificar en: Cuartiles Quintiles Déciles Percentiles Pi = X i ( n + 1)    100   La expresión de cálculo es:  n× j P j = LI j +   100  ai − Ni − 1   ni 24/06/2013 Elaborado por: Humberto Villalobos Torres .

4 73.7 71.2 76.0 8.8 6.2 1.10 P58 = X 58(27+ 1)  = X (16.8 75.7 86.2 2.4 1.7 4.8 70.8 7. usted considera necesario leer fielmente … 59.7 70.2 71.1 3.8 69.4 82.5 78.4 0.8 4.INDICADORES DE LOCALIZACIÓN • APLICACIÓN 4: Como consultor económico privado.4 8.8 68.5 2.7 0.8 5.4 9.8 1.9 3.2 8.5 74.0 68.9 P25 = X 25(27+ 1)  = X (7)   100   = 70.9 0.7 Tallo 5 *6 6 *7 7 *8 8 *9 9 Hoja 9.4 72.9 73.1 66.2 84.9 71.6 72.4 76.5 2.7 8.24) = 75.1 5.7 6.1 76.10   100   24/06/2013 Elaborado por: Humberto Villalobos Torres .8 80.5 78.5 6.6 6.2 6.9 95.2 67.

56% . Tiempos (seg.64% 8.33% 25. 6 = 53.0 − 19.0 [ 70.8 − [ 53.4 − ⁞ [ 44.6 ] 14. P80  117 × 80  8. 4 +  − 77  × = 58.00% .7 66.) Frecuencia Marca Frecuencia Acumulada de Clase Absoluta Relativa Absoluta Relativa [ 10. 2  100  30 24/06/2013 Elaborado por: Humberto Villalobos Torres .4 − [ 62.80% 91..7 ⁞ 49.4 [ 62.0 [ 53.3 1 ⁞ 39 30 10 0.INDICADORES DE LOCALIZACIÓN APLICACIÓN 3: Considere los datos de tiempos de espera (en segundos) .44% 100.1 57.85% ⁞ 33.85% ⁞ 65.. 1 ⁞ 77 107 117 0.

5 – 20.5 +   100  3 − 0.5 = 20. se … Planta Sur Sueldo [M$/d] % de Obreros [8.INDICADORES DE LOCALIZACIÓN APLICACIÓN 8: La Planta Sur de la fábrica de muebles Hoti S. 08 90.33 % 24/06/2013 Elaborado por: Humberto Villalobos Torres .5 – 23.5[ [23.5 – 14.5[ [11.5 – 28.5[ [20.5[ [17..A.67 % 9.5[ [14.88   0.5 – 11.5] 10 20 48 10 8 4 ¿Qué % de los obreros gana más de 21500 por día? P j = 21500 ⇒ ¿ j ?  j 21.5 – 17.