Beruflich Dokumente
Kultur Dokumente
La tendencia central es el valor en torno al cual los datos o mediciones de una variable
tienden a concentrarse, estas pueden ser, la media, la moda o la mediana. Mientras que la
variabilidad es la diversidad de resultados de una variable o de un proceso.
Las gráficas para este ejercicio fueron realizadas en R, a través de datos generados de
manera aleatoria con reemplazo se generaron dos distribuciones normales: 𝑁(𝜇 = 0, 𝜎 = 13) y
𝑁(𝜇 = 30, 𝜎 = 13)
x <- sample(1:100,50,replace=T) #Generamos números aleatorios
#Del 1 al 100, 50 números con
reemplazo
c. Elabora la gráfica de dos procesos con la misma media pero diferente dispersión.
Las gráficas para este ejercicio fueron realizadas en R, a través de datos generados de
manera aleatoria con reemplazo se generaron dos distribuciones normales: 𝑁(𝜇 = 0, 𝜎 = 15) y
𝑁(𝜇 = 0, 𝜎 = 50), se utilizaron los mismos valores de x del ejemplo anterior.
Las gráficas para este ejercicio fueron realizadas en R, a través de datos generados de manera
aleatoria con reemplazo se generaron dos distribuciones, una Normal y una Fisher:
x <- sample(1:30,25,replace=T) #Generamos números aleatorios
#Del 1 al 30, 25 números con
reemplazo
No necesariamente, pues podemos considerar dos casos; el primero es que los datos oscilen
entre los valores 29 y 31, su promedio resultará muy cercano al 30 como en el caso de este ejemplo,
pero, si los datos oscilan entre los intervalos [27, 27.5] y [32.5, 33], su promedio también será muy
cercano a 30, pero realmente los datos ni siquiera se encuentran dentro de los límites de calidad.
En conclusión, una media dentro de los límites de calidad no implica que haya buena calidad o
que el servicio/producto cumpla con las especificaciones.
3. ¿De qué manera afectan los datos raros o atípicos a la media? Explique su respuesta.
Si un dato atípico es muy grande, entonces el valor de la media tiende a incrementar, por
ejemplo, si tenemos un pequeño conjunto de datos:
1 2 2 3 4 4 5 1 5 3
Entonces 𝜇 = 3, si a ese conjunto le agregamos un dato atípico como 26, entonces 𝜇 = 5.09.
Justificación de la media: La edad de los niños se encuentra entre 4 y 8 años, como es un intervalo
pequeño podemos esperar que su media sea cercana a 6, al agregar 3 datos atípicos grandes
Justificación para la mediana: La mediana de las edades de los niños es 5, entonces, al agregar las
edades de la maestras asumimos que la mediana se recorre unas dos unidades a la derecha,
entonces tomamos el valor consecutivo, que es el 6, como la mediana.
Justificación para la moda: La moda de la edad de los niños es 4, al agregar 3 datos atípicos
diferentes, éstos no pueden interferir con la moda, por lo que ésta sigue siendo la misma.
5. En una empresa se llevan los registros del número de fallas de equipos por mes; la media
es de 4 y la mediana es de 6.
a. Si usted tiene que reportar la tendencia central de fallas, ¿qué número reportaría?
¿Por qué?
Reportaría la mediana, pues la media igual a 4, indica que en uno o dos meses hubo pocas fallas, es
decir, se presentaron datos atípicos, una tendencia central de fallas tan pequeña puede implicar
que no se le dé la importancia necesaria al resto de los datos.
b. ¿La discrepancia entre la media y la mediana se debió a que durante varios meses
ocurrieron muchas fallas?
No, se debió a que durante algunos meses hubo pocas fallas, ¿por qué no digo varios? La media es
muy sensible a los datos atípicos, por lo que si en apenas uno o dos meses se reportaron 0, 1 o 2
fallas y en el resto de ellos de 5 a 7 fallas, por los datos atípicos la media tiende a disminuir.
6. De acuerdo con los registros de una empresa, el ausentismo por semana del personal de
labor directa es de 25 personas en promedio, con una desviación estándar de 5. Con base
en esto, conteste:
a. ¿Entre qué cantidad se espera que usualmente varíe el número de personas que
no acuden a trabajar por semana?
Si asumimos que la media y la desviación estándar son valores poblaciones, podemos hacer uso de
los límites reales para contestar esta pregunta:
No, si hubo 34 ausencias sigue estando dentro de los límites reales, en caso de haber una ausencia
mayor a 40 podemos asumir que sucedió algo fuera de lo normal, lo cual se debe investigar y
finalmente tomar medidas para minimizar el número de empleados que faltan a la semana.
Asumimos que la media y la desviación estándar son valores poblaciones, podemos hacer uso de los
límites reales para contestar esta pregunta:
No, si hubo 25 que acudieron a la enfermería en la semana aún sigue estando dentro de los límites
reales, en caso de haber una cantidad mayor a 26 podemos asumir que sucedió algo fuera de lo
normal, por ejemplo entrega de comida en mal estado, lo cual se debe investigar y finalmente tomar
medidas para minimizar el número de empleados que acuden a atención médica.
8. De acuerdo con cierta norma, a una bomba de gasolina en cada 20L se le permite una
discrepancia de 0.2L. En una gasolinera se hacer revisiones periódicas para evitar
infracciones y ver si se cumplen las especificaciones (𝑬𝑰 = 𝟏𝟗. 𝟖, 𝑬𝑺 = 𝟐𝟎. 𝟐). De acuerdo
con los resultados de 15 inspecciones para una bomba en particular, la media y la
desviación estándar de los 15 datos son 19.9 y 0.1, respectivamente. De acuerdo con esto,
¿se puede garantizar que la bomba cumple con la norma? Argumento su respuesta.
En este caso, al ser datos muestrales podemos hacer uso de la desigualdad de Chebyshev o de la
regla empírica.
Lo que hacen la desigualdad de Chebyshev y la regla empírica es utilizar la desviación estándar para
medir la variabilidad en torno a la media. Los intervalos que se obtienen con estas operaciones son
10. Dos máquinas, cada una operada por una persona, son utilizadas para cortar tiras de hule,
cuya longitud ideal es de 𝟐𝟎𝟎𝒎𝒎, con una tolerancia de ±𝟑𝒎𝒎. Al final del turno un
inspector toma muestras e inspecciona que la longitud cumpla especificaciones. A
continuación se muestran las últimas 110 mediciones para ambas máquinas.
𝑀𝑜𝑑𝑎 = 199.0,
𝑀𝑒𝑑𝑖𝑎 = 199.99 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 200.1
200.5 𝑦 201.4
Todas las medidas de tendencia central dadas se encuentran en el intervalo de calidad dado, la
media está cercana a la mediana y las tres modas dadas también están bastante cercanas a la media
y a la mediana (esto no implica que no puedan haber acantilados, datos atípicos o sesgo) no quiere
decir que no haya acantilados o datos atípicos). Como una pequeña observación, tres modas
implican que los datos pueden tender a centrarse en más de un lugar, lo cual se puede justificar
como que cada empleado trabaje de forma distinta o que las máquinas tienen distinta calibración,
esto puede implicar mayor variabilidad.
La desviación estándar de los datos es 1.16, por lo que los límites reales correspondientes son:
Una parte sustancial de los datos se encuentran entre los valores 198.5 y 199, pero otra gran parte
de ellos se encuentran entre los valores 200 y 201.5, es decir, se muestran dos tendencias centrales
diferentes (distribución multimodal), esto refleja que la presencia de dos condiciones de trabajo
diferentes. Hay una variabilidad considerable en los datos. No hay acantilados por la ausencia de
datos atípicos.
El proceso de corte de tiras es el adecuado, las medidas de tendencia central y los valores en general
se encuentran dentro de los intervalos de confianza. Sin embargo, la presencia de dos tendencias
centrales, que suele darse por condiciones de trabajo diferentes, implicó mayor variabilidad en los
datos, dándonos límites reales fuera de los límites de calidad. Esto es algo que debe mejorarse ya
que en el futuro puede darnos datos que se salgan de los límites de calidad.
El valor del sesgo es bastante pequeño por lo que podemos asumir la ausencia del mismo. El valor
de la curtosis es algo pequeña. Aunque el sesgo estandarizado se encuentra dentro del intervalo
que implica que los datos puede tener Distribución Normal, la curtosis estandarizada indica lo
11. En el caso del ejercicio anterior, considere que los primero 55 datos (ordenados por
renglón) corresponden a una máquina y los últimos 55 a otra. Ahora conteste lo siguiente.
a. Evalúe las dos máquinas en cuanto a su centrado (tendencia central) y con
respecto a la longitud ideal (200).
Máquina 1
𝑀𝑒𝑑𝑖𝑎 = 200.96 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 201 𝑀𝑜𝑑𝑎 = 201.4
Máquina 2
𝑀𝑒𝑑𝑖𝑎 = 199.03 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 199 𝑀𝑜𝑑𝑎 = 199
Ambas máquinas indican un buen proceso de corte de tiras, pues sus medidas de tendencia central
se encuentran dentro del intervalo de calidad. Que las medidas de tendencia central sean tan
cercanas en ambos casos indica la tendencia central hacia un solo valor (esto no implica que no
puedan haber acantilados, datos atípicos o sesgo) no quiere decir que no haya acantilados o datos
atípicos).
Los datos de la máquina 1 tienden a centrarse al valor 201, dado que la amplitud del histograma es
pequeña se asume poca variabilidad, no tiene forma de distribución bimodal (dos tendencias
centrales) y no parece haber sesgo. No hay datos atípicos para la máquina 1. Un pequeño detalle a
observar es que a pesar de que los datos tienen un valor hacia el que tienden agruparse, estos
parecen inclinarse un poco más hacia el límite superior del intervalo de calidad, es decir, hay un
acantilado a la izquierda.
e. Considere que cada máquina es operada por una persona diferente, y determine
cuáles son las posibles causas de los problemas señalados en el inciso anterior y
señale que haría para corroborar cuáles son las verdaderas causas.
Para corroborar las causas, se podría dar mantenimiento a las máquinas y pedir que un mismo
empleado haga su calibración, en caso de no ser las máquinas el problema, se podría analizar el
procedimiento que sigue cada empleado para cortar las tiras.
Efectivamente había comentado que una de las características del histograma de todos los datos,
es que tiene una distribución multimodal.
12. En un área de servicios dentro de una empresa de manufactura se realiza una encuesta
para evaluar la calidad del servicio proporcionado y el nivel de satisfacción de los clientes
internos. La encuesta consiste de 10 preguntas, y cada una de ellas evalúa diferentes
aspectos del servicio proporcionado. Las respuestas para cada pregunta es un número
entre 0 y 10. Para hacer un primer análisis de los resultados obtenidos, se suman los
puntos obtenidos de las 10 preguntas para cada cuestionario. A continuación se muestran
los puntos obtenidos en 50 cuestionarios.
78 78 82 85 81 86 80 73 84 78
68 84 75 78 76 76 82 85 91 80
70 87 77 82 84 48 49 39 39 43
35 42 34 44 49 34 30 43 31 34
41 42 45 42 35 38 39 42 43 29
Dado que la media y mediana son muy cercanas (esto no implica que no puedan haber acantilados,
datos atípicos o sesgo) no quiere decir que no haya acantilados o datos atípicos) pero la moda no es
cercana a ellos y además hay dos, lo que puede provocar una distribución bimodal. La media tan
cercana a 60 nos da a entender que el servicio es regular, no es pésimo, pero tampoco es excelente;
sin embargo, la desviación estándar tan grande nos indica que realmente hay opiniones muy
diferentes sobre la calidad del servicio. No considero correcto tomar en cuenta las modas ya que
éstas solo tuvieron una frecuencia igual a 4, que no es ni el 10% de la muestra.
d. ¿Tendría alguna utilidad hacer un análisis por separado de cada una de las
preguntas? Explique.
Si lo tendría, pues, si cada pregunta se enfoca, por ejemplo, a un área de servicio sería más sencillo
valorar por separado la calidad de servicio de cada área, puede que en un área el servicio sea
excelente mientras que en otro hay que considerar mejoras.
Basándonos en el gráfico, los datos no parecen tener Distribución Normal. Una forma de verificar
esta afirmación es utilizando el sesgo y la curtosis estandarizados, si estos valores se encuentran
dentro del intervalo (−2,2) entonces los datos tienen Distribución Normal.
El sesgo estandarizado indica que los datos tienen DN, mientras que la curtosis indica lo contrario,
en conclusión, los datos no tienen DN, ya que son dos factores en contra de que lo tengan: la forma
del gráfico y la curtosis estandarizada.
13. En una fábrica de piezas de asbesto una característica importante de la calidad es el grosor
de las láminas. Para cierto tipo de lámina el grosor óptimo es de 5mm y se tiene una
discrepancia tolerable de 0.8mm, ya que si la lámina tiene un grosor menor que 4.2mm
Tomando en cuenta solo la media y la mediana, el proceso es adecuado, pues ambas se encuentran
dentro de los límites de calidad, sin embargo, este proceso debe mejorarse pues, según lo descrito
anteriormente, es de suma importancia fabricar láminas con el grosor óptimo.
No, hace falta tomar en cuenta más datos para asumir que el proceso es adecuado, por ejemplo, la
moda, si hay más de una entonces hay problemas en el proceso de fabricación, o puede ser que la
moda sea exactamente 5mm, lo cual indicaría que al menos la mayoría de las láminas tienen en
grosor óptimo. También haría falta la desviación estándar para medir la variabilidad de los datos.
Para realizar el gráfico de capacidad, se realizó una simulación en R de 100 datos aleatorios entre
3.39 y 6.09, a esos datos se les asignó una 𝐷𝑁(𝜇 = 4.74, 𝜎 = 0.45). En base a lo obtenido, se asume
14. En el problema anterior, el propósito de mejorar la calidad que se tenía en cuanto al grosor
de las láminas, se implementó un proyecto de mejora siguiendo la metodología Seis
Sigma. Varios de los cambios implementados fueron relativos a mejora y estandarización
de los procedimientos de operación del proceso. Para verificar si el plan tuvo éxito, se
eligieron láminas de manera aleatoria y se midió su grosor. Los 120 datos obtenidos
durante tres días se muestran a continuación:
4.8 4.3 4.8 5.1 4.9 4.6 4.9 4.6 5.0 4.9 4.8 4.5
4.7 5.7 4.5 5.3 4.4 5.1 4.6 4.9 4.2 4.6 5.3 5.2
4.7 4.1 5.1 5.0 5.0 4.9 4.6 4.9 5.2 4.8 4.7 5.1
4.9 4.8 4.7 5.1 5.1 5.3 5.1 5.0 5.3 5.0 5.1 5.2
4.7 5.0 5.0 5.3 5.1 5.1 4.5 5.2 4.1 5.1 4.9 4.9
4.6 5.0 4.6 4.8 4.7 4.9 4.4 4.5 5.3 5.3 4.4 5.0
4.2 4.5 5.3 5.1 4.8 4.4 4.7 5.3 5.1 4.7 4.7 4.8
5.0 5.0 4.9 5.2 5.6 5.1 5.2 4.5 4.6 5.2 4.9 5.0
5.3 4.9 5.0 4.4 4.9 4.7 4.6 5.3 4.8 4.7 4.6 5.1
4.4 5.0 4.5 5.0 5.2 4.7 5.0 5.3 5.6 5.0 5.0 4.5
a. Calcule la media y la mediana de estos datos, y compárelas con las que se tenían
antes del proyectos, decida si con los cambios se mejoró el centrado del proceso.
Proceso 1 Proceso 2
𝑀𝑒𝑑𝑖𝑎 = 4.74 𝑀𝑒𝑑𝑖𝑎 = 4.88
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 4.7 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =4.9
Si tomamos en cuenta solo la media y la media la podríamos asumir que el proceso tuvo una mejora,
pues los datos se encuentran más cercanos al grosor óptimo; sin embargo, se deben tomar en
cuenta muchos más datos, como la variabilidad, la moda, etc. Para determinar si realmente mejoró
el proceso.
b. Calcule la desviación estándar y, con esta, obtenga una estimación de los nuevos
límite reales y decida si la variabilidad de redujo.
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝐼) = 𝜇 − 3𝜎 = 4.74 − 3(0.45) = 3.39
𝐿𝑅 𝑃𝑟𝑜𝑐𝑒𝑠𝑜 1 {
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝑆) = 𝜇 + 3𝜎 = 4.74 + 3(0.45) = 6.09
𝑯
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝐼) = 𝜇 − 3𝜎 = 4.88 − 3(0.32) = 3.92
𝐿𝑅 𝑃𝑟𝑜𝑐𝑒𝑠𝑜 2 {
{ 𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝑆) = 𝜇 + 3𝜎 = 4.88 + 3(0.32) = 5.84
La variabilidad si redujo unas cuantas décimas, sin embargo, aún no se encuentra dentro de los
límites reales.
d. De acuerdo con todo lo anterior, ¿el proyecto dio buenos resultados? Argumente.
El proyecto si dio buenos resulta porque se redujo la variabilidad y hubo menos datos que
sobrepasan los límites de calidad, sin embargo, aún no se consiguen los valores deseados, por lo
que es indispensable reajustar el proyecto de calidad.
A pesar de que hubo mejoras, aún no tenemos la garantía de que todas las láminas cumplan con las
especificaciones dadas.
Las medidas de tendencia central tan cercanas indican que la tendencia central de las mediciones
es adecuada y que además se centran hacia un solo valor.
b. Calcule la desviación estándar y una aproximación de los límites reales y con base
en éstos decida si la variabilidad de los datos es aceptable.
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝐼) = 𝜇 − 3𝜎 = 27.98 − 3(0.14) = 27.55
{
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝑆) = 𝜇 + 3𝜎 = 27.98 + 3(0.14) = 28.40
La variabilidad de los datos es aceptable, pues se encuentra dentro de los límites de calidad
requeridos.
Efectivamente los datos tienden a centralizarse hacia un solo valor que es 27.94, debido a la poca
amplitud del histograma asumimos una variabilidad pequeña, aunque parecen haber acantilados a
la izquierda y a la derecha, estos son muy pequeños, apenas 0.1 unidades de amplitud, no parece
haber sesgo y la distribución no es muy plana ni tampoco muy alta.
Sí, lo es totalmente, los valores se centralizan hacia un solo valor, la variabilidad es aceptable y los
valores se encuentran dentro de los límites de calidad.
16. Una característica clave en la calidad de las pinturas es su densidad, y un componente que
influye en ésta es la cantidad de arenas que se utilizan en su elaboración. La cantidad de
arena en la formulación de un lote se controla por medio del número de costales, que
según el proveedor contienen 20 kg. Sin embargo, continuamente se tienen problemas en
la densidad de la pintura que es necesario corregir con retrabajo y reprocesos adicionales.
En este contexto se decide investigar cuánta arena contienen en realidad los costales. Para
ello, se toma una muestra aleatoria de 30 costales de cada lote o pedido (500 costales).
Los pesos obtenidos en las muestras de los últimos tres lotes se muestran adelante. Las
especificaciones iniciales que se establecen para el peso de los costales de arena son de
𝟐𝟎 ± 𝟎. 𝟖 𝒌𝒈.
Lote Peso de costales de la muestra
18.6 19.2 19.5 19.2 18.9 19.4 19 20 19.3 20
1 19.1 18.6 19.4 18.7 21 19.8 19 18.6 19.6 19
19.6 19.4 19.8 19.1 20.0 20.4 18.8 19.3 19.1 19.1
18.6 19.9 18.8 18.4 19.0 20.1 19.7 19.3 20.7 19.6
2 19.5 19.1 18.5 19.6 19.4 19.6 20.3 18.8 19.2 20.6
20.0 18.4 18.9 19.7 17.8 19.4 18.9 18.4 19.0 19.7
20.1 20.2 21.0 19.7 20.1 20.0 19.1 20.4 19.6 20.6
3 20.0 19.7 20.8 19.7 19.7 20.4 19.8 20.5 20.0 20.0
20.2 19.7 20.0 19.6 19.7 19.8 19.9 20.3 20.4 20.2
Si lo es, pues las tres medidas indican que los valores tienden a centralizarse hacia un solo valor
(esto no implica que no puedan haber acantilados, datos atípicos o sesgo) no quiere decir que no
haya acantilados o datos atípicos).
Los datos tienden a centralizarse hacia los valores entre 19.5 y 20, debido a la amplitud del
histograma la variabilidad es grande, varios de los valores sobrepasan los límites de calidad, hay un
ligero sesgo a la izquierda y la curtosis puede considerarse “alta”.
En general los bultos no cumplen con el peso especificado, sin embargo, esto no quiere que todos
los proveedores estén entregando bultos sobre todo con menos peso, sería más preciso realizar un
análisis a cada lote.
e. Haga un análisis de cada lote por separado y con apoyo de estadísticos y gráficas,
señale si hay diferencias grandes entre los lotes.
LOTE 1
Dadas las medidas de tendencia central tan cercanas, implica que los datos se centralizan en un solo
valor, el detalle aquí, es que el valor al que tienden a centrarse es aproximadamente 19.2, que es el
límite del límite inferior del intervalo de calidad.
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝐼) = 𝜇 − 3𝜎 = 19.35 − 3(0.56) = 17.68
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝑆) = 𝜇 + 3𝜎 = 19.35 + 3(0.56) = 21.01
La variabilidad en este lote no es aceptable, pues sobrepasa los límites de calidad requeridos.
Los valores se centralizan en el límite inferior del intervalo de calidad, la variabilidad es poca pero
sobrepasa los límites de calidad, hay un notable sesgo a la derecha y la curtosis parece ser aceptable.
𝑀𝑜𝑑𝑎 = 18.4,
𝑀𝑒𝑑𝑖𝑎 = 19.29 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 19.35
19.6 𝑦 19.7
La media y la mediana están un poco alejadas por lo que puede haber datos atípicos muy pequeños,
hay tres modas, dos de ellas tienen apenas 0.1 unidades de diferencia, por lo que los datos van a
centralizarse hacia dos valores, es decir, tendremos una distribución bimodal. Además, uno de los
valores sobrepasa por mucho el límite inferior del intervalo de calidad.
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝐼) = 𝜇 − 3𝜎 = 19.29 − 3(0.69) = 17.22
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝑆) = 𝜇 + 3𝜎 = 19.29 + 3(0.69) = 21.37
La variabilidad en este lote no es aceptable, pues sobrepasa los límites de calidad requeridos.
LOTE 3
La media, la mediana y la moda tan cercanas indican que los valores tenderán a centralizarse hacia
un solo valor.
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝐼) = 𝜇 − 3𝜎 = 20.04 − 3(0.40) = 18.83
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝑆) = 𝜇 + 3𝜎 = 20.04 + 3(0.40) = 21.24
La variabilidad en este lote no es aceptable, pues sobrepasa los límites de calidad requeridos.
La mayoría de los datos se centran en el peso ideal de calidad, sin embargo, aún hay valores que
sobrepasan los límites de calidad, a pesar de su variabilidad pequeña. No hay acantilados ni valores
atípicos, el sesgo es complicado de identificar y la curtosis puede determinarse alta.
f. ¿Las diferencias encontradas se podrían haber inferido a partir del histograma del
inciso c)?
En los valores del histograma del inciso c), sí pudieron haber inferido pero no en los resultados del
estudio, pues aún sus diferencias todos los lotes tienen valores que sobrepasan los límites de calidad
y sigue habiendo sesgo.
El diagrama del lote dos 2, indica un rango mucho más amplio que los otros dos lotes, se reporta
sesgo a la izquierda y sobrepasa los límites de calidad.
El diagrama del lote tres es el que menos sobrepasa los límites de calidad, no tiene sesgo y su media
es igual al peso óptimo de los costales
17. En una empresa que fabrica y vende equipo para fotocopiado utilizan como un indicador
importante de la calidad en el servicio posventa, el tiempo de respuesta a solicitudes de
apoyo técnico debido a fallas en los equipos. Para problemas mayores, en cierta zona del
país se estableció como meta que la respuesta se dé en un máximo de 6 horas hábiles; es
decir, de que habla el cliente solicitando apoyo, y que si el problema se clasifica como
grave no deben pasar más de 6 horas hábiles para que un técnico acuda a resolver el
problema. A continuación se aprecian los tiempos de respuesta en horas para los primeros
nueve meses del año (65 datos).
5.0 5.4 7.1 7.0 5.5 4.4 5.4 6.6 7.1 4.2
4.1 3.0 5.7 6.7 6.8 4.7 7.1 3.2 5.7 4.1
5.5 7.9 2.0 5.4 2.9 5.3 7.4 5.1 6.9 7.5
3.2 3.9 5.9 3.6 4.0 2.3 8.9 5.8 5.8 6.4
7.7 3.9 5.8 5.9 1.7 3.2 6.8 7.0 5.4 5.6
a. Calcule las medidas de tendencia central y con base en éstas, ¿cree que se cumple
con la meta?
Las medidas de tendencia central tan cercanas indican que los valores tienden a centralizarse hacia
un solo valor y no hay datos atípicos, sin embargo, estos datos no son suficientes para determinar
si se cumple con la meta, habrá que ver si hay valores que sobrepasan las seis horas.
b. Aplique la regla empírica, interprete y diga qué tan bien se cumple la meta.
Aplicando la regla empírica de 1S, determinamos entre que valores se encuentran el 68% de los
datos.
Los datos se centralizan hacia los valores entre 6 y 5, la amplitud del histograma es poco grande, lo
que implica mucha variabilidad, esto no necesariamente es algo malo, la mayoría de los valores son
menores a seis horas, lo que implica un ligero sesgo a la izquierda, no parecen haber datos atípicos.
La curtosis puede considerarse grande. Algunos de los valores sobrepasan las 6 horas de meta.
Utilizando el método de calidad seis sigma se debe dar ideas de lo que puede generar que algunas
solicitudes sean atendidas después de las seis y dar solución a ello. Una sugerencia personal sería
determinar la cantidad de solicitudes que atiende un empleado al día y determinar cuánto se tarda
en resolver el problema, en base a eso considerar contratar a más empleados.
18. Los siguientes datos representan las horas caídas de equipos por semana en tres líneas de
producción.
a. Analice los datos para cada línea y anote las principales características de la
distribución de los datos.
Línea 1.
La media tiene una ligera separación de la mediana, lo que indica que puede haber un ligero sesgo
en los datos, la mediana y la moda también están un poco separadas, pero aun así podemos asumir
que la mayoría de los datos se centralizan entre esos dos puntos.
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝐼) = 𝜇 − 3𝜎 = 6.87 − 3(1.05) = 3.72
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝑆) = 𝜇 + 3𝜎 = 6.87 + 3(1.05) = 10.02
Dado que no tenemos los límites de calidad, no podemos asumir o descartar que la variabilidad de
los datos es aceptable para la Línea 1, pero según la regla empírica, podemos asumir que el 99.7%
de los datos se encuentra entre 3.72 y 10.02.
Línea 2.
La media y la mediana son iguales, esto indica que hay un equilibrio entre los datos (no quiere decir
que no haya acantilados o datos atípicos), la moda está un poco alejada de la media y la mediana,
por lo que puede que esta serie sea bimodal.
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝐼) = 𝜇 − 3𝜎 = 6.99 − 3(1.00) = 3.99
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝑆) = 𝜇 + 3𝜎 = 6.99 + 3(1.00) = 9.99
Dado que no tenemos los límites de calidad, no podemos asumir o descartar que la variabilidad de
los datos es aceptable para la Línea 2, pero según la regla empírica, podemos asumir que el 99.7%
de los datos se encuentra entre 3.99 y 9.99.
Línea 3.
La media y la mediana se encuentran cerca (esto no implica que no puedan haber acantilados, datos
atípicos o sesgo) la moda está muy alejada de la media y la mediana, por lo que puede que esta serie
sea bimodal o los datos pueden centralizarse solo hacia la moda.
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝐼) = 𝜇 − 3𝜎 = 6.99 − 3(1.00) = 4.68
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 (𝐿𝑅𝑆) = 𝜇 + 3𝜎 = 6.99 + 3(1.00) = 9.94
Dado que no tenemos los límites de calidad, no podemos asumir o descartar que la variabilidad de
los datos es aceptable para la Línea 3, pero según la regla empírica, podemos asumir que el 99.7%
de los datos se encuentra entre 4.68 y 9.94.
Las líneas 1 y 2 tiene mayos variabilidad que la 3 y sus medias son cercanas, la línea 2 presenta un
dato atípico a la derecha pero un ligeros sesgo a la izquierda, las líneas 1 y 3 tienen mayor sesgo a
hacia el mismo lado y la variabilidad de la Línea 3 es más pequeña que el resto.
2.7 3.4 3.5 4.0 3.1 3.3 3.5 3.3 3.2 3.4 2.6 3.1
3.4 2.7 3.3 3.6 2.9 2.8 3.0 3.6 3.5 2.8 3.1 2.8
Los estándares de calidad son puntos de referencia que sirven para fijar un mínimo necesario de
condiciones para que los rasgos y características de un producto o servicio sean capaces de
satisfacer eficientemente las necesidades de los consumidores. Estos estándares permitirán saber
si se debe modificar o no algún aspecto con el fin de mejorar los procesos y los productos que se
brindan al público. Con esta explicación asumimos que la leche debe contener más de 3% de grasa.
La media la media y la moda son valores bastante cercanos, lo que indica que los datos se van a
centralizar principalmente entre 3.2 y 3.3 (esto no implica que no puedan haber acantilados, datos
atípicos o sesgo), la variabilidad es pequeña por lo que la amplitud del histograma será pequeña.
Como comenté hace rato, los datos se centralizan principalmente entre 3.2 y 3.3, hay un sesgo muy
ligero a la derecha lo cual no necesariamente es malo, pues esto implica que la mayoría de la leche
tiene una concentración de grasa mayor al 3.0%, lo cual cumple con el estándar mínimo de calidad.
No hay acantilados ni datos atípicos pero sería conveniente observar los datos menores a 3.
No del todo, obteniendo los cuartiles podemos darnos cuenta de que el 25% de los datos son
menores o iguales a 3.
Obtenemos el sesgo y la curtosis estandarizada, sus valores son -0.62 y 6.64, respectivamente,
aunque este gráfico tiene “una forma muy bonita” parecida a la Normal, no podemos suponer que
los datos tenga esta Distribución, pues la curtosis estandarizada no se encuentra dentro del
intervalo (−2,2)
20. En la elaboración de envases de plástico es necesario garantizar que cierto tipo de botella
en posición vertical tenga una resistencia mínima de 20 kg fuerza. Para garantizar esto, en
el pasado se realizaba una prueba del tipo pasa-no-pasa, donde se aplicaba la fuerza
mínima y se veía si la botella resistía o no. En la actualidad se realiza una prueba exacta,
en la que mediante un equipo se le aplica fuerza a la botella hasta que ésta cede, y el
equipo registra la resistencia que alcanzó. ¿Qué ventajas y desventajas tiene cada
método?
Para el primer método su principal ventaja es que se garantizaba que la botella llevara la resistencia
deseada pero implicaba más retrabajo, es decir, las botellas que no pasaban debían volver a
elaborarse, o quizá peor, simplemente tirarse.
Para el segundo método, su ventaja es que se impide el retrabajo y usando la resistencia obtenida
de las botellas se puede estimar la resistencia promedio de todas las botellas elaboradas, la
desventaja es que puede ser que una de tantas botellas no cumpla con la resistencia mínima
requerida y aun así se mande al mercado.
21. En el caso del problema anterior, a continuación se muestran 100 datos obtenidos en las
pruebas destructivas de la resistencia de botellas.
28.3 26.8 26.6 26.5 28.1 24.8 27.4 26.2 29.4 28.6 24.9 25.2
30.4 27.7 27.0 26.1 28.1 26.9 28.0 27.6 25.6 29.5 27.6 27.3
26.2 27.7 27.2 25.9 26.5 28.3 26.5 29.1 23.7 29.7 26.8 29.5
28.4 26.3 28.1 28.7 27.0 25.5 26.9 27.2 27.6 25.5 28.3 27.4
28.8 25.0 25.3 27.7 25.2 28.6 27.9 28.7 25.3 29.2 26.5 28.7
29.3 27.8 25.1 26.6 26.8 26.4 26.4 26.3 28.3 27.0 23.7 27.7
26.9 27.7 26.2 27.0 27.6 28.8 26.5 28.6 25.7 27.1 27.8 24.7
27.1 26.4 27.2 27.3 27.0 27.7 27.6 26.2 24.7 27.2 23.8 27.4
29.5 26.4 25.8 26.7
b. Estime los límites reales y comente si las botellas cumplen la resistencia mínima
que se desea garantizar.
Las botellas cumplen con la resistencia mínima, pues su variabilidad es mayor que 20kg.
Los valores sobrepasan por completo la resistencia mínima, los datos se centralizan hacia los valores
26 y 27, la variabilidad es pequeña y hay un acantilado a la izquierda (esto no necesariamente es
malo).
d. Con base en los análisis anteriores, ¿considera que el proceso cumple con la
especificación inferior?
Sí, los valores sobrepasan la resistencia mínima de 20 e incluso se puedes esperar una DN de los
datos.
22. En una empresa que elabora productos lácteos se tiene como criterio de calidad para la
crema que ésta tenga un porcentaje de grasa de 45 con una tolerancia de ± 𝟓. De acuerdo
con los muestreos de los últimos meses se tiene una media de 44 con una desviación
estándar de 1.3. Haga un análisis de capacidad para ver si se está cumpliendo con la
calidad exigida, represente gráficamente los datos y comente los resultados obtenidos.
24. En la elaboración de una bebida se desea garantizar que el porcentaje de CO2 (gas) esté
entre 2.5 y 3.0. En el monitoreo del proceso se obtuvieron los siguientes 115 datos:
2.61 2.62 2.65 2.56 2.68 2.51 2.56 2.62 2.63 2.57 2.60
2.69 2.53 2.67 2.66 2.63 2.52 2.61 2.60 2.52 2.62 2.68
2.61 2.64 2.49 2.58 2.61 2.53 2.53 2.57 2.66 2.51 2.57
2.57 2.56 2.52 2.58 2.64 2.59 2.57 2.58 2.52 2.61 2.55
2.73 2.51 2.61 2.71 2.64 2.59 2.60 2.64 2.56 2.60 2.57
2.60 2.61 2.55 2.66 2.69 2.56 2.64 2.67 2.60 2.59 2.67
2.61 2.49 2.63 2.72 2.67 2.52 2.63 2.57 2.61 2.49 2.60
2.64 2.62 2.64 2.65 2.67 2.61 2.67 2.65 2.60 2.58 2.59
2.50 2.65 2.57 2.55 2.64 2.66 2.67 2.61 2.52 2.65 2.57
2.56 2.60 2.59 2.56 2.57 2.66 2.64
b. Calcule la desviación estándar y una aproximación de los límites reales y, con base
en éstos, decida si la variabilidad de los datos es aceptable.
Los límites reales sobrepasan un poco los límites de calidad, por lo que asumimos que la variabilidad
de los datos no es aceptable, hace falta hacer una muy ligera mejora.
La mayoría de los datos se centralizan entre 2.55 y 2.6, no hay datos atípicos pero sí un acantilado
a la derecha, la variabilidad parece ser pequeña y no hay sesgo, puede que la curtosis sea grande.
La mayoría de loa casos el proceso es bueno, pero es necesario mejorar ese 2.45, y examinar por
qué hay un acantilado en la derecha, es decir, por qué no hay datos mayores de 2.75
Usando la curtosis y el sesgo estandarizados, cuyos valores son 5.16 y -0.2 respectivamente, no
podemos asumir que los datos tengan DN, pues la curtosis no se encuentra dentro del intervalo
(−2,2).