Sie sind auf Seite 1von 89

Curso Intermedio de MINITAB

EO / Marzo - 2009

www.fcx.com
S-P-A-C-E-R

 Seguridad
 Propósito
 Agenda
 Código de Conducta
 Expectativas
 Roles
Propósito del curso

 Revisar el concepto de variabilidad de un proceso,


fuentes de la variación
 Aprender el Análisis de variabilidad con MINITAB
 Introducción a la estadística inferencial, selección
de tamaño adecuado de muestra
 Graficas de control y su aplicación en nuestros
procesos.
Agenda del curso

08:00 – 08:30 Introducción


08:30 – 10:00 Análisi de variabilidad
10:00 – 10:15 Break (descanso)
10:15 – 12:00 Estadística inferencial
12:00 – 13:00 Almuerzo (descanso)
13:00 – 14:30 Pruebas de hipótesis
14:30 – 14:45 Break (descanso)
14:45 – 15:50 Gráficas de control
15:00 – 16:00 Cierre / Plus y Deltas
Còdigo de Conducta

- Participación ordenada
- Una sola reunión
- Proteja la integridad de la persona
- Todos contribuyen, nadie domina
- No emails, buscadores o celulares durante el taller,
el taller se detendrá
- Sea puntual
- Mantenga un enfoque positivo
- La regla de 3- Impactos
- PÀSELO BIEN !!!
Expectativas

- …
- …
- …
- …
- …
- …
Variabilidad

 La variabilidad es la componente de ruido en un proceso


 En términos estadísticos la variabilidad es una comparación de tendencia
central o posición que nos indica donde se sitúa un grupo de
puntuaciones. La variabilidad o dispersión nos indican si esas
puntuaciones o valores están próximas entre sí o si por el contrario están
muy dispersas.
 Una medida razonable de la variabilidad podría ser la amplitud o
rango, que se obtiene restando el valor más bajo de un conjunto de
observaciones del valor más alto. Es fácil de calcular y sus unidades son
las mismas que las de la variable, aunque posee varios inconvenientes
Efecto de la variabilidad en la capacidad de
mejorar la estimación de un presupuesto
•La variabilidad tiene un gran impacto en la capacidad de estimar los montos
de un presupuesto debido a que la afecta la capacidad de predecir entre que
valores se moverán probabilísticamente los mínimos y máximos del mismo.

•La variabilidad excesiva en un proceso siempre tiene efectos negativos puesto


que representa costos de oportunidad o bien costos de improductivos.

•Las pérdidas debido a una excesiva variabilidad no se compensan cuando son


positivas o negativas, sino que siempre se suman.

•Cuando la variabilidad es muy alta disminuye la probabilidad de predecir un


determinado resultado y por consiguiente obliga a aumentar los valores de los
límites del proceso para asegurar una respuesta adecuada cuando llegue el
momento.
Variabilidad

La variabilidad es una componente


de ruido en los procesos

Vamos, no
podemos fallar
todas...

La variabilidad puede inducir al error,


hace imposible predecir con exactitud
Análisis Multi – Variable

 Una herramienta gráfica la cual, a través de subgrupos lógicos,


analiza el efecto de X’s discretas en las Y
 Las X’s deben de ser discretas o forzar a que lo sean a fin de
utilizar la técnica multi-vari
 En el análisis mult-vari, la recolección de datos es pasiva, esto
es que el proceso se monitorea en su estado natural sin cambio
alguno
 La herramienta puede ser usada para evaluar capacidad,
estabilidad y relaciones gráficas entre las X’s y las Y’s.

Y = f (x’s)
Propósito de análisis de Multi-Vari

 Evaluar X’s probables en la fase de medición. La meta es hacer


angosto el campo de varias X’s a sólo pocas vitales que se
nombrarán en la fase de mejoramiento.
 Recolecta información significante acerca de un proceso sin
ninguna interrupción y evalúa el impacto de factores sencillos al
igual que las interacciones de factores.
 Permite agrupar la variación por ‘familia’ y a concentrar el
esfuerzo de tormenta de ideas en los variables que puedan
influenciar aquella ‘familia’.
 Analizar gráficamente las relaciones entre variables
independientes y una o más variables dependientes.
Clasificación de variables de ruido

 Las variables de ruido pueden ser clasificadas en 3 familias de


variación:
 Posicional (dentro de una pieza) DENTRO DE UN GRUPO
- Variación dentro de una pieza relacionada a la geometría de la parte.
- Variación a través de una unidad sencilla conteniendo varias partes
individuales tales como un barquillo conteniendo varios procesadores de
computadora.
- Ubicación en un proceso de lote tal como el chapeado.

 Cíclico (de pieza a pieza) ENTRE Grupos


- Variación entre piezas consecutivas
- Variación entre grupos de piezas
- Variación entre lotes consecutivos

 Temporal (de tiempo en tiempo) SOBRE TIEMPO


- Turno a turno
- Día a día
- Semana a semana
Ejemplo de Multi-Vari
 Cinco mediciones se realizaron en 3 piezas a través de
4 periodos de tiempo
- Círculo
Rojo: son las Multi-Vari Chart for Within by repeat - time
unit repeat
5 mediciones 1

por unidad 102.5 2


3
- Cuadro Rojo: 101.5 4

son el prom. 5

de mediciones 100.5
Within

por unidad
99.5
- Rombo Azul:
son el prom. 98.5
del tiempo
97.5
1 2 time 3 4
Posicional o Dentro de Pieza

 La variación dentro de la pieza, típicamente es un


resultado de la geometría de la parte
- La variación
puede darse Gráfica Multi-Vari por repet-tiempo
de final a final unidad repet

arriba a abajo,
1
102.5 2

lado a lado, 3

etc.
4
101.5
5

Posicional: La 100.5
Dentro

más grande
99.5
variación se
tiene dentro de 98.5
la pieza
97.5
1 2 tiempo 3 4
Cíclico o Pieza a Pieza

 La variación de unidad a unidad o pieza a pieza


puede ser causada por X’s que cambian
rápidamente
Gráfica Multi-vari para Entre por repet-tiempo
- Causa potenciales unidad
r e pe t

pueden incluir set-up 112 1

operadores, desgaste
2

de herramientas o 4
Entre

plantillas
5

102

Cíclico: La más
grande variación
se tiene de pieza
a pieza 92

1 2 tiempo 3 4
Temporal o Tiempo a Tiempo
 La variación temporal es el resultado de un proceso que
contiene variables X que cambian lentamente a través del
tiempo
Gráfica Multi-Vari a través del tiempo por repet-tiempo
- La presencia de una unidad repe t

tendencia indica un 11 5 1

A través del Tiempo


cambio constante en
2

una o más X tal como 4

el desgaste o la
5

disolución de un 10 5

químico

Temporal: La más
grande variación se 95

encuentra entre 3
1 2 tiempo 3 4
intervalos de tiempo
Ejemplo de análisis de Multi-Vari
 Al analizar los datos se debe observar lo siguiente:
- Análisis de capacidad
- "Boxplots"s
- Análisis de Multi-Vari
Stat> Quality Tools > Multi-Vari Chart
Esquemas de Multi-Vari
Multi-Vari Chart Volume By Board Location - Machine
Panel
Board Location
1 2 1 2 1 2 1 2
1

2
0.05

0.04

0.03
Volume

0.02

0.01

0.00

1 2 3 4

Machine
Ejercicio de Multi - vari

 Una compañía de embotellado tiene un problema


con el volumen de llenado
- Dos líneas están en uso para llenar las botellas
- La compañía corre 2 turnos
- Las especificaciones del proceso son 220ml +/- 5 ml

 Analice la información y genere conclusiones

F/N Overfill.mtw)
Estadística Inferencial
 Población – Todos los estadísticos que existen ahora sobre un proceso
mas los que existirán en el futuro
 Muestra – Un extracto de la población tomada durante el tiempo o en
una sola muestra
 Observación – Una medición individual incluida en una muestra
 Hipótesis – La teoría sobre la naturaleza de las relaciones entre
variables de entrada y salida
 Hipótesis Nula (Ho) – Declaración de no cambio, no diferencia o no
relación
- La declaración se asume verdadera hasta tener suficiente evidencia (datos de
la muestra) presentada para rechazarla
 Hipótesis Alterna (Ha) – Declaración de cambio, diferencia o relación
- Esta declaración es considerada verdadera si Ho es rechazada
Definiciones
 Error Tipo I – Es el error en rechazar Ho cuando en realidad es verdadera
(ejem., decir que hay una diferencia cuando no la hay)
 Riesgo Alfa – La oportunidad o probabilidad de cometer el Error Tipo I
- Esta probabilidad es usualmente mayor a cero
- El experimentador establece un riesgo máximo aceptable, usualmente 5%, en la
decisión de rechazar Ho cuando en realidad es verdadera
 Error Tipo II – El error de fallar en rechazar Ho cuando en realidad es falsa
(ejem.,decir que no hay diferencia cuando sí la hay)
 Riesgo Beta – La oportunidad o probabilidad de cometer en el Error Tipo II
- Esta probabilidad es usualmente mayor a cero
- El experimentador establece un riesgo máximo aceptable, usualmente 10%, de
pasar por alto un tratamiento efectivo para el problema, o de pasar por alto la
fuente de la variación
 Poder – Es la sensibilidad de una prueba estadística para detectar
diferencias cuando realmente las hay, o la probabilidad de estar en lo
correcto cuando se rechaza Ho. Poder = 1 - Beta
Definiciones

 Importancia Estadística – Usada cuando es rechazada Ho , o cuando


los datos de la muestra son muy diferentes de Ho para ser
razonablemente atribuida a la oportunidad (error de muestreo)
 Importancia Práctica – Usada cuando la magnitud del cambio,
diferencia o relación es importante para el experimentador
 Prueba Estadística- Valor estandarizado (Z, t, c2, F, etc.) calculado de
los datos de la muestra
- Usada para calcular el riesgo del error en la decisión, por comparación con
una distribución conocida si Ho es verdadera.
Naturaleza de la Inferencia

 Una inferencia es una declaración acerca de los parámetros de una


población
- Una inferencia es hecha luego de haber recolectado datos, calcular estadísticos y
hacer conclusiones
 Si tan sólo tenemos datos de muestras, entonces tendremos incertidumbre
sobre los verdaderos parámetros de la población
- Por lo tanto, la inferencia puede ser errónea
 La manera en que los datos son recolectados así como la cantidad de los
datos impactará grandemente en la cantidad de riesgo o incertidumbre
 Tres preguntas básicas deben ser hechas cuando se toma una muestra:
1.¿Cómo deben ser los datos recolectados?
2. ¿Cómo deben ser analizados los datos y que estadísticos son requeridos?
3. ¿Qué tanta incertidumbre se tiene con nuestros estimados de la verdadera
naturaleza de la población?
Muestreando: ¿Cuántas?

 ¿Qué tantas muestras debo de tomar?


- Respuesta típica:
- Toma 30 muestras
- Tantas como puedas obtener
- Entre más, mejor
- Respuesta Correcta:

¡Depende de qué es lo que quieres saber!


Muestreando: ¿Cuántas?

 Datos Continuos:
- Análisis de Capacidad – un mínimo de 30 muestras
- Prueba de Hipótesis – Depende de la diferencia práctica para ser
detectada y de la variación inherente del proceso
 Datos de Atributos:
- Análisis de Capacidad - Muchas muestras
- Prueba de Hipótesis - Muchas, Depende de la diferencia práctica
para ser detectada
¿Cómo Debe Ser Hecho?

 ¿Cómo deben ser tomadas las muestras?


- Aleatorias
- Secuenciales
- Subgrupos
 Escogiendo el correcto tamaño de muestra además del método
de recolección, ambos son críticos para el éxito de todo el análisis
estadístico
- Si toma el número incorrecto de muestras, tal vez no conozca lo que
necesita saber
Tipos de Error

 Muestras estadísticas son solo estimados de los parámetros de


una población verdadera
- La diferencia entre estadísticos y parámetros es debida a tres
causas potenciales de error:

1. Error en la medición- debido a problemas de exactitud y


precisión
2. Tendencias de la muestra - debido a la falta de independencia
de las muestras (muestras no - aleatorias)
3. Error de muestreo - debido a la selección aleatoria de un
proceso
Simulación de Dados

1. Simule que tira un dado


1000 veces en Minitab
usando el generador de
datos aleatorios
Calc> Random Data> Integer

Repita este
comando para
2. Tome 4 muestras aleatorias, las muestras 2
cada muestra teniendo 5 a la 4
observaciones individuales (Tip: use Ctrl-E
Calc> Random Data> Sample from Columns para repetir la
última ventana
de diálogo )
Error de la Muestra
3. Calcule la media y la desviación estándar y compare los
estadísticos de la muestra

Stat> Basic Statistics> Display Descriptive Statistics

Variable N Mean Median TrMean StDev SE Mean


sample1 5 3.600 5.000 3.600 1.949 0.872
sample2 5 4.600 5.000 4.600 1.517 0.678
sample3 5 4.000 4.000 4.000 2.121 0.949
sample4 5 3.600 3.000 3.600 1.342 0.600
Rango de medias 1.0 Rango de St Dev 0.779
Note las diferencias en los estadísticos. Estas diferencias son el
resultado del error en la muestra. Observaremos que si incrementamos
el tamaño de la muestra las diferencias de los estadísticos disminuirán.
El conocimiento del error de la muestra es la llave para el uso exitoso
de la estadísitca inferencial.
Error de la Muestra - Reducida

4. Repita el ejercicio con 10 observaciones por muestra

Variable N Mean Median TrMean StDev SE Mean


sample1 10 3.400 3.500 3.375 1.713 0.542
sample2 10 3.500 4.000 3.500 1.900 0.601
sample3 10 3.500 3.000 3.500 1.716 0.543
sample4 10 3.400 3.500 3.375 1.713 0.542

Rango de medias 0.1 Rango de StDev 0.187

Con 10 observaciones, las diferencias entre muestras ahora son


mucho menores
Distribuciones de Muestras
 En teoría, si seguimos tomando muestras de tamaño n=5 y n=10
y calculamos las medias de las muestras, podríamos ver como las
medias están distribuidas

1. Simule esto en Minitab


creando 10 columnas de
1000 tiradas de un dado:
Calc> Random Data> Integer

Repita este
comando para
calcular la media
de C1-C10, y
guarde los
resultados en
mean10 2. Para cada renglón, calcule la
media de cinco columnas
Calc> Row Statistics
Diferentes Distribuciones
Individuals Sample Means
200 100

n=5

Freq uen c y
F req u en c y

50
100

0
0
0 1 2 3 4 5 6
0 1 2 3 4 5 6
80
C1
70

60
n = 10
F re q u e n c y 50

40

30

20

Seleccione “Same X 10

and distinct Y” para 0

facilitar la comparación 0 1 2 3 4 5 6

Graph> Histogram
Frame> Multiple Graphs
Resumen de la Simulación

3. Calcule la estadística descriptiva y resuma los resultados en esta


tabla:

Distribution Mean StDev Descripcion de la Forma

Individuals

Sample
Means, n=5
Sample
Means,
n=10

¿Qué es diferente entre las tres distribuciones?


¿Qué pasaría si el número de dados se incrementa?
Observaciones

De forma que el tamaño de la muestra (número


de datos) se incrementa de 1 a 5 a 10, hay tres
puntos a denotar:
El centro permanece igual

1. La variación decrece
2. La forma de la distribución cambia, tiende a
hacerse normal
Teorema del Límite Central

 Si todas las muestras aleatorias posibles, cada una de tamaño n,


son tomadas de cualquier población con media μ y desviación
estándar σ, la distribución de la muestra sería

Con media μx  μ
σ
Con stdev σx 
n
Normalmente distribuida cuando la distribución padre es
normalmente distribuida, o será aproximadamente normal para
muestras de tamaño 30 ó más cuando la población padre no está
normalmente distribuida

Esto mejora con muestras de tamaño mayor


Una Prueba Rápida de la Teoría

Compare nuestros resultados de la simulación con la


teoría:

Variable N Mean Median TrMean StDev SE Mean


C1 1000 3.4880 4.0000 3.4867 1.7421 0.0551
mean5 1000 3.4556 3.4000 3.4591 0.7751 0.0245
mean10 1000 3.4818 3.5000 3.4800 0.5593 0.0177

 1.74
Para n  5 :  x    0.78
n 5
 1.74
Para n  10 :  x    0.55
n 10
Aplicación Práctica
Análisis del Sistema de Medición
 Usualmente nos basamos en una lectura de un sistema de
medición para estimar los valores de la variable de entrada o
salida. Una manera fácil de reducir el error en el sistema de
medición es promediando dos o más lecturas
σ MS
σ MS 
n
 En un Gage R&R reducimos la variación por: 1 n
 La precisión del sistema de medición se incrementa con un factor
de la raíz cuadrada del tamaño de muestra usado para
determinar la media.
Tamaño de Muestra y la Media

 Cuando tomamos una muestra solo tenemos estimada la media


verdadera
- Todo lo que sabemos es que la media verdadera se halla en
algún lado dentro de la distribución teórica de la media de la
muestra
Distribución teórica de la muestra
media con n = 10
Distribución de individuales de
la población
Distribución teórica de la
muestra media con n = 2

m
Error estándar de la Media
 La amplitud de la distribución de la media decrece con tamaños
de muestras mayores

Dónde
Sx Sx: Error estándar
Sx  Sx: Desviación estándar
n
de los individuales
n : Tamaño de muestra

m
Error Estándar
 La velocidad del cambio en el error estándar se aproxima a cero con
alrededor de 30 muestras
 Esto es el porque 30 muestras son frecuentemente recomendadas
cuando se generan estadísticos como la media y la desviación
estándar
 Esto es también el punto en el cual las distribuciones t y Z se vuelven
casi equivalentes
Error estándar

Sx
Sx 
n
0 5 10 20 30
Tamaño de la muestra
Intervalos de Confianza
 El error estándar también se utiliza para generar intervalos de
confianza sobre la media
 El 95% en los intervalos de confianza implica que el 95% de las
medias, no individuales, caen entre los limites superior e inferior
m
- Si 100 muestras fueran
tomadas cada una con dos Población Distribución con n=2
observaciones podríamos
esperar encontrar que el 95 Distribución con n=20
de las 100 muestras caen
dentro del intervalo de
confianza del 95%
95% Intervalo de
Confianza
Intervalos de Confianza
Ecuación general para calcular intervalos de confianza:
Dónde :
x : media
sx s x : desviación estándar de los individual es
x  t critical n : tamaño de muestra
n t critical : t α/2, ν de la tabla t con un
riesgo alfa α (0.05 de 95%) y
grados de libertad ν (n - 1)

Intervalo de confianza de dos lados al 95% para la media:


s s
x - t α/2, n -1  μ  x + t α/2, n -1
n n
Ejemplo
 Para evaluar el tiempo de secado de un adhesivo, se tomaron 20
muestras y se capturó el tiempo
 Calcule el intervalo de confianza al 95%

A/N Adhesive.mtw
s s
Método manual: x - t α/2,n -1  μ  x + t α/2,n -1
n n
1.004 1.004
11.71 - 2.093  μ  11.71 + 2.093
20 20
De la tabla:
t = 2.093 11.24  μ  12.18

Estamos 95 por ciento confiados que la media está en algún


lado entre 11.24 y 12.18 minutos
Minitab – Intervalos de Confianza
 La ventana de sesión de Minitab nos provee del tamaño de la muestra,
media, desviación estándar, error estándar y el intervalo de confianza
 Los resultados coinciden con los estadísticos generados manualmente
Stat> Basic Statistics> 1- sample t

One-Sample T: Adhesive
s 1.004
Variable N Mean StDev SE Mean 95.0 % CI 
Adhesive 20 11.710 1.004 0.225 ( 11.240, 12.180) n 20
Meta la variable y
oprima OK
La prueba de media
no se requiere para
los intervalos de
confianza
Diferencia Significativa
 ¿Existe una diferencia significativa entre las dos muestras de
abajo?
 ¿Cómo lo sabes?
 ¿Qué confianza tendremos en la decisión de concluir que las dos
son iguales o diferentes?

Muestra 1 Muestra 2

¡Las respuestas a estas


preguntas se encuentran en
la prueba de Hipótesis!
Detectando la Importancia

• Diferencia Práctica: La diferencia que resulta de la mejora de


un valor práctico o económico en la compañía
- Ejemplo, un incremento en el rendimiento del 80 al 95 por ciento

• Diferencia Estadística: La diferencia o cambio de un proceso


que no pudo suceder al azar
- Ejemplos pueden incluir las diferencias en proveedores, turnos o
equipos

 Nosotros veremos que es posible realizar una diferencia


estadística importante sin realizar una diferencia práctica
importante
Detectando la Importancia

 Durante la fase de medición Problema con Proceso Centrado


es importante que la naturaleza Curva de Proceso Actual
Mejorada
del problema sean entendida LSL USL

correctamente
 El entendimiento del problema,
la diferencia práctica deberá ser
alcanzada y debe coincidir con d
la diferencia estadística Problema Varianza
Curva Mejorada
 La diferencia d puede ser también un
cambio en la media o en la varianza LSL USL
Actual
 La detección de las diferencias es
lograda con el uso de estadísticos
de hipótesis de prueba
Prueba de Hipótesis

 Una prueba de hipótesis es una teoría que a priori relaciona las


diferencias entre variables
 Una prueba estadística o una prueba de hipótesis es hecha para
probar o desaprobar la teoría
 Una prueba de hipótesis convierte un problema práctico en un
problema estadístico
- Cuando se toma relativamente un tamaño de muestra pequeño para
calcular los parámetros de una población, siempre existe la
probabilidad de haber recolectado una muestra no representativa
- La estadística inferencial nos permite estimar la probabilidad de
obtener una muestra no representativa
Ejemplo
 Supongamos que queremos saber si una moneda esta balanceada
 Podemos lanzarla un número de veces y verificar cuantas veces cae
cara
- Con una moneda balanceada, podemos esperar que el 50% de los
lanzamientos serán siempre cara
 Si lanzamos la moneda 10 veces y cae 10 veces cara, ¿qué
podríamos concluir? ¿Cómo podemos estar seguros?
- Pr (1 cara) = 0.5 Pr (10 caras) = (0.5)10 = 0.00098
 Entonces hay menos de una oportunidad de entre 1000 que
obtengamos 10 caras con una moneda balanceada
 Entonces, podríamos decir que estamos dispuestos a tomar 0.1% de
probabilidad de estar equivocados sobre nuestra “moneda
desbalanceada”
Naturaleza de las Hipótesis

 La Hipótesis Nula (H0) se asume que es verdad


- Cualquier diferencia observada es debida a la probabilidad (el

acusado se presume inocente hasta que se pruebe su culpabilidad)

 La Hipótesis Alterna (Ha) puede ser sólo aceptada si la


probabilidad asociada con H0 es pequeña
- Por lo tanto, Ha esta asociada con eventos que probablemente
no sean causados por el azar
 Antes de rechazar H0 se debe de proveer evidencia de que
esta suposición de inocencia es probablemente no verdadera
 Se debe mostrar que los valores observados fueron poco
probable tomados del mismo proceso, entonces H0 es
probablemente errónea!
¿Qué tan Probable es Improbable?

 Cualquier diferencia entre datos observados y quejas hechas bajo


H0 pueden ser reales o debidas al azar
 La prueba de hipótesis determina las probabilidades de que estas
diferencias ocurran únicamente debido al azar
 Estas probabilidades son llamadas p - values
 El nivel - a de una prueba (nivel de significancia) representa el
criterio contra el cual el p-values es medido
 La elección del nivel- a depende del experimentador
 H0 es rechazado si p-value < nivel -a
 Los niveles -a más comúnmente usados son 5% y 1% y
dependerán de lo crítico de lo que se esté probando
Riesgo de la Prueba de Hipótesis
 Riesgo Alfa:
- Riesgo Alfa es la probabilidad de estar equivocado al decir que
algo es diferente cuando en realidad es lo mismo, o es parte de
la misma población

 El riesgo Beta es el Poder de la prueba:


- El riesgo Beta es la probabilidad de estar equivocado en decir
que algo NO es diferente cuando en realidad sí existen
diferencias
Impacto del Tamaño de la Muestra
 La Sensibilidad Estadística está Distribuciones Teoréticas
De muestras con medias n=2
dada por el tamaño de la
muestra como se observa a la
derecha
 Entre mayor el tamaño de la
muestra, más sensitiva es la prueba
 Una creencia común es que si tomamos
más muestras, estaremos más
confiados de la prueba Distribuciones
 En realidad, todo lo que está pasando Teoréticas
De muestras con
es que la prueba se está volviendo medias n=30
más sensitiva
 Idealmente el tamaño de muestra correcto
asegurará que ambos la prueba estadística
y el problema práctico sean considerados
Ejemplo

 La media y la desviación estándar de la muestra de los datos de


fuerza de tensión fueron determinados en 16.1 libras y 3.5 libras
respectivamente
 Un nuevo material está bajo investigación pero la compañía ha
indicado que no hará cambios a menos que se haga una mejora
de 5 libras

Comparando la Media con el Objetivo


16.1 libras Objetivo = 21.1

Paso 1:
Mantenga el
problema
práctico y la
diferencia (d)
a ser
detectada d5
Ejemplo
 De la descripción del problema, la desviación de la muestra es 3.5
libras
Comparando la Media al Objetivo
Paso 2: 16.1 Libras Objetivo = 21.1
Estimar la
desviación
S=3.5 libras
estándar
de la
muestra

Paso 3:
Establecer
el riego d5
Alfa y Beta

• La gerencia ha indicado que les gustaría estar 95% confiados en


su decisión
Por tanto: (a =0.05,  =0.10)
Ejemplo

 Usando Minitab – 1 sample t


Stat> Power and Sample Size> 1-Sample t
Power and Sample Size
Paso 4:
Determine 1-Sample t Test
el tamaño Testing mean = null (versus not = null)
correcto de
la muestra Calculating power for mean = null + difference
Alpha = 0.05 Sigma = 3.5
Sample Target Actual
Difference Size Power Power
5 8 0.9000 0.9312

El tamaño correcto de la muestra es n=8


Esto asegura que las pruebas prácticas y estadísticas sean consideradas
(ejem. La prueba detectará la diferencia si mejoramos 5 libras o más ocurre
en la prueba del producto)
Mapa de Prueba de Hipótesis con Valores
Contínuos
¿Son los datos Minitab:
Stat - Basic Stat - Normality Test
Normales? Si P-value > 0.05 datos son
normales

No Normal Normal
Dos o mas muestras Una muestra Dos o mas muestras Una muestra

Prueba de Igualdad de Prueba de Mediana Prueba de Igualdad de Varianza t-Test 1 muestra


Varianza (Levene’s Test) (Prueba F o Bartlett’s Test)
Minitab:
Minitab:
Stat - Nonparametric
Minitab: Stat - Basic Stats - 1 Sample-T
- 1 Sample-Sign Minitab:
Stat > ANOVA>Test of Ver también comparación de pares, H0:
ó - 1 Sample-Wilcoxon Stat> ANOVA>Test of Equal Variances
Equal Variances m1 - m2 = 0
Ver también comparason de pares, If P-value < 0.05 las
Si P-value < 0.05 las Si P-value < 0.05 hay diferencia entre
Ho: M1 - M2 = 0 varianzas son diferentes
varianzas son diferentes la media y el objetivo

Dos o mas Muestras Varianzas Iguales


Varianzas No Iguales
Dos Muestras Dos Muestras Dos o mas Muestras

Mann- Dos Muestras Dos o mas Muestras


Whitney t-Test 2 muestras ANOVA Un sentido
Minitab: Minitab: Minitab:
Stat - Nonparametric - Stat - Basic Stats - 2-Sample t Stat - ANOVA - One-way
Mann-Whitney Test usa desv. Estándar ‘pooled’. Si P-value < 0.05 al menos t-Test 2 muestras ANOVA Un sentido
Varias Pruebas Se debe marcar la opción una media es diferente
de Medianas indicando varianza igual. Minitab:
Minitab:
Si P-value < 0.05 las medias son Stat - ANOVA- One-way
Stat - Basic Stats - 2-Sample t
Minitab: diferentes ANOVA asume varianza
Esto es lo marcado enMinitab
Stat - Nonparametric constante pero ANOVA es
Si P-value < 0.05 al menos una
- Kruskal-Wallis ‘robusto’ a variaciones leves
media es diferente
ó - Mood’s Median Si P-value < 0.05 al menos una
ó - Friedman media es diferente
Mapa de Prueba de Hipótesis con Valores de
Atributos
Datos de Atributos

Un factor Dos Factores


Dos Dos o mas muestras
Una Muestra muestras

Proporción de una Proporción de dos Prueba de Chi2 (Tabla


Muestra Muestras de Contingencia)

Minitab: Minitab: Minitab:


Stat - Basic Stats - 1 Stat - Basic Stats - 2 Proportions Stat - Tables - Chi-Square Test
Proportion Si P-value < 0.05 las proporciones Si P-value < 0.05 al menos una
Si P-value < 0.05 una son diferentes proporción es diferente
diferencia existe entre la
proporción y el objetivo

Chi Square Test


(Contingency Table)
Minitab:
Stat - Tables - Chi-Square Test
Si P-value < 0.05 los factores no
son independientes
Comparación de Varianzas

• Metodología para comparar:


• La varianza de una distribución con un objetivo
• La varianza de una distribución con otra

¿Existe una mejora?


s12 s22

 Una suposición es que comúnmente requerida en la prueba de


hipótesis es la homogeneidad de varianza (ejemplo: varianza
constante)
 Para satisfacer esta suposición, una comparación estadística de
las varianzas debe ser realizada.
Pasos de la Comparación de Varianzas

Paso 1: Enunciar el problema práctico


Paso 2: Enunciar el problema estadístico
- Seleccione la prueba estadística apropiada.
- Establecer las hipótesis
Ho: 12  22
Ha: 12  22
Paso 3: Establecer el riesgo a y 
(a =0.05,  =0.10)

Paso 4: Calcular el tamaño de muestra


Pasos de la Comparación de Varianzas

Paso 5: Recolectar los datos y realice la prueba


Paso 6: Analizar los datos con Minitab
a) Revise la normalidad de los datos
i. Datos Normales – Prueba F o Prueba de Bartlett. Una
prueba F será conducida cuando existan dos varianzas
a comparar y la prueba de Bartlett sea realizada cuando
mas de dos varianzas sean comparadas.
ii. Datos No Normales – Prueba de Levene
b) Compare Varianzas
 Si el P-value< a (0.05, Paso 3), rechace la hipótesis
nula y concluya que las varianzas son diferentes.
 Para la prueba F: Si Fo > Fcritica, rechace la hipótesis
nula.
Paso 7: Obtener conclusiones prácticas
Ejemplo

Paso 1: - El fabricante de teléfonos esta interesado en comparar


Enunciar
el
la variabilidad de la potencia de salida de dos modelos
problema de teléfono
práctico
- La compañía considera una diferencia de un factor de
dos será prácticamente significativo.
Paso 2:
Ho: A2  B2
Enunciar el
problema Ha: A2  B2
estadístico

- La gerencia ha indicado que ellos quieren tener el


Paso 3: 95% de confianza en su
Establecer
el riesgo - Riesgo Alfa y Beta (a =0.05,  =0.10)
Alfa y Beta
Ejemplo
Paso 4:
Calcular el
tamaño de
muestra
- La gerencia ha indicado que una desviación
estándar de el modelo mejorado sea por un
factor de dos.
- De la tabla de tamaño de muestra, el tamaño de
muestra será de 20
- El Black belt fue al proceso y recolectó 20
Paso 5: muestras del Modelo A y 20 muestras del Modelo
Colecte B aleatoriamente y capturó la información en
datos y Minitab.
realice la
prueba

F/N phone.mtw
Ejemplo
-
Analizar los datos con Minitab
a) Revise la normalidad de los datos:
Paso 6:
Analizar i. Datos Normales – Prueba F o Prueba estadística de
los datos Bartlett.
usando
Minitab ii. Datos No Normales – Prueba de Levene Valores P >
b) Compare las varianzas 0.05 ambos
grupos de
Stat> Basic Statistics > Normality Test datos son
Normal Probability Plot Normal Probability Plot normales

.999 .999

.99 .99
.95 .95
Probability
Probability

.80 .80

.50 .50

.20 .20

.05 .05
.01 .01
.001 .001

13.5 14.5 15.5 16.5 12.0 12.5 13.0 13.5


Phone A Phone B
Average: 15.2380 Anderson-Darling Normality Test Average: 12.9714 Anderson-Darling Normality Test
StDev: 0.929139 A-Squared: 0.279 StDev: 0.514364 A-Squared: 0.270
N: 20 P-Value: 0.610 N: 20 P-Value: 0.640
Ejemplo

Paso 6: - Analizar los datos usando Minitab


Analyze a) Revise la normalidad de los datos
the data
with i. Normal data – F-test or Bartlett’s test statistic.
Minitab ii. Non-normal data – Levene’s Test
b) Compare the variances
Un P-Value < 0.05
Stat> Basic Statistics > Test for Equal Variances… indica que las dos
varianzas son
Test for Equal Variances for Phones
diferentes
95% Confidence Intervals for Sigmas Factor Levels
A

Phone A tienen
B
mayor variabilidad
0.5 1.0 1.5
que Phone B
Paso 7: F-Test Levene's Test
Draw Test Statistic: 3.263 Test Statistic: 5.476

practical
P-Value : 0.013 P-Value : 0.025 El F-test debe ser
usado cuando las
conclusions Boxplotsof RawData
dos muestras son
A
normales.
B

12 13 14 15 16 17
Phones
Comparación de Medias

• Metodología para comparar:


- La media de una distribución con el objetivo
- Las medias de dos distribuciones

Comparando una media con el objetivo Comparando dos medias


Muestra 1 Objetivo Muestra 1 Muestra 2

d d
Pasos para la Comparación de Medias

Paso 1: Plantear el problema práctico


Paso 2: Plantear el problema estadístico
- Seleccione la prueba apropiada.
- Establecer las hipótesis
Ho: m1  Objetivo Ho: m1  m2
Ha: m1  Objetivo Ha: m1  m2
Paso 3: Establecer el riesgo Alpha y Beta
(a =0.05,  =0.10)
Paso 4: Establecer la diferencia práctica (d) que usted desee
detectar como se definió en el enunciado del problema
práctico
Pasos para la Comparación de Medias

Paso 5: Calcular el tamaño de muestra necesaria para asegurar que


el problema practico y estadístico son considerados
Paso 6: Recolectar los datos y realice la prueba
Paso 7: Analizar los datos con Minitab
a) Revise la normalidad de los datos. Si dos o más medias son
comparadas, cada muestra individual deberá ser revisada
b) Revice la Homogeneidad de Varianza si compara dos o mas
muestras
c) Haga la comparación de medias
a) Si to > tcritical, ó el P-value < a (0.05, paso 3), rechace la
hipótesis
Paso 8: Obtener conclusiones
Ejemplo de Media y Objetivo

Paso 1: - El gerente de planta desea correr su planta con una


Enunciar el
problema
media de respuesta de 240 unidades
practico - La gerencia desea que el intervalo de confianza sea no
exceda +/- 20 unidades
- La desviación estándar histórica es de 14 unidades
F/N Power.mtw
Paso 2:
Enunciar el Ho: m1= 240
problema
estadístico
Ha: m1  240

- La gerencia ha indicado que desean estar seguros de


Paso 3: su decisión en un 95 porciento
Establecer
el riesgo
- Riesgo Alpha y Beta (a =0.05,  =0.10)
alpha y
beta
Ejemplo de Media y Objetivo

Paso 4:
Establecer la
diferencia - El manejo de la una diferencia práctica ha indicado
práctica (d) que será significativo:
como se d = 20
estableció en
el enunciado
del problema
práctico
Stat> Power and Sample Size> 1Sample t

Paso 5:
Calcular el
tamaño de
muestra
Ejemplo Media y Objetivo
Paso 5: Power and Sample Size
Calcular 1-Sample t Test
el taming
de la Testing mean = null (versus not = null)
muestra Calculating power for mean = null + difference
Alpha = 0.05 Sigma = 14

Sample Target Actual


Difference Size Power Power
20 8 0.9000 0.9312

El tamaño de muestra es n=8


Recolectar 8 muestras aseguraría que el problema
práctico y estadístico son equivalentes
Ejemplo Media y Objetivo
Paso 6: - Basados en un tamaño de muestra de 8, usted
Recolectar
los datos y iría a recolectar 8 muestras aleatoriamente
realice la
- Para nuestro ejemplo, 10 muestras son reunidas
prueba
- ¿Cómo impacta a nuestra prueba el tomar 10
muestras?
- Calcular el impacto
Ejemplo Media y Objetivo

Paso 7: • Analisis con Minitab


Analizar a) Revisando la normalidad de los datos
los datos
con
• Si dos o más medias son comparadas, entonces
Minitab deberán de ser revisadas cada una de las
muestras
b) Revisar la homogeneidad de varianza si más de dos
muestras serán comparadas Norm al P rob ab ility Plot

c) Haga la comparación .9 9 9

.9 9
.9 5

Probab ility
.8 0

.5 0

.2 0
Stat> Basic Statistics> Normality Test .0 5
.0 1

.0 0 1

225 235 245 255 265


El P-value indica que los Pow er
datos son normales A verage: 249.56
S tDev: 14.1507
N: 10
Anderson-Darling Normality Test
A-Squared: 0.628
P-Value: 0.072
Ejemplo Media y Objetivo

Paso 7: • Análisis con Minitab


Analizar a) Revise la normalidad de los datos
los • Si dos o mas medias van a ser comparadas, cada
datos
muestra individual será revisada
usando
Minitab b) Revisar la homogeneidad de varianza si más de dos
muestras serán comparadas
c) Haga la comparación
Stat> Basic Statistics> 1-Sample t
Ejemplo Media y Objetivo
One-Sample T: Power Desde que el P-value >
Paso 7: 0.05 fallamos en rechazar
Test of mu = 240 vs mu not = 240
Analizar la hipótesis nula y
los Variable N Mean StDev SE Mean concluimos que la nueva
datos planta de energía esta
Power 10 249.56 14.15 4.47 corriendo a 240 unidades
usando
Minitab La gerencia ha alcanzado
Variable 95.0% CI T P su objetivo de 240
unidades
Power ( 239.44, 259.68) 2.14 0.061
Bo xplot of Power
(with Ho and 95% t-confidence interval for the mean)

Los resultados son


verificados usando una
Paso 8: Boxplot.
Obtener Desde que Ho esta dentro
conclusiones de el intervalo de
practicas [ _ ] confianza entonces
Ho X
nosotros debemos
concluir que no hay
diferencia.
220 225 230 235 240 245 250 255 260 265

Pow er
Ejemplo Media y Objetivo
 Calculos Manuales
Ho: m1  Objetivo
Paso 7:
Analizar Ha: m1  Objetivo
los x - objetivo Desde que to es menor
datos to  que la tcritical fallamos en
con S/ n rechazar la nula y
Minitab concluimos que la planta
249.56 - 240 de energía esta corriendo
to  a 240 unidades
14.15/ 10
Estas son las mismas
Paso 8: conclusiones mostradas
Obtener t o  2.14 por Minitab
conclusiones
prácticas tcritica= ta/2,  = 2.262
De la tabla T(a=0.05,  = 9)
Si to > ta/2,  Entonces rechace la Nula
Comparando Dos Medias
Paso 1:
Enunciar
- Una empresa de comunicaciones está considerando una
el mejorara a todas sus líneas de ensamble para reducir costo
problema sin afectar su desempeño
Práctico - Para asegurar que esa mejora es justificada, una línea de
ensamble ha sido mejorada y comparada con una línea
existente
F/N Yield.mtw
- Un análisis de la historia de los datos indican una desviación
estándar de 3.5
- La gerencia considera un cambio de un 5 % sería
Paso 2: prácticamente significativo.
Enunciar el
problema
Ho: m1= m2
estadístico Ha: m1  m2

Paso 3:
Establecer
- La gerencia ha manifestado que desean estar un 95 %
el riesgo seguros de la decisión que se tome.
Alpha y - Riesgos Alfa y Beta (a =0.05,  =0.10)
Beta
Comparando Dos Medias
Paso 4: - El manejo práctico de la diferencia indica que es
Establecer significativo:
la diferencia
práctica (d) d = 5%
que usted
Stat> Power and Sample Size> 2 Sample t
quiere
detectar
como se
enunció en
el problema
práctico

Paso 5:
Calcular el
tamaño de
muestra
Comparando Dos Medias
Paso 5: - La respuesta de Minitab para el cálculo de el tamaño de
Calcular el muestra
tamaño de
muestra
Power and Sample Size
2-Sample t Test
Testing mean 1 = mean 2 (versus not =)
Calculating power for mean 1 = mean 2 + difference
Alpha = 0.05 Sigma = 3.5

Sample Target Actual


Paso 6: Difference Size Power Power
Recolectar
5 12 0.9000 0.9167
datos y
elaborar la
prueba - Basado en el tamaño de muestra de 12, tomaríamos 12
muestras aleatoriamente de cada línea.
Comparando Dos Medias

Paso 7: a) Revise la normalidad de los datos


Analizar • Si dos o más medias van a ser comparadas, cada
los datos muestra individual será revisada
con b) Revisar la homogeneidad de varianza si más de dos
Minitab muestras serán comparadas P-values > 0.05 indicar que
c) Haga la comparación ambas distribuciones son
normales
Stat> Basic Statistics> Normality Test
N orm al P rob ab ility P lot
Norm al Probability Plot
.9 99
.9 9 9
.99
.9 9
.95
.9 5
Probability
Probability

.8 0 .80

.5 0 .50

.2 0 .20

.0 5 .05
.0 1 .01
.0 0 1 .0 01

83 84 85 86 87 88 89 90 80 85 90
New Line O ld Line
Average: 86.8705 Anderson-DarlingNormality Test A verage: 84.9554
StDev: 1.96598 Anderson-Darling Normality Test
A-Squared: 0.401 S tDev: 3.30639 A-Squared: 0.394
N: 12 P-Value: 0.305 N: 12 P-Value: 0.317
Comparando Dos Medias
a) Revise la normalidad de los datos
Paso 7: • Si dos o más medias van a ser comparadas, cada
Analizar muestra individual será revisada
los datos b) Revisar la homogeneidad de varianza si más de dos
con muestras serán comparadas
Minitab c) Haga la comparación Test for Equal Variances for Yield
95% Confidence Intervals for Sigmas Factor Levels

New Line

Old Line

Stat> ANOVA> Test for Equal Variances… 1 2 3 4 5 6

F-Test Levene's Test


Test Statistic: 0.354 Test Statistic: 1.180
P-Value : 0.099 P-Value : 0.289
P-value > 0.05
en la prueba F Boxplots of Raw Data

indica que las New Line

varianzas son
iguales Old Line

80 85 90
Yield
Comparando Dos Medias
• Análisis con Minitab
Paso 7: a)Revisando la normalidad de los datos
Analizar • Si dos o más medias son comparadas, entonces
los datos deberán de ser revisadas cada una de las muestras
con b)Revisar la homogeneidad de varianza si más de dos
Minitab muestras serán comparadas
c) Haga la comparación

Stat> Basic Statistics> 2 Sample t


Comparando Dos Medias
Two-Sample T-Test and CI: Línea nueva, Línea
Paso 7: vieja Partiendo que el
Analizar Two-sample T for New Line vs Old Line
P-value > 0.05
los datos Fallamos en
N Mean StDev SE Mean rechazar la nula y
con concluimos que la
Minitab New Line 12 86.87 1.97 0.57 nueva línea no
Old Line 12 84.96 3.31 0.95 tiene diferencia
significativa
Difference = mu New Line - mu Old Line
Estimate for difference: 1.92
95% CI for difference: (-0.39, 4.22)
Boxplots of New Line and Old Line
T-Test of difference = 0 (vs not =): T-Value = 1.72
(means are indicated by solid circles)
P-Value = 0.099 DF = 22
Both use Pooled StDev = 2.72
90

Paso 8:
Obtener Los resultados son 85

verificados usando
conclusiones Boxplots
prácticas 80

New Line Old Line


Comparando Dos Medias
Two-Sample T-Test and CI: New Line_15 Samples, En el caso de que el
Oldline_15 Sample valor de P < 0.05 el
Paso 7: cual indica que una
Two-sample T for New Line_15 Samples vs Oldline_15 Sample
Analizar diferencia existe.
los datos N Mean StDev SE Mean Usando 15 muestras
con ha causado que la
New Line 15 86.87 1.74 0.45
prueba sea demasiado
Minitab Oldline_ 15 84.96 2.93 0.76 sensible. La práctica
y los problemas
Difference = mu New Line_15 Samples - mu Oldline_15 Sample estadísticos no son
Estimate for difference: 1.915 equivalentes. ¿Qué d
está siendo detectado
95% CI for difference: (0.112, 3.719) con 15 muestras?
T-Test of difference = 0 (vs not =): T-Value = 2.18 P-Value =
0.038 DF = 28 Boxplots of New Line and Oldline_
(means are indicated by solid circles)

Both use Pooled StDev = 2.41


90

Paso 8: El impacto de el tamaño de la


Obtener muestra es también ilustrado
85
conclusiones por una Boxplot
prácticas La variación es reducida
80

NewLine_15 Samples Oldline_15 Samples


Ejercicio/Tarea

 El consumo alto de Nitrato ha estado demostrando un gran


número de efectos incluyendo el aumento de peso
 Los siguientes datos son el resultado de un experimento para
medir el porcentaje de aumento en peso a los ratones que se les
suministró alto nivel de nitrato versus los que no.
Nitrate No Nitrate
12.7 18.2
19.3 32.9
20.5 10
10.5 14.3
14 16.2
10.8 27.6
16.6 15.7
14
F/N Nitrate.mtw 17.2
Gráficas de control
 Use gráficas de control para rastrear la estabilidad de procesos en el tiempo y
detectar la presencia de causas especiales, que corresponden a ocurrencias
poco comunes que no son parte normal del proceso.
 Minitab grafica la estadística de un proceso, tal como la media de un
subgrupo, la observación individual, la estadística ponderada o el número de
defectos, versus un número o tiempo de muestra. Minitab dibuja:
- La línea central en el promedio de la estadística
- El límite de control superior (LCS) en 3 desviaciones estándares sobre la línea
central
- El límite de control inferior (LCI) en 3 desviaciones estándar bajo la línea central
 Para todas las gráficas de control, usted puede modificar las especificaciones
predeterminadas de gráficas de Minitab. Hay muchos tipos de cartas de
control, estas se usan dependiendo el tipo de datos que desea monitorear.
Gráfica I - MR
Cree una gráfica de lo valores individuales comparados con los límites de
control establecidos por el proceso, el rango móvil (MR) representa la
variación de los subgrupos artificiales creados entre un par de puntos
secuenciales en la gráfica individual.

I-MR Chart of Adhesive


U C L=14.482
14
Individual V alue

12 _
X=11.71

Estadísticas ➤ Gráficas de 10
control ➤ Gráficas de variables LC L=8.938
individuales ➤ I - MR 1 3 5 7 9 11 13 15 17 19
O bser vation

U C L=3.405
3
M oving Range

__
1 M R=1.042

0 LC L=0
1 3 5 7 9 11 13 15 17 19
O bser vation
Gráfica Z - MR
Cree una gráfica con sub grupos de pequeñas corridas, que se colocan en una
columna adicional, esta gráfica es usada cuando se tiene un número limitado
de datos por sub grupo o corrida y se tienen diferentes corridas para el
mismo proceso. La gráfica de estandarización se obtiene sustrayendo a cada
valor individual el valor promedio.
Z-MR Chart of Adhesive
A B C E
U C L=3
Standar dized Data 2

0 0

Estadísticas ➤ Gráficas de -2
control ➤ Gráficas de variables LC L=-3
individuales ➤ Z- MR 1 3 5 7 9 11 13 15 17 19
O bser vation

A B C E
U C L=3.686

3
M oving Range

2
__
1 M R=1.128

0 LC L=0
1 3 5 7 9 11 13 15 17 19
O bser vation
Gráfica X - s
Cree una gráfica X y una gráfica S con la cual puede monitorear
simultáneamente la media y la variabilidad del proceso. Use gráficas X y S
cuando tenga subgrupos de tamaño 9 o más.

Xbar-S Chart of Adhesive


14
U C L=13.784

Sample M ean

12 _
_
X=11.71

10
Estadísticas ➤ Gráficas de LC L=9.636

control ➤ Gráficas de variables 1 2 3 4 5


Sample
6 7 8 9 10

para subgrupos ➤ Xbarra-S.


U C L=2.548

2
Sample StDev

1 _
S =0.780

0 LC L=0
1 2 3 4 5 6 7 8 9 10
Sample

Das könnte Ihnen auch gefallen