Beruflich Dokumente
Kultur Dokumente
Este ejemplo muestra la lógica que hay detrás de una prueba de hipótesis estadística.
Una prueba de hipótesis es un procedimiento estadístico que a través del estudio de una muestra permite
determinar el cumplimiento de una hipótesis planteada sobre alguna característica de la población
(Parámetro).
DEFINICIONES FUNDAMENTALES
Para entender bien que es una prueba de hipótesis hay que tener bien claros (entre otros) los
siguientes conceptos:
¿Qué es un parámetro?
En estadística, un parámetro es una constante asociada a la distribución de probabilidad de una
variable aleatoria.
Ejemplo1: ¿Será que el porcentaje de empleados de una organización que en un día normal de
trabajo llega tarde es más del 2%?
Ejemplo 2: ¿Podría ser posible que el tiempo de entrega de suministros del proveedor A es más
rápido que el tiempo del proveedor B para una compañía grande?
Ejemplo 3: ¿Será que la variabilidad del costo diario de mantenimiento de una planta
procesadora de alimentos es de $500.000?
DEFINICIONES FUNDAMENTALES
¿Qué es una hipótesis estadística?
Representación de la hipótesis de investigación en forma de ecuación matemática y en función
de parámetros poblacionales.
Ejemplo 1: ¿Será que el porcentaje de empleados de una organización que en un día normal de
trabajo llega tarde es más del 2%?
𝑃 > 0.02
Ejemplo 2: ¿Podría ser posible que el tiempo de entrega de suministros del proveedor A es más
rápido que el tiempo del proveedor B para una compañía grande?
𝜇 𝐴 < 𝜇𝐵 → 𝜇 𝐴 − 𝜇 𝐵 < 0
Ejemplo 3: ¿Será que la variabilidad del costo diario de mantenimiento de una planta
procesadora de alimentos es de $500.000?
𝜎 = 500.000 → 𝜎 2 = 500.0002
DEFINICIONES FUNDAMENTALES
Las hipótesis de investigación pueden desglosarse en dos hipótesis estadísticas que se denominan:
Por norma general a la hipótesis nula siempre se le asigna el signo igual (=). Si a la hipótesis
alternativa se le asigna el signo “menor que” (<) o el signo “mayor que” (>) se dice que la
prueba de hipótesis es de una sola cola (Hipótesis unilaterales), por el contrario, si se le
asigna el signo “diferente de” (≠) se dice que la prueba es de dos colas (Hipótesis
bilaterales).
Ejemplo 1: ¿Será que el porcentaje de empleados de una organización que en un día normal de
trabajo llega tarde es más del 2%?
𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝐻1 : 𝜇𝐴 < 𝜇𝐵
DEFINICIONES FUNDAMENTALES
Ejemplo 3: ¿Será que la variabilidad del costo diario de mantenimiento de una planta procesadora
de alimentos es de $500.000?
𝐻0 : 𝜎 2 = 500.0002 𝑉𝑠 𝐻1 : 𝜎 2 ≠ 500.0002
𝐻0 : 𝑃 = 0.5 𝑉𝑠 𝐻1 : 𝑃 ≠ 0.5
Ejercicio 2: Una máquina de llenado de botellas debe estar programada para efectuar un llenado
con una desviación estándar no superior a 5ml. Si se desea evaluar la calidad de la máquina de
llenado, ¿Cuál debería ser el sistema de hipótesis a probar?
𝐻0 : 𝜎 2 = 52 𝑉𝑠 𝐻1 : 𝜎 2 > 52
Recuerde que…
La verdad de las hipótesis NO puede conocerse con total seguridad a menos que
pueda examinarse toda la población.
TIPOS DE ERRORES EN PRUEBAS DE HIPÓTESIS
𝐻0 : 𝑁𝑜 ℎ𝑎𝑦 𝑒𝑚𝑏𝑎𝑟𝑎𝑧𝑜 𝐻1 : 𝐻𝑎𝑦 𝑒𝑚𝑏𝑎𝑟𝑎𝑧𝑜 Uno querría tomar la decisión correcta
Condición real
𝐻0 Verdadera 𝐻0 Falsa
Error tipo I No existe error
Decisión que Rechazar 𝐻0
se toma en la 𝟏−
prueba de
No existe error Error tipo II
hipótesis No rechazar 𝐻0
Es un error decir que no hay 𝟏−
embarazo cuando realmente
lo está (𝐻1 ).
TIPOS DE ERRORES EN PRUEBAS DE HIPÓTESIS
Condición real
𝐻0 Verdadera 𝐻0 Falsa
Error tipo I No existe error
Decisión que Rechazar 𝐻0
se toma en la 𝟏−
prueba de
No existe error Error tipo II
hipótesis No rechazar 𝐻0
𝟏−
Decisión correcta: Si la hipótesis nula es verdadera y Error tipo II: Si la hipótesis nula es falsa y no se
no se rechaza, se ésta tomando una decisión rechaza, se comete error tipo II. La probabilidad
correcta. También se llama nivel de confianza. La de cometerlo es:
probabilidad de cometerlo es:
𝛽 = 𝑃 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎
1 − 𝛼 = 𝑃 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎
¿QUÉ TIPO DE ERROR ES PEOR: TIPO I O TIPO II?
Caso 1: Juicio de un acusado Caso 2: El caso de contaminación
• El juez puede cometer error tipo I cuando o (Las motocicletas contaminan si emisiones
decide declarar culpable al acusado cuando superan el 5.5 g/Km).
realmente es inocente.
• El juez puede cometer error tipo II cuando • El error tipo I: Decir que 𝒄𝒐𝒏𝒕𝒂𝒎𝒊𝒏𝒂 cuando
o decide declarar inocente en circunstancia realmente la emisión es menor que 5.5 (No
que el individuo es realmente culpable. contamina), esto es, las motocicletas que
están emitiendo una cantidad permitida de CO
Se podría pensar que: no pasan la prueba y no pueden ser transitar.
El error más grave es cometer error tipo I, es • El error tipo II: Decir que no contamina
decir, declarar culpable a un inocente. cuando realmente la emisión es mayor a 5.5
También es grave cometer el error tipo II, pero (Contamina), esto implica que las motocicletas
sus consecuencias podrían ser menos graves. que emiten gran cantidad de CO pasan la
prueba y pueden transitar (contaminación
Pero entonces, ¿Qué tipo de error es el peor? ambiental).
El estadístico de prueba adecuado para una hipótesis sobre 𝜇 se debe basar en la variable aleatoria 𝑋ത (Si la
situación cumple las condiciones del teorema de limite central):
Es un estadístico de prueba, porque es
𝑋ത − 𝜇
una variable aleatoria, con distribución
𝜎 ∼ 𝑁𝑜𝑟𝑚𝑎𝑙 0,1
conocida (Normal estándar), y que
relaciona al parámetro 𝜇 con su 𝑛
estimador 𝑋.ത
En el proceso de prueba de hipótesis se asume que 𝐻0 es verdadera hasta que se demuestre lo contrario
𝐻0 : 𝜇 = 𝜇0 . Por lo que (Si la situación cumple las condiciones del teorema de limite central):
𝑋ത − 𝜇0
También se le suele llamar: 𝑍𝑐 = 𝜎 ∼ 𝑁𝑜𝑟𝑚𝑎𝑙 0,1
Estadístico calculado. 𝑛
¿CÓMO SE DECIDE SI SE RECHAZA O NO LA HIPÓTESIS NULA?
Si suponemos el siguiente sistema de hipótesis:
𝐻0 : 𝜇 = 𝜇0 𝑉𝑠 𝐻1 : 𝜇 < 𝜇0
Entonces, ¿Cómo se
decide entre 𝐻0 o 𝐻1 ?
Esto indica que los valores que puede tomar el estadístico de prueba de dividen en dos regiones:
Entonces para elegir entre la hipótesis nula (𝑯𝟎 ) o la hipótesis alternativa (𝑯𝟏 ) se debe formular una
regla de decisión.
¿CÓMO SE DECIDE SI SE RECHAZA O NO LA HIPÓTESIS NULA?
Entonces para elegir entre la hipótesis nula (𝐻0 ) o la hipótesis alternativa (𝐻1 ) se debe formular
una regla de decisión, para establecerla es necesario identificar un valor crítico (Estadístico de
contraste).
Un valor crítico es un punto en la distribución
𝐻0 : 𝜇 = 𝜇0 𝑉𝑠 𝐻1 : 𝜇 < 𝜇0
del estadístico de prueba (Suponiendo que la
Región de rechazo 𝑯𝟎 Región de no rechazo 𝑯𝟎 hipótesis nula es cierta) que define un conjunto
de valores que apoyan o no el rechazo de la
Valor crítico hipótesis nula.
ത 0
𝑋−𝜇
• Rechazamos 𝐻0 si: Z𝑐 = 𝜎 < 𝑉𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜
𝑛
𝐻0 : 𝜇 = 𝜇0 𝑉𝑠 𝐻1 : 𝜇 < 𝜇0
𝑃 𝑍 < 𝑍𝛼 = 𝛼
La regla de decisión sería:
ത
𝑋−𝜇
• Rechazamos 𝐻0 si: Z𝑐 = 𝜎 0 < 𝑍𝛼 Región de Región de no
𝑛 𝑍
rechazo 𝑯𝟎 𝛼 rechazo 𝑯𝟎
𝐻0 : 𝜇 = 𝜇0 𝑉𝑠 𝐻1 : 𝜇 ≠ 𝜇0
𝛼
𝑃 𝑍 < 𝑍𝛼 =
Región de 2 2
La regla de decisión sería: no rechazo 𝛼
• Rechazamos 𝐻0 si: 𝑯𝟎 𝑃 𝑍 < 𝑍1−𝛼 = 1 −
2 2
𝑋ത − 𝜇0 𝑋ത − 𝜇0
Z𝑐 = 𝜎 < 𝑍𝛼 𝑜 Z𝑐 = 𝜎 > 𝑍1−𝛼 Región de 𝑍𝛼 𝑍1−𝛼 Región de
2 2 rechazo 𝑯𝟎 2 2 rechazo 𝑯𝟎
𝑛 𝑛
PRUEBAS PARA LA MEDIA DE UNA POBLACIÓN: SE CONOCE LA DESVIACIÓN
ESTÁNDAR POBLACIONAL
Ejemplo 1:
En 2001, el U.S. Department Labor informó que el salario por hora promedio para los
trabajadores de la producción en Estados Unidos era $14.32 por hora (The World Almanac
2003). En 2003, en una muestra de 75 trabajadores de la producción, la media muestral fue
$14.68 por hora. Si la desviación estándar poblacional es $1.45, ¿Se puede concluir que ha
habido un aumento en la media del salario por hora? Use un nivel de significancia del 0.05.
𝑛 = 75 𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑔𝑟𝑎𝑛𝑑𝑒
𝑋ത − 𝜇0
𝑍𝑐 = 𝜎
𝑛
El nivel de significancia 𝛼 = 0.05.
PRUEBAS PARA LA MEDIA DE UNA POBLACIÓN: SE CONOCE LA DESVIACIÓN
ESTÁNDAR POBLACIONAL
Ejemplo 1:
Entonces: 𝑛 = 75
𝑋ത = 14.68
𝜎 = 1.45 14.68 − 14.32
𝑍𝑐 = = 2.15
𝜇0 = 14.32 1.45
75
Por lo tanto con un nivel de significancia de 0.05 se puede decir que existe evidencia para concluir
que hay un aumento salarial por hora.
EJERCICIO
Heinz, un fabricante de salsa de tomate, utiliza una máquina para vaciar 16 onzas de su salsa en botellas.
A partir de su experiencia de varios años con la máquina despachadora, la empresa sabe que la cantidad
del producto en cada botella tiene una distribución normal con una media de 16 onzas y una desviación
estándar de 0.15 onzas. Una muestra de 50 botellas llenadas durante la hora pasada reveló que la
cantidad media por botella era de 16.017 onzas. ¿Sugiere la evidencia que la cantidad media despachada
es diferente de 16 onzas? Utilice un nivel de significancia de 0.05.
PRUEBAS PARA LA MEDIA DE UNA POBLACIÓN: SE DESCONOCE LA DESVIACIÓN
ESTÁNDAR POBLACIONAL
𝑯𝟎 : 𝝁 = 𝝁𝟎 𝑽𝒔 𝑯𝟏 : 𝝁 ≠ 𝝁𝟎 𝑯𝟎 : 𝝁 = 𝝁𝟎 𝑽𝒔 𝑯𝟏 : 𝝁 ≠ 𝝁𝟎
El Edison Electric Institute publica cifras del número de kilowatts-hora que gastan anualmente
varios aparatos electrodomésticos. Se afirma que una aspiradora gasta un promedio de 46
kilowatts-hora al año. Si una muestra aleatoria de 16 hogares, que se incluye en un estudio
planeado, indica que las aspiradoras gastan un promedio de 42 kilowatts-hora al año con una
desviación estándar de 11.9 kilowatts-hora. ¿Esto sugiere que las aspiradoras gastan, en
promedio, menos de 46 kilowatts-hora al año a un nivel de significancia de 0.05? Suponga que
la población de kilowatts-hora es normal.
𝐻0 : 𝜇 = 46 𝑉𝑠 𝐻1 : 𝜇 < 46
𝑋ത − 𝜇0
𝑡𝑐 =
𝑆Τ 𝑛
El nivel de significancia 𝛼 = 0.05.
PRUEBAS PARA LA MEDIA DE UNA POBLACIÓN: SE DESCONOCE LA DESVIACIÓN
ESTÁNDAR POBLACIONAL
Ejemplo 2:
𝑃 𝑡𝑛−1 > 𝑡𝛼 = 𝛼
Rechazo 𝑯𝟎 si:
𝑃 𝑡15 > 𝑡0.05 = 0.05
𝑡0.05 = 1.753
Región de −1.753 Región de no
rechazo 𝑯𝟎 rechazo 𝑯𝟎
Entonces: 𝑛 = 16
𝑋ത = 42 42 − 46
𝑆 = 11.9 𝑡𝑐 = = −1.34
11.9
𝜇0 = 46 16
Por lo tanto con un nivel de significancia de 0.05 se puede decir que existe evidencia para concluir
que el consumo promedio de kilowatts-hora al año no es menor a 46.
EJERCICIO
La longitud media de una pequeña barra de contrapeso es de 43 milímetros. Al supervisor de
producción le preocupa que hayan cambiado los ajustes de la máquina de producción de
barras. Solicita una investigación al departamento de ingeniería, que selecciona una muestra
aleatoria de 12 barras y las mide. Los resultados aparecen en seguida, expresados en
milímetros, 42,39,42,45,43,40,39,41,40,42,43,42. ¿Es razonable concluir que cambió la
longitud media de las barras? Utilice el nivel de significancia 0.02 (Suponga que la población
es normal).
PRUEBAS DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL
𝐻0 : 𝑃 = 𝑝0 𝑉𝑠 𝐻1 : 𝑃 < 𝑝0
𝑃 𝑍 < 𝑍𝛼 = 𝛼
La regla de decisión sería:
ො 0
𝑝−𝑝
• Rechazamos 𝐻0 si: Z𝑐 = < 𝑍𝛼 Región de Región de no
𝑝0 1−𝑝0 𝑍
rechazo 𝑯𝟎 𝛼
𝑛 rechazo 𝑯𝟎
𝐻0 : 𝑃 = 𝑝0 𝑉𝑠 𝐻1 : 𝑃 ≠ 𝑝0 𝛼
𝑃 𝑍 < 𝑍𝛼 =
2 2
La regla de decisión sería: Región de
𝛼
• Rechazamos 𝐻0 si: no rechazo
𝑯𝟎
𝑃 𝑍 < 𝑍1−𝛼 = 1 −
2 2
𝑝Ƹ − 𝑝0 𝑝Ƹ − 𝑝0
Z𝑐 = < 𝑍𝛼 𝑜 Z𝑐 = > 𝑍1−𝛼 𝑍1−𝛼 Región de
𝑝0 1 − 𝑝0 2 𝑝0 1 − 𝑝0 2 Región de 𝑍𝛼
rechazo 𝑯𝟎 2 2 rechazo 𝑯𝟎
𝑛 𝑛
PRUEBAS DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL
Ejemplo 3:
El gerente de una empresa de producción asegura que su proceso genera una proporción de
unidades defectuosas menor a 5%, al tomar una muestra de su producto se obtiene que de
200 unidades revisadas, un total de 15 unidades fueron defectuosas. Realizar una prueba de
hipótesis con un nivel de significancia del 0.01. ¿Los datos contradicen al gerente de la
empresa?
15
𝑛 = 200 𝑥 = 15 𝑝Ƹ = = 0.075
200
𝑝Ƹ − 𝑝0
𝑍𝑐 =
𝑝0 1 − 𝑝0
𝑛
El nivel de significancia 𝛼 = 0.01.
PRUEBAS DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL
Ejemplo 3:
Rechazo 𝑯𝟎 si:
𝑃 𝑍 < 𝑍1−𝛼 = 1 − 𝛼
Entonces:
Por lo tanto con un nivel de significancia de 0.01 se puede decir que existe evidencia para creer la
afirmación del productor.
EJERCICIO
Se desea probar si existe un cambio en la proporción de 0.4 de mujeres en la
carrera de ingeniería industrial. En la última fecha de inscripciones para el ingreso
se seleccionó una muestra de 200 potenciales estudiantes y se obtuvo que 90 de
ellos eran mujeres. Use un nivel de significancia del 0.01.
PRUEBAS DE HIPÓTESIS PARA LA VARIANZA POBLACIONAL
2 2
𝐻0 : 𝜎2 = 𝜎02 𝑉𝑠 𝐻1 : 𝜎2 > 𝜎02 𝑃 𝜒𝑛−1 < 𝜒1−𝛼 =1−𝛼
𝛼
𝐻0 : 𝜎 2 = 𝜎02 𝑉𝑠 𝐻1 : 𝜎 2 ≠ 𝜎02 2
𝑃 𝜒𝑛−1 < 𝜒𝛼2 =
2
2
Una máquina de llenado de botellas debe estar programada para efectuar un llenado con una
desviación estándar no superior a 5ml. Para probar que esto se está cumpliendo eso se
extrajeron aleatoriamente 20 botellas de llenado y se encontró que S = 6.2. Se supone que los
datos están normalmente distribuidos. Si se desea evaluar la calidad de la máquina de llenado,
¿Se podría decir que la máquina se encuentra fuera de control (Use un nivel de significancia de
0.05)?
𝐻0 : 𝜎 2 = 25 𝑉𝑠 𝐻1 : 𝜎 2 > 25
𝑛 = 20 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙
𝑛 − 1 𝑠2
𝜒𝑐2 =
𝜎02
El nivel de significancia 𝛼 = 0.05.
PRUEBAS DE HIPÓTESIS PARA LA VARIANZA POBLACIONAL
Ejemplo 4:
Rechazo 𝑯𝟎 si:
2 2
𝑃 𝜒𝑛−1 < 𝜒1−𝛼 =1−𝛼
2 2
𝑃 𝜒19 < 𝜒0.95 = 0.95
Entonces:
𝑛 = 20
𝑆 = 6.2 𝑛 − 1 𝑠2 20 − 1 6.22
𝜒𝑐2 = = = 29.2144
𝜎02 25
Por lo tanto con un nivel de significancia de 0.01 se puede decir que existe evidencia para creer que
la máquina se encuentra bajo control.
EJERCICIO
Metrocali (mio) desea dar una imagen de confiabilidad haciendo que sus conductores sean
puntuales en los horarios de llegada a las paradas. La empresa desea que haya poca
variabilidad en dichos tiempos. En términos de la varianza de los tiempos de llegada de las
paradas, la empresa considera que la varianza deber ser de 4 𝑚𝑖𝑛2 o menos. Asuma que en
una muestra aleatoria de 24 llegadas a cierta parada en una intersección en el centro de la
ciudad, la varianza muestral encontrada es 10 𝑚𝑖𝑛2 (Suponga normalidad). Esta prueba de
hipótesis se realiza con un nivel de significancia de 0.05. ¿Podemos considerar que Metrocali
nos está mintiendo?