Sie sind auf Seite 1von 50

Inferencia

Estadística

Pruebas de Hipótesis

Universidad Javeriana
Definiciones
- Hipótesis Estadística: Una hipótesis estadística (HE) es una afirmación acerca del
valor de los parámetros de la distribución de una población si dicha distribución se conoce, ó
sobre el tipo de distribución si ésta es desconocida. Si la hipótesis especifica
completamente la distribución, se le llama hipótesis simple, de lo contrario decimos que es
una hipótesis compuesta.

- Prueba estadística (de H0 contra H1): Una prueba para confrontar una hipótesis
estadística H0 contra una hipótesis estadística H1 (dichas hipótesis deben ser excluyentes) es
una regla que permite tomar la decisión de no rechazar ó rechazar la hipótesis H0 (y
consecuentemente rechazar o no rechazar H1), según los valores obtenidos en la muestra
-aleatoria y denula
Hipótesis acuerdo con cierto
e hipótesis porcentaje
alterna: admisiblede
En pruebas dehipótesis
error. estadísticas, se acostumbra
a llamar hipótesis nula (H0) a aquella que se asume hasta el momento como válida, e
hipótesis alterna (H1) a aquella que se presenta como “nueva alternativa” a la hipótesis H 0
que hasta el momento aparecía como válida.

- Región crítica C: La región crítica C asociada a la prueba de una hipótesis estadística es


el conjunto de todos los posibles resultados de la muestra aleatoria para los cuales la
hipótesis nula es rechazada, de acuerdo con la prueba aplicada.
Errores Tipo I y II
 • Error Tipo I: RECHAZAR cuando en realidad es CIERTA
• Error Tipo II: NO RECHAZAR cuando en realidad es FALSA

Las probabilidades de cometer dichos errores se definen como:

• Probabilidad de cometer Error Tipo I ()

• Probabilidad de cometer Error Tipo II ()

Los dos errores no pueden cometerse en forma simultánea. Por lo


tanto

• Potencia de la prueba ()
Errores Tipo I y II

Si aumenta α
disminuye β y al
contrario, ¿Qué hacer
para tener un α fijo y
disminuir el β ?
AUMENTAR EL
TAMAÑO DE LA
MUESTRA
Tipos de pruebas de hipótesis
Unilateral a la izquierda

H 0: µ = a α
H 1: µ < a

Unilateral a la derecha

H0: µ = a
H1: µ > a

Bilaterial o de dos colas


α/2
H 0: µ = a
H 1: µ ≠ a
Construcción de las P.H.

Paso 1: Identificar el parámetro a evaluar: media, proporción, varianza,


diferencia de medias, etc.

Paso 2: Formular la prueba de hipótesis.

Paso 3: Identificar el estimador y el estadístico de prueba.

Paso 4: Graficar la distribución del estadístico, identificar el punto y la región


crítica.

Paso 5: Ubicar el estadístico de prueba en la gráfica de la distribución.

Paso 6: Concluir en términos del problema


Construcción de las P.H. - Ejemplo
Se
  toman los tiempos de armado de 20 piezas en una línea de ensamblaje (tiempos
en segundos):
9.8, 9.7, 9.6, 9.9, 10.5, 10.4, 9.9, 10.2, 11.2, 10.1, 10.6, 10.9, 10.3, 10.6, 10.5, 9.6,
11.1, 9.6, 9.8, 9.7
Se define la variable aleatoria X como el tiempo necesario para armar una unidad.
Se asume que X sigue una distribución .

Con un nivel de significancia () del 5%, ¿existe alguna razón para pensar que el
tiempo medio de armado es mayor que 10 segundos?

Paso 1: Identificar el parámetro a evaluar.

Paso 2: Formular la prueba de hipótesis.

Paso 3: Identificar el estimador y el estadístico de prueba.


Bajo el estadístico de prueba tiene un valor de 1.49
Construcción de las P.H. - Ejemplo
Paso
  4: Graficar la distribución del estadístico, identificar el punto y la región
crítica.

1-α=0.95 α=0.05

0
Punto = 1.645
Crítico

Paso 5: Ubicar el estadístico de prueba en la gráfica de la distribución.

1-α=0.95 α=0.05

0
Punto = 1.645
Crítico
Estadístico = 1.49
de Prueba

Paso 6: Concluir
No existe evidencia estadística para rechazar la hipótesis nula que valida que
P.H. Para la media (varianza
Paso
 
conocida)
1: Identificar el parámetro a evaluar.
Paso 2: Formular la prueba de hipótesis.

Cola Inferior Cola Superior Dos Colas

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variable aleatoria:
2) Parámetros poblacionales: , conocidos
3) Muestra aleatoria: : calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
P.H. Para la media (varianza
conocida) - ejemplo
P.H. Para la media (varianza
conocida) - ejemplo
P.H. Para la media (varianza
Paso
  desconocida)
1: Identificar el parámetro a evaluar.
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variable aleatoria:
2) Parámetros poblacionales: conocida, desconocida
3) Muestra aleatoria: : calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
P.H. Para la media (varianza
desconocida) - ejemplo
P.H. Para la media (varianza
desconocida) - ejemplo
La experiencia indica que el tiempo que requieren los estudiantes de
último semestre para contestar una prueba estandarizada es una
variable aleatoria normal con media de 35 minutos.
Si se toma una muestra aleatoria de 20 estudiantes de último semestre
a los que les tomó en promedio 33,1 minutos contestar la prueba, con
una varianza de 18,49, realice una prueba de hipótesis para
contrarrestar el histórico de tiempo o el hecho de que ese tiempo sea
diferente. Utilice una significancia del 5 %.
P.H. Para la proporción
Paso
  1: Identificar el parámetro a evaluar. p
Paso 2: Formular la prueba de hipótesis.

Cola Inferior Cola Superior Dos Colas

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variable aleatoria:
2) Muestra grande n ≥ 30
3) Muestra aleatoria:
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
P.H. Para la proporción - ejemplo
P.H. Para la proporción - ejemplo

Estudios distritales concluyeron que, mensualmente, la proporción de


locales comerciales en el sector de San Andresito que incurren en pérdidas
en el sector de San Andresito no supera el 35 %. Para un estudio
independiente, se tomó una muestra de 105 locales del sector
seleccionados al azar, en los que se observó que 37 de ellos han tenido
pérdidas en este mes. A partir del estudio, un comerciante de la zona
afirmó que los estudios distritales estaban equivocados.
 
Contraste la hipótesis propuesta por el comerciante utilizando un nivel de
significancia del 1 %.
P.H. Para la proporción - ejemplo

Con el fin de analizar si los acontecimientos económicos del último


mes afectaron a más zonas comerciales de Bogotá, se decidió tomar
otra muestra de 136 locales ubicados en la zona norte de la ciudad.
Allí se encontró que 49 de ellos han tenido pérdidas en este mes. Con
base en lo anterior, se desea probar si la proporción de locales con
pérdidas para esta zona de la ciudad se atiene o no al patrón
mostrado en los estudios distritales. Utilice un nivel de significancia
del 2,5 %.
P.H. Para la varianza
Paso
  1: Identificar el parámetro a evaluar.
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variable aleatoria:
2) Parámetros poblacionales: bajo
3) Muestra aleatoria: : conocidos
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
P.H. Para la varianza - ejemplo

Una industria alimenticia utiliza diversas materias primas para la preparación de sus productos. Sobre uno de
ellos, un jarabe de azúcar, se busca analizar si el último lote presenta o no una variabilidad mayor a 15 grados
brix. Para lo anterior, se tomaron 20 muestras del lote y se determinó una varianza muestral de 20,98. Con
una significancia de 5 % ¿Hay evidencia significativa para afirmar que la varianza del lote es mayor a 15 °Brix?

  20,98
𝐸𝑃= ( 19 )=26,57
15

𝑅𝑒𝑔𝑖
  ó 𝑛 𝑐𝑟 í 𝑡𝑖𝑐𝑎 : 𝜒 2(19 ;0,95 )=30,14

No rechazar Ho.
No hay evidencia estadística para poder afirmar que la varianza del lote sea mayor a 15 °Brix.
P.H. Para la varianza - ejemplo

En un bar, se considera que una máquina dispensadora de cerveza necesita mantenimiento si en el momento
de servir cerveza en jarras de 500 mL hay una varianza por encima o por debajo de de 11,5 mL. El
administrador ha decidido mandar a reprar la máquina. No obstante usted ha tomado una muestra de 25
jarras para la cual ha identificado que la varianza resultó ser de 20,3 mL. Con base en la muestra establezca si
la decisión del administrador fue acertada o no. Utilice una significancia del 5 %

  20,3
𝐸𝑃= ( 24 ) =42,37
11,5
𝑅𝑒𝑔𝑖
  ó 𝑛 𝑐𝑟 í 𝑡𝑖𝑐𝑎 : 𝜒 2(24 ;0,975 )=39,36 𝑦 𝜒 2(24 ;0 ,02 5)=12,40

Rechazar Ho.
Hay evidencia estadística para poder afirmar que la varianza del lote es diferente de 11,5 mL y por lo tanto la
decisión de reparar la máquina fue acertada.
P.H. Para la varianza - ejemplo

Una empresa de transportes fue demandada por el incumplimiento en la prestación del servicio pues, según
los demandantes, la varianza en los tiempos de llegada de los buses a los paraderos fueron iguales o
superiores a 2 minutos, cuando en el contrato se establece que dicha varianza no debe superar este valor
límite. La empresa quiere probar que, en efecto, la varianza fue menor al tiempo límite establecido, para lo
cuál midió el tiempo (en minutos) entre llegadas de 12 buses en un paradero de una ruta escogida al azar. Los
resultados fueron los siguientes:

7,7 6,8 8,3 9,4 9,8 5,5 7,9 8,0 9,5 10,3 9,9 7,3

Establezca con un nivel de significancia de 1 % cuál de las dos partes tiene la razón
Errores Tipo I y II – Ejemplos
Errores Tipo I y II – Ejemplos
Errores Tipo I y II – Ejemplos
Errores Tipo I y II – Ejemplos

Si la longitud promedio de las 16 vigas analizadas resultó ser de 4,9913 metros, ¿Cuál es la probabilidad de
cometer error Tipo I.

Con base en el resultado anterior, y asumiendo que la longitud promedio real es de 4,98 metros, ¿Cuál es la
potencia de la prueba? ¿Se debe considerar modificar el tamaño de la muestra?
Errores Tipo I y II – Ejemplos
P.H. Para la diferencia de medias
  (varianzas conocidas)
Paso 1: Identificar el parámetro a evaluar.
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variables aleatorias: y . ,
2) Parámetros poblacionales: conocidas
3) Muestras aleatorias: calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
P.H. Para la diferencia de medias (varianzas
conocidas) - ejemplo

Una muestra aleatoria de 36 niñas de primero de primaria de una escuela municipal presentó un peso
promedio de 34.1 kilos y otra muestra aleatoria de 44 niños de primer grado de primaria de la misma
escuela, presentó una media de 35.6 kilos. Si se conoce que la desviación histórica del peso de las niñas
que han cursado ese grado es de 2.11 kilos y la de los niños es de 1.95 kilos, establezca si existe una
diferencia significativa en los pesos de los dos géneros. Utilice un nivel de significancia del 5 % y asuma que
estos datos constituyen muestras aleatorias de dos distribuciones normales e independientes.
P.H. Para la diferencia de medias (varianzas
conocidas) - ejemplo
En cierta empresa se requiere un análisis de ventas medias mensuales entre dos vendedores. El vendedor
A lleva 9 meses trabajando en la empresa mientras que el vendedor B labora hace 6 meses. El volumen de
ventas (en unidades de producto) para cada vendedor se muestra a continuación:

Vendedor/Mes 1 2 3 4 5 6 7 8 9
A 54 48 59 68 46 69 44 71 63
B 50 41 36 62 70 52

Se sabe además, por el análisis de ventas, que las varianzas históricas en las ventas son de 11 y 13 para los
vendedores A y B, respectivamente. Utilizando un nivel de significancia de 2 % establezca si la media de
ventas del vendedor A es mayor a la media de ventas del vendedor B.
P.H. Para la diferencia de medias (varianzas
desconocidas pero iguales)
Paso 1: Identificar el parámetro a evaluar.
 
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variables aleatorias: y
2) Parámetros poblacionales: desconocida
3) Muestras aleatorias: calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.
donde
Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.
Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
P.H. Para la diferencia de medias (varianzas
desconocidas pero iguales) - ejemplo
P.H. Para la diferencia de medias (varianzas
desconocidas pero iguales) - ejemplo
Los Tigres Las Panteras
90 88
Los Tigres y Las Panteras son dos equipos de baloncesto que se enfrentarán en la 89 92
próxima final de un campeonato interuniversitario. Un estudio previo contó la
76 93
cantidad de puntos que hicieron los dos equipos en los últimos 10 partidos. Con base
en lo anterior, el técnico de las panteras estima que la media de puntos de su equipo 82 90
es superior al de su rival en más de un punto y que por eso ganarán el campeonato. 93 79
Asumiendo que las poblaciones se pueden suponer normales con varianzas
77 82
poblacionales iguales, determine con un nivel de significancia del 2,5 % si la
afirmación del técnico es verdadera. 80 72
85 85
86 89
82 94
P.H. Para la diferencia de medias (varianzas
desconocidas y diferentes)
Paso 1: Identificar el parámetro a evaluar.
 
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variables aleatorias: y . ,
2) Parámetros poblacionales: desconocidas y diferentes
3) Muestras aleatorias: calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
P.H. Para la diferencia de medias (varianzas
desconocidas y diferentes) - ejemplo
Se tomó una muestra de las calificaciones de un examen de estadística para hombres y mujeres de un curso, con
el fin de probar si hay diferencia significativa entre el rendimiento en la asignatura por género. Los resultados de
la muestra se presentan a continuación:

Hombres 77 80 79 76 85 66 98 69 72
Mujeres 81 67 90 80 76 78 81

Utilice un nivel de significancia del 1 % para concluir acerca del rendimiento por género.
P.H. Para la diferencia de medias (varianzas
desconocidas y diferentes) - ejemplo
En cierta empresa se requiere un análisis de ventas medias mensuales entre dos vendedores. El vendedor
A lleva 9 meses trabajando en la empresa mientras que el vendedor B labora hace 6 meses. El volumen de
ventas (en unidades de producto) para cada vendedor se muestra a continuación:

Vendedor/Mes 1 2 3 4 5 6 7 8 9
A 54 48 59 68 46 69 44 71 63
B 50 41 36 62 70 52

Utilizando un nivel de significancia de 5 % establezca si la media de ventas del vendedor A es mayor a la


media de ventas del vendedor B.
P.H. Para la diferencia de medias
(muestras dependientes)
Paso 1: Identificar el parámetro a evaluar.
 
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variables aleatorias:
2) Parámetros poblacionales: conocida, desconocida
3) Muestra aleatoria: : calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
P.H. Para la diferencia de medias (muestras
dependientes) - Ejemplo
Un programador web recibió una capacitación en un nuevo programa de ilustración con el fin de integrar
mejores interfaces gráficas e ilustraciones a las páginas que diseña y/o administra. Lo anterior repercute en
el número de veces que los navegantes visitan sus sitios en línea.
Un conteo de las visitas que recibió en los siete días de la semana, para dos semanas antes y después de
tomar el curso, se presenta a continuación:

D L M M J V S
Antes 90 85 88 79 77 89 96
Después 96 84 98 83 71 95 107

Utilizando un nivel de significancia de 5 % establezca si realmente el curso tuvo utilidad en términos de


aumentar el número de visitas a las páginas web.
P.H. Para la diferencia de medias (muestras
dependientes) - Ejemplo
Una editorial pretende probar un nuevo papel a base de caña de azúcar, pues su proveedor asegura que la
fricción dentro de las impresoras es menor y, por lo tanto, la impresión de libros es más rápida. Para
comprobar la afirmación del proveedor, el jefe de producción de la editorial decidió imprimir 10 libros en
los dos tipos de papel (tradicional y caña de azúcar) y medir el tiempo (en minutos) que se demoraron
imprimiendo.
1 2 3 4 5 6 7 8 9 10
Tradicional 1,7 1,8 1,9 1,7 1,6 1,9 2,1 1,8 1,6 1,8
Caña de azúcar 1,7 1,6 1,8 1,8 1,8 1,5 1,6 1,7 1,6 1,7

Asumiendo que las muestras son dependientes, establezca si el nuevo papel tuvo repercusión en el tiempo
de impresión de los libros o no. Utilice una significancia del 1 %.
P.H. Para la diferencia de proporciones
Paso
  1: Identificar el parámetro a evaluar.
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variables aleatorias: y . ,
2) Parámetros poblacionales: conocidas
3) Muestras aleatorias: calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.


Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
Paso 7: Concluir
P.H. Para la diferencia de proporciones - ejemplo
Una firma encuestadora determinó que a diferencia del año pasado, los consumidores están gastando más dinero
en tecnología este año. Para ello determinó que, en el año anterior, de 500 encuestados, el 38 % destinan una
cantidad significativa de su sueldo a invertir en tecnología; mientras que en el año actual de 400 personas
indagadas, 164 gastan significativamente en tecnología. A partir de lo anterior, y con un nivel de 2 % determine si
la afirmación de la encuestadora es válida.
P.H. Para la diferencia de proporciones - ejemplo
P.H. Para el cociente entre
Paso
 
varianzas
1: Identificar el parámetro a evaluar.
Paso 2: Formular la prueba de hipótesis.

Paso 3: Definir supuestos para seleccionar el estadístico de prueba.


1) Variables aleatorias: y
2) Parámetros poblacionales:
3) Muestras aleatorias: calculables
Paso 4: Identificar el estimador apropiado para el parámetro y el estadístico de prueba.

NOTA: Identificar la
Paso 5: Graficar la distribución del estadístico, identificar el punto y la región crítica.
población que tenga la
Paso 6: Calcular y ubicar el estadístico de prueba en la gráfica de la distribución.
mayor varianza
muestral y definirla
Paso 7: Concluir
como X.
P.H. Para la varianza y razón de varianzas-
ejemplo
P.H. Para la varianza y razón de varianzas-
ejemplo
En cierta empresa se requiere un análisis de ventas medias mensuales entre dos vendedores. El vendedor
A lleva 9 meses trabajando en la empresa mientras que el vendedor B labora hace 6 meses. El volumen de
ventas (en unidades de producto) para cada vendedor se muestra a continuación:

Vendedor/Mes 1 2 3 4 5 6 7 8 9
A 54 48 59 68 46 69 44 71 63
B 50 41 36 62 70 52

Utilizando un nivel de significancia de 1 % establezca si la varianza en las ventas del vendedor A es mayor al
doble de la varianza de ventas del vendedor B.
Ejercicios
Ejercicios
Ejercicios
Taller
1. Una empresa de cosméticos produce perfumes en recipientes cuya capacidad se puede modelar como una variable aleatoria normal
con media de 6 onzas y varianza 0,0144. El jefe de control de calidad selecciona 18 recipientes al azar de un lote y mide su volumen,
determinando que si la media muestral tiene un valor menor al esperado, devolverá los perfumes a producción y estos no saldrán a
la venta.
- Si el error Tipo I es del 8 %, ¿cuál debe ser el máximo valor de la media muestral para que el lote sea regresado a producción?
- De acuerdo al resultado anterior y teniendo en cuenta que la capacidad media real de los recipientes es de 5,91, ¿cuál es la potencia
de la prueba?

2. Un fabricante de dispositivos electrónicos desea probar un nuevo proceso de ensamblaje puesto que sabe que el proceso actual
presenta una tasa de defectos del 5 %. En una muestra de 400 unidades ensambladas con el nuevo proceso se determinó que 16
tenían defectos. ¿Se puede concluir que el nuevo proceso tiene una tasa menor de defectos? Utilice el p-value para determinar su
conclusión y compárelo con un 5 % de significancia.

3. Los datos de 7 muestras sobre la duración efectiva de la acción de un bloqueador solar sobre la piel (en horas) se presentan a
continuación: 3,4 3,8 3,3 3,9 4,1 3,7 4,1. Teniendo en cuenta que un indicador de calidad del producto corresponde a una
mínima varianza, el jefe de producción afirma que para todo el lote dicha varianza será menor de 0,16.
- Establezca si la afirmación del jefe de producción es verdadera utilizando una significancia del 5 %.
- Si esta muestra se compara con una muestra de 10 unidades del penúltimo lote producido cuya desviación estándar resultó ser de
0,292, establezca si habrá o no diferencia entre las varianzas de los lotes utilizando una significancia del 10 %.

Das könnte Ihnen auch gefallen