Sie sind auf Seite 1von 27

Pruebas de Estimación

Pruebas de Hipótesis
Pruebas de Hipótesis

Media de la población
Diferencia de medias de dos poblaciones
Proporción de la población
Diferencia de proporción de dos poblaciones
Desviación estándar de la población
Razón entre varianzas de dos poblaciones
Prueba de Hipótesis
 Hipótesis estadística es una aseveración o conjetura con respecto
a una o más poblaciones.
 La verdad o falsedad de una hipótesis estadística nunca se sabe con
absoluta certidumbre a menos que examinemos toda la población. En
la mayoría de los casos se toma una muestra aleatoria de la población
y se utilizan los datos de la muestra para proporcionar evidencia que
apoye o no la hipótesis. La evidencia de la muestra que es
inconsistente con la hipótesis que se establece conduce al rechazo de
ésta, mientras que la evidencia que la apoya conduce a su aceptación.
 Si el investigador se interesa en apoyar una opinión, desea llegar a la
opinión en la forma de rechazo de una hipótesis. Si un investigador
desea mostrar fuerte evidencia a favor de la opinión de que fumar
aumenta el riesgo de contraer cáncer, la hipótesis a probar debe ser de
la forma “ no hay aumento en el riesgo de contraer cáncer como
producto de fumar”. Como resultado, la opinión se alcanza por
medio de un rechazo.
Concepto de Prueba de Hipótesis
Se explicará con un ejemplo: Un laboratorio farmacéutico produce y vende un
medicamento para reducir el nivel de colesterol en sangre. Los químicos
de un laboratorio rival trabajan para obtener un medicamento que reduzca
más el colesterol. Una vez que tienen el nuevo producto, lo someten a prueba
para ver si se alcanzaron los objetivos o no. La pregunta de investigación
que se puede plantear es la siguiente:

¿Se reduce más el nivel de colesterol en sangre con el nuevo


medicamento que con el medicamento en uso?

La imposibilidad de probar el nuevo medicamento en toda la población, obliga


a recurrir a una muestra aleatoria y a un modelo que permita establecer una
verdad estadística.
Prueba de Hipótesis
 El modelo estadístico se basa en un método de demostración
comúnmente empleado en matemáticas, en el que se asume una
hipótesis y se obtiene un resultado absurdo, concluyéndose que la
hipótesis de partida es falsa. Se le conoce como método por
contradicción o reducción al absurdo.
 La adaptación de este método en estadística parte de dos hipótesis
lógicas: la hipótesis nula y la hipótesis alterna, representadas por
Ho y H1, respectivamente.
 Modelo estadístico para la pregunta de investigación

 Ho : El nuevo medicamento tiene el mismo efecto que el medicamento en


uso.
 H1 : El nuevo medicamento reduce más el colesterol que el medicamento
en uso.
Pruebas de hipótesis…
 La pregunta de investigación se ha transformado en una hipótesis
(hipótesis de investigación, H1 ); además, encabeza el modelo una
hipótesis H0, un resultado posible de la prueba, aunque lógicamente
opuesto a lo que los químicos planearon; esto es, opuesto al
objetivo de la investigación. La idea de esta estrategia es que al
final del proceso de prueba se llegue a la decisión de rechazar H0 ,
apoyando con ello H1; la corroboración de que se cumplió el
objetivo de la investigación.

 La estructura y la mecánica del modelo tienen la hipótesis nula


como el referente alrededor del cual se desarrolla el análisis
estadístico y se toma la decisión final; esto da lugar a sólo dos
decisiones: aceptar H0 o rechazar H0 .
Prueba de hipótesis
 La prueba de hipótesis comienza con una suposición, llamada
hipótesis, que hacemos acerca de un parámetro de la población.
Después recolectamos datos de muestra, producimos estadísticos
muestrales y usamos esta información para decidir qué tan probable
es que nuestro parámetro de población hipotético sea correcto.
 Si suponemos un cierto valor para una media de población.
Para probar la validez de esa suposición recolectamos datos de
muestra y determinamos la diferencia entre el valor hipotético y el
valor de la media de muestra. Después juzgamos si la diferencia
obtenida es significativa o no. Mientras más pequeña sea la
diferencia, mayor será la probabilidad de que nuestro valor
hipotético para la media sea correcto. Mientras mayor sea la
diferencia, más pequeña será la probabilidad de que el valor
hipotético sea correcto.
Hipótesis nula y alternativa
 Hipótesis nula: ésta se refiere a cualquier hipótesis
que deseamos probar y se denota con H0. El rechazo de
H0 conduce a la aceptación de una hipótesis alternativa,
que se denota con H1. Una hipótesis nula con respecto a
un parámetro poblacional siempre se establecerá de modo
que especifique un valor exacto del parámetro, mientras
que la hipótesis alternativa permite la posibilidad de varios
valores.
H0 : p = 0.5
H1 : p > 0.5 , H1 : p < 0.5 , H1 : p ≠ 0.5
Ejemplo de Aplicación
 Se debe techar un complejo deportivo y se adjudica el contrato a
una constructora grande. Las especificaciones de construcción
indican un techo que debe llevar 10,000 láminas de aluminio con un
grosor de 0.04 pulgadas. Las láminas de aluminio no pueden ser
considerablemente más gruesas que 0.04 pulgs porque la
estructura no podría soportar el peso adicional, ni tampoco pueden
ser más delgadas porque la fuerza estructural del techo sería
inadecuada. Debido a estas restricciones la constructora debe
revisar cuidadosamente las láminas de aluminio que le llegan del
proveedor . En la empresa se toman muestras para medir el
grosor, así se tomó la decisión de tomar 100 muestras aleatorias de
los lotes de láminas de aluminio. Las láminas de la muestra tienen
un grosor medio de 0.0408 pulgadas. Por experiencia con este
proveedor se cree que estas láminas provienen de una población
que tiene una desviación estándar de 0.004 pulgadas. Con base en
estos datos, se debe decidir si las 10,000 láminas de aluminio
cumplen con las especificaciones.
Desarrollo
 Si suponemos que el grosor medio real es 0.04
pulgadas y sabemos que la desviación estándar de
la población es 0.004 pulgadas, ¿Qué tan probable
es que obtengamos una media de la muestra de
0.0408 ? Si la media real es 0.04 pulg. y la
desviación estándar es 0.004 pulg. ¿cuál es la
probabilidad de obtener una media de la muestra
que difiera de 0.04 pulgadas en 0.0008 pulgadas
(es decir, 0.0408 – 0.04) o más ?
Nivel de significación
 La respuesta a esta pregunta depende del nivel de error que
se desee tolerar, es decir, de la probabilidad de que la muestra
haya proporcionado una media lo suficientemente mayor que el
valor hipotético asumido. Cuando una media muestral es lo
bastante grande como para provocar que se rechace la hipótesis
que se planteó ocurre “n” veces (5%,1%, 2%), entonces el nivel
de error es 5%,1% ,2%. Debido a esto a este valor se le llama
nivel de significación de la prueba.
 El nivel de significación significa que se rechazará la hipótesis
planteada cuando la media muestral (x)
caiga dentro del intervalo de valores sobre el eje horizontal
cubierto por el área sombreada.
Área crítica
Nivel de significación
 El nivel de significación es la probabilidad de
rechazar una hipótesis nula verdadera o de cometer
lo que se denomina error tipo I. A esta probabilidad
comúnmente se le simboliza con la letra griega α.
 Al valor crítico que puede ser z, t, χ2 ó f, se le
denomina valor crítico o estadístico de prueba y
divide en dos regiones a la curva, una la región de
rechazo y otra la región de aceptación
Área Crítica en la Curva Normal
Nivel de significación
 No existe un nivel de significación único o universal para probar hipótesis. En
algunos casos, se utiliza un nivel de significación de 5%. Es posible probar una
hipótesis a cualquier nivel de significación. Sin embargo, el nivel de significación ,
es también el riesgo que se corre al rechazar una hipótesis nula cuando es cierta.
Cuándo más alto sea el nivel de significación que utilizamos para probar una
hipótesis, mayor será la probabilidad de rechazar la hipótesis nula cuando es cierta.
 Los especialistas en estadística usan α para denominar el error tipo I, que es la
probabilidad de rechazar una hipótesis nula cuando es cierta, este error también es
el nivel de significación de la prueba. Por otro lado aceptar una hipótesis nula
cuando es falsa se le llama error tipo II, y su probabilidad se simboliza con β.
Existe una relación entre estos dos tipos de errores: la probabilidad de cometer un
tipo de error puede reducirse sólo si estamos dispuestos a aumentar la probabilidad
de cometer el otro tipo de error.
 Cuando el error tipo I (α) es muy grande , rara vez se aceptaría una hipótesis nula
cuando no es cierta, pero como precio de esta seguridad, a menudo rechazaremos
una hipótesis nula cuando es cierta. Puesto de otra manera, con el fin de obtener
una β baja, tendremos que tolerar un α alta. Es por esto que los tomadores de
decisiones deciden el nivel de significación adecuado examinado los costos o la
penalización vinculados con ambos tipos de errores.
Usos del Nivel de significación
 Suponga que cometer el error tipo I (rechazar una hipótesis nula
cuando es cierta) implica el tiempo y los problemas de volver a trabajar
un lote de compuestos químicos que debieran haberse aceptado. Al
mismo tiempo, cometer un error tipo II (aceptar una hipótesis nula
cuando es falsa) significa arriesgarse a que todo un grupo de
consumidores de este compuesto químico se envenenen.
Evidentemente, la administración de esta compañía preferiría el error
tipo I sobre el error tipo II y, como resultado, establecerá niveles de
significación (α) muy altos en sus pruebas para obtener el error tipo II
(β) bajo.
 Suponga, por otra parte, que cometer un error tipo I implica desarmar
todo un motor en la fábrica, pero cometer un error tipo II implica que
los distribuidores de automóviles realicen reparaciones de garantía
relativamente baratas. Entonces, es más probable que el fabricante
prefiera el error tipo II y que establezca menores niveles de
significación en sus pruebas.
Error tipo I y error Tipo II
 Al probar cualquier hipótesis estadística, hay cuatro
situaciones posibles que determinan si nuestra
decisión es correcta o incorrecta, debido a que la
prueba de hipótesis se sustenta en una muestra
aleatoria. Estas cuatro situaciones se resumen en la
tabla siguiente:
Situaciones posibles al probar una hipótesis estadística
H0 es verdadera H0 es falsa
Aceptar H0 Decisión correcta Error tipo II
Rechazar H0 Error tipo I Decisión correcta
Análisis de los errores y aciertos en las pruebas de hipótesis

 La probabilidad condicional y el teorema del límite central, permitirá


analizar estadísticamente los errores tipo I y tipo II, y las decisiones
correctas. Los diferentes resultados de la tabla anterior se pueden
expresar en términos de la probabilidad condicional :

P(rechazar Ho / Ho es verdadera ) = P(error tipo I) = α


P(aceptar H0 / H o es verdadera) = 1 – α (Decisión correcta)
P(aceptar Ho / Ho es falsa ) = P(error tipo II) = β
P(rechazar Ho / Ho es falsa ) = 1- β (Decisión correcta)
Tipos de errores en las pruebas de
hipótesis
Pasos a seguir en una prueba de hipótesis
 1. Definir las hipótesis H0 y H1
 2. Establecer los supuestos de la prueba
La población se distribuye normalmente
La muestra fue tomada de forma aleatoria
 3. Especificar el estadístico de prueba
 4. Determinar la región crítica
 5. Calcular el estadístico usando la muestra
 6. Comparar el valor calculado en (5) con el valor
calculado en (4)
 7. Emitir conclusiones
Reglas de Decisión
 Las pruebas de hipótesis pueden ser de una o dos
colas, esto depende del objetivo de la investigación, lo
que genera un planteamiento de las hipótesis nula y
alternativa como pruebas de una o dos colas.
 Para todas las posibles decisiones se compara zc, tc, χ2
 ó fc con el valor crítico calculado en base al nivel de
significación de la prueba y el tamaño de la muestra.
 A continuación las diferentes reglas de decisión que se
pueden presentar en una prueba de hipótesis. ( Se
pueden apreciar en la siguiente diapositiva).
Gráfica de distribución Gráfica de distribución
Normal, Media=100, Desv.Est.=5 Normal, Media=100, Desv.Est.=5
0.09 0.09
0.08 0.08

0.07 0.07

0.06 0.06
Densidad

Densidad
0.05 0.05

0.04 0.04

0.03 0.03

0.02 0.02

0.01 0.01
0.025 0.025 0.025 0.025
0.00 0.00
90.2 100 110 90.2 100 110
-zα/2 X zα/2 -tα/2 X tα/2

Gráfica de distribución
Normal, Media=100, Desv.Est.=5
Gráfica de distribución
0.09 Normal, Media=100, Desv.Est.=5

0.08 0.09

0.08
0.07
0.07
0.06
0.06
Densidad

0.05

Densidad
0.05
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.05 0.01
0.05
0.00 0.00
100 108
X zα -zα
91.8 100
X

Gráfica de distribución
Normal, Media=100, Desv.Est.=5
Gráfica de distribución
Normal, Media=100, Desv.Est.=5
0.09
0.09
0.08
0.08
0.07 0.07
0.06 0.06
Densidad

Densidad

0.05 0.05
0.04 0.04

0.03 0.03

0.02 0.02

0.01
tα -tα
0.05 0.01
0.05
0.00 0.00
100 108 91.8 100
X X
Tipos de Pruebas de Hipótesis
Para cualquier parámetro de la población podemos realizar pruebas de
hipótesis que nos permitan probar un supuesto sobre el parámetro, así
tenemos:

 Prueba de hipótesis para la media de la población ( muestras grandes y


pequeñas)
Prueba de hipótesis para la diferencia de medias (muestras grandes,
desviación estándar conocida y desconocida)
Prueba de hipótesis para la diferencia de medias (muestras pequeñas,
desviación estándar conocida)
Prueba de hipótesis para la diferencia de medias (muestras pequeñas,
desviación estándar desconocida)
Prueba de hipótesis para la proporción de la población (muestras grandes)
Prueba de hipótesis para la diferencia de dos proporciones (muestras
grandes)
Prueba de hipótesis para la varianza de la población
Prueba de hipótesis para la razón entre dos varianzas
Ejemplos de Aplicación
 Prueba de hipótesis de la media de la población. (Muestras grandes)
1. Una compañía farmacéutica afirma que la potencia media de uno de sus antibióticos es
80%. Se somete a prueba una muestra aleatoria de 100 cápsulas y se obtiene una media
muestral de y = 79.7%, con una desviación estándar S = 0.8% ¿Presentan los datos
suficiente evidencia para refutar la afirmación de la compañía ? Use α = 0.05

 Solución:
 1. Ho : μ = 80
 H1: μ ≠ 80

 2. La población se distribuye normalmente


 La muestra se selecciona aleatoriamente
 3. Estadístico de prueba zα/2

 4. zα/2 = ± 1.96

 5.

1. 6. zc < - zα/2, - 3. 75 < 1.96. Se rechaza Ho y se concluye que la potencia del antibiótico no es 80%, a
un nivel de significación del 5%.
Problemas de Aplicación

• Una muestra aleatoria de 100 muertes


registradas el año pasado muestra una vida
promedio de 71.8 años. Suponga una
desviación estándar poblacional de 8.9 años,
¿esto parece indicar que la vida media hoy
en día es mayor que 70 años? Utilice un
nivel de significancia de 0.05.
Problemas de Aplicación
 1. Los salarios diarios en una industria particular tienen una distribución normal con media 23.2 dólares y desviación estándar de 4.5
dólares. Si una compañía en esta industria que emplea 40 trabajadores les paga en promedio $21.20 ¿Puede ser acusada esta
compañía de pagar salarios inferiores a un nivel de significación del 1% ? (Prueba de hipótesis para la media de la población.
Muestras Grandes)
 2. Se mide el contenido disuelto de oxigeno en el agua de un río para determinar si la corriente posee suficiente oxigeno para sostener la
vida acuática. Un inspector de contaminación sospecha que cierta comunidad está descargando desperdicios semitratados en el río.
Para verificar su teoría, obtuvo cinco muestras de agua del río seleccionadas al azar en una ubicación anterior a la ciudad y otras cinco
en una ubicación posterior a la ciudad. Las cantidades disueltas de oxígeno, en partes por millón, fueron: Use α = 0.05
 Antes de la ciudad 4.8 5.2 5.0 4.9 5.1 ¿Proporcionan los datos suficiente evidencia para concluir que el contenido
 Posterior a la ciudad 5.0 4.7 4.9 4.8 4.9 medio de oxígeno en las ubicaciones que están después de la ciudad es
menor que el de las ubicaciones que están antes de la ciudad?
 (Prueba de hipótesis para la diferencia de medias de dos poblaciones. Muestras Pequeñas)
 3. Suponga que se desea determinar si el contenido promedio de azúcar de los jugos de melocotón marca I es igual al de los jugos de
melocotón marca II . Con la finalidad de probar esta hipótesis , se seleccionan aleatoriamente dos muestras de 35 jugos de las dos
marcas y se obtienen dos medias muestrales x 1 = 0.8 mg y x2 = 1.0 mg. Se sabe que las varianzas de la población de los dos jugos
son 0.36 y 0.64 respectivamente. Determine si las dos marcas de jugos tienen la misma media. Use α = 0.05. ( Prueba de hipótesis
para la diferencia de medias de dos poblaciones. Muestras Grandes )
 4. Una operación de ensamblaje de una planta requiere que un empleado nuevo se someta a un período de entrenamiento de
aproximadamente un mes para alcanzar su máxima eficacia. Se sugirió un nuevo método de entrenamiento y se llevó cabo una prueba
para comparar el método nuevo con el procedimiento estándar. Dos grupos de 9 empleados nuevos se entrenaron durante un período
de 3 semanas, un grupo usando el nuevo método y el otro siguiendo el procedimiento estándar. Al final del período de 3 semanas se
observó el tiempo en minutos que le tomó a cada empleado ensamblar un dispositivo. ¿Presentan los datos suficiente evidencia que
indique que el tiempo medio de ensamblaje al final del período de entrenamiento de 3 semanas es menor para el nuevo método? Use α
= 0.05 (Prueba de hipótesis para la diferencia de medias de dos poblaciones. Muestras pequeñas)
 Procedimiento estándar Procedimiento Nuevo
 32 35 35 27
 37 31 31 32
 35 34 29 31
 28 25
 41 34
 44 40
Problemas de aplicación (continuación)
 5. Se tomará el voto entre los residentes de una ciudad y el condado circundante para determinar si se debe construir una
planta química propuesta. El lugar de construcción está dentro de los límites de la ciudad y por esta razón muchos votantes
del condado consideran que la propuesta pasará debido a la gran proporción de votantes que favorecen la construcción.
Para determinar si hay una diferencia significativa en la proporción de votantes de la ciudad y votantes del condado que
favorecen la propuesta, se realiza una encuesta. Si 120 de 200 votantes de la ciudad favorecen la propuesta y 240 de 500
residentes del condado también lo hacen, ¿estaría de acuerdo en que la proporción de votantes de la ciudad que favorecen
la propuesta es más alto que la proporción de votantes del condado? Use un nivel de significación de 0.025. (Prueba de
hipótesis de la diferencia de proporciones. Muestras Grandes)
 6. Se lleva a cabo un estudio para comparar el tiempo entre hombres y mujeres para ensamblar cierto producto.
Experiencias pasadas indican que la distribución de los tiempos para hombres y mujeres es aproximadamente normal pero
que la varianza de los tiempos para las mujeres es menor que para los hombres. Una muestra aleatoria de tiempos para 11
hombres y 14 mujeres produce los siguientes datos:
 Hombres Mujeres
 n1 = 11 n2 = 14
 S1 = 6.1 S2 = 5.3
 Pruebe la hipótesis de que σ 1 = σ2 a un nivel de significación de 0.01 (Prueba de hipótesis de la razón entre dos
2 2

varianzas)
 7. Un fabricante de baterías para autos afirma que la duración de sus baterías se distribuye de forma aproximadamente
normal con una desviación estándar igual a 0.9 años. Si una muestra aleatoria de 10 tales baterías tiene una desviación
estándar de 1.2 años, ¿considera que σ > 0.9 años? Utilice un nivel de significación de 0.05. (Prueba de hipótesis de la
varianza de una población)
 8. Una medicina que se prescribe comúnmente para aliviar la tensión nerviosa se considera que es efectiva en 60%.
Resultados experimentales con una nueva medicina que se administra a una muestra aleatoria de 100 adultos que padecen
de tensión nerviosa muestran que 70 tuvieron alivio. ¿Esta es evidencia suficiente para concluir que la nueva medicina es
superior a la que se prescribe actualmente? Use un nivel de significación de 0.05 (Prueba de hipótesis de la
proporción de una población)

Das könnte Ihnen auch gefallen