Beruflich Dokumente
Kultur Dokumente
“Santiago Mariño”
Extensión Barcelona
HIPÓTESIS
Estadística II
Sección: S1
Tenemos que empezar por definir que es una hipótesis y que es prueba de
hipótesis.
El error tipo I y error tipo II son tipos de errores que podemos cometer
cuando en una investigación estamos ante la formulación de hipótesis estadísticas
(como la hipótesis nula o H0 y la hipótesis alternativa o H1). Es decir, cuando
estamos realizando pruebas de hipótesis. Pero para entender estos conceptos,
primero debemos contextualizar su uso en la estimación por intervalos.
1. Formulación de hipótesis
El error tipo II o beta (β), se comete al aceptar la hipótesis nula (H0) siendo
esta falsa. Es decir, la probabilidad de cometer un error tipo II es beta (β), y
depende de la potencia de la prueba (1-β).
Para reducir el riesgo de cometer un error tipo II, podemos optar por
asegurarnos de que la prueba tiene suficiente potencia. Para ello, deberemos
asegurarnos de que el tamaño de la muestra es lo suficientemente grande como
para detectar una diferencia cuando ésta realmente exista.
Ejemplo:
Hipótesis nula: H0 : μ = 15
Hipótesis alternativa: H1 : μ ≠ 15
Puesto que nuestra hipótesis nula está formulada en forma de igualdad, tenemos
un contraste bilateral.
5. Interpretación de la decisión.
Hemos rechazado la hipótesis nula por no poder afirmar que el tiempo medio de
espera sea de 15 minutos, pero podemos estar equivocados. De ser así,
estaríamos cometiendo un error de tipo I.
Niveles de Significación:
Una prueba de dos colas se asocia a una hipótesis alternativa para la cual
se desconoce el signo de la potencial diferencia. Por ejemplo, supongamos que
deseamos comparar las medias de dos muestras A y B. Antes de diseñar el
experimento y ejecutar la prueba, esperamos que si se resalta una diferencia entre
las dos medias, realmente no saabemos si A debería ser superior a B o a la
inversa. Esto nos lleva a elegir una prueba de dos colas, asociada a la siguiente
hipótesis alternativa: Ha: media(A) ≠ media(B). Las pruebas de dos colas son con
diferencia las más utilizadas.
Solución:
3) Un laboratorio afirma que un calmante quita la jaqueca en 14 minutos en los
casos corrientes. Con el fin de comprobar esta información, se eligen al azar 30
pacientes con jaqueca y se toma como variable en el experimento el tiempo que
transcurre entre la administración del calmante y el momento en que desaparece
la jaqueca. Los resultados obtenidos en esta muestra fueron, media 17 minutos y
desviación típica 7 minutos. ¿Podemos admitir como cierta la afirmación del
laboratorio a un nivel de confianza del 95 % ?
4) En los últimos meses, una cadena comercial ha intentado potenciar con precios
más atractivos y publicidad la venta de productos con la marca genérica de la
cadena, frente a los de otras marcas más conocidas por los consumidores. Antes,
un 15 % de los productos que vendía eran de la marca de la cadena.
Recientemente, en una muestra de 200 productos vendidos, 36 eran de dicha
marca.
Plantea un test para contrastar que las medidas no han surtido efecto frente a que
sí lo han hecho, como parecen indicar los datos. ¿A qué conclusión se llega con
una significación del 10 %?
5) De una muestra aleatoria de 225 habitantes de una población, hay 18 que
hablan alemán. A un nivel de significación de 0,05, ¿hay suficiente evidencia para
refutar la afirmación de que al menos el 10 % de los habitantes de la población
hablan alemán?
6) Se afirma que, en una determinada ciudad, al menos el 30 % de las
familias poseen ordenador. Se toma una muestra aleatoria de 200 familias
de la ciudad y resulta que 50 poseen ordenador. A un nivel de significación
de 0,05, ¿hay suficiente evidencia para refutar la afirmación?
7) En el año 2005, un estudio indicaba que un 15 % de los conductores utilizaban
el móvil con el vehículo en marcha.
Con el fin de investigar la efectividad de las campañas que se han realizado desde
entonces para reducir esos hábitos, se ha hecho una encuesta a 120
conductores de los cuales 12 hacían un uso indebido del móvil.
Plantea un test para contrastar que las campañas no han cumplido su objetivo
frente a que sí lo han hecho, como parecen indicar los datos.
¿A qué conclusión se llega con un nivel de significación del 4 % ?
8) Hace 10 años, se hizo un amplio estudio y se concluyó que, como máximo, el 40
% de los estudiantes universitarios eran fumadores. Para ver si actualmente se
mantienen las mismas conclusiones, se tomó una muestra de 78 estudiantes
entre los que 38 eran fumadores.
Con un nivel de significación del 10 %, ¿se acepta que el porcentaje de
fumadores entre los universitarios es menor o igual que el 40% ?
9) Para tomar una importante decisión a nivel profesional se desea determinar si
existen diferencias significativas fundamentadas entre dos empresas referentes al
salario de sus empleados. Se realiza una investigación revisando el salario de 60
trabajadores de la empresa A y 70 de la empresa B. Se obtiene un salario
medio de 30000 euros anuales con una desviación típica de 1000 euros en el
primer grupo y un salario medio de 25000 euros anuales con una desviación
típica de 1500 en el segundo grupo. ¿Podríamos decidir a favor de alguna de las
dos empresas con un nivel de significación del 1 % ?
10) Para la ubicación de una nueva biblioteca en una pequeña ciudad, se decide
comparar el número medio de libros prestados por socio en dos bibliotecas de dos
barrios diferentes, uno situado en el centro de la ciudad y otro en el extrarradio. Se
seleccionan al azar 1000 socios de cada uno de ellas y se obtienen los siguientes
datos: número medio de libros anuales en barrio céntrico, 10 con varianza 4,2 ;
número medio de libros anuales en barrio extrarradio, 12,3 con varianza 5,1.
¿Hay suficiente evidencia para poder deducir con un nivel de significación de 0,05
que la biblioteca debe ser construida en el centro de la ciudad?
11) Se quieren probar dos tipos de alimentos para los 75 pingüinos de un zoológico
cuyo peso se distribuye normalmente. Se separan en dos grupos, uno formado por
40 pingüinos y otro por 35. Al cabo de un mes son pesados, y se obtiene para el
primer grupo un peso medio de 13 kg y desviación típica de 0,7 y para el
segundo grupo, un peso medio de 11 kg y desviación típica 0,3.
¿Se puede afirmar, con el nivel de confianza del 99 %, que están mejor
alimentados los del primer grupo que los del segundo?
12) Se sabe que la duración de una enfermedad sigue una distribución normal. Para la
curación de dicha enfermedad se aplica un determinado antibiótico. Se desea
comparar la duración de la enfermedad según que al enfermo se le haya aplicado
o no en otra ocasión dicho antibiótico. Observamos a 36 enfermos a los que no
se había aplicado anteriormente el antibiótico y la duración media de la
enfermedad ha sido de 12 días, y a 35 enfermos a los que sí se había aplicado
y que han permanecido enfermos 15 días. La desviación típica en ambos casos
es de 4 días.
¿Qué podemos afirmar acerca de la duración de la enfermedad para un nivel de
significación del 1 % ?
13) Un laboratorio farmacéutico fabrica dos tipos de somníferos, A y B. Se toman
dos grupos similares de enfermos de insomnio formados por 75 y 90 individuos,
respectivamente, y se suministra a los del primer grupo el somnífero A y a los del
segundo grupo, el B. El número medio de horas de sueño para los enfermos del
primer grupo es 7,93 con desviación típica de 0,77 y para los del segundo grupo
es de 7,12 y 1,89 respectivamente.
A un nivel de significación del 15 %, ¿se puede decir que la diferencia entre los
números de horas de sueño es significativa?
Conclusión:
Una vez que se creó una hipótesis, el proceso de prueba de la
hipótesis se vuelve importante. Para ser más exactos, debes tener dos
hipótesis: la alternativa y la nula.