Sie sind auf Seite 1von 22

República Bolivariana De Venezuela

Ministerio Del Poder Popular Para La Educación Superior

Instituto Universitario Politécnico

“Santiago Mariño”

Extensión Barcelona

Escuela de Ingeniería Industrial

HIPÓTESIS

Profesor: Pedro Beltrán Bachiller: Cornivel María, 23.734.548

Estadística II

Sección: S1

Barcelona, Agosto De 2019


Introducción:

Tenemos que empezar por definir que es una hipótesis y que es prueba de
hipótesis.

Hipótesis es una aseveración de una población elaborado con el propósito


de poner a prueba, para verificar si la afirmación es razonable se usan datos.

En el análisis estadístico se hace una aseveración, es decir, se plantea una


hipótesis, después se hacen las pruebas para verificar la aseveración o para
determinar que no es verdadera.

Por tanto, la prueba de hipótesis es un procedimiento basado en la


evidencia muestral y la teoría de probabilidad; se emplea para determinar si la
hipótesis es una afirmación razonable.

Prueba de una hipótesis: se realiza mediante un procedimiento sistemático


de cinco paso:

Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o


no rechazar la hipótesis, pero debemos de tener cuidado con esta determinación
ya que en la consideración de estadística no proporciona evidencia de que algo
sea verdadero. Esta prueba aporta una clase de prueba más allá de una duda
razonable. Analizaremos cada paso en detalle.

El propósito de la prueba de hipótesis no es cuestionar el valor calculado


del estadístico (muestral), sino hacer un juicio con respecto a la diferencia entre
estadístico de muestra y un valor planteado del parámetro.
Desarrollo:

Error tipo I y error tipo II: ¿qué son?

El error tipo I y error tipo II son tipos de errores que podemos cometer
cuando en una investigación estamos ante la formulación de hipótesis estadísticas
(como la hipótesis nula o H0 y la hipótesis alternativa o H1). Es decir, cuando
estamos realizando pruebas de hipótesis. Pero para entender estos conceptos,
primero debemos contextualizar su uso en la estimación por intervalos.

Como hemos visto, la estimación por intervalos se basa en una región


crítica a partir del parámetro de la hipótesis nula (H0) que planteamos, así como
en el intervalo de confianza a partir del estimador de la muestra.

Es decir, el objetivo es establecer un intervalo matemático donde caería el


parámetro que queremos estudiar. Para ello, se deben realizar una serie de pasos.

1. Formulación de hipótesis

El primer paso es formular la hipótesis nula y la hipótesis alternativa, lo que,


como veremos, nos llevará a los conceptos de error tipo I y error tipo II.

1.1. Hipótesis nula (H0)

La hipótesis nula (H0) es la hipótesis que plantea el investigador, y que


provisionalmente acepta como verdadera. Solo puede rechazarla mediante un
proceso de falsación o refutación.

Normalmente, lo que se hace es plantear la ausencia de efecto o la


ausencia de diferencias (por ejemplo, sería afirmar que: “No hay diferencias entre
la terapia cognitiva y la terapia de conducta en el tratamiento de la ansiedad”).

1.2. Hipótesis alternativa (H1)

La hipótesis alternativa (H1), en cambio, es la aspirante a suplantar o


reemplazar la hipótesis nula. Esta suele plantear que existen diferencias o efecto
(por ejemplo, “Existen diferencias entre la terapia cognitiva y la terapia de
conducta en el tratamiento de la ansiedad”).

2. Determinación del nivel de significación o alfa (α)

El segundo paso dentro de la estimación por intervalos es determinar el


nivel de significación o el nivel alfa (α). Este lo fija el investigador al inicio del
proceso; se trata de la probabilidad máxima de error que aceptamos cometer al
rechazar la hipótesis nula.
Suele tomar valores pequeños, tales como 0.001, 0,01 o 0,05. Es decir,
sería el “tope” o error máximo que estamos dispuestos a cometer como
investigadores. Cuando el nivel de significación vale 0,05 (5%), por ejemplo, el
nivel de confianza es de 0.95 (95%), y los dos suman 1 (100%).

Una vez establecemos el nivel de significación, pueden ocurrir cuatro


situaciones: que se produzcan dos tipos de errores (y aquí es donde entran el
error tipo I y error tipo II), o bien que se produzcan dos tipos de decisiones
correctas. Es decir, las cuatro posibilidades son:

2.1. Decisión correcta (1-α)

Consiste en aceptar la hipótesis nula (H0) siendo esta verdadera. Es decir,


no la rechazamos, la mantenemos, porque es cierta. Matemáticamente se
calcularía de la siguiente forma: 1-α (donde α es el error tipo I o nivel de
significación).

2.2. Decisión correcta (1-β)

En este caso, también tomamos una decisión correcta; consiste en rechazar


la hipótesis nula (H0) siendo esta falsa. También se llama potencia de la prueba.
Se calcula: 1-β (donde β es el error tipo II).

2.3. Error tipo I (α)

El error tipo I, también llamado alfa (α), se comete al rechazar la hipótesis


nula (H0) siendo esta verdadera. Así, la probabilidad de cometer un error de tipo I
es α, que es el nivel de significación que hemos establecido para nuestra prueba
de hipótesis.

Si por ejemplo el α que habíamos establecido es de 0.05, esto indicaría que


estamos dispuestos a aceptar una probabilidad del 5% de equivocarnos al
rechazar la hipótesis nula.

2.4. Error tipo II (β)

El error tipo II o beta (β), se comete al aceptar la hipótesis nula (H0) siendo
esta falsa. Es decir, la probabilidad de cometer un error tipo II es beta (β), y
depende de la potencia de la prueba (1-β).

Para reducir el riesgo de cometer un error tipo II, podemos optar por
asegurarnos de que la prueba tiene suficiente potencia. Para ello, deberemos
asegurarnos de que el tamaño de la muestra es lo suficientemente grande como
para detectar una diferencia cuando ésta realmente exista.

Ejemplo:

Se ha comprobado que el tiempo de espera (en minutos) hasta ser


atendido, en cierto servicio de urgencias, sigue un modelo normal de probabilidad.

A partir de una muestra de 100 personas que fueron atendidas en dicho


servicio, se ha calculado un tiempo medio de espera de 14,25 minutos y una
desviación típica de 2,5 minutos.

¿Podríamos afirmar, con un nivel de significación del 5 % que el tiempo medio de


espera, en este servicio de urgencias, no es de 15 minutos?

1. Se formula la hipótesis nula H0 y la hipótesis alternativa H1.

Hipótesis nula: H0 : μ = 15

Hipótesis alternativa: H1 : μ ≠ 15

Puesto que nuestra hipótesis nula está formulada en forma de igualdad, tenemos
un contraste bilateral.

2. Identificamos la distribución de probabilidad y el tamaño de la muestra.

Por el enunciado sabemos que la población sigue una distribución normal.


Tomamos una muestra de tamaño n = 100 con una media μ = 14,25 y desviación
típica σ = 2,5. La muestra se distribuye:

3. Construimos las regiones de aceptación y rechazo.

Construimos nuestra región de aceptación a partir de un nivel de significación α =


0,05. Como es un contraste bilateral, emplearemos zα/2 :
4. Calcular el estadístico de contraste y verificar la hipótesis.

Nuestro estadístico de contraste es el tiempo de media de espera en urgencias, μ


= 14,25.

En este caso, 14,25 ∉ ( 14,51 ; 15,49 ).

Nuestro estadístico de contraste no pertenece a la región de aceptación.

5. Interpretación de la decisión.

Como nuestro estadístico de contraste no pertenece a la región de aceptación,


rechazamos la hipótesis nula.

Por lo tanto, no podemos afirmar que el tiempo medio de espera sea de 15


minutos.

Hemos rechazado la hipótesis nula por no poder afirmar que el tiempo medio de
espera sea de 15 minutos, pero podemos estar equivocados. De ser así,
estaríamos cometiendo un error de tipo I.

Si la muestra seleccionada hubiera tenido un tiempo medio de espera de 14,52


minutos (apenas 16 segundos más) hubiéramos aceptado la hipótesis nula. En
caso de equivocación, estaríamos cometiendo un error de tipo II.

Niveles de Significación:

Al contrastar una cierta hipótesis, la máxima probabilidad con la que


estamos dispuesto a correr el riesgo de cometerán error de tipo I, se llama nivel de
significación.

Esta probabilidad, denota a menudo por ser, suele especificar antes de


tomar la muestra, de manera que los resultados obtenidos no influyan en nuestra
elección.

En la práctica, es frecuente un nivel de significación de 0,05 ó 0,01, si bien


se une otros valores. Si por ejemplo se escoge el nivel de significación 0,05 (ó 5%)
al diseñar una regla de decisión, entonces hay unas cinco (05) oportunidades
entre 100 de rechazar la hipótesis cuando debiera haberse aceptado; Es decir,
tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal
caso decimos que la hipótesis ha sido rechazada al nivel de significación 0,05, lo
cual quiere decir que tal hipótesis tiene una probabilidad 0,05 de ser falsa.
¿Cuál es la diferencia entre una prueba de dos colas (bilateral) y de una cola
(unilateral)?

Una prueba estadística se basa en dos hipótesis competitivas: la hipótesis


nula H0 y la hipótesis alternativa Ha.

El tipo de hipótesis alternativa Ha define si una prueba es de una cola


(unilateral) o de dos colas (bilateral).

Pruebas bilaterales o de dos colas

Una prueba de dos colas se asocia a una hipótesis alternativa para la cual
se desconoce el signo de la potencial diferencia. Por ejemplo, supongamos que
deseamos comparar las medias de dos muestras A y B. Antes de diseñar el
experimento y ejecutar la prueba, esperamos que si se resalta una diferencia entre
las dos medias, realmente no saabemos si A debería ser superior a B o a la
inversa. Esto nos lleva a elegir una prueba de dos colas, asociada a la siguiente
hipótesis alternativa: Ha: media(A) ≠ media(B). Las pruebas de dos colas son con
diferencia las más utilizadas.

Pruebas unilaterales o de una cola

Una prueba de una cola normalmente está asociada a una hipótesis


alternativa para la cual se conoce el signo de la potencial diferencia antes de
ejecutar el experimento y la prueba. En el ejemplo descrito más arriba, la hipótesis
alternativa referida a una prueba de una cola podría redactarse así: media(A) <
media(B) o media(A) > media(B), dependiendo de la dirección esperada de la
diferencia.
Ejercicios:

1) Una encuesta, realizada a 64 empleados de una fábrica, concluyó que el


tiempo medio de duración de un empleo en la misma era de 6,5 años, con
una desviación típica de 4.
¿Sirve esta información para aceptar, con un nivel de significación del 5 %,
que el tiempo medio de empleo en esta fábrica es menor o igual que 6?
Solución:
2) La duración de las bombillas de 100 vatios que fabrica una empresa sigue
una distribución normal con una desviación típica de 120 horas. Su vida
media está garantizada durante un mínimo de 800 horas.
Se escoge al azar una muestra de 50 bombillas de un lote y, después de
comprobarlas, se obtiene una media de 750 horas.

Con un nivel de significación de 0,01, ¿habría que rechazar el lote por no


cumplir la garantía?

Solución:
3) Un laboratorio afirma que un calmante quita la jaqueca en 14 minutos en los
casos corrientes. Con el fin de comprobar esta información, se eligen al azar 30
pacientes con jaqueca y se toma como variable en el experimento el tiempo que
transcurre entre la administración del calmante y el momento en que desaparece
la jaqueca. Los resultados obtenidos en esta muestra fueron, media 17 minutos y
desviación típica 7 minutos. ¿Podemos admitir como cierta la afirmación del
laboratorio a un nivel de confianza del 95 % ?
4) En los últimos meses, una cadena comercial ha intentado potenciar con precios
más atractivos y publicidad la venta de productos con la marca genérica de la
cadena, frente a los de otras marcas más conocidas por los consumidores. Antes,
un 15 % de los productos que vendía eran de la marca de la cadena.
Recientemente, en una muestra de 200 productos vendidos, 36 eran de dicha
marca.
Plantea un test para contrastar que las medidas no han surtido efecto frente a que
sí lo han hecho, como parecen indicar los datos. ¿A qué conclusión se llega con
una significación del 10 %?
5) De una muestra aleatoria de 225 habitantes de una población, hay 18 que
hablan alemán. A un nivel de significación de 0,05, ¿hay suficiente evidencia para
refutar la afirmación de que al menos el 10 % de los habitantes de la población
hablan alemán?
6) Se afirma que, en una determinada ciudad, al menos el 30 % de las
familias poseen ordenador. Se toma una muestra aleatoria de 200 familias
de la ciudad y resulta que 50 poseen ordenador. A un nivel de significación
de 0,05, ¿hay suficiente evidencia para refutar la afirmación?
7) En el año 2005, un estudio indicaba que un 15 % de los conductores utilizaban
el móvil con el vehículo en marcha.
Con el fin de investigar la efectividad de las campañas que se han realizado desde
entonces para reducir esos hábitos, se ha hecho una encuesta a 120
conductores de los cuales 12 hacían un uso indebido del móvil.
Plantea un test para contrastar que las campañas no han cumplido su objetivo
frente a que sí lo han hecho, como parecen indicar los datos.
¿A qué conclusión se llega con un nivel de significación del 4 % ?
8) Hace 10 años, se hizo un amplio estudio y se concluyó que, como máximo, el 40
% de los estudiantes universitarios eran fumadores. Para ver si actualmente se
mantienen las mismas conclusiones, se tomó una muestra de 78 estudiantes
entre los que 38 eran fumadores.
Con un nivel de significación del 10 %, ¿se acepta que el porcentaje de
fumadores entre los universitarios es menor o igual que el 40% ?
9) Para tomar una importante decisión a nivel profesional se desea determinar si
existen diferencias significativas fundamentadas entre dos empresas referentes al
salario de sus empleados. Se realiza una investigación revisando el salario de 60
trabajadores de la empresa A y 70 de la empresa B. Se obtiene un salario
medio de 30000 euros anuales con una desviación típica de 1000 euros en el
primer grupo y un salario medio de 25000 euros anuales con una desviación
típica de 1500 en el segundo grupo. ¿Podríamos decidir a favor de alguna de las
dos empresas con un nivel de significación del 1 % ?
10) Para la ubicación de una nueva biblioteca en una pequeña ciudad, se decide
comparar el número medio de libros prestados por socio en dos bibliotecas de dos
barrios diferentes, uno situado en el centro de la ciudad y otro en el extrarradio. Se
seleccionan al azar 1000 socios de cada uno de ellas y se obtienen los siguientes
datos: número medio de libros anuales en barrio céntrico, 10 con varianza 4,2 ;
número medio de libros anuales en barrio extrarradio, 12,3 con varianza 5,1.
¿Hay suficiente evidencia para poder deducir con un nivel de significación de 0,05
que la biblioteca debe ser construida en el centro de la ciudad?
11) Se quieren probar dos tipos de alimentos para los 75 pingüinos de un zoológico
cuyo peso se distribuye normalmente. Se separan en dos grupos, uno formado por
40 pingüinos y otro por 35. Al cabo de un mes son pesados, y se obtiene para el
primer grupo un peso medio de 13 kg y desviación típica de 0,7 y para el
segundo grupo, un peso medio de 11 kg y desviación típica 0,3.
¿Se puede afirmar, con el nivel de confianza del 99 %, que están mejor
alimentados los del primer grupo que los del segundo?
12) Se sabe que la duración de una enfermedad sigue una distribución normal. Para la
curación de dicha enfermedad se aplica un determinado antibiótico. Se desea
comparar la duración de la enfermedad según que al enfermo se le haya aplicado
o no en otra ocasión dicho antibiótico. Observamos a 36 enfermos a los que no
se había aplicado anteriormente el antibiótico y la duración media de la
enfermedad ha sido de 12 días, y a 35 enfermos a los que sí se había aplicado
y que han permanecido enfermos 15 días. La desviación típica en ambos casos
es de 4 días.
¿Qué podemos afirmar acerca de la duración de la enfermedad para un nivel de
significación del 1 % ?
13) Un laboratorio farmacéutico fabrica dos tipos de somníferos, A y B. Se toman
dos grupos similares de enfermos de insomnio formados por 75 y 90 individuos,
respectivamente, y se suministra a los del primer grupo el somnífero A y a los del
segundo grupo, el B. El número medio de horas de sueño para los enfermos del
primer grupo es 7,93 con desviación típica de 0,77 y para los del segundo grupo
es de 7,12 y 1,89 respectivamente.
A un nivel de significación del 15 %, ¿se puede decir que la diferencia entre los
números de horas de sueño es significativa?
Conclusión:
Una vez que se creó una hipótesis, el proceso de prueba de la
hipótesis se vuelve importante. Para ser más exactos, debes tener dos
hipótesis: la alternativa y la nula.

Para la prueba, analizarás y compararás tus resultados con la


hipótesis nula. Por eso, tu investigación debe ser diseñada teniendo esto en
mente. Es muy importante que la investigación que diseñes produzca
resultados que sean analizables mediante pruebas estadísticas.

La mayoría de la gente le tiene mucho miedo a las estadísticas por


los símbolos matemáticos oscuros. También se preocupa por no entender
los procesos o estropear los experimentos. Realmente no hay necesidad de
tener miedo.

La mayoría de los científicos entiende únicamente los principios


básicos de la estadística. Por eso, una vez que los entiendes, la tecnología
informática moderna brinda toda una serie de software para la prueba de la
hipótesis.

Para diseñar tu investigación sólo necesitas una comprensión básica


de las mejores prácticas para la selección de muestras, el aislamiento de
las variables verificables y la asignación de grupos al azar.

Das könnte Ihnen auch gefallen