Sie sind auf Seite 1von 20

Trabajo individual de prueba de hipótesis.

1º se debe haber estudiado “Llave Maestra


para IConf y Contrastes de Hipótesis”
Tomado del de 24Mar10. 01Feb11. 16Maer15.
Buscar o construir dos problemas que se deban resolver con contrastes de hipótesis:
- Redactar o escribir el problema Prof. Miguel Ángel Abreu H. Marzo 10. 1/
- Establece la contrastación de hipótesis
- Se debe calcular, como pasos intermedios “la estimación de la desviación estándar de Xbarra
en caso de que  sea desconocida” y de debe calcular “el error máximo de estimación”. Es
suficiente la llave maestra para obtener las cuatro formas con  conocida o desconocida.
(Ver archivo: “Llave Maestra para IConf y Contrastes de Hipótesis”).
- Probar la hipótesis: - sobre el eje Xbarra; - sobre el eje Z; por medio del valor p y - mediante
el intervalo de confianza. (Se debe incluir la “Gráfica Integradora”).
Se puede adaptar un problema de libro de texto pero dando la referencia bibliográfica. Sin
embargo trate de ser creativo e indique si el problema es de su autoría. Piense en un problema
relacionado con la licenciatura que estudia o de la empresa en que usted trabaja o donde trabaja
un amigo o un familiar o un problema social, etc..
Un problema debe ser bilateral y el otro unilateral.
En un problema se supone  conocida por lo cual se utiliza la distribución Z.
En el otro problema se supone  desconocida por lo cual se utiliza la distribución t de Student.
Deben de garantizar que X es aproximadamente normal.
Ambos problemas deben tener los n datos individuales. Si no tiene datos reales utilice el
simulador “Simulador datos Normal” de Excel.
Miércoles semana 11. Examen modelos de probabilidad para el mismo miércoles.
---
También el proyecto de equipo incluye la prueba de hipótesis sobre la variable continua de interés.
A continuación se dan dos ejemplos detallados de Prueba o Contraste de
Hipótesis:
☺PROBLEMA
Ejemplo 1. Se desea asegurar que un lote de zapatos fabricado corresponde a la medida del pie
del número 25. 25 centímetros. Para lo cual se toma una muestra aleatoria de 35 zapatos. El
estricto control que se tiene sobre la producción permite considerar una variabilidad para
cualquier lote de 2 centímetros. (Dar los 35 datos). La media obtenida de la muestra fue 24.85.
Especifique un  = 0.05.
| -- . --
El valor de  debe ser determinado al principio del estudio que incluye a la prueba de
hipótesis como un instrumento para la toma de decisiones. Debe ser determinado tanto
por aquellos que pueden ser beneficiados con el rechazo de la hipótesis nula como por
aquellos que pueden ser perjudicados o viceversa.
-- . -- |
☺PLANTEAMIENTO DEL CONTRASTE DE HIPÓTESIS
Definir la variable aleatoria X: longitud real de un zapato en centímetros.
El zapato debe medir, según el diseño 25 centímetros. Se permite algo de variabilidad. Por tal
motivo no se puede garantizar que cada zapato mida 25 centímetros pero si que la media
muestral esté alrededor de 25 centímetros – tampoco se garantiza que la media muestral sea de
25 centímetros pues también es una variable aleatoria. Se supone que la media poblacional es de
25 centímetros.
Otra manera de plantear el problema es que el fabricante asegura que sus zapatos especificados
como de 25 centímetros tienen una longitud real alrededor de dicho valor con un alta
probabilidad, en este caso especificada como 1 –  = 1 – 0.05 = 0.95.
Ho:  =  vs. Ha: 



Ho:  = 25 vs. Ha: 


CONTRASTE DE HIPÓTESIS:
Ho:  = 25 vs. Ha:  Prueba bilateral (dos colas).
¿ es conocida?
 es conocida puesto que se nos da como dato la variabilidad general y no particular de este lote
específico.
RESUMEN DE DATOS:
ó S = 2 centímetros. Xbarra = 24.85.  = 0.05. n = 35. . 1 –  = 1– 0.05 = 0.95.
(Si  es desconocida la estimamos por medio de S y verificamos si X es aproximadamente
normal y sólo entonces utilizamos el teorema de la t de Student).

☺DETERMINACIÓN DEL ESTADÍSTICO DE PRUEBA z o t (o ninguno de los dos)


Cómo sigma es conocida procedemos a utilizar el teorema central del límite, es decir, Xbarra
se comporta como una variable aleatoria normal con media  y desviación estándar /(n)^0.5. Es
decir, usamos “Llave Maestra para IConf y Contrastes de Hipótesis” (Ver archivo).
☺CÁLCULOS
Por tanto, la precisión (o error de estimación máximo va a estar dada por . zα / 2 σ
n
Observe que ambas cantidades las podemos calcular sin conocer aún la muestra ni la media
muestral x

zα / 2 . Se calcula con base en la siguiente situación Pr(Z  zα / 2 )  α / 2. Cómo  es pequeña


zα / 2  0. Pero se puede calcular z1 - α / 2 es tal que Pr(Z  z1 - α / 2 )  1- α / 2.
Pr(Z  z
α/2
)  α / 2. Pr(Z  z0.025  1.96)  0.025
Prof. Miguel Ángel Abreu H. Marzo 10. 2/

(Ver figura dela siguiente hoja)


σ 1

 

eje Z


zα / 2  1.96.  zα / 2  1.96.

Z 0.00 -0.01 -0.02 -0.03 -0.04 -0.05 -0.06 -0.07 -0.08 -0.09
... . . . . . . . . . . . . . . . . . . . . . . . . . . . ...
-1.8 0.035930 0.035148 0.034379 0.033625 0.032884 0.032157 0.031443 0.030742 0.030054 0.029379
-1.9 0.028716 0.028067 0.027429 0.026803 0.026190 0.025588 0.024998 0.024419 0.023852 0.023295
-2.0 0.022750 0.022216 0.021692 0.021178 0.020675 0.020182 0.019699 0.019226 0.018763 0.018309
... ... ... ... ... ... ... ... ... ... ...

z1 - α / 2 es tal que Pr(Z  z 1 - α / 2 )  1 - α / 2. z0.975 es tal que Pr(Z  z0.975  1.96)  0.975.

Prof. Miguel Ángel Abreu H. Marzo 10. 3/


σ 1

 

eje Z


 zα / 2  1.96.  zα / 2  1.96.

Z 0.00 -0.01 -0.02 -0.03 -0.04 -0.05 -0.06 -0.07 -0.08 -0.09
... . . . . . . . . . . . . . . . . . . . . . . . . . . . ...
1.8 0.964070 0.964852 0.965621 0.966375 0.967116 0.967843 0.968557 0.969258 0.969946 0.970621
1.9 0.971284 0.971933 0.972571 0.973197 0.973810 0.974412 0.975002 0.975581 0.976148 0.976705
2.0 0.977250 0.977784 0.978308 0.978822 0.979325 0.979818 0.980301 0.980774 0.981237 0.981691
... ... ... ... ... ... ... ... ... ... ...

Por tanto ya conocemos zα / 2  1.96 para α  0.05. (Se toma |z/2| ó z/2 puesto que se suma
y se resta a x .
σ  0.338. z σ  1.96(0.338)  0.66248.
Entonces como α/2
n n

Entonces tenemos que nuestra región de no rechazo (Ver “Llave Maestra para IConf y Contrastes
de Hipótesis”) es
 σ  x μz σ   1- α
Pr  μ- zα / 2 Pr 25- 0.6625  x  25  0.6625  0.95
 n α/2
n 

Pr 24.34  x  25.66  0.95 ó 95%. Ya tenemos todos los elementos para probar la hipótesis
nula sobre el eje Xbarra y sobre el eje Z. Ahora ya podemos calcular la media de la muestra y el valor
z observado de la muestra para confrontarlos contra lo esperado. (Recuerde que el valor de  debe
haber sido especificado previamente).

o =  se supone verdadera y se espera que Xbarra caiga en la región


de 24.34 a 25.66 centímetros con una probabilidad (confianza) del 95%.


-- Digresión:
Recuerde que consideramos que si la hipótesis nula es verdadera entonces la probabilidad de que
Xbarra caiga en la región de no rechazo es tan alta como 95%, por tanto, si la Xbarra observada cae
fuera de dicha región es tan poco probable como 5% =  de que  = 25 que preferimos rechazar tal
hipótesis nula.
Pero realmente hay una pequeña probabilidad, que nosotros especificamos en 5%, de obtener una
Xbarra fuera de la región de no rechazo aún cuando la verdadera  sea igual a 25 en cuyo caso
estaríamos cometiendo un error tipo I: “rechazar una hipótesis nula (como falsa) cuando es
verdadera”. Ejemplo: si sabes que un alimento que te gusta tiene un olor agradable para ti bastaría
una sola vez en que el olor fuera diferente para que sospecharas que está echado a perder o que al
menos su sabor no es aquel que te encanta, por tanto, no lo consumirías aunque es posible que el
alimento este en muy buen estado y tenga el sabor al que estás acostumbrado.
-- Termina digresión.
Prof. Miguel Ángel Abreu H. Marzo 10. 4/

x
 
σ/ n

 
 eje x
σ  24.34
μ o - zα / 2 μo  zα / 2 σ  25.66
n n

Zona de rechazo Zona de no rechazo Zona de rechazo

eje
 zα / 2 0  zα / 2 Z
X -μ
zα / 2  1.96 z1-α / 2  1.96 σ/ n

Observe como la figura permitió presentar la propuesta de prueba de hipótesis ANTES de obtener la
muestra. Ahora calculamos Xbarra de los datos y también la z observada.
☺OBTENCIÓN DE LA MUESTRA .i.i.d. y CÁLCULO DE Xbarra, z o t observada y de S de ser
necesario.
n 35 x  μ o 24.85  25  0.15
x1  xi  24.85. z obs     -0.4438
n i 1
σ/ n 0.338 0.338
zobs: z observada en la muestra. zobs  0.4438
_________________
MUESTRA .i.i.d: muestra (aleatoria) de n variables aleatorias independientes e idénticamente
distribuidas.
Prof. Miguel Ángel Abreu H. Marzo 10. 5/

☺PRUEBA SOBRE EL EJE Xbarra Y EL EJE Z. ES CONVENIENTE HACERLO DE FORMA


GRÁFICA.
Colocamos éstos valores en la figura y observamos si caen en la región de no rechazo o en alguna
de las regiones de rechazo. Recuerde que estamos realizando una prueba bilateral.
x  24.85 zobs  0.4438
x  24.85
 
σ/ n

 
24.34  eje x
25.66
zobs  0.4438

Zona de rechazo Zona de no rechazo Zona de rechazo

eje Z
 1.96 0 1.96
Ambos valores x y obs caen en la región de no rechazo, por tanto, la hipótesis nula no se rechaza.
z
Ambos valores se corresponden, cada uno en su correspondiente eje o escala.

El fabricante está en lo correcto.


Ahora agregamos las otras dos formas de realizar la prueba de hipótesis.
Con el valor p y con el intervalo de confianza.
☺CONTRASTE CON EL VALOR p
z
Tanto la obs como x dividen a la distribución normal de Xbarra en dos partes si calculamos el
área menor de ambas, para el caso bilateral, dcha área será la mitad del Valor p. Obviamente esta
área la calculamos con zobs, es decir, con la distribución normal estándar.

Podríamos decir que el Valor p es como el  más grande que permitiría aceptar la hipótesis nula (o
que llevaría a la indecisión entre no rechazar o si rechazar la hipótesis nula) con la muestra
específica obtenida, por tanto se calcula a partir del valor Xbarra obtenido en la muestra. De hecho es
la forma de comparar  que es lo supuesto o esperado contra lo observado, en este caso el valor p (o
coloquialmente  observada).

Xbarra divide a la normal en dos áreas: en los casos unilaterales se calcula el área que está en la
dirección de la región de rechazo siendo ésta el valor p; en el caso bilateral, se calcula el área más
pequeña y el doble de la misma es el valor p.
zobs  0.4438

σ 1

 

eje Z
 Pr(Z zobsPr(Z-0.44½(valor p)½

Z 0.00 -0.01 -0.02 -0.03 -0.04 -0.05 -0.06 -0.07 -0.08 -0.09
... ... ... ... ... ... ... ... ... ... ...
-0.4 0.344578 0.340903 0.337243 0.333598 0.329969 0.326355 0.322758 0.319178 0.315614 0.312067
... ... ... ... ... ... ... ... ... ... ...

Observe cómo dicha área = ½(valor p) sería menor a ½  si Xbarra y zobs hubiesen caído en una de
las regiones de rechazo. “½(valor p) > ½ ” es equivalente a “valor p > " lo que indica que la
hipótesis nula no se rechaza” Cuándo “valor p < " estaríamos en el caso en que la hipótesis nula se
rechaza. Para recordar esta regla basta dibujar la normal en caso de no rechazo o de rechazo y
observar sobre el dibujo como son las áreas  y valor p.

Prof. Miguel Ángel Abreu H. Marzo 10. 6/


Representamos gráficamente las tres maneras de realizar la prueba de hipótesis que llevamos hasta
el momento. Observe que el área de la mitad del valor p corresponde al área con la línea punteada

y el área que representa la mitad


del valor  es representada por

Comparativamente la mitad de  representa 0.025 o 2.5% y la mitad del


valor p representa 0.33 o 33%, es decir, en este caso la mitad del valor p
es 0.33/0.025 = 13.2 veces el valor  o el valor p es mayor que el valor
 en 13.2 veces. Valor p >> valor , por tanto, no se rechaza la
hipótesis nula.
Prof. Miguel Ángel Abreu H. Marzo 10. 7/

½(valor p) x  24.85


 
σ/ n

 
 eje x
24.34 25.66
zobs  0.4438

Zona de rechazo Zona de no rechazo Zona de rechazo

eje Z
 1.96 0 1.96

La forma más usual de realizar a mano la prueba de hipótesis es con la zobs, pero da muy poca
información y es difícil de interpretar por alguien que conoce poca estadística. El valor p es muy
usado en los paquetes estadísticos computacionales. El método más expresivo y directo es sobre el
eje Xbarra.

☺CONTRASTE CON EL INTERVALO DE CONFIANZA


Ahora pasamos a la última forma de probar la hipótesis nula, el intervalo de confianza. Sabemos
que el intervalo de confianza se puede utilizar para simplemente obtener una estimación por
intervalo para el parámetro en estudio, en este caso la media poblacional sin tener que realizar la
prueba de hipótesis. Es decir, el intervalo de confianza puede ser independiente de la prueba de
hipótesis pero además se puede utilizar para probar una gran gama de hipótesis nulas como
explicaremos a continuación. En este sentido el intervalo de confianza da más información útil para
la toma de decisiones que la prueba de un solo valor en la hipótesis nula.
Construcción del intervalo de confianza (Ver “Llave Maestra para IConf y Contrastes de
Hipótesis”):

 σ σ 
Cf  x - z   xz   1- α
......  α/2 n α / 2 n 

= 2 centímetros. Xbarra = 24.85.  = 0.05. n = 35. . 1 –  = 1– 0.05 = 0.95.


σ  2  2  0.338.
n 35 5.916

z1 - α / 2 es tal que Pr(Z  z 1 - α / 2 )  1 - α / 2.


.... ..
σ
x- z α / 2  24.85 0.6625  24.1875
n
σ
x- z α / 2  24.85 0.6625  25.5125
n
 σ σ 
Cf  x- z α / 2  μ  x  z α/2  1-α
 n n

Cf  24.19  μ  25.51  0.95. μ o  25. 24.19  μ  25.51


Si Xbarra está dentro de la región de no rechazo la hipótesis nula no se rechaza y se considera como
verdadera. De manera similar si o está dentro del intervalo de confianza (usando la misma )
entonces no se rechaza la hipótesis nula. Por tanto, todas las hipótesis nulas tales que estén entre
24.2 y 25.5 no serán rechazadas y todas las que salgan de dicho intervalo serán rechazadas. Claro
que siempre debemos trabajar sobre una sola hipótesis nula.

Observe que las cuatro formas de probar la hipótesis son consistentes, si una forma no rechaza la
hipótesis nula, todas las demás no la rechazan y viceversa.

Prof. Miguel Ángel Abreu H. Marzo 10. 8/


A continuación se grafican las cuatro formas de manera complementaria (“Gráfica Integradora”):

½(valor p) x  24.85


 
σ/ n

 
24.34
 25.66
eje x
<- o dentro del I.C.
x <- I.C. centrado en Xbarra.
24.19 25.66
zobs  0.4438

Zona de rechazo Zona de no rechazo Zona de rechazo

eje Z
 1.96 0 1.96
x
0.6625
0.6625
En el eje de las abscisas no se está utilizando escala.
......☺
Queda pendiente (no se verán en este curso, excepto la lectura en el libro):
☺ Calcular un valor : Probabilidad de error tipo II. Aceptar como verdadera una hipótesis
nula falsa.
☺ Establecer un tamaño de muestra.
......
I.C. Intervalo de Confianza. Prof. Miguel Ángel Abreu H. Marzo 10. 9/
☺REFLEXIÓN PRÁCTICA
Después de realizada la prueba de hipótesis, ¿todo está bien?
¿Porqué es importante mostrar los datos? ¿Usted observa algo raro en los mismos?
25.6 21.8 27.3 25.0 25.8 26.2 25.8
22.1 25.8 22.8 25.5 28.9 22.9 24.3
22.5 25.0 26.6 23.6 22.3 26.5 24.3 Prof. M.A. Abreu H. Marzo 10. 10/
26.7 23.9 24.0 23.2 25.6 26.7 21.5
26.0 27.9 25.9 23.1 22.4 26.1 26.1

En la práctica no sólo tenemos que obtener los datos sino, incluso tenemos que diseñar todo un
estudio estadístico para resolver un problema que se presenta o se manifiesta a través de la
incertidumbre. Inicialmente cuidar que la muestra sea realmente i.i.d. o aleatoria.
La variabilidad, expresada con  = 2 es muy grande, de hecho hay zapatos que compraría una
persona que utiliza calzado del 23 (23.1) o del 29 (28.9). Si hay calzado con las medidas 21.5, 22.0,
22.5, , ..., 28.0, 28.5 varios de éstos zapatos caerían en algunas de ellas. Aún si los zapatos se
clasifican después de hacerlos sería muy aventurado decir que es un buen proceso de fabricación de
zapatos. Esto hubiera sido más difícil detectarlo simplemente con 25  2 centímetros. Si X es
normal 25  3*2 => ¡19 a 31 este sería el rango real de zapatos producidos dizque de 25
centímetros! (Ver la “regla empírica” de la distribución normal” FPE Jit Press página 4-33).
Aunque pase la prueba de hipótesis en este caso es necesario establecer especificaciones, por
ejemplo, 25  0.2 centímetros. Si X es normal 25  3*0.2 => 24.4 a 25.6 y aún es un rango muy
amplio, habría que reducirlo al menos a 25  3*0.1 => 24.7 a 25.3. Incluso hasta añadirles algunas
décimas de centímetro y todos sean mayores a 25 centímetros y menores a 25.5. Por tanto, no es
suficiente con no rechazar la hipótesis nula para asegurar que “todo está bien”.
Este problema se podría complementar con modelos de probabilidad. Específicamente si X se
comporta de manera normal. Por ejemplo, podríamos responder, con el modelo normal u otro, a la
cuestión ¿cuáles deben ser  y  para que el 99% de los zapatos tengan una medida entre 25.0 y
25.4?
También aquí podría entrar la metodología Seis Sigma (Six Sigma ®) qué es un método de mejora
continua de la calidad. Es decir, la estadística es indispensable pero insuficiente, hay que
complementarla con otros enfoques, en cuanto al factor humano, la organización del trabajo y de las
máquinas, dispositivos e instrumentos, etcétera.
Por ejemplo, si mis especificaciones son que un zapato de 25 centímetros debe estar entre 25.0 y
25.4 deseo que dentro de esté rango esté incluida seis veces sigma, entonces 25.4 – 25.0 = 6 y esto
implica que = 0.4/6 = 0.067 centímetros que es mucho menor que la sigma original de dos
centímetros (1). Lograr ese cambio significa un trabajo inteligente y arduo por parte de la empresa y
es un problema complejo que se debe atacar con enfoques tan elaborados como Six Sigma ®.
………….
Bibliografía básica sobre Seis Sigma: Control Estadístico de Calidad y Seis Sigma. Humberto Gutiérrez
Pulido y Román de la Vara Salazar. McGraw Hill. México. 2004. (1) En esta metodología la   0.067.

Es un excelente libro con un precio accesible, que cualquiera que se precie de ser ingeniero debe estudiar
independientemente que su carrera se lo pida o no. El control total de la calidad y Seis Sigma son
herramientas de uso generalizado en la mayoría de las empresas o en unos años más van a tener que utilizar
TODAS las empresas y que involucra de una forma u otra a TODO su personal.
Ejemplo 2.
Un corredor de fondo tiene un tiempo histórico de 25 minutos en entrenamiento. Ha estado
entrenando para mejorar dicho tiempo histórico. En sus últimas 16 carreras de entrenamiento ha
obtenido un tiempo promedio de 24.23 minutos con una desviación estándar de 0.899 minutos.
Establezca si dicho entrenamiento le ha servido a este corredor para mejorar su tiempo de
carrera con un  = 0.01. Definir X. ¿La muestra es i.i.d.?
X: Tiempo, en minutos*, de cada carrera del tipo correspondiente, …
*Actualmente, en la práctica, el tiempo es redondeado a centésimas de minutos.
Ho:  =  vs. Ha: 




Ho:  = 25 vs. Ha: ¿Cuál es el objetivo?


El objetivo es conocer si ha mejorado su tiempo, lo cual no se puede observar en la hipótesis nula
que siempre es de igualdad. Se observa en la hipótesis alternativa. Por tanto, sólo se podrá observar
la mejoría si se rechaza la hipótesis nula. Es decir, la hipótesis alternativa debe establecer que  es
menor que 25. Pero si se sospecha que la media debe ser ahora de 24 minutos, ésta sería .
(Ver “Llave Maestra para IConf y Contrastes de Hipótesis”):

Ho:  = 25 vs. Ha:  Prueba unilateral de cola izquierda (una cola).
¿ es conocida?
x  x 2
S  i
 es desconocida y estimada por S = 0.899
ó S S= 0.899 n  1
Xbarra = 24.23
 = 0.01
Como  es desconocida tendríamos que estimarla con s y utilizar el teorema de la t de Student .
Esto sólo es posible si la variable aleatoria original X es aproximadamente normal.
Por tanto, esta última aseveración tendríamos que probarla. Una forma relativa de hacerlo sería
con una gráfica de papel de probabilidad normal para los 16 datos, otra mejor forma sería
utilizar una prueba de bondad de ajuste.

Prof. Miguel Ángel Abreu H. Marzo 10. 11/


2.5000
2.0000
1.5000
1.0000
0.5000
0.0000
-0.5000
-1.0000
-1.5000
-2.0000
-2.5000
21.0 22.0 23.0 24.0 25.0 26.0

Se observa que prácticamente la mayoría de los datos están en el área definida por el rectángulo.
Sin embargo, los puntos extremos (mínimo y máximo) están fuera, parece que no hay evidencia
suficiente para negar que los 16 valores provengan de un modelo normal. Pero debido a la
situación de los dos valores extremos sería conveniente realizar una prueba de bondad de ajuste
Anderson-Darling.

Supondremos que no hay evidencia suficiente en contra de que los datos provienen de una
población normal.

Ahora pasaríamos a recordar o construir la región de no rechazo y el intervalo de confianza para


una prueba unilateral de cola izquierda.
Prof. Miguel Ángel Abreu H. Marzo 10. 12/
Lo único que tenemos que recordar es que “deseamos (si la hipótesis nula es verdadera) que la
distancia (valor absoluto) entre la media muestral y la media poblacional tenga una cierta
precisión con un alta probabilidad”. Podemos suponer la precisión y calcular la probabilidad
antes dicha o podemos suponer dicha probabilidad y a partir de la misma calcular la precisión.
Esto último es lo que estamos proponiendo al haber establecido  = 0.01. Entonces dicha alta
probabilidad es 1 –  = 1 0.01 = 0.99. Recuerde que lo que expresamos entre comillas es:
Pr( x  μ  precisión  probabilidad  1- α. Precisión = Error máximo de estimación.
que se representa como
Pr  x  μ  ( Estadístico de prueba, " " ó "  2" )  (Desviación estándar de Xbarra o su estimación)   1- α
En nuestro caso  es desconocida y por tanto la desviación estándar de Xbarra se estima como

ˆ  S / n donde ̂ : es la estimación de la desviación estándar de X y S 


 x  x 2
i

x x n  1
Y nuestro estadístico de prueba es t  ( x   ) /( s / n ). Pudiendo ser t n  1,  / 2 ó t n  1, 
Para nuestro caso con prueba de hipótesis unilateral requerimos:t n  1, .
(Ver archivo: “Llave Maestra para IConf y Contrastes de Hipótesis”).
A partir de la “Llave Maestra”:


Pr  x  μ  z n  1,  / 2
   1- α  
Pr   z  / 2
  x μ     1- α
z / 2
 n   n n 
Como  es desconocida  se cambia por S y z por t, además como es una prueba de hipótesis
unilateral inferior o de cola izquierda se cambia /2 por ; quedando:
 s  x  μ   1-  S
Pr   t , n 1  o de manera más breve:  t n  1,   x μ
 n  n
Si despejamos  nos da un intervalo de confianza de límite ¡¡superior!! Si despejamos Xbarra
obtenemos la región de no rechazo para nuestra prueba de interés sobre el eje Xbarra. Si
despejamos t n tenemos la región de no rechazo en el eje t para comparar con la t observada.
Entonces, al despejar Xbarra, tenemos como región de no rechazo: μ  t s
x
 , n 1
n
Para el intervalo de confianza, es incorrecto sustituir  por Xbarra y Xbarra por . Hay que
s
hacer el despeje de  directamente a partir de la región de no rechazo: μ  t , n1 x
n
queda   x  t , n1 s como el intervalo de confianza ¡¡de límite superior!!
n
Es decir, la precisión, por tratarse de una prueba unilateral ( queda concentrada de un solo
lado) o de una sola cola y por ser  desconocida pero X aproximadamente normal sería
s s
t α, n - 1 . no es tα porque la distribución t de Student depende del tamaño de la muestra, n.
n n
Por último, en los casos unilaterales, el Valor p se obtiene calculando el área que va en la misma
dirección en la que se encuentra la región de rechazo, en la distribución t con n - 1 g.l., a partir
del valor tobservado. En nuestro caso
tobservado  ( x   ) /( s / n )  ( 24.23  25) /( 0.899 / 16 )   0.77 / 0.22475   3.4260

Prof. Miguel Ángel Abreu H. Marzo 10. 13/


-----------------------------------------------------------------
Se supone que a partir de los 16 datos se obtuvieron x y s con las fórmulas que se dan a
continuación:
1 n 16 1 n16
x   xi  24.23
n i 1
y s 
n  1 i 1
( xi  x ) 2  0.899

-----------------------------------------------------------------
Observe que se usan las notaciones “t n” ó “t , n” sin embargo la que considero más adecuada
es la notación t n porque la distribución t es la que tiene n – 1 grados de libertad. Posteriormente
haré el cambio en todo el documento. Por lo pronto se usarán ambas expresiones.
- - - DIGRESIÓN:
s σ
Si SIGMA ES CONOCIDA: en los casos anteriores se sustituye tα por zα .
n n
Para nuestro ejemplo la z sería tal que Pr(Z≤ z) = . Buscando en la tabla normal
estándar,
Pr(Z  z )  α  0.01.
α
Pr(Z  z
0.01
 2.33)  0.01 σ 1

 

eje Z

z α  2.33 

Z 0.00 -0.01 -0.02 -0.03 -0.04 -0.05 -0.06 -0.07 -0.08 -0.09
... ... ... ... ... ... ... ... ... ... ...
-2.2 0.013903 0.013553 0.013209 0.012874 0.012545 0.012224 0.011911 0.011604 0.011304 0.011011
-2.3 0.010724 0.010444 0.010170 0.009903 0.009642 0.009387 0.009137 0.008894 0.008656 0.008424
-2.4 0.008198 0.007976 0.007760 0.007549 0.007344 0.007143 0.006947 0.006756 0.006569 0.006387
... ... ... ... ... ... ... ... ... ... ...

Usamos |z| = z , es decir, |z| = || = = z ., pues |z| = z = z = .
   

Todo lo demás se calcula de manera semejante.

- - - Termina DIGRESIÓN.
Prof. Miguel Ángel Abreu H. Marzo 10. 14/
¿Cómo se calcula el valor t , n  1? Se calcula de tablas (también se puede calcular en Excel) pero
 

la tabla de la t de Student es muy diferente a la tabla de la distribución normal estándar (z).

 (z): Distribución normal


 Valores críticos de la distribución t
estándar
  
z 0.00 0.01 0.02 ... n -1 0.25 0.10 0.05 0.025 0.01 0.005
0.0 0.500000 0.503989 0.507978 . . . 1 1.000 3.078 6.314 12.706 31.821 63.657
0.1 0.539828 0.543795 0.547758 . . . 2 0.817 1.886 2.920 4.303 6.965 9.925
0.2 0.579260 0.583166 0.587064 . . . ... ... ... ... ... ... ...
... ... ... ... ... 28 1.313 1.701 2.048 2.467 2.763 3.674
29 1.311 1.699 2.045 2.462 2.756 3.659

z

1
 
1 - /2

zα 0 0 t

1.1 La distribución normal estándar 2.1 La tabla de distribuciones t nos


nos da las probabilidades  (z) =  da las probabilidades Pr(t ≥ t).
Pr(Z≤ z). Pr(Z≤ z ) = . Da proba-  Pr(t ≥ t) = . Da probabilidades de
balidades de cola inferior o cola superior o derecha. 2.2 Las
izquierda. 1.2 Todas las distribucio- distribuciones t no se pueden
nes normales con media  y reducir a una sola tabla. Hay tantas
desviación estándar  tienen distribuciones t como tamaños de
probabilidades que se obtienen de la muestra: n (o grados de libertad:
tabla normal estándar; para nuestro n – 1). En la tabla t sólo se dan los
caso mediante la fórmula: valores t de algunas probabilidades
z = ( x -  ) / ( n  La tabla
  
de cola derecha. 2.3 La primera
normal estándar es la única tabla columna representa los grados de
normal que se utiliza para obtener libertad (g.l.) por lo que cada
probabilidades o valores z. 1.3 La renglón es una distribución t
primera columna da las unidades y distinta. Por tanto, el primer
las décimas del valor z , el primer renglón representa dichas
renglón da las centésimas del valor probabilidades que se encuentran
z. 1.4 En el cuerpo de la tabla se en las correspondientes columnas.
encuentran las probabilidades 2.4 En el cuerpo de la tabla se
acumuladas.  encuentran los valores t.
Prof. Miguel Ángel Abreu
H. Marzo 10. 15/
Ambas son simétricas lo que garantiza que valores a la misma distancia de la media tienen el
mismo valor con signo distinto; de esta idea tomaremos el valor t , n  1. Para nuestro caso
 

debido a que requerimos el valor izquierdo que no viene en tablas. Necesitamos Pr(t ≤ t) =
(valor negativo) y en la tabla de distribuciones t encontramos Pr(t ≥ t) = (valor positivo).

Obtengamos de la tabla de las distribuciones t el valor t para  = 0.01 y g.l. = (n – 1) = 16 –


1 = 15. (Observe que si tuviéramos una prueba bilateral estaríamos buscando en la
columna 0.005, en este caso equivalente a  = 0.01/2 = 0.005. t n-1 = t. Hay

tablas que presentan mayor número de columnas como la de Montgomery/Runger que


presenta las columnas: 0.4, 0.25, 0.10, 0.05, 0.025, 0.01, 0.005, 0.0025, 0.001 y 0.0005).

  
g.l. = n-1 0.25 0.10 0.05 0.025 0.01 0.005
... ... ... ... ... ... ...
14 0.6924 1.3450 1.7613 2.1448 2.6245 2.9768
15 0.6912 1.3406 1.7531 2.1315 2.6025 2.9467
16 0.6901 1.3368 1.7459 2.1199 2.5835 2.9208
... ... ... ... ... ... ...

0 t g.l.
(La tabla t de Student puede variar de un libro a otro en cuanto a las probabilidades que
se representan).

Por tanto, para este problema tn-1 = t = 2.6025.


Buscamos Pr(t  t )  α. pero este no es un valor de la tabla de distribuciones t.
α
En la tabla obtenemos Pr(t  t
0.01
 2.6025)  0.01

 
 eje t


t α  2.6025  t α  2.6025
El negativo del valor en la tabla*. Valor de la tabla de distribuciones t.
Se utiliza la simetría de las distribuciones t.
* Ver nota inicio de la próxima hoja. Prof. Miguel Ángel Abreu H. Marzo 10. 16/
*Aunque es mejor tomar el valor
positivo y sustituirlo directamente
en la fórmula del valor crítico. Sin Prof. Miguel Ángel Abreu H.
embargo, cuando se dibuja el valor Marzo 10. 17/
crítico sobre el eje t, si es el negativo
del valor t de tablas.
1 n
Ahora pasaríamos a calcular s mediante la fórmula S  
n  1 i 1
( xi  x ) 2

Y se obtiene s = 0.899. Entonces s/ n  0.899/4 = 0.22475. Esto quiere decir que la


desviación estándar de Xbarra se estima en 0.22475. Siendo un paso intermedio que se
debe especificar.

Finalmente calculamos la precisión o dicho de manera más correcta “el error máximo de
estimación” debido al muestreo: tn(S/n.5) = 2.60250.22475 = 0.5849. Por tanto,
como es un contraste de hipótesis unilateral de cola inferior o izquierda el valor o punto
crítico que separa las regiones de rechazo y de no rechazo (aceptación) se localiza
mediante la fórmula: tn(S/n.5) ≤ Xbarra.
s
μ  t , n 1  x.
n
μ  t , n1
s  25  0.5849  24.4151  24.415  x 
24.42  x Pr(24.42  x )  0.99
n
Dibujemos el planteamiento del contraste de hipótesis. Observe que no es necesario
conocer el valor Xbarra de la muestra ANTES de establecer las regiones de rechazo y no
rechazo, sin embargo, si es necesario tener la muestra para calcular s.

x  24.23

s/ n

 
σ
 “eje x ”
μo- t
α, n - 1
 24.42
tobservado = -3.4260 n

Zona de rechazo Zona de no rechazo


- t α, n -1  2.6025 X -μ eje t
0 t 
s/ n
En este caso no existe propiamente un eje Xbarra con alguna distribución de probabilidad
específica. Sin embargo, es válido observar tanto la región crítica como el intervalo de
confianza en un eje Xbarra puesto que es más fácil de observar el resultado de rechazar o
no la hipótesis nula para alguien que conoce el problema real pero no sabe suficiente
estadística. Incluso para el que sabe, se observa directamente en las unidades de
medición del problema original.
t observado  ( x   ) /( s / n )  ( 24.23  25) /(0.899 / 16 )   0.77/0.22475  3.4260

Por tanto, valor tobservado = -3.4260 < tn-1 = t = -2.6025 y también se rechaza
la hipótesis nula sobre el eje t. Observe la figura de la hoja anterior.

Ahora construyamos el intervalo de confianza:

De la expresión  t n  1, 
S
 x  μ despejamos , obteniendo μ  x  t , n1 s
n n
Observe como una prueba de hipótesis de cola izquierda o inferior nos lleva a un
intervalo de confianza con límite superior finito.

μ  x  t , n1
s  24.23  0.5849  24.815
n
Cf(μ  24.815)  1 - α  0.99.
Como  no está contenida en el intervalo de confianza se rechaza la hipótesis nula
Es decir, el corredor está corriendo más rápido.

Por último obtengamos el Valor p:


Para los casos unilaterales, el Valor p se obtiene calculando el área que va en la misma
dirección en la que se encuentra la región de rechazo, en la distribución t con n - 1 g.l., a
partir del valor tobservado. En nuestro caso ya obtuvimos tobservado = -3.4260.

Prof. Miguel Ángel Abreu H. Marzo 10. 18/


Hagamos un dibujo únicamente para explicar el cálculo del valor p con la distribución t ,
amplificando la zona de rechazo para observar mejor la siguiente explicación.

t observado = área que ocupa hacia )


-3.4260
área que ocupa el Valor p


 
0 eje t
- t α, n - 1  2.6025 X -μ
t
s/ n
t observado = -3.4260 Prof. Miguel Ángel Abreu H. Marzo 10. 19/

Observemos la parte de la tabla de distribuciones t en el renglón de la distribución t con


n – 1 = 15 g.l. Por la simetría de las distribuciones t ubicamos en vez de el valor
-3.4260, el valor -t observado = 3.4260

  
g.l. = n-1 0.25 0.10 0.05 0.025 0.01 0.005
... ... ... ... ... ... ...
15 0.6912 1.3406 1.7531 2.1315 2.6025 2.9467
... ... ... ... ... ... ...

3.426
No tenemos en el renglón 15 de la tabla el valor 3.4260 pero sabemos que está después
de 2.9467. 2.9467 < 3.426 y observamos que la probabilidad decrece conforme el valor
t se incrementa. Por tanto la probabilidad de t = 3.4260 debe ser menor a 0.005.
Pr(t ≥ 2.6025) = 0.01 > Pr(t ≥ 2.9467) = 0.005 > Pr(t ≥ 3.4260).
= 0.01 Pr(t ≥ 2.6025)

n - 1 = 15 0.005 Pr(t ≥ 2.9467)

No hay escala. 0.001 Pr(t ≥ 3.4260)

 
 3.4260
2.9467
eje t
2.6025
Por simetría el resultado es semejante para el lado izquierdo:
Pr(t ≥ -2.947) = 0.01 > Pr(t ≥ -3.426) > Pr(t ≥ -4.073) = 0.001.
============================================================
En Excel podemos obtener el valor exacto de Pr(t ≥ -3.426) mediante la función
………………………………………………………………………………

DISTR.T(x ; grados _ de _ libertad ; colas)


Colas: especifica el número de colas de la distribución que deben devolverse. Si colas = 1,
DISTR.T devuelve la distribución de una cola. Si colas = 2, DISTR.T devuelve la distribución
de dos colas. (El nombre de la distribución t puede cambiar de una versión de Excel a otra,
incluso pueden cambiar la forma de introducir los grados de libertad y el valor de t.)
………………………………………………………………………………
DISTR.T(x = 3.4260 ; grados _ de _ libertad = n - 1 = 15 ; colas = 1)
DISTR.T(3.4260; 15; 1) =
Se puede verificar contra la tabla de valores críticos de t
DISTR.T(2.9467; 15; 1) = 0.005 correcto
DISTR.T(2.9467; 15; 2) = 0.010 incorrecto ó
DISTR.T(2.6025; 15; 1) = 0.009999 ≈ 0.01 correcto
DISTR.T(2.6025; 15; 2) = 0.01999 ≈ 0.02 incorrecto
Para nuestro problema DISTR.T(3.426; 15; 1) = 0.001876 ≈ 0.002
DISTR.T(3.426; 15; 1) = 0.001876 ≈ 0.002 este es el valor correcto
comprobándose (por simetría) que

 = Pr(t ≥ -2.6025) = 0.01 ≥ Pr(t ≥ -2.9467) = 0.005 > Pr(t ≥ -3.4260) = 0.002 = valor p .
-------------------------
En conclusión:  = 0.01 > Valor p y como  > Valor p se rechaza la hipótesis nula.
 > Valor p -> por tanto, el valor p es menor que  y en consecuencia se rechaza la
hipótesis nula. Las cuatro formas de contrastar la hipótesis: sobre el eje t, sobre el
“eje Xbarra”, con el valor p y con el intervalo de confianza son consistentes. En
todos los casos se rechaza la hipótesis nula y se puede concluir que el corredor ha
mejorado sus tiempos de competencia. Sin olvidar los dos tipos de errores estadísticos.
En este caso se consideró 1 –  = 0.99,  = 0.01← probabilidad de rechazar una hipótesis nula
verdadera (Ho:  = 25 minutos e implícitamente  > 25, pues H1:  < 25).
============================================================
QUEDA PENDIENTE LA GRÁFICA INTEGRADORA DEL PROBLEMA 2 Y
TAMAÑO DE MUESTRA Y  (Error tipo II).
Prof. Miguel Ángel Abreu H. Marzo 10. 20/20

Das könnte Ihnen auch gefallen