Apuntes Sobre Prueba de Hipotesis

Apuntes sobre Prueba de Hiptesis
(Borrador para correccin)
Elaborado por:
Hctor Medina Disla
Santo Domingo Julio 2008
Prueba de Hiptesis. Se ha hablado mucho sobre la importancia de la Estadstica como metodologa cientfica para hacer inferencia sobre la poblacin a partir del estudio de una muestra. En este captulo nos centraremos en probar si nuestra suposicin sobre el comportamiento de un parmetro se puede considerar cierta o por el contrario se tiene evidencia para descartar dicha suposicin. Una hiptesis puede definirse como una suposicin sobre el comportamiento de algo, sea cierto o no. Dicha suposicin se origina a partir de la observacin o de la induccin y que requiere ser verificada. Una Hiptesis Estadstica en una suposicin sobre un parmetro poblacional, es decir una suposicin sobre la forma de distribucin de probabilidad de una o varias poblaciones determinadas. Por ejemplo un gerente de operaciones pude suponer que un programa de capacitacin al personal podra reducir el porcentaje de artculos defectuosos, el gerente de mercadeo de una empresa puede creer que un tipo de campaa influye en la demanda de un producto o servicio, un psiclogo clnico puede entender que una terapia determinada es mejor que otra, o que el tiempo que un paciente tarda en recuperar un trastorno con una terapia determinada es tantos das, etctera. La suposicin o hiptesis que se tenga sobre el comportamiento de un fenmeno puede ser cierta o no, el procedimiento que se sigue para verificar la certeza o la falsedad de nuestra suposicin se le denomina prueba de hiptesis. La prueba de una hiptesis estadstica consiste en probar si la diferencia que se observa entre un valor muestral o estadgrafos difiere significativamente con el valor de referencia o parmetro. Este proceso de verificacin de una hiptesis requiere de un proceso de inferencia estadstica, se ha dicho en reiteradas ocasiones y se reitera una vez ms, que difcilmente se pueda analizar una poblacin completa, dado el costo y tiempo requerido para ello, por lo que, cuando se desea conocer ciertas caractersticas de una poblacin, se recurre a estudiarla a partir de una muestra. De igual forma se observ que al tomar diferentes muestras de una poblacin, el valor muestral del promedio, por ejemplo, era diferente con respecto al promedio poblacional o parmetro y que eran diferentes uno de los otros. El objetivo fundamental de la prueba de hiptesis es ayudar a decidir si la diferencia que se observa entre el valor muestral y el parmetro es estadsticamente significativa. Esto equivale a decir que lo buscamos es, determinar si la diferencia observada entre el estimador o estadgrafo y el parmetro se debe a alguna cusa especfica, (diferecnia estadsticamente significativa) o por el contrario se debe causas aleatorias, (diferecnia estadsticamente no significativa) Hiptesis nula e hiptesis alternativa El procedimiento de prueba de hiptesis se realiza sobre dos tipos de hiptesis: la Hiptesis nula, que se representa por H 0 y la hiptesis alternativa que se representa por HA. En la hiptesis nula se establece la hiptesis que se desea probar, en ella se 2
plantea que la diferecia observada entre el estimador y el parmetro se debe a causas aleatorias y su planteamiento conlleva un signo de igualdad, puede ser el de igualdad, (=), el de mayor o igual, () o el de menor o igual, () En la hiptesis alternativa, por su parte es la hiptesis alterna posible a la hiptesis nula y debe ser planteada de forma que esta y la hiptesis nula sean mutuamente excluyentes. Errores en la prueba de hiptesis Una hiptesis puede ser cierta o puede ser falsa y con respecto a ella se toma una de dos decisiones, se acepta o se rechaza, de forma que se puede rechazar una hiptesis que sea cierta o se puede aceptar una que sea falsa. En ambos casos se est incurriendo en un error y a estos errores se le llama Error Tipo I y Error Tipo II. Error Tipo I: es la probabilidad de rechazar una hiptesis nula siendo esta cierta, esta probabilidad est definida por el nivel de confianza que se utilice para la prueba, en cambio el Error Tipo II es la probabilidad de aceptar una hiptesis nula cuando esta es falsa. Potencia de una prueba: La potencia de una prueba define la probabilidad de rechazar una hiptesis nula cuando esta es falsa. En la tabla sigueinte se resumen estos conceptos Hiptesis H0 Cierta Nula, Decisin Aceptar Decisin correcta, con probabilidad igual al nivel de confianza Error Tipo II. Probabilidad de cometer este error Rechazar Error Tipo I. Con probabilidad igual al nivel de significacin Decisin correcta. Con probabilidad igual a: 1- , (Potencia de una prueba)
Falsa
Prueba de hiptesis bilateral y unilateral

En los problemas relacionados con la prueba de hiptesis se pueden presentar uno de dos plantemanientos: 1) se desea conocer si el valor muestral o estimador es diferente del parmetro, es decir que la diferencia puede estar a cualquier lado de la curva, en este caso al procedimiento se le llama prueba de hiptesis bilateral o de dos colas y 2) se desea probar si la estimador o estadgrafo es superior al parmetro poblacional o si por el contrario es menor a este, es decir que la diferencia entre ambas medidas se encuentra en un solo lado de la curva. En este caso se le denomina prueba de hiptesis unilateral o de una cola.
Para ilustrar estas consideraciones tomamos un ejemplo. El rendimiento promedio de un grupo de trabajadores es de 20 unidades y una desviacin estndar de 5 unidades. Suponga que se han generados cambios en el ambiente de trabajo y que se desea saber si estos cambios han influido en el rendimiento del grupo. En este caso se podran plantear tres hiptesis nulas con su respectiva hiptesis alternativa. Un primer planteamiento que se podra hacer es el siguiente Ho: El rendimiento promedio del grupo sigue siendo 20 unidades Ha: El rendimiento promedio del grupo es diferente 20 unidades En este caso se est planteando que el rendimiento del grupo ha sufrido cambios, sin especificar si es que ha aumentado o que ha disminuido. Este procedimiento es bilateral o de dos colas. S representamos el rendimiento del grupo por la letra R, estas hiptesis podran plantearse como se ilustra a continuacin Ho: R = 20; Ha: R 20 Un segundo planteamiento es Ho: El rendimiento promedio del grupo sigue siendo 20 unidades Ha: El rendimiento promedio del grupo es mayor de 20 unidades En este caso se est planteando que el promedio es mayor despus de los cambios en el ambiente. En este caso la hiptesis es unilateral o de una cola, en este caso a la derecha. Ho: R = 20; Ha: R > 20 Y un tercer planteamiento es
Ho: El rendimiento promedio del grupo sigue siendo de 20 unidades Ha: El rendimiento promedio del grupo es menor de 20 unidades En este caso se est planteando que el promedio es mayor despus de los cambios en el ambiente. En este caso la hiptesis es unilateral o de una cola, en este caso hacia la izquierda. Ho: R = 20; Ha: R < 20 Pasos para probar una hiptesis: Un procedimiento de prueba de hiptesis requiere seis pasos: 4
1. Plantear o enunciar las hiptesis 2. Identificar el estadstico de la prueba, (Distribucin de probabilidad a utilizar en la prueba) 3. Especificar el nivel de confianza de la prueba de hiptesis. Establecer zona de rechazo y zona de aceptacin 4. Obtener los datos y realizar los clculos de la prueba 5. Decidir sobre la veracidad o no de la prueba 6. Redactar una conclusin sobre el proceso. Enunciacin de las hiptesis: La enunciacin de las hiptesis consiste en establecer las hiptesis que se quiere probar. En el procedimiento de prueba de hiptesis se plantean dos opciones: La hiptesis nula, la cual se representa por Ho y la hiptesis alternativa, que se representa por Ha. La hiptesis nula es la hiptesis que se somete a prueba, por lo tanto la decisin y la conclusin sern sobre esta hiptesis, en cambio la hiptesis alternativa es la hiptesis complementaria de la hiptesis nula. El planteamiento de la hiptesis nula siempre lleva un signo de igualdad, es decir, mayor o igual, menor o igual o igual. Eleccin del estadstico de la prueba El estadstico de la prueba es la distribucin de probabilidad que sigue la variable en la muestra. Para la eleccin del estadstico de la prueba se tomar en consideracin tres elementos: el tamao de la muestra, el origen de la varianza y estimador que se est probando. Por ejemplo, para la prueba de hiptesis del promedio se utiliza la distribucin normal de probabilidad cundo se conoce la varianza de la poblacin, o cuando se tiene una varianza calculada a partir de una muestra grande, (muestra con ms de 30 elementos, n > 30), en cambio se utiliza la distribucin T de Student cuando no se conoce la varianza de la poblacin y se tiene una muestra pequea, (muestra menor a 30 elementos, n < 30). En el caso de la prueba de hiptesis de la proporcin siempre se utiliza la distribucin normal de probabilidad Establecimiento del nivel de confianza: El nivel de confianza es la probabilidad de que el parmetro poblacional se encuentre dentro de los lmites del intervalo calculado para dicho parmetro, de forma tal que al establecer el nivel de confianza tambin se establece la zona de aceptacin y la zona de rechazo de la hiptesis nula. La zona de aceptacin en el rea bajo la curva correspondiente al nivel de confianza, mientras que la zona de rechazo es el rea correspondiente a las colas del intervalo.
Para una prueba de hiptesis de dos colas y un nivel de confianza de 95.0% de confianza la zona de aceptacin y de rechazo estaran dadas como se ilustra en la figura siguiente
Zona de rechazo de Ho Zona de aceptacin de Ho Zona de rechazo de Ho
Z/2=-1.96
Z/2=1.96
El valor de Z se obtiene a partir de la tabla de la distribucin normal. En este caso como se trata de un nivel de confianza de 95.0%, en las colas hay 5.0% y como es de dos colas, cada lado de la cola les corresponde la mitad es decir 2.5% o 0.025 a cada lado por lo que al buscar en el tabla de la distribucin normal el 0.475 de uno de los lados de la curva esta probabilidad se ubica en la columna de Z correspondiente a 1.9 y la columna 0.06, es decir Z = 1.96 Clculos del estadstico de la prueba Para la prueba de hiptesis lo esencial es calcular el estadstico de la prueba, esto es, el valor de Z o T, segn sea el caso, calculado a partir de los datos de la muestra y los cuales se comparan con el valor estndar obtenido a partir de la tabla correspondiente. El calculo que se hace indica en cuantos errores estndar se aleja el estimador del parmetro, para luego compara en cuantos debera alejarse. El clculo del estadstico se obtiene a partir de:
Estadstico
estimador.
Estimador Parmetro
S Estimador
, donde Estimador es el error estndar del
Decisin sobre la prueba de hiptesis Los datos obtenidos y los clculos realizados llevan a tomar una decisin, aceptar o rechazar la hiptesis nula. La regla es simple, solo hay que comparar el valor del estadstico calculado con el estadstico de la tabla. Si el valor absoluto del estadstico calculado es mayor que el valor estndar, este cae en zona de rechazo y por lo tanto hay evidencia para rechazar la hiptesis nula Redaccin de la conclusin La hiptesis nula plantea que la diferencia observada entre el estimador y el parmetro poblacional se debe a causas aleatorias o a la distribucin muestral, por lo tanto al hacer la compasin y decidir se debe redactar una conclusin sobre la veracidad o no de la hiptesis nula.
II. PRUEBA DE HIPOTESIS PARA UNA MUESTRA 6
Este procedimiento de prueba de hiptesis se usa cuando se desea conocer si la diferencia que se observa entre un estimador y su parmetro es estadsticamente significativa, esto es, si la diferencia que se observa se debe a la presencia de un factor o si por contrario se debe a causas aleatorias. En este procedimiento de prueba de hiptesis solo se dispone de datos de una muestra. En este caso los planteamientos de las hiptesis seran, segn sea el caso, los siguientes: Estadstico Promedio Proporcin o
porcentaje
Tipo de prueba Prueba bilateral o de dos colas Prueba unilateral a la derecha Prueba unilateral a la izquierda
Regla de decisin Rechazar H0 si el estadstico calculado es mayor o si es menor al estadstico de la tabla Rechazar H0 cuando el estadstico calculado sea mayor al estadstico de la tabla Rechazar H0 cuando el estadstico calculado sea menor al estadstico de la tabla
Ho: = ; Ha: Ho: = ; Ha: > Ho: = ; Ha: <
Ho: Px = P0; Ha: Px P0 Ho: Px = P0; Ha: Px > P0 Ho: Px = P0; Ha: Px < P0
PRUEBA DE HIPTESIS DEL PROMEDIO: Este procedimiento de prueba de hiptesis se usa cuando se desea conocer si la diferencia que se observa entre un promedio calculado a partir de una muestra y el promedio de la poblacin o parmetro es estadsticamente significativa, esto es, si la diferencia que se observa se debe a causas aleatorias o si por el contrario se debe a un factor no aleatorio que hace que se produzca tal diferencia. Ejemplo 1: Un psiclogo que trabaja para una escuela introdujo un nuevo mtodo de enseanza con el objetivo de facilitar el aprendizaje y mejorar las condiciones de trabajo del cuerpo de profesores. Antes de iniciar el nuevo mtodo de enseanza el rendimiento promedio de los estudiantes era de 74.4 puntos. Luego de tres meses de trabajar con el nuevo mtodo tom una muestra de 60 estudiantes y encontr un promedio de 77.8 puntos con una varianza de 95.2 puntos2. Con un nivel de confianza de 95.0% puede decirse que con el nuevo mtodo de enseanza el rendimiento es mayor. 1) Planteamiento de las hiptesis, para este caso se refiere a una prueba de una sola cola o unilateral, ya que se desea probar si promedio ahora es mayor, por lo tanto el planteamiento de las hiptesis es como sigue: Ho: = 74.4; Ha: > 74.4
2) Identificar el estadstico de la prueba, en este caso el estadstico de la prueba es la Distribucin Normal, dado que tenemos una muestra grande, por lo tanto el estadstico de la prueba es Zc x
Sx
3) Especificar el nivel de confianza de la prueba de hiptesis. Se desea un nivel de confianza de 95.0% y por lo tanto el rea de significacin es de 5.0%, por lo que el intervalo es:
Z =1.64 4) Realizando los clculos = 77.8 puntos, = 74.4 puntos, n = 60 estudiantes, S2 = 95.2 ptos2, Sx=9.8 puntos S 9.8 = 0.05 y S = x S = S =1.27 n 60
Zc
x , por lo tanto, Z 77.8 74.4 3.4 2.68 c

Sx
1.27
1.27
5) Decisin: Dado que el Z c = 2.68 es mayor que Z =1.64 hay evidencia para rechazar la hiptesis 6) Conclusin sobre el proceso. Como el valor de Z calculado cae en zona de rechazo, se puede concluir que existe evidencia para rechazar la hiptesis de que el promedio sigue siendo el mismo, pudiendo afirmar, con un nivel de confianza de 95.0%, que con el nuevo mtodo de enseanza el rendimiento del grupo es significativamente mayor. Ejemplo 2: Antes de recibir entrenamiento el promedio de fallas por empleado era de 2.0 y la desviacin estndar de 0.06. Tratando de mejorar esta situacin el Gerente de Recursos Humanos dispuso desarrollar un curso de entrenamiento y luego de poner en prctica los conocimientos del curso tom una muestra de nueve empleados y encontr que el promedio de fallas era de 1.95. Al observar los resultados el gerente de produccin plantea al de R. H. que el promedio de fallas por empleado sigue siendo el mismo. Con un nivel de confianza de 95.0% qu se puede decir acerca del planteamiento del gerente de produccin? 1) Planteamiento de las hiptesis, para este caso se refiere a una prueba de dos colas o bilateral, ya que se desea probar si promedio ahora es diferente, por lo tanto el planteamiento de las hiptesis es como sigue:
Ho: = 2.0 errores; Ha: 2.0 errores 2) Identificar el estadstico de la prueba, en este caso el estadstico de la prueba es la distribucin normal, dado que, aunque se tiene una muestra pequea, se conoce la x varianza de la poblacin, por lo tanto el estadstico de la prueba es Z c x 3) Especificar el nivel de confianza de la prueba de hiptesis. Se desea un nivel de confianza de 95.0% y por lo tanto el rea de significacin es de 5.0%, en ambos extremo, es decir 2.5% en cada lado por lo que el intervalo es:
-1.96 4) Realizando los clculos = 1.95, = 2, n = 9, 0.06 = x = =0.02 n 9
1.96
= 0.06,
= 0.05
Zc
x
x
Zc
1.95 2.00 0.05 2.50

0.02 0.02
5) Decisin: Dado que el Z c = -2.50 es menor que Z/2 = -1.96 se rechaza la hiptesis 6) Conclusin sobre el proceso. Como el valor calculado cae en el rea de significacin, existe evidencia para rechazar la hiptesis de que el promedio de fallas sigue siendo el mismo. Por lo que podemos decir que el entrenamiento ha tenido efectos positivos al reducir significativamente el promedio de fallas por empleado. Prueba de hiptesis del promedio en una muestra pequea, n < 30 Cuando se tienen datos de una muestra pequea y no se conoce la varianza de la poblacin, es decir que lo que se tiene es la varianza calculada a partir de la muestra, en este caso se procede a utilizar el estadstico T de la distribucin T de student, la cual tiene forma de campana con la caracterstica de que la curva es ms plana que en una muestra mayor dado el grado de variabilidad. Ejemplo 3: Un psiclogo industrial est midiendo en rendimiento de un grupo de empleados, para ello toma en consideracin el tiempo que tarda un empleado en terminar una tarea determinada. El tiempo promedio en terminar dicha tarea es de 9
0.30 minutos. Una estrategia para reducir este tiempo es colocar msica mientras los empleados desarrollan su trabajo y en una muestra de 16 empleados que trabajaron con msica se encontr un tiempo promedio de 0.28 minutos con una desviacin estndar de 0.017 minutos. Con un nivel de confianza de 99.0% puede decirse que la msica disminuye el tiempo en terminar dicha tarea? 1) Planteamiento de las hiptesis, para este caso se refiere a una prueba de una cola o unilateral, ya que se desea probar si el tiempo promedio en terminar una tarea ahora es menor, por lo tanto el planteamiento de las hiptesis es como sigue: Ho: = 0.30 minutos; Ha: < 0.30 minutos 2) Identificar el estadstico de la prueba, en este caso el estadstico de la prueba es la distribucin T de Student, dado que se tiene una muestra pequea y la varianza se calcul a partir de los datos de la muestra. En este caso el estadstico de la prueba es x tc Sx 3) Especificar el nivel de confianza de la prueba de hiptesis. Se desea un nivel de confianza de 99.0% y por lo tanto el rea de significacin es de 1.0%, en el extremo izquierdo:
t15, 0.01= -2.606

4) Realizando los clculos = 0.28, = 0.01 = 0.30, y n = 16, Sx = 0.017 S 0.017 S = x S = S = 0.0043 n 16
tc
x
Sx
tc
0.28 0.30
0.0043
0.02 4.651 0.0043

es menor que t15,
0.01
5) Decisin: Dado que el tc = - 4.651 hiptesis
= -2.977 se rechaza la
6) Conclusin sobre el proceso. Como se observa en el estadstico t calculado y el de la tabla, indica que existe evidencia para rechazar la hiptesis de que trabajando con msica los empleados duran el mismo tiempo para terminar su tarea. Siendo as, podemos concluir, con un 99.0% de confianza, que la msica ayuda a que los empleados tarden menos tiempo para terminar su tarea. 10
PRUEBA DE HIPTESIS PARA LA PROPORCIN: La proporcin define el porcentaje de xito de una variable, por ejemplo porcentaje de estudiantes promovidos, porcentaje de artculos defectuosos, porcentaje de personas que consumen un determinado producto, porcentaje de cuestas recuperadas, entre otros muchos casos. El procedimiento de la prueba de hiptesis es comparar el porcentaje de xito en la muestra, (Px) con el porcentaje de referencia o porcentaje de la poblacin (P0). Para el caso de la prueba de hiptesis de la proporcin siempre se utiliza la Distribucin Normal de Probabilidad, sin importar el tamao de la muestra. Para la prueba de la proporcin el estadstico Z es: Px P0 Zc P0 1 P0 n El denominador del estadstico Zc es error estndar de la proporcin, (Sp) por lo que el estadstico de la prueba se puede escribir como sigue:
Zc
Px P0
Sp
, siendo el error estndar de la proporcin, (Sp)
Sp
P 1 P 0 0 n
Ejemplo 4: Recordemos la introduccin del nuevo mtodo de enseanza, del ejemplo nmero uno, introducido por el psiclogo en la escuela, una de las variables estudiadas fue el nmero de estudiantes reprobados en aos anteriores y en este sentido encontr que de todos los estudiantes el 19.6% haba reprobado. Con el nuevo mtodo de enseanza en la muestra de 60 estudiantes se encontr que 11 de ellos haban reprobado. Con un nivel de significacin de 95.0% se puede decir que con el nuevo mtodo de enseanza el porcentaje de estudiantes reprobado es menor? Si X define el nmero de estudiantes reprobados, en la muestra de 60 estudiantes, Px = 11/60, es decir Px = 0.183 y P0 = 0.196. Ahora se puede calcular el error estndar P 1 P 0.19610.196 0 de la proporcin, (Sp), resultando: Sp 0 , as Sp , es decir n 60
Sp
0.196 x0.804 0.158 Sp 0.0026 0.051 60 60
Ahora se procede a probar la hiptesis: 1) Planteamiento de la hiptesis, lo que deseamos probar es si realmente el porcentaje de estudiantes reprobado es menor, por lo tanto el planteamiento de la hiptesis es: Ho: Px = P0; Ha: Px < P0
2) Estadstico de la prueba, para este caso se debe utilizar el estadstico Z, dado que se trata de una prueba para la proporcin: Z c P x P0
S
p
11
3) Especificar el nivel de confianza de la prueba, como se trata de una prueba unilateral o de una cola.
Z= -1.64 4) Realizando los clculos de la prueba Px = 11/60 Px= 0.183 P0 = 0.196, n = 60, y Sp = 0.051
(0.183 0.196) 0.013 0.25 Sp 0.051 0.051 5) Decisin sobre la veracidad o no de la prueba.
Luego, el clculo de Zc es: Zc
Px P0
Como Zc = -0.25 > Z = -1.64 se acepta la hiptesis 6) Redaccin de la conclusin: Dado que el valor del estadstico calculado cae en zona de aceptacin, podemos concluir que hay evidencia para aceptar la hiptesis de que el porcentaje de estudiantes reprobado es igual con el nuevo mtodo, que con el viejo, por lo que se puede decir con 95.0% de confianza que el nuevo mtodo de enseanza no contribuye a reducir el porcentaje de estudiantes reprobados. II. PRUEBA DE HIPOTESIS PARA DOS MUESTRAS Este procedimiento de prueba de hiptesis se usa cuando se desea conocer si existe diferencia entre un estadstico de una muestra y otro estadstico de otra muestra. El objetivo de este procedimiento es determinar la diferencia que se observa entre los estimadores de ambas muestras es estadsticamente significativa, esto es, si la diferencia que se observa se debe a la caracterstica de cada grupo o si por contrario se debe a causas aleatorias. En este procedimiento de prueba de hiptesis se dispone de datos de dos muestras y los planteamientos de las hiptesis seran, segn sea el caso, los siguientes: Estadsticos Proporciones Promedios
porcentajes Ho: Px Py = 0 Ha: P x P y 0 Ho: Px Py = 0 Ha: P x P y > 0 Ho: Px Py = 0 Ha: P x P y < 0
Tipo de prueba
Regla de decisin
Rechazar H0 si el estadstico calculado es mayor o si es menor al estadstico de la tabla Rechazar H0 cuando el estadstico calculado sea mayor al estadstico de la tabla Rechazar H0 cuando el estadstico calculado sea menor al estadstico de la tabla
Prueba bilateral Ho: ( ) = 0; o de dos colas Ha: ( ) 0 Prueba unilateral Ho: ( ) = 0; a la derecha Ha: ( ) > 0 Prueba unilateral Ho: ( ) = 0; a la izquierda Ha:( ) < 0
12
Los estadsticos de la prueba siguen siendo los mismos y se usan bajo los mismos criterios que los descritos anteriormente, la diferencia es que la frmula para el clculo del estadstico de la prueba vara segn sea el caso. PRUEBA DE HIPTESIS PARA LA DIFERENCIA ENTRE DOS PROMEDIOS: MUESTRAS GRANDES Cuando se desea comparar dos grupos de elementos, por ejemplo el rendimiento de dos grupos de estudiantes, dos grupos de trabajadores, los niveles de consumo entre dos poblaciones, la efectividad de dos terapias para tratar a un paciente, entre otros casos, el promedio es una herramienta muy til para representar a un grupo o una poblacin. En este sentido al momento de hacer una comparacin entre dos grupos se puede proceder con el procedimiento de prueba de hiptesis para la diferencia entre dos medias. Para la prueba de hiptesis de la diferencia entre dos medias con muestras grandes, el estadstico de la prueba est dado por:
zc
X Y
2 Sy S x2 nx ny
Donde: Zc : Estadstico de la prueba calculado X : Promedio del grupo X Y : Promedio del grupo Y S x2 : Varianza del grupo X
2 S y : Varianza del grupo Y
nx : Tamao de la muestra del grupo X ny : Tamao de la muestra del grupo Y Ejemplo 1: Se compar el desempeo de dos grupos de trabajadores, el grupo A, de 186 trabajadores, desarrollaron su trabaj en ambiente de auto administracin de las tareas y del tiempo, el grupo B de 172 trabajadores, desarroll su trabajo bajo la direccin de un supervisor que determinaba lo que se deba hacer y el tiempo en que se deba hacer. En el grupo A el desempeo promedio fue de 4.059 y una varianza de 0.704, mientras que en el grupo B el desempeo promedio fue de 3.68 y una varianza de 0.933. Con un 99.0% de confianza, se puede decir que existe diferencia significativa entre el desempeo de los grupos? 1) Planteamiento de las hiptesis, se nos pregunta si existe diferencia entre los dos grupos, de forma que tiene una prueba de hiptesis bilateral o de dos colas.
Ho: ( ) = 0; Ha: ( ) 0
13
2) Estadstico
de
la
prueba,
dado
que
teneos
independientes, el estadstico de la prueba es: z c
dos muestras X Y
2 Sy S x2 nx ny
grandes
3) Establecimiento de la zona de rechazo y zona de aceptacin, como se desea un nivel de confianza de 99.0%, la cola tendr un 1.0% divido en dos reas, por ser prueba bilateral, es decir Z/2 = Z0.01/2 = Z0.005
Zona de rechazo de Ho
Zona de aceptacin de Ho
Z0.005 =-2.57 4) Realizando los clculos
Z0.005=2.57
X = 4.059, Y = 3.680,
S x2 = 0.704,
2 S y = 0.933,
nx = 186
ny = 172,
NC = 99.0%,
/2 = 0.005
zc
(X Y )
2 2 Sx Sy nx n y
(4.059 3.680) 0.704 0.933 186 172
0.379 0.0038 0.0054
0.379 0.379 3.95 0.0092 0.0959
5) Decidiendo sobre el proceso, dado que el valor de Zc=3.95 es mayor que Z0.005=2.57, hay evidencia para rechazar la hiptesis. 6) Conclusin, como hay evidencia para rechazar la hiptesis nula de que los dos grupos tienen igual rendimiento, podemos decir con un nivel de confianza de 99.0% que el grupo A que trabaja con mayor autonoma tiene un rendimiento estadsticamente significativamente mayor que el grupo B, el cual es dirigido por un supervisor.
PRUEBA DE HIPTESIS PARA LA DIFERENCIA ENTRE DOS PROMEDIOS: MUESTRAS PEQUEAS Cuando se desea comparar las medias de dos grupos de y tienen datos que provienen de muestras pequeas, n < 30 elementos, el estadstico de la prueba de la diferencia de dos medias es el estadstico T de Student, el cual esta dado por:
tc
X Y S c2 S2 c nx ny
14
Donde:
tc : Estadstico de la prueba calculado

X : Promedio del grupo X, Y : Promedio del grupo Y,
S
2 c :
2 c 2 ( n x 1) S x2 ( n y 1) S y
nx : Tamao de la muestra del grupo X

ny : Tamao de la muestra del grupo Y
Varianza comn de los grupos. Esta varianza se calcula a partir de la siguiente frmula
(nx n y ) 2
Ejemplo 2: Se midi el nmero de ideas generadas por un grupo de ocho personas en presencia de un moderador y de seis personas en ausencia de ste. En presencia del moderador el nmero promedio de ideas fue de 78 con una desviacin estndar de 24.4, mientras que en ausencia del moderador el promedio de ideas fue 63.5 y una desviacin estndar de 20.2. Probar con 95.0% de confianza si la presencia del moderador influye en el nmero promedio de ideas. 1) Planteamiento de las hiptesis, s llamamos X al grupo que trabaja con el moderador y llamamos Y al grupo en ausencia del moderador y como se desea probar si la presencia del moderador influye en la generacin de ideas del grupo, las hiptesis a plantear son:
Ho: ( ) = 0; Ha: ( ) > 0
2) Estadstico de la prueba, al tratarse de dos muestras pequeas, el estadstico de la prueba es el estadstico T de Student
tc X Y S c2 S 2 c nx ny
3) Estableciendo zona de aceptacin y zona de rechazo, al tratarse de una prueba de una cola, con un nivel de confianza de 95.0%, en la cola derecha quedar el 5.0%,
Zona de aceptacin de Ho
t(12, 0.05) = 1.782 4) Realizando los clculos
X =78.0 ideas, Y =63.5 ideas
nx = 8 personas
ny =6 personas
15
S c2 : est dada por

2 c 2 ( nx 1) S x2 (ny 1)S y
(nx n y ) 2
(8 1) x 24.42 (6 1) x 20.22 (7 x595.4) (5x 408.0) (8 6) 2 (8 6) 2
S c2
4,1 67 .8 2, 04 0 6, 20 7.8 5 17 .3 , ahora se procede a calcular el estadstico 14 2 12
de la prueba tc
tc
(X Y ) S S nx n y
2 c 2 c
(78.0 63.5) 517.3 517.3 8 6
14.5 14.5 14.5 1.179 64.7 86.2 150.9 12.3
5) Decisin, dado que tc=1.179 es menor que t(12, aceptar la hiptesis nula.
0.05)
= 1.782, hay evidencia para
6) Conclusin, como se observa en los resultados finales, el valor del estadstico calculado es inferior al estadstico esperado, el de la tabla, por lo que hay evidencia para aceptar la hiptesis de que el nmero promedio de ideas generadas por cada grupo es igual. Siendo as, podemos afirmar con un 95.0% de confianza que la presencia del moderador no influye en la productividad de este grupo para generar ideas. PRUEBA DE HIPTESIS PARA LA DIFERENCIA ENTRE DOS PROPORCIONES Cuando lo que se desea comparar una cualidad o atributo de un grupo con el de otro grupo la prueba de la diferencia se basa en evaluar si la diferencia que se observa entre las dos proporciones es estadsticamente significativa. El contraste de la prueba se basa en la distribucin normal de probabilidad y el estadstico de la prueba es:
Zc
( px p y ) px q x p y q y nx ny
Donde:
px : Proporcin de xito en el grupo X, qx = (1- px ), nx : Tamao de la muestra del grupo X py Proporcin de xito en el grupo Y, qy = (1- qy )
ny : Tamao de la muestra del grupo Y
Ejemplo 3: De una muestra aleatoria de 100 empleados, 26 cometieron errores muy graves, mientras que de otro grupo de 135 con una mayor supervisin, 28 cometieron
16
errores muy graves. Probar a un 10.0% de significacin, que el nivel de supervisin no influye en el porcentaje de empleados que cometen errores muy graves. Llamemos X al primer grupo de 100 empleados que trabaj con menos supervisin y llamemos Y al grupo de 135 empleados que trabaj con mayor supervisin. 1) Planteamiento de las hiptesis, esta prueba puede plantearse como una prueba bilateral dado que no se especifica si un grupo es mayor o menor que otro. De ah que las hiptesis se pueden plantear como sigue:
Ho: Px Py = 0 Ha: P x P y 0
2) Estadstico de la prueba, dado que se trata de la diferencia entre dos
px q x p y q y nx ny 3) Establecimiento de la zona de rechazo y zona de aceptacin, es una prueba de dos colas y con un nivel de confianza de 90.0%, por lo tanto queda un 10.0% para ambos lados de la curva, es decir 5.0% para casa lado
Zona de rechazo de Ho Zona de aceptacin de Ho Zona de rechazo de Ho
proporciones, el estadstico de la prueba es Z c
( px p y )
Z0.05 = -1.64
Z0.05 = 1.64
17
Ejemplo1: Un artculo del New York Times en 1987 report que se puede reducir el riesgo de sufrir ataques al corazn ingiriendo aspirina. Para llegar a esta conclusin el cronista se bas en los resultados de un experimento diseado, en donde participaron dos grupos de personas. A un grupo de 11,034 personas se le suministr una dosis diaria de una pastilla que no contena ninguna droga (un placebo), y de estos 189 sufrieron posteriormente ataques razn, mientras que al otro grupo de 11,037 se les suministr una aspirina, y slo 104 lo sufrieron. Usando una prueba de hiptesis y un nivel de significacin del 1.0%, considera usted que el cronista del New York Times estaba en lo correcto?
http://siona.udea.edu.co 16/05/2008
18
Ejercicios 1. El gerente de crdito de una cadena de tiendas afirma que el saldo mensual promedio de las tarjetas habientes es $30. Para probar su acierto, un auditor selecciona una muestra aleatoria de 100 cuentas y encuentra que el saldo promedio es de $35 con una desviacin estndar de $12.50. Con un nivel de significacin de 0.01. Se puede decir que el saldo mensual es diferente de $30? 2. El fabricante de los acumuladores Dellco asevera que los acumuladores tienen una duracin promedio de 40,000 millas. Se aprob una muestra aleatoria de 81 acumuladores, se tuvo como una duracin promedio de 40,800 millas, con una desviacin estndar de la muestra de 5,400 millas con un nivel de significacin de 0.05. Es vlida la afirmacin del fabricante de los acumuladores Dellco. 3. Un fabricante de televisores anuncia que el 90% de sus aparatos no necesita ninguna reparacin durante los dos primeros aos de uso. La oficina de proteccin al consumidor selecciona una muestra de 100 aparatos y encuentra que 14 necesitan alguna reparacin durante los dos primeros aos de uso. Al nivel de significacin de 0.01. A qu conclusin puede llegar la oficina de proteccin al consumidor? 4. El propietario de una firma de mayoreo querra saber la proporcin de cuentas por cobrar con ms de 60 das de vencidas. El propietario estima que 15.0% de las cuentas por cobrar tienen ms de 60 das de vencidas. Una muestra aleatoria de 300 cuentas por cobrar revela que 44 tenan ms de 60 das de vencidas. Al nivel de significacin de 0.05. Es vlida la estimacin del propietario? 5. Se contrat a una empresa independiente dedicada a hacer pruebas para determinar si hay o no alguna diferencia en el kilometraje por galn de dos gasolinas diferentes, en el mismo modelo de automvil. La gasolina A se prob en 200 automviles y produjo un promedio de muestra de 18.5 millas por galn con una desviacin estndar de la muestra de 4.6 millas por galn. La gasolina B se prob en una muestra de 100 automviles y produjo un promedio de muestra de 19.34 millas por galn con una desviacin estndar de la muestra de 5.2 millas por galn. Al nivel de significacin de 0.05. Hay alguna diferencia en el rendimiento de las dos gasolinas? 6. Un investigador mdico estaba estudiando el peso de los nios y nias al nacer. Se seleccion una muestra aleatoria de cinco nios y seis nias, entre todos los bebes nacidos en el Hospital el ao anterior. El peso al nacer (en libras) de los bebes fue el siguiente: Nios Nias 5.3 2.8 6.4 6.8 7.4 8.0 4.7 7.3 6.2 3.4 5.5
a) Con un nivel de significacin de 0.02. Hay diferencia en el peso al nacer de los nios y las nias nacidas en ese hospital en el ao anterior? b) Tenemos que suponer que las dos muestras tienen una distribucin normal?. 7. Un analista financiero debe saber si ha habido o no cambio significativo en las utilidades por accin de un perodo a otro, entre las empresas industriales ms grandes de Estados Unidos. Una muestra aleatoria de 15 empresas seleccionadas entre las 500 ms grandes arroj los siguientes resultados:
19
Ganancia por Accin, ($) Empresa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Ao I 4.12 2.85 2.81 3.39 2.03 4.91 2.28 4.10 6.39 0.51 2.44 2.25 5.01 1.85 1.95 Ao II 4.79 3.20 3.34 1.94 2.86 3.69 2.50 4.30 7.16 1.78 0.80 1.31 5.06 2.15 2.07
a) Con un nivel de significacin de 0.01, Hay una diferencia en las utilidades por accin entre los dos aos? b) Que suposicin es necesario para efectuar es prueba? 8. Un estudio de mercado efectuado en Santo Domingo mostr que, en una muestra aleatoria de 100 mujeres casadas que trabajan tiempo completo, 64 prefirieron comprar caf instantneo, no obstante, en una muestra aleatoria de 100 mujeres casadas que trabajaban tiempo parcial slo 56 prefirieron comprar caf instantneo. Con el uso de un nivel de significacin de 0.05. Hay alguna diferencia entre la proposicin de los grupos de mujeres casadas que prefirieron caf instantneo? 9. Un auditor independiente restaba la legibilidad de los informes anuales de dos compaas grandes. Se seleccion una muestra aleatoria de 100 auditores independiente; de ellos, 50 se asignaron de forma aleatoria para leer el informe anual de la compaa A y los otros 50 para leer el informe anual de la compaa B. Con base en una medida estndar de legibilidad, 17 encontraron legible el informe anual de la compaa A y 23 encontraron legible el informe anual de la compaa B. Al nivel de significacin de 0.01. Hay alguna diferencia entre las dos compaas con la proporcin de auditores que encontraron legible el informe anual? 10. Se desea determinar si hay alguna diferencia, segn el sexo en la preferencia por la margarina contra la mantequilla. Una muestra entre 80 varones indic que 28 preferan la margarina a la mantequilla. Una muestra de 120 damas indic que 52 preferan la margarina a la mantequilla. Con un nivel de significacin de .05, Existe diferencia en la preferencia por la margarina sobre la mantequilla entre varones y hembras?
20

Apuntes Sobre Prueba de Hipotesis

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Apuntes Sobre Prueba de Hipotesis

Hochgeladen von

Copyright:

Verfügbare Formate

Apuntes sobre Prueba de Hiptesis

(Borrador para correccin)

Hctor Medina Disla

Santo Domingo Julio 2008

Prueba de hiptesis bilateral y unilateral

II. PRUEBA DE HIPOTESIS PARA UNA MUESTRA 6

Ho: = ; Ha: Ho: = ; Ha: > Ho: = ; Ha: <

x , por lo tanto, Z 77.8 74.4 3.4 2.68 c

-1.96 4) Realizando los clculos = 1.95, = 2, n = 9, 0.06 = x = =0.02 n 9

1.95 2.00 0.05 2.50

t15, 0.01= -2.606

0.02 4.651 0.0043

5) Decisin: Dado que el tc = - 4.651 hiptesis

, siendo el error estndar de la proporcin, (Sp)

0.196 x0.804 0.158 Sp 0.0026 0.051 60 60

independientes, el estadstico de la prueba es: z c

Z0.005 =-2.57 4) Realizando los clculos

(4.059 3.680) 0.704 0.933 186 172

0.379 0.0038 0.0054

0.379 0.379 3.95 0.0092 0.0959

tc : Estadstico de la prueba calculado

nx : Tamao de la muestra del grupo X

t(12, 0.05) = 1.782 4) Realizando los clculos

X =78.0 ideas, Y =63.5 ideas

S c2 : est dada por

(8 1) x 24.42 (6 1) x 20.22 (7 x595.4) (5x 408.0) (8 6) 2 (8 6) 2

4,1 67 .8 2, 04 0 6, 20 7.8 5 17 .3 , ahora se procede a calcular el estadstico 14 2 12

(78.0 63.5) 517.3 517.3 8 6

14.5 14.5 14.5 1.179 64.7 86.2 150.9 12.3

= 1.782, hay evidencia para

2) Estadstico de la prueba, dado que se trata de la diferencia entre dos

proporciones, el estadstico de la prueba es Z c

Das könnte Ihnen auch gefallen