Sie sind auf Seite 1von 8

MEDIA CON MUESTRA GRANDE

Hoy vamos a ver como se puede realizar una inferencia acerca de un parmetro
poblacional probando (o comprobando) una hiptesis acerca de su valor. Veamos
algunos ejemplos en donde se puede usar una prueba de hiptesis:

Un investigador en medicina propone la hiptesis de que un medicamento A es


ms efectivo que otro B para curar una cierta enfermedad.
Un tcnico de control de calidad propone la hiptesis de que un nuevo mtodo de
montaje produce slo 5% de artculos defectuosos.
Un educador afirma que dos mtodos para ensear tiene la misma eficacia.
Un candidato poltico afirma que la mayora de los votantes estn de su parte.

En todos estos casos la hiptesis o afirmacin se somete a una prueba estadstica


para compararla con los resultados de los datos muestrales. Vamos a ver:
Qu funcin de las mediciones muestrales debe utilizarse para realizar la prueba.
Cmo se decide si una muestra no concuerda con la hiptesis
Cundo debe rechazarse la hiptesis, aceptarse la hiptesis o no decidir nada
acerca de la hiptesis.
Cul es la probabilidad de tomar una decisin equivocada.
elementos de una prueba de hiptesis
El objetivo de toda prueba de hiptesis es probar una hiptesis acerca del valor de
un parmetro poblacional. Entonces el primer elemento de la prueba de hiptesis
es la afirmacin o hiptesis sobre el valor de uno o ms parmetros poblacionales
y recibe el nombre de hiptesis alternativa.
MEDIA CON MUESTRA PEQUEA
Prueba de hiptesis Muestras pequeas
Introduccin Para emplear la distribucin z es necesario conocer la desviacin
estndar de la poblacin y tener una muestra grande (>30). Si no conoce la
desviacin estndar de la poblacin y el nmero de observaciones de la muestra
es menor que 30, entonces es posible utilizar la desviacin estndar de la muestra
como una estimacin de la desviacin estndar de la poblacin; pero no es posible
utilizar la distribucin normal, el estadstico adecuado es t.
Caractersticas de una distribucin t William S. Gossett desarroll la distribucin t
de Student. 1. Al igual que la distribucin z, es una distribucin continua. 2. Al igual
que z, tiene forma de campana y es simtrica. 3. Al igual que z, no hay una
distribucin t, sino una familia de distribuciones. Todas con la misma media (0);
pero con distinta desviacin estndar, de acuerdo al tamao de la muestra. 4. La
distribucin t es ms ancha y ms plana que la distribucin z. A medida que la
muestra es ms grande, se asemeja ms a la distribucin z.
Prueba para la media de la poblacin Poblacin normal? n => 30 Prueba no
paramtrica Use z Conoce la Desv. Est.? Use t Use z No No No Si Si Si
Recuerde: Cmo comprobar una hiptesis? 1.Plantear las hiptesis nula y
alternativa(s). 2.Seleccionar un nivel de significancia. 3.Calcular el estadstico de
prueba. 4.Formular la regla de decisin. 5.Tomar una decisin. El costo promedio
de resolver una queja en la empresa es de $60.00. Se adoptaron medidas para
reducir los costos. Se analizaron los costos de 26 quejas y se calcul un
promedio de $57.00 y una desviacin estndar de $10.00. Con un nivel de
significancia de 0.01, se puede concluir que las medidas adoptadas reducen los
costos?
Paso 1: Establecer hiptesis nula y alternativa H0: Promedio >= $60.00 Ha:
Promedio < $60.00
8. Paso 2: Seleccionar nivel de significancia Siendo un problema de calidad, se
selecciona 0.01 (la tabla de distribucin t, incluye tambin 0.005 y 0.0005.
9. Paso 3: Resuelva el estadstico de prueba De acuerdo al diagrama en la
dispositiva 4, se utiliza el estadstico de prueba t. Sustituyendo, t=-1.530 n s t

10. Paso 4: Formar regla de decisin Utilice la tabla: Distribucin t para encontrar
el valor crtico. En la columna del lado izquierdo de la tabla, encontrar los
grados de libertad (gl). Los grados de libertad son igual al nmero de
observaciones en la muestra, menos el nmero de muestras (1). En segundo
lugar, se debe determinar si se trata de una prueba de una o dos colas. En este
caso., 2.485
11. Paso 5: Se toma una decisin Como se trata de una prueba con una cola, y
la regin de rechazo est en la cola izquierda, el valor crtico es negativo. La
regla de decisin seala que se debe rechazar la H0, si t pasa el valor crtico de
-2.485. Como -1.530 est a la derecha del valor crtico, no se rechaza la
hiptesis nula.
RECTA DE REGRESIN DE MNIMOS CUADRADOS
Una recta que mejor se ajusta es una lnea recta que es la mejor aproximacin del
conjunto de datos dado.
Es usada para estudiar la naturaleza de la relacin entre dos variables.
Una recta que mejor se ajusta puede ser determinada aproximadamente usando el
mtodo visual al dibujar una lnea recta en una grfica de dispersin para que
tanto el nmero de puntos arriba de la recta y debajo de la recta sean casi iguales
(y la lnea pasa a trves de tantos puntos como sea posible).
Una forma ms precisa de encontrar la recta que mejor se ajusta es el mtodo de
mnimos cuadrados .
Use los pasos siguientes para encontrar la ecuacin de la recta que mejor se
ajusta para un conjunto de parejas ordenadas .
Paso 1: Calcule la media de los valores de x y la media de los valores de y .
Paso 2: Realice la suma de los cuadrados de los valores de x .
Paso 3: Realice la suma de cada valor de x multiplicado por su valor
correspondiente y .
Paso 4: Calcule la pendiente de la recta usando la frmula:

donde n es el nmero total de puntos de los datos.


Paso 5: Calcule la intercepcin en y de la recta usando la frmula:

donde son las medias de las coordenadas de x y y de los puntos de datos


respectivamente.
Paso 6: Use la pendiente y la intercepcin en y para formar la ecuacin de la
recta.

INTERVALO DE CONFIANZA PARA LOS COEFICIENTES BI

Si se requieren intervalos de confianza para los coeficientes de regresin y ,


se sustituye el trmino medio de t < t < t por el estadstico t adecuado
del teorema anterior. Luego, por medio de clculos simples, se determinan los
correspondientes intervalos de confianza:
Problema: Los siguientes datos son las mediciones de la velocidad del aire
y del coeficiente de evaporacin de las gotitas de combustible en una turbina de
propulsin:

Velocidad del aire 20 60 100 140 180 220 260 300 340 380
(cm/s)
Coeficiente de Eva- .18 .37 .35 .78 .56 .75 1.18 1.36 1.17 1.65
poracin (mm2/seg)

Construir un intervalo de confianza del 95% para el coeficiente de regresin .


PRUEBA DE HIPTESIS PARA LOS COEFICIENTES DE REGRESIN
La prueba de significancia del modelo nos permite determinar estadsticamente si
las variables independientes (en conjunto) tienen efecto o no sobre la variable
dependiente.
Para realizar esta prueba se requiere descomponer la suma total de cuadrados,
representada por Syy, en dos componentes: SSR y SSE
Syy = SSR + SSE
Donde:
Syy es la suma total de cuadrados
SSR es la suma de cuadrados de la regresin
SSE es la suma de cuadrados del error
Las ecuaciones apropiadas para calcular las expresiones anteriores son:
2
n

n
Y i

Syy Yi 2 i 1

i 1 n

2
n

Y i

SSR X Y i1

SSE Syy SSR

Partimos de las hiptesis:

H 0 : 1 2 0
Ha : i 0

Utilizamos la tabla de anlisis de varianza:


COEFICIENTE DE CORRELACIN
En una distribucin bidimensional puede ocurrir que las dos variables guarden
algn tipo de relacin entre si.
Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es
muy posible que exista relacin entre ambas variables: mientras ms alto sea el
alumno, mayor ser su peso.
El coeficiente de correlacin lineal mide el grado de intensidad de esta posible
relacin entre las variables. Este coeficiente se aplica cuando la relacin que
puede existir entre las variables es lineal (es decir, si representramos en un
grfico los pares de valores de las dos variables la nube de puntos se aproximara
a una recta).

No obstante, puede que exista una relacin que no sea lineal, sino exponencial,
parablica, etc. En estos casos, el coeficiente de correlacin lineal medira mal la
intensidad de la relacin las variables, por lo que convendra utilizar otro tipo de
coeficiente ms apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor
es representar los pares de valores en un grfico y ver que forma describen.
INTERVALO DE CONFIANZA PARA LOS COEFICIENTES DE CORRELACIN
Los procedimientos que se tuvieron en cuenta para la construccin de intervalos
de con encapara el cociente de correlacin en una distribucin normal bivariado, di
eren en calidad dependiendo del tamao de muestra empleado para ello. Se pudo
observar que, en el caso
de muestras pequeas (n= 5 yn= 10), los que mejor desempe~no tuvieron fueron
los de Razn de Verosimilitud y Bootstrap. El mtodo de Razn de Verosimilitud
ofrece longitudes
cortas de intervalo y nivel de con onza real mas cercano al nivel nominal
establecido en este estudio de simulacin, 95 % para correlaciones desde 0 hasta
0.7. En los casos restantes, es
decir, correlaciones de 0.8 y 0.9, el mtodo Bootstrap supera al anterior. Cuando
n= 20, el mtodo que se comporta mejor en la gran mayora de las correlaciones
consideradas es el de Pivote Generalizado. Le siguen en orden de calidad el
intervalo obtenido por el mtodo de Razn de Verosimilitud. Cuando
n= 50 yn= 100, todos los metodos
tienen un comportamiento casi igual. Las longitudes de intervalo para cada uno de
estos doscasos (n= 50 yn= 100) disminuyen considerablemente a lo observado en
el caso anterior,
es decir, en comparacin con= 20, como se puede evidenciar en las tablas.
En la mayor a de los casos, el mtodo de Bootstrap ofrece niveles de con anza
reales menores que los de los demas metodos. Se observa un detalle muy
particular con respecto a estacaracterstica y todos los mtodos a excepcion del
Pivote Generalizado: los niveles de con-
anza reales son muy parecidos entre cuando el tama~no de muestra es muy
grande (n=100).
En la parte Bayesiana se puede notar que en la mayor de los casos, los resultados
obtenidos

Das könnte Ihnen auch gefallen