Sie sind auf Seite 1von 75

4,5,6 caps

ESTADISTICA INFERENCIAL.

PRUEBAS DE HIPOTESIS

Se trata de rechazar o no rechazar alguna suposicin previa que se hace sobre algn parmetro de
la poblacin con base en la informacin que proporciona una muestra.

ELEMENTOS DE LA PRUEBA: La hiptesis nula (Ho), es la que se quiere probar. Es la que el


investigador est dispuesto a sostener como placible a menos que la evidencia experimental en su
contra sea sustancial la hiptesis alternativa (Ha) es la negacin de la hiptesis nula.

ERROR TIPO 1: consiste en rechazar una hiptesis nla que es cierta P(errortipo1) =

ERROR TIPO 2: consiste en no rechazar una hiptesis nula que es falsa P(errortipo2) =

El nivel de significancia de la prueba es la probabilidad de cometer el error tipo 1, es

ESTADISTICA PARA LA PRUEBA DE HIPOTESIS.

Es la variable aleatoria, cuyo valor es una muestra dada, determinara si se rechaza o no se rechaza
la hiptesis nula.

Ejemplo

Siembre predominante de trigo equivalente a 3.5 toneladas por hectrea, una compaa
productora de semillas ha desarrollado una nueva variedad y pretende que el rendimiento
promedio es mayor que en la variedad comnmente usada. (o sea se est suponiendo que el
rendimiento es mayor o igual a 3,5). Para probar esta aceleracin se siembran 9 lotes
experimentales con la nueva variedad.

3.15, 3.92, 4.26, 3.36, 3.72, 4.19, 3.42, 4.38, 4.5

METODOLOFIA PARA REALIZAR LA PRUEBA DE HIPOTESIS.

1. Elegir un modelo probabilstico para el fenmeno.


X:rendimiento de la nueva variedad XN(
Identifique el parametro del modelo prbabilistico sobre el que s quiere inferir (se
quieresobre
Elegir el juego de hipotesis que se probara para el parmetro dado
Ho: < 3,5 en oposicin a Ha >3,5
Ho: > 3,5 en oposicin a Ha <3,5
Ho: =3,5 en oposicin a Ha diferente a 3,5
4. Se elige una estadstica de prueba, la distribucin de la estadstica depende del parmetro
escogido.
()
t0=
5. Se fija el nivel de significancia



6. Establecer la regin de rechazo y no rechazo de la prueba, Establecer la regla de decisin.
Esta depende de la distribucin de la estadstica de prueba.
Rechaza H0 si t0 > t(n-1) (Cola derecha)
Rechazar H0 si< t(n-1) (Cola izquierda)
Rechazar H0 si< t(n-1)

to= 9() (media-3,5)/desv estndar=2,31526 anlisis de una variable


GL=8 por n =9 y necesitamos t0,05 (8)
Como t0 > t0,05 Se rechaza H0
Con un nivel de significancia del 5% la evidencia experimental indica que el rendimiento de
la nueva variedad es mayor a 3,5.

El valor P de una prueba.


Es la probabilidad de que el estadstico de prueba tome un valor mas extremo que el
obtenido de la muestra, cuando H0 es cierta. (si valor P da menor que nivel de significancia
se rechaza la hiptesis nula sino no se rechaza).

PRUEBAS DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL.

Se tiene una muestra aleatoria de tamao de una distribucin normal. Se quiere inferir sobre el
parmetro de la distribucin empleando la muestra que tiene

Ho < en oposicin a Ha >


Ho > en oposicin a Ha <
Ho =o en oposicin a Ha u diferente o

o lo elige el investigador segn requiera la estadstica de prueba para todos los juegos de
hiptesis es:
()
to=

con un nivel de significancia X las reglas de decisin son

Rechazar Ho si to>t(n-1)
Rechazar Ho si to< -t(n-1)
Rechaza Ho si to < ts(n-1) o to > ts(n-1) si n es es grande >30, para utilizarse Zn
o Zn/s en vez de ta y t/s

EJEMPLO
En un experimento para determinar los grados centgrados necesarios para llevar al punto de
ebullicin 1L de agua en una localidad se realizan 14 intentos obtenindose los siguientes
resultados. Pruebe la hiptesis: 100.2, 100.1, 99.3, 99.2, 99.8, 100.7, 98.5,100.3, 100.2, 99.7, 99.6,
99.8, 100.3, 99.6.

Ho en oposicin a Ha diferente 100 con K


Si el valor P es mayor que el alfa no se rechaza

PRUEBA DE HIPOTESIS SOBRE LA VARIANZA DE UNA DISTRIBUCION NORMAL.

Ho < en oposicin a Ha >


Ho > en oposicin a Ha <
Ho =o en oposicin a Ha u diferente o

La estadstica de prueba es

2
2 ( 1)
=
2
Con un nivel de significancia las reglas de decisin son.

Rechazar Ho si Xo2>X2(n-1)
Rechazar Ho si Xo2< -X21-k(n-1)
Rechaza Ho si Xo2>X2(n-1) o Xo2< -X21-k/2 (n-1).

EJEMPLO

Para establecer la variabilidad en las mediciones de un equipo con el que se trata de determinar el
porcentaje de magnesio en un producto se realizan 12 determinaciones. Una solucin que se sabe
tiene 5% de magnesio. De acuerdo con las normas de calidad vigentes l mxima desviacin que se
puede tolerar es de 0.2% determine si el equipo es adecuado o no. LAS 12 DETERMINACIONES
ARROJAN LOS SIGUIENTES RESULTADOS(% de magnesio). 5.1, 4.8, 5.2, 5.3, 4.7, 4.8, 4.9, 5.5, 5.2,
4.9, 4.8,5.3.( si no me dicen cuanto es alfa elijo una significancia de 5%)

Entonces =0,2% 2=0,04. El juego de hiptesis a probar es que Ho 2>0,04 en oposicin a Ha


2<0,04 (hay que partir de que no c
OTRO METODO SINO ME DAN DATOS SINO LA MEDIA MUESTRAL Y DESV ESTANDAR Y n
ESTIMACION

Damos respuesta a dos preguntas

Qu valor se le puede atribuir a un parmetro a partir de la informacin de una muestra


En que intervalo es ms probable que se encuentre un parmetro a partir de la
informacin que se tiene
ESTIMACION PUNTUAL:

Estimador integrado: es un fdp cuya esperenza es igual al parmetro

E()=

ESTIMACION PUNTUAL DE PARAMETROS EN UNA DISTRIBUCION NORMAL

Los parmetros son y 2, la media y la varianza de la variable aleatoria. L a media aritmtica es


el estndar de y es X N(,/n), por lo tanto E()=m la varianza muestral S2 es el estndar de
2 y es pues E(S2)= 2

ESTIMACION POR INTERVALO

Se tiene una muestra aleatoria X1,X2,..Xn de una variable con la misma fdp, en la cual hay un
parmetro de inters , sean y dos estadsticas. Un intervalo de confianza ( , ) para es tal
que antes de tomar la muestra de probabilidad de que E ( ( , ) es 1-k.

P(( < < )=1-K

1-K es el nivel de confianza del intervalo.

Intervalo de confianza: para la media de una fdp normal este intervalo de confianza esta
dado por

= ( ) ( 1)
2


= + ( ) ( 1)
2

Ejemplo

Del ejemplo del rendimiento del trigo anterior, construya un intervalo de confianza al 90% para el
rendimiento promedio de la variedad usando la muestra usada en el ejemplo.

DISEOS FACTORIALES

En este caso se estudian dos o ms factores en cuanto a los aspectos sobre alguna variable de
respuesta cada factor tiene cierto nmero de niveles y se investigan todas las posibles
combinaciones de los niveles haciendo repeticiones en cada combinacin.

Para dos factores:


S.C total: Sc tratamientos A+ SC tratamientos B+SC interaccion AB+ SC error

Para calcular SC error se requiere n > 2 asociadas a estas SC, tienen distribuciones Ji- cuadrada que
dan origen a una prueba F para cada Ho.

Para probar los Ho se usan las estadsticas de prueba siguientes


EJEMPLO

Se analiza el efecto de 3 venenos y 4 antdotos en el tiempo de supervivencia de unas ratas de


laboratorio

Factor A: Veneno (i,ii,iii)

Factor B: Antdoto (A,B,C,D)

Qu diferencia hay entre venenos (se rechaza o no la primera hiptesis nula) y cual es ms
perjudicial. Variable de respuesta tiempo de supervivencia. Hay interaccin entre el veneno y el
antdoto?( uno depende del nivel del otro segn su efecto)

SE HACE CON I para A,B,C,D y adems 4 repeticiones en cada 1.


ESTO NOS DICE QUE EL ANTIDOTO Y EL VENENO INFLUYEN EN EL TIEMPO DE SUPERVIVICENCIA Y
SI HAY DIFERENCIA ENTRE VENENOS E ANTIDOTOS Y LA INTERACCION NO ES MUY MARCADA
PARA UN ALFA DE 0,05.

Verificar los supuestos de normalidad y la homocelasticidad de residuos.


Le doy al disquet y grafico los residuos.

Se grafica el normal y mirar si se ajusta tambin se mira P.

Tambin puede hacer esto


Luego podemos ir a anova y

Como la ultima es muy pequea tampoco cumple la homocelisticidad. ( si la variabilidad es


diferente entonces lo que hicimos no tiene validez.) Tambien podemos verificar con un anova
simple.
Como P es menor a 0,05 la homoelasticidad no se cumple

Para el antdoto.

Tampoco se cumple. P es menor.

Si no se cumplen los supuestos. El ANOVA que hemos calculado no es confiable por tanto debera
modificar los datos de la respuesta. Sacarles raz cuadra, inverso, logaritmos no hay reglas es ir
tanteando. Las mas comunes son 1/ variables o ln (variable) tambiens e usan variables ^n o raz de
variable.
GENERO DATOS

HAGO LO MISMO DISQUET Y RESIDUOS Y ANOVA MULTIFACTO.


AHORA SI CUADRA P Y ES MAYOR por tanto si cumple.

Y la Anova simple tambin nos dice que cumple la homocelestalidad.


Si hay diferencia entre antidotos y si hay diferencia entre venenos. Para saber cual es mejor peor o
mejor hacemos esto
Esto dice que est entre B Y D por que dan mejor tiempo de supervivencia porque estn en un
mismo rango.

DISEO FACTORIAL 2K.

Es un caso particular de los diseos factoriales y el ms popular. Se tiene K factores cada uno con
dos niveles se requieren 2K observaciones por replica.

Este diseo es muy til es las primeras fases del trabajo experimental, cuando hay muchos
factores para analizar, pues el expediente que tiene menor numero de observaciones. Como hay
dos niveles en cada factor, se supone que la respuesta es lineal entre niveles

El Diseo 22

Hay solo dos factores A Y B cada uno con dos niveles. Las combinaciones de tratamiento se suelen
representar con letras minsculas, de tal manera que el nivel superior de cualquier factor de una
combinacin de tratamientos esta representado por la presencia de la letra minscula
correspondiente, mientras que la ausencia de la letra minscula representa el nivel inferior del
factor, Por convencin (i) se utiliza para representar la combinacin de todos los factores en el
nivel inferior.

El efecto de un factor (promedio) se calcula como la diferencia entre la respuesta promedio (#


repeticiones) de las combinaciones de tratamientos en las que el factor se encuentra en nivel alto
y la respuesta promedio de las combinaciones de tratamientos en las que el factor se encuentra en
nivel bajo.

En ejemplo El efecto de la concentracin de reactivo A


=-5

Que de negativo o positivo se refiere a la proporcionalidad con respecto a la variable.

El efecto de la interaccion entre los factores F1 Y F2 se define como la diferencia entre el efecto
de F1 en el nivel superior de F2 y el efecto en el nivel inferior de F2.
NO PONEMOS ALEATORIO SINO ESPACIADA POR QUE EL EXPRIMENTO YA SE HIZO SINO SE HA
HECHO SE PONE ALEATORIA
LIBRO DE DATOS TG TG DESPUES DE HOJA DE TRABAJO
UNA SOLA REPLICA EN EL DISEO 2K

DISEO DE EXPERIMENTO DE MONTGOMERY

Hacer repeticiones resulta costoso y a veces se est limitado a una sola replica con una sola replica
no hay estimacin del error. Hay dos estrategias para trabajar con una sola replica

Suponer que las interacciones de orden superior son despreciables y se aprovechan sus
grados de libertad para calcular el error.
Graficar las estimaciones de los efectos en papel de probabilidad normal los efectos
despreciables se distribuyen normalmente con media cero y varianza 2 y tienden a ubicar
en una lnea recta en esta grfica, mientras que los significativos tendrn medias
diferentes a cero y no se ubicaran en lnea recta.

EJEMPLO 6.2: un producto qumico se fabrica en un envase presurizado y se lleva a cabo


un experimento factorial en la planta piloto para estudiar los factores que se piensa
influyen en la velocidad de filtracin de este producto. Los 4 factores son la T (A), P(B),
concentracin formaldehido (C), velocidad de agitacin (D). Se hace una sola replica de un
diseo 24 las 16 corridas se hacen de manera aleatoria y el ing del proceso esta interesado
en maximizar la velocidad de filtracin
Factor a,b,c,d (k ES EL NUMERO DE FACTORES)
Variable de respuea: v de filtracin
Replica(n-1)
Diseo: 24
Si no hay puntos centrales entonces no importa si se pone aleatoria o espaciado. Si ya se
hizo el experimento es espaciado.
Es 4 segn las variables.
La tabla de ANOVA no la calcula por que no hay grados de libertad y es 0 el error
Este grafico se utiliza cuando solo tiene 1 replica y no hay grados de libertad para calcular
el error.
Todos los efectos que estn sobre la lnea recta no tienen influencia estadstica
significativa. Por tanto los efectos significativos son A, AD, D,C,AC. (SE USA CUANDO SOLO
HAY UNA RECTA).
SI YO TENGO FORMALDEHIDO EN NIVEL BAJO AL CAMBIAR LA T HAY MUCHO CAMBIO,
PERO S ESTA EN NIVEL ALTO EL SISTEMA SE VUELVE RESISTENTE A LA T.
EN NIVEL BAJO DE AGITACION LA T NO AFECTA, MIENTRAS A NIVEL ALTO LA T SI LO
AFECTA MUCHO.

OTRO CAMINO PARA RESOLVER


ADICION DE PUNTOS CENTRALES AL DISEO 2K
Se utiliza para probar la linealidad de la respuesta entre los dos niveles de factores.
Agregar puntos controlados el diseo 2K permite verificar si existe curvatura y adems
aumenta los GL permitiendo estimar el error en diseos sin replica.

Ejemplo 11.1
A: tiempo de rxn (80,90min)
B: T de rxn (170,180)
Variable de resp: rendimiento (%)
Solo hace una replica con 5 repeticiones al centro (verificar si hay curvatura y Gl
adicionales en experimentos sin replica para el error)
Se pone al final por que el experimento ya se hizo.

Puntos centrales en el punto medio segn las repeticiones.


Segn la tabla anova nada influye

Solo incluyo la prueba de falta de ajuste si tengo puntos centrales.

Si el valor P < 0,05 si hay curvatura (en falta de ajuste). ( el modelo no sirve)
REGRESION LINEAL SIMPLE
EJEMPLO

En un artculo cientfico se describe un estudio para investigar la relacin entre la exposicin al


ruido y la hipertensin
Nos dice cual es la variable independiente, con intercepto y pendiente estimados
Intercepto = Bo y Pendiente en B1
La estimacin de la varianza es el 1,8364

Residual es el error

Modelo es la regresin

Se rechaza la hiptesis nula por que el valor P<por ende hay relacion lineal entre X Y Y
CONTINUACION

Este se utiliza para valores que nunca he medido (el Xo)


Intercepto

-10.1315(+-) t student (18) 1.9949

18 por que es n-2


Esto es t de student 0.025(18) para 0.975 da 2.1009

-10.135 (+-) 4.1911 (este salio de 2.1009* 1.9949)

Pendiente ,=0.05 (1-

0.174297(+-) 2.1009*0.0238286

0.174294(+-)0.05
Para X0 que ya medi se utiliza este

POR DEFECTO VIENE CON EL MAYOR Y EL MENOR

POR EJEMPLO, SI PONGO UNO QUE NO ESTA EN LOS DATOS COMO 75 SERIA UNA PREDICCION
Y TIENE MENOS CONFIANZA QUE UNO QUE ESTUVIERA EN LOS DATOS
ANTERIORMENTE QUITABAMOS LOS LIMITES D EPREDICCION Y CONFIANZA AHORA LOS
NECESITAMOS

EL VERDE DICE LOS LIMITES DE CONFIANZA.

GRIS ES PARA PREDECIR OTROS VALORES FUTUROS.

EL INTERVALO TIENDE A CRECER EN LOS EXTREMOS, ESO QUIERE DECIR QUE ENTRE MAS
EXTREMO ES MENOS CONFIABLE

LA FLECHA INDICA EL INTERVALO DE CONFIANZA ENTRE MAS SEPARADO MENOS CONFIABLE.


Ahora como saber si el modelo se ajusta bien.

Se deben verificar los supuestos de normalidad y homocelasticidad. Si hay repeticiones se


puede verificar esto.
)

Regresin Simple - Aumento presion sanguinea vs. Intensidad del sonido


Variable independiente: Intensidad del sonido (desi)
Lineal: Y = a + b*X
Nmero de observaciones: 20

Coeficientes
Mnimos Cuadrados Estndar Estadstico
Parmetro Estimado Error T Valor-P
Intercepto -10.1315 1.9949 -5.07872 0.0001
Pendiente 0.174294 0.0238286 7.31447 0.0000

Anlisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razn-F Valor-P
Modelo 92.9335 1 92.9335 53.50 0.0000
Residuo 31.2665 18 1.73703
Total (Corr.) 124.2 19

Coeficiente de Correlacin = 0.865019


R-cuadrada = 74.8257 porciento
R-cuadrado (ajustado para g.l.) = 73.4271 porciento
Error estndar del est. = 1.31796
Error absoluto medio = 0.989474
Estadstico Durbin-Watson = 2.28986 (P=0.6639)
Autocorrelacin de residuos en retraso 1 = -0.179127
Segn el valor P del anterior pantallazo la hiptesis Puesto que el valor-P para la carencia de ajuste

en la tabla ANOVA es menor que 0.05, el modelo parece ser adecuado para los datos observados
con un nivel de confianza del 95.0%.

Das könnte Ihnen auch gefallen