Beruflich Dokumente
Kultur Dokumente
ESTADISTICA INFERENCIAL.
PRUEBAS DE HIPOTESIS
Se trata de rechazar o no rechazar alguna suposicin previa que se hace sobre algn parmetro de
la poblacin con base en la informacin que proporciona una muestra.
ERROR TIPO 1: consiste en rechazar una hiptesis nla que es cierta P(errortipo1) =
ERROR TIPO 2: consiste en no rechazar una hiptesis nula que es falsa P(errortipo2) =
Es la variable aleatoria, cuyo valor es una muestra dada, determinara si se rechaza o no se rechaza
la hiptesis nula.
Ejemplo
Siembre predominante de trigo equivalente a 3.5 toneladas por hectrea, una compaa
productora de semillas ha desarrollado una nueva variedad y pretende que el rendimiento
promedio es mayor que en la variedad comnmente usada. (o sea se est suponiendo que el
rendimiento es mayor o igual a 3,5). Para probar esta aceleracin se siembran 9 lotes
experimentales con la nueva variedad.
Se tiene una muestra aleatoria de tamao de una distribucin normal. Se quiere inferir sobre el
parmetro de la distribucin empleando la muestra que tiene
o lo elige el investigador segn requiera la estadstica de prueba para todos los juegos de
hiptesis es:
()
to=
Rechazar Ho si to>t(n-1)
Rechazar Ho si to< -t(n-1)
Rechaza Ho si to < ts(n-1) o to > ts(n-1) si n es es grande >30, para utilizarse Zn
o Zn/s en vez de ta y t/s
EJEMPLO
En un experimento para determinar los grados centgrados necesarios para llevar al punto de
ebullicin 1L de agua en una localidad se realizan 14 intentos obtenindose los siguientes
resultados. Pruebe la hiptesis: 100.2, 100.1, 99.3, 99.2, 99.8, 100.7, 98.5,100.3, 100.2, 99.7, 99.6,
99.8, 100.3, 99.6.
La estadstica de prueba es
2
2 ( 1)
=
2
Con un nivel de significancia las reglas de decisin son.
Rechazar Ho si Xo2>X2(n-1)
Rechazar Ho si Xo2< -X21-k(n-1)
Rechaza Ho si Xo2>X2(n-1) o Xo2< -X21-k/2 (n-1).
EJEMPLO
Para establecer la variabilidad en las mediciones de un equipo con el que se trata de determinar el
porcentaje de magnesio en un producto se realizan 12 determinaciones. Una solucin que se sabe
tiene 5% de magnesio. De acuerdo con las normas de calidad vigentes l mxima desviacin que se
puede tolerar es de 0.2% determine si el equipo es adecuado o no. LAS 12 DETERMINACIONES
ARROJAN LOS SIGUIENTES RESULTADOS(% de magnesio). 5.1, 4.8, 5.2, 5.3, 4.7, 4.8, 4.9, 5.5, 5.2,
4.9, 4.8,5.3.( si no me dicen cuanto es alfa elijo una significancia de 5%)
E()=
Se tiene una muestra aleatoria X1,X2,..Xn de una variable con la misma fdp, en la cual hay un
parmetro de inters , sean y dos estadsticas. Un intervalo de confianza ( , ) para es tal
que antes de tomar la muestra de probabilidad de que E ( ( , ) es 1-k.
Intervalo de confianza: para la media de una fdp normal este intervalo de confianza esta
dado por
= ( ) ( 1)
2
= + ( ) ( 1)
2
Ejemplo
Del ejemplo del rendimiento del trigo anterior, construya un intervalo de confianza al 90% para el
rendimiento promedio de la variedad usando la muestra usada en el ejemplo.
DISEOS FACTORIALES
En este caso se estudian dos o ms factores en cuanto a los aspectos sobre alguna variable de
respuesta cada factor tiene cierto nmero de niveles y se investigan todas las posibles
combinaciones de los niveles haciendo repeticiones en cada combinacin.
Para calcular SC error se requiere n > 2 asociadas a estas SC, tienen distribuciones Ji- cuadrada que
dan origen a una prueba F para cada Ho.
Qu diferencia hay entre venenos (se rechaza o no la primera hiptesis nula) y cual es ms
perjudicial. Variable de respuesta tiempo de supervivencia. Hay interaccin entre el veneno y el
antdoto?( uno depende del nivel del otro segn su efecto)
Para el antdoto.
Si no se cumplen los supuestos. El ANOVA que hemos calculado no es confiable por tanto debera
modificar los datos de la respuesta. Sacarles raz cuadra, inverso, logaritmos no hay reglas es ir
tanteando. Las mas comunes son 1/ variables o ln (variable) tambiens e usan variables ^n o raz de
variable.
GENERO DATOS
Es un caso particular de los diseos factoriales y el ms popular. Se tiene K factores cada uno con
dos niveles se requieren 2K observaciones por replica.
Este diseo es muy til es las primeras fases del trabajo experimental, cuando hay muchos
factores para analizar, pues el expediente que tiene menor numero de observaciones. Como hay
dos niveles en cada factor, se supone que la respuesta es lineal entre niveles
El Diseo 22
Hay solo dos factores A Y B cada uno con dos niveles. Las combinaciones de tratamiento se suelen
representar con letras minsculas, de tal manera que el nivel superior de cualquier factor de una
combinacin de tratamientos esta representado por la presencia de la letra minscula
correspondiente, mientras que la ausencia de la letra minscula representa el nivel inferior del
factor, Por convencin (i) se utiliza para representar la combinacin de todos los factores en el
nivel inferior.
El efecto de la interaccion entre los factores F1 Y F2 se define como la diferencia entre el efecto
de F1 en el nivel superior de F2 y el efecto en el nivel inferior de F2.
NO PONEMOS ALEATORIO SINO ESPACIADA POR QUE EL EXPRIMENTO YA SE HIZO SINO SE HA
HECHO SE PONE ALEATORIA
LIBRO DE DATOS TG TG DESPUES DE HOJA DE TRABAJO
UNA SOLA REPLICA EN EL DISEO 2K
Hacer repeticiones resulta costoso y a veces se est limitado a una sola replica con una sola replica
no hay estimacin del error. Hay dos estrategias para trabajar con una sola replica
Suponer que las interacciones de orden superior son despreciables y se aprovechan sus
grados de libertad para calcular el error.
Graficar las estimaciones de los efectos en papel de probabilidad normal los efectos
despreciables se distribuyen normalmente con media cero y varianza 2 y tienden a ubicar
en una lnea recta en esta grfica, mientras que los significativos tendrn medias
diferentes a cero y no se ubicaran en lnea recta.
Ejemplo 11.1
A: tiempo de rxn (80,90min)
B: T de rxn (170,180)
Variable de resp: rendimiento (%)
Solo hace una replica con 5 repeticiones al centro (verificar si hay curvatura y Gl
adicionales en experimentos sin replica para el error)
Se pone al final por que el experimento ya se hizo.
Si el valor P < 0,05 si hay curvatura (en falta de ajuste). ( el modelo no sirve)
REGRESION LINEAL SIMPLE
EJEMPLO
Residual es el error
Modelo es la regresin
Se rechaza la hiptesis nula por que el valor P<por ende hay relacion lineal entre X Y Y
CONTINUACION
0.174297(+-) 2.1009*0.0238286
0.174294(+-)0.05
Para X0 que ya medi se utiliza este
POR EJEMPLO, SI PONGO UNO QUE NO ESTA EN LOS DATOS COMO 75 SERIA UNA PREDICCION
Y TIENE MENOS CONFIANZA QUE UNO QUE ESTUVIERA EN LOS DATOS
ANTERIORMENTE QUITABAMOS LOS LIMITES D EPREDICCION Y CONFIANZA AHORA LOS
NECESITAMOS
EL INTERVALO TIENDE A CRECER EN LOS EXTREMOS, ESO QUIERE DECIR QUE ENTRE MAS
EXTREMO ES MENOS CONFIABLE
Coeficientes
Mnimos Cuadrados Estndar Estadstico
Parmetro Estimado Error T Valor-P
Intercepto -10.1315 1.9949 -5.07872 0.0001
Pendiente 0.174294 0.0238286 7.31447 0.0000
Anlisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razn-F Valor-P
Modelo 92.9335 1 92.9335 53.50 0.0000
Residuo 31.2665 18 1.73703
Total (Corr.) 124.2 19
en la tabla ANOVA es menor que 0.05, el modelo parece ser adecuado para los datos observados
con un nivel de confianza del 95.0%.