Beruflich Dokumente
Kultur Dokumente
CONCEPTOS PREVIOS:
x =Es madorinsesgado
Distribucin muestral de las varianzas:
Seudovarianza
xs
2
2
Ejemplo:Silavarianzadeladistribucinmuestraldelasmediases
Laprecisindeerrortpicodelamediadeunamuestra(como
estimadorde)es
2
x n n
queseestimacon
s2 s
s
x n n
Laprecisindelaestima ^
xs
X
Es s
X
Estimacin por intervalo:
Es la estimacin de un valor paramtrico obtenida con una
probabilidad dada () de que dicho valor se encuentre entre un
mximo y un mnimo determinados.
Ejemplo:
x 1,96 S x , x 1,96 S x
Porque en el intervalo comprendido entre 1,96 por encima y por
debajo de la media de una distribucin normal se encuentran el
95% de las observaciones. A se le denomina nivel de significacin
Muy frecuentemente la inferencia estadstica; es decir, la estima de
valores paramtricos a partir de una muestra se hace mediante
una Prueba o Contraste de Hiptesis
Para poder probar las hiptesis hay que realizar varios pasos
previos:
1) Lo primero es decidir cual es la variable que puede cuantificar el
carcter y poner de manifiesto el factor expresado en la hiptesis,
que solo se podr observar a partir de sus manifestaciones
2) Lo segundo es decidir cual es el modelo que explica la
variabilidad de la variable elegida, es decir, cual es la poblacin de
esta variable
3) El tercer paso es traducir la hiptesis planteada al lenguaje
estadstico, lo que implica la eleccin del estadstico de prueba
4) El cuarto paso es tomar la muestra y decidir las regiones de
aceptacin (Ho) y rechazo (Ha) de la hiptesis
5) El quinto paso es establecer la rebla de decisin y la
probabilidad de error (nivel de significacin)
Una hiptesis estadstica es una afirmacin sobre un modelo
probabilstico (poblacin) que una vez asumido, la nica o nicas
constantes desconocidas son los parmetros de la distribucin
(poblacin) correspondiente
Una prueba de hiptesis es un mtodo para dictaminar sobre la
probabilidad de esa afirmacin, usando muestras como
instrumento
Paraprobarunahiptesisestadsticasedivideelespaciodevalores
posibles del parmetro, en el que se esta interesado, en dos
subconjuntos; uno de ellos es el espacio definido por la hiptesis
nula que constituir la regin de aceptacin y el otro espacio es el
definido por la hiptesis alternativa que constituir la regin de
Rechazo
Una vez tomada la muestra se decide que, con ciertas
probabilidades de error,el parmetro en cuestin pertenece a uno
de esos dos subconjuntos. Pero no existe certeza de que no se
cometer un error
Ejemplo del examen tipo test con diez preguntas y cinco posibles
respuestas. Cada pregunta se puede considerar una repeticin del
experimento.
Se trata de un experimento que se ajusta a una distribucin
Binomial donde, si se llama xito (variable X) a un acierto del
alumno , el parmetro de la distribucin es p, la probabilidad de un
acierto. Por lo que se tiene que decidir sobre al magnitud de p, para
ello se puede adoptar la hiptesis de que el alumno no conoce la
materia, o hiptesis nula (Ho). y simplemente trata de adivinar la
respuesta por puro azar. Traducido al lenguaje probabilstico, se
tiene una funcin de probabilidad binomial con p=1/5; mientras
que A pretende que su p es mayor de 0.2. Se tiene, entonces, una
particin natural del espacio de posibles valores para p. Los valores
de p 0.2, corresponden a la hiptesis H0, mientras que los valores
p>0.2 corresponden a la hiptesis alternativa de que el alumno si la
conoce (Ha). La distribucin de probabilidades de X depende del
valor de p. Se rechaza Ho si el alumno acierta ms veces que las
que acertara diciendo al azar un nmero del 1 a 5
Al tomar una decisin se puede estar errando de dos maneras: decidiendo que
el alumno conoce la materia cuando no la conoce o decidiendo que no conoce
la materia cuando si la conoce.
Estadsticamente: se puede rechazar la Ho cuando es cierta y se puede no
rechazar la Ho cuando es falsa.
O bien
Siendo
Si la muestra es pequea
Datos:
G1 G2
6 5
9 3
8 4
7 3
Resultados:
ANOVA 1 Factor
F=t2
Comparacin de ms de dos medias: ANOVA de 1 Factor (Ejemplo2)
Datos:
G1 G2 G3
6 5 1
9 3 3
8 4 2
7 3 1
Clculos:
SCG x i 293, 5
g n gn
Valores de F
Probalidad de 0,1 F=3,01
encontrar un 0,05 F=4,26
azar 0,01 F=8,02
0,005 F=10,11
Todos son menores que F= 29,26, lo que quiere decir que el valor de F
encontrado tiene una probabilidad de haber salido por azar y no porque
pertenece a la distribucin F correspondiente a la hiptesis nula de igualdad de
varianzas. Es, por lo tanto, un valor correspondiente a un cociente de varianzas
diferente se la unidad y, consecuentemente, entre las medias comparadas
EL MODELO LINEAL ADITIVO:
-
1 1 - estimado por x1 - x 7,5 - 4,33 3,17
3 3 estimado por x 3 x 1, 75 4,33 2, 58
Los ij son xij i
Ejemplo, para la primera observacin: 11 5 4, 33 ( 0, 58) 1, 25
i 0
Lo que significa que las medias de los distintos grupos son iguales, ya que, por
ejemplo:
1 2 2 1 2 0
ALGUNOS MODELOS DE ANOVA
Modelo: xij i ij
a
Intra grupos (error o residual) ni a res 2
a
Total ni 1
a
2
1 a ni
CM G I n i
2 2
As, por ejemplo, se pueden estar contrastando la diferencia entre tres lneas
consanguneas de animales (o tres lneas puras de plantas) concretas,
elegidas a propsito (factor lnea fijo), para comparar sus medias, o se
pueden haber elegido esas tres lneas al azar en un conjunto de lneas para
saber si hay una varianza asociada al factor lnea (factor aleatorio) y
cuantificarla.
A) ANOVA de 1 FACTOR Modelo II (Factores aleatorios)
Modelo: x ij i ij
C.M.E. estima
res 2 no a2
res 2
^`
COMPONENTES DE LA VARIANZA: res 2 sres 2 CMresidual C.M .ERROR
^
C.M .GRUPOS C.M .ERROR
sa
2
a
2
no
sa2
% VARIACIN ENTRE GRUPOS: *100
sres sa
2 2
sa2 24,167
*100 *100 95,39%
s sa
2 2
25,334
%VARIACIN INTRA GRUPOS:
sres 2 1,167
*100 *100 4,61%
sres sa
2 2
25,334
B) ANOVA MULTIFACTORIAL:
COLUMNAS(C) (factor B)
n n n n
n n n n
FILAS(F)
n n n n
(factorA)
n n n n
n n n n
c 1
nc f 2
Entre columnas c-1
2
f 1
cf
Interaccin (f-1) (c-1)
2 n
2
c 1 f 1
Error fc(n-1) 2
ModeloI I Yijk Ai B j AB ij ijk
Aleatorio
CME
Entre filas n AB nf A
2 2 2
Entre columnas 2 n AB 2 nc B 2
Interaccin n2 2
AB
Error 2
Modelo mixto Yijk Ai j A ij ijk
CME
c
nf
Entre filas 2 n 2 B
c 1
2
Entre columnas 2 nc 2 B
Interaccin n
2 2
B
Error 2
SIGNIFICADO DE LOS EFECTOS Y DE LAS INTERACCIONES:
A1 A1 (B2-B1)1
Factor A
filas (f)
(B2-B1)2
A2 A2
_______
B1 B2 B2 B1
_______
Media marginal (A2-A1)1 (A2-A1)2 A2 A1
________
(A2-A1)1 y (A2-A1)2
efectos simples A2 A1
(B2-B1)1 y (B2-B1)2 ________ efectos principales
B2 B1
B1 B2 B2 B1
A1 2
A2 2
A2 A1 6 6
(B2-B1)1
(B2-B1)2
A1 A2
B1 B2 B2 B1
A1 2
A2 -10
A2 A1 6 6
(B2-B1)2
(B2-B1)1
A1 A2
3.- Hay interaccin debida al cambio de magnitud de la diferencia
entre los dos niveles de un factor en funcin del nivel del otro factor que
estemos considerando
B1 B2 B2 B1
A1 2
A2 8
A2 A1 6 2
(B2-B1)2
(B2-B1)1
A1 A2
Importante: La presencia o ausencia de efectos principales no nos dice nada
sobre la posible existencia o no de interaccin y viceversa.
Tipos de diseos con respecto al nmero de observaciones en cada casilla
(subgrupo)
Bloque 1
A D E B C F
Bloque 2
D E F A B C
A, B, C,D E, F son los tratamientos (hasta un n=t)
Puede haber bloques (hasta un n=b)
Ejemplo :
Gallos
1 2 3
Gallinas: 1 2 3 4 5 6 7 8
9
Modelo I: Mixto
2 n B nb i
2
Total abn-1
bi
a bi a nij
2
nij bi
nij
no
g .l .subgrupos
Pruebas de significacin:
Descomposicin de la varianza:
CM Sub CM Error S2 B A
S2 B A = 2 2 x100
n S S B A S A
2
CM Grupos CM Subg
S2 A % variacin entre grupos:
nb
S2 A
= S2 S2 S 2
B A A
En el ejemplo:
Estimacin de la varianza:
Tres planteamientos:
Tres planteamientos:
Ejemplo5:
Se quiere saber si hay diferencia en la produccin de piezas hechas por
cuatro trabajadores diferentes. Los datos son:
El ANOVA es:
Y las SC:
El ANOVA de estos contrastes:
1) Ho: - m1 - m2 + m3 + m4 = 0
2) Ho: + m1 + m2 - m3 - m4 = 0
3) Ho: + m1 - m2 - m3 + m4 = 0
4) Ho: + m2 - m3 = 0
5) Ho: + m1 - m4 = 0
Ejemplo6.-
Se han probado cuatro tratamientos en cuatro rebaos elegidos al azar.
Los cuatro tratamientos son cuatro piensos que tienen las siguientes
caractersticas:
Se quieren comparar las medias de los piensos con distinto nivel
energtico , las medias de los piensos con distinto nivel proteico y la
interaccin entre ambos. Los coeficientes sern:
-1 +1 -1 +1
-1 -1 +1 +1
+1 -1 -1 +1
En este caso los contrastes de los cuadrados medios de los dos factores
y de la interaccin se deben hacer dividiendo dichos cuadrados medios
por el cuadrado medio del error, porque la interaccin no es significativa
UNIANOVA
npiezas BY t
/CONTRAST (t)=SPECIAL (1 -1 1 -1)
/CONTRAST (t)=SPECIAL (1 1 -1 -1)
/CONTRAST (t)=SPECIAL (1 -1 -1 1)
/CONTRAST (t)=SPECIAL (0 1 -1 -0)
/CONTRAST (t)=SPECIAL (1 0 0 -1)
/METHOD = SSTYPE(1)
/INTERCEPT = INCLUDE
/CRITERIA = ALPHA(.05)
/DESIGN = t .
y EJECUTAR TODO
Para realizar el contraste de un cuadrado medio con otro que determinamos:
En el archivo Sintaxis1:
UNIANOVA
dato BY rebao tratamie
/METHOD = SSTYPE(3)
/INTERCEPT = INCLUDE
/CRITERIA = ALPHA(.05)
/TEST=tratamie VS tratamie*rebao
/TEST=rebao VS tratamie*rebao
/DESIGN = rebao tratamie rebao*tratamie .
Con los contrastes sera:
UNIANOVA
dato BY rebao tratamie
/CONTRAST (tratamie)=SPECIAL (1 -1 1 -1)
/CONTRAST (tratamie)=SPECIAL (-1 -1 1 1)
/CONTRAST (tratamie)=SPECIAL (1 -1 -1 1)
/METHOD = SSTYPE(3)
/INTERCEPT = INCLUDE
/CRITERIA = ALPHA(.05)
/TEST=tratamie VS tratamie*rebao
/TEST=rebao VS tratamie*rebao
/DESIGN = rebao tratamie rebao*tratamie .
Es como la anterior solo que no es secuencial y utiliza un solo rango crtico, que
es el correspondiente a la p del nmero total de medias. Para el clculo de este
valor crtico se necesita el valor de q que se encuentra en la Tabla 8 (ver el
archivo) segn la expresin:
Siendo:
el error tpico combinado, es decir, la raz cuadrada del cuadrado medio del
error dividido por el tamao de submuestra
q el valor que se encuentra en la tabla 8 para p=nmero total de medias y gl del
error
-No se incluye el trmino porque va incluido en los valores de q de la tabla
Siendo el error tpico combinado, es decir, la raz cuadrada del cuadrado medio
del error dividido por el tamao de submuestra y q los valores de la tabla 8 para
p=nmero de medias entre las dos que se estn contrastando y los gl del error
En el caso de tamaos de submuestras diferentes se utilizara como n el valor de
la media armnica de las dos submuestras, siendo la prueba:
Prueba de Duncan o de amplitudes mltiples
Siendo:
el error tpico combinado, es decir, la raz cuadrada del cuadrado medio del
error dividido por el tamao de submuestra y r los valores de la tabla 7 para
p=nmero de medias entre las dos que se estn contrastando y los gl del error.
Siendo:
Como F(3,12; 0.05) = 4.49 los tratamientos son significativos. Para saber si el
efecto de la dosis es lineal cuadrtico o cbico se toman los coeficientes
dados en la Tabla 6 para dichas funciones y 3 gl (n de tratamientos -1):
Las SC son:
El ANOVA correspondiente ser: