Sie sind auf Seite 1von 82

Repaso de Conceptos Estadsticos Bsicos

CONCEPTOS PREVIOS:

PARMETROS: Valores que definen la distribucin de una o ms


variables en una poblacin. Se representan con caracteres griegos

Ejemplos: Media , Varianza 2, Coeficiente de regresin

ESTADSTICOS: Valores que definen la distribucin de una o ms


variables en una muestra. Se representan con caracteres latinos.
Ejemplos: Media , Varianza s2, Coeficiente de regresin b

Se utilizan como estimadores de los parmetros de la distribucin


poblacional
Inferencia: Descripcin de caractersticas (parmetros, por
ejemplo) de una poblacin a partir de una muestra

Estimacin: De un parmetro poblacional con un estadstico


muestral

Mtodo de estimacin: Procedimiento para obtener un estimador


Ejemplos: Mnimos cuadrados Mxima verosimilitud.

Distribucin muestral de un estimador: Es la distribucin que se


obtendra con los valores del estimador (estadstico) de un nmero
infinito de muestras extradas de la poblacin en la que se estima
el parmetro.

Ejemplo: Distribucin muestral de las medias, es la distribucin


de infinitas medias maestrales
Sesgo Diferenciaentreelvalormediodeladistribucinmuestral
deundeterminadoestimadoryelparmetroqueestima
Ejemplo:
N~ muestrasdetamaon,extradasdeunapoblacin
Distribucinmuestraldelasmedias: Media=mediadetodaslas

mediasmuestrales=mediaparamtrica= x


x =Es madorinsesgado
Distribucin muestral de las varianzas:

Seudovarianza


xs
2
2

La varianza muestral es:


2


x x

s2 Estimador Sesgado
n 2



x x

xs
2
2
s
2
Seudovarianza Insesgado
n 1
Precisindeunaestimacin(errortpico) Esladesviacintpica
deladistribucinmuestraldelestimador.

Ejemplo:Silavarianzadeladistribucinmuestraldelasmediases
Laprecisindeerrortpicodelamediadeunamuestra(como
estimadorde)es
2


x n n
queseestimacon
s2 s
s
x n n
Laprecisindelaestima ^
xs
X
Es s
X
Estimacin por intervalo:
Es la estimacin de un valor paramtrico obtenida con una
probabilidad dada () de que dicho valor se encuentre entre un
mximo y un mnimo determinados.

Ejemplo:

El intervalo de confianza del valor paramtrico.de la media con un


=0,05 (95% de probabilidad) es (si el tamao muestral n es grande):



x 1,96 S x , x 1,96 S x


Porque en el intervalo comprendido entre 1,96 por encima y por
debajo de la media de una distribucin normal se encuentran el
95% de las observaciones. A se le denomina nivel de significacin
Muy frecuentemente la inferencia estadstica; es decir, la estima de
valores paramtricos a partir de una muestra se hace mediante
una Prueba o Contraste de Hiptesis
Para poder probar las hiptesis hay que realizar varios pasos
previos:
1) Lo primero es decidir cual es la variable que puede cuantificar el
carcter y poner de manifiesto el factor expresado en la hiptesis,
que solo se podr observar a partir de sus manifestaciones
2) Lo segundo es decidir cual es el modelo que explica la
variabilidad de la variable elegida, es decir, cual es la poblacin de
esta variable
3) El tercer paso es traducir la hiptesis planteada al lenguaje
estadstico, lo que implica la eleccin del estadstico de prueba
4) El cuarto paso es tomar la muestra y decidir las regiones de
aceptacin (Ho) y rechazo (Ha) de la hiptesis
5) El quinto paso es establecer la rebla de decisin y la
probabilidad de error (nivel de significacin)
Una hiptesis estadstica es una afirmacin sobre un modelo
probabilstico (poblacin) que una vez asumido, la nica o nicas
constantes desconocidas son los parmetros de la distribucin
(poblacin) correspondiente
Una prueba de hiptesis es un mtodo para dictaminar sobre la
probabilidad de esa afirmacin, usando muestras como
instrumento
Paraprobarunahiptesisestadsticasedivideelespaciodevalores
posibles del parmetro, en el que se esta interesado, en dos
subconjuntos; uno de ellos es el espacio definido por la hiptesis
nula que constituir la regin de aceptacin y el otro espacio es el
definido por la hiptesis alternativa que constituir la regin de
Rechazo
Una vez tomada la muestra se decide que, con ciertas
probabilidades de error,el parmetro en cuestin pertenece a uno
de esos dos subconjuntos. Pero no existe certeza de que no se
cometer un error
Ejemplo del examen tipo test con diez preguntas y cinco posibles
respuestas. Cada pregunta se puede considerar una repeticin del
experimento.
Se trata de un experimento que se ajusta a una distribucin
Binomial donde, si se llama xito (variable X) a un acierto del
alumno , el parmetro de la distribucin es p, la probabilidad de un
acierto. Por lo que se tiene que decidir sobre al magnitud de p, para
ello se puede adoptar la hiptesis de que el alumno no conoce la
materia, o hiptesis nula (Ho). y simplemente trata de adivinar la
respuesta por puro azar. Traducido al lenguaje probabilstico, se
tiene una funcin de probabilidad binomial con p=1/5; mientras
que A pretende que su p es mayor de 0.2. Se tiene, entonces, una
particin natural del espacio de posibles valores para p. Los valores
de p 0.2, corresponden a la hiptesis H0, mientras que los valores
p>0.2 corresponden a la hiptesis alternativa de que el alumno si la
conoce (Ha). La distribucin de probabilidades de X depende del
valor de p. Se rechaza Ho si el alumno acierta ms veces que las
que acertara diciendo al azar un nmero del 1 a 5
Al tomar una decisin se puede estar errando de dos maneras: decidiendo que
el alumno conoce la materia cuando no la conoce o decidiendo que no conoce
la materia cuando si la conoce.
Estadsticamente: se puede rechazar la Ho cuando es cierta y se puede no
rechazar la Ho cuando es falsa.

= P(Error Tipo I) = P(rechazar la Ho cuando es cierta)


= P(Error Tipo II) = P(aceptar la Ho cuando es falsa)

Si (p) = P(rechazar Ho cuando el verdadero valor del parmetro es p), para


todos los valores de p en la Ho (p) = Probabilidad de Error Tipo II = y para
todos los valores de p en la H1 d(p) = 1 - Probabilidad de Error Tipo II =1-

Puesto que (p) es la probabilidad de rechazar una hiptesis dada,


dependiendo del verdadero valor del parmetro, se la llama funcin de
potencia de la prueba.
Prueba de hiptesis sobre la media de una distribucin normal

La media de la distribucin muestral de las medias es una variable con la


siguiente distribucin:

Si se quiere contrastar una hiptesis

Porque la regin de rechazo es

O bien

Siendo
Si la muestra es pequea

Este es un contraste de hiptesis relativo a la media para la cola derecha:

De forma similar sera para la cola izquierda:

Y para las dos colas:


En la tabla de valores de t el valor para un contraste de medias de una cola para
gl=9 y =0,05 es 1,8331, por tanto para el contraste de cola izquierda
Comparacin de las medias de dos grupos de observaciones

La media de la distribucin muestral de la diferencia de las medias es:


Ejemplo de comparacin de medias mediante una prueba t de Student y
mediante un ANOVA de un factor (Ejemplo1)

Datos:
G1 G2
6 5
9 3
8 4
7 3

Resultados:

t-Student = 4,666 P0,003

ANOVA 1 Factor

Origen Var. Suma de cuadrados gl Media cuadrtica F P


Inter-grupos 28,125 1 28,125 21,774 0,003
Intra-grupos 7,750 6 1,292
Total 35,875 7

F=t2
Comparacin de ms de dos medias: ANOVA de 1 Factor (Ejemplo2)

Datos:
G1 G2 G3
6 5 1
9 3 3
8 4 2
7 3 1
Clculos:

Grupos Gi para i = (1,2,3)


Nmero de grupos g = 3
Nmero de observaciones por grupo n=4
Nmero total de observaciones: N = g*n = 12
G1 x11 = 6 x12 = 5 x13 = 1
G2 x12 = 9 x22 = 3 x23 = 3
G3 x31 = 8 x32 = 4 x33 = 2
G4 x41 = 7 x42 = 3 x43 = 1
Suma de las observaciones de cada grupo: x1 30; x2 15; x3 7

Medias de los grupos: x1 7, 5; x 2 3, 75; x 3 1, 75

Media general: x x .. 4, 333....


Suma de cuadrados:

Suma de cuadrados total sin corregir por la media: Es la suma de los


cuadrados de todas las observaciones
No se puede mostrar la imagen en este momento.

Suma de cuadrados total corregida por la media: Es la suma de cuadrados


total a la que se le resta el trmino de correccin (T.C.):
No se puede mostrar la imagen en este momento.

No se puede mostrar la imagen en este momento.

El trmino de correccin es:


No se puede mostrar la imagen en este momento.

= Suma de cuadrados de la media


Suma de los cuadrados de las medias de los grupos referida a la suma de
cuadrados de la media Es la suma de cuadrados entre grupos:

2 ( x i )2 xi2 ( x ..)
2

SCG x i 293, 5
g n gn

Resto = Suma de cuadrados Residual o del Error Es la suma de


cuadrados intragrupos:

SC I SC Re sidual SC Error SCTC SCG 10, 5

Las sumas de cuadrados son aditivas: SCT SCG SC I


Grados de libertad:

Dependen de los tamaos muestrales


g.l. Entre Grupos = N Grupos -1 = 3-1 = 2

g.l. Intra Grupos = N Grupos * (Tamao Grupo -1) = g (n-1) = 3*(4-1) = 9

g.l. Totales = N Observaciones -1 = 12-1 = 11


Cuadrados medios o medias cuadrticas:
SCG
-Entre grupos: CM G 97, 833
2
SC Re sidual
-Intra grupos, residual o error: CM I CM Re sidual 1,167
9
CM G 97, 833
F 83, 857
CM residual 1,167

F es un estadstico cuya distribucin muestral es una F de Snedecor


Buscando en la tabla de valores de la F de Snedecor los correspondientes a 2 g.l.
(numerador) y 9 g.l. (denominador)

Valores de F
Probalidad de 0,1 F=3,01
encontrar un 0,05 F=4,26
azar 0,01 F=8,02
0,005 F=10,11
Todos son menores que F= 29,26, lo que quiere decir que el valor de F
encontrado tiene una probabilidad de haber salido por azar y no porque
pertenece a la distribucin F correspondiente a la hiptesis nula de igualdad de
varianzas. Es, por lo tanto, un valor correspondiente a un cociente de varianzas
diferente se la unidad y, consecuentemente, entre las medias comparadas
EL MODELO LINEAL ADITIVO:

Las observaciones del ejemplo anterior se pueden expresar con el siguiente


modelo:
x ij i ij

2 2 estimado por x x 3, 75 4,33 0,58
2

-
1 1 - estimado por x1 - x 7,5 - 4,33 3,17

3 3 estimado por x 3 x 1, 75 4,33 2, 58
Los ij son xij i
Ejemplo, para la primera observacin: 11 5 4, 33 ( 0, 58) 1, 25
i 0
Lo que significa que las medias de los distintos grupos son iguales, ya que, por
ejemplo:
1 2 2 1 2 0
ALGUNOS MODELOS DE ANOVA

A) ANOVA de 1 FACTOR ModeloI (Factores fijos)

Modelo: xij i ij

O.V. g.l. C.M.E. Estima___


a
Entre grupos a 1 res no ai2
2

a
Intra grupos (error o residual) ni a res 2
a

Total ni 1

a
2
1 a ni

no ni a , siendo a el nmero de grupos. Si ni igual


a 1 en todos, n0=n


n i


Si se considera un modelo de efectos fijos, los cuadrados medios
estiman:
CM I Estima I2
g
CM G Estiman n i2
2
I
i

i son los efectos de los grupos (diferencias entre las medias


paramtricas de cada grupo y la media paramtrica general)

En este caso, podemos comparar medidas:

Para saber si i son diferentes de cero Contraste de hiptesis-se


comparan los dos C.M., ya que:

CM G I n i
2 2

F nos permite saber si los valores i


CM I I2
son significativamente diferentes de cero
DISEO EXPERIMENTAL

Cuando se quiere contrastar una determinada hiptesis, es necesario


plantear un diseo experimental adecuado. El diseo experimental es la
manera de elegir las muestras y establecer los grupos que van a servir
para realizar el contraste de la hiptesis. El diseo experimental va a
permitir generar los resultados experimentales (datos) con los que,
siguiendo un determinado modelo, se pueden realizar los contrastes de
hiptesis.

Cuando se quieren hacer contrastes de hiptesis relativos a la


comparacin de las medias de varios grupos entre s, o relativos a la
comparacin de las varianzas de dichos grupos, recurrimos a los modelos
lineales aditivos como el que hemos visto anteriormente. La solucin de
estos contrastes de hiptesis se obtiene mediante el anlisis de varianza.
Este anlisis de varianza se denomina unifactorial, porque solamente
existe un factor de clasificacin de las observaciones.

Existen otros contrastes de hiptesis posibles y, por lo tanto, otros modelos


lineales, como los que veremos a continuacin.
El ANOVA anterior, de efectos fijos, da lugar a una descomposicin de la
suma de cuadrados total de una variable en dos componentes, intra y entre
grupos. Los cuadrados medios correspondientes estiman la varianza residual
(varianza de las observaciones) y el efecto debido a la diferencia entre las
medias de los grupos, respectivamente. Nos sirve para comparar las medias
de ms de dos grupos.

El ANOVA sirve tambin para estimar componentes de varianza, cuando el


factor de clasificacin de los grupos que se est considerando es aleatorio.
En este caso el cuadrado medio entre grupos no estima el efecto debido a la
diferencia de las medias, si no la varianza entre ellas.

La naturaleza fija o aleatoria de un factor de clasificacin no es una propiedad


intrnseca de dicho factor si no una propiedad asignada a dicho factor en el
diseo experimental que, a su vez, es consecuencia de la hiptesis que se
est contrastando.

As, por ejemplo, se pueden estar contrastando la diferencia entre tres lneas
consanguneas de animales (o tres lneas puras de plantas) concretas,
elegidas a propsito (factor lnea fijo), para comparar sus medias, o se
pueden haber elegido esas tres lneas al azar en un conjunto de lneas para
saber si hay una varianza asociada al factor lnea (factor aleatorio) y
cuantificarla.
A) ANOVA de 1 FACTOR Modelo II (Factores aleatorios)

Modelo: x ij i ij
C.M.E. estima

res 2 no a2
res 2
^`
COMPONENTES DE LA VARIANZA: res 2 sres 2 CMresidual C.M .ERROR
^
C.M .GRUPOS C.M .ERROR
sa
2
a
2

no

sa2
% VARIACIN ENTRE GRUPOS: *100
sres sa
2 2

%VARIACIN INTRA GRUPOS: sres 2


*100
sres sa
2 2
En el ejemplo anterior
^
2 s2 C.M .ERROR1,167
^
C.M .GRUPOS C.M.ERROR 97,833 1,167
sa
2
a
2

no 4
24,167
2
2 2 2
Varianza total: Total a i 24,167 1,167 25,334
% VARIACIN ENTRE GRUPOS:

sa2 24,167
*100 *100 95,39%
s sa
2 2
25,334
%VARIACIN INTRA GRUPOS:

sres 2 1,167
*100 *100 4,61%
sres sa
2 2
25,334
B) ANOVA MULTIFACTORIAL:

Ejemplo de ANOVA de dos factores (diseo equilibrado)

COLUMNAS(C) (factor B)

n n n n

n n n n

FILAS(F)
n n n n
(factorA)
n n n n

n n n n

C= n filas f= n columnas n= nmero de observaciones por casilla o subgrupo


ModeloI Yijk i j ij ijk
Fijo

O.V. g.l. CME


nf c 2
Entre filas f-1
2

c 1

nc f 2
Entre columnas c-1
2

f 1

cf
Interaccin (f-1) (c-1)
2 n
2

c 1 f 1

Error fc(n-1) 2
ModeloI I Yijk Ai B j AB ij ijk
Aleatorio

CME

Entre filas n AB nf A
2 2 2

Entre columnas 2 n AB 2 nc B 2

Interaccin n2 2
AB

Error 2
Modelo mixto Yijk Ai j A ij ijk

CME

c
nf
Entre filas 2 n 2 B
c 1
2

Entre columnas 2 nc 2 B

Interaccin n
2 2
B

Error 2
SIGNIFICADO DE LOS EFECTOS Y DE LAS INTERACCIONES:

Factor B columnas (C)


Niveles B1 B2 Media marginal


A1 A1 (B2-B1)1

Factor A
filas (f)
(B2-B1)2
A2 A2

_______
B1 B2 B2 B1
_______
Media marginal (A2-A1)1 (A2-A1)2 A2 A1
________
(A2-A1)1 y (A2-A1)2
efectos simples A2 A1
(B2-B1)1 y (B2-B1)2 ________ efectos principales
B2 B1

Tres posibles situaciones:

1.- No hay interaccin

B1 B2 B2 B1

A1 2

A2 2

A2 A1 6 6
(B2-B1)1

(B2-B1)2

A1 A2

Lo mismo sera si consideramos las diferencias (A2A1)1 y (A2A1)2


2.- Hay interaccin debida al cambio de orden de los niveles de un
factor segn el nivel del otro factor considerado

B1 B2 B2 B1

A1 2

A2 -10

A2 A1 6 6

(B2-B1)2
(B2-B1)1

A1 A2
3.- Hay interaccin debida al cambio de magnitud de la diferencia
entre los dos niveles de un factor en funcin del nivel del otro factor que
estemos considerando
B1 B2 B2 B1

A1 2

A2 8

A2 A1 6 2

(B2-B1)2

(B2-B1)1

A1 A2
Importante: La presencia o ausencia de efectos principales no nos dice nada
sobre la posible existencia o no de interaccin y viceversa.
Tipos de diseos con respecto al nmero de observaciones en cada casilla
(subgrupo)

A.- Constante o equilibrado: Nmero igual de observaciones por subgrupo o


casilla
n n n n
n n n n
n n n n
B.- Desequilibrado: Nmero diferente de observaciones por subgrupo
3 6 9
B1.- Proporcional: Nmeros mltiples en filas o columnas
2 4 6
B2.- Irregular: Nmero de observaciones diferentes 6 4 8 3
4 8 12
4 2 5 1
1 5 3 6

El proporcional se resuelve como el equilibrado con pequeas variantes en el


clculo de la S.C. El irregular exige el ajuste de los valores de los efectos por el
mtodo de mnimos cuadrados: Modelo Lineal General
EL DISEO DE BLOQUES ALEATORIZADOS

Supongamos cinco tratamientos: A,B,C,D,E, y F

En cuatro bloques (4 Repeticiones/ Tratamiento) se asignan


aleatoriamente los tratamientos en los bloques

Bloque 1
A D E B C F

Bloque 2
D E F A B C
A, B, C,D E, F son los tratamientos (hasta un n=t)
Puede haber bloques (hasta un n=b)

Suponemos 1 observacin por tratamiento y bloque


Modelo: yij i j ij

Variacin g.l. C.M. Esperado


Bloques b-1 2 t 2 b
b t

2 2
Tratamientos t-1 t 1
i

Error (r-1) (t-1) 2


Total rt-1

Se debe suponer que no existe interaccin

Si hay ms de una observacin por tratamiento y bloque Se


puede estimar el error independiente de la interaccin = Factorial de
dos factores.
C) ANOVA ANIDADO O JERRQUICO

Es el anlisis de varianza correspondiente a un diseo factorial en el que


uno de los factores (el factor subordinado o anidado) es siempre aleatorio
(sus categoras han sido elegidas al azar en un universo infinito de
posibles categoras) y estn subordinadas al factor principal, que puede
ser fijo o aleatorio.

Ejemplo :

Experimento para comparar distintos genotipos (estirpes) de gallos de


una raza de gallinas. Se tienen las ganancias medias de peso diario en
gramos de una muestra de 4 hijas por gallina apareada con un gallo de
cada una de las tres estirpes distintas.

El factor gallo (estirpe) se considera un factor fijo, porque lo que interesa


es conocer si hay diferencia entre las medias de tres estirpes concretas.

El factor gallina (anidado a el factor gallo) es aleatorio. Se eligen tres


gallinas al azar para aparear con cada gallo.
Diseo:

Gallos
1 2 3

Gallinas: 1 2 3 4 5 6 7 8
9

111 121 131 241 251 261 371 381 391


Id. hijas 112 122 132 242 252 262 372 382 392
113 123 133 243 253 263 373 383 393
114 124 134 244 254 264 374 384 394
Tipos de modelo de diseo anidado:

Modelo I: Mixto

Factor principal: Gallos (efectos medios a comparar)


Factor Subordinado: Gallinas (varianza entre gallinas). Siempre aleatorio

ijk i Bij ijk


B j i
Variacin G.L. C.M. Esperado

2 n B nb i
2

Entre grupos a-1


a 1
Entre Subgrupos a(b-1) n
2 2
B

Dentro de Subgrupos ab(n-1) 2


Total abn-1

Modelo II: Puro

Ambos factores son aleatorios. En el ejemplo anterior, los gallos se elegiran al


azar, siendo una muestra representativa de un universo de infinitos posibles
genotipos. Se estiman las componentes de varianza entre gallos y entre
gallinas anidadas a gallos (o entre los grupos de hijas de los distintos gallos y
entre los grupos de hijas de las diferentes gallinas apareadas con cada gallo.
Se trata de un diseo frecuentemente utilizado para estimar parmetros
genticos.

ijn Ai Bij ijk


Variacin g.l. C.M. Esperado
Entre grupos a-1 2 n 2 B A nb 2 A
Entre subgrupos a(b-1) 2 n 2 B A
Intra grupos
Dentro de subgrupos ab(n-1) 2
(Error)

Total abn-1

Si el tamao muestral de los subgrupos no es igual para todos, en


lugar de n, se utiliza n0

bi
a bi a nij
2

nij bi

nij
no
g .l .subgrupos
Pruebas de significacin:

Si F = CMsubs es significativo se calcula F= CMgrupos


CMerror CMsubgr
Si no es significativo ver reglas en libro de estadstica

Descomposicin de la varianza:

CMError = S2 % Variacin entre subgrupos:

CM Sub CM Error S2 B A
S2 B A = 2 2 x100
n S S B A S A
2

CM Grupos CM Subg
S2 A % variacin entre grupos:
nb

S2 A
= S2 S2 S 2
B A A
En el ejemplo:

Origen Numerador gl Denominador gl Valor F Sig.


Interseccin 1 24 122157,176 0 ,000
DIETA 2 24 6,882 0,004
FAMILIA(DIETA) 9 24 17,137 0 ,000

Estimacin de la varianza:

Estimaciones de parmetros de varianza

Parmetro Estimacin Error tipico


Residuos 1,4166667 0,4089564
FAMILIA(DIETA) 6,7398990 3,0782787
Procedimiento en el SSPS para estimar las componentes de varianza:

ANOVA anidado o jerrquico


ANALIZAR MODELOS MIXTOS LINEAL CONTINUAR
Establecer VARIABLE DEPENDIENTE Y FACTORES ALEATORIOS
En ventana nueva: CONSTRUIR TRMINOS ANIDADOS Entrar factor
principal con flecha hacia la casilla construir trmino y AADIR Entrar factor
anidado con flecha hacia la casilla construir trmino DENTRO factor
principal con flecha hacia casilla construir trmino y AADIR CONTINUAR
En la ventana anterior: PEGAR: aparece el archivo Sintax. En este archivo
cambiar
/RANDOM dieta familia(dieta) | COVTYPE(VC) .
Por
/RANDOM familia(dieta) | COVTYPE(VC) .
Quedara:
MIXED
crecimie BY dieta familia
/CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1)
SINGULAR(0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0,
ABSOLUTE)
PCONVERGE(0.000001, ABSOLUTE)
/FIXED = | SSTYPE(3)
/METHOD = REML
/RANDOM familia(dieta) | COVTYPE(VC) .
Comparacin de medias

Tres planteamientos:

1.- Comparaciones a priori


Las comparaciones estn planificadas al iniciar el experimento,
independientemente del resultado del ANOVA. Ejemplo: la comparacin
de un conjunto de tratamiento con un tratamiento control

2.- Comparaciones mltiples o a posteriori


Son comparaciones no planificadas al iniciarse el experimento, dependen
del resultado del ANOVA; una vez realizado ste y obtenido un valor de F
significativo se quiere saber cuales son las medias distintas entre si

3.- Contrastes ortogonales


Son contrastes de medias que se realizan cuando los niveles numricos
de un factor cuantitativo estn igualmente espaciados y se quieren
conocer tendencias. Ejemplo: los tratamientos consisten en dosis
proporcionales de un determinado producto
Comparacin de medias planificada a priori

Tres planteamientos:

1.- Obtencin de una suma de cuadrados y un cuadrado medio para cada


comparacin y contraste de dicho cuadrado medio con el cuadrado
medio del error o el cuadrado medio de contraste que corresponda

Ejemplo5:
Se quiere saber si hay diferencia en la produccin de piezas hechas por
cuatro trabajadores diferentes. Los datos son:
El ANOVA es:

Antes de realizar el anlisis se saba que de los cuatro trabajadores, dos


son mujeres (M) y dos hombres (H) y que dos tienen un C.I. Alto (A) y
dos bajo (B) y a priori se quera saber si existe un efecto del sexo y un
efecto del C.I. en la produccin y si existe interaccin entre ambos
efectos
Antes de realizar el anlisis se saba que de los cuatro trabajadores, dos
son mujeres (M) y dos hombres (H) y que dos tienen un C.I. Alto (A) y
dos bajo (B) y a priori, antes de hacer el ANOVA, se quera saber si
existe un efecto del sexo y un efecto del C.I. en la produccin y si existe
interaccin entre ambos efectos. Es decir, se quiere comparar el nmero
medio de piezas producido por los hombres con el producido por las
mujeres (efecto del sexo); la produccin de los individuos con C.I. alto
con la de los individuos con C.I. bajo (efecto del C.I.) y la produccin
media de HA y Mb con la media de HB y MA.

Para obtener las SC correspondientes a estos contrastes se consideran


los siguientes coeficientes :
Con los que se calculan:

siendo nSc2 = 5x4 = 20

siendo nSc2 = 5x4 = 20

El ANOVA correspondiente a estos contrastes de medias es:


Otros posibles contrastes de medias por ejemplo, comparar M de CI alto
(MA) con H de CI bajo (CB) y viceversa, HA con MB. Los coeficientes de
estos contrastes seran :

Y las SC:
El ANOVA de estos contrastes:

Resolver estos dos ltimos contrastes con el SPSS


Los contrastes que se han resuelto anteriormente son los relativos a las
hiptesis nulas:

1) Ho: - m1 - m2 + m3 + m4 = 0
2) Ho: + m1 + m2 - m3 - m4 = 0
3) Ho: + m1 - m2 - m3 + m4 = 0
4) Ho: + m2 - m3 = 0
5) Ho: + m1 - m4 = 0

Las pruebas planeadas o a priori, se pueden formar con los diferentes


niveles de un tratamiento, asignndole a cada nivel un coeficiente de
forma que se cumplan las condiciones de ortogonalidad que son:

1) Dentro de una misma comparacin, la suma de coeficientes ha de ser


cero.
2) Entre los varios contrastes que se puedan formar dentro de un mismo
factor, la suma de productos ordenados de los coeficientes ha de ser
nula, tomando todas las comparaciones dos a dos

De manera que cada comparacin o contraste sea independiente de los


dems
Las reglas para la determinacin de los coeficientes son:
1) Si se van a comparar dos grupos de igual tamao, simplemente se
asignan coeficientes +1 a los miembros de un grupo y -1 a los integrantes
del otro grupo. No importa a qu grupo se le asigne los coeficientes
positivos o negativos.
2) En la comparacin de grupos que contienen distintos nmeros de
tratamientos, asgnese al primer grupo tantos coeficientes como nmero
de tratamientos tenga el segundo grupo; y a este ltimo, tantos
coeficientes, del signo opuesto, como nmero de tratamientos tenga el
primer grupo. Por ejemplo, si entre cinco tratamientos se quiere comparar
los dos primeros con los tres ltimos, los coeficientes seran +3, +3, -2,
-2, -2.
3) Redzcanse los coeficientes a los enteros ms pequeos posibles. Por
ejemplo, en la comparacin de un grupo de dos tratamientos con un
grupo de cuatro se tendr (regla segunda) los coeficientes +4, +4, -2, -2, -
2, -2 pero stos pueden reducirse, dividiendo por dos, a los coeficientes
+2, +2, -1, -1, -1, -1.
4) Los coeficientes de la interaccin siempre pueden determinarse
mediante la multiplicacin de los coeficientes correspondientes de los
efectos principales.
Modelos con ms de un factor

Si se tiene un modelo con ms de un factor y se quiere hacer pruebas


planeadas de uno o mas factores, todo se hara lo mismo teniendo en
cuenta que habra que utilizar como trmino de error el mismo del factor
que se esta descomponiendo

Ejemplo6.-
Se han probado cuatro tratamientos en cuatro rebaos elegidos al azar.
Los cuatro tratamientos son cuatro piensos que tienen las siguientes
caractersticas:
Se quieren comparar las medias de los piensos con distinto nivel
energtico , las medias de los piensos con distinto nivel proteico y la
interaccin entre ambos. Los coeficientes sern:

-1 +1 -1 +1
-1 -1 +1 +1
+1 -1 -1 +1
En este caso los contrastes de los cuadrados medios de los dos factores
y de la interaccin se deben hacer dividiendo dichos cuadrados medios
por el cuadrado medio del error, porque la interaccin no es significativa

A continuacin se muestra cuales seran las instrucciones a seguir en el


SPSS para realizar los contrastes y para indicar que el trmino de
comparacin sea distinto del error:

Con el procedimiento MODELO LINEAL GENERAL UNIVARIANTE:

1 VENTANA: ANALIZAR MODELO LINEAL GENERAL


UNIVARIANTE
2 VENTANA: Establecer variable dependiente y factores MODELO
3 VENTANA: Establecer modelo (con interseccin) y tipo de SC
CONTINUAR
Vuelve a la 2 VENTANA: CONTRASTES
4 VENTANA: Elegir un modelo y CAMBIAR CONTINUAR
Vuelve a 2 VENTANA: PEGAR Aparece un archivo Sintaxis1
En Sintaxis1: En la fila de CONTRAST poner:

/CONTRAST (t)=SPECIAL (1 -1 1 -1)


/CONTRAST (t)=SPECIAL (1 1 -1 -1)
/CONTRAST (t)=SPECIAL (1 -1 -1 1)
/CONTRAST (t)=SPECIAL (0 1 -1 -0)
/CONTRAST (t)=SPECIAL (1 0 0 -1)

El archivo Sintaxis1 quedara:

UNIANOVA
npiezas BY t
/CONTRAST (t)=SPECIAL (1 -1 1 -1)
/CONTRAST (t)=SPECIAL (1 1 -1 -1)
/CONTRAST (t)=SPECIAL (1 -1 -1 1)
/CONTRAST (t)=SPECIAL (0 1 -1 -0)
/CONTRAST (t)=SPECIAL (1 0 0 -1)
/METHOD = SSTYPE(1)
/INTERCEPT = INCLUDE
/CRITERIA = ALPHA(.05)
/DESIGN = t .

y EJECUTAR TODO
Para realizar el contraste de un cuadrado medio con otro que determinamos:

En el archivo Sintaxis1:

Incluir las filas:


/TEST=tratamie VS tratamie*rebao
/TEST=rebao VS tratamie*rebao

El archivo Sintaxis1 quedara:

UNIANOVA
dato BY rebao tratamie
/METHOD = SSTYPE(3)
/INTERCEPT = INCLUDE
/CRITERIA = ALPHA(.05)
/TEST=tratamie VS tratamie*rebao
/TEST=rebao VS tratamie*rebao
/DESIGN = rebao tratamie rebao*tratamie .
Con los contrastes sera:

UNIANOVA
dato BY rebao tratamie
/CONTRAST (tratamie)=SPECIAL (1 -1 1 -1)
/CONTRAST (tratamie)=SPECIAL (-1 -1 1 1)
/CONTRAST (tratamie)=SPECIAL (1 -1 -1 1)
/METHOD = SSTYPE(3)
/INTERCEPT = INCLUDE
/CRITERIA = ALPHA(.05)
/TEST=tratamie VS tratamie*rebao
/TEST=rebao VS tratamie*rebao
/DESIGN = rebao tratamie rebao*tratamie .

Si se quieren contrastar los CM de los contrastes con el trmino de interaccin


hay que hacerlo a mano
Comparacin de medias a posteriori o comparacin mltiple
Este tipo de comparacin se realiza cuando no existe una idea previa al
comienzo del experimento sobre los contrastes entre los diferentes
niveles de los tratamientos o cuando el objetivo es comparar todos los
posibles pares de medias
Los contrastes pueden realizarse en cualquier tipo de diseo para los
diferentes niveles de cada uno de los factores, utilizando el CM del error
del ANOVA realizado con todos los factores
Procedimiento
1) Se ordenan todas las medias de mayor a menor
X4 > X3 > X1 > X2 > X5 > X6
2) Se hace un cuadro de doble entrada en el que se ordenan las medias
de mayor a menor en vertical y de menor a mayor en horizontal y se
realizan las diferencias disponindolas en tringulo, de forma que a
medida que se desciende en las columnas o se mueve hacia la derecha
en las filas el nmero de medias comprendidas entre las dos que se
comparan (ambas inclusive) disminuye de uno en uno, conforme se
expresa en la p de cada casilla de la tabla siguiente:
Prueba DMS o diferencia mnima significativa (LSD-Least-Significant-Difference)

Tambin llamada prueba t mltiple. Se puede usar, tambin, para pruebas a


priori. Para el clculo de la regin crtica se usa la tabla t de la misma forma que
se utiliza para contrastar dos medias, comprobando, al nivel a que fijemos, si las
diferencias de medias tomadas dos a dos cumplen:

Donde es el error tpico combinado, es decir, la raz cuadrada del cuadrado


medio del error dividido por el tamao de submuestra. Esto es:

En el caso de que los tamaos de las submuestras sean diferentes (experimento


desequilibrado), se utiliza como n el valor de la media armnica de las t
submuestras. El contraste sera entonces:
Prueba Tukey

Es como la anterior solo que no es secuencial y utiliza un solo rango crtico, que
es el correspondiente a la p del nmero total de medias. Para el clculo de este
valor crtico se necesita el valor de q que se encuentra en la Tabla 8 (ver el
archivo) segn la expresin:

Siendo:
el error tpico combinado, es decir, la raz cuadrada del cuadrado medio del
error dividido por el tamao de submuestra
q el valor que se encuentra en la tabla 8 para p=nmero total de medias y gl del
error
-No se incluye el trmino porque va incluido en los valores de q de la tabla

En el caso de tamaos de submuestras diferentes se utilizara como n el valor


de la media armnica de las dos submuestras, siendo la prueba:
Prueba de Student-Newmans-Keuls o SNK

Se basa en el valor q (tabla 8), de recorrido Studentizado, pero en lugar de tomar


un solo valor para la regin crtica, correspondiente a la p del nmero total de
medias que se van a comparar, la regin crtica cambiar, dentro de la misma
prueba, con arreglo a la distancia, en nmero de medias, entre las dos medias
que se comparan. Por tanto, los valores de p dentro de una misma prueba
cambiaran de un mnimo de p=2, correspondiente a dos medias contiguas, hasta
un valor mximo de p=t-1, correspondiente a las dos medias de valor ms
alejado. Por lo que para cada valor de q se calcula su regin crtica multiplicando
el valor q de la tabla por el error tpico combinado de las medias, quedando la
prueba de la siguiente manera:

Siendo el error tpico combinado, es decir, la raz cuadrada del cuadrado medio
del error dividido por el tamao de submuestra y q los valores de la tabla 8 para
p=nmero de medias entre las dos que se estn contrastando y los gl del error
En el caso de tamaos de submuestras diferentes se utilizara como n el valor de
la media armnica de las dos submuestras, siendo la prueba:
Prueba de Duncan o de amplitudes mltiples

Se parece a la prueba SNK en que usa amplitudes mltiples y regiones crticas


variables que dependen del nmero de medias que entran en cada etapa. Se usa
la tabla r (Tabla 7) para los rangos crticos. Para efectuar las comparaciones
mltiples entre t medias, se necesita, como en las anteriores pruebas, el
cuadrado medio del error sus grados de libertad y el nmero de observaciones
(n) en cada nivel del factor
El contraste consiste en:

Siendo:
el error tpico combinado, es decir, la raz cuadrada del cuadrado medio del
error dividido por el tamao de submuestra y r los valores de la tabla 7 para
p=nmero de medias entre las dos que se estn contrastando y los gl del error.

En el caso de tamaos de submuestras diferentes se utilizara como n el valor


de la media armnica de las dos submuestras, siendo la prueba:
Prueba de Scheffe

Es muy general en el sentido de que todas las posibles comparaciones pueden


probarse en cuanto a significacin, es decir que no solamente se pueden
establecer contrastes entre dos medias sino entre ciertas combinaciones lineales
de ellas, no siendo necesario que el nmero de elementos por tratamiento sea
igual para todos ellos. El contraste consiste en:

Siendo:

En el caso de tamaos de submuestras diferentes se utilizara como n el valor


de la media armnica de las dos submuestras, siendo la prueba
Contrastes ortogonales con factores cuantitativos
Son comparaciones planeadas de los tratamientos cuando stos tienen
niveles numricos igualmente espaciados. Se estudia la tendencia que
presenta la variable analizada al aumentar progresivamente los niveles
del tratamiento. Esta tendencia puede ser lineal, cuadrtica, cbica, etc., y
una vez establecida servir para interpretar los resultados
El clculo de los coeficientes para estos contrastes se puede realizar
teniendo en cuenta el tipo de funcin a la que se quiere ajustar los puntos
obtenidos. Los coeficientes para las sumas cuadrados para las funciones
lineal, cuadrtica y cbica se encuentran en la Tabla 6 y no hay ms que
aplicarlos directamente para la obtencin de las SC
Ejemplo
Se han aplicado cuatro dosis,15, 20, 25 y 30 de un determinado producto
a un cultivo celular, habindose obtenido las siguientes respuestas:
El resultado del ANOVA es:

Como F(3,12; 0.05) = 4.49 los tratamientos son significativos. Para saber si el
efecto de la dosis es lineal cuadrtico o cbico se toman los coeficientes
dados en la Tabla 6 para dichas funciones y 3 gl (n de tratamientos -1):

Las SC son:
El ANOVA correspondiente ser:

La respuesta es, por tanto, lineal


Se
Se
Se

Das könnte Ihnen auch gefallen