Sie sind auf Seite 1von 197

Modelos Mixtos

en
InfoStat
Julio A. Di Rienzo
Ral Macchiavelli
Fernando Casanoves

Actualizado en Agosto de 2010


Modelos Mixtos en InfoStat

Julio A. Di Rienzo es Profesor Asociado de Estadstica y


Biometra de la Facultad de Ciencias Agropecuarias de la
Universidad Nacional de Crdoba, Argentina. Director del
grupo de desarrollo de InfoStat y responsable de la
implementacin de la interfase con R que se presenta en
esta obra (dirienzo@agro.uncor.edu).

Ral E. Macchiavelli es Catedrtico de Biometra en el


Facultad de Ciencias Agrcolas, Universidad de Puerto Rico
- Mayagez (raul.macchiavelli@upr.edu)

Fernando Casanoves es el Jefe de la Unidad de


Bioestadstica del Centro Agronmico Tropical de
Investigacin y Enseanza (CATIE). Anteriormente trabaj
en la Facultad de Ciencias Agropecuarias de la Universidad
Nacional de Crdoba, Argentina, donde particip del
desarrollo de InfoStat (casanoves@catie.ac.cr).
Modelos Mixtos en InfoStat

AGRADECIMIENTOS
Los autores agradecen a las Estadsticas Yuri Marcela Garca Saavedra y Jhenny Liliana
Salgado Vsquez, de la Universidad del Tolima, Colombia, por la lectura crtica del
manuscrito, la reproduccin de la ejemplificacin de este manual y los aportes sobre
algunos detalles de la interfaz.
Modelos Mixtos en InfoStat

INDICE DE CONTENIDOS

Introduccin ................................................................................................................................ 1
Requerimientos (actualizacin 09/05/2010) ....................................................................... 1
Invocacin del procedimiento de modelos lineales generales y mixtos .................................. 1
Especificacin de los efectos fijos............................................................................................... 2
Especificacin de los efectos aleatorios ..................................................................................... 4
Comparacin de medias de tratamientos.................................................................................. 7
Especificacin de la estructura de correlacin y de varianza de los errores ......................... 9
Especificacin de la estructura de correlacin.......................................................................... 9
Especificacin de la parte fija .......................................................................................................... 11
Especificacin de la parte aleatoria ................................................................................................. 12
Especificacin de la correlacin de los errores ............................................................................... 13
Especificacin de la estructura de varianzas de los errores .................................................... 21

Anlisis de un modelo ajustado ............................................................................................... 24


Ejemplos de Aplicacin de Modelos Lineales Generales y Mixtos ...................................... 29
Estimacin de componentes de varianza ................................................................................ 30
Aplicacin de modelos mixtos para datos estratificados ........................................................ 52
Parcelas divididas ............................................................................................................................ 52
Parcelas divididas en un arreglo en bloques .................................................................................... 53
Parcelas divididas en un arreglo en diseo completamente aleatorizado........................................ 63
Parcelas subdivididas (split-split plot) ............................................................................................. 71
Aplicacin de modelos mixtos para mediciones repetidas en el tiempo ................................ 80
Datos longitudinales ......................................................................................................................... 80
Anlisis de un ensayo de establecimiento de forrajeras ................................................................... 81
Anlisis de un ensayo de drogas para asma ..................................................................................... 99
Anlisis de ensayo de descomposicin ........................................................................................... 115
Uso de modelos mixtos para el control de la variabilidad espacial en ensayos agrcolas .... 128
Correlacin espacial ...................................................................................................................... 128
Anlisis de un ensayo comparativo de rendimientos en man ........................................................ 129
Aplicaciones de modelos mixtos en otros diseos experimentales ...................................... 151
Diseo en franjas (strip-plot) ......................................................................................................... 151
Diseo experimental con dos factores y dependencia espacial ...................................................... 160
Diseos de testigos apareados........................................................................................................ 173

Referencias............................................................................................................................... 185
ndice de cuadros .................................................................................................................... 187
ndice de figuras ...................................................................................................................... 187

ii
Modelos Mixtos en InfoStat

Introduccin

InfoStat implementa una interfase amigable de la plataforma R para la estimacin de


modelos lineales generales y mixtos a travs de los procedimientos gls y lme de la
librera nlme. La bibliografa de referencia de esta implementacin, as como alguno de
los ejemplos utilizados, corresponde a Pinheiro y Bates (2004). La interfaz con R fue
escrita en Delphi y depende de R-DCOM, un servidor de R que permite correr R en
background. R-DCOM es debido a Thomas Baier y Erich Neuwirth. El R-DCOM es
accedido desde Delphi gracias a las rutinas desarrolladas por Dieter Menne.

Requerimientos (actualizacin 07/11/2010)

Para que InfoStat pueda tener acceso a R, debe estar instalado en su sistema el
componente DCOM y R. Para ello consulte la ayuda en lnea (aqu) o utilice el enlace
que se encuenta en el men Aplicaciones de InfoStat.

Invocacin del procedimiento de modelos lineales generales y mixtos

En el men Estadsticas seleccionar el submen Modelos lineales generales y mixtos,


all encontrar dos opciones. La primera, con el rtulo Estimacin, invoca la ventana de
dilogo que permite especificar la estructura del modelo. La segunda, rotulada Anlisis
exploracin de modelos estimados, se activa cuando algn modelo ha sido estimado
previamente y contiene un conjunto de herramientas para el anlisis diagnstico.

1
Modelos Mixtos en InfoStat

Especificacin de los efectos fijos

Comenzaremos indicando cmo ajustar un modelo de efectos fijos, utilizando el archivo


Atriplex.IDB2 del conjunto de datos de prueba de InfoStat. Una vez abierto este archivo
activar el men Estadsticas, submen Modelos lineales mixtos, opcin Estimacin. En
la ventana de seleccin de variables, los factores de clasificacin, covariables y
variables dependientes pueden ser especificados como en un anlisis de la varianza para
efectos fijos. Para los datos en el archivo Atriplex.IDB2 especificar PG como variable
respuesta y como criterios de clasificacin a Tamao y Episperma. Una vez que se
acepta la seleccin realizada se mostrar la ventana principal de la interfase para
modelos mixtos. Esta ventana contiene cinco solapas (Figura 1).

Figura 1: Solapas con las opciones para especificacin de un modelo lineal general y mixto.

La primera permite especificar los efectos fijos del modelo y seleccionar opciones para
la presentacin de resultados y la generacin de predicciones, obtener residuos del
modelo y especificar el mtodo de estimacin. Por defecto el mtodo de estimacin es
mxima verosimilitud restringida (REML).

A la derecha de la ventana aparecer una lista conteniendo las variables de clasificacin


y las covariables declaradas en la ventana de seleccin de variables. Para incluir un
factor (variable de clasificacin) o una covariable a la parte fija del modelo, basta hacer
doble clic sobre el nombre del factor o covariable que se quiere incluir. Esta accin
agregar una lnea en la lista de efectos fijos. Doble clics adicionales sobre un factor o
una covariable agregarn trminos en lneas sucesivas, implcitamente separados por un
signo + (modelo aditivo). Seleccionando con el ratn los factores principales y
accionando el botn * se introduce un trmino que especifica la interaccin entre los
factores. Para el conjunto de datos en el archivo Atriplex.IDB2, incluir en el modelo de
efectos fijos los factores Tamao, Episperma y su interaccin (Figura 2). Algunos de los
textos en estas ventanas han sido aumentados de tamao para mejorar su visualizacin
(esto se logra moviendo el roller del ratn mientras la tecla Ctrl del teclado esta
apretada).

2
Modelos Mixtos en InfoStat

Si aceptamos esta especificacin, en la ventana de resultados de InfoStat se obtendr la


salida que se muestra a continuacin de la Figura 2. La salida que se obtiene es la ms
sencilla ya que no se han especificado caractersticas adicionales del modelo u otras
opciones de anlisis. La primera parte contiene la especificacin de la forma en que se
invoc la estimacin del modelo en la sintaxis de R, e indica el nombre del objeto R que
contiene al modelo y su estimacin. En este caso modelo001_PG_REML. Esta
especificacin es slo de inters para aquellos que estn acostumbrados a ver las
sentencias en R.

La segunda parte muestra medidas de ajuste que son tiles para comparar distintos
modelos ajustados a un conjunto de datos. AIC hace referencia al criterio de Akaike,
BIC al Criterio Bayesiano de Informacin, logLik al logaritmo de la verosimilitud y
Sigma a la desviacin estndar residual.

La tercera parte de esta salida presenta una tabla de anlisis de la varianza mostrando las
pruebas de hiptesis de tipo secuencial.

Figura 2: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Atriplex.IDB2.

3
Modelos Mixtos en InfoStat

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo001_PG_REML<-gls(PG~1+Tamano+Episperma+Tamano:Episperma
,method="REML"
,na.action=na.omit
,data=R.data01)

Resultados para el modelo: modelo001_PG_REML

Variable dependiente:PG

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


27 160.36 169.26 -70.18 9.07 0.92
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 1409.95 <0.0001
Tamano 2 10.49 0.0010
Episperma 2 90.53 <0.0001
Tamano:Episperma 4 2.29 0.0994

Especificacin de los efectos aleatorios

Los efectos aleatorios estn asociados a grupos de observaciones. Ejemplos tpicos son
las medidas repetidas sobre un mismo individuo o las respuestas observadas en grupos
de unidades experimentales homogneas (bloques) o en los individuos de un mismo
grupo familiar, etc. Estos efectos aleatorios son agregados a los efectos fijos de
manera selectiva. Por lo tanto, en la especificacin de los efectos aleatorios es necesario
tener uno o ms criterios de agrupamiento o estratificacin, y elegir sobre qu efectos
fijos se agregan los efectos aleatorios asociados. En el procedimiento lme de R, sobre el
que se basa esta implementacin, cuando hay ms de un criterio de agrupamiento
admisible, estos son anidados o encajados.

En la segunda solapa del dilogo de especificacin del modelo podemos elegir los
criterios de estratificacin o agrupamiento y la forma en que stos incorporan efectos
aleatorios a los componentes fijos. Para ejemplificar la especificacin de los efectos
aleatorios consideremos el archivo de prueba Bloque.IDB2. Este archivo contiene tres
columnas: Bloque, Tratamiento y Rendimiento. En este ejemplo indicaremos que los
bloques fueron seleccionados en forma aleatoria o producen un efecto aleatorio (por
ejemplo, si los bloques son conjuntos de parcelas, el efecto de estos puede ser

4
Modelos Mixtos en InfoStat

considerado aleatorio ya que su respuesta depender entre otras cosas de condiciones


ambientales que no son predecibles), mientras que los tratamientos agregan efectos
fijos. Para especificar este modelo, las dos primeras columnas del archivo de pruebas
Bloque.IDB2 (Bloque y Tratamiento) se ingresarn como criterios de clasificacin y la
ltima (Rendimiento) como variable dependiente. El factor Tratamiento se incluir en la
solapa Efectos fijos como el nico componente de esa parte del modelo. Para agregar el
efecto aleatorio de los bloques, seleccionaremos la solapa Efectos aleatorios. Cuando se
selecciona sta solapa la lista Criterios de estratificacin est vaca. Haciendo doble clic
sobre Bloque en la lista de variables, se agrega este factor de clasificacin, como criterio
de agrupamiento. La inclusin de un criterio de estratificacin activa, en el panel
inferior, un dispositivo que permite detallar la forma en que el efecto aleatorio entra en
el modelo. En ste dispositivo hay una lista de componentes de la parte fija de modelo.
El primer componente hace referencia a la Constante y el resto a los otros trminos, en
este caso Tratamiento (Figura 3).

Figura 3: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo
Bloque.IDB2.

5
Modelos Mixtos en InfoStat

Dentro de la lista de trminos fijos aparecen los criterios de estratificacin previamente


especificados. La combinacin de ambas listas define los efectos aleatorios. Para ello,
cada criterio de estratificacin, dentro de cada efecto fijo, tiene asociado un check box.
Cuando ste est tildado indica que hay un conjunto de efectos aleatorios asociados al
efecto fijo correspondiente. El nmero de efectos aleatorios es igual al nmero de
niveles que tiene el trmino fijo del modelo o a 1 en el caso de la constante o de las
covariables. En el ejemplo que se ilustra se est incluyendo un efecto aleatorio inducido
por los bloques sobre la constante.

Esta especificacin representa al siguiente modelo:

yij = + i + b j + ij ; i = 1,.., T ; j = 1,..., B (1)

donde yij es la respuesta al i-simo tratamiento en el j-simo bloque, la media

general de rendimientos, i los efectos fijos de los tratamientos, b j el cambio del nivel

medio de yij asociado al j-simo bloque y ij el trmino de error asociado a la

observacin yij . T y B son el nmero de niveles del factor de clasificacin

correspondiente al efecto fijo Tratamiento y al nmero de bloques respectivamente. Los


b j se consideran, a diferencia de un efecto fijo, como variables aleatorias idnticamente

distribuidas N ( 0, b2 ) y cuyas realizaciones se interpretan como los efectos de los

distintos grupos o estratos (bloques, en este ejemplo). Luego, en estos modelos, los b j

no se estiman, lo que se estima es el parmetro b2 que caracteriza a su distribucin.

Los ij tambin se interpretan como variables aleatorias idnticamente distribuidas

N ( 0, 2 ) y describen a los errores aleatorios asociados a cada observacin. Se supone,

adems, que las variables aleatorias b j y ij son independientes.

La salida del ejemplo se muestra a continuacin. La parte nueva de esta salida, respecto
del ejemplo con el modelo lineal de efectos fijos, es que tiene una seccin de parmetros
para los efectos aleatorios.

Especificacin del modelo en R

modelo002_Rendimiento_REML<-lme(Rendimiento~1+Tratamiento
,random=list(Bloque=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data03

6
Modelos Mixtos en InfoStat

,keep.data=FALSE)

Resultados para el modelo: modelo003_Rendimiento_REML

Variable dependiente:Rendimiento

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


20 218.77 223.73 -102.39 160.65 0.89 0.93
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 12 2240.00 <0.0001
Tratamiento 4 12 41.57 <0.0001

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Bloque

Desvos estndares relativos al residual y correlaciones

(const)
(const) 0.57

En este caso se presenta la estimacin de b (la desviacin estndar de los b j relativa al

residual) como 0.57. Al comienzo de la salida puede observarse la estimacin de , la

desviacin estndar de los ij , como 160.65. As, la varianza de los bloques puede

calcularse como: b2 =
(0.57 160.65) 2 =
8385.15

Comparacin de medias de tratamientos

Siguiendo en la solapa Comparaciones (Figura 4), si en el panel que lista los trminos
fijos del modelo se tilda alguno de ellos, se obtiene una tabla de medias y errores
estndares y una comparacin mltiple entre medias del tipo LSD de Fisher (esta prueba
est basada en una prueba de Wald) o la prueba de formacin de grupos excluyentes
DGC (Di Rienzo et l. 2002). Tambin se presentan varias opciones de correccin por
comparaciones mltiples.

7
Modelos Mixtos en InfoStat

Figura 4: Ventana desplegada con la solapa Comparaciones para los datos del archivo Bloque.IDB2.

La salida correspondiente a la comparacin de las medias de tratamientos se presenta a


continuacin.

Medias ajustadas y errores estndares para Tratamiento


LSD Fisher (alfa=0.05)
Procedimiento de correccin de p-valores: No

Tratamiento Medias E.E.


300 3237.75 92.47 A
225 3093.50 92.47 A B
150 2973.00 92.47 B
75 2498.50 92.47 C
0 1972.75 92.47 D
Letras distintas indican diferencias significativas(p<= 0.05)

La comparacin de medias de tratamientos se muestra de la forma clsica como una


lista ordenada en forma decreciente.

Si el usuario desea controlar el error tipo I para la familia de todas las comparaciones de
a pares, puede optar por alguno de los cuatro criterios implementados: Bonferroni (Hsu
1996), Sidak (Hsu 1996), Benjamini-Hochberg (Benjamini y Hochberg 1995) o

8
Modelos Mixtos en InfoStat

Benjamini-Yekutieli (Benjamini y Yekutieli 2001). Si para este mismo conjunto de


datos se selecciona la opcin Bonferroni, se obtiene el siguiente resultado:

Medias ajustadas y errores estndares para Tratamiento


LSD Fisher (alfa=0.05)
Procedimiento de correccin de p-valores: Bonferroni

Tratamiento Medias E.E.


300 3237.75 92.47 A
225 3093.50 92.47 A B
150 2973.00 92.47 A B
75 2498.50 92.47 B
0 1972.75 92.47 B
Letras distintas indican diferencias significativas(p<= 0.05)

Especificacin de la estructura de correlacin y de varianza de los errores

Las estructuras de varianzas y de covarianzas pueden modelarse separadamente. Para


ello, InfoStat presenta dos solapas: en la solapa Correlacin se encuentran las opciones
para especificar la estructura de correlacin de los errores y la solapa
Heteroscedasticidad permite seleccionar distintos modelos para la funcin de varianza.
A continuacin se describen los contenidos de estas solapas.

Especificacin de la estructura de correlacin

Para ejemplificar la utilizacin de esta herramienta recurriremos a un ejemplo citado en


Pinheiro y Bates (2004). Corresponde al archivo Ovary que contiene los datos de un
estudio de Pierson y Ginther (1987) sobre el nmero de folculos mayores de 10 mm en
ovarios de yeguas (mare). Estos nmeros se registraron a los largo del tiempo desde 3
das antes de la ovulacin y hasta 3 das despus de la siguiente ovulacin. Los datos
pueden cargarse desde la librera nlme utilizando el tem de men Aplicaciones>>Data
set de R. Cuando se activa esta opcin aparece la siguiente ventana de dilogo, que
puede diferir en el nmero de libreras que estn instaladas en su configuracin local de
R (Figura 5).

9
Modelos Mixtos en InfoStat

Figura 5: Ventana de dilogo para importar datos desde las libreras de R.

En ella se muestra tildada la librera nlme y a la derecha la lista de archivos de datos en


esa librera. Haciendo doble clic sobre Ovary, nlme se abrir una tabla de datos de
InfoStat conteniendo los datos correspondientes. El encabezamiento de la tabla abierta
se muestra a continuacin (Figura 6).

Figura 6: Encabezamiento de la tabla de datos del archivo Ovary.

10
Modelos Mixtos en InfoStat

Una grfica de la relacin entre nmero de folculos y el tiempo se muestra a


continuacin (Figura 7).

25

20

15
Follicles

10

0
-0,25 0,00 0,25 0,50 0,75 1,00 1,25
Time

Figura 7: Relacin entre el nmero de folculos (follicles) y el tiempo (Time).

Pinheiro y Bates (2004) proponen ajustar un modelo donde el nmero de folculos


depende linealmente del seno(2*pi*Time) y el coseno(2*pi*Time). Este modelo trata de
reflejar las variaciones cclicas del nmero de folculos mediante la inclusin de
funciones trigonomtricas. Adems proponen la inclusin de un efecto aleatorio de
yegua (Mare) sobre la constante del modelo y una auto-correlacin de orden 1 de los
errores dentro de cada hembra. El efecto aleatorio se incluy para romper con la falta de
independencia debida a efectos sujeto-dependientes que se expresan como perfiles
paralelos del nmero de folculos a travs del tiempo. El modelo propuesto tendra la
siguiente forma general:

yit = 0 + 1sin ( 2* pi * Time ) + 2 cos ( 2* pi * Time ) + b0i + it (2)

donde los componentes aleatorios son b0i ~ N ( 0, bo2 ) y it ~ N ( 0, 2 ) .

Por otra parte, la inclusin de una auto-correlacin de orden 1 AR1 dentro de cada
yegua tiene como propsito modelar una eventual correlacin serial. Para especificar
este modelo en InfoStat, indicaremos que follicles es la variable dependiente, que Mare
es un criterio de clasificacin y que Time es una covariable.

Especificacin de la parte fija

La parte fija del modelo quedar indicada como se muestra en la Figura 8. InfoStat
verifica que los elementos en esta ventana se corresponden con los factores y
covariables listados en la parte derecha de la ventana.

11
Modelos Mixtos en InfoStat

Figura 8: Ventana desplegada con la solapa Efectos fijos para los datos del archivo Ovary.

Si no es as, porque no se han respetado minsculas y maysculas (R es sensible a la


tipografa), entonces InfoStat substituye eso trminos por los apropiados. Pero si an
as, hay palabras que InfoStat no puede interpretar (como en este caso sin, cos y pi),
entonces la lnea queda marcada en rojo. Esto no quiere decir que est incorrecta sino
que puede estarlo y advierte al usuario para que la verifique.

Especificacin de la parte aleatoria

La parte aleatoria se indica agregando a la lista de criterios de estratificacin el factor


Mare y especificando que el efecto yegua (Mare) es sobre la constante. Esto se indica
tildando Mare dentro de Constante como se muestra en la Figura 9 (este tildado se
agrega por defecto). Los trminos sin(2*pi*Time) y cos(2*pi*Time) no presentan, en
este caso, efectos aleatorios asociados.

12
Modelos Mixtos en InfoStat

Figura 9: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Ovary.

Especificacin de la correlacin de los errores

La especificacin de la correlacin autorregresiva de orden 1 para los errores dentro de


cada hembra, se indica en la solapa Correlacin 1 como se ilustra en la Figura 10. En R
hay dos grupos de modelos de correlacin. El primero corresponde a modelos de
correlacin serial, donde se supone que los datos estn ordenados en una secuencia, y el
segundo grupo modela correlaciones espaciales. En el primer grupo encontramos los
modelos de simetra compuesta, sin estructura, autorregresivo de orden 1,
autorregresivo continuo de orden 1 y el modelo ARMA(p,q), donde p indica el nmero
de trminos autorregresivos y q el nmero de trminos de medias mviles (moving
average). Todos estos modelos suponen que los datos estn ordenados en una

1
Si los errores se suponen independientes (no correlacionados), entonces debe seleccionarse la primera
opcin de la lista de estructura de correlacin (seleccionada por defecto).

13
Modelos Mixtos en InfoStat

secuencia. Por defecto, InfoStat asume la secuencia en la que los datos estn dispuestos
en el archivo, pero si existe una variable que los ordena de manera diferente, sta debe
indicarse en el casillero Variable que indica el orden de las observaciones (para que
este casillero se active hay que seleccionar alguna de las estructuras de correlacin).
Esta variable debe ser entera para la opcin autorregresiva. Por este motivo, InfoStat
agrega en la sentencia traducida al lenguaje R, una indicacin para que la variable sea
interpretada como entera. En el ejemplo que estamos ilustrando, la variable Time es un
nmero real que codifica el tiempo relativo a un punto de referencia y est en una escala
inapropiada para usarla como criterio de ordenamiento. Sin embargo, como los datos
estn ordenados por tiempo dentro de cada yegua (Mare), esta especificacin puede
omitirse (Figura 10).

Figura 10: Ventana desplegada con la solapa Correlacin para los datos del archivo Ovary.

Si los datos no estuvieran ordenados en forma ascendente dentro del criterio de


agrupamiento (Mare), habra que agregar una variable que identifique el orden. Para

14
Modelos Mixtos en InfoStat

agregar una variable de ordenamiento su nombre puede escribirse o arrastrarse con el


ratn desde la lista de variables al casillero correspondiente. Es usual que la estructura
de correlacin est asociada a un criterio de agrupamiento, en este caso Mare. Esto se
indica en el panel rotulado Criterios de agrupamiento (para que este casillero se active
hay que seleccionar alguna de las estructuras de correlacin). Si se incluye ms de un
criterio, InfoStat construye tantos grupos como combinacin de niveles en los factores
de clasificacin que se especifiquen. En la parte inferior de la ventana, rotulada
Expresin resultante, se muestra la expresin R que se est especificando para la
componente corr= de gls o lme. Esta expresin es slo informativa y no puede
editarse.

A continuacin se presenta la salida completa del modelo ajustado conteniendo la tabla


de anlisis de la varianza de los efectos fijos, que en este caso son pruebas secuenciales
sobre las pendientes asociadas a las covariables sin(2*pi*Time) y cos(2*pi*Time). Se
observa que la desviacin estndar del componente aleatorio de la ordenada al origen es
0.77 veces la desviacin estndar residual y que el parmetro phi del modelo
autorregresivo es 0.61.

Modelos lineales generales y mixtos

Especificacin del modelo en R

Modelo000_follicles_REML<-
lme(follicles~1+sin(2*pi*Time)+cos(2*pi*Time)
,random=list(Mare= pdIdent(~1))
,correlation=corAR1(form=~1|Mare)
,method="REML"
,na.action=na.omit
,data=R.data2
,keep.data=FALSE)

Variable dependiente:follicles

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


308 1562.45 1584.77 -775.22 3.67 0.21 0.56
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 295 163,29 <0,0001
sin(2 * pi * Time) 1 295 34,39 <0,0001
cos(2 * pi * Time) 1 295 2,94 0,0877

Parmetros de los efectos aleatorios

15
Modelos Mixtos en InfoStat

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Mare

Desvos estndares relativos al residual y correlaciones

(Const)
(Const) 0.77

Estructura de correlacin

Modelo de correlacin: AR(1)


Formula: ~ 1 | Mare

Parmetros del modelo

Estimacin
Phi 0.61

Los valores predichos por el modelo ajustado anteriormente versus el tiempo se


presentan en la Figura 11. La lnea de trazo negro representa la estimacin del promedio
poblacional y corresponde a las estimaciones de la parte fija del modelo. Para obtener
las estimaciones para obtener la curva, el usuario debe solicitar en la solapa de efectos
fijos los predichos. Por defecto el nivel de los valores predichos es cero, (indicado en el
campo de edicin: Niveles) lo que indica que las predicciones estn basadas solamente
en la parte fija del modelo.

Las curvas punteadas, paralelas a la curva promedio, son las predicciones para el perfil
de cada yegua derivadas de la inclusin de un efecto aleatorio (sujeto especfico) sobre
la constante. Para obtener las predicciones para obtener estas curvas el usuario debe
solicitar tambin, en la solapa de efectos fijos, los valores predichos del nivel 1. Para
obtener ambas predicciones el usuario deber escribir en el campo de edicin de Niveles
la expresin: 0;1.

Para probar la adecuacin del modelo identificamos los puntos correspondientes a cada
yegua y dibujamos una curva suavizada para cada una ellas como se muestra en la
Figura 12. Comparando la Figura 11 y la Figura 12 se observa que cada yegua tiene un
perfil diferente que esta sobresimplificado por el modelo representado en la Figura 11.
Cmo incluiramos en el modelo la variabilidad sujeto especfica observada en la
Figura 12? La forma ms simple de incluir este comportamiento sujeto-especfico es
agregar ms efectos aleatorios al modelo de la ecuacin (2). Como resultado tenemos el
siguiente modelo:

16
Modelos Mixtos en InfoStat

0 + 1 sin ( 2* pi * Time ) + 2 cos ( 2* pi * Time )


yit =
(3)
+ b0i + b1i sin ( 2* pi * Time ) + b2i cos ( 2* pi * Time ) + it

( ) ( )
Donde los components aleatorios son b0i ~ N 0, bo2 , b1i ~ N 0, b21 , b2i ~ N 0, b22 ( )
(
and it ~ N 0, 2 ) y, como una primera aproximacin los supondremos mutuamente

independientes.

Para ajustar el modelo (3) debemos hacer algunos cambios en el conjunto de datos
debido a algunas restricciones en el uso de formula en la solapa de los efectos
aleatorios. Por lo tanto calcularmos sin T = sin ( 2* pi * Time ) y

cos T = 2 cos ( 2* pi * Time ) como nuevas variable en el conjunto de datos.

En la parte fija del modelo en vez de especificar una lista de variable especificaremos en
una lnea nica 1 + sin T + cos T como se muestra en la Figure 13. Esta manera de
especificar la parte fija no afecta las estimaciones de los efectos fijos pero nos permite
introducir fcilmente los efectos aleatorios b0i , b1i y b2i . Luego, en la solapa de efectos

aleatorios especificamos los efectos aleatorios como se muestra en la Figura 14. Notar
que la estructura de covariacin supuesta para los efectos aleatorios ha sido especificada
como pdDiag, lo que indica que las varianzas de cada componente aleatorios son
diferentes y que estas componentes no estn correlados. Los resultados del ajuste de
este modelo se muestran en la Figura 15. En esta figura se puede observar que el efecto
de ajustar curvas sujeto-especficas para cada yegua, lo que permite una representacin
ms realista de los ciclos individuales. A pesar de esto, desde un punto de vista
estadstico no es apropiado suponer independencia entre efectos aleatorios de los
parmetros de un modelo de regresin. Para especificar correlacin entre efectos
aleatorios indicamos la estructura de covarianza como pdSymm. Esto se muestra en la
Figura 16 y el resultado del ajuste se muestra en la Figura 17.

17
Modelos Mixtos en InfoStat

22 Poblacional Mare 01 Mare 02


Mare 03 Mare 04 Mare 05
Mare 06 Mare 07 Mare 08
Mare 09 Mare 10 Mare 11

17

follicles

12

2
-0,30 0,10 0,50 0,90 1,30
Time

Figura 11: Funciones ajustadas para el nmero poblacional de folculos (lnea slida negra) y para
cada yegua originada por el efecto aleatorio sobre la constante (archivo Ovary).

25

20

15
Follicles

10

0
-0.25 0.00 0.25 0.50 0.75 1.00 1.25
Time

Figura 12: Valores suavizados (polinmico de tercer grado) para el nmero de folculos (lineas
slidas) para cada yegua (Archivo Ovary).

18
Modelos Mixtos en InfoStat

Figura 13: Especificacin de la parte fija del modelo (3)

Figura 14: Especificacin de la parte aleatoria del modelo (3)

19
Modelos Mixtos en InfoStat

22

18

14
follicles

10

2
-0,30 0,10 0,50 0,90 1,30
Time

Figura 15: Valores predichos para el nmero de folculos para cada yegua generados por la incluisin
de efectos aleatorios sobre los parmetros del modelo de regresin. Matriz de covarianzas de los efectos
aleatorios: pdSymm

20
Modelos Mixtos en InfoStat

Figura 16: Especificacin de la parte aleatoria del modelo (3) pero permitiendo que stos varien en
varianza y estn correlacionados.

22

20

18

16
PRED_1_follicles

14

12

10

4
-0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
Time

Mare 1 Mare 2 Mare 3 Mare 4 Mare 5 Mare 6


Mare 7 Mare 8 Mare 9 Mare 10 Mare 11

Figura 17: Valores predichos para el nmero de folculos para cada yegua generados por la incluisin
de efectos aleatorios sobre los parmetros del modelo de regresin. Matriz de covarianzas de los efectos
aleatorios: pdSymm.

Especificacin de la estructura de varianzas de los errores

Este mdulo permite contemplar modelos heteroscedsticos. La heteroscedasticidad sin


embargo no tiene un origen nico y as como se modela la correlacin entre los errores,
la heteroscedasticidad tambin puede modelarse. El modelo para las varianzas de los
errores se puede especificar de la siguiente manera: var( i ) = 2 g 2 ( i , zi , ) donde g (.)
se conoce como funcin de varianza. Esta funcin puede depender de la esperanza
( i ) de Yi (la variable de respuesta), de un conjunto de covariables ( z i ) y de un vector

de parmetros ( ) . InfoStat, a travs de R, estima los parmetros ( ) de acuerdo a la

funcin de varianza seleccionada. La solapa Heteroscedasticidad se muestra en la


Figura 18. Las funciones de varianza admitidas pueden ser identidad (varIdent),
exponencial (varExp), potencia (varPower), potencia corrida por una constante
(varConstPower), o fija (varFixed). R admite que varios modelos de varianza puedan
superponerse, es decir, que para ciertos grupos de datos la varianza puede estar asociada
con alguna covariable y para otros con otra. La especificacin simultnea de varios
modelos para la funcin de varianza se obtiene, simplemente, marcando y especificando

21
Modelos Mixtos en InfoStat

cada uno de los componentes y agregndolos a la listas de funciones de varianza.


InfoStat arma la sentencia apropiada para R.

En la solapa Heteroscedasticidad para el ejemplo de los folculos, hemos indicado que


la varianza de los errores es distinta para cada yegua, seleccionando varIdent como
modelo de la funcin de varianza y escribiendo Mare en Criterios de agrupamiento.

Figura 18: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Ovary.

A continuacin se presenta la salida del ajuste incluyendo estimaciones de la desviacin


estndar del error para cada yegua. Tambin aqu las desviaciones estndar estn
expresadas en trminos relativos a la desviacin estndar residual. Adems, el primer
nivel del criterio de agrupamiento especificado para calcular estas desviaciones estndar
diferenciales, es siempre inicializado en 1 porque de otra forma el modelo no es
identificable. En la salida se observa que la hembra 5 tiene una variabilidad en el
nmero de folculos comparativamente mayor que las otras hembras.

22
Modelos Mixtos en InfoStat

El modelo considerado en la Ecuacin (4) con varianzas residuales para estos datos
heterogneas es:

yit = 0 + 1sin ( 2* pi * Time ) + 2 cos ( 2* pi * Time ) + b0i + it (5)

donde los componentes aleatorios son b0i ~ N ( 0, bo2 ) y it ~ N ( 0, i2 ) .

Obsrvese que la varianza residual est sub-indicada con el ndice que identifica a las
yeguas.

Como es usual, los componentes aleatorios del modelo se suponen independientes.


Luego si tomamos una yegua al azar la varianza de la respuesta sera la suma de las
varianzas de la parte aleatoria, es decir var( y=
it ) b20 + i2 , o sea (3.57*0.8)2 +
(3.57*gi)2, donde gi es la funcin de varianza para una yegua elegida aleatoriamente.
Ahora bien, cuando se condiciona a una yegua dada (por ejemplo la 5), el efecto
individuo ( b0i ) est fijado, as que la varianza de la yegua 5 solo est asociada a la parte
residual y adems la funcin de varianza queda especificada, (es decir, hay que usar g5)
y la varianza sera (3.57*1.34)2.

Modelos lineales generales y mixtos

Especificacin del modelo en R

Modelo001_follicles_REML<-
lme(follicles~1+sin(2*pi*Time)+cos(2*pi*Time)
,random=list(Mare= pdIdent(~1))
,weight=varComb(varIdent(form=~1|Mare))
,correlation=corAR1(form=~1|Mare)
,method="REML"
,na.action=na.omit
,data=R.data5
,keep.data=FALSE)

Variable dependiente:follicles

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


308 1569.02 1628.55 -768.51 3.57 0.21 0.56
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 295 156.36 <0.0001
sin(2 * pi * Time) 1 295 34.22 <0.0001
cos(2 * pi * Time) 1 295 3.18 0.0756

23
Modelos Mixtos en InfoStat

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Mare

Desvos estndares relativos al residual y correlaciones

(Const)
(Const) 0.80

Estructura de correlacin

Modelo de correlacion: AR(1)


Formula: ~ 1 | Mare

Parmetros del modelo

Estimacin
Phi 0.61

Estructura de varianzas

Modelo de varianzas: varIdent


Formula: ~ 1 | Mare

Parmetros del modelo

Parmetro Estim
1 1.00
2 1.01
3 1.20
4 0.82
5 1.34
6 1.05
7 0.92
8 1.06
9 0.93
10 0.99
11 0.77

Anlisis de un modelo ajustado

Cuando InfoStat ajusta un modelo lineal general o mixto con el men Estimacin, se
activa el men Anlisis-exploracin de modelos estimados. En este dilogo aparecen
varias solapas como se muestra en la Figura 19.

24
Modelos Mixtos en InfoStat

Figura 19: Ventana comparacin de modelos generales y mixtos con la solapa Diagnstico desplegada
(archivo Atriplex.IDB2).

El ejemplo usado en este caso es el del archivo Atriplex.IDB2, sobre el que se estimaron
2 modelos de efectos fijos, el modelo000_PG_REML que contiene los efectos Tamao,
Episperma y su interaccin, y el modelo001_PG_REML que solo contiene los efectos
principales de Tamao y Episperma.

La solapa Modelos slo aparece en el caso que haya ms de un modelo estimado y


presenta una lista de los modelos evaluados en un check-list. Los modelos tildados,
aparecen en una lista con sus estadsticos resumen y una prueba de hiptesis de igualdad
de modelo cuya aplicabilidad debe tomarse con cautela ya que no todos los modelos son
estrictamente comparables. De todas formas los criterios AIC y BIC son buenos
indicadores para seleccionar el modelo ms parsimonioso.

La solapa Combinaciones lineales tiene como propsito probar hiptesis sobre


combinaciones lineales. La hiptesis que se prueba es que la esperanza de la
combinacin lineal es cero. En esta ventana de dilogo aparecen listados los parmetros
fijos del modelo que se haya seleccionado de la lista que aparece en la parte derecha de

25
Modelos Mixtos en InfoStat

la pantalla (Importante: por defecto siempre est seleccionado el ltimo de la lista). En


la parte inferior de la pantalla hay un campo de edicin donde pueden especificarse las
constantes de la combinacin lineal. A medida que los coeficientes se van agregando,
los parmetros correspondientes se van coloreando para facilitar la especificacin de las
constantes, como se ilustra en la Figura 20.

Figura 20: Ventana comparacin de modelos generales y mixtos con la solapa Combinaciones lineales
desplegada (archivo Atriplex.IDB2).

Finalmente la solapa Diagnstico tiene 3 subsolapas (Figura 19). La primera,


identificada como Residuos vs tiene dispositivos que sirven para generar de manera
sencilla grficos del tipo boxplot para los residuos estandarizados vs. cada uno de los
factores fijos del modelo o diagramas de dispersin entre los residuos estandarizados y
las covariables del modelo o los valores predichos. Asimismo, es posible obtener el
grfico Q-Q plot normal. La segunda solapa, identificada como ACF-SV, permite
generar un grfico de la funcin de auto-correlacin (til para el diagnstico de
correlaciones seriales) y la tercera, identificada como LevelPlot, permite generar
grficos de residuos vs. coordenadas espaciales para generar un mapa del sentido e

26
Modelos Mixtos en InfoStat

intensidad de los residuos. Esta herramienta es til en el diagnstico de estructuras de


correlacin espacial.

Para ejemplificar el uso de la solapa ACF-FV consideremos el ejemplo de los folculos


(archivo Ovary). En este ejemplo se argument que la inclusin del trmino
autorregresivo de orden 1 tena por objeto corregir una falta de independencia generada
por las discrepancias entre los ciclos individuales de cada yegua respecto de los ciclos
individuales que solo diferan del ciclo promedio poblacional por una constante (Figura
11). El grfico de la autocorrelacin serial de los residuos correspondiente a un modelo
sin la inclusin de la autocorrelacin de orden 1 muestra un claro patrn autorregresivo
(Figura 21). Por otra parte, el grfico de la autocorrelacin de los residuos para el
modelo que contempla la autocorrelacin mediante un trmino autorregresivo de orden
1, corrige la falta de independencia (Figura 22).

Figura 21: Funcin de autocorrelacin de los residuos del modelo presentado en la Ecuacin (2)
excluyendo la modelacin de la autocorrelacin serial.

27
Modelos Mixtos en InfoStat

Figura 22: Funcin de autocorrelacin de los residuos del modelo presentado en la Ecuacin (2)
incluyendo la modelacin de la autocorrelacin serial.

Las facilidades de la solapa Diagnstico tienen por propsito permitir al investigador un


rpido diagnstico de los eventuales problemas de adecuacin tanto de la parte fija
como aleatoria del modelo ajustado. En la presentacin de ejemplos se ilustrar ms
extensamente el uso de estas herramientas.

28
Modelos Mixtos en InfoStat

Ejemplos de Aplicacin de
Modelos Lineales Generales y Mixtos
Modelos Mixtos en InfoStat

Estimacin de componentes de varianza

En reas como el mejoramiento gentico animal o vegetal es de particular inters el


clculo de componentes de varianza. Estos son usados para obtener heredabilidades,
respuesta a la seleccin, coeficientes de variabilidad gentica aditiva, coeficientes de
diferenciacin gentica, etc. Los modelos lineales mixtos pueden usarse para estimar los
componentes de varianza, por medio del estimador de mxima verosimilitud restringida
(REML).

En muchos estudios de gentica de poblaciones se trabaja con varias poblaciones que a


su vez estn representadas por uno o ms individuos de distintas familias. En este caso
se cuenta con dos factores en el modelo, las poblaciones y las familias dentro de cada
poblacin. Para ejemplificar el uso de componentes de varianza se usan los datos que se
presentan en el archivo Compvar.IDB2 (Navarro et l. 2005). Estos datos provienen de
un ensayo de siete poblaciones de cedro (Cedrela odorata L.) con un total de 115
familias. Para algunas familias se cuenta con repeticiones y para otras no. Adems, el
nmero de familias dentro de cada poblacin no es el mismo. Las variables registradas
son el largo promedio de las semillas (largo), el dimetro, el largo del tallo y nmero de
hojas de plantines de cedro.

Adems de estimar los componentes de varianza, los investigadores estn tambin


interesados en comparar las medias de las poblaciones. Podemos considerar varios
espacios de inferencia, de acuerdo al diseo y a los intereses de los investigadores. Si
las poblaciones son una muestra aleatoria de un conjunto grande de poblaciones,
entonces la inferencia estar orientada a este conjunto grande de poblaciones. El efecto
de las poblaciones estudiadas es aleatorio, y el inters ser la estimacin de los
componentes de varianza debida a poblaciones y a familias dentro de poblaciones. Otro
aspecto de inters sern los predictores BLUP de los efectos aleatorios (en especial los
de poblaciones).

Si la inferencia se orienta solamente a las poblaciones estudiadas, el efecto de poblacin


es fijo, y el inters principal es estimar y comparar las medias de poblaciones. Si la
media de una poblacin se interpreta como un promedio a travs de todas las posibles
familias de dicha poblacin (no solamente las estudiadas), entonces el efecto de familia
Modelos Mixtos en InfoStat

es aleatorio. En este caso interesar estimar el componente de varianza debido a familia


dentro de poblaciones, y predecir los efectos de las familias estudiadas (BLUP).

Un tercer espacio de inferencia es cuando el inters reside solamente en las poblaciones


y las familias estudiadas. En este caso ambos efectos son fijos. Este tipo de modelo
presenta severas limitaciones, tanto en su interpretacin como en su implementacin.
Debido a esto, este modelo no se considerar en este tutorial.

Para el anlisis de los datos del archivo Compvar.IDB2 se ajustarn los dos primeros
casos discutidos:

Modelo 1: Poblaciones aleatorias y familias aleatorias

Modelo 2: Poblaciones fijas y familias aleatorias

Primero se selecciona el men Estadsticas, submen Modelos lineales generales y


mixtos y escogemos Estimacin. Al realizar esta seleccin aparecer la ventana de
seleccin de variables, donde especificamos como variables dependientes a Largo,
Diametro, Largodetallo y Numerodehojas y como criterios de clasificacin a Poblacin
y Familia (Figura 23).

Figura 23: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del
archivo Compvar.IDB2.

31
Modelos Mixtos en InfoStat

Modelo 1: Para el clculo de los componentes de varianza se deben especificar las


variables como en la Figura 23. Posteriormente, en la solapa Efectos aleatorios se debe
declarar primero a Poblacin y luego a Familia, ya que R asume que las distintas
componentes aleatorias que se van agregando secuencialmente estn anidadas en los
factores declarados con anterioridad. En la subventana Mostrar se tildaron las opciones
que se muestran en la Figura 24, y se sac el tilde que tiene por defecto para presentar
los Desvos estndares relativos al desvo estndar residual.

Figura 24: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo
Compvar.IDB2 para la especificacin del Modelo 1.

En la solapa Efectos fijos no debe aparecer ningn efecto, y el mtodo de estimacin


debe ser el de mxima verosimilitud restringida (REML), que es la opcin por defecto.
Observar que se desactiv la opcin por defecto Desvos estndares relativos al desvo
estndar residual, por lo que las estimaciones que aparecen sern directamente los
desvos estndares absolutos. A continuacin se presenta la salida obtenida con estas
especificaciones solo para la variable Largo.

32
Modelos Mixtos en InfoStat

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo000_Largo_REML<-lme(Largo~1
,random=list(Poblacion=pdIdent(~1)
,Familia=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo000_Largo_REML

Variable dependiente:Largo

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1 R2_2


214 2016.47 2029.91 -1004.23 21.53 0.51 0.76
AIC y BIC menores implica mejor

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Poblacion

Desvos estndares y correlaciones

(const)
(const) 27.16

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Familia dentro de Poblacion

Desvos estndares y correlaciones

(const)
(const) 14.80

Intervalos de confianza (95%) para los parmetros de los efectos


aleatorios

Formula: ~1|Poblacion

LI(95%) Est. LS(95%)


sd(const) 15.09 27.16 48.89

Formula: ~1|Familia dentro de Poblacion

LI(95%) Est. LS(95%)


sd(const) 10.72 14.80 20.43

Intervalo de confianza (95%) para sigma

lower est. upper


sigma 18.77 21.53 24.70

33
Modelos Mixtos en InfoStat

A partir de las estimaciones de desvos e intervalos de confianza para los desvos, se


obtienen las componentes de varianza y sus intervalos de confianza (Cuadro 1).

Cuadro 1. Componentes de varianza estimados para los datos del archivo Compvar.IDB2

Componente Varianza estimada IC para la Variabilidad


varianza relativa al total
(%)

Poblacin pob
= 2
=
27.16 2
737.66 (15.092 , 48.882 ) 52.0

Familia dentro de 2fam


= ( pob ) =
14.80 2
219.04 (10.722 , 20.432 ) 15.4
poblacin

Residual res
= 2
=
21.532
463.54 (18.77 2 , 24.702 ) 32.6

De acuerdo a los resultados presentados en la tabla anterior, es interesante resaltar que


la variabilidad de la familias dentro de poblaciones es menor que la variabilidad residual
con lo cual no hay una diferenciacin de familias dentro de poblaciones. La mayor
variacin, en tanto, es atribuible a diferencias entre poblaciones.

Ahora veremos cmo es el diagnstico para el Modelo 1, es decir, tanto los efectos de
familia como los de poblacin aleatorios. Para esto vamos al submen Anlisis-
exploracin de modelos estimados y se solicitan los grficos de diagnstico (Figura 25).
El anlisis diagnstico de este modelo permite determinar una fuerte falta de
homogeneidad de varianzas residual (Figura 26).

34
Modelos Mixtos en InfoStat

Figura 25: Ventana Anlisis-exploracin de modelos estimados con la solapa Diagnstico desplegada
para el Modelo 1 con los datos del archivo Compvar.IDB2.
2

2
Res.cond.estand.Pearson

Cuantiles muestrales
1

1
0

0
-1

-1
-2

-2

20 40 60 80 -3 -2 -1 0 1 2 3

Valores ajustados Cuantiles tericos

Figura 26: Grficos de diagnstico obtenidos para la variable largo y el modelo 1 para los datos del
archivo Compvar.IDB2.

35
Modelos Mixtos en InfoStat

En la Figura 26 los residuos estandarizados de Pearsons son aproximaciones de errores


y por lo tanto la heteroscedasticidad observada debe modelarse a este nivel.

Para corregir la falta de homogeneidad a este nivel se considera el Modelo 1 (Poblacin


y Familia como factores aleatorios) con varianzas residuales heterogneas. Para
incorporar las varianzas residuales eventualmente distintas para cada nivel de
Poblacin, en la solapa heterogeneidad se debe especificar el factor poblacin como se
muestra en la Figura 27.

Figura 27: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo
Compvar.IDB2 para la especificacin de varianzas heterogneas para poblaciones.

A continuacin se presenta la salida para el Modelo 1 con varianzas residuales


heterogneas por Poblacin y tildando en la solapa de Efectos aleatorios la opcin
Matriz de efectos aleatorios para obtener los estimadores BLUP.

36
Modelos Mixtos en InfoStat

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo004_Largo_REML<-lme(Largo~1
,random=list(Poblacion=pdIdent(~1)
,Familia=pdIdent(~1))
,weight=varComb(varIdent(form=~1|Poblacion))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo002_Largo_REML

Variable dependiente:Largo

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1 R2_2


214 1872.14 1905.75 -926.07 2.32 0.51 0.51
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 108 21.59 <0.0001

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Poblacion

Desvos estndares y correlaciones

(const)
(const) 27.72

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Familia dentro de Poblacion

Desvos estndares y correlaciones

(const)
(const) 1.56

Intervalos de confianza (95%) para los parmetros de los efectos


aleatorios

Formula: ~1|Poblacion

LI(95%) Est. LS(95%)


sd(const) 15.61 27.72 49.24

Formula: ~1|Familia dentro de Poblacion

LI(95%) Est. LS(95%)


sd(const) 0.47 1.56 5.14

37
Modelos Mixtos en InfoStat

Estructura de varianzas

Modelo de varianzas: varIdent


Formula: ~ 1 | Poblacion

Parmetros de la funcin de varianza

Parmetro Estim
Charagre 1.00
Escarcega 13.09
Esclavos 11.64
La Paz 15.94
Pacfico Sur 2.81
Xpujil 13.38
Yucatn 12.54

Coeficientes (BLUP) de los efectos aleatorios (~1|Poblacion)

const
Charagre -41.20
Escarcega 15.42
Esclavos 16.12
La Paz 19.80
Pacfico Sur -36.51
Xpujil 23.29
Yucatn 3.08

Coeficientes (BLUP) de los efectos aleatorios (~1|Familia in


Poblacion)

const
Charagre/Ch_71 -1.07
Charagre/Ch_710 0.59
Charagre/Ch_711 1.31
Charagre/Ch_712 1.42
Charagre/Ch_713 -0.95
Charagre/Ch_714 -1.07
Charagre/Ch_715 -0.70
Charagre/Ch_72 0.70
Charagre/Ch_73 -0.83
Charagre/Ch_74 -0.35
Charagre/Ch_75 -0.59
Charagre/Ch_76 -0.08
Charagre/Ch_77 -0.47
Charagre/Ch_78 0.48
Charagre/Ch_79 1.48
Escarcega/Es_1126 7.2E-04
Escarcega/Es_1127 0.18
Escarcega/Es_1128 0.14
Escarcega/Es_1129 0.07
Escarcega/Es_1130 3.6E-04
Escarcega/Es_1131 -0.06
Escarcega/Es_1132 0.21
Escarcega/Es_1133 0.01
Escarcega/Es_1134 -0.11
Escarcega/Es_1135 -0.09
Escarcega/Es_1136 -0.08
Escarcega/Es_1137 -0.17

38
Modelos Mixtos en InfoStat

Escarcega/Es_1138 0.16
Escarcega/Es_1139 -0.08
Escarcega/Es_1142 0.08
Escarcega/Es_1148 -0.20
Esclavos/Ec_31 -0.08
Esclavos/Ec_310 0.08
Esclavos/Ec_311 -0.07
Esclavos/Ec_312 -0.03
Esclavos/Ec_313 -0.22
Esclavos/Ec_314 0.28
Esclavos/Ec_315 -0.34
Esclavos/Ec_316 0.15
Esclavos/Ec_317 0.04
Esclavos/Ec_318 -0.08
Esclavos/Ec_319 0.04
Esclavos/Ec_32 -0.07
Esclavos/Ec_320 0.18
Esclavos/Ec_33 -3.7E-03
Esclavos/Ec_34 -0.11
Esclavos/Ec_35 0.15
Esclavos/Ec_36 -0.17
Esclavos/Ec_37 0.18
Esclavos/Ec_38 0.08
Esclavos/Ec_39 0.05
La Paz/LP_41 -0.13
La Paz/LP_410 0.14
La Paz/LP_411 0.11
La Paz/LP_412 0.16
La Paz/LP_413 -0.08
La Paz/LP_414 -0.01
La Paz/LP_415 -0.13
La Paz/LP_42 0.01
La Paz/LP_43 -0.01
La Paz/LP_44 -0.01
La Paz/LP_45 0.02
La Paz/LP_46 -0.07
La Paz/LP_48 -0.01
La Paz/LP_49 0.07
Pacfico Sur/PS_6204 -0.46
Pacfico Sur/PS_6206 -0.58
Pacfico Sur/PS_6207 0.52
Pacfico Sur/PS_6208 -0.33
Pacfico Sur/PS_6209 -0.15
Pacfico Sur/PS_6210 0.31
Pacfico Sur/PS_6211 -0.22
Pacfico Sur/PS_6212 -0.43
Pacfico Sur/PS_6213 0.03
Pacfico Sur/PS_6214 -0.56
Pacfico Sur/PS_6215 -0.07
Pacfico Sur/PS_6216 1.80
Pacfico Sur/PS_6217 -0.12
Pacfico Sur/PS_6218 0.88
Pacfico Sur/PS_6219 -0.35
Pacfico Sur/PS_6220 -0.51
Pacfico Sur/PS_6221 -0.12
Pacfico Sur/PS_6222 -0.48
Pacfico Sur/PS_660 0.72
Xpujil/Xp_11 -0.12
Xpujil/Xp_110 0.02
Xpujil/Xp_112 3.8E-03
Xpujil/Xp_113 -0.07

39
Modelos Mixtos en InfoStat

Xpujil/Xp_114 0.02
Xpujil/Xp_115 -0.12
Xpujil/Xp_116 0.17
Xpujil/Xp_117 0.11
Xpujil/Xp_118 0.08
Xpujil/Xp_119 0.18
Xpujil/Xp_12 -0.01
Xpujil/Xp_120 0.19
Xpujil/Xp_122 -0.21
Xpujil/Xp_123 -0.27
Xpujil/Xp_15 0.02
Xpujil/Xp_16 0.03
Xpujil/Xp_17 0.03
Xpujil/Xp_18 -0.05
Xpujil/Xp_19 0.07
Yucatn/Yu_1111 -0.17
Yucatn/Yu_1114 -0.19
Yucatn/Yu_1115 -0.04
Yucatn/Yu_1116 0.02
Yucatn/Yu_1117 0.05
Yucatn/Yu_1118 0.03
Yucatn/Yu_1119 0.10
Yucatn/Yu_1121 -0.06
Yucatn/Yu_1122 0.20
Yucatn/Yu_1123 -0.09
Yucatn/Yu_1124 -0.05
Yucatn/Yu_1125 0.20

Intervalo de confianza (95%) para sigma

lower est. upper


sigma 1.59 2.32 3.38

Este modelo presenta valores ms bajos de AIC y BIC que el modelo sin varianzas
heterogneas para Poblacin y Familia dentro de Poblacin. Observamos que las
varianzas de las poblaciones son bien diferentes: La poblacin La Paz tiene la mayor
varianza estimada en (15.94*2.32)2 = 1367.57 mientras que la de menor varianza es
(1*2.32)2 = 5.38. Al comparar los modelos con varianzas heterogneas y homogneas
mediante una prueba de cociente de verosimilitud se corrobora que el modelo con
varianzas heterogneas es el mejor (p<0.0001) como se muestra en la siguiente salida.
Comparacin de modelos

Call Model df AIC BIC logLik Test L.Ratio p-value


Modelo000_Largo_REML 1 1 4 2016.47 2029.91 -1004.23
Modelo001_Largo_REML 2 2 10 1872.14 1905.75 -926.07 1 vs 2 156.33 <0.0001

40
Modelos Mixtos en InfoStat

Los residuos obtenidos para el Modelo 1 con varianzas distintas en cada poblacin no
muestran problemas de heteroscedasticidad y presentan una mejora en los supuestos
distribucionales respecto al Modelo 1 con varianzas homogneas (Figura 28).
3

3
Res.cond.estand.Pearson

Cuantiles muestrales
2

2
1

1
0

0
-1

-1
-2

-2

10 20 30 40 50 60 70 -3 -2 -1 0 1 2 3

Valores ajustados Cuantiles tericos

Figura 28: Grficos de diagnstico obtenidos para la variable largo y el modelo 1 con varianzas
residuales heterogneas para poblaciones y los datos del archivo Compvar.IDB2.

Modelo 2: Para este modelo se debe declarar Poblacin en la solapa de Efectos fijos.
Observar que en esta solapa se ha seleccionado adems Coeficientes de los efectos fijos
(Figura 29). En la solapa de Efectos aleatorios se ha declarado familias como aleatorio,
se ha deseleccionado la opcin por defecto de familia como efecto sobre la Constante
(intercepto), y se ha seleccionado familia como afectando los parmetros del efecto
poblacin. La matriz de covarianzas de los efectos aleatorios asignados a poblaciones se
suponen independientes (pdIdent). Se han seleccionado adems las opciones Matriz de
efectos aleatorios, Intervalo de confianza para los parmetros de la parte aleatoria e
Intervalo de confianza para sigma (Figura 30). En la solapa Comparaciones se
seleccion la opcin DGC para Poblacin (Figura 31).

41
Modelos Mixtos en InfoStat

Figura 29: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Compvar.IDB2
para la especificacin del Modelo 2.

Figura 30: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo
Compvar.IDB2 para la especificacin del Modelo 2.

42
Modelos Mixtos en InfoStat

Figura 31: Ventana con la solapa Comparaciones desplegada para los datos del archivo
Compvar.IDB2 para la especificacin del Modelo 2.

A continuacin se presenta la salida correspondiente a estas especificaciones:

Especificacin del modelo en R

modelo001_Largo_REML<-lme(Largo~1+Poblacion
,random=list(Familia=pdIdent(~Poblacion-1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo001_Largo_REML

Variable dependiente:Largo

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


214 1967.65 1997.64 -974.82 21.54 0.51 0.75
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 108 601.79 <0.0001
Poblacion 6 108 27.23 <0.0001

43
Modelos Mixtos en InfoStat

Efectos fijos

Value Std.Error DF t-value p-value


(Intercept) 8.23 5.75 108 1.43 0.1551
PoblacionEscarcega 56.89 8.03 108 7.08 <0.0001
PoblacionEsclavos 57.72 7.46 108 7.74 <0.0001
PoblacionLa Paz 62.24 8.13 108 7.66 <0.0001
PoblacionPacfico Sur 4.65 7.53 108 0.62 0.5382
PoblacionXpujil 65.45 7.72 108 8.48 <0.0001
PoblacionYucatn 44.44 8.40 108 5.29 <0.0001

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~Poblacion - 1|Familia

Desvos estndares y correlaciones

Charagre Escarcega Esclavos La Paz Pacfico Sur XpujilYucatn


Charagre 14.79 0.00 0.00 0.00 0.00 0.00 0.00
Escarcega 0.00 14.79 0.00 0.00 0.00 0.00 0.00
Esclavos 0.00 0.00 14.79 0.00 0.00 0.00 0.00
La Paz 0.00 0.00 0.00 14.79 0.00 0.00 0.00
Pacfico Sur 0.00 0.00 0.00 0.00 14.79 0.00 0.00
Xpujil 0.00 0.00 0.00 0.00 0.00 14.79 0.00
Yucatn 0.00 0.00 0.00 0.00 0.00 0.00 14.79

Intervalos de confianza (95%) para los parmetros de los efectos


aleatorios

Formula: ~Poblacion - 1|Familia

LI(95%) est. LS(95%)


sd( - 1) 10.71 14.79 20.42

Coeficientes (BLUP) de los efectos aleatorios (~Poblacion - 1|Familia)

Charagre Escarcega Esclavos La Paz Pacfico Sur Xpujil Yucatn


Ch_71 -1.08 0.00 0.00 0.00 0.00 0.00 0.00
Ch_710 0.62 0.00 0.00 0.00 0.00 0.00 0.00
Ch_711 1.34 0.00 0.00 0.00 0.00 0.00 0.00
Ch_712 1.47 0.00 0.00 0.00 0.00 0.00 0.00
Ch_713 -0.96 0.00 0.00 0.00 0.00 0.00 0.00
Ch_714 -1.08 0.00 0.00 0.00 0.00 0.00 0.00
Ch_715 -0.71 0.00 0.00 0.00 0.00 0.00 0.00
Ch_72 0.73 0.00 0.00 0.00 0.00 0.00 0.00
Ch_73 -0.84 0.00 0.00 0.00 0.00 0.00 0.00
Ch_74 -0.35 0.00 0.00 0.00 0.00 0.00 0.00
Ch_75 -0.60 0.00 0.00 0.00 0.00 0.00 0.00
Ch_76 -0.07 0.00 0.00 0.00 0.00 0.00 0.00
Ch_77 -0.48 0.00 0.00 0.00 0.00 0.00 0.00
Ch_78 0.50 0.00 0.00 0.00 0.00 0.00 0.00
Ch_79 1.53 0.00 0.00 0.00 0.00 0.00 0.00
Ec_31 0.00 0.00 -6.04 0.00 0.00 0.00 0.00
Ec_310 0.00 0.00 5.36 0.00 0.00 0.00 0.00
Ec_311 0.00 0.00 -5.56 0.00 0.00 0.00 0.00
Ec_312 0.00 0.00 -2.65 0.00 0.00 0.00 0.00
Ec_313 0.00 0.00 -16.00 0.00 0.00 0.00 0.00
Ec_314 0.00 0.00 20.66 0.00 0.00 0.00 0.00
Ec_315 0.00 0.00 -25.46 0.00 0.00 0.00 0.00
Ec_316 0.00 0.00 10.95 0.00 0.00 0.00 0.00
Ec_317 0.00 0.00 2.69 0.00 0.00 0.00 0.00
Ec_318 0.00 0.00 -5.80 0.00 0.00 0.00 0.00
Ec_319 0.00 0.00 2.94 0.00 0.00 0.00 0.00
Ec_32 0.00 0.00 -5.56 0.00 0.00 0.00 0.00
Ec_320 0.00 0.00 12.89 0.00 0.00 0.00 0.00
Ec_33 0.00 0.00 -0.46 0.00 0.00 0.00 0.00

44
Modelos Mixtos en InfoStat

Ec_34 0.00 0.00 -7.99 0.00 0.00 0.00 0.00


Ec_35 0.00 0.00 10.95 0.00 0.00 0.00 0.00
Ec_36 0.00 0.00 -12.84 0.00 0.00 0.00 0.00
Ec_37 0.00 0.00 12.89 0.00 0.00 0.00 0.00
Ec_38 0.00 0.00 5.36 0.00 0.00 0.00 0.00
Ec_39 0.00 0.00 3.67 0.00 0.00 0.00 0.00
Es_1126 0.00 -0.06 0.00 0.00 0.00 0.00 0.00
Es_1127 0.00 16.20 0.00 0.00 0.00 0.00 0.00
Es_1128 0.00 16.63 0.00 0.00 0.00 0.00 0.00
Es_1129 0.00 6.49 0.00 0.00 0.00 0.00 0.00
Es_1130 0.00 -0.04 0.00 0.00 0.00 0.00 0.00
Es_1131 0.00 -7.09 0.00 0.00 0.00 0.00 0.00
Es_1132 0.00 19.12 0.00 0.00 0.00 0.00 0.00
Es_1133 0.00 1.15 0.00 0.00 0.00 0.00 0.00
Es_1134 0.00 -10.25 0.00 0.00 0.00 0.00 0.00
Es_1135 0.00 -10.94 0.00 0.00 0.00 0.00 0.00
Es_1136 0.00 -7.58 0.00 0.00 0.00 0.00 0.00
Es_1137 0.00 -16.32 0.00 0.00 0.00 0.00 0.00
Es_1138 0.00 14.26 0.00 0.00 0.00 0.00 0.00
Es_1139 0.00 -10.30 0.00 0.00 0.00 0.00 0.00
Es_1142 0.00 7.71 0.00 0.00 0.00 0.00 0.00
Es_1148 0.00 -18.99 0.00 0.00 0.00 0.00 0.00
LP_41 0.00 0.00 0.00 -18.43 0.00 0.00 0.00
LP_410 0.00 0.00 0.00 18.95 0.00 0.00 0.00
LP_411 0.00 0.00 0.00 14.82 0.00 0.00 0.00
LP_412 0.00 0.00 0.00 20.89 0.00 0.00 0.00
LP_413 0.00 0.00 0.00 -12.12 0.00 0.00 0.00
LP_414 0.00 0.00 0.00 -2.41 0.00 0.00 0.00
LP_415 0.00 0.00 0.00 -18.67 0.00 0.00 0.00
LP_42 0.00 0.00 0.00 1.23 0.00 0.00 0.00
LP_43 0.00 0.00 0.00 -1.93 0.00 0.00 0.00
LP_44 0.00 0.00 0.00 -1.68 0.00 0.00 0.00
LP_45 0.00 0.00 0.00 1.96 0.00 0.00 0.00
LP_46 0.00 0.00 0.00 -9.69 0.00 0.00 0.00
LP_48 0.00 0.00 0.00 -2.39 0.00 0.00 0.00
LP_49 0.00 0.00 0.00 9.48 0.00 0.00 0.00
PS_6204 0.00 0.00 0.00 0.00 -2.13 0.00 0.00
PS_6206 0.00 0.00 0.00 0.00 -2.73 0.00 0.00
PS_6207 0.00 0.00 0.00 0.00 2.48 0.00 0.00
PS_6208 0.00 0.00 0.00 0.00 -1.52 0.00 0.00
PS_6209 0.00 0.00 0.00 0.00 -0.67 0.00 0.00
PS_6210 0.00 0.00 0.00 0.00 1.51 0.00 0.00
PS_6211 0.00 0.00 0.00 0.00 -1.03 0.00 0.00
PS_6212 0.00 0.00 0.00 0.00 -2.01 0.00 0.00
PS_6213 0.00 0.00 0.00 0.00 0.18 0.00 0.00
PS_6214 0.00 0.00 0.00 0.00 -2.61 0.00 0.00
PS_6215 0.00 0.00 0.00 0.00 -0.31 0.00 0.00
PS_6216 0.00 0.00 0.00 0.00 8.55 0.00 0.00
PS_6217 0.00 0.00 0.00 0.00 -0.55 0.00 0.00
PS_6218 0.00 0.00 0.00 0.00 4.18 0.00 0.00
PS_6219 0.00 0.00 0.00 0.00 -1.64 0.00 0.00
PS_6220 0.00 0.00 0.00 0.00 -2.37 0.00 0.00
PS_6221 0.00 0.00 0.00 0.00 -0.55 0.00 0.00
PS_6222 0.00 0.00 0.00 0.00 -2.25 0.00 0.00
PS_660 0.00 0.00 0.00 0.00 3.46 0.00 0.00
Xp_11 0.00 0.00 0.00 0.00 0.00 -14.96 0.00
Xp_110 0.00 0.00 0.00 0.00 0.00 2.35 0.00
Xp_112 0.00 0.00 0.00 0.00 0.00 -0.09 0.00
Xp_113 0.00 0.00 0.00 0.00 0.00 -7.12 0.00
Xp_114 0.00 0.00 0.00 0.00 0.00 1.61 0.00
Xp_115 0.00 0.00 0.00 0.00 0.00 -12.46 0.00
Xp_116 0.00 0.00 0.00 0.00 0.00 15.93 0.00
Xp_117 0.00 0.00 0.00 0.00 0.00 10.11 0.00
Xp_118 0.00 0.00 0.00 0.00 0.00 6.95 0.00
Xp_119 0.00 0.00 0.00 0.00 0.00 16.91 0.00
Xp_12 0.00 0.00 0.00 0.00 0.00 -2.14 0.00
Xp_120 0.00 0.00 0.00 0.00 0.00 18.36 0.00
Xp_122 0.00 0.00 0.00 0.00 0.00 -20.72 0.00
Xp_123 0.00 0.00 0.00 0.00 0.00 -27.03 0.00
Xp_15 0.00 0.00 0.00 0.00 0.00 1.86 0.00
Xp_16 0.00 0.00 0.00 0.00 0.00 2.99 0.00
Xp_17 0.00 0.00 0.00 0.00 0.00 3.95 0.00
Xp_18 0.00 0.00 0.00 0.00 0.00 -4.94 0.00
Xp_19 0.00 0.00 0.00 0.00 0.00 8.44 0.00
Yu_1111 0.00 0.00 0.00 0.00 0.00 0.00 -14.89
Yu_1114 0.00 0.00 0.00 0.00 0.00 0.00 -16.59
Yu_1115 0.00 0.00 0.00 0.00 0.00 0.00 -3.24

45
Modelos Mixtos en InfoStat

Yu_1116 0.00 0.00 0.00 0.00 0.00 0.00 1.86


Yu_1117 0.00 0.00 0.00 0.00 0.00 0.00 4.53
Yu_1118 0.00 0.00 0.00 0.00 0.00 0.00 2.83
Yu_1119 0.00 0.00 0.00 0.00 0.00 0.00 8.66
Yu_1121 0.00 0.00 0.00 0.00 0.00 0.00 -5.18
Yu_1122 0.00 0.00 0.00 0.00 0.00 0.00 17.15
Yu_1123 0.00 0.00 0.00 0.00 0.00 0.00 -7.85
Yu_1124 0.00 0.00 0.00 0.00 0.00 0.00 -4.45
Yu_1125 0.00 0.00 0.00 0.00 0.00 0.00 17.15

Intervalo de confianza (95%) para sigma

lower est. upper


sigma 18.77 21.54 24.71

Medias ajustadas y errores estndares para Poblacion


DGC (alfa=0.05)

Poblacion Medias E.E.


Xpujil 73.68 5.16 A
La Paz 70.47 5.74 A
Esclavos 65.95 4.75 A
Escarcega 65.12 5.61 A
Yucatn 52.67 6.13 A
Pacfico Sur 12.88 4.87 B
Charagre 8.23 5.75 B
Letras distintas indican diferencias significativas(p<= 0.05)

A continuacin se muestra como ejemplo el clculo de los BLUP para algunas familias
de la poblacin Charagre:

Ycha ,71 = + cha + 71( cha ) = 8.2296 + 0 + (1.0823) = 7.1473


Ycha ,72 = + cha + 72( cha ) = 8.2296 + 0 + 0.7277 = 8.9573
Ycha ,73 = + cha + 73( cha ) = 8.2296 + 0 + (0.8396) = 7.3900
Ycha ,74 = + cha + 74( cha ) = 8.2296 + 0 + (0.3542) = 7.8754

El BLUP de la familia 42 de la poblacin La Paz se calcula como:

lpaz + 42(lpaz ) =
Ylpaz ,42 =+ 8.2296 + 62.2374 + 1.2297 =
71.6967

Ahora realizaremos el anlisis del ajuste del Modelo 2. En el submen Anlisis-


exploracin de modelos estimados se pidieron los grficos de diagnstico (Figura 32).

46
Modelos Mixtos en InfoStat

Figura 32: Ventana Anlisis-exploracin de modelos estimados con la solapa Diagnstico desplegada
para el Modelo 2 con los datos del archivo Compvar.IDB2.

El grfico de residuos condicionales estandarizados de Pearson vs. Valores ajustados


(Figura 33) muestra varianzas residual heterogneas para la variable Largo.

47
Modelos Mixtos en InfoStat

Figura 33: Grficos de diagnstico obtenidos para la variable largo y el Modelo 2 para los datos del
archivo Compvar.IDB2

Respecto a los supuestos distribucionales, es importante destacar que, existiendo


heteroscedasticidad, el Q-Q plot no debe ser interpretado hasta tanto no se corrija este
problema. Para incorporar las varianzas heterogneas del efecto Poblacin, en la solapa
heterogeneidad se debe especificar el factor Poblacin como se mostr en la Figura 27.

Este modelo presenta valores ms bajos de AIC y BIC que el modelo sin varianzas
heterogneas para Poblacin. Observamos que las varianzas de las poblaciones son bien
diferentes: La poblacin La Paz tiene la mayor varianza estimada en (15.94*2.32)2 =
1367.57, mientras que la de menor varianza es Charagre con (1*2.32)2 = 5.38.

48
Modelos Mixtos en InfoStat

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo002_Largo_REML<-lme(Largo~1+Poblacion
,random=list(Familia=pdIdent(~Poblacion-1))
,weight=varComb(varIdent(form=~1|Poblacion))
,method="REML"
,na.action=na.omit
,data=R.data01
,keep.data=FALSE)

Resultados para el modelo: modelo002_Largo_REML

Variable dependiente:Largo

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


214 1823.20 1873.20 -896.60 2.32 0.51 0.51
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 108 509.60 <0.0001
Poblacion 6 108 86.55 <0.0001

Efectos fijos

Value Std.Error DF t-value p-value


(Intercept) 8.23 0.61 108 13.42 <0.0001
PoblacionEscarcega 57.32 5.90 108 9.72 <0.0001
PoblacionEsclavos 57.72 4.33 108 13.33 <0.0001
PoblacionLa Paz 62.33 7.16 108 8.70 <0.0001
PoblacionPacfico Sur 4.65 1.28 108 3.65 0.0004
PoblacionXpujil 65.43 5.54 108 11.81 <0.0001
PoblacionYucatn 44.44 6.00 108 7.41 <0.0001

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~Poblacion - 1|Familia

Desvos estndares y correlaciones

Charagre Escarcega Esclavos La Paz Pacfico Sur Xpujil Yucatn


Charagre 1.56 0.00 0.00 0.00 0.00 0.00 0.00
Escarcega 0.00 1.56 0.00 0.00 0.00 0.00 0.00
Esclavos 0.00 0.00 1.56 0.00 0.00 0.00 0.00
La Paz 0.00 0.00 0.00 1.56 0.00 0.00 0.00
Pacfico Sur 0.00 0.00 0.00 0.00 1.56 0.00 0.00
Xpujil 0.00 0.00 0.00 0.00 0.00 1.56 0.00
Yucatn 0.00 0.00 0.00 0.00 0.00 0.00 1.56

Intervalos de confianza (95%) para los parmetros de los efectos


aleatorios

Formula: ~Poblacion - 1|Familia

LI(95%) Est. LS(95%)


sd( - 1) 0.45 1.56 5.38

49
Modelos Mixtos en InfoStat

Estructura de varianzas

Modelo de varianzas: varIdent


Formula: ~ 1 | Poblacion

Parmetros de la funcin de varianza

Parmetro Estim
Charagre 1.00
Esclavos 11.64
Escarcega 13.09
La Paz 15.94
Pacfico Sur 2.81
Xpujil 13.38
Yucatn 12.55

Para probar que este modelo menos parsimonioso es el de mejor ajuste se realiz una
prueba del cociente de verosimilitud cuya salida se presenta a continuacin.

Comparacin de modelos

Model df AIC BIC logLik Test L.Ratio p-value


001 9 1967.65 1997.64 -974.82
002 15 1823.20 1873.20 -896.60 1 vs 2 156.44 <0.0001

El modelo con varianzas heterogneas para las distintas poblaciones es mejor que el de
varianzas homogneas (p<0.0001). Podemos observar que con la inclusin de varianzas
heterogneas para las distintas poblaciones el ajuste ha mejorado respecto a los ajustes
anteriores (Figura 34). Tanto en los box-plot de los residuos condicionales
estudentizados de Pearson como en el diagrama de dispersin de residuos condicionales
estudentizados de Pearson versus predichos, ya no se evidencian problemas graves de
falta de homogeneidad de varianzas. En el grfico Q-Q plot se observa una mejora en el
supuesto distribucional.

50
Modelos Mixtos en InfoStat

Figura 34: Grficos de diagnstico obtenidos para la variable largo y el modelo 2 para los datos del
archivo Compvar.IDB2 una vez declaradas las varianzas residuales diferentes para cada poblacin.

51
Modelos Mixtos en InfoStat

Aplicacin de modelos mixtos para datos estratificados

Parcelas divididas

Supongamos un experimento bifactorial en el que no es posible asignar al azar las


combinaciones de ambos factores a las parcelas experimentales (PE). En algunos casos,
grupos de PE reciben aleatoriamente los distintos niveles de uno de los factores de
clasificacin y dentro de estos grupos de parcelas, los niveles del segundo factor son
asignados al azar.

El experimento descripto anteriormente difiere de un experimento bifactorial


convencional en que, si bien los niveles de los factores son asignados aleatoriamente a
las PE, no son los tratamientos (i.e. las combinaciones de los niveles de los factores) los
que estn siendo asignados de esta forma.

Esta manera particular de asignar los distintos niveles de los factores a las parcelas
representa una restriccin a la aleatorizacin, e induce estructuras de correlacin que
deben ser tenidas en cuenta en el momento del anlisis. Este diseo se conoce como
parcela dividida.

El nombre surge de la idea de que PARCELAS principales reciben los niveles de un


factor (tambin llamado a veces factor principal) y que estas parcelas son DIVIDIDAS
en SUBPARCELAS que reciben los niveles del segundo factor de clasificacin.

Aunque en las parcelas divididas los niveles de un factor son asignados dentro de los
niveles de otro factor, este NO ES un diseo anidado. Se trata de un experimento
tpicamente factorial donde los factores estn cruzados. Es slo la aleatorizacin la que
se ha realizado en forma secuencial.

De acuerdo a la forma en que estn arregladas las parcelas principales, el diseo puede
ser de:

Parcelas divididas en un arreglo en bloques

Parcelas divididas en un arreglo completamente aleatorizado

Parcelas divididas en otros diseos

52
Modelos Mixtos en InfoStat

Parcelas divididas en un arreglo en bloques

El anlisis clsico de un diseo en parcelas divididas con parcelas principales


distribuidas en bloques completos incluye los siguientes trminos en el modelo:

Factor asociado a la parcela principal (FPP)

Bloque

Bloque*FPP (error de la parcela principal)

Factor asociado a la subparcela (FSP)

FPP*FSP

Error (error para la subparcela)

El punto clave para completar el anlisis de este modelo es comprender que el error
experimental para el FPP es diferente que para los trminos del modelo que incluyen al
FSP. El error experimental de las parcelas principales es mayor que el de las
subparcelas.

La varianza del error experimental de las parcelas principales en un diseo de parcelas


divididas con parcelas principales repetidas en bloque completamente aleatorizados, se
estima como el cuadrado medio (CM) de la interaccin Bloque*FPP (se asume que no
hay interaccin Bloque*FPP y en consecuencia este CM estima el error entre parcelas
principales tratadas de la misma forma). El CM de esta interaccin es el que se usa
como referencia para calcular el estadstico F de la prueba de hiptesis para el factor
principal. El resto de las pruebas el CM residual es el apropiado para construir el
estadstico F.

El anlisis de este diseo mediante un modelo lineal mixto se basa en la identificacin


de dos niveles de agrupamiento de las observaciones. El primer nivel est dado por los
bloques y el segundo nivel por las parcelas principales dentro de los bloques. Cada uno
de estos niveles de agrupamiento genera una correlacin, conocida como correlacin
intraclase, entre las observaciones que contiene.

El modelo lineal mixto para este diseo es el siguiente:

yijk = + i + j + ij + bk + pik + ijk ; i = 1,.., T ; j = 1,..., G; k = 1,..., B (6)

53
Modelos Mixtos en InfoStat

donde yijk representa la respuesta observada en el k-simo bloque, i-simo nivel del

factor principal y j-simo nivel de factor asociado a las subparcelas, representa la

media general de la respuesta, i representa el efecto del i-simo nivel del factor

asociado a las parcelas principales, j representa el efecto del j-simo nivel del factor

asociado a las subparcelas y ij representa el efecto de la interaccin del ij-simo

tratamiento. Por otra parte bk , pik y ijk corresponden a efectos aleatorios de los bloques,

de las parcelas dentro de los bloques y de los errores experimentales. Las suposiciones
sobre estos componentes aleatorios es que bk ~ N ( 0, b2 ) , pik ~ N ( 0, p2 ) ,

ijk ~ N ( 0, 2 ) y que estos tres componentes aleatorios son independientes. A

continuacin ejemplificaremos el anlisis de un diseo en parcelas divididas en bloques


mediante la aplicacin de un modelo lineal mixto.

En este ejemplo (Di Rienzo 2007) se evalan 4 variedades de trigo: BUCK-Charrua


(BC), Las Rosas-INTA (LI), Pigu (Pe) y Pro-INTA Puntal (PP) bajo riego y secano
con el diseo a campo presentado en la Figura 35.

Bloque 1 BC Pe PP LI LI BC Pe PP

Bloque 2 PP BC Pe LI PP Pe LI BC

Bloque 3 Pe LI BC PP BC PP Pe LI

Figura 35: Esquema del diseo en parcelas divididas para el ejemplo de los datos en el archivo
Trigo.IDB2 (gris oscuro=parcelas bajo riego, gris claro=parcelas en secano)

Los datos de este ejemplo se encuentran en el archivo Trigo.IDB2. El encabezamiento


de la tabla de datos es la siguiente (Figura 36).

54
Modelos Mixtos en InfoStat

Figura 36: Encabezamiento de la tabla de datos del archivo Trigo.IDB2.

El factor en la parcela principal es Agua, el factor asociado a las subparcelas es


Variedad y la variable de respuesta es el Rendimiento. Los bloques estn claramente
identificados, pero las parcelas principales no aparecen explcitamente. Esto es as
porque en un diseo en parcelas divididas, las parcelas principales dentro de un bloque
estn confundidas con el factor principal. De esta forma las observaciones bajo Riego
en el bloque 1, representan las observaciones de una de las parcelas principales de ese
bloque.

Para analizar este ejemplo invocaremos la estimacin de un modelo lineal mixto. Esta
invocacin nos presentar, como es usual, la ventana de seleccin de variables. Su
imagen, con la seleccin apropiada de variables de respuesta y factores se muestra en la
Figura 37.

Figura 37: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del
archivo Trigo.IDB2.

Aceptando esta especificacin, se mostrar el dilogo que permite especificar el


modelo. La solapa de la parte fija, ya especificada, se muestra en la Figura 38. En ella
aparecen los efectos principales Agua, Variedad y la interaccin Agua*Variedad.

55
Modelos Mixtos en InfoStat

Figura 38: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Trigo.IDB2.

Para la especificacin de la parte aleatoria, en la solapa Efectos aleatorios se debe


incorporar primero al factor Bloque y despus al factor Agua. Esta es la forma de indicar
que Agua est dentro de Bloque. La especificacin de la parte aleatoria queda como se
muestra en la Figura 39.

56
Modelos Mixtos en InfoStat

Figura 39: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Trigo.IDB2
con bloque y agua como criterios de estratificacin.

La salida correspondiente a esta estimacin es la siguiente:

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo000_Rendimiento_REML<-
lme(Rendimiento~1+Agua+Variedad+Agua:Variedad
,random=list(Bloque=pdIdent(~1)
,Agua=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo000_Rendimiento_REML

Variable dependiente:Rendimiento

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1 R2_2


24 206.59 215.09 -92.30 51.65 0.84 0.89 0.91
AIC y BIC menores implica mejor

57
Modelos Mixtos en InfoStat

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 12 363.93 <0.0001
Agua 1 2 55.24 0.0176
Variedad 3 12 6.38 0.0078
Agua:Variedad 3 12 2.36 0.1223

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Bloque

Desvos estndares relativos al residual y correlaciones

(const)
(const) 0.55

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Agua dentro de Bloque

Desvos estndares relativos al residual y correlaciones

(const)
(const) 0.47

Las pruebas de hiptesis secuenciales dan los mismos resultados que las marginales en
este caso porque los datos son balanceados.

Antes de continuar con nuestro anlisis, haremos algunas validaciones simples de las
suposiciones de estos modelos, revisando residuales estandarizados vs. predichos y
otros criterios de clasificacin, as como el Q-Q plot normal de residuos estandarizados.
Estos residuos son condicionales a los efectos aleatorios (es decir, aproximan los
errores). Para ello invocaremos el submen Anlisis-exploracin de modelos estimados.
En el dilogo, seleccionaremos la solapa Diagnstico y dentro de ella la subsolapa
Residuos vs. (Figura 40).

58
Modelos Mixtos en InfoStat

Figura 40: Ventana Comparacin de modelos generales y mixtos con la solapa Diagnstico desplegada
para los datos del archivo Trigo.IDB2.

Si se seleccionan los tems dentro de la lista disponible, como se muestra en la Figura


40, se obtendr el grfico siguiente (Figura 41). Este aparece en una nueva ventana que
genera R y su contenido puede copiarse oprimiendo el botn derecho del ratn, sobre la
imagen. En el men que se despliega se podr optar por Copy as metafile o Copy as
bitmap.

59
Modelos Mixtos en InfoStat

Figura 41: Herramientas grficas para diagnstico obtenidas para los datos del archivo Trigo.IDB2.

Un examen rpido de la figura sugiere una posible heterogeneidad de varianzas entre


variedades. Para poder probar si es necesario incluir la estimacin de varianzas
residuales diferentes para cada variedad hay que ajustar un modelo heteroscedstico y
compararlo con el homoscedstico, utilizando algn criterio como el AIC o BIC (o una
prueba del cociente de verosimilitud, ya que el modelo homoscedstico es un caso
particular del heteroscedstico).

Para ajustar el modelo heteroscedstico invocamos nuevamente al mdulo de


estimacin de los modelos mixtos y en la solapa Heteroscedasticidad seleccionamos el
modelo varIdent y una vez seleccionado hacemos doble clic sobre Variedad (en la lista
a la derecha de la ventana) para especificar a esta variable como criterio de
agrupamiento (Figura 42). Luego accionamos el botn Agregar para hacer efectiva la

60
Modelos Mixtos en InfoStat

incorporacin de esta especificacin del modelo. Si por algn motivo la especificacin


ingresada no es deseada, haciendo doble clic sobre la misma, sta se borra.

Figura 42: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo
Trigo.IDB2 con seleccin de funcin varIdent con variedad como criterio de agrupamiento.

Las medidas de ajuste del modelo especificado son las siguientes:

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1 R2_2


24 209.47 220.28 -90.73 24.49 0.84 0.89 0.90
AIC y BIC menores implica mejor

Comparadas con las del modelo homoscedstico, no se observa una mejora, por lo
contrario tanto AIC como BIC aumentaron. Por este motivo se descarta el modelo
heteroscedstico.

61
Modelos Mixtos en InfoStat

Luego volviendo al modelo homoscedstico, realizaremos comparaciones mltiples del


tipo LSD de Fisher para evaluar diferencias entre variedades. Para ello en la solapa
Comparaciones subsolapa Medias, tildaremos la opcin Variedad como se muestra la
Figura 43.

Figura 43: Ventana con la solapa Comparaciones desplegada para los datos del archivo Trigo.IDB2 y
seleccin de la subsolapa Medias.

Al final de la salida del programa se encontrar la comparacin de medias. Se observa


que solo BUCK-Charrua tuvo los rendimientos ms bajos y esto ocurri
independientemente de si tena riego o no. En tanto las otras variedades tuvieron
rendimientos estadsticamente indistinguibles.

Medias ajustadas y errores estndares para Variedad


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Variedad Medias E.E.


Pro-INTA Puntal 469.50 28.48 A

62
Modelos Mixtos en InfoStat

Pigue 430.98 28.48 A


LasRosas-INTA 423.98 28.48 A
BUCK-Charrua 342.73 28.48 B
Letras distintas indican diferencias significativas(p<= 0.05)

Parcelas divididas en un arreglo en diseo completamente aleatorizado

A continuacin ejemplificamos mediante un


experimento cuyo objetivo fue evaluar el efecto de un
coadyuvante sobre la cobertura de gotas y uniformidad
de aplicacin en distintas ubicaciones de las hojas dentro
del canopeo de un cultivo de soja (Di Rienzo 2007). Para
ello se seleccionaron 16 sitios en cada uno de los cuales
se dispusieron 4 tarjetas hidro-sensibles, ubicadas a dos
alturas del canopeo (inferior, superior) y apuntando, sus
caras sensibles, en dos direcciones: hacia arriba y hacia
abajo. Las tarjetas hidrosensibles muestran una mancha
en el lugar donde cae una gota de agua. La superficie
manchada en estas tarjetas es una medida de cuanto
penetra y se dispersa el agua en una zona dada del canopeo. En 8 de los 16 sitios se
agreg al agua de pulverizacin un coadyuvante (para disminuir la tensin superficial
del agua y mejorar la dispersin de las gotas) y en los 8 restantes no. Por lo tanto en
cada sitio de pulverizacin se obtienen 4 lecturas correspondientes a las combinaciones
de las alturas (inferior y superior) y la ubicacin de la cara sensible de la tarjeta (abajo y
arriba). Luego en cada sitio hay una repeticin completa de un experimento con 4
tratamientos SuAr, SuAb, InAr y InAb, y que se combinan con la utilizacin o no del
coadyuvante en la solucin de rociado.

El experimento resultante es un trifactorial, con un factor principal (coadyuvante)


asociado a parcelas principales (sitios donde se realiza el rociado) y dos factores (altura
y ubicacin de cara sensible de la tarjeta) asociados a las subparcelas (tarjetas dentro de
sitio). El archivo conteniendo los datos se llama Cobertura de gotas.IDB2 y el
encabezamiento de la tabla de datos se presenta en la Figura 44.

63
Modelos Mixtos en InfoStat

Figura 44: Encabezamiento de la tabla de datos del archivo Cobertura de gotas.IDB2.

En la tabla de datos hay una columna que identifica a la parcela y va numerada de 1 a


16. Este va a ser el nico efecto aleatorio de nuestro modelo.

El modelo lineal para las observaciones de este experimento es el siguiente:

yijkl = + i + j + k + ij + ik + jk + ijk + bl + ijkl ;


(7)
=i 1,..,
= =
2; j 1,..., =
2; k 1,..., 2; l 1,...,16

donde yijkl representa la respuesta observada en i-simo nivel del factor coadyuvante y

j-simo nivel de factor altura, k-simo nivel del factor cara en la l-sima parcela,

representa la media general de la respuesta, i representa el efecto del i-simo nivel del

factor asociado a las parcelas principales (coadyuvante), j representa el efecto del

j-simo nivel del factor altura, k el k-simo nivel del factor cara, ambos asociados a

las subparcelas y ij , ik , jk y ijk las interacciones de segundo y tercer orden

correspondientes de los factores coadyuvante, altura y cara. Por otra parte pl y ijkl

representan los efectos aleatorios de las parcelas y de los errores experimentales


respectivamente. Las suposiciones sobre estos componentes aleatorios son que
pl ~ N ( 0, p2 ) , que ijkl ~ N ( 0, 2 ) , y que estas dos componentes aleatorias son

independientes.

A continuacin presentamos la forma en que se especifica el modelo anterior en


InfoStat, su salida, interpretacin y algunas acciones complementarias de validacin del
modelo. Para ello invocaremos el Men: Modelos lineales generales y
mixtos>>Estimacin. El dilogo de seleccin de variables para este caso se presenta en
la Figura 45.

64
Modelos Mixtos en InfoStat

Figura 45: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del
archivo Cobertura de gotas.IDB2.

La especificacin de la parte fija del modelo para este ejemplo contiene los tres factores
y sus interacciones dobles y triples (Figura 46).

Figura 46: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura de
gotas.IDB2.

El efecto aleatorio que consideramos en este ejemplo es el de Parcela (Figura 47).

65
Modelos Mixtos en InfoStat

Figura 47: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura
de gotas.IDB2 con Parcela como criterio de estratificacin.

Luego de aceptar las especificaciones anteriores obtendremos la siguiente salida:

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo000_Cobertura_REML<-
lme(Cobertura~1+Coad+Altura+Cara+Coad:Altura+Coad:Cara+Altura:Cara+Coa
d:Altura:Cara
,random=list(Parcela=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo000_Cobertura_REML

Variable dependiente:Cobertura

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


64 670.38 690.63 -325.19 65.17 0.76 0.82
AIC y BIC menores implica mejor

66
Modelos Mixtos en InfoStat

Pruebas de hiptesis secuenciales


numDF denDF F-value p-value
(Intercept) 1 42 233.37 <0.0001
Coad 1 14 1.89 0.1909
Altura 1 42 72.86 <0.0001
Cara 1 42 95.32 <0.0001
Coad:Altura 1 42 1.58 0.2152
Coad:Cara 1 42 0.01 0.9271
Altura:Cara 1 42 34.77 <0.0001
Coad:Altura:Cara 1 42 0.21 0.6476

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Parcela

Desvos estndares relativos al residual y correlaciones

(Intercept)
(Intercept) 0.40

Una revisin de los residuos estandarizados de este modelo mediante las herramientas
de diagnstico en el Men: Modelos lineales generales y mixtos>>Anlisis-exploracin
de modelos estimados muestra una posible heterogeneidad de varianzas cuando se
comparan las observaciones obtenidas cuando la cara sensible de la tarjeta hidrosensible
se presenta hacia arriba o hacia abajo (Figura 48).

Figura 48: Diagrama de cajas para los residuos estandarizados de Pearson para los niveles del factor
Cara.

67
Modelos Mixtos en InfoStat

Para tener en cuenta la posible falta de homogeneidad de varianzas entre posiciones de


la cara sensible, invocaremos nuevamente el men de estimacin del modelo. Todas las
especificaciones anteriores se han preservado por lo que slo tenemos que
concentrarnos en la especificacin de la funcin varianza. Para ello utilizaremos la
solapa heteroscedasticidad como se muestra en la Figura 49.

Figura 49: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo
Cobertura de gotas.IDB2 con Cara como criterio de agrupamiento.

La salida resultante es la siguiente:

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo001_Cobertura_REML<-
lme(Cobertura~1+Coad+Altura+Cara+Coad:Altura+Coad:Cara+Altura:Cara+Coa
d:Altura:Cara
,random=list(Parcela=pdIdent(~1))
,weight=varComb(varIdent(form=~1|Cara))
,method="REML"
,na.action=na.omit

68
Modelos Mixtos en InfoStat

,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo001_Cobertura_REML

Variable dependiente:Cobertura

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


64 636.54 658.82 -307.27 21.26 0.76 0.81
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 42 176.66 <0.0001
Coad 1 14 4.19 0.0599
Altura 1 42 53.72 <0.0001
Cara 1 42 98.43 <0.0001
Coad:Altura 1 42 13.83 0.0006
Coad:Cara 1 42 0.01 0.9259
Altura:Cara 1 42 35.90 <0.0001
Coad:Altura:Cara 1 42 0.22 0.6423

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Parcela

Desvos estndares relativos al residual y correlaciones

DS(Const)
DS(Const) 1.06

Estructura de varianzas

Modelo de varianzas: varIdent


Formula: ~ 1 | Cara

Parmetros del modelo

Parmetro Estim
Ab 1.00
Ar 4.15

El modelo para estos datos sera yijkl = i jk + pl + ijkl , donde i jk representa el efecto

fijo de i-simo tratamiento en la j-sima cara (cara puede ser Ab o Ar), bl es el efecto

aleatorio de la k-esima parcela experimental que se supone N ( 0, p2 ) y ijkl ~ N ( 0, k2 ) .

Luego la varianza de una observacin tomada en una parcela seleccionada


aleatoriamente va a depender si se hace en la cara de abajo o arriba de la tarjeta. As si

69
Modelos Mixtos en InfoStat

tomamos una observacin de la cara de abajo la varianza va a ser (21.26*1.06)2 +


(21.26*1)2 y si la tomamos en la cara de arriba: (21.26*1.06)2 + (21.26*4.15)2.

A continuacin se presentan las medidas resumen del modelo homoscedstico y del


heteroscedstico.

Medidas de ajuste del modelo homoscedstico

N AIC BIC logLik Sigma R2_0 R2_1


64 670.38 690.63 -325.19 65.17 0.76 0.82
AIC y BIC menores implica mejor

Medidas de ajuste del modelo heteroscedstico

N AIC BIC logLik Sigma R2_0 R2_1


64 636.54 658.82 -307.27 21.26 0.76 0.81
AIC y BIC menores implica mejor

Si comparamos los AIC y BIC veremos que el ltimo modelo ajustado es mejor y por lo
tanto la interpretacin de la pruebas de hiptesis debe basarse en este ltimo.

Obsrvese que en la estructura de varianzas, la desviacin estndar residual de las


observaciones en las tarjetas que apuntan hacia arriba es 4.15 veces mayor que la
desviacin estndar residual de las observaciones en las tarjetas que apuntan hacia
abajo.

Por otra parte, observando los resultados de las pruebas de hiptesis resulta que la
interaccin Coad:Altura:Cara no result significativa, por lo que se pueden observar
las interacciones dobles (Figura 50). Entre estas, Coad:Altura y Altura:Cara son
significativas. Estas interacciones se analizan utilizando la solapa Comparaciones de la
ventana Modelos lineales generales y mixtos y tildando las correspondientes
interacciones en la lista de trminos del modelo que se presenta en esa ventana. Este
procedimiento crear una tabla con las medias de todas las combinaciones resultantes de
los niveles de los factores que intervienen en la interaccin. El resultado, al final de la
salida, presenta las siguientes tablas.

Medidas ajustadas y errores estndares para Coad*Altura


LSD Fisher (alfa=0,05)
Procedimiento de correccin de p-valores: No

Coad Altura Medias E.E.


Si Su 253.94 17.89 A
No Su 204.69 17.89 A
Si In 94.38 17.89 B
No In 86.13 17.89 B
Letras distintas indican diferencias significativas(p<= 0.05)

70
Modelos Mixtos en InfoStat

Medidas ajustadas y errores estndares para Altura*Cara


LSD Fisher (alfa=0,05)
Procedimiento de correccin de p-valores: No

Altura Cara Medias E.E.


Su Ar 356.88 22.74 A
In Ar 121.75 22.74 B
Su Ab 101.75 7.73 B
In Ab 58.75 7.73 C
Letras distintas indican diferencias significativas(p<= 0.05)

a) b)
300 400

250
300
200

Cobertura
Cobertura

150 200

100
100
50

0 0
Superior Inferior Superior Inferior
Altura Altura

Sin coadyuvante Con coadyuvante Cara abajo Cara arriba

Figura 50: Diagramas de puntos para estudiar la interaccin entre Coad y Altura (a) y entre Cara y
Altura (b).

Parcelas subdivididas (split-split plot)

Este diseo utiliza el mismo principio que las parcelas divididas, excepto que lo
extiende un paso ms. El principio puede extenderse arbitrariamente a niveles ms
profundos de divisin. El modelo lineal para este diseo, suponiendo las parcelas
principales agrupadas en bloques completos aleatorizados, es el siguiente:

yijkl = + i + j + k + ij + ik + jk + ijk + bl + pil + sp jil + ijkl (8)

En la expresin anterior representa la media general, i el i-simo nivel del factor

asociado a las parcelas principales, j el j-simo nivel del factor asociado a las

subparcelas dentro de las parcelas principales, k el k-simo nivel del factor asociado a

las sub-subparcelas (dentro de las subparcelas) y ij , ik , jk y ijk las correspondientes

71
Modelos Mixtos en InfoStat

interacciones. Los trminos aleatorios de este modelo corresponden a los efectos de


bloques, bl ~ N ( 0, b2 ) , los efectos de parcelas, pil ~ N ( 0, p2 ) , los efectos de

subparcelas, sp jil ~ N ( 0, sp2 ) y el error experimental, ijkl ~ N ( 0, 2 ) . Todos ellos,

como siempre, se suponen independientes.

Consideremos ahora un ejemplo. Los datos estn en el archivo Calidad del


almidn.IDB2 (Di Rienzo 2007). En este experimento se evala el ndice de absorcin
de agua (IAA) del almidn cocido y crudo obtenido de dos genotipos de Qunoa
cultivada bajo 4 niveles de fertilizacin nitrogenada. Las variedades son Faro y
UDEC10. stas se asignaron a grandes parcelas dispuestas en 3 bloques. Las parcelas
en las que fueron sembradas las variedades fueron divididas en 4 subparcelas a las que
se les asignaron 4 dosis de fertilizacin: 0, 75, 150 y 225 kg/ha. Las subparcelas fueron
nuevamente divididas en 2 para asignar el tratamiento de coccin o sin coccin (crudo).
El esquema para este diseo de experimento se presenta en la Figura 51.

Sub-Parcela
Parcela principal

Bloque 1

Bloque 2

Bloque 3

Sub-sub Parcela

Figura 51: Esquema del diseo en parcelas subdivididas para el ejemplo de los datos en el archivo
Calidad del almidn.IDB2.

Para el anlisis de este diseo mediante un modelo mixto, adems de la especificacin


de la parte fija, como en un clsico experimento tri-factorial, slo debemos especificar
la parte aleatoria para incluir el efecto aleatorio de los Bloques, de las Parcelas

72
Modelos Mixtos en InfoStat

Principales dentro de Bloques y de las Subparcela dentro de Parcelas. El


encabezamiento del archivo Calidad del Almidn.IDB2 se presenta en la Figura 52.

Figura 52: Encabezamiento de la tabla de datos del archivo Calidad del Almidn.IDB2.

La ventana de seleccin de variables para este ejemplo tendr que contener la


informacin que se presenta en la Figura 53.

Figura 53: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del
archivo Calidad del Almidn.IDB2.

La especificacin de la parte fija deber contener los factores e interacciones


presentados en la Figura 54.

73
Modelos Mixtos en InfoStat

Figura 54: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Calidad del
Almidn.IDB2.

La parte aleatoria deber tener declarados a los bloques (Bloque), a las parcelas
principales dentro de Bloques (Genotipo) y a las subparcelas dentro de parcelas
principales (Nitrgeno) (Figura 55).

74
Modelos Mixtos en InfoStat

Figura 55: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del
Almidn.IDB2.

La salida correspondiente es la siguiente:

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo000_IAA_REML<-
lme(IAA~1+Genotipo+Nitrogeno+Coccion+Genotipo:Nitrogeno+Genotipo:Cocci
on+Nitrogeno:Coccion+Genotipo:Nitrogeno:Coccion
,random=list(Bloque=pdIdent(~1)
,Genotipo=pdIdent(~1)
,Nitrogeno=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo000_IAA_REML

Variable dependiente:IAA

75
Modelos Mixtos en InfoStat

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3


48 116.45 145.76 -38.22 0.61 0.75 0.75 0.75 0.75
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 16 1389.20 <0.0001
Genotipo 1 2 14.49 0.0626
Nitrogeno 3 12 0.78 0.5287
Coccion 1 16 32.90 <0.0001
Genotipo:Nitrogeno 3 12 0.88 0.4769
Genotipo:Coccion 1 16 37.67 <0.0001
Nitrogeno:Coccion 3 16 1.74 0.1998
Genotipo:Nitrogeno:Coccion.. 3 16 0.46 0.7108

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Bloque

Desvos estndares relativos al residual y correlaciones

(Const)
(Const) 1.3E-05

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Genotipo dentro de Bloque

Desvos estndares relativos al residual y correlaciones

(Const)
(Const) 5.0E-06

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Nitrogeno dentro de Genotipo dentro de Bloque

Desvos estndares relativos al residual y correlaciones

(Const)
(Const) 1.8E-05

Podramos seguir realizando pruebas de diagnstico pero asumiremos que el modelo es


correcto. La interpretacin de las pruebas de hiptesis indica que slo la interaccin
Genotipo:Coccin es significativa. Las comparaciones mltiples para las medias de
tratamientos correspondientes a esta interaccin se presentan a continuacin. En estas
pruebas se observa que slo el almidn cocido del genotipo UDEC10 presenta un IAA
significativamente mayor que el resto de combinaciones de Genotipo y Coccin.

76
Modelos Mixtos en InfoStat

Medidas ajustadas y errores estndares para Genotipo*Coccion


LSD Fisher (alfa=0,05)

Genotipo Coccion Medias E.E.


UDEC10 Cocido 4.64 0.18 A
Faro Crudo 2.97 0.18 B
Faro Cocido 2.90 0.18 B
UDEC10 Crudo 2.56 0.18 B
Letras distintas indican diferencias significativas(p<= 0.05)

Una manera alternativa de formular el modelo anterior consiste en dejar los efectos fijos
como en la Figura 54 y especificar los efectos aleatorios como se muestra en la Figura
56. Los resultados son exactamente los mismos que antes, excepto por el clculo de los
grados de libertad del denominador y por ende los valores de probabilidad. Esta es una
aproximacin tambin vlida aunque la versin anterior es acorde con el anlisis
tradicional basado en efectos fijos. Adems, las estimaciones de varianza estn
presentadas en forma diferente.

Figura 56: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del
Almidn.IDB2 que contempla otra forma de especificar la parte aleatoria.

77
Modelos Mixtos en InfoStat

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo001_IAA_REML<-
lme(IAA~1+Genotipo+Nitrogeno+Coccion+Genotipo:Nitrogeno+Genotipo:Cocci
on+Nitrogeno:Coccion+Genotipo:Nitrogeno:Coccion
,random=list(Bloque=pdIdent(~1)
,Bloque=pdIdent(~Genotipo-1)
,Bloque=pdIdent(~Genotipo:Nitrogeno-1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo001_IAA_REML

Variable dependiente:IAA

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3


48 116.45 145.76 -38.22 0.61 0.75 0.75 0.75 0.75
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 30 1389.20 <0.0001
Genotipo 1 30 14.49 0.0006
Nitrogeno 3 30 0.78 0.5157
Coccion 1 30 32.90 <0.0001
Genotipo:Nitrogeno 3 30 0.88 0.4605
Genotipo:Coccion 1 30 37.67 <0.0001
Nitrogeno:Coccion 3 30 1.74 0.1807
Genotipo:Nitrogeno:Coccion.. 3 30 0.46 0.7089

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Bloque

Desvos estndares relativos al residual y correlaciones

(Const)
(Const) 1.3E-05

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~Genotipo - 1|Bloque

Desvos estndares relativos al residual y correlaciones

Faro UDEC10
Faro 5.0E-06 0.00
UDEC10 0.00 5.0E-06

78
Modelos Mixtos en InfoStat

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~Genotipo:Nitrogeno - 1|Bloque

Desvos estndares relativos al residual y correlaciones


Faro:0 UDEC10:0 Faro:75 UDEC10:75 Faro:150 UDEC10:150 Faro:225 UDEC10:225
Faro:0 1.8E-05 0 0 0 0 0 0 0
UDEC10:0 0 1.8E-05 0 0 0 0 0 0
Faro:75 0 0 1.8E-05 0 0 0 0 0
UDEC10:75 0 0 0 1.8E-05 0 0 0 0
Faro:150 0 0 0 0 1.8E-05 0 0 0
UDEC10:150 0 0 0 0 0 1.8E-05 0 0
Faro:225 0 0 0 0 0 0 1.8E-05 0
UDEC10:225 0 0 0 0 0 0 0 1.8E-05

79
Modelos Mixtos en InfoStat

Aplicacin de modelos mixtos para mediciones repetidas en el tiempo

Datos longitudinales

Para la modelacin de datos longitudinales el aspecto ms importante a considerar es la


estructura de la matriz de covarianza residual, que es posible modelar especificando la
matriz de correlacin. En algunos casos tambin las varianzas pueden ser distintas para
algn criterio de agrupamiento y se debe modelar la heteroscedasticidad. Recordemos
que existe correlacin residual entre observaciones que comparten el mismo valor del
criterio de estratificacin, conocido tambin como sujeto, (por ejemplo, tomadas sobre
la misma persona, la misma parcela, el mismo animal, el mismo rbol, etc.). As, la
matriz de covarianza residual para todas las observaciones ser una matriz diagonal por
bloques, y en cada bloque se reflejar la estructura deseada, i.e. simetra compuesta,
autorregresiva de orden 1, etc.

Para especificar esto, InfoStat presenta dos solapas. En la solapa Correlacin se


encuentran las opciones que permiten especificar la estructura de correlacin de los
errores y en la solapa Heteroscedasticidad se pueden seleccionar distintos modelos de
varianza. As, las distintas estructuras de la matriz de covarianza residual que se pueden
ajustar resultan de combinar las distintas estructuras de correlacin con la posible
heteroscedasticidad en el tiempo. Si adicionalmente se desea especificar un efecto
aleatorio tambin es posible hacerlo usando la solapa correspondiente. En este caso se
debe tener mucha precaucin de no combinar efectos aleatorios, estructuras de
correlacin y de heteroscedasticidad tales que el modelo final no sea identificable. Esto
sucede cuando existe un conjunto infinito de valores de los parmetros para los cuales el
modelo es indistinguible, y por lo tanto las soluciones a las ecuaciones de verosimilitud
no son nicas.

Ejemplos de estas situaciones ocurren cuando se especifica una estructura de


correlacin de simetra compuesta con un criterio de estratificacin (por ejemplo, la
parcela) y un efecto aleatorio de ese mismo criterio de estratificacin sobre la constante.
En este caso la estructura de covarianza de las observaciones ser una matriz diagonal
por bloques, y cada bloque tendr una estructura de simetra compuesta. Por lo tanto,
esta estructura tiene intrnsecamente dos parmetros. Pero de la manera que la hemos
especificado aparecen tres parmetros (varianza del efecto aleatorio, correlacin

80
Modelos Mixtos en InfoStat

intraclase de la estructura de correlacin residual y varianza residual). Esta


sobreparametrizacin hace que existan infinitas soluciones, y por lo tanto los
estimadores no se pueden interpretar (y en muchos casos el algoritmo numrico no
converge). Otra situacin comn es la de una correlacin sin estructura (corSymm) con
un criterio de estratificacin dado (por ejemplo la parcela) y un efecto aleatorio de ese
mismo criterio de estratificacin sobre la constante (intercept).

Anlisis de un ensayo de establecimiento de forrajeras

A continuacin se presenta un ejemplo de modelacin de observaciones repetidas en el


tiempo. Los datos provienen de un ensayo de establecimiento de forrajeras para
comparar cinco mtodos de labranza (T1 = labranza mnima, T2 = labranza mnima con
herbicida, T3 = labranza mnima con herbicida y arado de disco a los 45 das,
T4 = labranza cero, y T5 = labranza convencional) en la regin central hmeda de
Puerto Rico. La especie usada fue Brachiaria decumbens cv. Basilik. El experimento
estaba diseado en tres bloques completos aleatorizados, y se analizan aqu las medidas
de cobertura (porcentaje de cobertura estimado en cada parcela). Hay 5 medidas
repetidas, tomadas con intervalos de un mes entre agosto y diciembre de 2001 (Moser y
Macchiavelli 2002). Los datos se encuentran en Cobertura forrajes.IDB2 en la carpeta
de datos de prueba de InfoStat.

Los perfiles promedio de cobertura observados en los cinco tiempos para cada uno de
los tratamientos se presentan en la Figura 57.

50

40
Cobertura (%)

30

20

10

0
1 2 3 4 5
Tiempo

T1 T2 T3 T4 T5

Figura 57: Relacin entre cobertura y tiempo para cinco tratamientos del archivo
Cobertura forrajes.IDB2.

81
Modelos Mixtos en InfoStat

Como estrategia general para analizar estos datos primero se ajustarn modelos con
distintas estructuras de covarianza, combinando apropiadamente estructuras de
correlacin residual, heteroscedasticidad residual y efectos aleatorios. Mediante criterios
de verosimilitud penalizada (AIC y BIC) se elegir el modelo que mejor describa los
datos, y usando este modelo se realizarn inferencias acerca de las medias (comparar
tratamientos, estudiar el efecto del tiempo, analizar si los perfiles promedio varan en el
tiempo, si son paralelos, etc.).

Para el elegir el mejor modelo comenzaremos proponiendo un modelo sencillo con


pocos parmetros a estimar (i.e. parsimonioso), e iremos adicionando parmetros hasta
llegar al modelo sin estructura, que es el menos parsimonioso.

Se usarn las siguientes estructuras de covarianza para los datos (covarianza marginal):

1. Errores independientes y homoscedsticos.


2. Errores independientes y heteroscedsticos.
3. Correlacin constante entre errores de la misma parcela y varianza residual constante
en el tiempo.
4. Correlacin constante entre errores de la misma parcela y varianza residual diferente
en los distintos tiempos.
5. Estructura autorregresiva de orden 1 entre los errores de la misma parcela y varianza
residual constante en el tiempo.
6. Estructura autorregresiva de orden 1 entre los errores de la misma parcela y varianza
residual diferente en los distintos tiempos.
7. Estructura autorregresiva de orden 1 entre los errores de la misma parcela, varianza
residual constante en el tiempo y efecto aleatorio de parcela.
8. Estructura autorregresiva de orden 1 entre los errores de la misma parcela, varianza
residual diferente en los distintos tiempos y efecto aleatorio de parcela.
9. Sin estructura para las correlaciones entre errores provenientes de la misma parcela y
varianzas residuales diferentes en el tiempo.

Para ajustar estos modelos en primer lugar se deben declarar las variables como se
indica en la Figura 58.

82
Modelos Mixtos en InfoStat

Figura 58: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del
ejemplo Cobertura forrajes.IDB2.

En todos los casos se us el mismo modelo de medias, ya que la parte fija del modelo
referido no cambi (imprescindible si se desea comparar estructuras de covarianza
usando REML, y por ende los criterios de AIC y BIC) (Figura 59). A continuacin se
detallar la forma de declarar cada uno de los modelos a evaluar seguido por una salida
de InfoStat con las medidas de ajuste correspondientes.

83
Modelos Mixtos en InfoStat

Figura 59: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura
forrajes.IDB2.

Modelo 1: Errores independientes y homoscedsticos

En la solapa Correlacin se debe declarar Errores independientes (Figura 60), que es la


opcin por defecto, y en la solapa Heteroscedasticidad no se declara nada.

84
Modelos Mixtos en InfoStat

Figura 60: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura
forrajes.IDB2 y seleccin de Errores independientes (Modelo 1).

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 465.05 517.45 -204.53 12.19 0.63
AIC y BIC menores implica mejor

Modelo 2: Errores independientes y heteroscedsticos

En la solapa Correlacin se debe declarar Errores independientes (opcin por defecto)


y en la solapa Heteroscedasticidad se declara varIdent y en criterio de agrupamiento se
declara Tiempo (Figura 61).

85
Modelos Mixtos en InfoStat

Figura 61: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo
Cobertura forrajes.IDB2 con seleccin de funcin varIdent con tiempo como criterio de agrupamiento
(Modelo 2).

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 465.83 525.71 -200.91 6.75 0.61
AIC y BIC menores implica mejor

Modelo 3: Correlacin constante entre datos de la misma parcela y varianza constante en el


tiempo.

En la solapa Correlacin se eligi la opcin Simetra Compuesta. Se debe declarar


tambin el Criterio de agrupamiento, en este caso la Parcela, para indicar que se est
modelando la correlacin de datos provenientes de una misma parcela (Figura 62). En la
solapa Heteroscedasticidad se dej la opcin por defecto, es decir no se eligi ningn
criterio (para esto ir a la solapa Heteroscedasticidad y borrar la seleccin anterior
desactivando todas las opciones y borrando varIdent(form=~1) con un doble clic).

86
Modelos Mixtos en InfoStat

Figura 62: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura
forrajes.IDB2 y seleccin de simetra compuesta para datos
agrupados por parcela (Modelo 3).

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 458.67 512.94 -200.34 12.59 0.63
AIC y BIC menores implica mejor

Modelo 4: Correlacin constante entre datos de la misma parcela y varianza diferente en los
distintos tiempos.

En la solapa Correlacin se eligi la opcin Simetra compuesta y en la solapa


Heteroscedasticidad eligi la opcin varIdent y en Criterios de agrupamiento se declara
Tiempo.

87
Modelos Mixtos en InfoStat

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 456.66 518.41 -195.33 8.05 0.48
AIC y BIC menores implica mejor

Modelo 5: Estructura autorregresiva de orden 1 entre los errores de la misma parcela y


varianza residual constante en el tiempo.

En la solapa Correlacin se eligi la opcin Autorregresivo de orden 1 (Figura 63).


Debido a que este modelo tiene en cuenta el orden en que fueron tomadas las
observaciones, la variable que indica esto se debe declarar en la ventana
correspondiente (en este caso la variable Tiempo). Para incorporar esta variable,
arrastrar Tiempo desde la ventana de la derecha. En la solapa Heteroscedasticidad se
dej la opcin por defecto, es decir no se eligi ningn criterio (para esto ir a la solapa
Heteroscedasticidad y borrar la seleccin anterior desactivando todas las opciones y
borrando varIdent(form=~1) con un doble clic).

88
Modelos Mixtos en InfoStat

Figura 63: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura
forrajes.IDB2 y seleccin de modelo Autorregresivo de orden 1 para datos agrupados por parcela y
orden de las observaciones indicado por la variable Tiempo (Modelo 5).

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 449.36 503.62 -195.68 12.40 0.63
AIC y BIC menores implica mejor

Modelo 6: Estructura autorregresiva de orden 1 entre los errores de la misma parcela y


varianza residual diferente en los distintos tiempos.

En la solapa Correlacin se eligi la opcin Autorregresivo de orden 1. En la solapa


Heteroscedasticidad se eligi la opcin varIdent y se especific el criterio de
agrupamiento que en este caso es la variable tiempo.

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 452.40 514.15 -193.20 8.78 0.63
AIC y BIC menores implica mejor

89
Modelos Mixtos en InfoStat

Modelo 7: Estructura autorregresiva de orden 1 entre los errores de la misma parcela,


varianza residual constante en el tiempo y efecto aleatorio de parcela.

En la solapa Correlacin se eligi la opcin Autorregresivo de orden 1 (igual que el


Modelo 5, Figura 63) y en la solapa Heteroscedasticidad se dej la opcin por defecto,
es decir no se eligi ningn criterio y se borraron las selecciones realizadas con
anterioridad. En la solapa Efectos aleatorios se declar a Parcela en Criterios de
estratificacin (Figura 64).

Figura 64: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura
forrajes.IDB2 con parcela como criterio de estratificacin (Modelo 7).

90
Modelos Mixtos en InfoStat

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


75 451.36 507.49 -195.68 12.40 0.63 0.63
AIC y BIC menores implica mejor

Modelo 8: Estructura autorregresiva de orden 1 entre los errores de la misma parcela,


varianza residual diferente en los distintos tiempos y efecto aleatorio de parcela.

En la solapa Correlacin se eligi la opcin Autorregresivo continuo de orden 1


(Figura 65) para mostrar que en este caso es igual al Autorregresivo de orden 1. Si los
tiempos no fuesen equidistantes, la estructura corAR1 no es aplicable, y se debe usar su
anloga continua (corCAR1). Para este ejemplo ambas estructuras son equivalentes
debido a que los tiempos son equidistantes.

En la solapa Heteroscedasticidad se dej la opcin varIdent (como en la Figura 61). En


la solapa Efectos aleatorios se declar a Parcela como Criterio de estratificacin (como
en el Modelo 7, Figura 64).

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


75 454.40 518.03 -193.20 8.78 0.63 0.63
AIC y BIC menores implica mejor

91
Modelos Mixtos en InfoStat

Figura 65: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura
forrajes.IDB2 y seleccin de modelo Autorregresivo continuo de orden 1 para datos agrupados por
parcela y orden de las observaciones indicado por la variable Tiempo (Modelo 8).

Modelo 9: Sin estructura para los datos provenientes de la misma parcela.

En la solapa Correlacin se eligi la opcin Sin estructura (Figura 66) y en la solapa


Heteroscedasticidad se dej tildada la opcin varIdent (como en Figura 61). En la
solapa Efectos aleatorios se elimin Parcela en Criterios de estratificacin.

92
Modelos Mixtos en InfoStat

Figura 66: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura
forrajes.IDB2 y seleccin de modelo Sin estructura para datos agrupados por parcela y orden de las
observaciones indicado por la variable Tiempo (Modelo 9).

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 425.03 503.62 -170.51 6.82 0.60
AIC y BIC menores implica mejor

Seleccin de la estructura de covarianza

Si comparamos los valores de AIC (o los de BIC) para las estructuras que hemos
ajustado, se puede observar que el menor valor se obtiene con el Modelo 9 (AIC =
425.03, BIC = 503.62). Por lo tanto elegimos la covarianza sin estructura. Observemos
los parmetros estimados bajo este modelo:

93
Modelos Mixtos en InfoStat

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 425.03 503.62 -170.51 6.82 0.60
AIC y BIC menores implica mejor

Estructura de correlacin
Modelo de correlacion: General correlation
Formula: ~ as.integer(Tiempo) | Parcela
Matriz de correlacin comn

1 2 3 4
2 0.3230
3 0.7160 0.2760
4 0.0650 0.0990 0.4600
5 0.0450 0.1240 0.4580 0.9950
Estructura de varianzas
Modelo de varianzas: varIdent
Formula: ~ 1 | Tiempo
Parmetros del modelo
Parmetro Estim
1 1.0000
2 1.1819
3 1.9653
4 2.3775
5 2.2697

Las varianzas estimadas para cada uno de los 5 tiempos se calculan de la siguiente
manera:

=12 6.8211
= 2
46.53
22 =(1.1819 6.8211) =64.99
2

32 =(1.9653 6.8211) =179.71


2

42 =( 2.3775 6.8211) =263.00


2

52 =( 2.2697 6.8211) =239.69


2

Las 10 correlaciones estimadas aparecen directamente como una matriz en Estructura


de Correlacin.

94
Modelos Mixtos en InfoStat

Inferencia sobre las medias

Una vez elegida la estructura de covarianza de los datos (en este caso el modelo sin
estructura) podemos proceder a realizar inferencias acerca de las medias. Los perfiles
promedios observados para cada tratamiento se presentaron en la Figura 57.

En un experimento factorial como este, donde se tiene el factor tratamiento y el factor


tiempo, lo primero que se debe indagar es si existe interaccin entre los tratamientos y
el tiempo. Para ello podemos realizar una prueba de Wald, que aparece directamente en
InfoStat como Trat:Tiempo en las pruebas secuenciales (recordemos que la interaccin
es el ltimo trmino que colocamos en el modelo). Otra opcin es realizar una prueba
del cociente de verosimilitudes (LRT por sus siglas en ingls). Para esta ltima no
podemos usar REML debido a que estamos probando modelos con efectos fijos
diferentes, y por lo tanto los estimadores REML no son comparables. En su lugar se usa
el estimador mximo verosmil (ML).

Pruebas de hiptesis secuenciales

numDF F-value p-value

(Intercept) 1 127.93 <0.0001

Bloque 2 2.75 0.0739

Tratam 4 6.28 0.0004

Tiempo 4 16.77 <0.0001

Tratam:Tiempo 16 1.49 0.1417

Para realizar una prueba de cociente de verosimilitudes podemos ajustar (con ML) dos
modelos con la misma estructura de covarianza (en este ejemplo el modelo sin
estructura) pero que difieren en su parte fija: uno contiene la interaccin (modelo
completo) y el otro no la contiene (modelo reducido):

Modelo completo:

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 535.33 632.67 -225.67 5.29 0.60
AIC y BIC menores implica mejor

95
Modelos Mixtos en InfoStat

Modelo reducido:

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


75 527.01 587.27 -237.51 5.55 0.38
AIC y BIC menores implica mejor

Si bien la prueba LRT se puede obtener directamente desde el men Anlisis-


exploracin de modelos estimados, solapa Modelos, a continuacin se muestra otra
forma de calcularla. En primer lugar se obtiene el estadstico de la prueba LRT,
G = 2 log lik completo 2 log lik reducido = 2(225.67) 2(237.51) = 23.68 . Este tiene 42-

26=16 grados de libertad, y arroja un valor p=0.0967, por lo que podemos decir que no
existe interaccin con un nivel de significancia del 5%. Este valor de probabilidad se
obtiene a partir de una distribucin chi-cuadrado con 16 grados de libertad, y puede ser
calculado con la herramienta Calculador de probabilidades y cuantiles del men
Estadsticas de InfoStat (Figura 67).

Figura 67: Ventana del Calculador de probabilidades y cuantiles de InfoStat.

Ambas pruebas (Wald y LRT) indican una interaccin no significativa (aunque los
p-valores no son demasiado altos, p=0.1417 y p=0.0967 respectivamente), por lo que

96
Modelos Mixtos en InfoStat

podemos (con precaucin) realizar pruebas de efectos de tratamiento y tiempo por


separado.

Contrastando tiempos sucesivos

Para comparar los tiempos sucesivos, es decir el tiempo 1 con el tiempo 2, el tiempo 2
con el tiempo 3 y as sucesivamente, se debe activar la solapa Comparaciones y dentro
de esta la subsolapa Contrastes y seleccionar el efecto Tiempo (Figura 68). El resto de
las ventanas debe quedar como en el Modelo 9, que fue elegido como el de mejor
estructura de correlacin para explicar el comportamiento de estos datos en el tiempo.

Figura 68: Ventana con la solapa Comparaciones desplegada para los datos del archivo Cobertura
forrajes.IDB2 y seleccin de la subsolapa Contrastes.

97
Modelos Mixtos en InfoStat

Pruebas de hiptesis para contrastes

F gl(num) gl(den) p-valor


Cont.1 18.94 1 48 0.0001
Cont.2 2.70 1 48 0.1070
Cont.3 0.19 1 48 0.6640
Cont.4 0.34 1 48 0.5645
Total 16.77 4 48 <0.0001

Las salidas presentadas aqu corresponden a las estimaciones REML. Est claro a partir
de estos resultados que, en promedio para los cuatro tratamientos, se ve un cambio
significativo entre los tiempos 1 y 2, pero en tiempos posteriores la cobertura promedio
no cambia significativamente. Las mismas conclusiones se obtienen realizando una
comparacin de medias de cada tiempo (LSD):

Medias ajustadas y errores estndares para Tiempo


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Tiempo Medias E.E.


3 30.29 3.46 A
4 28.53 4.19 A
5 28.27 4.00 A
2 24.53 2.08 A
1 14.73 1.76 B
Letras distintas indican diferencias significativas(p<= 0.05)

Comparacin de tratamientos
Medias ajustadas y errores estndares para Tratam
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Tratam Medias E.E.


5 39.60 5.15 A
1 31.27 5.15 A B
4 24.96 5.15 A B C
3 17.33 5.15 B C
2 13.19 5.15 C
Letras distintas indican diferencias significativas(p<= 0.05)

A partir de esta comparacin de medias ajustadas se puede concluir que los tratamientos
5, 1 y 4 son los que proveen mayor cobertura y no se diferencian estadsticamente entre
s.

98
Modelos Mixtos en InfoStat

Anlisis de un ensayo de drogas para asma

Una compaa farmacutica ha examinado los efectos de dos drogas (A y B) sobre la


capacidad respiratoria de pacientes de asma (Littell et l. 2002, 2006). Las dos drogas y
un placebo (P) fueron administradas a un grupo de pacientes en forma aleatoria. Se
cont con 24 pacientes por cada uno de los tres tratamientos. A cada paciente se le
midi la capacidad respiratoria basal (Cap_Rep_Bas) inmediatamente antes de aplicarle
el tratamiento y la capacidad respiratoria cada hora durante las 8 horas siguientes
(Cap_Respirat). Los datos estn en el archivo CapacidadRespiratoria.IDB2.

Usando nuevamente la estrategia definida en los ejemplos anteriores, primero se


ajustarn modelos con distintas estructuras de covarianza, combinando apropiadamente
estructuras de correlacin residual, heteroscedasticidad residual y efectos aleatorios.
Mediante criterios de verosimilitud penalizada (AIC y BIC) y pruebas de cociente de
verosimilitud se elegir el modelo que mejor describa los datos. Una vez seleccionado el
modelo de estructura de covarianza adecuado se realizarn inferencias acerca de las
medias (comparar medias de drogas, estudiar el efecto del tiempo, analizar si los
perfiles promedio varan en el tiempo, si son paralelos, etc.). Es importante destacar que
toda la inferencia sobre las medias estar basada en el modelo de estructura de
covarianza seleccionado.

Debido a que la variable que identifica al paciente (Paciente) en la base de datos toma
valores iguales dentro de cada droga, para identificar a los 72 pacientes de este estudio
se ha debido crear una nueva variable (paciente_droga) que identifica completamente al
paciente. Para hacer esto se ha usado el men Datos, submen Cruzar categoras para
formar una nueva variable (seleccionado Paciente y Droga en la ventana del selector de
variables). Este es un experimento bifactorial y se usa un modelo que contempla los
factores Droga, Hora y su interaccin y la covariable Cap_Rep_Bas (todos de efectos
fijos). Para realizar el anlisis de este modelo, se deben declarar las variables de la
siguiente forma (Figura 69).

99
Modelos Mixtos en InfoStat

Figura 69: Ventana de selector de variables con los datos del archivo CapacidadRespiratoria.IDB2.

En primer lugar se evaluar un conjunto de modelos para determinar cul es el que


mejor ajusta. Los modelos evaluados son:

1. Errores independientes y varianzas residuales homoscedsticas.


2. Simetra compuesta y varianzas residuales homoscedsticas.
3. Auto regresivo de orden 1 y varianzas residuales homoscedsticas.
4. Auto regresivo de orden 1 y varianzas residuales heteroscedsticas.
5. Auto regresivo de orden 1 y varianzas residuales homoscedsticas y efecto aleatorio
de paciente.
6. Auto regresivo de orden 1 y varianzas residuales heteroscedsticas y efecto aleatorio
de paciente.
7. Matriz de varianzas y covarianzas sin estructura y varianzas residuales
heteroscedsticas.

La especificacin de la parte fija del modelo es la misma para los 7 modelos evaluados
(Figura 70). Para obtener el ajuste del Modelo 1 solo se debe activar el botn Aceptar
con el modelo de efectos fijos presentado a continuacin:

100
Modelos Mixtos en InfoStat

Figura 70: Ventana con la solapa Efectos fijos desplegada con los datos del archivo
CapacidadRespiratoria.IDB2.

Para ajustar el Modelo 2, se deben especificar las ventanas como en la Figura 70 y la


Figura 71. El Modelo 3 se especifica como en la Figura 70 y la Figura 72. El Modelo 4
se especifica como el anterior ms el agregado de varianzas residuales heterogneas
como en la Figura 73. El Modelo 5 se especifica con las ventanas presentadas en la
Figura 70, la Figura 72 y la Figura 74. El Modelo 6 es como el Modelo 5 ms la
especificacion de varianzas residuales heterogneas (Figura 73). El modelo 7 se
especifica como se muestra en la Figura 70, Figura 73 y Figura 75).

101
Modelos Mixtos en InfoStat

Figura 71: Ventana con la solapa Correlacin desplegada, opcin Simetra compuesta, con los datos
del archivo CapacidadRespiratoria.IDB2.

102
Modelos Mixtos en InfoStat

Figura 72: Ventana con la solapa Correlacin desplegada, opcin Autorregresivo de orden 1, con los
datos del archivo CapacidadRespiratoria.IDB2.

103
Modelos Mixtos en InfoStat

Figura 73: Ventana con la solapa Heteroscedasticidad desplegada con los datos del archivo
CapacidadRespiratoria.IDB2.

104
Modelos Mixtos en InfoStat

Figura 74: Ventana con la solapa Efectos aleatorios desplegada con los datos del archivo
CapacidadRespiratoria.IDB2.

105
Modelos Mixtos en InfoStat

Figura 75: Ventana con la solapa Correlacin desplegada, opcin Sin estructura, con los datos del
archivo CapacidadRespiratoria.IDB2.

Luego de ajustar todos los modelos estos son los resultados:

Cuadro 2. Caractersticas y medidas de ajuste de los modelos evaluados para los datos del archivo
CapacidadRespiratoria.IDB2.

Varianzas
Efecto
Correlacin residuales
Modelo aleatorio AIC BIC log lik
residual heterogneas
paciente
en el tiempo
1 NO NO NO 968.94 1081.04 -458.47
Simetra
2 NO NO 401.29 517.71 -173.65
Compuesta
3 NO AR1 NO 329.04 445.45 -137.52
4 NO AR1 S 324.57 471.17 -128.28
5 S AR1 NO 303.03 423.76 -123.52
6 S AR1 S 287.80 438.71 -108.90
7 NO Sin estructura S 270.27 533.29 -74.14

106
Modelos Mixtos en InfoStat

A partir del Cuadro 2 podemos observar que los modelos 6 y 7 presentan los valores
ms bajos de AIC mientras que los modelos 5 y 6 presentan los valores ms bajos para
BIC. Una prueba formal de cociente de verosimilitud para comparar los modelos 5 y 6
puede obtenerse mediante:

X 2 = 2(log lik modelo reducido - log lik modelo completo)


=2(123.52 + 108.90) =29.24

Como ambos modelos difieren en 7 parmetros (el Modelo 5 tiene una nica varianza
residual y el Modelo 6 tiene 8 varianzas residuales), el estadstico de verosimilitud se
compara con un valor crtico de una distribucin chi-cuadrado con 7 grados de libertad.
Al hacer esto con el calculador de probabilidades y cuantiles de InfoStat obtenemos un
p-valor de 0.0001, lo que nos lleva a escoger el modelo completo (Modelo 6).

La misma prueba se puede realizar con el men Estadsticas>>Modelos lineales


generales y mixtos>> Anlisis-exploracin de modelos estimados. Para comparar ambos
modelos seleccionamos la solapa Modelos y obtenemos los siguientes resultados:

Comparacin de modelos

Model df AIC BIC logLik Test L.Ratio p-value


5 28 303.03 423.76 -123.52
6 35 287.80 438.71 -108.90 1 vs 2 29.23 0.0001

Los resultados de la prueba del cociente de verosimilitud indican que entre estos dos
modelos el mejor es el Modelo 6. Luego, resta solo comparar el Modelo 6 con el 7. En
este caso el modelo reducido es el 6 y el completo es el 7. Los resultados para esta
comparacin son:

Comparacin de modelos

Model df AIC BIC logLik Test L.Ratio p-value


7 61 270.27 533.29 -74.14
6 35 287.80 438.71 -108.90 1 vs 2 69.53 <0.0001

Los resultados indican que el Modelo 7 es el mejor. Por lo tanto el modelo seleccionado
tiene una estructura de correlacin residual sin estructura y varianzas residuales
heterogneas en el tiempo. La salida completa para este modelo se presenta a
continuacin:

107
Modelos Mixtos en InfoStat

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo007_Cap_Respirat_REML<-
gls(Cap_Respirat~1+Droga+Hora+Droga:Hora+Cap_Resp_base
,weight=varComb(varIdent(form=~1|Hora))
,correlation=corSymm(form=~as.integer(as.character(Hora))|Paciente_Dro
ga)
,method="REML"
,na.action=na.omit
,data=R.data09)

Resultados para el modelo: modelo007_Cap_Respirat_REML

Variable dependiente:Cap_Respirat

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


576 270.27 533.29 -74.14 0.48 0.55
AIC y BIC menores implica mejor

Pruebas de hiptesis marginales(SC tipo III)

numDF F-value p-value


(Intercept) 1 6.49 0.0111
Droga 2 7.25 0.0008
Hora 7 13.72 <0.0001
Cap_Resp_base 1 92.57 <0.0001
Droga:Hora 14 4.06 <0.0001

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 3936.01 <0.0001
Droga 2 13.87 <0.0001
Hora 7 13.72 <0.0001
Cap_Resp_base 1 92.57 <0.0001
Droga:Hora 14 4.06 <0.0001

Estructura de correlacin

Modelo de correlacin: General correlation


Formula: ~ as.integer(as.character(Hora)) | Paciente_Droga

Matriz de correlacin comn

1 2 3 4 5 6 7 8
1 1.00 0.89 0.88 0.78 0.69 0.67 0.52 0.65
2 0.89 1.00 0.91 0.87 0.81 0.70 0.59 0.70
3 0.88 0.91 1.00 0.91 0.81 0.75 0.64 0.74
4 0.78 0.87 0.91 1.00 0.82 0.73 0.67 0.75
5 0.69 0.81 0.81 0.82 1.00 0.85 0.73 0.84
6 0.67 0.70 0.75 0.73 0.85 1.00 0.81 0.88
7 0.52 0.59 0.64 0.67 0.73 0.81 1.00 0.82
8 0.65 0.70 0.74 0.75 0.84 0.88 0.82 1.00

108
Modelos Mixtos en InfoStat

Estructura de varianzas

Modelo de varianzas: varIdent


Formula: ~ 1 | Hora

Parmetros de la funcin de varianza

Parmetro Estim
1 1.00
2 1.07
3 1.06
4 1.15
5 1.12
6 1.07
7 1.09
8 1.15

Medias ajustadas y errores estndares para Droga


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Droga Medias E.E.


B 3.33 0.09 A
A 3.11 0.09 A
P 2.82 0.09 B
Letras distintas indican diferencias significativas(p<= 0.05)

Medias ajustadas y errores estndares para Hora


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Hora Medias E.E.


1 3.33 0.06 A
2 3.30 0.06 A
3 3.22 0.06 B
4 3.12 0.06 C
5 3.02 0.06 D
6 2.96 0.06 D
7 2.88 0.06 E
8 2.87 0.06 E
Letras distintas indican diferencias significativas(p<= 0.05)

Medias ajustadas y errores estndares para Droga*Hora


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Droga Hora Medias E.E.


B 1 3.69 0.10 A
B 2 3.63 0.10 A B
B 3 3.58 0.10 A B
A 1 3.47 0.10 A B C
B 4 3.44 0.11 B C D
A 2 3.39 0.10 B C D
B 5 3.25 0.11 C D E
A 3 3.18 0.10 D E F
B 6 3.08 0.10 E F G

109
Modelos Mixtos en InfoStat

A 5 3.05 0.11 E F G H
A 4 3.04 0.11 E F G H
B 8 3.01 0.11 E F G H I
A 6 2.98 0.10 E F G H I
B 7 2.98 0.11 F G H I
P 3 2.90 0.10 F G H I
P 2 2.89 0.10 G H I
P 4 2.87 0.11 G H I
A 7 2.87 0.11 G H I
A 8 2.86 0.11 G H I
P 1 2.83 0.10 G H I
P 6 2.82 0.10 G H I
P 7 2.79 0.11 H I
P 5 2.77 0.11 H I
P 8 2.73 0.11 I
Letras distintas indican diferencias significativas(p<= 0.05)

Podemos ver que hay interaccin significativa entre la droga y el tiempo (p<0.0001),
por lo que procederemos a realizar un Grfico de interaccin. Para realizar este grfico
en primer lugar se copiaron las Medias ajustadas y errores estndares para
Droga*Hora y se pegaron en una nueva tabla de InfoStat. Esta tabla fue guardada como
MedCapRes.IDB2. Luego en el men Grficos>>Grficos de puntos se declararon las
variables como se muestra a continuacin (Figura 76 y Figura 77):

Figura 76: Ventana de selector de variables para los datos del archivo MedCapRes.IDB2.

110
Modelos Mixtos en InfoStat

Figura 77: Ventana de selector de variables con solapa Particiones activada para los datos del archivo
MedCapRes.IDB2.

Es importante recalcar que debido a que los errores estndar de cada una de las
combinaciones de tratamientos y horas son diferentes stos deben ser tenidos en cuenta
al momento de solicitar el grfico. Esto se logra declarando la medida de error en la
subventana Error. Con estas especificaciones se obtiene el grfico para estudiar la
interaccin (Figura 78).

111
Modelos Mixtos en InfoStat

3.80

3.70

3.60

Droga A
3.50 Droga B
Placebo
3.40
Capacidad respiratoria media

3.30

3.20

3.10

3.00

2.90

2.80

2.70

2.60
1 2 3 4 5 6 7 8
Hora

Figura 78: Grfico de puntos para estudiar la interaccin entre tratamientos y hora con los datos del
archivo CapacidadRespiratoria.IDB2.

Podemos observar que mientras el placebo tiene una respuesta prcticamente constante,
las drogas A y B aumentan la capacidad respiratoria despus de su aplicacin. Esta
capacidad va disminuyendo con el tiempo, y siempre es superior el valor medio de la
droga B respecto a la droga A. Para encontrar diferencias significativas entre los
tratamientos en cada una de las horas se pueden realizar contrastes. En este caso, dentro
de cada hora se pueden probar hiptesis sobre igualdad de medias entre drogas y
placebo, y entre las dos drogas. Para la obtencin de los contrastes (en este caso
ortogonales) se deben declara en la solapa Comparaciones, subsolapa Contrastes como
en la Figura 79.

112
Modelos Mixtos en InfoStat

Figura 79: Ventana con la solapa Comparaciones, subsolapa Contrastes con los datos del archivo
CapacidadRespiratoria.IDB2.

A continuacin se presentan lo valores de probabilidad para los contrastes solicitados:


Pruebas de hiptesis para contrastes

Droga*Hora F gl(num) gl(den) p-valor


Ct.1 40.08 1 551 <0.0001
Ct.2 2.54 1 551 0.1119
Ct.3 23.46 1 551 <0.0001
Ct.4 2.46 1 551 0.1170
Ct.5 14.55 1 551 0.0002
Ct.6 7.36 1 551 0.0069
Ct.7 7.39 1 551 0.0068
Ct.8 6.37 1 551 0.0119
Ct.9 8.11 1 551 0.0046
Ct.10 1.63 1 551 0.2022
Ct.11 2.86 1 551 0.0914
Ct.12 0.53 1 551 0.4651
Ct.13 1.09 1 551 0.2965
Ct.14 0.53 1 551 0.4656
Ct.15 2.13 1 551 0.1446
Ct.16 0.94 1 551 0.3319
Total 5.19 16 551 <0.0001

113
Modelos Mixtos en InfoStat

Los Contrastes 1, 3, 5, 7 y 9 comparan el placebo con el promedio de las drogas para las
horas 1, 2, 3 ,4 y 5 respectivamente. Debido a que todos estos son significativos
(p<0.05) podemos decir que recin a la hora 6 de aplicadas las drogas estas pierden su
efecto, ya que los contrastes 11, 13 y 15 no son significativos. Respecto a la
comparacin de las drogas entres s, la superioridad de la B sobre la A se manifiesta
(p<0.05) solo en las horas 3 y 4 (contrastes 6 y 8 respectivamente).

114
Modelos Mixtos en InfoStat

Anlisis de ensayo de descomposicin

En los ensayos de descomposicin de hojarasca la materia seca remanente en cada


tiempo es analizada, generalmente, mediante ANCOVA, usando el tiempo como
covariable y transformacin logartmica de la respuesta, o ANOVA para un diseo en
parcelas divididas, cuando los periodos de evaluacin son equi-distantes. Las unidades
de observacin consisten en bolsas conteniendo el material vegetal. Usualmente estas
bolsas son agrupadas para conformar una repeticin y permitir su evaluacin a lo largo
del tiempo, evaluando el contenido de una bolsa en cada instancia de valoracin.
Aunque en cada tiempo las bolsas evaluadas son distintas, en muchas ocasiones la
estructura de correlacin que supone independencia o simetra compuesta (inducida por
la agrupacin de bolsas que representan una repeticin) no es suficiente para explicar
las correlaciones observadas. Las observaciones cercanas en el tiempo suelen estar ms
correlacionadas que las lejanas, o las correlaciones entre observaciones en los primeros
tiempos son diferentes a las de los ltimos. El uso de modelos mixtos permite no slo
manejar estructuras de correlacin ms complejas sino tambin la posibilidad de
modelar varianzas heterogneas. En estos modelos los tratamientos pueden ser incluidos
como factores de clasificacin y el tiempo puede modelarse tanto como una covariable
o como un factor. Este ltimo caso produce modelos menos parsimoniosos pero ms
flexibles para modelar diferentes tendencias en el tiempo. Por otra parte, la introduccin
de efectos aleatorios sobre los parmetros que involucran al tiempo puede ser usada
para corregir falta de ajuste.

En el ejemplo, que se presenta a continuacin, se analizan un conjunto de datos


proveniente de un ensayo de descomposicin realizado en ambiente acutico tropical
(Martinez 2006). Los tratamientos comparados consisten en: dos especies (Guadua sp. y
Ficus sp.) de las cuales se obtiene el material vegetal y dos tamao de la trama de la
bolsa donde se coloca el material (tramado fino y grueso). Los cuatro tratamientos
contaron con 5 repeticiones (conteniendo 7 bolsas cada una) y fueron evaluados en 7
tiempos. El propsito de este ensayo fue establecer el efecto de los factores y el tiempo
sobre la tasa de descomposicin. Los datos se encuentran en el archivo
Descomposicion.IDB2.

Los datos originales (materia seca remanente) fueron transformados a logaritmos. El


grfico del logaritmo de la materia seca remanente (en adelante la respuesta) en funcin
del tiempo y para cada tratamiento (Figura 80) muestra un decaimiento del peso seco

115
Modelos Mixtos en InfoStat

remanente en funcin del tiempo. Se insina tambin una posible falta de


homoscedasticidad en funcin del tiempo y dependiente de la especie y el tramado de la
tela de la bolsa. Una primera aproximacin a la modelacin de estos datos podra ser el
ajuste de un modelo de regresin con ordenadas al origen y pendientes diferentes. Para
realizar este ajuste se invoc al mdulo de modelos mixtos indicando como variable
dependiente al LnPesoSeco, como factores de clasificacin a Especie y Bolsa y como
covariable al Tiempo. Luego en la solapa de la parte fija del modelo se indicaron los
trminos que se presentan en la Figura 81. El grfico del modelo ajustado se presenta en
la Figura 82.

1.5

1.0

0.5

0.0

-0.5
LnPesoSeco

-1.0

-1.5

-2.0

-2.5

-3.0

-3.5

-4.0
0 10 20 30 40 50 60 70 80 90
Tiempo

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 80: Grfico de puntos para el logaritmo del peso seco remanente en funcin del tiempo, para
los cuatro tratamientos (Especie-Bolsa). Archivo Descomposicin.IDB2.

116
Modelos Mixtos en InfoStat

Figura 81: Especificacin del modelo de regresin lineal con ordenadas al origen y pendientes
diferentes para el logaritmo de la materia seca remanente en funcin del tiempo para cuatro
tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo
almacena. Archivo Descomposicin.IDB2.

117
Modelos Mixtos en InfoStat

1.5

1.0

0.5

0.0

-0.5
LnPesoSeco

-1.0

-1.5

-2.0

-2.5

-3.0

-3.5

-4.0
0 10 20 30 40 50 60 70 80 90
Tiempo

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 82: Grfico de puntos para el logaritmo del peso seco remanente en funcin del tiempo, para
los cuatro tratamientos (Especie-Bolsa). Archivo Descomposicin.IDB2.

La Figura 82 muestra que el ajuste de rectas especficas por tratamiento, es una


aproximacin que, aunque plausible, no da cuenta de algunas particularidades de la
prdida de peso seco. Esto se refleja en la presencia de curvatura en los residuos (Figura
83). Una forma de resolver el problema de la presencia de curvatura es la imposicin de
un modelo que incluya trminos cuadrticos para el tiempo. Para ello tendremos que
extender el modelo propuesto en Figura 81, incluyendo todos los trminos
correspondientes al tiempo al cuadrado. Para simplificar la notacin hemos creado tres
variables T1 y T2 que representan el tiempo y el tiempo al cuadrado y Especie_Bolsa
que identifica los cuatro tratamientos. T1 es el tiempo centrado respecto del valor 30
(das) y T2 el cuadrado de T1. La razn para centrar las covariables es romper la
colinealidad que resulta de utilizar una regresora y su cuadrado y mejorar la condicin
de la matriz XX. Las variables T1 y T2 as como Especie_Bolsa se incluyen en el
archivo Descomposicin.IDB2. En la invocacin del mdulo de modelos mixtos debera
incluirse Especie_Bolsa como factor de clasificacin y T1 y T2 como covariables.
Luego en la solapa de los efectos fijos del modelo debera verse como se muestra en la
Figura 84.

118
Modelos Mixtos en InfoStat

Figura 83: Grfico de residuos estudentizados (Pearson) vs. Tiempo, para un modelo de regresin de
la materia seca residual en funcin del tiempo para cuatro tratamientos (Especia-Bolsa) con diferentes
ordenadas y pendientes. Archivo Descomposicin.IDB2.

Figura 84: Especificacin del modelo de regresin lineal con ordenadas y pendientes diferentes para el
logaritmo de la materia seca remanente en funcin del tiempo para cuatro tratamientos dados por la
especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo
Descomposicin.IDB2.

119
Modelos Mixtos en InfoStat

1.50

1.00

0.50

0.00

-0.50
LnPesoSeco

-1.00

-1.50

-2.00

-2.50

-3.00

-3.50

-4.00
0 10 20 30 40 50 60 70 80 90
Tiempo

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 85: Ajustes del modelo de regresin polinmica de orden 2 con ordenadas y pendientes
diferentes para el logaritmo de la materia seca remanente en funcin del tiempo y el tiempo^2
(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado
de la bolsa que lo almacena. Archivo Descomposicin.IDB2.

Los residuos del modelo ajustado segn Figura 84, muestran dos problemas:
heteroscedasticidad (que depende del tiempo y los tratamientos) y falta de ajuste, ya que
para algunos tratamientos y tiempos, los residuos de Pearson aparecen por encima o por
debajo de la lnea del cero (Figura 86).

En este punto optaremos por modelar primeramente, el problema de heteroscedasticidad


utilizando varianzas diferentes para cada combinacin Especie-Bolsa. Para ello, en la
ventana de especificacin del modelo dejaremos la parte fija tal cual se indic en la
Figura 84, pero en la solapa Heteroscedasticidad indicaremos que la varianza debe ser
estimada de manera diferente para la combinacin de tiempo y tratamiento segn se
muestra en la Figura 87. Los residuos estudentizados vs. tiempo para este modelo se
presentan en la (Figura 88). An cuando se pudo subsanar, en gran medida, el problema
de la heteroscedasticidad, persisten problemas de falta de ajuste que se visualizan en
conjuntos de residuos de un nico tratamiento en un tiempo dado que quedan ya sean
todos positivos o negativos.

120
Modelos Mixtos en InfoStat

4.00

3.00

Residuos LnPesoSeco (Pearson)


2.00

1.00

0.00

-1.00

-2.00

-3.00

-4.00

-5.00

-6.00

-7.00
0 23 45 68 90
Tiempo

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 86: Residuos estudentizados (Pearson) vs. Tiempo para el modelo de regresin polinmica de
orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en
funcin del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen
del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposicin.IDB2.

Figura 87: Especificacin de la parte heteroscedstica del modelo de regresin polinmica de orden 2
con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en funcin del
tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material
vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposicin.IDB2.

121
Modelos Mixtos en InfoStat

Una forma de resolver esta falta de ajuste, es agregar efectos aleatorios sobre el nivel
medio para las combinaciones de tiempo y tratamientos. Si en la solapa Efectos
aleatorios agregamos Tiempo_Especie_Bolsa y dejamos tildado el casillero
correspondiente a la Constante estamos indicando que se trata de un corrimiento
aleatorio respecto al valor esperado para cada tratamiento y tiempo bajo el modelo de
regresin utilizado (Figura 89). Finalmente, el grfico de residuos estudentizados de
este modelo muestra una imagen donde no hay evidencia de falta de ajuste o presencia
de heteroscedasticidad (Figura 90).

2.50
Residuos LnPesoSeco (Pearson)

1.25

0.00

-1.25

-2.50
0 23 45 68 90
Tiempo

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 88: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedstico de regresin
con ordenadas y pendientes diferentes por tratamiento para el logaritmo de la materia seca remanente
en funcin del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de
origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposicin.IDB2.

122
Modelos Mixtos en InfoStat

Figura 89: Especificacin de la parte aleatoria del modelo heteroscedstico de regresin polinmica de
orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en
funcin del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen
del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposicin.IDB2.

2.50
Residuos LnPesoSeco (Pearson)

1.25

0.00

-1.25

-2.50
0 10 20 30 40 50 60 70 80 90
Tiempo

Ficus:Fino Ficus:Grueso Guadua:Fino Guadua:Grueso

Figura 90: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedstico de regresin
con ordenadas y pendientes diferentes por tratamiento y el agregado de un efecto aleatorio sobre la
constante que es particular para cada combinacin de tiempo y tratamiento, para el logaritmo de la
materia seca remanente en funcin del tiempo y el tiempo^2 (centrados) para cuatro tratamientos
dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo
Descomposicin.IDB2.

123
Modelos Mixtos en InfoStat

Finalmente, como el propsito de este ensayo fue calcular las tasas de descomposicin y
lo que hemos ajustado es un modelo lineal para el logaritmo del peso de materia seca
remanente, podemos estimar la tasa de descomposicin como la derivada de
-exp(modelo ajustado). Utilizaremos la interfase con R para obtener estas derivadas.
Apretando la tecla F9 se invoca la ventana del intrprete de R (Figura 91). A la derecha
de la ventana aparecern una lista de los objetos R que se hayan creado durante la sesin
de trabajo. En esta lista debe aparecer el modelo ajustado utilizando el modulo de
modelos mixtos, el nombre de estos objetos es modelo+ nmero correlativo_nombre
de la variable dependiente_mtodo de estimacin. En nuestro ejemplo debera aparecer
modelo#_LnPesoSeco_REML (en la posicin # debe haber un nmero que depende del

nmero de veces que se ajusto un modelo para la misma variable dependiente). En el


ejemplo figura el modelo modeloOO1_LnPesoSeco_REML.

Figura 91: Intrprete de R. Tiene 4 paneles. Script: contiene el o los programas R que se quieren
ejecutar. Output: la salida de la ejecucin de un script o de la visualizacin de un objeto, Objetos: la
lista de los objetos residente en la memoria de R. Finalmente un panel inferior muestra los mensajes y
reporte de errores que enva R a la consola.

Para calcular las tasas de descomposicin tenemos que comprender qu es lo que hemos
ajustado con el modelo lineal estimado. La parte fija de modelo propuesto fue:

124
Modelos Mixtos en InfoStat

Especie_Bolsa
T1
T2
Especie_Bolsa*T1
Especie_Bolsa*T2
Este modelo es equivalente a:

Especie_Bolsa-1
Especie_Bolsa*T1
Especie_Bolsa*T2
La ventaja de esta forma resumida de especificarlo es que los coeficientes de la parte
fija aparecen directamente como en la equacin (8).

Este modelo especifica una regresin polinmica de segundo grado en el tiempo


(centrado alrededor de 30 das) para cada una de las combinaciones de Especie y
tramado de Bolsa. As, lo que estimamos es una funcin de la forma:

ln PesoSeco = i 0 + i1 (T 30 ) + i 2 (T 30 )
2
(9)

Donde el ndice i indica el tratamiento (en este caso i identifica a las cuatro
combinaciones de Especie y tramado de Bolsa). Es decir que vamos a tener una
ecuacin como (8) especfica para cada condicin. Los coeficientes estimados de la
parte fija pueden obtenerse durante la estimacin del modelo tildando, en la solapa
Efectos fijos, la opcin Mostrar coeficientes de la parte fija.

Como vamos a utilizar R para calcular las derivadas de (8), revisaremos estos
coeficientes desde R. Si en la ventana Script escribimos:

Modelo004_LnPesoSeco_REML$coefficients$fixed

y apretamos al final de la lnea Shift Enter aparecer en el output la siguiente salida:

Especies_BolsaFicus_Fino Especies_BolsaFicus_Grueso
-0.7738921650 -1.3680878569
Especies_BolsaGuadua_Fino Especies_BolsaGuadua_Grueso
0.8162357629 0.7630705376
Especies_BolsaFicus_Fino:T1 Especies_BolsaFicus_Grueso:T1

125
Modelos Mixtos en InfoStat

-0.0326126598 -0.0508364778
Especies_BolsaGuadua_Fino:T1 Especies_BolsaGuadua_Grueso:T1
-0.0086055613 -0.0192635993
Especies_BolsaFicus_Fino:T2 Especies_BolsaFicus_Grueso:T2
0.0002938702 0.0004422140
Especies_BolsaGuadua_Fino:T2 Especies_BolsaGuadua_Grueso:T2
0.0000571603 -0.0002451274

Los primeros 4 coeficientes (leyendo de izquierda a derecha), corresponden a las


ordenadas al origen ( i 0 ) de: Ficus_Fino, Ficus_Grueso, Guadua_Fino y

Guadua_Grueso.

Los segundos 4 coeficientes (-0.0326126598,,,-0.0192635993) son los coeficientes


( i1 ) del trmino lineal de (8) y los ltimos 4 (0.0002938702,, -0.0002451274) son

los coeficientes ( i 2 ) del trmino cuadrtico en (8). Por ejemplo, el peso seco

remanente para la Especie Ficus con Bolsa de tramado Fino la ecuacin ser:

ln PesoSeco =
0.7738921651 0.0326126598 (T 30) + 0.0002938702(T 30) 2

Como la funcin (8) representa el peso seco remanente, el peso descompuesto debera
calcularse como:

PesoSecoConsumido (
= PesoInicial exp i 0 + i1 (T 30 ) + i 2 (T 30 )
2
) (10)

En tanto la tasa de descomposicin, sera la derivada de esta funcin, es decir:

TasaDescomp = (
exp i 0 + i1 (T 30 ) + i 2 (T 30 )
2
)( i1 + 2 i 2 (T 30 ) ) (11)

El siguiente script genera una tabla cuya primera columna es el tiempo y las restantes
las tasas de descomposicin para cada uno de los tratamientos. Tener en cuenta que se
debe especificar el modelo que mejor ajust (en nuestro caso modelo004):

a=modelo004_LnPesoSeco_REML$coefficients$fixed
T=seq(0,90,1)
dFF = -exp(a[1]+(T-30)*a[5]+(T-30)*(T-30)*a[9]) *(a[5]+2*(a[9] *(T-30)))
dFG = -exp(a[2]+(T-30)*a[6]+(T-30)*(T-30)*a[10])*(a[6]+2*(a[10]*(T-30)))
dGF = -exp(a[3]+(T-30)*a[7]+(T-30)*(T-30)*a[11])*(a[7]+2*(a[11]*(T-30)))
dGG = -exp(a[4]+(T-30)*a[8]+(T-30)*(T-30)*a[12])*(a[8]+2*(a[12]*(T-30)))
Tasas=as.data.frame=cbind(T,dFF,dFG,dGF,dGG)

126
Modelos Mixtos en InfoStat

En la lista de objetos aparecern los objetos


a, T, dFF, dFG, dGF, dGG y Tasas.
Haciendo clic sobre Tasas, con el botn
derecho del ratn aparecer un men de
acciones entre las que se encuentra
Convertir matriz, data frame o vector a
tabla InfoStat. Seleccionando esta opcin
obtendremos una nueva tabla InfoStat como
la que se muestra a la derecha de este
prrafo.

Utilizando el submen Diagrama de


dispersin en el men Grficos podemos
obtener la siguiente representacin de las
tasas de descomposicin (Figura 92). Para
ello se asignaron las variables dFF, dFG,
dGF y dGG al Eje Y y la variable T al Eje
X, en la ventana de dilogo emergente del
submen Diagrama de dispersin.

0.15
0.14
0.13
0.12
Tasa de descomposicin

0.11
0.10
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
0 10 20 30 40 50 60 70 80 90
Tiempo

Ficus Fino Ficus Grueso Guadua Fino Guadua Grueso

Figura 92: Curvas de tasas de descomposicin segn especie y tramado de la bolsa de


almacenamiento.

127
Modelos Mixtos en InfoStat

Uso de modelos mixtos para el control de la variabilidad espacial en


ensayos agrcolas

Correlacin espacial

La estratificacin o bloqueo de parcelas es una tcnica usada para controlar los efectos
de variacin entre las unidades experimentales. Los bloques son grupos de unidades
experimentales formados de manera tal que las parcelas dentro de los bloques sean lo
ms homogneas posible. Los diseos con estratificacin de parcelas tales como el
diseo en bloques completos aleatorizados (DBCA), los diseos en bloques incompletos
y los ltices son ms eficientes que el diseo completamente aleatorizado cuando las
diferencias entre unidades experimentales que conforman un mismo estrato (bloque) son
mnimas y las diferencias entre los estratos son mximas. Cuando esta condicin no se
cumple puede ocurrir una sobrestimacin de la varianza del error y, si los datos son
desbalanceados, tambin puede presentarse un sesgo en las estimaciones de los efectos
de tratamientos. Cuando se evalan muchos tratamientos en parcelas a campo, el
tamao de los bloques necesarios para lograr una repeticin del ensayo es grande y por
tanto resulta difcil asegurar la homogeneidad de las parcelas que conforman el bloque;
las parcelas ms prximas pueden ser ms similares que las ms distantes, generando
variabilidad espacial (Casanoves et l. 2005). La variabilidad espacial se refiere a la
variacin entre observaciones realizadas sobre parcelas con arreglos espaciales sobre el
terreno. Debido a la existencia de variabilidad espacial dentro de bloques, el anlisis de
varianza estndar para los diseos que involucran el bloqueo de unidades
experimentales no siempre elimina los sesgos en las comparaciones de efectos de
tratamientos. La variacin de parcela a parcela dentro de un mismo bloque puede
deberse a competencia, heterogeneidad en la fertilidad del suelo, dispersin de insectos,
malezas, enfermedades del cultivo o labores culturales, entre otros. Por este motivo se
han propuesto procedimientos estadsticos que contemplan la variacin espacial entre
parcelas y que van desde el ajuste de medias de tratamientos en funcin de lo observado
en las parcelas vecinas ms cercanas (Papadakis 1937), hasta el uso de modelos que
contemplan las correlaciones espaciales en trminos del error y que tambin producen
ajustes de medias de tratamientos (Mead 1971, Besag 1974, 1977, Ripley 1981).
Gilmour et l. (1997) particionan la variabilidad espacial entre parcelas de un ensayo en
variabilidad espacial local y global. La variabilidad espacial local hace referencia a las

128
Modelos Mixtos en InfoStat

diferencias entre parcelas a pequea escala, donde se contemplan las variaciones intra-
bloque. La tendencia espacial local y la heterogeneidad residual se modelan mediante la
matriz de varianza y covarianza residual. A travs de un sistema de coordenadas
bidimensionales es posible definir la ubicacin de las parcelas en el campo.

La modelacin de la estructura espacial de parcelas a partir de funciones de distancia


puede realizarse en el contexto de los modelos lineales mixtos (Zimmerman y Harville
1991, Gilmour et l. 1997, Cullis et l. 1998), donde adems de contemplar la estructura
de correlacin entre observaciones provenientes de distintas parcelas es posible modelar
heterogeneidad de varianza residual. Esto es muy til en los ensayos comparativos de
rendimiento ya que estos se llevan a cabo en distintos ambientes. Si la correlacin solo
depende de la distancia (magnitud y/o direccin de las distancias), los modelos que
estiman las covarianzas entre observaciones se denominan estacionarios. Las funciones
de correlacin para modelos estacionarios pueden ser isotrpicas o anisotrpicas. Las
primeras son idnticas en cualquier direccin (slo dependen de la magnitud de las
distancias) mientras que las segundas permiten diferentes valores de sus parmetros en
diferentes direcciones (i.e. dependen tambin de la direccin sobre la cual se calculan
las distancias).

Anlisis de un ensayo comparativo de rendimientos en man

Para ejemplificar las alternativas de anlisis usaremos los datos que se encuentran en el
archivo ECRman.IDB2 y provienen de un ao agrcola de un ensayo comparativo de
rendimientos (ECR) de lneas experimentales (genotipos) de man (Arachis hypogaea
L.) del Programa de Mejoramiento de Man de la EEA-Manfredi, INTA, Argentina. En
cada campaa los ECR se realizaron en tres localidades del rea de cultivo en la
provincia de Crdoba: Manfredi, General Cabrera y Ro Tercero. El conjunto de lneas
evaluadas fue el mismo para cada localidad. En cada una de las tres localidades los
ensayos fueron conducidos segn un DBCA con cuatro repeticiones, registrndose los
valores de rendimiento en grano (kg/parcela).

Los datos de rendimiento fueron analizados usando distintas modificaciones del


siguiente modelo:

yijk = + i + j + k + jk + ik + ijk ; i = 1,..,16; j = 1,..., 4; k = 1,...,3 (12)

129
Modelos Mixtos en InfoStat

donde yijk representa la respuesta observada en i-simo nivel del factor genotipo,

j-simo nivel de factor bloque, y k-simo nivel del factor localidad, representa la

media general de la respuesta, i representa el efecto del i-simo nivel del factor

genotipo, j representa el efecto del j-simo nivel del factor bloque, k el k-simo nivel

del factor localidad y ik la interaccin entre los factores genotipo y localidad, ik el

efecto de bloque dentro de localidad, y ijkl representa el error experimental. La

suposicin usual es que ijkl ~ N ( 0, 2 ) .

Excepto por ijk y los efectos de bloque (cuando son considerados aleatorios) en la
mayora de los casos, todos los factores del modelo sern considerados como de efectos
fijos. Esto tiene la finalidad de restringir la comparacin de los modelos a su estructura
de parcelas. Las distintas estructuras de parcela inducen una estructura de correlacin
entre las observaciones que puede ser contemplada en el marco de los modelos mixtos,
incluyendo tcnicas de anlisis para el control de la variabilidad espacial.

Se usarn las siguientes estructuras de covarianza para los datos (covarianza marginal):

1. Modelo BF: Efecto de Bloques fijos, errores independientes y varianza entre


localidades constante.
2. Modelo BA: Efecto de Bloques aleatorios, errores independientes y varianza entre
localidades constante.
3. Modelo BFH: Efecto de Bloques fijos, errores independientes y varianzas diferentes
entre localidades.
4. Modelo BAH: Efecto de Bloques aleatorios, errores independientes y varianzas
diferentes entre localidades.
5. Modelo Exp: Correlacin espacial exponencial sin efecto de bloques y varianza entre
localidades constante.
6. Modelo BFExp: Correlacin espacial exponencial, efecto de bloques fijos, y varianza
entre localidades constante.
7. Modelo ExpH: Correlacin espacial exponencial sin efecto de bloques y varianzas
diferentes entre localidades.
8. Modelo Gau: Correlacin espacial Gaussiana sin efecto de bloques y varianza entre
localidades constante.
9. Modelo Esf: Correlacin espacial esfrico sin efecto de bloques y varianza entre
localidades constante.

En los dos primeros modelos los ijk se asumirn como independientes con varianza
constante 2, i.e. se supone que no existe variacin espacial local (intrabloque) y
adems existe homogeneidad de varianzas residuales entre localidades. Los efectos de

130
Modelos Mixtos en InfoStat

bloque sern considerados fijos y aleatorios, denotando los procedimientos como


Modelo BF y Modelo BA respectivamente.

Los procedimientos denotados como Modelo BFH y Modelo BAH se basarn tambin
en un modelo para un DBCA pero contemplando la posibilidad de varianzas residuales
heterogneas segn los distintos niveles del factor localidad.

El quinto procedimiento consistir en ajustar para cada localidad un modelo de


correlacin espacial isotrpico con funcin de correlacin potencia (Modelo Exp) sin
declarar el efecto de bloques. Este modelo supone que la funcin exponencial no solo
contemplar la variacin intrabloque sino tambin la variacin entre bloques.

El sexto procedimiento fue igual al anterior pero agregando un efecto fijo de bloque
(Modelo BFExp).

El sptimo modelo consisti en un modelo como el Exp pero permitiendo la posibilidad


de varianzas (y correlaciones) diferentes para cada localidad.

Los dos ltimos procedimiento consistirn en ajustar para cada localidad un modelo de
correlacin espacial isotrpico con funcin de correlacin Gaussiana (Modelo Gau) y
con funcin de correlacin Esfrica, sin declarar el efecto de bloques.

En todos los casos se utiliz estimacin REML. En el selector de variables se indica al


rendimiento (Rendim) como dependiente y bloque, local y geno como clasificatorias.

Para ajustar el Modelo BF, en la solapa de efectos fijos se deben declarar los efectos
como se muestra en la Figura 93. No se declara nada en el resto de las solapas.

Para ajustar el Modelo BA, en la solapa efectos fijos y efectos aleatorios debe declararse
los factores como se presenta en la Figura 94 y Figura 95 respectivamente. No se
declara nada en el resto de las solapas.

131
Modelos Mixtos en InfoStat

Figura 93: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRman.IDB2 y
el Modelo BF.

Figura 94: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRman.IDB2 y
el Modelo BA.

132
Modelos Mixtos en InfoStat

Figura 95: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo
ECRman.IDB2 y el Modelo BA.

Los modelos BFH y BAH contemplan errores independientes y varianzas entre


localidades diferentes. Para especificar estos modelos, se procede igual que en los dos
casos anteriores (i.e. BF y BA) pero agregando una funcin varIdent en la solapa
Heteroscedasticidad, indicando como criterio de agrupamiento a la localidad (local).
Una vez declarada la funcin y el criterio de agrupamiento hacer clic en Agregar
(Figura 96).

133
Modelos Mixtos en InfoStat

Figura 96: Ventana con la solapa Heteroscedasticidad usando local como criterio de agrupamiento
para los datos del archivo ECRman.IDB2 y los Modelos BFH y BAH.

El quinto modelo no incluye el efecto de bloque y modela la variabilidad entre bloques


e intra-bloque por medio de una funcin exponencial isotrpica (modelo Exp) con
varianzas constantes entre localidades. Par usar la funcin exponencial deberemos
agregar al modelo las variables que denotan las coordenadas espaciales. Para esto en el
selector de variables debemos colocar las variables la y lon en Covariables. En la solapa
Efectos fijos dejamos geno, local y geno*local y en la solapa Efectos aleatorios no se
declara ningn factor. En la solapa Heteroscedasticidad no debe quedar ninguna
funcin declarada. Para declarar la correlacin espacial tipo exponencial, en la solapa
Correlacin se debe seleccionar la funcin correspondiente y declarar las coordenadas
en X y en Y, y el criterio de agrupamiento, en este caso local, ya que hay un sistema de
coordenadas dentro de cada localidad (Figura 97).

134
Modelos Mixtos en InfoStat

Figura 97: Ventana con la solapa Correlacin usando las variables la y lon como coordenadas en X e
Y respectivamente y local como criterio de agrupamiento para los datos del archivo ECRman.IDB2 y
los Modelos Exp y BFExp.

El sexto modelo, Modelo BFExp, es igual que el anterior pero declarando los efectos de
bloque dentro de localidad como fijos (como en la Figura 93). La inclusin de los
bloques fijos restringe la modelacin de la variacin espacial nicamente a la variacin
dentro de bloque. La variacin entre bloques est siendo contemplada, en un sentido
clsico, por la inclusin de los bloques en la parte fija. As, declarar como coordenadas
del modelo de correlacin espacial a la y lon, parece redundante ya que bastara con
declarar slo lon (coordenada que varia dentro de bloque). Sin embargo para omitir la
coordenada la sera necesario declara un nuevo criterio de estratificacin consistente en
la combinacin de los niveles de local y bloque. Esta forma alternativa produce
idnticos resultados a los mostrados en el modelo BFExp.

El sptimo modelo, modelo ExpH, es como el modelo Exp pero permitiendo varianzas
heterogneas entre las localidades (como en la Figura 96). Los modelos Gau y Esf se
ajustan al igual que el Exp sin el efecto de bloque, y como se muestra en la Figura 97,

135
Modelos Mixtos en InfoStat

pero eligiendo la funcin de correlacin espacial Gaussiana y esfrica respectivamente.


En la solapa Heteroscedasticidad no debe quedar nada declarado.

A continuacin se presentan las salidas con las medidas de ajuste de los diferentes
modelos.

Modelo BF
Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo000_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque
,method="REML"
,na.action=na.omit
,data=R.data00)

Resultados para el modelo: modelo000_rendim_REML

Variable dependiente:rendim

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 299.71 468.22 -91.86 0.35 0.86
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 8372.75 <0.0001
local 2 280.56 <0.0001
geno 15 6.02 <0.0001
local:geno 30 4.32 <0.0001
local:bloque 9 4.77 <0.0001

Modelo BA
Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo001_rendim_REML<-lme(rendim~1+local+geno+local:geno
,random=list(bloque_local=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo001_rendim_REML

Variable dependiente:rendim

136
Modelos Mixtos en InfoStat

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


192 283.41 431.90 -91.71 0.35 0.81 0.86
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 135 1754.21 <0.0001
local 2 9 58.78 <0.0001
geno 15 135 6.02 <0.0001
local:geno 30 135 4.32 <0.0001

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|bloque_local

Desvos estndares relativos al residual y correlaciones

(const)
(const) 0.49

Modelo BFH
Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo002_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque
,weight=varComb(varIdent(form=~1|local))
,method="REML"
,na.action=na.omit
,data=R.data00)

Resultados para el modelo: modelo002_rendim_REML

Variable dependiente:rendim

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 303.44 477.75 -91.72 0.36 0.86
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 8547.37 <0.0001
local 2 292.67 <0.0001
geno 15 6.02 <0.0001
local:geno 30 4.36 <0.0001
local:bloque 9 4.76 <0.0001
Estructura de varianzas

137
Modelos Mixtos en InfoStat

Modelo de varianzas: varIdent


Formula: ~ 1 | local

Parmetros de la funcin de varianza

Parmetro Estim
gralcabr 1.00
manf 0.92
rio3 0.96

Modelo BAH

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo003_rendim_REML<-lme(rendim~1+local+geno+local:geno
,random=list(bloque_local=pdIdent(~1))
,weight=varComb(varIdent(form=~1|local))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo003_rendim_REML

Variable dependiente:rendim

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1


192 287.12 441.55 -91.56 0.36 0.81 0.86
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 135 1765.74 <0.0001
local 2 9 59.53 <0.0001
geno 15 135 6.01 <0.0001
local:geno 30 135 4.36 <0.0001

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|bloque_local

Desvos estndares relativos al residual y correlaciones

(const)
(const) 0.46

Estructura de varianzas

138
Modelos Mixtos en InfoStat

Modelo de varianzas: varIdent


Formula: ~ 1 | local

Parmetros de la funcin de varianza

Parmetro Estim
gralcabr 1.00
manf 0.92
rio3 0.95

Modelo Exp
Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo004_rendim_REML<-gls(rendim~1+geno+local+local:geno
,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.c
haracter(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)

Resultados para el modelo: modelo004_rendim_REML

Variable dependiente:rendim

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 273.43 421.92 -86.72 0.39 0.81
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 1687.54 <0.0001
geno 15 7.27 <0.0001
local 2 56.18 <0.0001
geno:local 30 5.33 <0.0001

Estructura de correlacin

Modelo de correlacin: Exponential spatial correlation


Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean

Parmetros del modelo

Parmetro Estim
range 0.96

139
Modelos Mixtos en InfoStat

Modelo BFExp

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo005_rendim_REML<-gls(rendim~1+geno+local+local:geno+local/bloque
,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.c
haracter(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)

Resultados para el modelo: modelo005_rendim_REML

Variable dependiente:rendim

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 284.85 456.26 -83.42 0.35 0.86
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 2785.57 <0.0001
geno 15 7.86 <0.0001
local 2 92.79 <0.0001
geno:local 30 5.74 <0.0001
local:bloque 9 3.46 0.0007

Estructura de correlacin

Modelo de correlacin: Exponential spatial correlation


Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean

Parmetros del modelo

Parmetro Estim
range 0.78

140
Modelos Mixtos en InfoStat

Modelo ExpH

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo006_rendim_REML<-gls(rendim~1+geno+local+local:geno
,weight=varComb(varIdent(form=~1|local))
,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.c
haracter(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)

Resultados para el modelo: modelo006_rendim_REML

Variable dependiente:rendim

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 275.01 429.44 -85.50 0.43 0.81
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 1633.46 <0.0001
geno 15 7.15 <0.0001
local 2 61.51 <0.0001
geno:local 30 5.53 <0.0001

Estructura de correlacin

Modelo de correlacin: Exponential spatial correlation


Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean

Parmetros del modelo

Parmetro Estim
range 0.99

Estructura de varianzas

Modelo de varianzas: varIdent


Formula: ~ 1 | local

Parmetros de la funcin de varianza

Parmetro Estim
gralcabr 1.00
manf 0.85
rio3 0.81

141
Modelos Mixtos en InfoStat

Modelo Gau

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo007_rendim_REML<-gls(rendim~1+geno+local+local:geno
,correlation=corGaus(form=~as.numeric(as.character(la))+as.numeric(as.
character(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)

Resultados para el modelo: modelo007_rendim_REML

Variable dependiente:rendim

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 277.81 426.30 -88.90 0.37 0.81
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 3399.06 <0.0001
geno 15 7.36 <0.0001
local 2 113.57 <0.0001
geno:local 30 4.97 <0.0001

Estructura de correlacin

Modelo de correlacin: Gaussian spatial correlation


Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean

Parmetros del modelo

Parmetro Estim
range 0.87

142
Modelos Mixtos en InfoStat

Modelo Esf

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo008_rendim_REML<-gls(rendim~1+geno+local+local:geno
,correlation=corSpher(form=~as.numeric(as.character(la))+as.numeric(as
.character(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)

Resultados para el modelo: modelo008_rendim_REML

Variable dependiente:rendim

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 277.72 426.21 -88.86 0.38 0.81
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 3170.04 <0.0001
geno 15 7.61 <0.0001
local 2 105.96 <0.0001
geno:local 30 5.15 <0.0001

Estructura de correlacin

Modelo de correlacin: Spherical spatial correlation


Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean

Parmetros del modelo

Parmetro Estim
range 1.91

Comparacin de los modelos ajustados

Debido a que los modelos ajustados tienen distintas componentes en su parte fija, se
compararn por medio de los criterios AIC y BIC aquellos que comparten los mismos
efectos fijos. En primer lugar se comparan entonces el BF, BFH y BFExp (Cuadro 3).

143
Modelos Mixtos en InfoStat

Cuadro 3. Criterios de bondad de ajuste para los modelos ajustados con efectos de bloque fijo en los
datos del archivo ECRmani.IDB2

Modelo AIC BIC

BF 299.72 468.22

BFH 303.44 477.75

BFExp 284.85 456.26

Para este grupo de modelos que contemplan efecto de bloques fijos se puede ver que el
modelo con bloques fijos ms una funcin de correlacin exponencial provee el mejor
ajuste. Esto implica la existencia de una correlacin intra-bloque que es removida por la
funcin de correlacin exponencial. Tambin se puede observar que no hay una mejora
en estos modelos al permitir varianzas heterogneas entre localidades (BF respecto a
BFH). Si se calculan las varianzas a partir de los coeficientes para las distintas
localidades se puede ver que estas son realmente similares:

Varianza de gralcabr = (1*0.36)2 = 0.129

Varianza de manf = (0.92*0.36)2 = 0.109

Varianza de rio3 = (0.96*0.36)2 = 0.119

Los restantes 6 modelos se pueden comparar entre s ya que todos comparten los
mismos efectos fijos, i.e. geno, local y geno*local (Cuadro 4).

Cuadro 4. Criterios de bondad de ajuste para los modelos ajustados sin efectos de bloque fijo en los
datos del archivo ECRmani.IDB2

Modelo AIC BIC

BA 283.41 431.90

BAH 287.12 441.55

Exp 273.43 421.92

ExpH 275.01 429.44

Gau 277.81 426.30

Esf 277.72 426.21

144
Modelos Mixtos en InfoStat

Dentro de los modelos que contemplan efectos de bloque aleatorio se puede ver
nuevamente que al permitir varianzas heterogneas entre localidades el modelo no
mejora, ya que AIC y BIC son ms pequeos en BA comparados con BAH. Lo mismo
ocurre cuando slo se modela la variabilidad espacial por medio de una funcin de
correlacin exponencial, ya que al permitir varianzas heterogneas (ExpH) no se logra
una mejora respecto a Exp.

Comparando distintos modelos de correlacin espacial, no se encontraron diferencias


importantes para AIC y BIC entre los modelos Gau y Esf, pero estos criterios tuvieron
valores inferiores para la funcin de correlacin espacial exponencial. Este ltimo
modelo fue el de mejor ajuste dentro de los modelos sin efecto de bloque fijo.

Si bien el primer grupo de modelos (BF, BFH y BFExp) no son comparables por medio
de AIC y BIC con este ltimo grupo, el investigador deber poder discernir si sus
bloques deben ser considerados fijos o aleatorios. La eleccin de uno u otro grupo de
modelos tendr efecto sobre las inferencias que se realicen. Esto se visualiza fcilmente
al ver que los errores estndar usados para las comparaciones de medias cambian entre
los modelos. Una discusin ms detallada sobre la eleccin de bloques fijos o aleatorios
puede encontrarse en Casanoves et l. (2007).

En este ejemplo los mejores modelos dentro de cada grupo (i.e. BFExp y Exp para el
primero y segundo grupo de modelos respectivamente) tienen la misma estructura de
covarianza pero difieren en su parte fija: unos contienen el efecto de bloque y otros no.
Para decidir cul de los dos modelos es el que conviene, podemos realizar una prueba de
cociente de verosimilitudes, usando las estimaciones por ML para los modelos con y sin
efectos de bloque (recordemos que para comparar modelos con distintos efectos fijos se
debe usar ML):

Modelo con bloque (completo BFExp):

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 163.82 356.01 -22.91 0.29 0.86
AIC y BIC menores implica mejor

Modelo sin bloque (reducido Exp):

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 182.85 345.73 -41.43 0.34 0.81
AIC y BIC menores implica mejor

145
Modelos Mixtos en InfoStat

As, el estadstico G =
2 log lik completo 2 log lik reducido =
2 ( 22.91 + 41.43) =
37.04 con 9

grados de libertad, y un valor p<0.0001, por lo que podemos decir, con una
significancia del 5%, que conviene dejar el efecto de bloques fijos y la funcin de
correlacin exponencial. La comparacin se puede hacer manualmente, o utilizando el
mdulo Anlisis exploratorio de un modelo estimado. Seleccionando la solapa, Modelos
y tildando los modelos estimados correspondientes a BFExp y ExP, se obtienen la salida
mostrada a continuacin.

Comparacin de modelos

Model df logLik Test L.Ratio p-value


modelo009_rendim_ML 1 59 -22.91
modelo010_rendim_ML 2 50 -41.43 1 vs 2 37.04 <0.0001

A continuacin se presenta la salida completa correspondiente al modelo BFExp. Las


pruebas de hiptesis para la interaccin entre genotipo y localidad son significativas
(p<0.0001) por lo que la recomendacin de un genotipo puede cambiar dependiendo de
la localidad. Puede observarse que debido al ajuste de la funcin de correlacin espacial
los EE de los genotipos no son nicos. Las comparaciones mltiples presentadas se
realizaron mediante la aplicacin del procedimiento DGC (Di Rienzo et l. 2002). Esta
procedimiento fue adaptado para contemplar las particularidades de la estructura de
correlacin entre estimaciones emergente de los modelos mixtos. La aplicacin de este
procedimiento es recomendada por el gran nmero de medias a comparar, ya que
asegura una interpretacin ms sencilla que la que puede obtenerse de la aplicacin de
un test tipo LSD de Fisher. Para hacer recomendaciones se pueden usar las
comparaciones de medias de las combinaciones de localidades y genotipos como as
tambin el grafico de interaccin (Figura 98).

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo010_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque
,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.c
haracter(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data03)

146
Modelos Mixtos en InfoStat

Resultados para el modelo: modelo010_rendim_REML

Variable dependiente:rendim

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


192 284.85 456.26 -83.42 0.35 0.86
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 2785.57 <0.0001
local 2 92.79 <0.0001
geno 15 7.86 <0.0001
local:geno 30 5.74 <0.0001
local:bloque 9 3.46 0.0007

Estructura de correlacin

Modelo de correlacin: Exponential spatial correlation


Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean

Parmetros del modelo

Parmetro Estim
range 0.78

Medias ajustadas y errores estndares para local


DGC (alfa=0.05)

local Medias E.E.


manf 3.00 0.08 A
gralcabr 2.27 0.08 B
rio3 1.56 0.08 C
Letras distintas indican diferencias significativas(p<= 0.05)

Medias ajustadas y errores estndares para geno


DGC (alfa=0.05)

geno Medias E.E.


mf435 2.73 0.10 A
mf407 2.59 0.10 A
mf429 2.51 0.10 A
mf415 2.49 0.10 A
mf420 2.38 0.10 B
mf421 2.36 0.10 B
mf431 2.34 0.10 B
mf405 2.31 0.10 B
manf68 2.24 0.10 B
mf408 2.22 0.10 B
manf393 2.22 0.10 B
colirrad 2.21 0.10 B
mf404 2.14 0.10 B
mf433 1.96 0.10 C
mf432 1.96 0.10 C
mf410 1.78 0.10 C
Letras distintas indican diferencias significativas(p<= 0.05)

147
Modelos Mixtos en InfoStat

Medias ajustadas y errores estndares para local*geno


DGC (alfa=0.05)

local geno Medias E.E.


manf mf407 3.67 0.17 A
manf mf421 3.54 0.17 A
manf mf405 3.38 0.17 B
manf mf431 3.28 0.17 B
manf mf435 3.24 0.17 B
manf manf68 3.23 0.17 B
manf mf420 3.17 0.17 B
manf mf429 3.08 0.17 B
manf colirrad 3.05 0.17 B
manf manf393 3.02 0.17 B
gralcabr mf435 2.96 0.17 B
manf mf408 2.90 0.17 B
manf mf415 2.90 0.17 B
gralcabr mf420 2.82 0.17 B
gralcabr mf404 2.71 0.17 C
manf mf433 2.64 0.17 C
gralcabr mf415 2.61 0.17 C
manf mf410 2.53 0.17 C
gralcabr mf429 2.52 0.17 C
manf mf432 2.48 0.17 C
gralcabr mf421 2.42 0.17 C
gralcabr mf408 2.32 0.17 C
gralcabr manf393 2.30 0.17 C
gralcabr mf407 2.30 0.17 C
gralcabr mf405 2.25 0.17 C
gralcabr mf431 2.05 0.17 D
gralcabr manf68 2.04 0.17 D
rio3 mf435 1.99 0.17 D
rio3 mf415 1.98 0.17 D
manf mf404 1.97 0.17 D
rio3 mf429 1.93 0.17 D
gralcabr colirrad 1.92 0.17 D
rio3 mf432 1.89 0.17 D
rio3 mf407 1.81 0.17 D
gralcabr mf410 1.79 0.17 D
gralcabr mf433 1.77 0.17 D
rio3 mf404 1.74 0.17 D
rio3 mf431 1.70 0.17 D
rio3 colirrad 1.64 0.17 D
gralcabr mf432 1.50 0.17 E
rio3 mf433 1.47 0.17 E
rio3 manf68 1.45 0.17 E
rio3 mf408 1.44 0.17 E
rio3 manf393 1.33 0.17 E
rio3 mf405 1.32 0.17 E
rio3 mf420 1.16 0.17 E
rio3 mf421 1.14 0.17 E
rio3 mf410 1.02 0.17 E
Letras distintas indican diferencias significativas(p<= 0.05)

148
Modelos Mixtos en InfoStat

Rendimiento (kg/parcela)
3

0
mf404

mf432

mf410

mf433

mf415

manf393

mf408

mf429

colirrad

mf420

mf431

manf68

mf435

mf405

mf421

mf407
Genotipo

Manfredi General Cabrera Ro Tercero

Figura 98: Diagrama de puntos para estudiar la interaccin entre localidades y genotipos para la
variable rendimiento.

149
Modelos Mixtos en InfoStat

Aplicaciones de modelos mixtos en otros diseos experimentales

Diseo en franjas (strip-plot)

El diseo strip-plot es un resultado de las restricciones a la aleatorizacin. Al igual que


en el diseo en parcelas divididas, el strip-plot es un resultado de cmo fue llevado a
cabo un experimento que involucra dos o ms factores. Estos factores (o sus
combinaciones) se aplican en diferentes etapas, generalmente 2, y las restricciones a la
aleatorizacin producen las unidades experimentales de diferentes tamaos y por ende
diferentes trminos de error para cada una de los factores o sus combinaciones (Milliken
y Johnson 1984).

Consideremos un ejemplo donde se desean evaluar tres niveles de fertilizacin con N (0,
50 y 100 kg N/ha) y dos niveles de riego (bajo y alto) sobre los rendimientos de maz.
El ensayo se condujo bajo un diseo en bloques completos al azar con cuatro bloques
(datos: StripPlot.IDB2).

Debido a restricciones de la aplicacin de los tratamientos, en una primera etapa, en


cada uno de los bloques, se aleatorizan los tres niveles de nitrgeno y en la segunda
etapa, en cada bloque y en sentido trasversal al sentido de aplicacin de los niveles de
nitrgeno, se aleatorizan los niveles del factor riego.

Si bien en el siguiente esquema (Figura 99) se presenta la aleatorizacin dentro de un


bloque en particular, el experimento ha sido repetido en bloques, esquema necesario
para poder obtener los distintos trminos de error y que el modelo resultante tenga
sentido. Si en cada etapa del diseo hubiera ms de un factor, y estos no interactuaran
entre s, se podran usar las interacciones de ms alto orden como trminos de error y as
poder obtener las pruebas F sin necesidad de repeticiones.
Modelos Mixtos en InfoStat

Etapa 1

100 kg N/ha

0 kg N/ha

50 kg N/ha

Etapa 2

Riego alto Riego bajo

Figura 99: Esquema de un experimento conducido bajo un diseo strip-plot repetido en bloques
completos al azar, con la aleatorizacin para un bloque particular de los factores cantidad de
nitrgeno y cantidad de riego. Datos del archivo StripPlot.IDB2.

Los datos de rendimiento se analizaron usando el siguiente modelo:

yijk = + i + j + k + ik + jk + ij + ijk ; i = 1,..,3; j = 1, 2; k = 1,..., 4 (13)

donde yijk representa la respuesta observada en el i-simo nivel del factor nitrgeno,

j-simo nivel de factor riego y k-simo nivel del factor bloque, representa la media

general de la respuesta, i representa el efecto del i-simo nivel del factor nitrgeno, j

representa el efecto del j-simo nivel del factor riego, k el k-simo nivel del factor

152
Modelos Mixtos en InfoStat

bloque, ik el efecto del bloque k en el nivel i de nitrgeno (efecto aleatorio con el que

se construye el trmino de error para nitrgeno), jk el efecto del bloque k en el nivel j

de riego (trmino de error para riego), ij la interaccin entre los factores nitrgeno y

riego, y ijk representa el error residual (trmino de error para nitrgenoriego). La

suposicin usual es que ik ~ N ( 0, 2 ) , jk ~ N ( 0, 2 ) y ijkl ~ N ( 0, 2 ) , siendo todos

independientes.

Este modelo puede ajustarse en InfoStat en el men Anlisis de varianza, de efectos


fijos, declarando al rendimiento como variable dependiente y a riego, nitrgeno y
bloque como variables clasificatorias. Luego, en la solapa Modelo se declaran los
siguientes factores indicando su correspondiente trmino de error (Figura 100).

Figura 100: Ventana del procedimiento de Anlisis de varianza con la solapa Modelo desplegada para
los datos del archivo StripPlot.IDB2.

A continuacin se presenta la salida correspondiente al anlisis de la varianza


tradicional.

153
Modelos Mixtos en InfoStat

Anlisis de la varianza

Variable N R R Aj CV
Rendimiento 24 0.99 0.97 1.65

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor (Error)
Modelo 1177.38 17 69.26 48.41 0.0001
Bloque 123.46 3 41.15 28.77 0.0006
Nitrogeno 339.08 2 169.54 60.13 0.0001 (Bloque*Nitrogeno)
Bloque*Nitrogeno 16.92 6 2.82 1.97 0.2147
Riego 570.38 1 570.38 52.18 0.0055 (Bloque*Riego)
Bloque*Riego 32.79 3 10.93 7.64 0.0179
Nitrogeno*Riego 94.75 2 47.38 33.12 0.0006
Error 8.58 6 1.43
Total 1185.96 23

Test:LSD Fisher Alfa=0.05 DMS=2.05433


Error: 2.8194 gl: 6
Nitrogeno Medias n
0 68.25 8 A
50 71.75 8 B
100 77.38 8 C
Letras distintas indican diferencias significativas(p<= 0.05)

Test:LSD Fisher Alfa=0.05 DMS=4.29543


Error: 10.9306 gl: 3
Riego Medias n
Bajo 67.58 12 A
Alto 77.33 12 B
Letras distintas indican diferencias significativas(p<= 0.05)

Test:LSD Fisher Alfa=0.05 DMS=2.06945


Error: 1.4306 gl: 6
Nitrogeno Riego Medias n
0 Bajo 61.50 4 A
50 Bajo 66.00 4 B
0 Alto 75.00 4 C
100 Bajo 75.25 4 C
50 Alto 77.50 4 D
100 Alto 79.50 4 D
Letras distintas indican diferencias significativas(p<= 0.05)

Se encontr efecto de nitrgeno (p=0.0001), de riego (p=0.0055) y tambin interaccin


nitrogenoriego (p=0.0006). Para estudiar la interaccin se realiz un grfico de puntos
(Figura 101).

154
Modelos Mixtos en InfoStat

80

Rendimiento 75

70

65 Riego Alto
Riego Bajo

60

55
0 50 100
Nitrogeno

Figura 101: Diagramas de puntos para estudiar la interaccin entre Riego y Nitrgeno y su efecto
sobre el rendimiento. Datos archivo StripPlot.IDB2.

A partir del grfico de interaccin y de las medias de los tratamientos se recomienda el


riego alto con fertilizacin de nitrgeno de 50 kg, ya que esta combinacin no difiere
estadsticamente de 100 kg de nitrgeno con riego alto y ambas difieren del resto.

Este ensayo pudo evaluarse bajo la ptica de los modelos lineales fijos debido a que est
completamente balanceado. Estos datos tambin pueden analizarse como modelos
mixtos como se detalla a continuacin. Si hubiera existido desbalance o si los bloques
hubiesen sido aleatorios, este enfoque es el nico vlido.

Este modelo puede ajustarse en InfoStat en el men Modelos lineales generales y


mixtos, declarando a rendimiento como variable dependiente y a riego, nitrgeno y
bloque como variables clasificatorias. Luego, en la solapa Efectos fijos se declaran los
siguientes trminos (Figura 102).

155
Modelos Mixtos en InfoStat

Figura 102: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los
datos del archivo StripPlot.IDB2 .

En la solapa Efectos aleatorios se debe declarar el efecto de bloque tanto en la constante


(k ) como en los factores fijos nitrgeno y riego ( ik y jk respectivamente) (Figura

103).

156
Modelos Mixtos en InfoStat

Figura 103: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con
los datos del archivo StripPlot.IDB2 .

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo000_Rendimiento_REML<-
lme(Rendimiento~1+Nitrogeno+Riego+Nitrogeno:Riego
,random=list(Bloque=pdIdent(~1)
,Bloque=pdIdent(~Nitrogeno-1)
,Bloque=pdIdent(~Riego-1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)

Resultados para el modelo: modelo000_Rendimiento_REML

Variable dependiente:Rendimiento

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0 R2_1 R2_2 R2_3


24 106.09 115.00 -43.05 1.20 0.85 0.94 0.95 0.99
AIC y BIC menores implica mejor

157
Modelos Mixtos en InfoStat

Pruebas de hiptesis secuenciales

numDF denDF F-value p-value


(Intercept) 1 15 3061.88 <0.0001
Nitrogeno 2 15 60.13 <0.0001
Riego 1 15 52.18 <0.0001
Nitrogeno:Riego 2 15 33.12 <0.0001

Parmetros de los efectos aleatorios

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~1|Bloque

Desvos estndares relativos al residual y correlaciones

(const)
(const) 1.83

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~Nitrogeno - 1|Bloque

Desvos estndares relativos al residual y correlaciones

0 100 50
0 0.70 0.00 0.00
100 0.00 0.70 0.00
50 0.00 0.00 0.70

Modelo de covarianzas de los efectos aleatorios: pdIdent


Formula: ~Riego - 1|Bloque

Desvos estndares relativos al residual y correlaciones

Alto Bajo
Alto 1.49 0.00
Bajo 0.00 1.49

Medias ajustadas y errores estndares para Nitrogeno


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Nitrogeno Medias E.E.


100 77.38 1.40 A
50 71.75 1.40 B
0 68.25 1.40 C
Letras distintas indican diferencias significativas(p<= 0.05)
Medias ajustadas y errores estndares para Riego
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Riego Medias E.E.


Alto 77.33 1.47 A
Bajo 67.58 1.47 B
Letras distintas indican diferencias significativas(p<= 0.05)

158
Modelos Mixtos en InfoStat

Medias ajustadas y errores estndares para Nitrogeno*Riego


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Nitrogeno Riego Medias E.E.


100 Alto 79.50 1.59 A
50 Alto 77.50 1.59 A B
100 Bajo 75.25 1.59 B C
0 Alto 75.00 1.59 C
50 Bajo 66.00 1.59 D
0 Bajo 61.50 1.59 E
Letras distintas indican diferencias significativas(p<= 0.05)

Podemos observar que bajo el enfoque de modelos mixtos en este experimento se llega
a las mismas conclusiones que en el enfoque clsico y que los estadsticos F para las
pruebas de efectos fijos son los mismos, pero los grados de libertad del denominador
son diferentes. Debemos destacar que los modelos no son absolutamente equivalentes,
ya que en el enfoque de modelos mixtos los bloques son aleatorios y en el clsico son
fijos; y que las frmulas para el clculo de los grados de libertad del denominador en los
estadsticos F son diferentes.

159
Modelos Mixtos en InfoStat

Diseo experimental con dos factores y dependencia espacial

En muchas situaciones se presentan niveles de un factor de inters que, por su


naturaleza, no se pueden asignar en forma aleatoria. Este es el caso de las tomas de
muestras de agua a lo largo de un ro, cuando se evalan efectos a distintas distancias en
un bosque o cuando se toman muestras de suelo a distintas profundidades. El hecho de
que no se puedan aleatorizar los niveles de un factor genera una dependencia espacial
que debe ser contemplada. Aqu presentamos un ejemplo (datos Lombrices.IDB2) en
donde se evalan cuatro tipo de sombra en cultivos de caf: testigo con sol (sol),
leguminosa1 (SombraL1), leguminosa2 (SombraL2) y no leguminosa (SombraNL) en
tres profundidades (1=0-10 cm, 2=10-20 cm y 3=20-30 cm). En cada una de las
unidades experimentales (combinacin de tratamientos y repeticiones) se tomaron
muestras de 3030 cm con 10 cm de profundidad en cada una de las tres profundidades.
En cada muestra se recolectaron las lombrices y se obtuvo su peso vivo (biomasa). Las
unidades experimentales estaban arregladas en un diseo completamente aleatorizado
con tres repeticiones. La variable tratam_rep identifica a las unidades experimentales
sobre las que se miden las distintas profundidades y fue generada desde el men Datos,
sub men Cruzar categorias para formar una nueva variable (en la ventana de
seleccin de variables se declar a tratam y rep como variables).

Para realizar el anlisis de los datos del archivo Lombrices.IDB2, se deben declarar las
variables como se muestra a continuacin (Figura 104).

160
Modelos Mixtos en InfoStat

Figura 104: Ventana se selector de variable para Modelos lineales generales y mixtos los datos del
archivo Lombrices.IDB2.

Luego, en la solapa Efectos fijos se deben declarar las variables como se muestra en la
siguiente figura (Figura 105).

161
Modelos Mixtos en InfoStat

Figura 105: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los
datos del archivo Lombrices.IDB2.

Por ltimo, se declara en la solapa Correlacin el modelo de Correlacin espacial


exponencial, identificando a profund como coordenada X y a tratam_rep como criterio
de agrupamiento (Figura 106).

162
Modelos Mixtos en InfoStat

Figura 106: Ventana con la solapa Correlacin desplegada para evaluar un modelo mixto con
correlacin espacial exponencial en los datos del archivo Lombrices.IDB2.

La salida correspondiente se presenta a continuacin.

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo000_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund
,correlation=corExp(form=~as.numeric(as.character(Profund))|Tratam_Rep
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data00)

Resultados para el modelo: modelo000_Biomasa_REML

Variable dependiente:Biomasa

163
Modelos Mixtos en InfoStat

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


36 161.03 177.52 -66.52 3.46 0.97
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 3725.04 <0.0001
Tratam 3 66.75 <0.0001
Profund 2 303.14 <0.0001
Tratam:Profund 6 4.86 0.0022

Estructura de correlacin

Modelo de correlacin: Exponential spatial correlation


Formula: ~ as.numeric(as.character(Profund)) | Tratam_Rep
Metrica: euclidean

Parmetros del modelo

Parmetro Estim
range 2.12

Todos los factores resultaron significativos, presentndose interaccin entre


tratamientos y profundidad (p=0.0022). El parmetro range tiene un valor estimado de
2.12. Este parmetro debe interpretarse con cuidado, dependiendo del modelo de
correlacin espacial usado. En la bibliografa geoestadstica, el range se define, para
procesos espaciales estacionales de segundo orden, como la distancia a partir de la cual
las observaciones pueden considerarse independientes. El parmetro range que se
muestra en la salida est relacionado a esta definicin, pero no es la distancia a partir de
la cual no hay ms correlacin (excepto en los modelos esfrico y lineal). En los
modelos de correlacin espacial, en los que la covarianza alcanza cero solo
asintticamente (todos excepto el esfrico y el lineal), no existe una distancia a la cual la
correlacin espacial se haga 0, por lo que se usa el concepto de practical range
(distancia a partir de la cual la covarianza espacial se reduce al 5%, o equivalentemente,
la distancia a la cual el semivariograma alcanza el 95% de su mximo). Esta distancia
depende del modelo usado: para correlacin espacial exponencial es 3 veces el range
estimado, mientras que para correlacin espacial Gaussiana3esveces el range
estimado (Littel et l. 2006). Para la correlacin racional cuadrtica este factor es
aproximadamente 4.36.

164
Modelos Mixtos en InfoStat

En este ejemplo se us un modelo de correlacin espacial exponencial. La profundidad


1 era entre 0 y 10 cm, la 2 entre 10 y 20 cm y la 3 entre 20 y 30 cm, es decir, la
diferencia entre la profundidad 1 y 2 de la forma en que fueron declaradas, es de 1, sin
embargo en la escala original esta diferencia es de 10. Por lo tanto, el practical range en
la escala original es de 321.2 cm=63.6 cm. Esto implica que, para las profundidades
estudiadas (0 a 30 cm), las observaciones de biomasa de lombrices nunca sern
independientes (para que pudieran considerarse prcticamente independientes las
observaciones deberan estar a ms de 63.6 cm, lo que es imposible con estos datos).

El modelo de correlacin espacial exponencial isotrpico presentado aqu es equivalente


a un modelo autorregresivo de orden 1 (Casanoves et l. 2005). Si con este mismo
conjunto de datos usamos ahora un modelo Autorregresivo de orden 1 (Figura 107) se
obtiene la siguiente salida.

Figura 107: Ventana con la solapa Correlacin desplegada para evaluar un modelo mixto con
correlacin autorregresiva de orden 1 en los datos del archivo Lombrices.IDB2.

165
Modelos Mixtos en InfoStat

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo001_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund
,correlation=corAR1(form=~as.integer(as.character(Profund))|Tratam_Rep
)
,method="REML"
,na.action=na.omit
,data=R.data00)

Resultados para el modelo: modelo001_Biomasa_REML

Variable dependiente:Biomasa

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


36 161.03 177.52 -66.52 3.46 0.97
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 3725.05 <0.0001
Tratam 3 66.75 <0.0001
Profund 2 303.14 <0.0001
Tratam:Profund 6 4.86 0.0022

Estructura de correlacin

Modelo de correlacin: AR(1)


Formula: ~ as.integer(as.character(Profund)) | Tratam_Rep

Parmetros del modelo

Parmetro Estim
Phi 0.62

La nica diferencia entre esta salida y la anterior es que en sta se muestra el parmetro
Phi de correlacin (0.62) en vez del parmetro range.

A continuacin estudiaremos la validez de los supuestos de este modelo. Para esto, en el


submen Anlisis-exploracin de los modelos estimados se solicitaron los grficos de
diagnstico que se presentan a continuacin (Figura 108).

166
Modelos Mixtos en InfoStat

Figura 108: Herramientas grficas para diagnstico obtenidas para los datos del archivo
Lombrices.IDB2.

Como se puede observar la variabilidad de los residuos bajo los distintos tratamientos
parece diferente. Para evaluar un modelo heteroscedstico por tratamientos, en la solapa
Heteroscedasticidad se declararon las variables como en la (Figura 109) y se obtuvo la
siguiente salida.

167
Modelos Mixtos en InfoStat

Figura 109: Ventana con la solapa Heteroscedasticidad desplegada para evaluar un modelo mixto con
en los datos del archivo Lombrices.IDB2.

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo002_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund
,weight=varComb(varIdent(form=~1|Tratam))
,correlation=corAR1(form=~as.integer(as.character(Profund))|Tratam_Rep
)
,method="REML"
,na.action=na.omit
,data=R.data00)

Resultados para el modelo: modelo002_Biomasa_REML

Variable dependiente:Biomasa

168
Modelos Mixtos en InfoStat

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


36 164.03 184.06 -65.02 4.20 0.97
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 4300.37 <0.0001
Tratam 3 54.19 <0.0001
Profund 2 511.72 <0.0001
Tratam:Profund 6 6.32 0.0004

Estructura de correlacin

Modelo de correlacin: AR(1)


Formula: ~ as.integer(as.character(Profund)) | Tratam_Rep

Parmetros del modelo

Parmetro Estim
Phi 0.73

Estructura de varianzas

Modelo de varianzas: varIdent


Formula: ~ 1 | Tratam

Parmetros de la funcin de varianza

Parmetro Estim
sol 1.00
sombraL1 0.65
sombraL2 0.66
sombraNL 1.22

Los criterios AIC y BIC son mayores en el modelo heteroscedstico que en el


homoscedstico, indicando que este ltimo es el mejor. Similar conclusin se obtiene a
partir de la prueba del cociente de verosimilitud (p=0.3916) al pedir la comparacin de
los modelos como se mostr en la seccin Anlisis de un modelo ajustado.

Comparacin de modelos

df AIC BIC logLik Test L.Ratio p-value


modelo001_Biomasa_REML 14 161.03 177.52 -66.52
modelo002_Biomasa_REML 17 164.03 184.06 -65.02 1 vs 2 3.00 0.3916

Por este motivo, nos quedamos con el modelo homoscedstico y, debido a la presencia
de interaccin entre los dos factores, se realiza un diagrama de puntos para visualizar el
comportamiento de las medias de biomasa de lombrices (Figura 110).

169
Modelos Mixtos en InfoStat

90

80

70
Biomasa

60

50

40

30

20
1 2 3
Profundidad

Sol SombraL1 SombraL2 SombraNL

Figura 110: Diagramas de puntos para estudiar la interaccin entre tratamientos y profundidad y su
efecto sobre la biomasa. Datos archivo Lombrices.IDB2.

Como se puede observar, este grfico sugiere la presencia de un comportamiento lineal


para sol y uno cuadrtico para los otros tratamientos. Para probar estas hiptesis se
realizan contrastes ortogonales polinmicos a partir de la solapa Comparaciones,
subsolapa Contrastes (Figura 111).

170
Modelos Mixtos en InfoStat

Figura 111: Ventana con la solapa Comparaciones y la subsolapa Contrastes desplegada para evaluar
un modelo mixto con los datos del archivo Lombrices.IDB2.

A continuacin se muestran los resultados de los contrastes. Se puede ver que el nico
tratamiento que presenta solo tendencia lineal y no cuadrtica es el de sol (p<0.0001 y
p=0.8147 respectivamente). El resto de los tratamientos, adems de la tendencia lineal,
presentan una tendencia cuadrtica.

Pruebas de hiptesis para contrastes

Tratam*Profund F gl(num) gl(den) p-valor


Cont.1 111.81 1 24 <0.0001
Cont.2 0.06 1 24 0.8147
Cont.3 222.11 1 24 <0.0001
Cont.4 26.66 1 24 <0.0001
Cont.5 164.40 1 24 <0.0001
Cont.6 10.52 1 24 0.0035
Cont.7 92.62 1 24 <0.0001
Cont.8 7.26 1 24 0.0127
Total 79.43 8 24 <0.0001

171
Modelos Mixtos en InfoStat

Coeficientes de los contrastes

Tratam Profund Cont.1 Cont.2 Cont.3 Cont.4 Cont.5 Cont.6 Cont.7 Cont.8
sol 1 -1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00
sol 2 0.00 -2.00 0.00 0.00 0.00 0.00 0.00 0.00
sol 3 1.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00
sombraL1 1 0.00 0.00 -1.00 1.00 0.00 0.00 0.00 0.00
sombraL1 2 0.00 0.00 0.00 -2.00 0.00 0.00 0.00 0.00
sombraL1 3 0.00 0.00 1.00 1.00 0.00 0.00 0.00 0.00
sombraL2 1 0.00 0.00 0.00 0.00 -1.00 1.00 0.00 0.00
sombraL2 2 0.00 0.00 0.00 0.00 0.00 -2.00 0.00 0.00
sombraL2 3 0.00 0.00 0.00 0.00 1.00 1.00 0.00 0.00
sombraNL 1 0.00 0.00 0.00 0.00 0.00 0.00 -1.00 1.00
sombraNL 2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 -2.00
sombraNL 3 0.00 0.00 0.00 0.00 0.00 0.00 1.00 1.00

172
Modelos Mixtos en InfoStat

Diseos de testigos apareados

Este tipo de arreglo de tratamientos es comn en la evaluacin de nuevos cultivares


(variedades, hbridos, etc.) en mejoramiento gentico vegetal. Bsicamente consisten en
ubicar en forma aleatoria el conjunto de cultivares a evaluar intercalando siempre entre
ellos un testigo comn. La presencia de este testigo es la que permite de alguna forma
modelar los efectos sistemticos de la calidad del terreno donde se ubican las parcelas
experimentales. Para ejemplificar su anlisis se presenta un ejemplo con 16 hbridos
(H1,, H16) y un testigo, y as se tiene un total de 32 unidades experimentales. Los
datos se encuentran en el archivo Testigos apareados.IDB2.

Una alternativa bsica y muy poco eficiente para analizar estos datos es realizar un
ANOVA a una va de clasificacin, y comparar los tratamientos usando una estimacin
del trmino de error a partir de la varianza entre los testigos (nicos niveles del factor
tratamiento que estn repetidos). Este modelo es incapaz de contemplar los sesgos
producidos por las diferencias sistemticas entre unidades experimentales. Para obtener
este modelo, se declara en el selector de variables a Rendimiento como variable
dependiente y a Hibrido como variable de clasificacin.

En la solapa de Efectos fijos se declara al Hibrido como en la Figura 112. Luego, en la


solapa Comparaciones se solicit la prueba LSD de Fisher para Hibrido.

173
Modelos Mixtos en InfoStat

Figura 112: Ventana con la solapa Efectos fijos desplegada para los datos del archivo
Testigos_apareados.IDB2.

La salida correspondiente se presenta a continuacin.

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo000_Rendimiento_REML<-gls(Rendimiento~1+Hibrido
,method="REML"
,na.action=na.omit
,data=R.data21)

Resultados para el modelo: modelo000_Rendimiento_REML

Variable dependiente:Rendimiento

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


32 219.90 232.64 -91.95 101.35 0.69
AIC y BIC menores implica mejor

174
Modelos Mixtos en InfoStat

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 3580.56 <0.0001
Hibrido 16 2.12 0.0763

Medias ajustadas y errores estndares para Hibrido


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Hibrido Medias E.E.


H4 1230.00 101.35 A
H3 1222.00 101.35 A
H14 1193.00 101.35 A B
H10 1168.00 101.35 A B C
H11 1116.00 101.35 A B C
Testigo 1115.81 25.34 A B C
H5 1099.00 101.35 A B C
H9 1063.00 101.35 A B C
H2 1037.00 101.35 A B C D
H12 1033.00 101.35 A B C D
H8 975.00 101.35 A B C D
H7 966.00 101.35 A B C D
H16 928.00 101.35 A B C D
H6 907.00 101.35 B C D
H1 886.00 101.35 C D
H13 876.00 101.35 C D
H15 756.00 101.35 D
Letras distintas indican diferencias significativas(p<= 0.05)

La prueba F para Hibrido no result significativa (p = 0.0763) por lo cual no deben


interpretarse las diferencias de medias presentadas en la prueba LSD de Fisher.

La alternativa a este modelo es el uso de correlaciones espaciales para corregir las


medias de cada hbrido por el efecto del sitio en donde fueron ubicadas por azar. Para
esto, se procede a colocar la Posicion de la parcela como una covariable.

En la solapa Efectos fijos se deja igual que en la Figura 112. En la solapa Correlacin se
especifican los diferentes modelos:

Modelo 1: Correlacin espacial exponencial ( Figura 113).

Modelo 2: Correlacin espacial Gaussiana (Figura 114).

Modelo 3: Correlacin espacial lineal (Figura 115).

Modelo 4: Correlacin espacial rational quadratic (Figura 116).

Modelo 5: Correlacin espacial esfrica (Figura 117).

175
Modelos Mixtos en InfoStat

A continuacin se muestran las ventanas de seleccin de correlacin espacial y las


medidas de ajuste de cada uno de los modelos estimados.

Figura 113: Ventana con la solapa Correlacin desplegada para los datos del archivo
Testigos_apareados.IDB2 y seleccin de Correlacin espacial exponencial.

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


32 218.62 232.08 -90.31 112.79 0.58
AIC y BIC menores implica mejor

176
Modelos Mixtos en InfoStat

Figura 114: Ventana con la solapa Correlacin desplegada para los datos del archivo
Testigos_apareados.IDB2 y seleccin de Correlacin espacial Gaussiana.

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


32 219.17 232.62 -90.58 106.78 0.58
AIC y BIC menores implica mejor

177
Modelos Mixtos en InfoStat

Figura 115: Ventana con la solapa Correlacin desplegada para los datos del archivo
Testigos_apareados.IDB2 y seleccin de Correlacin espacial lineal.

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


32 219.13 232.58 -90.56 107.52 0.56
AIC y BIC menores implica mejor

178
Modelos Mixtos en InfoStat

Figura 116: Ventana con la solapa Correlacin desplegada para los datos del archivo
Testigos_apareados.IDB2 y seleccin de Correlacin espacial rational quadratic.

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


32 218.81 232.26 -90.40 106.92 0.59
AIC y BIC menores implica mejor

179
Modelos Mixtos en InfoStat

Figura 117: Ventana con la solapa Correlacin desplegada para los datos del archivo
Testigos_apareados.IDB2 y seleccin de Correlacin espacial esfrica.

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


32 219.21 232.66 -90.60 137.39 0.56
AIC y BIC menores implica mejor

Todos los modelos ajustan bien, ya que sus valores de AIC y BIC son muy parecidos. El
modelo con menores valores es el de Correlacin espacial exponencial (AIC=218.62,
BIC=232.08). La salida correspondiente a este modelo se presenta a continuacin.

180
Modelos Mixtos en InfoStat

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo028_Rendimiento_REML<-gls(Rendimiento~1+Hibrido
,correlation=corExp(form=~as.numeric(as.character(Posicion))
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data28)

Resultados para el modelo: modelo028_Rendimiento_REML

Variable dependiente:Rendimiento

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


32 218.62 232.08 -90.31 112.79 0.58
AIC y BIC menores implica mejor

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 582.79 <0.0001
Hibrido 16 5.27 0.0012

Estructura de correlacin

Modelo de correlacin: Exponential spatial correlation


Formula: ~ as.numeric(as.character(Posicion))
Metrica: euclidean

Parmetros del modelo

Parmetro Estim
range 2.74

Medias ajustadas y errores estndares para Hibrido


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Hibrido Medias E.E.


H3 1248.31 85.33 A
H4 1244.19 85.33 A
H10 1145.64 85.33 A B
H5 1128.65 85.33 A B C
Testigo 1096.98 45.09 A B C
H2 1091.07 85.33 A B C
H11 1078.43 85.33 A B C
H9 1078.28 85.33 A B C
H14 1070.07 85.33 A B C
H1 1005.46 85.33 B C
H12 979.80 85.33 B C
H6 966.31 85.33 B C

181
Modelos Mixtos en InfoStat

H7 936.21 85.33 B C D
H8 933.40 85.33 B C D
H16 902.87 85.33 C D
H13 727.55 85.33 D E
H15 653.36 85.33 E
Letras distintas indican diferencias significativas(p<= 0.05)

Se encontraron diferencias entre hbridos (p = 0.0012). Mediante la prueba LSD de


Fisher de comparacin de medias se pudo determinar que los hbridos de mayor
rendimiento fueron los H2, H3, H4, H5, H9, H10, H11, H14, y que stos a su vez no
difieren del testigo.

Otra alternativa es pensar el problema como en los orgenes de la modelacin espacial


(Papadakis 1937), y utilizar un anlisis de covarianza para ajustar las medias de los
hbridos en las distintas posiciones. Para realizar una aproximacin a este tipo de
anlisis se construy una nueva variable llamada Tes, la cual contiene los rendimientos
correspondientes a los testigos, luego se adicion una nueva columna (Hib) en la que se
copiaron los valores del rendimiento del hibrido ms cercano a cada testigo. Se calcul
luego la diferencia del rendimiento del testigo frente al hibrido (Dif).

A continuacin se realiz un anlisis de regresin lineal considerando a Dif como


variable dependiente y a Posicion como variable regresora. Se guardaron los predichos
de este modelo con el fin de utilizarlos como una covariable en el anlisis de las medias
de hbridos.

Luego, en la ventana del selector de variables de Modelos lineales generalizados y


mixtos se declaran las variables como se muestra en la Figura 118.

182
Modelos Mixtos en InfoStat

Figura 118: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del
archivo Testigos_apareados.IDB2.

En la ventana de Efectos fijos se declara a Hibrido y a PRED_Dif. En la solapa


Comparaciones se solicit la prueba LSD de Fisher. La salida correspondiente se
presenta a continuacin.

Modelos lineales generales y mixtos

Especificacin del modelo en R

modelo029_Rendimiento_REML<-gls(Rendimiento~1+Hibrido+PRED_Dif
,method="REML"
,na.action=na.omit
,data=R.data29)

Resultados para el modelo: modelo029_Rendimiento_REML

Variable dependiente:Rendimiento

Medidas de ajuste del modelo

N AIC BIC logLik Sigma R2_0


32 215.09 227.23 -88.54 79.89 0.82
AIC y BIC menores implica mejor

183
Modelos Mixtos en InfoStat

Pruebas de hiptesis secuenciales

numDF F-value p-value


(Intercept) 1 5763.58 <0.0001
Hibrido 16 3.42 0.0129
PRED_Dif 1 10.15 0.0066

Medias ajustadas y errores estndares para Hibrido


LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No

Hibrido Medias E.E.


H4 1295.07 82.46 A
H3 1293.92 83.02 A
H10 1150.88 80.07 A B
H5 1143.52 81.10 A B
H2 1129.47 85.00 A B
H14 1121.08 83.02 A B
Testigo 1115.81 19.97 A B
H11 1078.33 80.76 A B
H9 1052.73 79.95 A B C
H12 988.48 81.10 B C
H1 985.32 85.76 B C
H8 985.27 79.95 B C
H7 983.12 80.07 B C
H6 944.67 80.76 B C
H16 828.68 85.76 C D
H13 810.93 82.46 C D
H15 663.53 85.00 D
Letras distintas indican diferencias significativas(p<= 0.05)

Si bien se llega a la misma conclusin con respecto a los cultivares que en el anlisis
usando correlacin espacial exponencial, podemos observar que las medias ajustadas y
los errores estndares son diferentes. Tambin difiere el orden o ranking presente entre
los hbridos que presentan los mayores rendimientos. Por ltimo, el contemplar la
correlacin espacial es una alternativa mucho ms sencilla para realizar este tipo de
anlisis.

184
Modelos Mixtos en InfoStat

Referencias

Benjamini Y., Hochberg Y.1995. Controlling the false discovery rate: a practical and
powerful approach to multiple testing. J. R. Stat. Soc. Ser. B, 57:289-300.

Benjamini Y., Yekutieli, D. 2001. The control of the false discovery rate in multiple
hypothesis testing under dependency. The Annals of Statistics, 29(4):1165-
1188.

Besag J.E. 1974. Spatial interaction and the statistical analysis of lattice systems. J. R.
Stat. Soc. Ser. B 36: 192-225.

Besag J.E. 1977. Errors-in-variables estimation for Gaussian lattice schemes. J. R. Stat.
Soc. Ser. B 39: 73-78.

Casanoves F., Macchiavelli R., Balzarini, M. 2005. Error variation in multienvironment


peanut trials: Within-trial spatial correlation and between-trial heterogeneity.
Crop Science, 45: 1927-1933.

Casanoves F., Macchiavelli R., Balzarini M. 2007. Models for multi-environment yield
trials with fixed and random block effects and homogeneous and
heterogeneous residual variances. Journal of Agriculture of the University of
Puerto Rico, 91(3-4): 117-131.

Cullis B.R., Gogel B.J., Verbyla A.P., Thompson R. 1998. Spatial analysis of multi-
environment early generation trials. Biometrics 54: 1-18.

Di Rienzo J.A., Guzman A.W., Casanoves F. (2002). A Multiple Comparisons Method


based On the Distribution of the Root Node Distance of a Binary Tree
Obtained by Average Linkage of the Matrix of Euclidean Distances between
Treatment Means. JABES 7(2), 129-142.

Di Rienzo J. 2007.Curso de Diseo de Experimentos 2007 de la Maestra en Estadstica


Aplicada UNC. http://vaca.agro.uncor.edu/~estad/cursosposgrado.htm

Gilmour A.R., Thompson R, Cullis B.R., Verbyla A.P. 1997. Accounting for natural
and extraneous variation in the analysis of field experiments. J. Agric. Biol.
Env. Stat. 2: 269:273.

Hsu J.C. 1996. Multiple Comparisons: Theory and Methods. First edition. Chapman &
Hall, London.

185
Modelos Mixtos en InfoStat

Littell R., Milliken G., Stroup W., Wolfinger R., Schabenberger O. 2006. SAS for
Mixed Models. Second Ed., SAS Institute, Cary, NC.

Littell R., Pendergast J., Natarajan R. 2002. Modelling Covariance Structure in the
Analysis of Repeated Measures Data. Statistics in Medicine 19:1793-1819.

Martnez N. 2006. Determinacin de la tasa de degradacin de hojarasca de guadua


(Guadua angustifolia) e higuern (Ficus glabrata) con y sin presencia de
macroinvertebrados acuticos en una quebrada del Valle del Cauca, Colombia.
Disertacin, Departamento de Biologa, Universidad del Valle, Colombia.

Mead R. 1971. Models for interplant competition in irregularly spaced population. In:
Statistical Ecology, Patil G.P., Pielou E.C. and Waters W.E. (Eds.).
Pensilvania State University Press, State College, PA, pp: 13-22.

Milliken G.A., Johnson D.E. 1984. Analysis of Messy Data, Vol. 1. Van Nostrand
Reinhold, NY.

Moser E.B., Macchiavelli R. 2002. Model selection techniques for repeated measures
covariance structures. Proceedings of the XIV Conference on Applied
Statistics in Agriculture 14: 17-31.

Navarro C., Cavers S., Pappinen A., Tigerstedt P., Lowe A., Merila J. 2005. Contrasting
quantitative traits and neutral genetic markers for genetic resource assessment
of Mesoamerican Cedrela odorata. Silvae Genetica. 54: 281292.

Papadakis J.S. 1937. Mthode statistique pour des experiences sur champ. Institut
dAmlioration des Plantes a Thessaloniki.

Pinheiro J.C., Bates D.M. 2004. Mixed-Effects Models in S and S-PLUS. Springer,
New York.

Pierson R.A., Ginther O.J. 1987. Follicular population dynamics during the estrus cycle
of the mare. Animal Reproduction Science 14: 219231.

Ripley B.D. 1981. Spatial Statistics. Wiley, New York.

Zimmerman D.L., Harville D.A. 1991. A random field approach to the analysis of field
plot experiments and other spatial experiments. Biometrics 47: 223-239.

186
Modelos Mixtos en InfoStat

ndice de cuadros

Cuadro 1. Componentes de varianza estimados para los datos del archivo Compvar.IDB2 ......................................... 34

Cuadro 2. Caractersticas y medidas de ajuste de los modelos evaluados para los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 106

Cuadro 3. Criterios de bondad de ajuste para los modelos ajustados con efectos de bloque fijo en los datos del archivo
ECRmani.IDB2 .......................................................................................................................................................... 144

Cuadro 4. Criterios de bondad de ajuste para los modelos ajustados sin efectos de bloque fijo en los datos del archivo
ECRmani.IDB2 .......................................................................................................................................................... 144

ndice de figuras

Figura 1: Solapas con las opciones para especificacin de un modelo lineal general y mixto. .......................................2

Figura 2: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Atriplex.IDB2. ............................3

Figura 3: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Bloque.IDB2.......................5

Figura 4: Ventana desplegada con la solapa Comparaciones para los datos del archivo Bloque.IDB2. .........................8

Figura 5: Ventana de dilogo para importar datos desde las libreras de R................................................................... 10

Figura 6: Encabezamiento de la tabla de datos del archivo Ovary................................................................................ 10

Figura 7: Relacin entre el nmero de folculos (follicles) y el tiempo (Time). ........................................................... 11

Figura 8: Ventana desplegada con la solapa Efectos fijos para los datos del archivo Ovary. .......................................12

Figura 9: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Ovary. ...............................13

Figura 10: Ventana desplegada con la solapa Correlacin para los datos del archivo Ovary. ......................................14

Figura 11: Funciones ajustadas para el nmero poblacional de folculos (lnea slida negra) y para cada yegua
originada por el efecto aleatorio sobre la constante (archivo Ovary). ........................................................................... 18

Figura 12: Valores suavizados (polinmico de tercer grado) para el nmero de folculos (lineas slidas) para cada
yegua (Archivo Ovary). ................................................................................................................................................ 18

Figura 13: Especificacin de la parte fija del modelo (3) ............................................................................................. 19

Figura 14: Especificacin de la parte aleatoria del modelo (3) ..................................................................................... 19

Figura 15: Valores predichos para el nmero de folculos para cada yegua generados por la incluisin de efectos
aleatorios sobre los parmetros del modelo de regresin. Matriz de covarianzas de los efectos aleatorios: pdSymm ..20

Figura 16: Especificacin de la parte aleatoria del modelo (3) pero permitiendo que stos varien en varianza y estn
correlacionados. ............................................................................................................................................................ 21

Figura 17: Valores predichos para el nmero de folculos para cada yegua generados por la incluisin de efectos
aleatorios sobre los parmetros del modelo de regresin. Matriz de covarianzas de los efectos aleatorios: pdSymm. .21

187
Modelos Mixtos en InfoStat

Figura 18: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Ovary. .........................22

Figura 19: Ventana comparacin de modelos generales y mixtos con la solapa Diagnstico desplegada (archivo
Atriplex.IDB2).............................................................................................................................................................. 25

Figura 20: Ventana comparacin de modelos generales y mixtos con la solapa Combinaciones lineales desplegada
(archivo Atriplex.IDB2). .............................................................................................................................................. 26

Figura 21: Funcin de autocorrelacin de los residuos del modelo presentado en la Ecuacin (2) excluyendo la
modelacin de la autocorrelacin serial. ....................................................................................................................... 27

Figura 22: Funcin de autocorrelacin de los residuos del modelo presentado en la Ecuacin (2) incluyendo la
modelacin de la autocorrelacin serial. ....................................................................................................................... 28

Figura 23: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del archivo
Compvar.IDB2. ............................................................................................................................................................ 31

Figura 24: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la
especificacin del Modelo 1. ........................................................................................................................................ 32

Figura 25: Ventana Anlisis-exploracin de modelos estimados con la solapa Diagnstico desplegada para el Modelo
1 con los datos del archivo Compvar.IDB2. ................................................................................................................. 35

Figura 26: Grficos de diagnstico obtenidos para la variable largo y el modelo 1 para los datos del archivo
Compvar.IDB2. ............................................................................................................................................................ 35

Figura 27: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Compvar.IDB2 para la
especificacin de varianzas heterogneas para poblaciones. ........................................................................................ 36

Figura 28: Grficos de diagnstico obtenidos para la variable largo y el modelo 1 con varianzas residuales
heterogneas para poblaciones y los datos del archivo Compvar.IDB2........................................................................ 41

Figura 29: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Compvar.IDB2 para la
especificacin del Modelo 2. ........................................................................................................................................ 42

Figura 30: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la
especificacin del Modelo 2. ........................................................................................................................................ 42

Figura 31: Ventana con la solapa Comparaciones desplegada para los datos del archivo Compvar.IDB2 para la
especificacin del Modelo 2. ........................................................................................................................................ 43

Figura 32: Ventana Anlisis-exploracin de modelos estimados con la solapa Diagnstico desplegada para el Modelo
2 con los datos del archivo Compvar.IDB2. ................................................................................................................. 47

Figura 33: Grficos de diagnstico obtenidos para la variable largo y el Modelo 2 para los datos del archivo
Compvar.IDB2 ............................................................................................................................................................. 48

Figura 34: Grficos de diagnstico obtenidos para la variable largo y el modelo 2 para los datos del archivo
Compvar.IDB2 una vez declaradas las varianzas residuales diferentes para cada poblacin. ......................................51

Figura 35: Esquema del diseo en parcelas divididas para el ejemplo de los datos en el archivo Trigo.IDB2 (gris
oscuro=parcelas bajo riego, gris claro=parcelas en secano).......................................................................................... 54

Figura 36: Encabezamiento de la tabla de datos del archivo Trigo.IDB2. .................................................................... 55

Figura 37: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del archivo
Trigo.IDB2. .................................................................................................................................................................. 55

188
Modelos Mixtos en InfoStat

Figura 38: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Trigo.IDB2..............................56

Figura 39: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Trigo.IDB2 con bloque y
agua como criterios de estratificacin........................................................................................................................... 57

Figura 40: Ventana Comparacin de modelos generales y mixtos con la solapa Diagnstico desplegada para los datos
del archivo Trigo.IDB2................................................................................................................................................. 59

Figura 41: Herramientas grficas para diagnstico obtenidas para los datos del archivo Trigo.IDB2. .........................60

Figura 42: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Trigo.IDB2 con
seleccin de funcin varIdent con variedad como criterio de agrupamiento. ............................................................... 61

Figura 43: Ventana con la solapa Comparaciones desplegada para los datos del archivo Trigo.IDB2 y seleccin de la
subsolapa Medias.......................................................................................................................................................... 62

Figura 44: Encabezamiento de la tabla de datos del archivo Cobertura de gotas.IDB2. ............................................... 64

Figura 45: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del archivo
Cobertura de gotas.IDB2. ............................................................................................................................................. 65

Figura 46: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura de gotas.IDB2. .......65

Figura 47: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura de gotas.IDB2
con Parcela como criterio de estratificacin. ................................................................................................................ 66

Figura 48: Diagrama de cajas para los residuos estandarizados de Pearson para los niveles del factor Cara. ..............67

Figura 49: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura de gotas.IDB2
con Cara como criterio de agrupamiento. ..................................................................................................................... 68

Figura 50: Diagramas de puntos para estudiar la interaccin entre Coad y Altura (a) y entre Cara y Altura (b). .........71

Figura 51: Esquema del diseo en parcelas subdivididas para el ejemplo de los datos en el archivo Calidad del
almidn.IDB2. .............................................................................................................................................................. 72

Figura 52: Encabezamiento de la tabla de datos del archivo Calidad del Almidn.IDB2. ............................................ 73

Figura 53: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del archivo Calidad
del Almidn.IDB2. ....................................................................................................................................................... 73

Figura 54: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Calidad del Almidn.IDB2. ....74

Figura 55: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidn.IDB2.
...................................................................................................................................................................................... 75

Figura 56: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidn.IDB2
que contempla otra forma de especificar la parte aleatoria. .......................................................................................... 77

Figura 57: Relacin entre cobertura y tiempo para cinco tratamientos del archivo Cobertura forrajes.IDB2. .............81

Figura 58: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del ejemplo
Cobertura forrajes.IDB2. .............................................................................................................................................. 83

Figura 59: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura forrajes.IDB2. ........84

Figura 60: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura forrajes.IDB2 y
seleccin de Errores independientes (Modelo 1). ......................................................................................................... 85

189
Modelos Mixtos en InfoStat

Figura 61: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura forrajes.IDB2
con seleccin de funcin varIdent con tiempo como criterio de agrupamiento (Modelo 2).......................................... 86

Figura 62: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura forrajes.IDB2 y
seleccin de simetra compuesta para datos agrupados por parcela (Modelo 3). ......................................................... 87

Figura 63: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura forrajes.IDB2 y
seleccin de modelo Autorregresivo de orden 1 para datos agrupados por parcela y orden de las observaciones
indicado por la variable Tiempo (Modelo 5). ............................................................................................................... 89

Figura 64: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura forrajes.IDB2
con parcela como criterio de estratificacin (Modelo 7)............................................................................................... 90

Figura 65: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura forrajes.IDB2 y
seleccin de modelo Autorregresivo continuo de orden 1 para datos agrupados por parcela y orden de las
observaciones indicado por la variable Tiempo (Modelo 8). ........................................................................................ 92

Figura 66: Ventana con la solapa Correlacin desplegada para los datos del archivo Cobertura forrajes.IDB2 y
seleccin de modelo Sin estructura para datos agrupados por parcela y orden de las observaciones indicado por la
variable Tiempo (Modelo 9). ........................................................................................................................................ 93

Figura 67: Ventana del Calculador de probabilidades y cuantiles de InfoStat. ............................................................. 96

Figura 68: Ventana con la solapa Comparaciones desplegada para los datos del archivo Cobertura forrajes.IDB2 y
seleccin de la subsolapa Contrastes. ........................................................................................................................... 97

Figura 69: Ventana de selector de variables con los datos del archivo CapacidadRespiratoria.IDB2. ....................... 100

Figura 70: Ventana con la solapa Efectos fijos desplegada con los datos del archivo CapacidadRespiratoria.IDB2. 101

Figura 71: Ventana con la solapa Correlacin desplegada, opcin Simetra compuesta, con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 102

Figura 72: Ventana con la solapa Correlacin desplegada, opcin Autorregresivo de orden 1, con los datos del
archivo CapacidadRespiratoria.IDB2. ........................................................................................................................ 103

Figura 73: Ventana con la solapa Heteroscedasticidad desplegada con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 104

Figura 74: Ventana con la solapa Efectos aleatorios desplegada con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 105

Figura 75: Ventana con la solapa Correlacin desplegada, opcin Sin estructura, con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 106

Figura 76: Ventana de selector de variables para los datos del archivo MedCapRes.IDB2. ....................................... 110

Figura 77: Ventana de selector de variables con solapa Particiones activada para los datos del archivo
MedCapRes.IDB2....................................................................................................................................................... 111

Figura 78: Grfico de puntos para estudiar la interaccin entre tratamientos y hora con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 112

Figura 79: Ventana con la solapa Comparaciones, subsolapa Contrastes con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 113

190
Modelos Mixtos en InfoStat

Figura 80: Grfico de puntos para el logaritmo del peso seco remanente en funcin del tiempo, para los cuatro
tratamientos (Especie-Bolsa). Archivo Descomposicin.IDB2. ................................................................................. 116

Figura 81: Especificacin del modelo de regresin lineal con ordenadas al origen y pendientes diferentes para el
logaritmo de la materia seca remanente en funcin del tiempo para cuatro tratamientos dados por la especie de origen
del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposicin.IDB2. .............................. 117

Figura 82: Grfico de puntos para el logaritmo del peso seco remanente en funcin del tiempo, para los cuatro
tratamientos (Especie-Bolsa). Archivo Descomposicin.IDB2. ................................................................................. 118

Figura 83: Grfico de residuos estudentizados (Pearson) vs. Tiempo, para un modelo de regresin de la materia seca
residual en funcin del tiempo para cuatro tratamientos (Especia-Bolsa) con diferentes ordenadas y pendientes.
Archivo Descomposicin.IDB2. ................................................................................................................................. 119

Figura 84: Especificacin del modelo de regresin lineal con ordenadas y pendientes diferentes para el logaritmo de
la materia seca remanente en funcin del tiempo para cuatro tratamientos dados por la especie de origen del material
vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposicin.IDB2. .................................................. 119

Figura 85: Ajustes del modelo de regresin polinmica de orden 2 con ordenadas y pendientes diferentes para el
logaritmo de la materia seca remanente en funcin del tiempo y el tiempo^2 (centrados) para cuatro tratamientos
dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo
Descomposicin.IDB2. ............................................................................................................................................... 120

Figura 86: Residuos estudentizados (Pearson) vs. Tiempo para el modelo de regresin polinmica de orden 2 con
ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en funcin del tiempo y el tiempo^2
(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que
lo almacena. Archivo Descomposicin.IDB2. ............................................................................................................ 121

Figura 87: Especificacin de la parte heteroscedstica del modelo de regresin polinmica de orden 2 con ordenadas
y pendientes diferentes para el logaritmo de la materia seca remanente en funcin del tiempo y el tiempo^2
(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que
lo almacena. Archivo Descomposicin.IDB2. ............................................................................................................ 121

Figura 88: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedstico de regresin con ordenadas
y pendientes diferentes por tratamiento para el logaritmo de la materia seca remanente en funcin del tiempo y el
tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la
bolsa que lo almacena. Archivo Descomposicin.IDB2. ............................................................................................ 122

Figura 89: Especificacin de la parte aleatoria del modelo heteroscedstico de regresin polinmica de orden 2 con
ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en funcin del tiempo y el tiempo^2
(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que
lo almacena. Archivo Descomposicin.IDB2. ............................................................................................................ 123

Figura 90: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedstico de regresin con ordenadas
y pendientes diferentes por tratamiento y el agregado de un efecto aleatorio sobre la constante que es particular para
cada combinacin de tiempo y tratamiento, para el logaritmo de la materia seca remanente en funcin del tiempo y el
tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la
bolsa que lo almacena. Archivo Descomposicin.IDB2. ............................................................................................ 123

Figura 91: Intrprete de R. Tiene 4 paneles. Script: contiene el o los programas R que se quieren ejecutar. Output: la
salida de la ejecucin de un script o de la visualizacin de un objeto, Objetos: la lista de los objetos residente en la
memoria de R. Finalmente un panel inferior muestra los mensajes y reporte de errores que enva R a la consola. ....124

191
Modelos Mixtos en InfoStat

Figura 92: Curvas de tasas de descomposicin segn especie y tramado de la bolsa de almacenamiento. .................127

Figura 93: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRman.IDB2 y el Modelo BF.
.................................................................................................................................................................................... 132

Figura 94: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRman.IDB2 y el Modelo
BA. ............................................................................................................................................................................. 132

Figura 95: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo ECRman.IDB2 y el
Modelo BA. ................................................................................................................................................................ 133

Figura 96: Ventana con la solapa Heteroscedasticidad usando local como criterio de agrupamiento para los datos del
archivo ECRman.IDB2 y los Modelos BFH y BAH. ................................................................................................ 134

Figura 97: Ventana con la solapa Correlacin usando las variables la y lon como coordenadas en X e Y
respectivamente y local como criterio de agrupamiento para los datos del archivo ECRman.IDB2 y los Modelos Exp
y BFExp...................................................................................................................................................................... 135

Figura 98: Diagrama de puntos para estudiar la interaccin entre localidades y genotipos para la variable rendimiento.
.................................................................................................................................................................................... 149

Figura 99: Esquema de un experimento conducido bajo un diseo strip-plot repetido en bloques completos al azar,
con la aleatorizacin para un bloque particular de los factores cantidad de nitrgeno y cantidad de riego. Datos del
archivo StripPlot.IDB2. .............................................................................................................................................. 152

Figura 100: Ventana del procedimiento de Anlisis de varianza con la solapa Modelo desplegada para los datos del
archivo StripPlot.IDB2. .............................................................................................................................................. 153

Figura 101: Diagramas de puntos para estudiar la interaccin entre Riego y Nitrgeno y su efecto sobre el
rendimiento. Datos archivo StripPlot.IDB2. ............................................................................................................... 155

Figura 102: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo
StripPlot.IDB2 . .......................................................................................................................................................... 156

Figura 103: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con los datos del
archivo StripPlot.IDB2 . ............................................................................................................................................. 157

Figura 104: Ventana se selector de variable para Modelos lineales generales y mixtos los datos del archivo
Lombrices.IDB2. ........................................................................................................................................................ 161

Figura 105: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo
Lombrices.IDB2. ........................................................................................................................................................ 162

Figura 106: Ventana con la solapa Correlacin desplegada para evaluar un modelo mixto con correlacin espacial
exponencial en los datos del archivo Lombrices.IDB2. .............................................................................................. 163

Figura 107: Ventana con la solapa Correlacin desplegada para evaluar un modelo mixto con correlacin
autorregresiva de orden 1 en los datos del archivo Lombrices.IDB2. ......................................................................... 165

Figura 108: Herramientas grficas para diagnstico obtenidas para los datos del archivo Lombrices.IDB2. .............167

Figura 109: Ventana con la solapa Heteroscedasticidad desplegada para evaluar un modelo mixto con en los datos del
archivo Lombrices.IDB2. ........................................................................................................................................... 168

Figura 110: Diagramas de puntos para estudiar la interaccin entre tratamientos y profundidad y su efecto sobre la
biomasa. Datos archivo Lombrices.IDB2. .................................................................................................................. 170

192
Modelos Mixtos en InfoStat

Figura 111: Ventana con la solapa Comparaciones y la subsolapa Contrastes desplegada para evaluar un modelo
mixto con los datos del archivo Lombrices.IDB2. ...................................................................................................... 171

Figura 112: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Testigos_apareados.IDB2. ..174

Figura 113: Ventana con la solapa Correlacin desplegada para los datos del archivo Testigos_apareados.IDB2 y
seleccin de Correlacin espacial exponencial. .......................................................................................................... 176

Figura 114: Ventana con la solapa Correlacin desplegada para los datos del archivo Testigos_apareados.IDB2 y
seleccin de Correlacin espacial Gaussiana. ............................................................................................................. 177

Figura 115: Ventana con la solapa Correlacin desplegada para los datos del archivo Testigos_apareados.IDB2 y
seleccin de Correlacin espacial lineal. .................................................................................................................... 178

Figura 116: Ventana con la solapa Correlacin desplegada para los datos del archivo Testigos_apareados.IDB2 y
seleccin de Correlacin espacial rational quadratic. .............................................................................................. 179

Figura 117: Ventana con la solapa Correlacin desplegada para los datos del archivo Testigos_apareados.IDB2 y
seleccin de Correlacin espacial esfrica. ................................................................................................................. 180

Figura 118: Ventana de seleccin de variables para Modelos lineales generales y mixtos con datos del archivo
Testigos_apareados.IDB2. .......................................................................................................................................... 183

193

Das könnte Ihnen auch gefallen