Sie sind auf Seite 1von 40

Chapman & Hall/CRC

Statistics in the Social and Behavioral Sciences Series

Multilevel
Modeling Using R
W. Holmes Finch
Ball State University
Muncie, Indiana, USA
Jocelyn E. Bolin
Ball State University
Muncie, Indiana, USA
Ken Kelley
University of Notre Dame
Notre Dame, Indiana, USA
2 Introducción a la estructura de datos multinivel
2.1 Datos anidados y diseños de muestreo de conglomerados

En el Capítulo 1, consideramos el modelo lineal estándar que subyace en métodos estadísticos comunes como
regresión y análisis de varianza.
(ANOVA; el modelo lineal general). Como se ha señalado, este modelo se basa en varios Supuestos primarios
sobre la naturaleza de los datos en una población.
De particular La importancia en el contexto del modelado multinivel es el supuesto de términos de error
distribuidos independientemente para las observaciones individuales dentro de una muestra. Esta suposición
esencialmente significa que no hay relaciones entre los individuos en la muestra para la variable dependiente
una vez que se tienen en cuenta las variables independientes en el análisis. En el ejemplo descrito en el
Capítulo 1, este supuesto se cumplió, ya que los individuos en la muestra se seleccionaron al azar de la
población general.
Por lo tanto, nada vincula sus valores de variables dependientes distintos de las Variables independientes
incluidas en el modelo lineal. Sin embargo, en muchos casos, el método utilizado para seleccionar la muestra
crea respuestas correlacionadas entre individuos. Por ejemplo, un investigador interesado en el impacto de
un nuevo método de enseñanza en el rendimiento estudiantil puede seleccionar aleatoriamente escuelas
para la colocación en grupos de tratamiento o control. Si la escuela A se coloca en la condición de tratamiento,
todos los estudiantes dentro de la escuela también estarán en la condición de tratamiento. Este es un diseño
aleatorio de grupos en el que los grupos (y no los individuos) se asignan a un grupo específico.
Además, sería razonable suponer que la propia escuela, por encima de y más allá de la condición de
tratamiento, tendría un impacto en las actuaciones de los estudiantes. Este impacto se manifestaría como
correlaciones en los puntajes de las pruebas de rendimiento entre los individuos que asisten a la escuela. Por
lo tanto, si utilizáramos un ANOVA simple de una vía para comparar los medios de prueba de rendimiento
para los grupos de tratamiento y control con dichos datos muestreados en grupos, probablemente
violaríamos el supuesto de errores independientes porque es un factor más allá de la condición del
tratamiento (en este caso la escuela) ejercería un impacto adicional en la variable de resultado.

Normalmente nos referimos a la estructura de datos descrita anteriormente como anidada, lo que significa
los puntos de datos individuales en un nivel (por ejemplo, el estudiante) aparecen en un solo nivel de una
variable de nivel superior, como la escuela. Por lo tanto, los estudiantes están anidados dentro de la escuela.
Dichos diseños se pueden contrastar con estructuras de datos cruzados, por lo que los individuos en el primer
nivel aparecen en múltiples niveles de la segunda variable.

En nuestro ejemplo, los estudiantes pueden cruzarse con actividades después de la escuela si se les permite
participar en más de una. Por ejemplo, un estudiante podría estar en el equipo de baloncesto y ser miembro
de la banda.
El enfoque de este libro se centra casi exclusivamente en diseños anidados que dan lugar a datos multinivel.
Otro ejemplo de diseño anidado es una encuesta de los niveles de satisfacción laboral de los empleados de
varios departamentos dentro de una organización empresarial grande. En este caso, cada empleado trabaja
dentro de una sola división en la empresa, haciendo posible un diseño anidado. Parece razonable suponer
que los empleados que trabajan en la misma división tendrán respuestas correlacionadas en la encuesta de
satisfacción, porque gran parte de sus puntos de vista de sus trabajos se basarán exclusivamente en las
experiencias dentro de sus divisiones. Para un tercer ejemplo de este tipo, considere la situación en la que los
clientes de varios psicoterapeutas que trabajan en una clínica deben evaluar la calidad de cada sesión de
terapia. En este caso, existen tres niveles de datos: (1) tiempo en la forma de una sesión individual, (2) cliente
y (3) terapeuta. Por lo tanto, la sesión se anida en el cliente, que a su vez se anida en el terapeuta. Se espera
que esta estructura de datos conduzca a puntuaciones correlacionadas en un instrumento de calificación de
terapia.

2.2 Correlación Intraclase


En los casos en que los individuos se agrupan o anidan dentro de una unidad de nivel superior (p. Ej., Aula,
escuela, distrito escolar), es posible estimar la correlación entre las puntuaciones de los individuos dentro del
grupo o estructura anidada utilizando la correlación intraclase (ICC, denotado ρ en la población). La ρΙ es una
medida de la proporción de variación en la variable de resultado que se produce entre los grupos frente a la
variación total presente. Va desde 0 (sin variación entre grupos) hasta 1 (variación entre grupos, pero sin
variación dentro del grupo). ρΙ también se puede conceptualizar como la correlación para la medida
dependiente para dos individuos seleccionados al azar del mismo grupo. Se puede expresar como

donde τ2 denota la varianza de la población entre agrupamientos y σ2 indica la varianza de la población


dentro de los agrupamientos. Los valores más altos de ρΙ indican que una mayor proporción de la variación
total en la medida de resultado está asociada con la membresía del grupo; es decir, una relación
relativamente fuerte entre las Puntuaciones para dos individuos del mismo grupo. Otra forma de enmarcar
este problema es que los individuos dentro del mismo grupo (por ejemplo, la escuela) se parecen más a la
variable medida que a los individuos en otros grupos.

Es posible estimar τ2 y σ2 utilizando datos de muestra, y por lo tanto también es posible estimar ρΙ.
Aquellos que estén familiarizados con ANOVA reconocerán estas estimaciones como relacionadas (aunque
no idénticas) con la suma de los términos al cuadrado. La estimación de la muestra para la variación dentro
de los grupos es simplemente
nj es el tamaño de muestra del grupo j, N es el tamaño total de la muestra y C es el número total de grupos.
En otras palabras, σ2 es simplemente el promedio ponderado de las varianzas dentro del cluster.

La estimación de τ2 implica algunos pasos más, pero no es mucho más complejo de lo que hemos visto para
σ2. Para obtener la estimación de la muestra para la variación entre clusters τ2 ^, primero debemos calcular
la varianza ponderada entre clusters:

No podemos usar como SB 2 una estimación directa de τ2 porque se ve afectada por la variación aleatoria
entre los sujetos dentro de los mismos grupos. Por lo tanto, en Para eliminar esta fluctuación aleatoria,
estimaremos la variación de la población entre grupos como, Por lo tanto, con el fin de eliminar esta
fluctuación aleatoria, estimaremos la varianza entre el grupo de varianza como

Usando estas estimaciones de varianza, podemos a su vez calcular la estimación muestral de ρΙ:
Tenga en cuenta que la Ecuación (2.5) asume que los grupos son de igual tamaño. Claramente, ese no será
siempre el caso, en cuyo caso esta ecuación no se mantendrá.

Sin embargo, el propósito de su inclusión aquí es demostrar el principio que subyace en la estimación de ρI,
que se mantiene incluso cuando cambia la ecuación.

Para ilustrar la estimación de ρI, consideremos el siguiente conjunto de datos.

Los datos de las pruebas de rendimiento se obtuvieron de 10,903 estudiantes de tercer grado anidados en
160 escuelas. El tamaño de la matrícula escolar varió de 11 a 143, con un tamaño promedio de 68.14. En
este caso, nos centraremos en los resultados de las pruebas de rendimiento de lectura y utilizaremos datos
de solo cinco de las escuelas para hacer que los cálculos manuales sean fáciles de seguir. Primero,
estimaremos σ2 ˆ . Para hacerlo, debemos estimar la varianza en los puntajes dentro de cada escuela. Estos
valores aparecen en la tabla 2.1.

Usando estas variaciones y tamaños de muestra, podemos calcular σ2 ˆ como


Usando este valor, podemos calcular SB 2 para las cinco escuelas en nuestra pequeña muestra usando la
Ecuación (2.3):

Ahora podemos estimar la población entre la varianza del cluster τ2 usando la Ecuación (2.4):

Ahora hemos calculado todas las partes necesarias para estimar ρI para la población

Este resultado indica muy poca correlación entre los resultados de los exámenes dentro de las escuelas.
También podemos interpretar este valor como la proporción de la variación en los puntajes de las pruebas
representadas por las escuelas. Como ρΙ ˆ es una estimación de muestra, sabemos que está sujeta a una
variación de muestreo, que puede estimarse con un error estándar como en la Ecuación (2.6):
Los términos en la Ecuación (2.6) son como se definieron anteriormente, y se supone que todos los grupos
son de igual tamaño. Como se señaló anteriormente, esta última condición no es un requisito, sin embargo,
y existe una formulación alternativa para los casos en los que no se cumple. Sin embargo, la Ecuación (2.6)
proporciona información suficiente para nuestros propósitos en la estimación del error estándar del ICC.

El ICC es una herramienta importante en el modelado multinivel, en gran parte porque indica el grado en que
una estructura de datos multinivel puede impactar la variable de resultado de interés. Los valores ICC más
grandes son indicativos de un mayor impacto del agrupamiento. Por lo tanto, a medida que la ICC aumenta
su valor, debemos ser más conscientes de emplear estrategias de modelado multinivel en el análisis de datos.
En la siguiente sección, discutiremos los problemas asociados con ignorar esta estructura multinivel, antes de
dirigir nuestra atención a los métodos para tratarla directamente.

2.3 Escollos de ignorar la estructura de datos multinivel


Cuando los investigadores aplican métodos estadísticos estándar a datos de varios niveles, como el modelo
de regresión descrito en el Capítulo 1, se viola el supuesto de errores independientes. Por ejemplo, si tenemos
puntajes en las pruebas de rendimiento de una muestra de estudiantes que asisten a diferentes escuelas,
sería razonable creer que los que asisten a la misma escuela tendrán puntajes que están más relacionados
entre sí que con los puntajes de los estudiantes. en otras escuelas. Esta correlación dentro de la escuela se
debería, por ejemplo, a una comunidad, un conjunto común de maestros, un plan de estudios de enseñanza
común, un conjunto único de políticas administrativas y otros factores. La correlación dentro de la escuela a
su vez resultará en una estimación inadecuada de los errores estándar para los parámetros del modelo, lo
que conducirá a errores de inferencia estadística, como valores p más pequeños de lo que deberían ser y el
consiguiente rechazo de los efectos nulos. por encima de la tasa de error de Tipo I indicada para los
parámetros.

Recordando nuestra discusión en el Capítulo 1, el estadístico de prueba para la hipótesis nula de que no hay
relación entre la variable independiente y la dependiente es simplemente el coeficiente de regresión dividido
por el error estándar. Una subestimación del error estándar causará una sobreestimación del estadístico de
prueba y, por lo tanto, la significación estadística del parámetro en los casos en que no debería ser, es decir,
los errores de Tipo I a una tasa mayor que la especificada. De hecho, la subestimación del error estándar se
producirá a menos que τ2 sea igual a 0.

Además de la subestimación del error estándar, otro problema con ignorar la estructura de múltiples niveles
de datos es que podemos perder relaciones importantes que involucran cada nivel en los datos. Recordemos
nuestro ejemplo de

Dos niveles de muestreo: los estudiantes (nivel 1) están anidados en las escuelas (nivel 2).
Específicamente, al no incluir información sobre la escuela, por ejemplo, podemos pasar por alto variables
importantes a nivel escolar que pueden ayudar a explicar el desempeño a nivel de los estudiantes. Por lo
tanto, más allá del problema conocido con la desestimación de errores estándar, también desarrollamos un
modelo incorrecto para comprender la variable de resultado de interés. En el contexto de los modelos lineales
multinivel (MLM), la inclusión de variables en cada nivel es relativamente simple, al igual que las interacciones
entre variables en diferentes niveles.

Esta mayor complejidad del modelo a su vez puede llevar a una mayor comprensión del fenómeno en estudio.

2.4 modelos lineales multinivel


En la siguiente sección, revisaremos algunas de las ideas centrales que subyacen a los MLM. Nuestro objetivo
es familiarizar a los lectores con los términos que se repetirán a lo largo del libro y explicarlos de una manera
relativamente no técnica. Primero nos enfocaremos en la diferencia entre los efectos aleatorios y fijos,
después de lo cual discutiremos los conceptos básicos de la estimación de arameter, enfocándonos en los dos
métodos más comúnmente utilizados, máxima verosimilitud y máxima verosimilitud restringida, y
concluiremos con una revisión de los supuestos subyacentes de los MLM. y una visión general de cómo se
utilizan con más frecuencia, con ejemplos. En esta sección, también abordaremos el tema del centrado y
explicaremos por qué es un concepto importante en MLM. Después de leer el resto de este capítulo, el lector
tendrá suficiente experiencia técnica en MLM para comenzar a usar el paquete de software R para ajustar
MLM de varios tipos.

2.4.1 Intercepción aleatoria


A medida que pasamos del marco de regresión de un nivel del Capítulo 1 al Contexto de MLM, revisemos
primero el modelo básico de regresión lineal simple de Ecuación (1.1)

Aquí, la variable dependiente y se expresa como una función de una variable independiente x, multiplicada
por un coeficiente de pendiente β1, una intersección β0 y una variación aleatoria de sujeto a sujeto ε.
Definimos la intercepción como la media condicional de y cuando el valor de x es 0.

En el contexto de un modelo de regresión de un solo nivel como este, una intersección es común a todos los
individuos en la población de interés. Sin embargo, cuando los individuos se agrupan de alguna manera (por
ejemplo, estudiantes en aulas y escuelas, unidades organizativas dentro de una empresa), potencialmente
habrá una intercepción separada para cada grupo, es decir, pueden existir diferentes medios para la variable
dependiente para x = 0 a través de los diferentes grupos.

Decimos potencialmente aquí porque el modelo de intercepción única de la Ecuación (1.1) será suficiente si
no hay un efecto de cluster. En la práctica, evaluar la existencia de diferentes medios a través de grupos es
una pregunta empírica que se describe a continuación.

También se debe tener en cuenta que en esta discusión consideramos solo el caso en el que la intercepción
es específica del clúster. También es posible que β1 varíe según el grupo o incluso otros coeficientes de
modelos más complicados.
Permitir intercepciones y pendientes específicas del grupo lleva a la siguiente notación que se usa
comúnmente para el modelo (micro) de nivel 1 en el modelado multinivel

donde el subíndice ij se refiere al individuo i en el grupo jth. Comenzaremos nuestra discusión de la notación
y estructura de MLM con el modelo multinivel más básico: predecir el resultado solo desde una intersección
que permitiremos variar aleatoriamente para cada grupo.

Permitir que la intercepción difiera entre grupos, como en la ecuación (2.8), conduce a la intercepción
aleatoria que expresamos como

En este marco, γ00 representa un valor de intercepción promedio o general que se mantiene en todos los
grupos, mientras que U0j es un efecto específico del grupo en la intercepción.

Podemos pensar en γ00 como un efecto fijo porque permanece constante en todos los grupos, y U0j es un
efecto aleatorio porque varía de un grupo a otro.

Por lo tanto, para un MLM estamos interesados no solo en algún valor promedio general para y cuando x es
0 para todos los individuos en la población (γ00), sino también la desviación entre la media general y los
efectos específicos del grupo para la intersección (U0j ).

Si continuamos suponiendo que los grupos constituyen una muestra aleatoria de la población de todos estos
grupos, podemos tratar U0j como una especie de efecto residual en yij, muy similar a cómo pensamos en ε.
En ese caso, se supone que U0j se extrae al azar de una población con una media de 0 (recuerde que U0j es
una desviación del efecto fijo) y una varianza τ2.

Además, asumimos que τ2 y σ2, la varianza de ε, no están correlacionadas. Ya hemos discutido τ2 y su papel
en el cálculo de σ2^. Además, τ2 también puede verse como el impacto del clúster en la variable dependiente,
y por lo tanto, probar su significación estadística es equivalente a probar la hipótesis nula de que el cluster
(por ejemplo, la escuela) no tiene impacto en la variable dependiente. Si sustituimos los dos componentes de
la intercepción aleatoria en el modelo de regresión, obtenemos

La ecuación (2.10) se denomina modelo completo o compuesto en el que los múltiples niveles se combinan
en una ecuación unificada. A menudo, en MLM, comenzamos nuestro análisis de un conjunto de datos con
este modelo de intercepción aleatoria simple conocido como el modelo nulo que toma la forma
Si bien el modelo nulo no proporciona información sobre los impactos de variables independientes específicas
en la dependiente, sí proporciona información importante sobre cómo se divide la variación en y entre la
varianza entre los valores individuales σ2 y la varianza entre los grupos τ2. La varianza total de y es
simplemente la suma de σ2 y τ2. Además, como ya hemos visto, estos valores pueden usarse para estimar ρI.
El modelo nulo, como se verá en secciones posteriores, también se utiliza como una línea de base para la
construcción y comparación de modelos

2.4.2 Pendientes aleatorios


Es una cuestión simple expandir el modelo de intercepción aleatoria en la Ecuación (2.9) para acomodar una
o más variables predictoras independientes. Como ejemplo, si agregamos un solo predictor (xij) a nivel
individual (Nivel 1) al modelo, obtenemos

El modelo ahora incluye el predictor y la pendiente que lo relaciona con la variable dependiente γ10, que
reconocemos está en el Nivel 1 por el subíndice 10. Interpretamos γ10 de la misma manera que β1 en el
modelo de regresión lineal, es decir, como una medida del impacto en y de un cambio de una unidad en x.
Además, podemos estimar ρI exactamente igual que antes, aunque ahora refleja la correlación entre
individuos del mismo grupo después de controlar la variable independiente, x. En este modelo, γ10 y γ00 son
efectos fijos, mientras que σ2 y τ2 permanecen aleatorios.

Una implicación del modelo en la ecuación (2.12) es que la variable dependiente se ve afectada por
variaciones entre individuos (σ2), variaciones entre grupos (τ2), una media general común a todos los grupos
(γ00) y el impacto de la variable independiente medido por γ10, que también es común a todos los grupos

En la práctica, sin embargo, no hay razón para que el impacto de x en y sea común para todos los grupos. En
otras palabras, es completamente posible que, en lugar de tener un único γ10 común a todos los grupos, en
realidad haya un efecto único para el grupo de γ10 + U1j, donde γ10 es la relación promedio de x con y entre
los grupos, y U1j es la variación específica de grupo de la relación entre las dos variables.
Se supone que este efecto específico de grupo tiene una media de 0 y varía aleatoriamente alrededor de γ10.
El modelo de pendientes aleatorias es

Escrito de esta manera, hemos separado el modelo en sus componentes fijos (γ00 + γ10xij) y aleatorios (U0j
+ U1jxij + εij). El modelo de la Ecuación (2.16) simplemente indica una interacción entre clúster y x, de manera
que la relación de x e y no es constante entre los clústeres.

Hasta ahora hemos discutido solo una fuente de variación entre grupos, expresada como τ2, que sirve como
la variación entre grupos en la intersección.

Sin embargo, la Ecuación (2.16) agrega una segunda fuente de este tipo de varianza entre grupos en la forma
de U1j, que indica una variación de grupo en la pendiente que relaciona las variables independientes y
dependientes. ¿Para diferenciar estas dos fuentes de varianza entre grupos, ahora denotamos la varianza de
U0j cómo τ^20 y la varianza de U1j cómo τ ^21? ¿Además, dentro de los grupos esperamos que U1j y U0j
tengan una covarianza de? 01. Sin embargo, en diferentes grupos, estos términos deben ser independientes
entre sí, y en todos los casos se supone que ε sigue siendo independiente de todos los demás términos
modelo. En la práctica, si encontramos que τ ^21 no es 0, debemos ser cuidadosos al describir la relación
entre las variables independientes y dependientes, ya que no es la misma para todos los grupos.

Volveremos sobre esta idea en los capítulos siguientes. Por el momento, sin embargo, es muy importante
reconocer que la variación en la variable dependiente y puede explicarse por varias fuentes, algunas fijas y
otras aleatorias. En la práctica, lo más probable es que estemos interesados en estimar todas estas fuentes
de variabilidad en un solo modelo.

Como un medio para comprender mejor el MLM, consideremos un ejemplo simple utilizando las cinco
escuelas descritas anteriormente. En este contexto, estamos interesados en tratar una puntuación de la
prueba de rendimiento de lectura como la variable dependiente y una puntuación de la prueba de logro de
vocabulario como la variable independiente.

Recuerde que los estudiantes están anidados dentro de las escuelas para que una regresión simple el análisis
no es apropiado. Para comprender el problema que se está estimando en el contexto de MLM, podemos
obtener estimaciones de intersección y pendiente por separado para cada escuela, como se muestra en la
Tabla 2.2.

Dado que las escuelas son del mismo tamaño de muestra, la estimación de γ00, el valor de intercepción
promedio es 2.359, y la estimación del valor de pendiente promedio γ10 es 0.375. Observe que para ambos
parámetros, los valores escolares se desvían de estos medios. Por ejemplo, el intercepto para la escuela 1 es
1.230. La diferencia de –1.129 entre este valor y 2.359 es U0j para esa escuela.
diferencia entre el valor de pendiente promedio de 0.375 y la pendiente para la escuela

1, 0.552 es 0.177, que es U1j para la escuela. La tabla 2.2 incluye los valores de U0j y U1j para cada escuela.
Las diferencias en las pendientes también proporcionan información sobre la relación entre el vocabulario y
los resultados de las pruebas de lectura.

Esta relación fue positiva para todas las escuelas, lo que significa que los estudiantes que obtuvieron
calificaciones más altas en vocabulario también obtuvieron calificaciones más altas en lectura. Sin embargo,
la fortaleza de esta relación fue más débil para la escuela 2 que para la escuela 1, como ejemplo.

Sobre la base de los valores de la Tabla 2.2, también es posible estimar la variaciones asociadas con U1j y U0j,
τ1 ^2 y τ 0^2, respectivamente. Nuevamente, debido a que las escuelas en este ejemplo tenían la misma
cantidad de estudiantes, el cálculo de estas variaciones es una cuestión directa, utilizando

para las pendientes y una ecuación análoga para la intersección de la varianza aleatoria. ¿Obtenemos
τ0 ^2 = 0.439 0 y τ ^2 = 0.016. En otras palabras, mucho más de la varianza en la variable dependiente se
explica por la variación en las interceptaciones a nivel escolar que por la variación en las pendientes. Otra
forma de pensar en este resultado es que las escuelas mostraron mayores diferencias entre sí en el nivel
promedio de rendimiento en comparación con las diferencias en los impactos de x sobre y.

La práctica de obtener estas estimaciones de varianza utilizando el entorno R para computación estadística y
gráficos e interpretar su significado son temas de los próximos capítulos. Antes de analizar los aspectos
prácticos de la realización de este análisis, primero examinamos los conceptos básicos para estimar
parámetros en el marco de MLM utilizando algoritmos de máxima verosimilitud y de máxima verosimilitud
restringida. Si bien son similares en espíritu a los cálculos simples que se demostraron anteriormente, son
diferentes en la práctica y arrojarán resultados algo diferentes de los obtenidos utilizando los mínimos
cuadrados como se mencionó anteriormente. Primero, un problema más merece nuestra atención ya que
consideramos el uso de MLM, a saber, el centrado de variable.
2.4.3 Centrado
Centrar es simplemente la práctica de restar la media de una variable de cada valor individual. Esto implica
que la media para la muestra de las variables centradas es 0 y también que la puntuación (centrada) de cada
individuo representa una desviación de la media en lugar de representar el significado de su valor bruto. En
el contexto de la regresión, el centrado se usa comúnmente, por ejemplo, para reducir la colinealidad causada
por la inclusión de un término de interacción en un modelo de regresión. Si las puntuaciones brutas de las
variables independientes se utilizan para calcular la interacción y tanto los efectos principales como los
términos de interacción se incluyen en el análisis posterior, es muy probable que la colinealidad cause
problemas en los errores estándar de los parámetros del modelo. Centrar es una forma de ayudar a evitar
tales problemas (Iversen, 1991).

Esas cuestiones también son importantes a considerar en MLM, en las cuales las interacciones se emplean
con frecuencia. Además, el centrado también es una herramienta útil para evitar la colinealidad causada por
intercepciones aleatorias altamente correlacionadas y pendientes en los MLM (Wooldridge, 2004).
Finalmente, el centrado proporciona una ventaja potencial en términos de interpretación de los resultados.
Recuerde de nuestra discusión en el Capítulo 1 que la intercepción es el valor de la variable dependiente
cuando la variable independiente se establece en 0. En muchas aplicaciones (por ejemplo, una medida de
vocabulario), la variable independiente no puede ser razonablemente 0. Esto esencialmente representa la
interceptar como un valor necesario para ajustar la línea de regresión pero no uno que tenga un valor
fácilmente interpretable. Sin embargo, cuando x se ha centrado, la intersección toma el valor de la variable
dependiente cuando el independiente está en su media. Esta es una interpretación mucho más útil para los
investigadores en muchas situaciones, y otra razón más por la cual el centrado es un aspecto importante del
modelado, particularmente en el contexto de múltiples niveles.

Probablemente el enfoque más común para centrar es calcular la diferencia entre la puntuación de cada
individuo y la media general o general de toda la muestra. Este gran centrado de medias es sin duda el método
más utilizado en la práctica (Bickel, 2007). Sin embargo, no es la única forma de centrar los datos. Un enfoque
alternativo conocido como centrado de la media grupal implica calcular la diferencia entre cada puntaje
individual y la media del grupo al que pertenece. En nuestro ejemplo de escuela, el centro de gran media
implicaría calcular la diferencia entre cada puntaje y la media general en todas las escuelas, mientras que el
centro de media grupal llevaría al investigador a calcular la diferencia entre cada puntaje y la media de la
escuela.

Si bien la literatura indica algún desacuerdo sobre qué enfoque puede ser mejor para reducir los efectos
nocivos de la colinealidad (Bryk y Raudenbush, 2002; Snijders y Bosker, 1999), los investigadores demostraron
que cualquiera de las técnicas funcionará bien en la mayoría de los casos (Kreft, de Leeuw, & Aiken, 1995).
Por lo tanto, la elección de qué enfoque de uso debe hacerse sobre bases sustantivas con respecto a la
naturaleza de la relación entre x y y. Al utilizar el centro de gran media, comparamos de manera implícita a
los individuos entre sí (en la forma de la media global) en una muestra completa.

Por otro lado, el centro de la media del grupo coloca a cada individuo en posición relativa en x dentro de su
grupo. En nuestro ejemplo de la escuela, usar los valores medios del vocabulario centrado en el análisis en el
análisis significaría que estamos investigando la relación entre el puntaje de vocabulario relativo de un
estudiante en su escuela y su puntaje de lectura. Por el contrario, el uso del gran centro de la media
examinaría la relación entre la posición relativa de un estudiante en la muestra en su conjunto sobre el
vocabulario y la puntuación de lectura. Esta última interpretación sería equivalente conceptualmente (pero
no matemáticamente) al uso de la puntuación bruta, mientras que el centrado de la media del grupo no. A lo
largo del resto de este libro, utilizaremos el centrado de medias grandes de forma predeterminada según las
recomendaciones de Hox (2002), entre otras.

A veces, sin embargo, también demostraremos el uso del centrado de media de grupo para ilustrar cómo
proporciona resultados diferentes y para aplicaciones en las que la interpretación del impacto de la posición
relativa de un individuo en su grupo puede ser más útil que la posición relativa de la persona en la muestra
en su conjunto.

2.5 Fundamentos de la estimación de parámetros con MLMs


Hasta ahora, nuestras discusiones sobre la estimación de los parámetros del modelo han sido en el contexto
de los mínimos cuadrados, una técnica que proporciona bases de los mínimos cuadrados ordinarios (OLS) y
modelos lineales relacionados. Sin embargo, a medida que pasamos de estas aplicaciones bastante simples a
modelos más complejos, OLS no suele ser el enfoque óptimo para la estimación de parámetros. En su lugar,
confiaremos en la estimación de máxima verosimilitud (MLE) y la máxima verosimilitud restringida (REML).
En las siguientes secciones, revisamos estos enfoques de estimación desde una vista conceptual,
enfocándonos generalmente en cómo funcionan, lo que suponen acerca de los datos y cómo difieren entre
sí. Para los detalles técnicos, referimos a los lectores interesados a Bryk y Raudenbush (2002) y de Leeuw y
Meijer (2008), que son recursos excelentes para aquellos que desean una cobertura más profunda de estos
métodos.

Nuestro propósito aquí es proporcionar a los lectores una comprensión conceptual que ayude a su aplicación
de las técnicas de MLM en la práctica.

2.5.1 Estimación de máxima verosimilitud


MLE tiene como objetivo principal la estimación de los parámetros del modelo poblacional que maximizan la
probabilidad de obtener la muestra que de hecho obtuvimos. En otras palabras, los valores estimados de los
parámetros deberían maximizar la probabilidad de nuestra muestra en particular. Desde una perspectiva
práctica, la identificación de dichos valores de muestra se realiza mediante una comparación de los datos
observados con los datos predichos por el modelo asociado con los valores de los parámetros.

Cuanto más cerca estén los valores observados y predichos, mayor será la probabilidad de que los datos
observados surjan de una población con parámetros

Cercanos a los utilizados para generar los valores predichos. En la práctica, MLE es una metodología iterativa
en la que el algoritmo busca valores de parámetros que maximicen la probabilidad de los datos observados
(es decir, producen valores predichos que están lo más cerca posible de los valores observados). MLE puede
ser computacionalmente intensivo, particularmente para modelos complejos y muestras grandes.
2.5.2 Estimación de probabilidad máxima restringida
Una variante de MLE conocida como estimación de probabilidad máxima restringida (REML) ha demostrado
ser más precisa que MLE para estimar los parámetros de varianza (Kreft y De Leeuw, 1998). En particular, los
dos métodos difieren con respecto al cálculo de los grados de libertad en la estimación de varianzas. Como
ejemplo simple, una varianza muestral se calcula típicamente al dividir la suma de las diferencias al cuadrado
entre los valores individuales y la media por el número de observaciones menos 1 para obtener una
estimación imparcial. Esta es una estimación de varianza de REML.

En contraste, la varianza MLE se calcula dividiendo la suma de las diferencias al cuadrado por el tamaño total
de la muestra, lo que lleva a una estimación de la varianza más pequeña que la REML y, de hecho, un sesgo
en muestras finitas.

En el contexto del modelado multinivel, REML cuenta el número de parámetros que se estiman en un modelo
al determinar los grados de libertad apropiados para la estimación de los componentes aleatorios, como las
variaciones de parámetros descritas anteriormente. En contraste, MLE no tiene en cuenta esto, lo que lleva a
una subestimación de las variaciones que no se producen con REML. Por esta razón, REML es generalmente
el método preferido para estimar modelos multinivel, aunque para probar los parámetros de varianza (o
cualquier efecto aleatorio), es necesario usar MLE (Snijders & Bosker, 1999). Debemos tener en cuenta que
como el número de grupos de Nivel 2 aumenta, la diferencia en el valor para las estimaciones de MLE y REML
se vuelve muy pequeña (Snijders y Bosker, 1999).

2.6 Supuestos subyacentes de MLMs


Al igual que con cualquier modelo estadístico, el uso apropiado de los MLM requiere que varias suposiciones
acerca de los datos sean ciertas. Si estas suposiciones no se cumplen, las estimaciones del parámetro del
modelo pueden no ser confiables, como sería el caso con la regresión lineal estándar revisada en el Capítulo1.
De hecho, mientras que las suposiciones para MLM difieren un poco de las de los modelos de un solo nivel,
las suposiciones subyacentes MLM son similares a los de los modelos más simples. Esta sección presenta estos
supuestos y sus implicaciones para los investigadores que utilizan MLM. En capítulos posteriores, describimos
métodos para verificar la validez de estos supuestos para conjuntos de datos dados.

• Primero, asumimos que los residuos del Nivel 2 son independientes entre los grupos. En otras
palabras, la suposición es que la intersección aleatoria y la (s) pendiente (s) en el Nivel 2 son
independientes entre sí en los grupos.
• En segundo lugar, se supone que las intercepciones y los coeficientes del Nivel 2 son independientes
de los residuos del Nivel 1, es decir, los errores para las estimaciones a nivel de conglomerado no
están relacionados con los errores a nivel individual.
• En tercer lugar, los residuos del nivel 1 se distribuyen normalmente y tienen variaciones constantes.
Este supuesto es muy similar al que hacemos sobre los residuos en el modelo de regresión lineal
estándar.
• Cuarto, el nivel 2 de intercepción y la pendiente (s) tienen una distribución normal multivariable con
una matriz de covarianza constante. Cada uno de estos supuestos puede evaluarse directamente para
una muestra, como veremos en los próximos capítulos. De hecho, los métodos para verificar los
supuestos de MLM son similares a aquellos para verificar el modelo de regresión que usamos en el
Capítulo 1.

2.7 Resumen de MLM de dos niveles


Hemos descrito los términos específicos de MLM, incluidos los efectos aleatorios de nivel 1 y nivel 2 y los
residuos. Cerraremos este capítulo sobre MLM considerando ejemplos de MLM de dos y tres niveles y el uso
de MLM con datos longitudinales. Esta discusión debería preparar al lector para los siguientes capítulos que
cubren las aplicaciones de R a las estimaciones de MLM específicos. Primero, consideramos el MLM de dos
niveles, partes de las cuales describimos anteriormente en este capítulo. En la ecuación (2.16), consideramos
el modelo de pendientes aleatorias

en el que la variable dependiente yij (rendimiento de lectura) era una función de una variable independiente
xij (puntaje en la prueba de vocabulario) y también un error aleatorio tanto en el nivel del alumno como en
el escolar. Podemos ampliar este modelo un poco más al incluir múltiples variables independientes tanto en
el Nivel 1 (estudiante) como en el Nivel 2 (escuela). Así, por ejemplo, además de determinar la relación entre
el vocabulario de un individuo y los puntajes de lectura, también podemos determinar el grado en que el
puntaje promedio de vocabulario en la escuela en general se relaciona con el puntaje de lectura de un
individuo. Este modelo tiene básicamente dos partes: (1) una que explica la relación entre el vocabulario de
nivel individual (xij) y la lectura y (2) una que explica los coeficientes en el nivel 1 en función del predictor de
nivel 2 o la puntuación promedio de vocabulario (zj). Las dos partes de este modelo se expresan como

La parte adicional de la Ecuación (2.19) es γh1zj, que representa la pendiente para (γh1), y el valor del puntaje
promedio de vocabulario de la escuela (zj). En otras palabras, el rendimiento medio de la escuela se relaciona
directamente con el coeficiente que vincula la puntuación del vocabulario individual con la puntuación de
lectura individual. Para nuestro ejemplo específico, podemos combinar las ecuaciones (2.18) y (2.19) para
obtener una sola ecuación para el MLM de dos niveles.

Cada uno de estos términos modelo se definió anteriormente en este capítulo: γ00 es la intercepción o gran
media del modelo, γ10 es el efecto fijo de la variable x vocabulario) en el resultado, U0j representa la variación
aleatoria para la intercepción entre grupos, y U1j representa la variación aleatoria para la pendiente a través
de grupos.

Las piezas adicionales de la ecuación (2.13) son γ01 y γ11. El γ01 representa el efecto fijo de la variable de
Nivel 2 z (vocabulario promedio) en el resultado y γ11 representa la pendiente y el valor del puntaje promedio
de vocabulario de la escuela. El nuevo término en la Ecuación (2.20) es la interacción de nivel cruzado
γ1001xijzj.

Como su nombre lo indica, la interacción entre niveles es simplemente una interacción de los predictores de
Nivel 1 y Nivel 2. En este contexto, representa la interacción entre el puntaje de vocabulario de un individuo
y el puntaje promedio de vocabulario para su escuela. El coeficiente para este término de interacción, γ1001,
evalúa hasta qué punto la relación entre el puntaje de vocabulario de un estudiante está moderada por la
media de la escuela a la que asistió. Un gran valor significativo para este coeficiente indicaría que la relación
entre el puntaje de la prueba de vocabulario de un individuo y el rendimiento general de lectura depende del
nivel de rendimiento de vocabulario en su escuela.

2.8 Resumen de los MLM de tres niveles


Es completamente posible utilizar tres o más niveles de estructuras de datos con MLM. Sin embargo, debemos
tener en cuenta que los modelos de cuatro niveles y más grandes son raros en la práctica. Para nuestros datos
de logros de lectura en los que el segundo nivel fue la escuela, un posible tercer nivel podría ser el distrito en
el que se encuentra la escuela. En ese caso, tendríamos que tener en cuenta múltiples ecuaciones al expresar
la relación entre el vocabulario y los puntajes en lectura, comenzando en el nivel individual:

El subíndice k representa el grupo de Nivel 3 al que pertenece el individuo.

Antes de formular el resto del modelo, debemos evaluar si las pendientes y las intersecciones son aleatorias
en los Niveles 2 y 3 o solo en el Nivel 1, por ejemplo. Esta decisión siempre debe basarse en la teoría que
rodea las preguntas de investigación, lo que se espera en la población y lo que se revela en los datos empíricos.
Continuaremos con el resto de esta discusión bajo el supuesto de que las intercepciones y pendientes del
Nivel 1 son aleatorias para los Niveles 2 y 3 con el fin de proporcionar una descripción completa del modelo
más complejo posible cuando están presentes tres niveles de estructura de datos. Cuando los coeficientes
del Nivel 1 no son aleatorios en ambos niveles, los términos en los siguientes modelos para los cuales esta
aleatoriedad no está presente simplemente serían eliminados. Abordaremos este problema más
específicamente en el Capítulo 4 cuando analicemos la adaptación de los modelos de tres niveles utilizando
R. Las contribuciones de Nivel 2 y Nivel 3 al MLM descritas en la Ecuación (2.13) aparecen a continuación.
Luego podemos usar una sustitución simple para obtener la expresión de la intersección y pendiente del Nivel
1 en términos de los parámetros del Nivel 2 y del Nivel 3.

A su vez, estos términos pueden ser sustituidos en la Ecuación (2.15) para proporcionar el MLM completo de
tres niveles.

Hay una suposición implícita en esta expresión de la ecuación (2.24) que no hay interacciones de nivel
cruzado, aunque ciertamente pueden ser modeladas en los tres niveles o para cualquier par de niveles. La
ecuación (2.24) expresa los puntajes de los individuos en la prueba de rendimiento en lectura en función de
los componentes aleatorios y fijos de la escuela a la que asisten, el distrito en el que se encuentra la escuela
y sus propias puntuaciones de las pruebas de vocabulario y las variaciones aleatorias asociadas solo con ellos.

Aunque no se incluye en la Ecuación (2.24), también es posible incluir variables en los Niveles 2 y 3, similar
a lo que describimos para la estructura del modelo de dos

2.9 Resumen de los diseños longitudinales y su relación con los MLM

Finalmente, explicaremos brevemente cómo se pueden expresar los diseños longitudinales como MLM. Los
diseños de investigación longitudinales implican simplemente la recopilación de datos de los mismos
individuos en múltiples momentos en el tiempo. Por ejemplo, es posible que tengamos puntuaciones de
rendimiento en lectura para los alumnos evaluados en el otoño y la primavera del año escolar. Con un diseño
de este tipo, podríamos investigar aspectos de las puntuaciones de crecimiento y los cambios en los logros a
lo largo del tiempo. Dichos modelos pueden ubicarse en el contexto de un MLM donde el estudiante
representa la variable del Nivel 2 (grupo), y la administración de la prueba individual se encuentra en el Nivel
1. Luego, simplemente aplicaríamos el modelo de dos niveles descrito anteriormente, incluido el nivel de
estudiante. Las variables que son apropiadas para explicar los logros de lectura.
De manera similar, si los estudiantes están anidados dentro de las escuelas, tendríamos un modelo de tres
niveles, con la escuela como tercer nivel. Podríamos aplicar la Ecuación (2.24) nuevamente con las variables
de nivel de estudiante o escuela pertinentes a la pregunta de investigación.
Un aspecto único del ajuste de datos longitudinales en el contexto de MLM es que los términos de error
pueden tomar formas específicas que no son comunes en otras aplicaciones de análisis multinivel. Estos
términos de error reflejan la forma en que las mediciones realizadas en el tiempo se relacionan entre sí y son
típicamente más complejas que la estructura básica de error descrita hasta ahora. En el Capítulo 5,
consideraremos ejemplos de ajuste de dichos modelos longitudinales con R y centraremos nuestra atención
en estas estructuras de error, cuando cada una es apropiada y cómo se interpretan. Además, tales MLM no
necesitan tomar formas lineales. Pueden adaptarse para adaptarse a tendencias cuadráticas, cúbicas u otras
no lineales a lo largo del tiempo. Estos temas serán discutidos más adelante en el Capítulo 5.

Resumen
El objetivo de este capítulo fue presentar los fundamentos teóricos básicos del modelado multinivel, pero no
proporcionar una discusión técnica exhaustiva sobre estos temas. Una serie de recursos útiles pueden
proporcionar detalles completos y se enumeran en las referencias al final del libro.
Sin embargo, la información en este capítulo debería ser adecuada a medida que avanzamos con el modelado
multinivel utilizando el software R.
Le recomendamos que haga un uso liberal de la información proporcionada aquí mientras lee los capítulos
siguientes. Esto debería proporcionarle una comprensión completa de la salida generada por R que estaremos
examinando. En particular, al interpretar la salida de R, puede ser útil que vuelva a este capítulo para revisar
con precisión qué significa cada parámetro del modelo.
En los siguientes dos capítulos, tomaremos la información teórica de este capítulo y la aplicaremos a
conjuntos de datos reales utilizando dos bibliotecas R diferentes, nlme y lme4, ambas desarrolladas para
realizar análisis multinivel con variables de resultado continuo. En el Capítulo 5, examinaremos cómo se
pueden aplicar estas ideas a los datos longitudinales. Los capítulos 7 y 8 tratarán el modelado multinivel para
variables dependientes categóricas. En el Capítulo 9, divergiremos de los enfoques basados en la probabilidad
descritos aquí y explicaremos el modelado multinivel dentro del marco bayesiano, enfocándonos en las
aplicaciones y aprendiendo cuándo este método puede ser apropiado y cuándo no.
3. Ajuste de modelos de dos niveles en R
En el capítulo anterior, se introdujo el enfoque de modelado multinivel para el análisis de datos anidados
junto con notaciones relevantes y definiciones de intercepciones aleatorias y coeficientes. Dedicaremos este
capítulo a la introducción de los paquetes R para el ajuste de modelos multinivel. En el Capítulo 1,
proporcionamos una descripción general de la función lm () para modelos de regresión lineal. Como se hará
evidente, la estimación de modelos multinivel en R es muy similar a la estimación de modelos lineales de un
solo nivel. Después de proporcionar una breve discusión de los dos paquetes R primarios para ajustar modelos
multinivel para datos continuos, dedicaremos el resto del capítulo a ejemplos extendidos, aplicando los
principios introducidos en el Capítulo 2 usando R.

3.1 Paquetes y funciones para el modelado multinivel en R

Actualmente, las dos bibliotecas principales de R para el diseño de modelos multinivel son nlme y lme4, y
ambas se pueden usar para ajustar modelos básicos y avanzados de multinivel. El paquete lme4 es
ligeramente más nuevo y proporciona una sintaxis más concisa y más flexibilidad. Usando el paquete nlme,
la llamada de función para los modelos de multinivel de resultados continuos que son lineales en sus
parámetros es lme (), mientras que la llamada de función en lme4 es lmer ().
En las siguientes secciones de este capítulo, demostraremos y proporcionaremos ejemplos del uso de estos
dos paquetes para ejecutar modelos básicos de varios niveles en R. La siguiente es la sintaxis básica de estas
dos funciones. Detalles sobre su uso y varias opciones serán proporcionados en los ejemplos.

Para modelos lineales de niveles múltiples, los únicos subcomandos R necesarios para las funciones son la
fórmula (que consiste en efectos fijos y aleatorios) y datos. Los subcomandos restantes se pueden usar para
personalizar modelos y proporcionar resultados adicionales. Este capítulo se enfoca primero en definir
modelos simples de varios niveles y luego muestra opciones para la personalización del modelo y la
verificación de supuestos.

3.2 El paquete nlme


3.2.1 Modelos simples (solo interceptar) de niveles múltiples que utilizan nlme
Para demostrar el uso de R para el ajuste de modelos multinivel, volvemos a la
ejemplo introducido en el Capítulo 2. Específicamente, un investigador quiere determinar hasta qué punto se
pueden usar las puntuaciones de vocabulario para predecir el rendimiento general de la lectura. Dado que
los estudiantes estaban anidados dentro de las escuelas, los modelos estándar de regresión lineal no son
apropiados. En este caso, la escuela es un efecto aleatorio y las puntuaciones de vocabulario son fijas. El
primer modelo que ajustaremos es el modelo nulo que no tiene una variable independiente. Este modelo es
útil para obtener estimaciones de la varianza residual e de intercepción cuando solo se considera la
agrupación por escuela, como en la Ecuación (2.11). La sintaxis lme necesaria para estimar el modelo nulo
aparece a continuación.

Podemos obtener resultados de este modelo escribiendo resumen (Modelo 3.0).

Si bien este es un modelo nulo en el que no hay una variable independiente, proporciona información útil que
nos ayudará a comprender la estructura de los datos. En particular, los valores AIC y BIC que son de interés
principal en este caso serán útiles para comparar este modelo con otros que incluyan una o más variables
independientes, como veremos a continuación. Además, el modelo nulo también proporciona estimaciones
de la varianza entre los individuos σ2 y entre los grupos τ2. A su vez, estos valores se pueden usar para estimar
ρΙ (ICC), como en la Ecuación (2.5). Aquí, el valor sería

Interpretamos este valor en el sentido de que la correlación de los puntajes de las pruebas de lectura entre
los estudiantes dentro de las mismas escuelas es de 0.22 si redondeamos nuestro resultado.
Para ajustar el modelo con el vocabulario como variable independiente usando lme, enviamos la siguiente
sintaxis en R.
En la primera parte de la llamada a la función, definimos la fórmula para los efectos fijos del modelo, muy
similar a la definición del modelo de regresión lineal utilizando lm (). La declaración fixed = geread ~
gevocab esencialmente dice que la puntuación de lectura se predice con el efecto fijo de la puntuación de
vocabulario. La parte aleatoria de la llamada de función define los efectos aleatorios y la estructura de
anidación. Si solo se desea una intercepción aleatoria, la sintaxis de la intercepción es 1. En este ejemplo,
random = ~ 1 | school indica que solo se utilizará un modelo de intercepción aleatoria y que la intercepción
aleatoria varía dentro de la escuela. Esto corresponde a la estructura de datos de los estudiantes anidados
dentro de las escuelas. Al ajustar este odel, que se guarda en el objeto de salida Model3.1, obtenemos la
siguiente salida al ingresar el nombre del objeto de salida.

La salida de la función lme () proporciona estimaciones de parámetros para los efectos fijos y desviaciones
estándar para los efectos aleatorios junto con un resumen del número de unidades de nivel 1 y nivel 2 en la
muestra. Sin embargo, al igual que con la salida de la función lm (), la salida de la función lme () proporciona
información limitada. Si deseamos información más detallada sobre el modelo, incluidas las pruebas de
significación para estimaciones de parámetros y estadísticas de ajuste del modelo, podemos solicitar un
resumen del modelo. El comando summary () proporcionará lo siguiente:
De este resumen obtenemos información de probabilidad de AIC, BIC y registro que se puede usar para
comparaciones de modelos además de pruebas de significación de parámetros. También podemos obtener
una correlación entre la pendiente del efecto fijo y la intercepción del efecto fijo, así como un breve resumen
de los residuales del modelo, que incluyen el mínimo, el máximo y el primero, segundo (mediana, denotado
como Med) y el tercer cuartil.

La correlación de los efectos fijos representa la correlación estimada si tuviéramos muestras repetidas de los
dos efectos fijos (es decir, la intersección y la pendiente para gevocab). A menudo esta correlación no es
particularmente interesante. Desde esta salida, podemos ver que gevocab es un predictor significativo de
geread (t = 61.258, p <0.05), y que a medida que aumenta la puntuación de vocabulario en 1 punto, la
capacidad de lectura aumenta en 0.513 puntos. Podemos comparar el ajuste para este modelo con el del
modelo nulo refiriéndonos a las estadísticas AIC y BIC. Recuerde que los valores más pequeños reflejan un
mejor ajuste del modelo. Para el Modelo 3.1, el AIC y el BIC son 43145.2 y 43174.17, respectivamente. Para
el Modelo 3.0, el AIC y el BIC fueron 46274.31 y 46296.03. Debido a que los valores de ambas estadísticas son
más pequeños para el Modelo 3.1, podemos concluir que proporciona un mejor ajuste a los datos.
Sustancialmente, esto significa que debemos incluir la variable predictiva geread, que también respalda los
resultados de la prueba de hipótesis. Además de los efectos fijos en el Modelo 3.1, también podemos
determinar cuánta variación en geread está presente en las escuelas. Específicamente, el resultado muestra
que después de tener en cuenta el impacto de gevocab, la estimación de la variación en las interceptaciones
entre escuelas es 0.3158785, mientras que la variación dentro de la escuela se estima en 1.940740.
Podemos vincular estos números directamente a nuestra discusión en el Capítulo 2, donde 0 2? = 0.3158785
y σ2 = 1.940740. Además, la intercepción fija general indicada como γ00 en el Capítulo 2 es 2.0233559, que
es la media de geread cuando el gevocab la puntuación es 0
Finalmente, es posible estimar la proporción de varianza en la variable de resultado explicada en cada nivel
del modelo. En el Capítulo 1, vimos que con los modelos de regresión OLS de un solo nivel, la proporción de
la varianza de la variable de respuesta representada por el modelo se expresa como R2. En el contexto del
modelado multinivel, los valores de R2 se pueden estimar para cada nivel del modelo (Snijders & Bosker,
1999). Para el nivel 1, podemos calcular

Este resultado nos dice que el Nivel 1 del Modelo 3.1 explica aproximadamente el 21% de la varianza en la
puntuación de lectura por encima y más allá de la explicada en el modelo nulo. También podemos calcular un
valor de nivel 2 R2:

donde B es el tamaño promedio de las unidades del Nivel 2 (escuelas en este caso). R proporciona el número
de individuos en la muestra (10320) y el número de escuelas (160) para que podamos calcular B como
10320/160 = 64.5. Ahora podemos estimar
El modelo del ejemplo anterior era bastante simple e incorporaba solo un único predictor de Nivel 1. En
muchas aplicaciones, los investigadores utilizan variables predictoras tanto en el Nivel 1 (estudiante) como
en el Nivel 2 (escuela). La incorporación de predictores en niveles más altos de análisis es directa en R y se
maneja exactamente de la misma manera que la incorporación de predictores de Nivel 1.
Por ejemplo, supongamos que además del rendimiento de la prueba de vocabulario de un estudiante, un
investigador también desea determinar si el tamaño de la matrícula escolar (senroll) también produce un
impacto estadísticamente significativo en la puntuación general de lectura. En ese caso, agregar el predictor
de nivel 2 de inscripción escolar resultaría en la siguiente sintaxis R:
Tenga en cuenta que en esta función específica, senroll, se incluye solo en la parte fija del modelo y no en la
parte aleatoria. Por lo tanto, esta variable solo tiene un efecto fijo (promedio) y es la misma en todas las
escuelas. En breve veremos cómo incorporar un coeficiente aleatorio en este modelo.

De estos resultados podemos ver que la inscripción no tuvo una relación estadísticamente significativa con el
rendimiento en lectura. Además, observe algunos cambios menores en las estimaciones de los otros
parámetros del modelo y un cambio bastante grande en la correlación entre el efecto fijo de la pendiente de
gevocab y el efecto fijo de la intersección. La pendiente para el desplazamiento y la intersección estaban
fuertemente correlacionadas negativamente y las pendientes de los efectos fijos no mostraron prácticamente
ninguna correlación. Como se señaló anteriormente, estas correlaciones generalmente no son muy útiles para
explicar la variable dependiente y rara vez se analizan en detalle en los informes de resultados de análisis. Los
valores de R2 para los niveles 1 y 2 aparecen a continuación.

3.2.2 Modelos de coeficientes aleatorios usando nlme


En el Capítulo 2, describimos el modelo de coeficientes aleatorios en el que el impacto de la variable
independiente en el dependiente puede variar a través de los efectos del Nivel 2. En el contexto del problema
de investigación actual, esto significaría que permitimos que el impacto de gevocab en geread varíe de una
escuela a otra.
La incorporación de dichos efectos de coeficientes aleatorios en un modelo multinivel utilizando lme ocurre
en la parte aleatoria de la sintaxis del modelo. Al definir los efectos aleatorios, como se mencionó
anteriormente, 1 representa la intercepción, de modo que si todo lo que deseamos es un modelo de
intercepción aleatoria como en el ejemplo anterior, la sintaxis ~ 1 | school es suficiente. Sin embargo, si
queremos permitir que una pendiente de Nivel 1 varíe al azar, cambiaremos esta parte de la sintaxis (recuerde
que gevocab ya está incluido en la parte fija del modelo). Regresemos al escenario del Modelo 3.1, pero esta
vez permita que tanto la pendiente como la intersección de gevocab varíen aleatoriamente de una escuela a
otra. La sintaxis de este modelo se convertiría ahora.
Este modelo difiere del Modelo 3.1 solo en que el 1 en la línea aleatoria es reemplazado por el nombre de la
variable cuyo efecto queremos que sea aleatorio. Observe que ya no declaramos explícitamente una
intercepción aleatoria en la especificación. Una vez que se define una pendiente aleatoria, la intersección
aleatoria se vuelve implícita, por lo que ya no necesitamos especificarla (es decir, se incluye de forma
predeterminada). Si no queremos la intercepción aleatoria mientras modelamos el coeficiente aleatorio,
incluiríamos un -1 inmediatamente antes de gevocab. La sintaxis aleatoria de pendiente e intercepción
generará el siguiente resumen del modelo:

Number of Observations: 10320


Number of Groups: 160

Un examen de los resultados muestra que el gevocab está relacionado estadísticamente con el geread en
todas las escuelas. El coeficiente estimado 0.5203554 corresponde a γ10 del Capítulo 2, y se interpreta como
el impacto promedio del predictor en el resultado en las escuelas. Además, el valor 0.1389372 representa la
estimación de 1? 2 del Capítulo 2, y refleja la variación en los coeficientes entre las escuelas. Un valor
relativamente mayor de esta estimación indica que el coeficiente varía de una escuela a otra; es decir, la
relación de las variables independientes y dependientes difiere entre las escuelas. Como antes, también
tenemos las estimaciones de 0 2? (0.5316640) y σ2 (1.9146629). En conjunto, estos resultados muestran que
la mayor fuente de variación aleatoria en geread es la variación entre estudiantes dentro de las escuelas, con
una menor variación de las diferencias en la media condicional (intercepción) y el coeficiente de gevocab
entre las escuelas.
Un modelo con dos pendientes aleatorias se puede definir de manera muy similar a la definición de una sola
pendiente. Como ejemplo, supongamos que un investigador está interesado en determinar si la edad de un
estudiante también afecta el rendimiento de la lectura y desea permitir que este efecto varíe de una escuela
a otra. Dicha incorporación de dos pendientes aleatorias puede ser modelada como:
Aquí vemos que la edad está significativamente relacionada con geread (p = 0.0214), con un coeficiente
negativo que indica que los estudiantes mayores tuvieron puntuaciones más bajas. Además, la varianza
aleatoria de los coeficientes para esta variable entre escuelas (0.006388612) es mucho más pequeña que la
de gevocab (0.137974552), lo que nos lleva a concluir que la relación del vocabulario sobre lectura varía más
entre las escuelas que el impacto de la edad.

3.2.3 Interacciones e interacciones de nivel cruzado usando nlme

Las interacciones entre las variables predictoras, particularmente las interacciones de nivel cruzado, pueden
ser muy importantes en la aplicación de modelos multinivel. Las interacciones de nivel cruzado ocurren
cuando el impacto de una variable del Nivel 1 en un resultado (por ejemplo, puntaje de vocabulario) difiere
según el valor del predictor del Nivel 2 (por ejemplo, la inscripción escolar). Las interacciones, ya sea dentro
del mismo nivel o en todos los niveles, son simplemente el producto de dos predictores. Por lo tanto, la
incorporación de interacciones e interacciones de nivel cruzado en el modelado multinivel se realiza de la
misma manera que vimos para la función lm () en el Capítulo 1. A continuación, se incluyen ejemplos para
ajustar un modelo de interacción para dos.
Variables de nivel 1 (Modelo 3.5) y una interacción de nivel cruzado que involucra variables de Nivel 1 y Nivel
2 (Modelo 3.6)

El Modelo 3.5 define un modelo multinivel en el que dos predictores de Nivel 1 (nivel de estudiante)
interactúan entre sí. El Modelo 3.5 define un modelo multinivel con una interacción de nivel cruzado en el
que interactúan un predictor de Nivel 1 (nivel de estudiante) y Nivel 2 (nivel de escuela). Tenga en cuenta que
no existe diferencia en el tratamiento de variables a diferentes niveles al calcular las interacciones.
Podemos ver en la salida del Modelo 3.5 que tanto la edad (t = –3.65, p <0.01) como la interacción (gevocab:
edad) entre la edad y el vocabulario (t = 2.87, p <0.01) son predictores significativos de la lectura. Centrándose
en la interacción, el signo del coeficiente es positivo. Esto indica un efecto de mejora: a medida que aumenta
la edad, la relación entre lectura y vocabulario se fortalece
La salida del Modelo 3.6 tiene una interpretación similar. Cuando la escuela
la inscripción se utiliza en lugar de la edad como predictor, el efecto principal del vocabulario (t = 19.59, p
<0.001) y la interacción entre el vocabulario y la inscripción escolar
(t = –2.51, p <0.05) son predictores significativos del rendimiento en lectura.
Centrándonos en la interacción, dado que el signo en el coeficiente es negativo, llegaríamos a la conclusión
de que existe un efecto amortiguador o inhibidor. En otras palabras, a medida que aumenta el tamaño de la
escuela, la relación entre el vocabulario y el rendimiento en lectura se debilita

3.2.4 Centrar los predictores


Basado en las discusiones en el Capítulo 2, puede ser ventajoso centrar los predictores, especialmente cuando
se incorporan las interacciones. Los predictores de centrado pueden proporcionar una interpretación
ligeramente más sencilla de los términos de interacción y también ayudan a aliviar la multicolinealidad
derivada de la inclusión de los efectos principales y las interacciones en el mismo modelo. Recuerde que el
centrado de una variable implica la resta de un valor medio de cada puntaje en la variable. El centrado de los
predictores se puede lograr a través de R mediante la creación de nuevas variables.
Por ejemplo, volviendo al Modelo 3.5, las variables de gevocab y edad centradas en la media grande se
pueden crear con la siguiente sintaxis:

Después de que se crean las versiones centradas en la media de los predictores, se pueden incorporar al
modelo de la misma manera que se usó anteriormente.
Primero, observe el ajuste idéntico del modelo (compare AIC, BIC y probabilidad de registro) de los modelos
centrados y no centrados. Esta es una buena manera de asegurar que el centrado funcionó. Mirando ahora
los efectos fijos del modelo, vemos algunos cambios en su interpretación. Estas diferencias probablemente
se deben a problemas de multicolinealidad en el modelo original sin centro. La interacción sigue siendo
significativa (t = 2.87, p <0.05) pero ahora vemos un efecto significativo del vocabulario (t = 61.15, p <0.01).
La edad ya no es un predictor significativo (t = –1.73 p> 0.05). Centrándose en la interacción, recuerde que
cuando los predictores están centrados, una interacción puede interpretarse como el efecto de una variable
mientras se mantiene constante la segunda variable. Dado que el signo en la interacción es positivo, el
vocabulario tiene un impacto positivo en la capacidad de lectura si mantenemos la edad constante.

3.3 El paquete lme4


3.3.1 Modelos de intercepción aleatoria usando lme4
La discusión anterior se centró en el uso de la función lme de la biblioteca nlme para ajustar modelos de varios
niveles en R. Como se señaló anteriormente en este capítulo, una segunda función para ajustar dichos
modelos, llamada lme4, está disponible en la biblioteca lmer. Veremos que de alguna manera la sintaxis y la
salida de estas dos funciones son virtualmente idénticas. Sin embargo, exhiben algunas diferencias
fundamentales que debemos considerar al aplicarlas. Nos centraremos en algunas de estas diferencias y sus
implicaciones para la práctica. En particular, el paquete lme4 ofrece una sintaxis un poco más simplificada
para ajustar modelos multinivel. También proporciona un marco más flexible para la definición de
Modelos complejos. En lme4, ajustaríamos el Modelo 3.1 utilizando la siguiente sintaxis

El modelo se define de manera muy similar a como definimos la función lme, donde la variable de resultado
es la suma o combinación lineal de todos los efectos aleatorios y fijos. La única diferencia en el tratamiento
de los efectos fijos y aleatorios es que los efectos aleatorios requieren información sobre la estructura de
anidación (estudiantes dentro de las escuelas en este caso) para el parámetro dentro del cual varían. La
diferencia principal en la sintaxis del modelo entre lme y lmer es que el efecto aleatorio se denota por su
aparición entre paréntesis en lugar de mediante la asignación explícita utilizando la declaración aleatoria. Esta
sintaxis producirá el siguiente resultado:

De esta salida podemos ver que un beneficio obvio del paquete lme4 es que toda la información importante
se presenta sin requerir el uso de un resumen.
declaración. La llamada a la función por sí sola es suficiente para proporcionar estadísticas de ajuste del
modelo, estimaciones de parámetros, pruebas de significación de parámetros, correlaciones de estimaciones
de parámetros, residuos y resúmenes de muestra. También podemos ver que el paquete lme4 incluye la
desviación y los valores de desviación estimada de REML en las estadísticas de ajuste del modelo además del
AIC, BIC y la probabilidad de registro informados en el paquete nlme. Lo que el paquete lme4 no incluye son
los valores de p para los coeficientes del modelo.

Al comparar los resultados de lme y lmer, notamos que mientras tanto los valores t y los valores p que lo
acompañan se informan en el paquete nlme, solo los valores t para efectos fijos se reportan en lme4. La razón
de esta discrepancia en los resultados informados, y específicamente por la falta de valores de p, es algo
compleja y no está al alcance de este libro. Sin embargo, debemos tener en cuenta que el enfoque estándar
para encontrar valores p basados en el uso de la distribución t de referencia, que parece ser el paso
intuitivamente correcto, en realidad no produce valores correctos en muchos casos. Por lo tanto, es necesario
algún enfoque alternativo para obtenerlos. Douglas Bates, el desarrollador de lme4, recomienda el uso de los
métodos Monte Carlo (MCMC) de la cadena de Markov para obtener valores de p para efectos de modelos
mixtos. Revisamos MCMC con mayor detalle en el Capítulo 9 para que los lectores puedan comprender cómo
funciona este método. Podemos decir en este punto que el enfoque MCMC de uso intensivo de computadora
se basa en generar una distribución posterior para cada parámetro del modelo y luego usar
Las distribuciones para obtener valores de p e intervalos de confianza para cada parámetro estimado. Para
obtener los valores p de MCMC y los intervalos de confianza para los objetos lme, debemos instalar los
paquetes coda y languageR y luego usar la siguiente secuencia de comandos para obtener las estadísticas
deseadas para el modelo 3.7

Estos comandos primero cargan las dos bibliotecas que necesitamos. Luego creamos un objeto que contiene
los valores de p y los intervalos de confianza para los diversos términos en el Modelo 3.7 en el objeto
Model3.7.pvals. La función real que utilizamos es pvals.fnc, que forma parte de la biblioteca languageR. A su
vez, esta función llama a la función mcmcsamp desde la biblioteca coda. Se incluyen tres elementos en esta
llamada a la función, incluido el nombre del objeto lmer que contiene los resultados de ajuste del modelo
(Modelo 3.7), el número de conjuntos de datos simulados que queremos muestrear utilizando MCMC (nsim)
y si deseamos resultados de cada uno de estos 10000 dibujos de MCMC para guardar (withMCMC = TRUE).
No es necesario establecer esta última condición en VERDADERO, ya que solo nos interesan las estadísticas
de resumen. Podemos obtener la información relevante para las partes fijas y aleatorias del modelo
escribiendo los siguientes comandos.

A partir de estos resultados, podemos determinar que la puntuación del vocabulario se relacionó
estadísticamente con la puntuación de lectura, y que la escuela de efectos aleatorios y el residual también
fueron diferentes de 0, ya que ninguno de sus intervalos de confianza incluyó 0.
Volviendo a la definición del modelo usando lmer (), los predictores múltiples en cualquier nivel y las
interacciones entre los predictores en cualquier nivel se ingresan nuevamente en el modelo de la misma
manera que se usan las funciones lm () o lme (). La siguiente es la sintaxis para ajustar el Modelo 3.8 usando
lmer

3.3.2 Modelos de coeficiente aleatorio usando lme4


La definición de efectos aleatorios para pendientes en lme4 es muy similar a la de nlme. La única diferencia
real es que, nuevamente, como en el modelo de intercepción aleatoria, los efectos aleatorios se definen entre
paréntesis como una combinación lineal de efectos. Volviendo al Modelo 3.3, podemos expresar el mismo
modelo multinivel usando lmer como:

Debemos tener en cuenta que el enfoque MCMC para obtener resultados de pruebas de hipótesis para
modelos estimados utilizando lmer no está disponible actualmente para modelos de coeficientes aleatorios.
Aunque, en su mayor parte, la sintaxis de lme4 es bastante similar a la de lme para modelos relativamente
simples, la incorporación de múltiples pendientes aleatorias en modelos multinivel que utilizan lme4 es algo
diferente. Los efectos aleatorios discutidos para el paquete nlme asumen niveles correlacionados o anidados.
Los efectos aleatorios en lme4 pueden estar correlacionados o no correlacionados. En este sentido, lme4
proporciona una mayor flexibilidad de modelado. Esta diferencia en la especificación del modelo se comunica
a través de una sintaxis de modelo diferente. Como ejemplo, consulte los Modelos 3.10 y 3.11, cada uno de
los cuales tiene los mismos efectos fijos y aleatorios.
Sin embargo, las pendientes aleatorias en el Modelo 3.10 se tratan como correlacionadas con una de ellas;
en el Modelo 3.11, se especifican como no correlacionados. Esta falta de correlación en el Modelo 3.11 se
expresa al tener términos de efectos aleatorios separados (gevocab | escuela) y (edad | escuela). En
contraste, el Modelo 3.10 incluye ambos efectos aleatorios en un solo término (gevocab + edad | escuela).
Observe la diferencia en cómo se expresan los efectos aleatorios en lmer entre los modelos 3.10 y 3.11. La
salida en el modelo 3.10 proporciona estimaciones idénticas a las del modelo nlme 3.4. Con los efectos
aleatorios, R informa las estimaciones de la variabilidad de la intersección aleatoria, la variabilidad de cada
pendiente aleatoria y las correlaciones entre la intersección aleatoria y las pendientes aleatorias. La salida en
el Modelo 3.11, sin embargo, informa dos conjuntos diferentes de efectos aleatorios no correlacionados.
El primer conjunto informa sobre la variabilidad para la intercepción aleatoria y la variabilidad para la
pendiente aleatoria para el vocabulario y la correlación entre la intersección aleatoria y la pendiente aleatoria
para el vocabulario. El segundo conjunto de efectos aleatorios informa la variabilidad de una segunda
intersección aleatoria, la variabilidad en la pendiente aleatoria para la edad y la correlación entre la
intersección aleatoria y la pendiente aleatoria para la edad. La pendiente aleatoria para el vocabulario y la
pendiente aleatoria para la edad no pueden correlacionarse. Finalmente, podemos obtener los valores de p
y los intervalos de confianza para cada término del modelo utilizando la función pvals.fnc basada en el
enfoque MCMC revisado anteriormente en este capítulo.

3.4 Opciones adicionales


R proporciona varias opciones adicionales para aplicar modelos de múltiples niveles a través de los paquetes
nlme y lme4.

3.4.1 Método de estimación de parámetros


Tanto nlme como lme4 utilizan por defecto la estimación de probabilidad máxima restringida (REML). Sin
embargo, cada paquete también permite el uso de la estimación de máxima verosimilitud (ML) en su lugar.
El modelo 3.12 demuestra la sintaxis para ajustar un modelo multinivel utilizando ML en el paquete nlme.
Para cambiar el método de estimación en nlme, la llamada es method = "ML". El modelo 3.13 muestra la
instalación del mismo modelo multinivel con el paquete lme4. La llamada para designar el uso del ML que se
utilizará es REML = FALSE.

3.4.2 Controles de estimación


A veces, un modelo correctamente especificado no alcanza una solución (convergencia) en la configuración
predeterminada para la convergencia del modelo. Este problema a menudo se puede solucionar cambiando
los controles de estimación predeterminados usando la opción de control. Los problemas de convergencia se
pueden solucionar con frecuencia cambiando el límite de iteración del modelo (maxIter) o cambiando el
optimizador de modelo (opt). Para especificar qué controles se cambiarán, R debe recibir una lista de
controles y sus nuevos valores. Por ejemplo, control = list (maxIter = 100, opt = "optim") cambiará el número
máximo de iteraciones a 100 y el optimizador a optim. Estas opciones de control se colocan en el código R de
la misma manera que la elección del método de estimación (separado del resto de la sintaxis por una coma).
Son los mismos para los paquetes nlme y lme4. Consulte los modelos 3.14 y 3.15 a continuación. Se puede
encontrar una lista completa de controles de estimación en las páginas R helpme y? Lme4
3.4.3 Prueba de Chi cuadrado para comparar el ajuste del modelo
Anteriormente explicamos cómo se pueden comparar los ajustes de varios modelos utilizando los índices de
información AIC y BIC. Sin embargo, estas estadísticas son de naturaleza descriptiva, por lo que no se pueden
probar formalmente las hipótesis sobre el ajuste relativo del modelo. Por lo tanto, si el AIC para un modelo
es 1000.5 y 999 para otro, no podemos saber si la diferencia aparentemente pequeña en el ajuste dentro de
la muestra es verdaderamente representativa de una diferencia en el ajuste en la población general. Por lo
tanto, cuando trabajamos con modelos anidados y un modelo es una versión más restringida (es decir, más
simple) de otro, podríamos probar si el ajuste general de los dos modelos difiere. Dicha prueba de hipótesis
es posible utilizando la prueba de diferencia de chi-cuadrado basada en la estadística de desviación.
Cuando se comparan los ajustes de los modelos anidados, se puede usar la diferencia en los valores de chi-
cuadrado para cada desviación del modelo para comparar el ajuste del modelo. Después de que cada uno de
los modelos en cuestión se haya ajustado, la diferencia en los valores de chi-cuadrado se puede obtener
mediante la llamada a la función anova ().
Para los modelos ejecutados con el paquete nlme, el comando anova () proporcionará comparaciones
precisas solo si se utiliza la estimación de máxima verosimilitud. Para los modelos que se ejecutan utilizando
lme4, el comando anova () funcionará tanto para la máxima verosimilitud como la máxima verosimilitud
restringida. Cuando se usa la máxima probabilidad, los efectos fijos y aleatorios se comparan
simultáneamente. Cuando se usa la probabilidad máxima restringida, solo se comparan los efectos aleatorios.
El siguiente es un ejemplo de comparación de ajuste con la estadística de la diferencia de ji cuadrado para los
modelos 3.1 y 3.2 que se analizaron en detalle anteriormente.

3.4.4 Intervalos de confianza para estimaciones de parámetros


Los lectores que están familiarizados con el modelado multinivel pueden haber notado que ni el resultado de
nlme ni lme4 proporcionan pruebas de significación estadística para la varianza de los efectos aleatorios.
Como se describe en el Capítulo 2, la importancia estadística de los efectos aleatorios proporciona
información muy útil sobre la variabilidad de los grupos en estudio. Utilizando el ejemplo de este capítulo, la
importancia de la intercepción aleatoria indica variaciones en la capacidad de lectura entre las escuelas de la
muestra; es decir, diferentes escuelas exhiben puntuaciones de lectura promedio significativamente
diferentes. De manera similar, una pendiente aleatoria significativa para el vocabulario indicaría una variación
significativa en el impacto del vocabulario en la capacidad de lectura en todas las escuelas. A menudo, esta
información es muy útil al proporcionar información sobre los factores que contribuyen a las diferencias de
puntaje. Sin embargo, los paquetes actuales no ofrecen una opción para probar la importancia de los efectos
aleatorios.
Sin embargo, aún es posible obtener información sobre la importancia de los efectos aleatorios mediante la
creación de intervalos de confianza. Con el paquete nlme, los intervalos de llamada de función () se pueden
utilizar para generar intervalos de confianza del 95% para los efectos fijos y las variaciones de los efectos
aleatorios. Los intervalos de confianza obtenidos para las variaciones de los efectos aleatorios se pueden
utilizar para determinar la importancia de los efectos aleatorios. Por ejemplo, volviendo al Modelo 3.3
cubierto anteriormente en este capítulo, determinamos que el vocabulario era un factor predictivo
significativo de la capacidad de lectura. Sin embargo, no pudimos determinar a partir de la salida del Modelo
3.3 si la variabilidad en la intersección aleatoria o la pendiente aleatoria fue significativamente diferente de
0. Si no es diferente, el resultado indicaría que el rendimiento promedio en lectura y / o la relación entre el
puntaje de vocabulario y el rendimiento en lectura no difirió entre las escuelas. Para determinar el significado
de los efectos aleatorios, podemos utilizar la función de la función intervalos ().

Para la intercepción, el intervalo de confianza del 95% se encuentra entre 0,425 y 0,665.
Por lo tanto, tenemos un 95% de confianza de que el componente de varianza real para la intersección estaba
entre estos dos valores. Asimismo, el intervalo de confianza del 95% para la varianza de pendiente aleatoria
fue entre 0.115 y 0.167. De estos valores, podemos ver que 0 no se encontraba en el intervalo para el efecto
aleatorio, la intercepción o la pendiente. Por lo tanto, podemos concluir que tanto la intersección aleatoria
como la pendiente aleatoria fueron significativamente diferentes de 0.

Das könnte Ihnen auch gefallen