Sie sind auf Seite 1von 8

El ANOVA est diseado especficamente para probar si dos o ms poblaciones tienen la

misma media. El procedimiento se puede utilizar para determinar si cuando se aplica un


tratamiento en particular a una poblacin, este tendr un impacto significativo en su media.
Consideremos como ejemplo el inters en medir los efectos relativos en la produccin de los
empleados de tres programas de capacitacin. Estos tres tipos de formacin son: 1)
autodidactas, 2) impartido por pc y 3) enseanza por maestro.
Las unidades experimentales son los objetos que reciben el tratamiento, en este caso son los
empleados los que reciben el tratamiento. El factor es la variable cuyo impacto en tales
unidades experimentales se desea medir, en este caso es la capacitacin el factor de inters,
el aprendizaje. Y finalmente los tres tipos de capacitacin constituyen los tratamientos o
niveles del factor, que en este caso es la capacitacin.
Este es un modelo de efectos fijos, pues los programas fueron seleccionados o se fijaron antes
de realizar el estudio. Se sabe cul de los tres programas se desean probar desde el comienzo
del estudio.
Modelos de efectos fijos, en el cual se selecciona tratamientos especficos o se fijan antes del
estudio.
Modelos de efectos aleatorios, en el cual los niveles (tratamientos) utilizados en el estudio se
seleccionan aleatoriamente de una poblacin de niveles posibles.
Para la aplicacin de la ANOVA son esenciales tres suposiciones:
1. todas las poblaciones involucradas son normales.
2. todas las tienen la misma varianza.
3. las muestras se seleccionan independientemente.
Si un nmero de tratamientos se designa como c, el conjunto de hiptesis de prueba es:
H
0
:
1
=
2
=
3
=
c

H
A
: No todas las medias son iguales.
1

2

Regresando al ejemplo de los programas, el director de la empresa sedea determinar si los tres
programas de capacitacin distintos tienen efectos diferentes en los niveles de productividad
de los empleados. Al trmino, a cada empleado responde un examen para determinar su
competencia. Se colocan 4 empleados en el primer programa y 5 en los dos restantes. Cada
uno se trata de manera independiente como muestras separadas. Los puntajes de la prueba
aparecen en la tabla siguiente:



TRATAMIENTOS
PROG 1 PROG 2 PROG 3
85 80 82
72 84 80
83 81 85
80 78 90
82 88

=80

=81

=85

La gran media de todas las observaciones del experimento es

= 82.14
Si de un tratamiento al otro la variacin es significativamente alta, puede concluirse que los
tratamientos tienen efectos diferentes en las poblaciones. En nuestra tabla identificamos 3
tipos de variacin o fuentes de variacin. Una de ellas es la suma de las otras dos, ya que si
promediamos la media de los tratamientos no sera la misma que la gran media calculada
anteriormente (

= 82).
1. Existe variacin entre el nmero total de las 14 observaciones. No todos los 14 empleados
tuvieron el mismo puntaje en el examen. Esta se llama variacin total.
2. existe variacin entre los diferentes tratamientos (muestras). Los empleados del programa 1
no tuvieron el mismo puntaje que los del programa 2 y 3. Esto se denomina variacin entre
muestras.
2. existe variacin dentro de un tratamiento dado (muestra). No todos los empleados de la
muestra (tratamiento) tuvieron el mismo puntaje. Esto se denomina variacin dentro de la
muestra.
Efecto del tratamiento. Como las muestras diferentes tienen tratamientos distintos, la
variacin entre las muestras puede ser producida por los efectos de tratamientos diferentes.
Si la variacin entre las muestras (B/S) es significativamente mayor que la variacin dentro de
las muestras (W/S), un fuerte efecto de tratamiento est presente.
(B/S) (W/S) = variacin diferencia, por lo tanto esta variacin en la diferencia es lo que mide
el ANOVA. Es una relacin de la variacin entre muestras con la variacin dentro de las
muestras. Si los tratamientos diferentes tienen efectos diferentes, la variacin entre muestras
crecer, haciendo que la razn aumente. Esta razn se basa en la razn F, donde esta denota la
razn de la variacin entre muestras y la variacin dentro de las muestras.
La razn F, cuando las medias poblacionales son diferentes, el efecto del tratamiento est
presente y las desviaciones entre las muestras sern grandes comparadas con la desviacin del
error dentro de una muestra. Por tanto, el valor F aumentara, lo cual es una razn de la
variacin del tratamiento y de la variacin del error.
La variacin total es igual a la variacin producida por los tratamientos diferentes, ms la
variacin producida por los elementos del error aleatorios dentro de los tratamientos, como lo
es la destreza, la suerte y la motivacin. Es decir:
Variacin total = variacin del tratamiento + variacin del error.
La suma de cuadrados.
El conocimiento de estas tres fuentes de variacin permite la divisin de la suma de cuadrados,
un procedimiento que es necesario para el anlisis de la varianza. Cada uno de los tres tipos
produce una suma de cuadrados.
1. suma de cuadrados total (SCT)
2. suma d cuadrados de los tratamientos (SCTR)
3. suma de cuadrados del error (SCE)
SCT= SCTR + SCE

Varianza muestral S
2
= (X
i
-

)
2
/ n 1
Suma de cuadrados total SCT =

)
2

La gran media se le resta a cada una de las 14 observaciones. Las diferencias se elevan al
cuadrado y se suman.
Suma de cuadrados de los tratamientos SCTR = (

j
-

)
2

Suma de cuadrados del error SCE = (X
ij
-

j
)
2



TRATAMIENTOS


PROG 1 PROG 2 PROG 3


85 80 82


72 84 80


83 81 85


80 78 90

promedio de
las
observacin
82 88
82,14
promedio de
cada
tratamiento


80 81 85 82,00

-2,14 -1,14 2,86


4,59 1,31 8,16 14,06


18,37 6,53 40,82 65,71



programa1 programa2 programa3 Global de observacin


Media 80 Media 81 Media 85 Media 82,14
Error tpico 2,86 Error tpico 1 Error tpico 1,84 Error tpico 1,18
Mediana 81,5 Mediana 81 Mediana 85 Mediana 82
Moda #N/A Moda #N/A Moda #N/A Moda 80
Desv est 5,72 Desv est 2,24 Desv est 4,12 Desv est 4,40
Varianza 32,67 Varianza 5 Varianza 17 Varianza 19,36
Curtosis 1,5 Curtosis 0,2 Curtosis -1,89 Curtosis 1,41
Coef de asim -1,29 Coef de asim 0 Coef de asim 0,00 Coef de asim -0,43
Rango 13 Rango 6 Rango 10 Rango 18
Mnimo 72 Mnimo 78 Mnimo 80 Mnimo 72
Mximo 85 Mximo 84 Mximo 90 Mximo 90
Suma 320 Suma 405 Suma 425 Suma 1150
Cuenta 4 Cuenta 5 Cuenta 5 Cuenta 14
Niv de
conf(95%) 9,09
Niv de
conf(95%) 2,78
Niv de
conf(95%) 5,12
Niv de
conf(95%) 2,54


OBSERV Xi - Xmedia (Xi - Xmedia)2 X
ij
- Xprom
j
(X
ij
- Xprom
j
)
2

85
3 8,16 5 25
72
-10 102,88 -8 64
83
1 0,73 3 9
80
-2 4,59 0 0
80
-2 4,59 -1 1
84
2 3,45 3 9
81
-1 1,31 0 0
78
-4 17,16 -3 9
82
0 0,02 1 1
82
0 0,02 -3 9
80
-2 4,59 -5 25
85 3 8,16 0 0
90 8 61,73 5 25
88
6 34,31 3 9

251,71

186

SCT = SCTR + SCE donde 251.7 = 65.71 + 186


Cuadros medios.
Una suma de cuadrados dividida por sus grados de libertad produce un cuadrado medio. En
este aspecto, al calcular SCT, se utiliz todo el conjunto de datos de n observaciones para
calcular un valor. Ese valor nico era la gran media

, la cual representa una restriccin. De


aqu que para SCT se tiene n - 1 grados de libertad. (14 -1 = 13)
El clculo de SCTR involucra el uso de c=3 medias mustrales de las cuales se puede calcular la
gran media. Las medias mustrales se ven como puntos de datos individuales y la gran media
se toma como restriccin. SCTR tiene entonces c 1 grados de libertad. Donde c son el nmero
de tratamientos. (3 1 = 2)
Finalmente, se calcul SCE sumando la desviacin de n = 14 observaciones de c= 3 medias
mustrales. Por tanto, SCE tiene n c grados de libertad. (14 3 = 11)
Entonces: gl SCT = gl SCTR + gl SCE donde; n-1 = c-1 + n-c
Y con esto se halla el cuadrado medio total CMT (que viene siendo el cuadrado medio de SCT).
CMT = SCT / n 1
El cuadrado medio del tratamiento CMTR es CMTR = SCTR / c 1
El cuadrado medio del error CME es CME = SCE / n c
Y calculamos la informacin con las formulas al momento, obtenemos esta tabla que
calculamos con ayuda del Excel.
DATOS VALORES
SCT 251,71
SCTR 65,71
SCE 186
CMT 19,36
CMTR 32,86
CME 16,91
GL SCT 13
GL SCTR 2
GL SCE 11

Estas tres cuadrados medios estn calculados a partir de la frmula de la varianza, son sumas
de cuadrados divididas por sus grados de libertad, y como tales son varianzas. Es la razn de
las dos ltimas CMTR y CME, que se utiliza como base del anlisis de varianza para probar la
hiptesis respecto a la igualdad de las medias. Esta razn se ajusta a la distribucin F, y se
expresa como:
F = CMTR / CME , de donde F = 32.86 / 16.91 = 1.94
CMTR mide la variacin entre tratamientos. Si los tratamientos tienen efectos diferentes,
CMTR lo reflejara a travs de su incremento. Por tanto, F se vuelve significativamente grande
porque CMTR excede a CME por una cantidad grande, y se reconoce que los efectos del
tratamiento probablemente existen. Es probable que tratamientos diferentes tengan efectos
diferentes en las medias de sus poblaciones respectivas, y podra rechazarse la hiptesis nula
donde H
0
:
1
=
2
=
3

El valor critico de F que es considerado significativamente grande puede encontrarse en la
tabla F, donde queremos probar la hiptesis a un nivel del 5%, donde se convierte = 0.05 que
es el nivel de significancia de la prueba. Por conveniencia al buscar el valor critico de F en la
tabla seguimos el siguiente orden donde F
a, gln, gld
= 3.98



Ahora realizando con el minitab 16 este problema de ms de da y medio de explicacin, lo
realizaremos en menos de 1 minuto.
Abrimos una hoja nueva en el minitab, colocamos los valores de los tratamientos tal y como
estn, nos vamos al men, seleccionamos estadsticas, ANOVA, y de un factor des apilado. Para
este caso, si hubiramos colocado las observaciones en una sola columna, hubisemos puestos
el nmero de tto en una columna alterna para identificarlo en el minitab como TTO y
VALORES, seleccionamos ANOVA, de un solo factor y pegamos en respuesta los valores y
factor, pegamos los tratamientos y aceptamos. Lo mismo para los residuos y las grficas.
Posteriormente, en respuestas colocamos las tres columnas de los tratamientos y
seleccionamos la casilla de residuos, y en significancia el 95% que en este caso es lo que nos
piden. En graficas seleccionamos tres en uno y le damos en aceptar. Y nos arroja la siguiente
informacin, un ANOVA
ANOVA unidireccional: PROG 1; PROG 2; PROG 3

Fuente GL SC CM F P
Factor 2 65,7 32,9 1,94 0,189
Error 11 186,0 16,9
Total 13 251,7

Como observamos los grados de libertad que calculamos ya nos lo da por default el minitab, la
suma de cuadrados tambin, y los cuadros medios necesarios para calcular F, pero ya tambin
realiza la razn F, todo en menos de 1 minuto. Nos olvidamos de la tabla de valores y formulas.
Ahora bien para la grfica de la probabilidad necesitamos realizar lo siguiente, nos da la
siguiente informacin el minitab
ICs de 95% individuales para la media
basados en Desv.Est. agrupada
Nivel N Media Desv.Est. ----+---------+---------+---------+-----
PROG 1 4 80,000 5,715 (------------*------------)
PROG 2 5 81,000 2,236 (----------*-----------)
PROG 3 5 85,000 4,123 (-----------*----------)
----+---------+---------+---------+-----
77,0 80,5 84,0 87,5

Desv.Est. agrupada = 4,112

Y los valores devueltos de los residuos:
PROG 1 PROG 2 PROG 3 RESID1 RESID2 RESID3
85 80 82 5 -1 -3
72 84 80 -8 3 -5
83 81 85 3 0 0
80 78 90 0 -3 5
82 88 1 3
Los residuos son las diferencias de cada observacin con su propia media, lo que realizamos
para calcular el SCE, y posteriormente el CME.
Entonces regresamos al minitab, para no realizar la grfica a mano, buscar la tabla de valores F
el valor crtico, y colocar el valor de nuestra F calculada, nos vamos al minitab, en el men
grficas, y graficas de distribucin de probabilidad, seleccionamos de dos colas y aceptamos.
Seleccionamos el tipo de distribucin que para nuestro caso es F, en grados del numerador
colocamos el de los TR, que es 2 en nuestra ANOVA, y el gl del denominador van los del error
que es 11, aceptamos y nos da la siguiente informacin:
1,0
0,8
0,6
0,4
0,2
0,0
X
D
e
n
s
i
d
a
d
3,982
0,05
0
F; df1=2; df2=11
Grfica de distribucin de F

No rechazar H0 si F 3.982, rechazar si F es 3.98

Valor F = 1,94

Das könnte Ihnen auch gefallen