Sie sind auf Seite 1von 9

Anlisis de

VARIANZA

SEMANA 7

[ ESTADSTICA INFERENCIAL ]

ANLISIS DE VARIANZA

HIPTESIS PARA TRES O MAS GRUPOS
ANLISIS DE VARIANZA
DISTRIBUCIN F.
PALABRAS CLAVE
Anlisis de varianza, ANOVA, variacin entre grupos, variacin dentro de grupos, error
experimental, valor F.

INTRODUCCIN

En las lecturas anteriores aprendimos como probar hiptesis en una o dos muestras,
suponga ahora que se quieren comparar tres o mas muestras a con la prueba de igualdad
entre sus medias. Para establecer si tres o ms medias son iguales el mtodo estadstico es
el anlisis de varianza.

Las variables que me manejan al analizar un conjunto de datos pueden ser cualitativas o
cuantitativas. Las segundas como su nombre lo indican, son aquellas que pueden medirse, lo
que no ocurre con las variables cualitativas. Por lo tanto, el volumen mensual de ventas, el
ingreso anual, el nmero de empleados, la produccin diaria, constituyen ejemplos de
variables cuantitativas. Por otro lado el fabricante de neumticos para automvil es una
variable que posiblemente esta relacionada con sus caractersticas de desgaste, pero es
imposible ordenar o hacer un arreglo contnuo de cinco fabricantes. En forma similar, se
podra establecer si el rendimiento promedio de determinada de determinada sustancia
qumica en una operacin de produccin depende del supervisor que dirige el proceso y
tambin si varia en el turno de trabajo. El experimento completo constituye, por lo tanto, un
estudio del efecto de dos variables cualitativas independientes, supervisores y turnos, sobre
el rendimiento de la sustancia qumica.
El anlisis de varianza es una tcnica que se puede utilizar para decidir si las medias de dos o
ms poblaciones son iguales. La prueba se basa en una muestra nica, seleccionada de cada
poblacin. Por ejemplo, suponga, que cuatro grupos de vendedores de una compaa,
fueron sometidos a diferentes programas de entrenamiento, el nmero de personas fue
diferente para cada grupo. Al final del programa de entrenamiento, a cada vendedor le fue
asignada aleatoriamente una zona de ventas de un grupo de zonas que tienen
aproximadamente el mismo potencial de ventas. Se registra el nmero de ventas efectuadas
por cada uno de los vendedores de cada grupo durante la primera semana posterior al
entrenamiento. El anlisis de varianza puede servir para determinar si las diferencias entre las


[ POLITCNICO GRANCOLOMBIANO ]

medias muestrales revelan las verdaderas diferencias entre los cuatro programas de
entrenamiento.
NMERO DE VENTAS EFECTUADAS POR CADA
PERSONA DE CADA GRUPO DE ENTRENAMIENTO


GRUPO DE ENTRENAMIENTO
1

65

75

59

94

87

69

78

89

73

83

67

80

79

81

62

88

81

72

83

87

69

79

76

88

454

459

425

526


Total
Tj
nj


GT: gran total = 454+459+425+526= 1864
n = 6+6+6+6 = 24
k = 4 nmero de grupos.
Las hiptesis nula y alternativa se pueden enunciar como:
H0 :!! = !! = !! = !!
H1: Alguna media es diferente
O lo que es equivalente en este caso:
H0: Los cuatro programas de entrenamiento tienen el mismo efecto sobre las ventas.
H1: Algn programa de entrenamiento tiene un efecto diferente sobre las ventas.
La tcnica utilizada para analizar los datos de este tipo de experimentos es conocida como
Anlisis de varianza.
Un criterio para establecer si los promedios no se pueden considerar como iguales se basa en la
comparacin entre mediciones de la dispersin externa y la dispersin interna. Las dispersiones
se pueden medir con varianzas, las cuales se llamaran varianzas internas o varianza dentro de


[ ESTADSTICA INFERENCIAL ]

los grupos y externas o varianzas entre grupos respectivamente. Vale la pena destacar el hecho
de que una comparacin de promedios (medidas de tendencia central) se realiza utilizando
como criterio una comparacin de varianzas (medida de dispersin).
La dispersin interna se define como aquella variacin propia de cada grupo teniendo en
cuenta las distancias que separan a los datos del promedio del grupo.
La dispersin externa es la variacin existente entre los promedios de los diferentes grupos.
Para relacionarlo con el experimento en cuestin digamos que la variacin interna se puede
deber a las caractersticas inherentes a cada unidad experimental o al mismo instrumento de
medida que se est utilizando, mientras que la variacin externa est asociada a los diversos
programas de entrenamiento, a la que fueron sometidos los trabajadores en esa empresa.
La suma de estas dos varianzas nos da una varianza total, y los resultados se resumen en una
tabla de Anlisis de Varianza.

VARIANZA ENTRE
VARIANZA DENTRO
VARIANZA TOTAL =
GRUPOS +
DE GRUPOS
El numerador de la varianza es una suma de cuadrados entonces se dice que:
SCT = SCTR + SCE
SCT: suma de cuadrados totales.
SCTR: suma de cuadrados entre grupos o de tratamientos.
SCE : suma de cuadrados dentro de grupos o del error.
Las frmulas para la obtencin de estas variaciones son:
Suma de Cuadrados

Fuente de
Variacin

TRATAMIENTO
S (BETWEEN)

G T2

ni
n
i =1

ni

DENTRO DE
GRUPOS
(WITHIN)

T i2

2
ij

(S C T R )

T i2

X - n
j =1 i =1


[ POLITCNICO GRANCOLOMBIANO ]

i =1

(S C E )

Grados de
libertad

Media de
Cuadrados

Razn de
Varianza F

k - 1

S C TR
= M C TR
k 1

SCE
= M C E
n k

n - k


M C TR
~ F (k -1 )(n -k)
M CE

ni

TOTAL:

i =1

X ij2 -

G T2
n

(S C T)

n - 1

La comparacin de estas varianzas tienen una distribucin asociada conocida como la


distribucin F la cual trabaja con dos tipos de grados de libertad: uno con el numerador y otro
con el denominador. El valor F permite establecer si existe un efecto significativo del factor
sobre la caracterstica estudiada.
La tabla de anlisis de varianza se presenta en la siguiente forma:
TABLA DE ANLISIS DE VARIANZA ANOVA
ANLISIS DE VARIANZA DE UN FACTOR
Fuente de

Suma de

Grados de
Libertad

Cuadrado

Razn F

Variacin

Cuadrados

Medio

Entre

Grupos.

SCTR

k 1

MCTR

MCTR/MCE

Dentro de grupos
o del Error.

SCT

n k

MCE

Total:

SCT

n 1

Fuente de

TABLA DE ANLISIS DE VARIANZA ANOVA


ANLISIS DE VARIANZA DE UN FACTOR
Suma de
Grados de

Variacin

Cuadrados

Libertad

Cuadrado medio

Razn F

Dentro de

912,3333

304,1111

Grupos.
Dentro de grupos
Error.

1041 20

52,05
1953,3333

33

5,8426


[ ESTADSTICA INFERENCIAL ]

Total:

El valor de la tabla con un nivel de significancia del 5% y grados de libertad 3 en el numerador y
20 en el denominador es de 3,10


Al comparar el valor de la tabla de anlisis de varianza (5,84) con respecto al valor de la tabla F
(3,10) cae en la zona de rechazo, por lo tanto con un nivel de significancia del 5% se puede decir
que hay diferencias significativas en el efecto que tienen los diferentes programas de
entrenamiento, en las ventas.
Los resultados se pueden calcular utilizando el procedimiento de anlisis de datos en Excel.


[ POLITCNICO GRANCOLOMBIANO ]


Los resultados obtenidos se muestran en la siguiente forma:


EJEMPLO DOS:

Si trabajamos nuevamente con el ejemplo dos, supongamos que se desea experimentar si tres
dispositivos especiales en los carburadores para automviles tienen el mismo efecto con
relacin al ahorro en consumo de gasolina. La variable respuesta es el kilometraje recorrido por
galn. Para el experimento se seleccionaron tres dispositivos y un carburador estndar sin
dispositivo.
La unidad de experimentacin es un automvil, se escogieron cinco autos entre los disponibles.
Los datos obtenidos como kilometraje por galn se muestran en la siguiente tabla:


[ ESTADSTICA INFERENCIAL ]

CARBURADOR
--------------- --------------------
Estndar A B C
29.12 30.24 30.56 32.64
43.84 44.64 44.96 47.84
56.96 55.84 57.28 61.12
23.68 24.32 23.84 27.68
40.64 39.68 40.96 43.04
------------------------------------
Llas hiptesis correspondientes son:
Ho : No existen diferencias significativas en el consumo de gasolina con los tres dispositivos
especiales en los carburadores.
H1 : Si existen diferencias significativas en el consumo de gasolina con los tres dispositivos
especiales en los carburadores.
La tabla de Anlisis de varianza para esta hiptesis queda en la forma:

Fuente de

TABLA DE ANLISIS DE VARIANZA ANOVA


COMPARACION DISPOSITIVO EN CARBURADORES

Suma de
Grados de
Cuadrado medio

Razn F

Variacin

Cuadrados

Libertad

Dentro de

Tratamientos

43.657

14.55232

Error

26545459

16

165.90912

Total

2698.2029

19


F= 0.088


Con un nivel de significancia del 5% que se puede concluir con base en los resultados del anlisis
de varianza?
Obtenga la tabla de anlisis de varianza utilizando las herramientas de Excel y compare los
resultados.


[ POLITCNICO GRANCOLOMBIANO ]

BIBLIOGRAFA

FREUND, John E., MILLER, Irwin y MILLER, Marylees. Estadstica Matemtica con
aplicaciones. 6ed. Madrid Prentice Hall, 2000.
GUTIERREZ, Humberto y DE LA VARA, Romn. Control estadstico de Calidad y Seis Sigma
(6s). Mxico: McGraw-Hill, 2005.
KENNET, Ron S., y ZACKS, Shelemyahu. Estadstica Industrial Moderna. Barcelona, Thomson,
2000.
MONTGOMERY, Douglas C. y RUNGER, George C. Probabilidad y Estadstica aplicadas a la
Ingeniera. 2ed. Mxico: Limusa, 2002.
NEWBOLD. Paul. Estadstica para los Negocios y la Economa. 4ed. Madrid Prentice Hall, 1988.
WALPOLE Ronal, E., MYERS, Raymond H. y MYERS, Sharon L. Probabilidad y Estadstica para
Ingenieros. 6ed. Madrid Prentice Hall, 1998.


[ ESTADSTICA INFERENCIAL ]

Das könnte Ihnen auch gefallen