Beruflich Dokumente
Kultur Dokumente
VARIANZA
SEMANA 7
[ ESTADSTICA INFERENCIAL ]
ANLISIS
DE
VARIANZA
HIPTESIS
PARA
TRES
O
MAS
GRUPOS
ANLISIS
DE
VARIANZA
DISTRIBUCIN
F.
PALABRAS
CLAVE
Anlisis
de
varianza,
ANOVA,
variacin
entre
grupos,
variacin
dentro
de
grupos,
error
experimental,
valor
F.
INTRODUCCIN
En
las
lecturas
anteriores
aprendimos
como
probar
hiptesis
en
una
o
dos
muestras,
suponga
ahora
que
se
quieren
comparar
tres
o
mas
muestras
a
con
la
prueba
de
igualdad
entre
sus
medias.
Para
establecer
si
tres
o
ms
medias
son
iguales
el
mtodo
estadstico
es
el
anlisis
de
varianza.
Las
variables
que
me
manejan
al
analizar
un
conjunto
de
datos
pueden
ser
cualitativas
o
cuantitativas.
Las
segundas
como
su
nombre
lo
indican,
son
aquellas
que
pueden
medirse,
lo
que
no
ocurre
con
las
variables
cualitativas.
Por
lo
tanto,
el
volumen
mensual
de
ventas,
el
ingreso
anual,
el
nmero
de
empleados,
la
produccin
diaria,
constituyen
ejemplos
de
variables
cuantitativas.
Por
otro
lado
el
fabricante
de
neumticos
para
automvil
es
una
variable
que
posiblemente
esta
relacionada
con
sus
caractersticas
de
desgaste,
pero
es
imposible
ordenar
o
hacer
un
arreglo
contnuo
de
cinco
fabricantes.
En
forma
similar,
se
podra
establecer
si
el
rendimiento
promedio
de
determinada
de
determinada
sustancia
qumica
en
una
operacin
de
produccin
depende
del
supervisor
que
dirige
el
proceso
y
tambin
si
varia
en
el
turno
de
trabajo.
El
experimento
completo
constituye,
por
lo
tanto,
un
estudio
del
efecto
de
dos
variables
cualitativas
independientes,
supervisores
y
turnos,
sobre
el
rendimiento
de
la
sustancia
qumica.
El
anlisis
de
varianza
es
una
tcnica
que
se
puede
utilizar
para
decidir
si
las
medias
de
dos
o
ms
poblaciones
son
iguales.
La
prueba
se
basa
en
una
muestra
nica,
seleccionada
de
cada
poblacin.
Por
ejemplo,
suponga,
que
cuatro
grupos
de
vendedores
de
una
compaa,
fueron
sometidos
a
diferentes
programas
de
entrenamiento,
el
nmero
de
personas
fue
diferente
para
cada
grupo.
Al
final
del
programa
de
entrenamiento,
a
cada
vendedor
le
fue
asignada
aleatoriamente
una
zona
de
ventas
de
un
grupo
de
zonas
que
tienen
aproximadamente
el
mismo
potencial
de
ventas.
Se
registra
el
nmero
de
ventas
efectuadas
por
cada
uno
de
los
vendedores
de
cada
grupo
durante
la
primera
semana
posterior
al
entrenamiento.
El
anlisis
de
varianza
puede
servir
para
determinar
si
las
diferencias
entre
las
[ POLITCNICO GRANCOLOMBIANO ]
medias
muestrales
revelan
las
verdaderas
diferencias
entre
los
cuatro
programas
de
entrenamiento.
NMERO
DE
VENTAS
EFECTUADAS
POR
CADA
PERSONA
DE
CADA
GRUPO
DE
ENTRENAMIENTO
GRUPO
DE
ENTRENAMIENTO
1
65
75
59
94
87
69
78
89
73
83
67
80
79
81
62
88
81
72
83
87
69
79
76
88
454
459
425
526
Total
Tj
nj
GT:
gran
total
=
454+459+425+526=
1864
n
=
6+6+6+6
=
24
k
=
4
nmero
de
grupos.
Las
hiptesis
nula
y
alternativa
se
pueden
enunciar
como:
H0
:!! = !! = !! = !!
H1:
Alguna
media
es
diferente
O
lo
que
es
equivalente
en
este
caso:
H0:
Los
cuatro
programas
de
entrenamiento
tienen
el
mismo
efecto
sobre
las
ventas.
H1:
Algn
programa
de
entrenamiento
tiene
un
efecto
diferente
sobre
las
ventas.
La
tcnica
utilizada
para
analizar
los
datos
de
este
tipo
de
experimentos
es
conocida
como
Anlisis
de
varianza.
Un
criterio
para
establecer
si
los
promedios
no
se
pueden
considerar
como
iguales
se
basa
en
la
comparacin
entre
mediciones
de
la
dispersin
externa
y
la
dispersin
interna.
Las
dispersiones
se
pueden
medir
con
varianzas,
las
cuales
se
llamaran
varianzas
internas
o
varianza
dentro
de
[ ESTADSTICA INFERENCIAL ]
los
grupos
y
externas
o
varianzas
entre
grupos
respectivamente.
Vale
la
pena
destacar
el
hecho
de
que
una
comparacin
de
promedios
(medidas
de
tendencia
central)
se
realiza
utilizando
como
criterio
una
comparacin
de
varianzas
(medida
de
dispersin).
La
dispersin
interna
se
define
como
aquella
variacin
propia
de
cada
grupo
teniendo
en
cuenta
las
distancias
que
separan
a
los
datos
del
promedio
del
grupo.
La
dispersin
externa
es
la
variacin
existente
entre
los
promedios
de
los
diferentes
grupos.
Para
relacionarlo
con
el
experimento
en
cuestin
digamos
que
la
variacin
interna
se
puede
deber
a
las
caractersticas
inherentes
a
cada
unidad
experimental
o
al
mismo
instrumento
de
medida
que
se
est
utilizando,
mientras
que
la
variacin
externa
est
asociada
a
los
diversos
programas
de
entrenamiento,
a
la
que
fueron
sometidos
los
trabajadores
en
esa
empresa.
La
suma
de
estas
dos
varianzas
nos
da
una
varianza
total,
y
los
resultados
se
resumen
en
una
tabla
de
Anlisis
de
Varianza.
VARIANZA
ENTRE
VARIANZA
DENTRO
VARIANZA
TOTAL
=
GRUPOS
+
DE
GRUPOS
El
numerador
de
la
varianza
es
una
suma
de
cuadrados
entonces
se
dice
que:
SCT
=
SCTR
+
SCE
SCT:
suma
de
cuadrados
totales.
SCTR:
suma
de
cuadrados
entre
grupos
o
de
tratamientos.
SCE
:
suma
de
cuadrados
dentro
de
grupos
o
del
error.
Las
frmulas
para
la
obtencin
de
estas
variaciones
son:
Suma
de
Cuadrados
Fuente
de
Variacin
TRATAMIENTO
S
(BETWEEN)
G T2
ni
n
i =1
ni
DENTRO
DE
GRUPOS
(WITHIN)
T i2
2
ij
(S C T R )
T i2
X - n
j =1 i =1
[ POLITCNICO GRANCOLOMBIANO ]
i =1
(S C E )
Grados
de
libertad
Media
de
Cuadrados
Razn
de
Varianza
F
k - 1
S C TR
= M C TR
k 1
SCE
= M C E
n k
n - k
M C TR
~ F (k -1 )(n -k)
M CE
ni
TOTAL:
i =1
X ij2 -
G T2
n
(S C T)
n - 1
Suma de
Grados
de
Libertad
Cuadrado
Razn F
Variacin
Cuadrados
Medio
Entre
Grupos.
SCTR
k 1
MCTR
MCTR/MCE
Dentro
de
grupos
o
del
Error.
SCT
n k
MCE
Total:
SCT
n 1
Fuente de
Variacin
Cuadrados
Libertad
Cuadrado medio
Razn F
Dentro de
912,3333
304,1111
Grupos.
Dentro
de
grupos
Error.
1041
20
52,05
1953,3333
33
5,8426
[ ESTADSTICA INFERENCIAL ]
Total:
El
valor
de
la
tabla
con
un
nivel
de
significancia
del
5%
y
grados
de
libertad
3
en
el
numerador
y
20
en
el
denominador
es
de
3,10
Al
comparar
el
valor
de
la
tabla
de
anlisis
de
varianza
(5,84)
con
respecto
al
valor
de
la
tabla
F
(3,10)
cae
en
la
zona
de
rechazo,
por
lo
tanto
con
un
nivel
de
significancia
del
5%
se
puede
decir
que
hay
diferencias
significativas
en
el
efecto
que
tienen
los
diferentes
programas
de
entrenamiento,
en
las
ventas.
Los
resultados
se
pueden
calcular
utilizando
el
procedimiento
de
anlisis
de
datos
en
Excel.
[ POLITCNICO GRANCOLOMBIANO ]
Los
resultados
obtenidos
se
muestran
en
la
siguiente
forma:
EJEMPLO
DOS:
Si
trabajamos
nuevamente
con
el
ejemplo
dos,
supongamos
que
se
desea
experimentar
si
tres
dispositivos
especiales
en
los
carburadores
para
automviles
tienen
el
mismo
efecto
con
relacin
al
ahorro
en
consumo
de
gasolina.
La
variable
respuesta
es
el
kilometraje
recorrido
por
galn.
Para
el
experimento
se
seleccionaron
tres
dispositivos
y
un
carburador
estndar
sin
dispositivo.
La
unidad
de
experimentacin
es
un
automvil,
se
escogieron
cinco
autos
entre
los
disponibles.
Los
datos
obtenidos
como
kilometraje
por
galn
se
muestran
en
la
siguiente
tabla:
[ ESTADSTICA INFERENCIAL ]
CARBURADOR
---------------
--------------------
Estndar
A
B
C
29.12
30.24
30.56
32.64
43.84
44.64
44.96
47.84
56.96
55.84
57.28
61.12
23.68
24.32
23.84
27.68
40.64
39.68
40.96
43.04
------------------------------------
Llas
hiptesis
correspondientes
son:
Ho
:
No
existen
diferencias
significativas
en
el
consumo
de
gasolina
con
los
tres
dispositivos
especiales
en
los
carburadores.
H1
:
Si
existen
diferencias
significativas
en
el
consumo
de
gasolina
con
los
tres
dispositivos
especiales
en
los
carburadores.
La
tabla
de
Anlisis
de
varianza
para
esta
hiptesis
queda
en
la
forma:
Fuente de
Razn F
Variacin
Cuadrados
Libertad
Dentro de
Tratamientos
43.657
14.55232
Error
26545459
16
165.90912
Total
2698.2029
19
F=
0.088
Con
un
nivel
de
significancia
del
5%
que
se
puede
concluir
con
base
en
los
resultados
del
anlisis
de
varianza?
Obtenga
la
tabla
de
anlisis
de
varianza
utilizando
las
herramientas
de
Excel
y
compare
los
resultados.
[ POLITCNICO GRANCOLOMBIANO ]
BIBLIOGRAFA
FREUND,
John
E.,
MILLER,
Irwin
y
MILLER,
Marylees.
Estadstica
Matemtica
con
aplicaciones.
6ed.
Madrid
Prentice
Hall,
2000.
GUTIERREZ,
Humberto
y
DE
LA
VARA,
Romn.
Control
estadstico
de
Calidad
y
Seis
Sigma
(6s).
Mxico:
McGraw-Hill,
2005.
KENNET,
Ron
S.,
y
ZACKS,
Shelemyahu.
Estadstica
Industrial
Moderna.
Barcelona,
Thomson,
2000.
MONTGOMERY,
Douglas
C.
y
RUNGER,
George
C.
Probabilidad
y
Estadstica
aplicadas
a
la
Ingeniera.
2ed.
Mxico:
Limusa,
2002.
NEWBOLD.
Paul.
Estadstica
para
los
Negocios
y
la
Economa.
4ed.
Madrid
Prentice
Hall,
1988.
WALPOLE
Ronal,
E.,
MYERS,
Raymond
H.
y
MYERS,
Sharon
L.
Probabilidad
y
Estadstica
para
Ingenieros.
6ed.
Madrid
Prentice
Hall,
1998.
[ ESTADSTICA INFERENCIAL ]