Sie sind auf Seite 1von 20

Problema ejemplo:

Suponga que usted sea dueo de un restaurante mexicano y que ofrezca una salsa especial que acompaa las enchiladas. Uste
clientes regulares que vienen todos los dias. La mayoria de sus clientes son estudiantes, obreros o unos empleados de oficina.
casi siempre piden la salsa especial, pero usted tiene la impresion de que a los estudiantes y a los obreros les gusta mas esta sa
empleados. Basndose en 10 dias representativos para cada grupo, existe en este caso alguna relacion significativa?

Nmero de veces que los clientes


piden la salsa especial

Da Estudiantes Empleados

1 25 15
2 10 18
3 14 13
4 14 15
5 20 14
6 27 9
7 19 9
8 22 10
9 19 11
10 14 13

suma 184.0 127.0


promedio 18.40 12.70
varianza 29.156 8.678

Anlisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma
25 9 159
15 9 112
25 9 247

ANLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad
Entre grupos 1043.6296296296 2
Dentro de los grupos 300.4444444444 24
Total 1344.0740740741 26

El resultado de una ANOVA le da el valor estadistico de la "F." En este ca


"F" o la variacion entre los tres grupos es 40.01. Para saber si los resulta
son significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.0
ser al menos 3.354 (o sea, el valor critico para F). Entonces, como el valor
y es mucho mayor que el valor crtico para F (3.354) estamos seguros qu
son significativos. En otras palabras, si existe una relacion significativa e
salsa especial. La probabilidad demuestra a que nivel de los resultados so

EJERCICIO
Se mide la contaminacion de un rio analizando la cantidad de oxigeno que contiene en disolucio
Se toman muestras en cuatro lugares dferentes del rio a ( 10,20,25 y 100 km de yacimiento), obt
siguientes datos:

100km 50KM 25KM


4.80 6.00 5.90
5.20 6.20 6.10
5.00 6.10 6.30
4.70 5.80 6.10
5.10 5.90 6.00

suma
promedio
varianza
a salsa especial que acompaa las enchiladas. Usted cuenta con
estudiantes, obreros o unos empleados de oficina. Algunos de ellos
os estudiantes y a los obreros les gusta mas esta salsa que a los
n este caso alguna relacion significativa?

es

Obreros

25
29
28
27
25
28
29
27
26
28

272.0
27.20
2.178

Promedio Varianza
17.6666666667 26.75
12.4444444444 9.0277777778
27.4444444444 1.7777777778

Promedio de los cuadrados F Probabilidad


521.8148148148 41.6834319527 1.55629415176197E-08
12.5185185185
stadistico de la "F." En este caso el valor de la
40.01. Para saber si los resultados en este ejemplo
"P" tiene un valor menor a 0.05), el valor de la "F" necesita
ra F). Entonces, como el valor de nuestra "F" es de 40.01
F (3.354) estamos seguros que los resultados de nuestras pruebas
te una relacion significativa entre cuanto que cada grupo pide la
que nivel de los resultados son estadisticamente significativos.

ad de oxigeno que contiene en disolucion el agua.


10,20,25 y 100 km de yacimiento), obteniendose los

10KM
6.30
6.60
6.40
6.40
6.60
Valor crtico para F
3.4028261054
necesita
40.01
estras pruebas
grupo pide la
gnificativos.
ANOVA: Anlisis de varianza de dos factores con una sola muestra por grupo
ejercico 2

Suponga que usted haya experimentado con levadura para una receta de panes dulces. Parece ser que la cantidad
temperatura del agua afectan el tamao de los panes. Basndose en los siguientes datos, usted realiza un anlisis d
averiguar lo que es significativo de estas recetas.

agua FILAS
fria tibia caliente SUMA
poca azucar 75 87 60 222.0
azucar normal 74 82 55 211.0
mucha azucar 70 79 53 202.0

El resultado del
valor de la "F" p
significativos (o
necesita ser al m
es de 23.15 y es
de nuestras prue
igual a 378.53. E
otras palabras, e
tamao de los p
estadsticamente

EJERCICIO2
Imagine que la compaa Tortillas Familiares, S.A. haya analizado el nmero de clientes que entra a la tienda
principal. Cada hora, ellos han contado el nmero promedio de clientes que entra a la tienda. Estos nmeros
estn resumidos por hora y por trimestre. Existe alguna relacin significativa en el nmero de clientes que
entra a la tienda por medio de las variables que son la hora y el trimestre del ao?

Promedio de clientes en la tienda


Hora Trim 1 Trim 2 Trim 3 Trim 4
8:00AM 7 4 5 9
9:00AM 10 7 8 20
10:00AM 25 15 17 35
11:00AM 50 20 25 67
12:00PM 75 35 40 85
1:00PM 79 40 46 103
2:00PM 74 43 49 96
3:00PM 68 38 38 85
4:00PM 52 34 38 80
5:00PM 54 30 35 86
6:00PM 45 25 30 85
7:00PM 69 27 35 75
8:00PM 50 20 33 70
9:00PM 40 17 29 62

Anlisis de varianza de dos factores con una sola muestra por grupo

RESUMEN Cuenta Suma Promedio Varianza


9:00AM 4 45 11.25 35.5833333333
10:00AM 4 92 23 82.6666666667
11:00AM 4 162 40.5 484.333333333
12:00PM 4 235 58.75 622.916666667
1:00PM 4 268 67 870
2:00PM 4 262 65.5 593.666666667
3:00PM 4 229 57.25 542.25
4:00PM 4 204 51 433.333333333
5:00PM 4 205 51.25 643.583333333
6:00PM 4 185 46.25 739.583333333
7:00PM 4 206 51.5 577
8:00PM 4 173 43.25 468.916666667
9:00PM 4 148 37 366

7 13 691 53.1538461538 413.974358974


4 13 351 27 117.833333333
5 13 423 32.5384615385 124.935897436
9 13 949 73 541.833333333

ANLISIS DE VARIANZA
Origen de las variacionesSuma de cuadrados
Grados de libertad
Promedio de los cuadrados F Probabilidad
Filas 12185.1923077 12 1015.43269231 16.6333280832 3.1772907E-11
Columnas 17181.7692308 3 5727.25641026 93.815509004 4.4429048E-17
Error 2197.73076923 36 61.0480769231

Total 31564.6923077 51
Parece ser que la cantidad de azcar y la
s, usted realiza un anlisis de varianza para

FILAS COLUMNAS
PROMEDIO VARIANZA SUMA PROMEDIO VARIANZA
74.0 183.0
70.3 192.3
67.3 174.3

El resultado del ANOVA (Anlisis de varianza) indica el valor estadstico de la "F." En este caso el
valor de la "F" por las filas (cantidad de azcar) es 23.15. Para saber si estos resultados son
significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la "F" observado
necesita ser al menos 6.94 (o sea, el valor crtico de la F). Entonces, como el valor de "F" observado
es de 23.15 y es mucho mayor que el valor crtico de la F (6.94), estamos seguros que los resultados
de nuestras pruebas son significativas. El valor de la "F" para las columnas (temperatura del agua) es
igual a 378.53. Esto es tambin significativo, porque el valor de "F" crtico es solamente 6.94. En
otras palabras, existe una relacin significativa en la cantidad de azcar, la temperatura del agua y el
tamao de los panes dulces. La probabilidad muestra a qu nivel los resultados son
estadsticamente significativos.

s que entra a la tienda


tienda. Estos nmeros
mero de clientes que

FILAS COLUMNAS
SUMA PROMEDIO VARIANZA SUMA PROMEDIO VARIANZA
25.0 6.3 4.9 698.0 49.9 534.3
45.0 11.3 35.6 355.0 25.4 146.6
92.0 23.0 82.7 428.0 30.6 169.5
162.0 40.5 484.3 958.0 68.4285714 792.725275
235.0 58.8 622.9
268.0 67.0 870.0
262.0 65.5 593.7
229.0 57.3 542.3
204.0 51.0 433.3
205.0 51.3 643.6
185.0 46.3 739.6
206.0 51.5 577.0
173.0 43.3 468.9
148.0 37.0 366.0

Ntese: El valor de F significativo para las


filas (i.e., la hora del da) nos indica que de
acuerdo con la hora del da, hay una
diferencia significativa en el nmero de
clientes que pasa por la tienda. El valor
significativo para las columnas (i.e.,
trimestre) nos indica que de acuerdo con el
trimestre del ao, hay una diferencia
significativa en el nmero de clientes que
pasa por la tienda.

Valor crtico para F


2.032703133
2.8662655509
ste caso el
os son
"F" observado
"F" observado
los resultados
ura del agua) es
te 6.94. En
ra del agua y el
Anlisis de varianza de dos factores con varias muest
HOMBRES MUJERES
85 69
74 65
96 63
62 70
OPINION DE LA SALSA 80 72
DE LA RECETA
ANTERIOR 78 59
90 64
79 70
85 68
80 73
68 85
64 75 RECETA ANTERIOR
62 97 HOMBRES
69 80 SUMA 809
73 88 PROMEDIO 80.9
OPINION DE LA SALSA DE LA RECETA NUEVA
61 81 VARIANZA 84.7666666667
64 91
72 83 RECETA ANTERIOR
70 84 HOMBRES
71 82 SUMA 674
PROMEDIO
VARIANZA

Anlisis de varianza de dos factores con varias muestras por grupo

RESUMEN HOMBRES MUJERES Total


SA DE LA RECETA ANTERIOR
Cuenta 10 10 20
Suma 809 673 1482
Promedio 80.9 67.3 74.1
Varianza 84.7666666667 19.5666666667 98.0947368421

SALSA DE LA RECETA NUEVA


Cuenta 10 10 20
Suma 674 846 1520
Promedio 67.4 84.6 76
Varianza 18.7111111111 38.0444444444 104.736842105
Total
Cuenta 20 20
Suma 1483 1519
Promedio 74.15 75.95
Varianza 96.9763157895 106.05

ANLISIS DE VARIANZA
Origen de las variacionesSuma de cuadradosGrados de libertad
Promedio de los cuadrados F Probabilidad
Muestra 36.1 1 36.1 0.8963995034 0.3500611555
Columnas 32.4 1 32.4 0.804524762 0.3757033049
Interaccin 2371.6 1 2371.6 58.8892261002 4.3768828E-09
Dentro del grupo 1449.8 36 40.2722222222

Total 3889.9 39

Dentro del grupo


Imagine 1449.8
que la compaa Tortillas 36 40.2722222222
Familiares, S.A. necesite distribuir tortillas recin hechas diariamente y que se
mnimo de paquetes sobrantes diariamente. La compaa Tortillas Familiares ha checado el nmero de paquete
cuatro diferentes localidades (Chihuahua,
Total 3889.9 Monclova,
39Saltillo, y Monterrey). Basndose en estos nmeros, la com
procedimientos de distribucin. Despus checaron otra vez para ver si hubo menos paquetes sobrantes. Existe
el nmero de paquetes sobrantes en relacin con los cambios de distribucin? Estos cambios se aplican para to

Nmero de paquetes sobrantes de tortillas


(En 10 tiendas por ciudad)
Chihuahua Monclova Saltillo Monterrey
20 15 25 26
36 20 37 36
45 40 44 45
27 35 25 21
45 30 46 48
Pre-Modificacin
33 21 34 32
21 20 25 24
22 30 25 26
15 12 17 18
34 10 33 32
15 14 14 25
20 21 21 33

Pos-Modificacin
20 39 22 44
21 30 20 20
33 31 34 47
Pos-Modificacin
20 20 21 34
15 19 14 20
14 32 13 24
10 15 9 15
25 9 26 29

Anlisis de varianza de dos factores con varias muestras por grupo


arias muestras por grupo

MUJERES
673 El resultado del ANOVA (Anlisis de varianza) indica el valor estadstico de la "F." En este
67.3 (receta anterior y receta nueva) es 0.896. Para saber si estos resultados son significativo
valor menor a 0.05), el valor de la "F" necesita ser al menos 4.11 (o sea, el valor crtico
19.5666666667 nuestra "F" es de 0.896 y es no es mayor que el valor crtico de la F, no podemos decir q
Sin embargo, a la vez necesitamos interpretar qu significa el valor de F que est relacio
Siempre un efecto de interacin sobrepasa el efecto principal. En este caso tenemos un
"F"=58.89). En otras palabras, s existe una diferencia significativa entre la opinin de lo
MUJERES la receta anterior y a la nueva. La probabilidad demuestra a qu nivel los resultados son
Valor crtico para F
4.1131652768
4.1131652768
4.1131652768

as diariamente y que sea importante reportar el nmero


el nmero de paquetes sobrantes en las tiendas en
n estos nmeros, la compaa cambi algunos de sus
uetes sobrantes. Existe alguna diferencia significativa en
mbios se aplican para todas las localidades?

PREMODIACION
Chihuahua Monclova Saltillo Monterrey
SUMA
PROMEDIO
VARIANZA
POSMODIFICACION
Chihuahua Monclova Saltillo Monterrey
SUMA
PROMEDIO
VARIANZA

Ntese: El valor de F signficativo para las muestras (i.e., pre-


y pos-modificacin nos indica que hay una diferencia
significativa en el cambio en el nmero de paquetes
sobrantes. El valor de F no significativo para las columnas
(i.e., las cuatro ciudades) nos indica que los cambios tenan el
mismo efecto en todas las ciudades, no hubo diferencia entre
las ciudades. El valor de F no significativo para la interaccin
nos indica que no hay un efecto de interaccin entre las
variables (eso es bueno, pues una interaccin muchas veces
neiga la validez de los otros valores de F.)
estadstico de la "F." En este caso el valor de la "F" de la muestra
s resultados son significativos (o sea, si la probabilidad "P" tiene un
4.11 (o sea, el valor crtico de la F). Entonces, como el valor de
de la F, no podemos decir que existe alguna diferencia significativa.
el valor de F que est relacionado al efecto de una interaccin.
al. En este caso tenemos un gran efecto de interaccin (el valor de la
cativa entre la opinin de los hombres y de las mujeresa relacionada a
qu nivel los resultados son estadsticamente significativos.

Das könnte Ihnen auch gefallen