Beruflich Dokumente
Kultur Dokumente
PRUEBA DE HIPOTESIS
HIPTESIS
a Es el enunciado acerca de una poblacin, elaborado con el propsito de ponerlo a aprueba
PRUEBA DE HIPTESIS
Procedimiento basado en la evidencia muestral y la teora de probabilidad que se emplea para determinar
si la hiptesis es un enunciado razonable.
y la hiptesis alternativa
aceptarla o rechazarla. Tal hiptesis es una afirmacin que se aceptar si los datos
muestrales no pueden proporcionar evidencia convincente que es falsa.
Hiptesis alternativa
Error tipo II (
Poblacin
Muestra
Se acepta
Se rechaza
es verdadera
rechaza Ho
Decisin Correcta
Ho
Error Tipo I
es falsa
Ho
Error Tipo II
Decisin correcta
4.- Formular la regla de decisin.- Es un enunciado de las condiciones segn las que se
acepta o se rechaza la hiptesis nula.
Ha:
Estadstico de prueba:
conocida
Z=
Estadstico de prueba:
desconocida:
si Z
Ejemplo
Se desea probar si una nueva tcnica de siembra en vivero produce diferencias en la
longitud de plantines de algarrobo, luego de tres meses de realizada la siembra. Bajo la
tcnica tradicional, las plantas alcanzan una altura promedio de 15 cm, con una
desviacin estndar de 3 cm. El ensayo consisti en evaluar 16 plantines de algarrobo
al cabo de tres meses de sembrado con la nueva tcnica, obtenindose un promedio
de altura de 17 cm. Con =0,05 realizar la prueba de hiptesis correspondiente.
Solucin
Ho: = 15
Ha: 15
Z=
Z=
= 2,66
y, por lo tanto,
se acepta
Ejemplo
La tasa anual de resurtido de botellas de aspirinas es 6.0 (esto indica que las
existencias del medicamento tienen que renovarse en promedio 6 veces al ao en un
establecimiento). La desviacin estndar es 0,50. Se sospecha que el volumen de
4
Ho: = 6
Ha:
6
b.- = 0,05
c.- El valor estadstico de la prueba es:
Z=
1.96
Si el valor del estadstico de prueba resulta mayor a 1.96 o menor a -1.96 se rechaza
la hiptesis nula
Z=
2.56
y, por lo tanto,
Ejemplo
El supermercado local gast en una remodelacin miles de nuevos soles durante
muchas semanas. Aunque la interrupcin espant a los clientes temporalmente, el
gerente espera que los clientes vuelvan a disfrutar de las nuevas comodidades. Antes
de remodelar, los recibos de la tienda promediaban $ 32 533 por semana. Ahora que
se ha terminado la remodelacin, el gerente toma una muestra de 36 semanas para
ver si la construccin afect de alguna manera el negocio. Se report una media de
$34 166 y una desviacin estndar de $12 955 Qu puede decir el gerente a un nivel
de significancia del 1%?
5
Solucin
Rechazar Ho si:
Ho: = 32 533
Ha:
- 2.576
El estadstico de la prueba:
Z=
2.576
0.756
El valor de prueba est dentro de la zona de aceptacin, entonces se acepta Ho Es
decir la media es 32 533
Ejemplo
Una operacin en lnea de montaje automotriz tiene una media del tiempo de
terminacin de 2,2 minutos. Debido al efecto del tiempo de terminacin sobre las
operaciones anteriores y siguientes de ensamblaje, es importante mantener esta
norma de 2,2 minutos. Una muestra aleatoria de 45 tiempos da como resultado una
media del tiempo de 2,39 minutos con una desviacin estndar de 0,20 minutos.
Emplee un nivel de significacin de 0,02 y pruebe si la operacin cumple con la norma
de 2,2 minutos.
PRUEBA DE HIPTESIS CON MUESTRAS GRANDES (n 30) RESPECTO A UNA MEDIA
POBLACIONAL PARA PRUEBAS DE UNA COLA (UNILATERAL) DE LA FORMA
Ho:
Ha: o
Estadstico de prueba:
conocida
Z=
Estadstico de prueba:
desconocida:
Z=
Ejemplo
La produccin media de trigo por hectrea en una regin es de 2200 Kg con una
desviacin estndar
450Kg Se desea establecer si la aplicacin de fertilizantes
modifica el rendimiento medio de trigo. Para lo cual se elige 20 has (una en cada
chacra de la regin) y se encontr que el rendimiento promedio fue de 2650 Kg .Con
= 0,05 que se puede concluir.
Ho: 2200 Kg
Ha: 2200 Kg
Z=
= 4,47
conocida
Z=
Estadstico de prueba:
desconocida:
Z=
si
- Z
6.8
6.8
Regla de la decisin
Rechazar
si
Z - 1.645
8
Valor de la prueba
Z=
7.2
Z =
Donde:
= Relacin proporcional poblacional
= Relacin proporcional muestral
n = Tamao de muestra
PRUEBA PARA LA PROPORCIN POBLACIONAL
PRUEBA DE HIPTESIS RESPECTO A UNA PROPORCIN POBLACIONAL PARA
PRUEBAS DE UNA COLA (UNILATERAL) DE LA FORMA:
El estadstico de la prueba
Z
Ejemplo
Una investigacin en la Universidad de Toledo indica que el 50% de los estudiantes
cambian su rea principal de especializacin despus del primer ao en el programa de
estudios. Una muestra de 100 alumnos en la escuela de Administracin revel que 48
de ellos cambi de dicha rea despus del lapso mencionado. Ha habido un
decremento significativo en la proporcin de estudiantes que cambian su rea de
10
0.48
0.05
Regla de decisin
Rechazar
si
- 1.645
El estadstico de la prueba
Z
- 0.4
Como Z
11
Estadstico de prueba
Z
Rechazar
si
Ejemplo
Un artculo en la publicacin Piura 21 report que solo hay un empleo disponible para
uno de cada tres egresados de la Universidad. Las principales razones aportadas fueron
que existe una sobrepoblacin de estos ltimos y una economa dbil. Suponga que
una encuesta de 200 egresados recientes de la Universidad de Jan revel que 80
tenan empleo. Al nivel de significancia de 0.02, Se puede concluir que tienen trabajo
una proporcin mayor de egresados de la Universidad de Jan?
n 200
0,02
Regla de la decisin.
Rechazar
si
Z
2,054
Valor de la prueba:
Z
12
Se acepta
igual
Ejemplo
Un restaurante de comida rpida planea una oferta especial que permita a sus clientes
comprar vasos de diseo especial con conocidos personajes de caricaturas. Si ms del
15% de los clientes compran estos vasos, se implementar la promocin. En una
prueba preliminar en varios locales, 88 de 500 clientes los compraron. Se debe
implantar la promocin especial? Lleve a cabo una prueba de hiptesis que apoye su
decisin. Use un nivel de significacin de 0,01 Cul es su recomendacin?
PRUEBA DE HIPTESIS RESPECTO A UNA POBLACIN POBLACIONAL PARA PRUEBAS
DE DOS COLAS (BILATERAL) DE LA FORMA:
Ho: P = Po
Ha: P Po
Estadstico de prueba
Z=
Rechazar
si
Ejemplo
Se establece la siguiente hiptesis:
: P = 0.4
:P
Una muestra de 120 observaciones revel
Rechazar
si Z
-1,96
1.96
c.- Se rechaza
= -2.24
desconocida
Z=
Z=
Donde:
Tamao de
muestra
Media
muestral
Variancia
poblacional
Poblacin 1
Poblacin 2
14
Ejemplo
Una importante compaa de transporte pblico de Chiclayo debe decidir entre dos
marcas de llantas para su parque automotor, con un nivel de confianza del 95%. Para
tomar una decisin seleccion una muestra aleatoria de 100 llantas de cada marca y
encontr que la marca 1 tiene una vida til de 98 000 Km, en promedio, con una
desviacin estndar de 8 000 Km.
Por otro lado, las estadsticas calculadas para la marca 2 son, en promedio, de 101 000
Km y desviacin estndar de 12 000 Km
Qu marca de llantas debera adquirir la compaa de transporte si la diferencia de
precios es mnima?
Solucin
:
Regla de decisin
Rechazar
si:
= 98 000
= 8 000
=100
= 101 000
= 12 000
= 100
Valor de la prueba
15
Z=
= - 2.08
Estadstico de prueba
Conocida
-
Z=
desconocida
-
Rechazar
si Z
:
:
0
0
16
Estadstico de prueba
Conocida
desconocida
Rechazar
si Z
Del ejercicio anterior, para decidir qu marca comprar, realizamos una nueva prueba
de hiptesis suponiendo que la vida til promedio de la llanta de marca 2 es mayor
que la vida til promedio de la marca 1, esto es:
:
:
Usando los mismos datos anteriores tenemos
= - 2.08
17
Como 2.08 est en la zona de rechazo tenemos que la marca 2 tiene mayor vida til
promedio que la marca 1.Por lo tanto, la compaa de transporte debe abastecerse de
la marca 2
PRUEBA DE HIPTESIS CON MUESTRAS GRANDES (n
ENTRE DOS PROPORCIONES:
PARA LA DIFERENCIA
Tamao de
muestra
Proporcin Proporcin
muestral
ponderada
Poblacin 1
Poblacin 2
Alternativamente
Ejemplo
El departamento de investigacin en la casa Matriz de una compaa aseguradora,
realiza una investigacin acera de las causas de accidentes automovilsticos, las
caractersticas de los conductores, etc. Se seleccion una muestra aleatoria de 400
plizas de seguros expedidas a personas solteras. Se descubri que en el periodo
anterior de tres aos, 120 sufrieron al menos un accidente automovilstico. En forma
semejante, una muestra de 600 plizas expedidas a personas casadas revel que 150
haban tenido al menos un accidente. Al nivel de significancia de 0.05, Hay diferencia
18
significativa en las personas solteras y casadas que sufrieron un accidente durante un lapso de
tres aos?
Solucin
400
600
= 0.30
= 0.25
:
:
Regla de decisin
Rechazar
si: Z
Valor de la prueba
Z=
Z=
= 0.27
= 1.74
Ejemplo
Por registros pasados se sabe que la vida til promedio de una pila elctrica que se
utiliza en un reloj digital es de 305 das. La vida til de las pilas se distribuye
normalmente. Tal elemento elctrico fue modificado recientemente para que tenga
mayor duracin. Se prob una muestra de 20 pilas modificadas y se encontr que la
vida media era de 311 das con una desviacin estndar de la muestra de 12 das. Al
nivel de significancia de 0.05. La modificacin increment la duracin promedio de la
pila?
a.- Plantear la hiptesis nula y alternativa.
b.- Ilustrar grficamente la regla de decisin.
c.- Calcular t y llegar a una decisin. Resuma la manera breve el resultado.
Solucin:
Regla de decisin:
Rechazar
si
Valor de prueba:
t=
Por lo tanto se rechaza
= 2.24
20
PRUEBA DE DOS
INDEPENDIENTES
MEDIAS
POBLACIONALES:
MUESTRAS
ALEATORIAS
Caso I
Cuando
tiene:
Valor de prueba
t
t con
grados de libertad:
Donde:
Tamao de
muestra
Media
muestral
Variancia
ponderada
Poblacin 1
Poblacin 2
Grados de libertad:
Observacin
Las varianzas son desconocidas, pero iguales:
Donde
es un estimador insesgado de
Ejemplo:
Una muestra de calificaciones en un examen presentado en un curso de Estadstica (en
escala 100) es:
Hombres 72
Mujeres 87
69
90
98
78
66
81
85
80
76
76
79
80
77
:
:
21
H
78
9,49
9
S
n
M
82
5,40
6
Regla de decisin:
Rechazar
si t
Valor de la prueba
= 66.6153
= 0.10
Se acepta
porque 0.42 est en la zona de aceptacin. Por lo tanto, no se puede
afirmar que la calificacin de las mujeres es ms alta que la calificacin de los
hombres.
b.. Caso II:
Cuando
22
g.l.
[
]
]
Ha: d> 0
Ha: d 0
Ha: d < 0
3.- Estadstico de prueba:
t=
= 1
t>t
t<
t>t
23
Nmero de oficina
No msica
Con msica
1
8
5
2
9
6
3
5
7
4
6
5
5
5
6
6
10
7
7
7
8
= 0.05
Ho: d = 0
Ha: d > 0
No msica
8
9
5
6
5
10
7
=7,14
=6,28
=0,85
t=
En las tablas
Con msica
5
6
7
5
6
7
8
d
3
3
2
1
1
3
1
=2,6457
=
= 1,025
1,943
Conclusin: No hay una evidencia estadstica para afirmar que con la instalacin de la
msica en las oficinas, los empleados pasaran ms tiempo en estas.
PRUEBA DE HIPTESIS PARA LA VARIANZA
Hay casos que se tiene el problema de desconocer la varianza, o desviacin estndar
de la poblacin, en donde las distribuciones son normales. Si se desea probar una
hiptesis acerca de la varianza se puede hacer utilizando la distribucin de Ji cuadrada
(Chi cuadrada). As mismo, supngase que se tiene inters en dos poblaciones
normales independientes, donde las medias y las varianzas de la poblacin son
desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder
comparar las medias de estas dos poblaciones se ha utilizado la distribucin de t de
Student, en la cual podemos tener varianzas iguales o diferentes en la poblacin.
24
Casos de independencia
-
Donde:
-
26
Solucin:
Ho: La preferencia de los candidatos se mantiene
Ha: No hay cambios en la preferencia
= 0.10
Candidato
A
B
C
D
Otros
Total
Datos
observados
45
30
18
6
21
120
Datos
esperados
120x0,34=40,8
120x0,28=33,6
120x0,14=16,8
120x0,08=9,6
120=0,16=19,2
12,0
%
Terico
34
28
14
8
16
100
= 2,4225
El valor critico se busca en la tabla de Chi cuadrado, con k- 1 grados de libertad y con
un nivel de significancia
En las tablas
El valor calculado es inferior al tabular, por lo tanto se acepta la hiptesis que las
frecuencias se mantienen (Hiptesis nula).
Ejemplo en proporciones
Las frecuencias esperadas de un cruce gentico entre la prole estn en una proporcin
fenotipo de 3:1 de normal a mutante. Las frecuencias observadas fueron:
Fenotipo Datos
Observados
Normal
80
Mutante
10
Total
90
Fenotipo
Datos
observados
Datos
esperados
Normal
Mutante
Total
80
90x
67,5
10
90x
22,5
90
90
Datos
observado
Datos
esperados
Cara
Sello
10
15
25
25 x 0,50 = 12,5
25 x 0,50 = 12,5
El valor de
Por lo tanto se acepta la hiptesis Ho, que dice que la moneda es balanceada.
PRUEBA DE INDEPENDENCIA TABLAS DE CONTIGENCIA
Las pruebas aplicadas a cuadros de contingencia, algunos la denominan tambin como
dcimas de independencia. Sin embargo, permiten la realizacin de pruebas de
homogeneidad. Un cuadro de contingencia, es un arreglo en el cual un conjunto de
observaciones se dispone conforme a dos criterios de clasificacin, uno de los cuales se
expresa en columnas y el otro en renglones. Si cada uno de los criterios admite dos
clasificaciones, se obtiene una tabla de contingencia de 2 x 2. Si el primer admite tres
clasificaciones y el segundo criterio 4, se denominar como tabla 3 x 4. Si
designamos las columnas por K y los renglones por J, se tendr una tabla de K x J
Los grados de libertad sern iguales a v=(K 1)(J 1), as en una tabla de 2 x 2, el
valor de v ser igual a 1, o sea v= (2 1)(2 -1); y en la tabla de 3x 4 ser: v= (3 - 1)(4)=6.
Cuando el nmero de grados de libertad es igual a 1, se utiliza la correccin de Yates
(correccin por continuidad)
Durmieron
35
45
80
No
durmieron
5
15
20
Total
40
60
100
29
Tratamiento
Pastillas para dormir
Durmieron
Pastillas de azcar
Total
No durmieron
Total
= 32
=8
40
= 48
= 12
60
80
20
100
=
Buscamos en las tablas
= 2,3437
, con (2 1) (2 1)= 1
Satisfaccin
En el
trabajo
Categora
Profesor Profesor
Profesor
Asistente auxiliar
asociado
40
60
52
Mucha
78
87
82
Regular
57
63
66
Poca
Profesor
principal
63
88
64
Solucin
Planteamiento de las hiptesis
La satisfaccin en el trabajo y la categora acadmica son independientes
La satisfaccin en el trabajo y la categora acadmica no son independientes
Grados de libertad: (r 1) (c 1) = (3 -1) (4 -1) = 6
30
Regla de decisin
Rechazar
12.59
i= fila
j = columna
Satisfaccin
En el
trabajo
Mucha
Regular
Poca
Total
= 47.03
Profesor
asistente
40
78
57
175
Profesor
auxiliar
60
87
63
210
categora
Profesor
asociado
52
82
66
200
= 73.28
Profesor
principal
63
88
64
215
Total
215
335
250
800
= 54.69
= 56.44
= 87.94
= 65.62
= 53.75
= 83.75
= 62.50
= 57.78
= 62.50
Satisfaccin
En el
trabajo
Mucha
Regular
Poca
Total
= 90.03
Profesor
asistente
47.03
73.28
54.69
175
CATEGORA
Profesor Profesor Profesor
auxiliar
asociado principal
56.44
53.75
57.78
87.94
83.75
90.03
65.62
62.50
67.19
210
200
215
Total
215
335
250
800
Valor de la prueba:
= 2.75
Como 2.75 es menor que el valor critico 12.59, por lo tanto, no se rechaza
y se
concluye con un = 0.05, que la satisfaccin en el trabajo y la categora acadmica son
independes
31
Estadstico de prueba:
=
si:
Ejemplo
Una manera de evaluar la eficacia de un profesor ayudante es analizar las calificaciones
obtenidas por sus estudiantes en un examen al final del curso. Evidentemente, es
interesante la puntuacin media, sin embargo, la varianza tambin contiene
informacin til; algunos profesores tienen un estilo que funciona muy bien con los
estudiantes ms sobresalientes, pero es ineficiente con los estudiantes con menos
capacidad o menos motivados. Un profesor realiza un examen al final de cada
semestre para todas las secciones del curso, la varianza de las calificaciones de este
examen suelen estar muy prximos a 300 : Un nuevo ayudante tiene una clase de 30
estudiantes, cuyas calificaciones en el examen tuvieron una varianza de 480;
considerando estas calificaciones como una muestra aleatoria de una poblacin
normal, contrastar la hiptesis nula de que la varianza poblacional de sus calificaciones
es 300 frente a una alternativa bilateral con
0.05
32
Regla de decisin
Rechazar
si:
Valor de prueba
=
= 46.40
45.72, se rechaza
Estadstico de prueba
=
Regla de decisin a un nivel de significancia
Rechazar
si:
Ejemplo
Un producto, se debe maquinar determinada parte con tolerancias muy estrechas,
para que los clientes la puedan aceptar. Las especificaciones del producto piden que la
varianza mxima de las longitudes de las partes sea 0.0004. Suponga que en 30 partes,
33
0.05 si se ha
Estadstico de prueba
=
= 36.25
Regla de decisin
Rechazar
si:
Entonces dado que
, se acepta la Ho, lo cual significa que las
especificaciones del producto no han sido violadas.
PRUEBA UNILATERAL IZQUIERDA DE LA VARIANZA DE UNA POBLACIN
Estadstico de prueba
si:
34
Estadstico de prueba
F
s:
Estadstico de prueba
F
Regla de decisin a un nivel de significacin
Rechaza
si: F
35
Ejemplo:
La compaa Piura Com. realiz un estudio acerca de los hbitos de escuchar radio
por parte de los hombres y las mujeres. Un aspecto del estudio comprendi el tiempo
promedio de audicin. Se descubri que tal tiempo para los varones es de 35 minutos
al da. La desviacin estndar de la muestra de 11 personas de sexo masculino que se
estudiaron fue de 10 minutos diarios. El tiempo promedio de audicin para las 13
mujeres en el estudio fue tambin de 35 minutos, pero la desviacin estndar de la
muestra, result 12 minutos. Al nivel de significancia de 0.10, es posible concluir que
existe diferencia en la variacin del nmero de minutos que los hombres y las mujeres
escuchan la radio?
Recuerde que
0.36
Rechaza
s: F
36
Estadstico de prueba
F
1.44
Por lo tanto, al ser F 1.44 se acepta , lo cual significa que la variacin del nmero
de minutos que escuchan radio los hombres es igual al de las mujeres.
Ejemplo
En su incansable bsqueda de un sistema de llenado adecuado, cierta empresa prueba
dos mquinas. Robot Fill se usa para llenar 16 tarros y resulta una desviacin estndar
de 1.9 onzas en el llenado. Con Automatic Fill se llenan 21 frascos que dan desviacin
estndar de 2.1 onzas. Si la empresa tiene que elegir uno de estos sistemas en funcin
de la uniformidad de llenado, Cul deber seleccionar? Use un
0.05
Solucin
Robot Fill
Automatic Fill
De acuerdo a la tabla de F:
s:
Estadstico de prueba
37
Dado que el valor de F es 1.22 se acepta Ho. Por lo tanto, se elige el proceso Automatic
Fill porque es el que presenta mejor uniformidad de llenado.
ANLISIS DE REGRESIN Y CORRELACIN
ANLISIS DE CORRELACIN
Conjunto tcnicas estadsticas empleadas para medir la intensidad y el sentido de la
asociacin de dos ms variables. El concepto de correlacin est estrechamente
vinculado al concepto de regresin, pues para que una ecuacin de regresin sea
razonable los puntos muestrales deben estar ceidos a la ecuacin de regresin,
adems el coeficiente de correlacin debe ser:
-
y pequeo
DIAGRAMA DE DISPERSIN
Grfica que presenta la relacin entre dos variables.
VARIABLE DEPENDIENTE
Variable que se predice o estima. Se muestra en el eje Y.
VARIABLE INDEPENDIENTE
Variable que proporciona la base para la estimacin. Es la variable de pronstico. Se
muestra en el eje X.
Ejemplo
La empresa Rzuri Hnos. un negocio familiar que ha vendido al menudeo en Piura
durante muchos aos, se anuncia ampliamente por radio y televisin, destacando sus
bajos precios y accesibles condiciones de crdito. Al dueo le gustara analizar la
relacin entre las ventas y lo que gasta en publicidad. A continuacin se muestra la
informacin acerca de las ventas y lso gastos de publicidad durante los ltimos cuatro
meses.
Mes
Julio
Agosto
Setiembre
Octubre
Gastos de publicidad
(miles de dlares)
2
1
3
4
38
r=
][
Donde:
n = Nmero de pares de observaciones
x = Suma de los valores de la variable x
39
Total
r=
r=
y
7
3
8
10
28
xy
14
3
24
40
81
[
[
4
1
9
16
30
][
49
9
64
100
222
][
= 0,96
= 92,16%
40
1-
= 7,84%
Estadstico de prueba:
t
Rechazar
si:
= 4,84
, es decir
=4,303
Como el valor calculado es mayor que el valor de la tabla, existe una fuerte correlacin
entre el gasto en publicidad y el ingreso por ventas. (Aceptamos hiptesis alternativa)
ANLISIS DE REGRESIN
A travs del anlisis de regresin buscamos que la lnea de ajuste se aproxime lo mejor
posible a todos los puntos del diagrama de dispersin. La ecuacin para la lnea recta
empleada para calcular y con base en x se conoce como ecuacin de regresin.
ECUACIN DE REGRESIN
Expresin matemtica que define la relacin entre dos variables.
41
42
Donde
-
Ejemplo
Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de
publicidad (en millones de dlares) para 7 marcas principales de refrescos:
43
Marca
Coca cola
Pepsi
Kola real
Sprite
Inca cola
Concordia
7 up
Gastos de
publicidad
131.3
92.4
60.4
55.7
40.2
29.0
11.6
Ventas
de cajas
1929.2
1384.6
811.4
541.5
536.9
535.6
219.5
a.- Trace un diagrama de dispersin para estos datos, con los gastos de publicidad
como variable independiente.
b.- Qu parece indicar este diagrama acerca de la relacin entre las dos variables?
trace una recta que pase por los datos, para aproximar una relacin lineal entre los
gastos de publicidad y las ventas.
c.- Aplique el mtodo de mnimos cuadrados para plantear la ecuacin estimada de
regresin
d.- Presente una interpretacin de la pendiente de esta ecuacin
Solucin:
Variable independiente: Gastos de publicidad
Variable dependiente: Ventas de cajas
Diagrama de dispersin.
El diagrama parece indicar que la relacin entre las variables es linealmente positiva.
Ahora encontraremos los valores de r,
Gastos de
Publicidad
Sumas
x
131.3
92.4
60.4
55.7
40.2
29
11.6
420.6
17 239.69
8 537.76
3 648.16
3 102.49
1 616.04
841
134.56
35 119.7
Ventas de
cajas
y
1929.2
1 384.6
811.4
541.5
536.9
535.6
219.5
5 958.7
3 721 812.64
1 917 117.16
658 369.96
293 222.25
288 261.61
286 867.36
48 180.25
7 213 831.23
xy
253 303.96
127 937.04
49 008.56
30 161.55
21 583.38
15 532.4
2 546.2
500 073.09
44
r=
r=
][
][
= 0.97810014
Como r se aproxima a uno, entonces diremos que la relacin que hay entre las dos
variables es bastante fuerte o intensa.
La ecuacin que mejor se ajusta a los datos es una recta, como se aprecia en el
siguiente grfico.
= 14.42378282
=
=
= - 15.42
= - 15.42 + 14.424x
es solo matemtica, esto es el punto de corte con el
45
COEFICIENTE DE DETERMINACIN (
).
Rechazar
si: t
Estadstico de prueba
= 10.5093
Se acepta la hiptesis alternativa, es decir existe relacin entre las variables en estudio
ERROR ESTNDAR DE LA ESTIMACIN:
Mide la dispersin de los valores observados, con respecto a la recta de regresin.
46
Marca
Gastos de
Publicidad
X
Coca cola
Pepsi
Kola real
Sprite
Inca cola
Concordia
7 up
131.3
92.4
60.4
55.7
40.2
29.0
11.6
Ventas
de
Cajas
y
1929.2
1384.6
811.4
541.5
536.9
535.6
219.5
Rendimiento
Pronosticado
Desviaciones
y -
Desviaciones al
cuadrado
1878.45
1317.35
855.78
787.99
564.42
402.87
151.89
50.75
67.25
- 44.38
- 246.49
- 27.52
132.73
67.61
2575.56
4522.56
1969.58
60757.32
757.35
17617.25
4571.11
= 136.21
t (Syx)
Donde
Y' = es el valor pronosticado para cualquier valor X seleccionado
X = es cualquier valor seleccionado de X
= es la media de X
n = en el nmero de observaciones
Syx = es el error estndar de la estimacin
t = es el valor de t tomado para n 2
Ejemplo
De acuerdo a los datos anteriores. Calcular los intervalos de confianza para la venta de
cajas de gaseosas cuando la inversin en publicidad es 100.00 (millones de dlares)
= es 1426.98 para un X igual a 100
= 60.0857
n= 7
1426.98
Syx = 136.21
47
1426.98
t(Syx)
Ejemplo.
- Cuanto ser la venta de cajas de Inca cola, cuando esta compaa invierta 100
millones en publicidad:
1426.98
1426.98
1972.305y 881.655
Interpretacin.Con una probabilidad del 0,95 se puede afirmar que cuando la Inca Cola invierta 100
millones en publicidad sus ventas estarn comprendidas entre 1972.305 y 881.655
cajas.
RELACIN ENTRE COEFICIENTE DE CORRELACIN, COEFICIENTE DE DETERMINACIN
Y ERROR ESTANDAR DE ESTIMACIN
Un medio conveniente para mostrar la relacin entre estas tres medidas es la ANAVA,
recordemos que:
El error estndar de la estimacin mide cun cerca de la recta de regresin se
encuentra los valores reales. Cuando el valor es pequeo indica que las dos variables
estn relacionadas muy de cerca.
El coeficiente de correlacin mide la fuerza de la asociacin entre dos variables.
Cundo los puntos del diagrama de dispersin parecen cercanos a la lnea recta, se
observa que el coeficiente de correlacin tiende a ser grande. Luego el error estndar
de la estimacin y coeficiente de correlacin indican la misma informacin, pero
utilizan escalas diferentes.
El coeficiente de determinacin mide el porcentaje de la variacin de Y que se explica
por la variacin de X
48
N A V A
Suma de
Cuadrados
Grados de
Libertad
Cuadrado
Medio
Prueba de
significacin
Regresin
SC r =
Error
SC e = ( ) = SC t SC r
n2
Total
SC t = (
n1
Significacin
estadstica
Suma de
Cuadrados
Regresin
Error
(Residual)
Total
Diferencia
SCY
Grados de
Libertad
Cuadrado
Medio
Prueba de
significacin
n2
Significacin
estadstica
n1
49
1929,2
1384,6
811,4
541,5
536,9
535,6
219,5
1878,5
1317,35
855,78
787,99
564,42
402,87
151,89
851,2428
851,2428
851,2428
851,2428
851,2428
851,2428
851,2428
1077,9572
533,3572
- 39,8428
-309,7428
-314,3428
-315,6428
-631,7428
A
Fuentes de
Variacin
Regresin
Error
Total
1161991,725
284469,9028
1587,4487
95940,6021
98811,3959
99630,3771
399098,9654
2141530,417
SC Total
50,75
67,25
- 44,38
- 246,49
- 27,52
132,73
67,61
2575,5625
4522,5625
1969,5844
60757,3201
757,3504
17617,2529
4571,1121
92770,7449
SC Error
1027,2072
466,1072
4,5372
- 63,2528
- 286,8228
- 448,3728
- 699,3528
1055154,632
217255,9219
20,5861
4000,9167
82267,3186
201038,1678
489094,3389
2048831,882
SC Regresin
SC
GL
CM
2048831.882
92770.7449
2141530.417
1
5
6
2048831.882
18554.1489
110.4244
Sign.
Estad.
**
F (1,5)= 6.61 (
16.26 (
=
=
= 1
= 1
= 0,9567 = 95.67%
= 136.2136
Por ltimo como se observa conforme la Suma de Cuadrado del error disminuye esta
y por el contrario, conforme disminuye el error estndar se incrementa
El ANAVA de una regresin lineal puede ser calculado de la siguiente manera
50
A N A V A
Fuentes de
variacin
Regresin
Debido a
Suma de
cuadrados
SC total
Total
(corregida)
Cuadrados
medios
Error
Residual
(no explicada)
Grados de
libertad
Donde
y n 2 grados de libertad
Ejemplo
Con los siguientes datos, haga un estudio de regresin parablica
29
35
29
38
40
Total 171
23
34
26
30
35
148
841
1225
841
1444
1600
5951
24389
42875
24389
54872
64000
210525
707281
1500625
707281
2085136
2560000
7560323
667
1190
754
1140
1400
5151
19343
41650
21866
43320
56000
182179
529
1156
676
900
1225
4486
51
Ecuaciones normales
Calcular:
148 = 5
. (1)
5151 = 171
(2)
182179 = 5951
. (3)
. (1)
5151 = 171
(2)
Tendremos:
5061,6 = -171
5151
89,4
171
0
(4)
Trabajamos con la ecuacin (1) y (3) multiplicando la ecuacin (1) por 1190,2
148 = 5
. (1)
182179 = 5951
. (3)
Tendremos:
= - 5951
182179
5951
6029,4
(5)
6029,4
(4)
(5)
Tendremos:
619822,32
0
69919,2
52
Reemplazamos
89,4
(4)
89,4
89,4
102,8
102,8
148 = 5
148 = 5
148 = 5
148 = 5
5
5
5
Total
23
34
26
30
35
148
24,65
32,0
24,65
33,34
33,36
148,00
2,00
1,35
1,64
0,00
)
2,7225
4,0000
1,8225
11,1556
2,6896
22,3902
53
= 4,4780
7,464 (corregida)
Tambin se puede cualcular usando la siguiente formula:
Reemplazando tenemos:
4,4703
Error estndar de la estimacin
2,1143
(Corregido)
(3,182)(2,7320)
r=
r
0,9109
54
Log
Para la representacin grfica se debe utilizar papel semilogaritmico, cuando la
variable X, localizada en el eje horizontal o abscisa, se presenta en forma de progresin
aritmtica, mientras que en la ordenada, donde se ubica la variable Y, se expresa en
forma logaritmica, Si ambas variables tienen crecimiento geomtrico, la
representacin grfica se hace en papel logartmico.
Ejemplo:
Con los siguientes datos, calcule la regresin exponencial
Clculos para una regresin exponencial
log
log
Total
0,47712 0,95424
0,22764
0,60768
4,05
16
0,77815 3,11261
0,60552
0,84063
6,93
12
25
1,07918 5,39591
1,16463
0,95710
9,06
24
49
1,38021 9,66147
1,90498
1,19005
15,50
12 45
1,77241
59,21
30 90
5,36787
94,75
55
Reemplazando tenemos:
5,36787 = 5 log
. (1)
38,96278
Eliminamos log
(2)
ecuacin
-
32,20722 = - 30 log
. (1)
38,96278
(2)
6,75556 =
58 log
58 log
= 6,75556
log
log
47
antilog 0,11647
= 5,36787
5 log
= 5,36787
= 5,36787 3,4941
5 log
5 log
log
= 1,87377
=
log
antilog 0,11647
Log
= antilog 1,53947
= 34,63
Tambin podemos calcular
de la siguiente manera:
log
log
log
0,11647
antilog de 0,11647
1,3075
log
log
=
log
= 0,37475
2,37
Total
log
log
0,47712
0,60768
0,13056
0,0170459
0,77815
0,84063
0,06248
0,0039038
1,07918
0,95710
0,12208
0,0161493
1,38021
1,19005
0,19016
0,0361608
1,65321
1,77241
0,13056
0,0142086
5,36787
5,36787
0,0000
0,0874684
log
log
0,01749368
Este valor tambin se puede calcular de la siguiente manera
57
Donde
Luego:
0,9012
Tambin:
r
[
][
][
r
ANLISIS DE REGRESIN MLTIPLE
Estudia la influencia de dos o ms variables independientes sobre la dependencia de
otra variable dependiente.
La ecuacin ser:
= bo + b1X1 +b2X2
X 1, X2 = son las dos variables independientes
58
+ b2X1X2
59
Vendedor
Juan
Andrea
Ral
Steffany
Eduardo
Ventas semanales
(en miles de soles) Y
5
12
4
8
11
Puntaje de la
Prueba
4
7
3
6
10
Calificacin de
Desempeo
2
5
1
4
6
Solucin:
1.- La ecuacin podr ser calculada de la siguiente forma:
Total
Y
5
12
4
8
11
40
4
7
3
6
10
30
2
5
1
4
6
18
16
49
9
36
100
210
] [
4
25
1
16
36
82
8
35
3
24
60
130
] =[ ]
20
84
12
48
110
274
10
60
4
32
66
172
] [
] =[ ]
+ = 320
+ =120
+ = 120
+ = 120
+ = 120
+ = 86
+ = 110
+ = 110
+ = 150
60
Luego
][
=[ ]
=
=
[(
= 3,5
= 0,975
]
= 2,875
Sy.12 =
Puntaje
de
Prueba
Juan
Andrea
Ral
Steffany
Eduardo
4
7
3
6
10
Calificacin
de
Desempeo
Ventas
semanales
(miles de
soles)
2
5
1
4
6
Sy.12 =
5
12
4
8
11
Ventas
semanales
Pronosticadas
(miles de soles)
5,35
11,05
3,45
9,15
11,00
Total
0,35
0,1225
0,95
0,9025
0,55
0,3025
1,15
1,3225
0,00
0,0000
0,00
2,6500
61
Correlacin
moderada
Correlacin
grande
0,50
1,00
sin correlacin
correlacin perfecta
Suma de
Cuadrados
N A V A
Grados de
Libertad
Cuadrado
Medio
Prueba de
significacin
Significacin
estadstica
n1
Sy.12 =
(
y
5
12
4
8
11
40
5,39
11,05
3,45
9,15
11
40
8
8
8
8
8
3
4
4
0
3
0
)
9
16
16
0
9
50
0,35
0,95
0,55
1,15
0
0
0,1225
0,9025
0,3025
1,3225
0
2,65
2,65
3,05
4,55
1,15
3
0
)
7,0225
9,3025
20,7025
1,3225
9
47,35
Total
62
Fuentes de variacin
Regresin
Error
Total
F(2,2)= 19,00 (
A
SC
47.35
2.65
50
GL CM
2
23.675
2
1.325
4
99,50 (
F
17.87
SIG
N.S.
Coeficiente de determinacin:
= 0,9731
Sy.12 =
= 1,1510
63
DISEO Y ANLISIS
Diseo y anlisis son inseparables para un experimento dado, pueda que exista otro
mtodo igualmente para analizar los datos del experimento, cada metodologa debe
estar justificada y sustentada estadsticamente, nuevas tcnicas se exponen en
artculos cientficos para casos o situaciones muy especiales. El experimentador no
tiene que eliminar datos con el fin que se ajuste a un mtodo estadstico, sino que
debe utilizar la tcnica que se ajusta a su experimento; para que exista concordancia,
en el planeamiento del experimento debe contemplarse el mtodo a utilizar. Hay
lmites que el experimentador deber conocer, esta barrera constituye los lmites a la
libertad de disear un experimento. Hay buenos y malos diseos, los anlisis pueden
ser simples o complicados, el experimentador est obligado a aceptar
estadsticamente un resultado bajo los supuestos que considera como vlidos para la
toma de una decisin.
Ejemplos
Imagine un experimento en el que se alimenta a 300 nios japoneses con pescado y a
300 nios suecos con carnes rojas, durante cinco aos, con resultados: altura media
del grupo japons de 1.55 metros y de los suecos de 1.68 metras. Un experimentador
est interesado en saber el efecto de la dieta en la altura de los muchachos, la consulta
se hace a un estadstico y este responde que el efecto de la dieta y la diferencia racial
se confunden completamente y no hay forma de
Ejemplo 2
64
DISEO DEL EXPERIMENTO.Disear significa planear un experimento de manera que se pueda obtener la
informacin pertinente al problema bajo investigacin y as tomar decisiones
correctas.
El diseo de un experimento es una etapa fundamental de la experimentacin,
permite que los datos que resulten del experimento, conduzcan a un anlisis objetivo y
deducciones vlidas con respecto al problema.
ETAPAS FUNDAMENTALES DE LA EXPERIMENTACION
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
CONCEPTOS GENERALES
Tratamiento
Factor sometido a estudio y comparacin en un experimento.
Una marca de fertilizante
Cantidad de fertilizante Profundidad del sembrado
65
66
Repeticin
Es una rplica de la aplicacin de un tratamiento en otra unidad experimental bajo las
mismas condiciones.
Error experimental
Es una fuente de variacin que permite evaluar el efecto de los tratamientos. El error
experimental se forma por la variacin de las unidades que recibieron el mismo trato
en la aplicacin de los tratamientos y que por efectos no controlables reportan ciertas
diferencias. Se supone que esta variable es totalmente aleatoria.
El error experimental es el fracaso de llegar a resultados idnticos con dos unidades
experimentales tratadas por igual.
Coeficiente de variacin
Es una medida de variacin del experimento en funcin del error experimental y la
magnitud de la variable en estudio. As:
CV = 100%
El valor CV. en experimentos agronmicos no debe ser mayor del 30 %, de ser mayor,
restar confiabilidad a los resultados estadsticos. En experimentos conducidos en
invernadero, laboratorios o centros bajo control ambiental, el CV permitido debe ser
menor del 15 %.
Fuentes de Variacin
Las fuentes de variacin estn referidas a las fuentes controlables y no controlables de
un diseo experimental, la suma parcial de estas fuentes de variacin generan la
variacin total respuesta del experimento.
Grados de Libertad
Son parmetros de la distribucin de probabilidades de la fuente de variacin en
estudio y corresponde al nmero de vectores linealmente independientes que
conforman la matriz de la forma cuadrtica de dicha fuente. Las reglas para determinar
su valor en la prctica son simples, ya estn definidas para los modelos estadsticos en
estudio.
67
Donde:
= Variancia del error experimental verdadero
r = Nmero de repeticiones.
ALEATORIZACION
El proceso de aleatorizacin (asignacin de los tratamientos a las unidades
experimentales) garantiza independencia en los errores. Los errores asociados con
unidades experimentales que estn afectas a espacio o tiempo, tienden a
correlacionarse, y lo que hace la aleatorizacin es asegurar en parte la independencia.
CONTROL LOCAL
Sinnimo de diseo experimental, el control local se refiere al balanceo, bloqueo y
agrupamiento de las unidades experimentales que se utilizan en el experimento,
aunque los tres trminos son sinnimos cada uno explica algo referente a la unidad
experimental, as:
Agrupamiento de unidades experimentales homogneas.
Bloqueo como la distribucin de las unidades experimentales relativamente
homogneas dentro del bloque.
Balance como la asignacin de los tratamientos a las unidades experimentales, de
modo tal que resulte una configuracin balanceada, igual repeticin por tratamiento.
Ejemplos:
Balance completo.
Se distribuye tres raciones para porcinos en grupos de tres animales, en cada grupo se
asigna las tres raciones uno por animal y en cuatro grupos diferentes.
Aproximacin a balance completo.
68
Caso anterior. Se dispone de cuatro animales por grupo, las tres raciones se aplican
aleatoriamente en cada grupo, en las unidades faltantes de aplica uno de los
tratamientos aplicados, este tendr ocho repeticiones.
Balance parcial.
Caso anterior, se completa el primer grupo a seis cerdos, se tiene dos replicas en el
primer grupo, frente a una rplica en los otros grupos.
El control local es para hacer ms eficiente el diseo, los procedimientos son ms
consistentes. El uso adecuado del control local permite una disminucin del error
experimental.
DISEO COMPLETAMENTE AL AZAR
Es el ms simpe de todos los diseos con distribucin al azar. En este diseo los
tratamientos se distribuyen al azar en todas las unidades experimentales, y el nmero
de repeticiones o unidades por tratamiento puede ser igual o diferente.
El diseo completamente al azar es el diseo ms simple y se usa cuando las unidades
experimentales son homogneas, y la variacin entre ellas es muy pequea. Tal es el
caso de experimentos de laboratorios, invernadero, gallineros, porcinas, etc. En
experimentos en que las condiciones ambientales son controladas, as por ejemplo
puede ser aplicado para estudiar diferentes dosis de una vitamina en aves de una
determinada edad y raza, siempre que estn en el mismo corral o corrales idnticos;
para estudios en macetas, etc, este diseo es una prueba con un solo criterio de
clasificacin.
LAS VENTAJAS DE ESTE DISEO SON:
a.- Es fcil de planear.
b.- Es flexible en cuanto al nmero de tratamientos y repeticiones, el lmite est dado
por el nmero de unidades experimentales en general.
c.- No es necesario que el nmero de tratamientos sea igual al nmero de
repeticiones.
d.- No se estima parcelas perdidas.
e.- El nmero de grados de libertad para el error aumenta al no tener muchas
restricciones.
LAS DESVENTAJAS DEL DISEO SON:
a.- No es eficiente con material experimental heterogneo.
b.- Puesto que no existen restricciones en cuanto a la aleatoriedad, el error
experimental incluye la variacin total entre unidades experimentales
69
A
FUENTE DE
VARIACION
SUMA DE
CUADRADOS
SC
Tratamiento
Error
TC
SC tot. SC tra.
Total
GRADOS DE
LIBERTAD
GL
CUADRADO
MEDIO
CM
PRUEBA
ESTADISTICA
F
t 1
t(r 1)
tr 1
TC
C.V. =
Maceta
1
s 2
3
4
Total
Media
TRATAMIENTOS
1
2
3
4
5
101 51
83
67
29
93
61
68
40
45
93
59
72
46
51
96
58
75
52
42
383 229 298 205 167
93, 57, 74, 51, 41,
75
25
50
25
128
2
75
TC
82176
SC total =
SC total
SC tratamientos =
TC = 8168
70
SC tratamientos =
7286
A N A V A
Fuentes de Variacin
Tratamiento
VvvAvariacion
(entre muestras)
Error
(Dentro de muestras)
Total
C.V. =
SC
7286
GL
4
CM
1821,5
882
15
58,15
8168
F
30,98
SIG
**
19
F 0.05 = 3,06
0,01= 4,89
100= 46,33%
PRUEBA DE SIGNIFICACIN DE t
Las pruebas de hiptesis sern:
71
1 vs 2
1 vs 3
1 vs 4
1vs 5
2 vs 3
Ho
Ho
Ho
Ho
Ho
Ha
Ha
Ha
Ha
Ha
2 vs 4
2 vs 5
3 vs 4
3 vs 5
4 vs 5
Ho
Ho
Ho
Ho
Ho
Ha
Ha
Ha
Ha
Ha
= 5, 39
0,05= 2,131
0,01= 2,947
Comparaciones
t=
= 6, 77**
t=
= 3, 57**
t=
= 7, 88**
t=
= 9, 64**
t=
= 17, 25 *
t=
= 1, 11 N.S.
t=
= 2, 87*
t=
= 4, 31**
t=
= 6, 07**
t=
72
t=
= 1, 76 N.S.
PRUEBA DE D. L. S.
Con la prueba de t habra que realizar tantas pruebas como comparaciones, por lo que
si el nmero de tratamientos en el experimento es elevado resultara tedioso realizar
tantas pruebas de t. Esta labor puede aliviarse enormemente empleando la prueba de
DLS, que no es ms que la prueba de t, pero realizada mediante un artificio con el cual
se obtiene los mismos resultados que se obtendran si se hicieran todas las pruebas de
t.
El valor de DLS establece los lmites de separacin de las regiones de aceptacin o de
rechazo de la Hiptesis nula.
Es as que con un solo valor de DLS se acepta o rechaza todas las hiptesis nulas (forma
abreviada de la prueba de t)
D.L.S. = t. S
D.L.S. = 2,131 x 5, 39= 11.48
1 vs 2 = 93,75 57,25 = 36,5*
1 vs 3 = 93,75 74,50 = 19,25*
1 vs 4 = 93,75 51,25 = 42,5*
1 vs 5 = 93,75 41,75 = 52,00*
2 vs 3 = 57,25 74,50 = 17,25*
2 vs 4 = 57,25 51,25 = 6,00 N.S.
2 vs 5 = 57,25 41,75 = 15,50*
3 vs 4 = 74,50 51,25 = 23,25*
3 vs 5 = 74,50 41,75 = 32,75*
4 vs 5 = 51,25 41,75 = 9,5 N.S.
PRUEBA DE SIGNIFICACIN DE DUNCAN
La ventaja de esta prueba consiste en el hecho de que no necesita que el valor de F sea
significativo para poderlo usar.
Es una prueba que permite comparar todas las medias entre s, sin restricciones.
Esta prueba tiene en cuenta el orden de los promedios de cada uno de los
tratamientos.
S =
= 3, 81
Con los grados de libertad del error buscamos en la tabla de Duncan (A.E.S.)
3,01
3,16
3,25
3,31
Encontramos la A.L.S.
73
A.L.S. =A.E.S. x S
2
3.01
3.81
11.46
A.E.S.
S
A.L.S.
3
3.16
3.81
12.03
4
3.25
3.81
12.38
5
3.31
3.81
12.61
41,75
51,25
57,25
74,50
93,73
Promedio
93,70
74,50
57,25
51,25
41,75
=3,81
Buscamos en la tabla de Tukey con los grados de libertad del error y el nmero de
tratamientos.
74
A.E.S. (T)
Promedio
93,70
74,50
57,25
51,25
41,75
Repeticiones
1
2
3
4
5
6
7
8
9
Total
TC =
1
45
46
49
44
184
46
RACIONES
2
3
35
34
33
34
35
34
33
68
54
170
34
4
41
41
44
43
41
42
44
41
41
378
42
800
Gran Total
=
75
SC. Tratamientos =
SC. Total =
32 000=464
ANAVA
Fuentes de Variacin
Tratamiento
Error
Total
SC
432
32
464
GL
3
16
19
CM,
72
2
F
36
SIG
**
F 0.05 3,24
0,01 5,29
C.V. =
x 100= 3, 52%
76
Durante el experimento todas las parcelas dentro del bloque se deben tratar igual,
excepto cuando se aplique un tratamiento cuyo efecto se quiere medir. Por ejemplo, si
los tratamientos son niveles de fertilizacin, todos los dems factores como
preparacin del suelo, poca, densidad de siembra, labores de cultivo, uso de
plaguicidas, riegos y variedades deben ser exactamente iguales para todas las parcelas,
si no es as, se introduciran otras fuentes de variacin cuyo efecto no se podra medir,
y ocultaran el efecto de los tratamientos en estudio.
A continuacin se da una representacin grfica de los diseos completamente
randomizado y bloques completa randomizado, donde las letras indican tratamientos,
los nmeros romanos representan los niveles de variacin de una fuente, cada
casillero corresponde a una unidad experimental.
Este diseo tambin se conoce como diseo de doble via, se aplica cuando el material
es heterogneo. Las unidades experimentales homogneas se agrupan formando
grupos homogneos llamados bloques.
Ventajas
El agrupamiento de las unidades experimentales en bloques, debido a la
existencia real de esta fuente de variabilidad, aumenta la precisin del
experimento con relacin a un D.C.A.
No existe restricciones en cuanto al nmero de tratamientos o bloques
El anlisis estadstico es simple
Si se pierde los datos de un bloque completo, estos pueden omitirse sin
mayores complicaciones para el estudio. Si faltan datos de unidades
experimentales, estos pueden estimarse (estimacin de unidades perdidas)
Ventajas
Cuando la variabilidad entre las unidades experimentales dentro de los bloques
es grande, resulta un error experimental considerable. Esto ocurre usualmente
cuando el nmero de tratamientos es muy grande.
Si existe interaccin entre los bloques y los tratamientos, esta va incluida en el
error experimental
Si no existe una real diferencia entre bloques, habr una perdida de precisin
en el experimento con relacin al D.C.A. debido a la disminucin de los grados
de libertad del error.
COMPLETAMENTE
RANDOMIZADO
B
B
D
B
A
D
C
A
A
C
A
A
C
C
B
C
BLOQUE COMPLETO
RANDOMIZADO
I
II
III
IV
B
A
C
D
D
D
B
A
A
C
A
B
C
B
D
C
77
REPETICIONES
J=1,2,3,r
Tratamiento
i=1,2,3t
1
2
Suma Media
t
Suma
Media
Caractersticas:
1. Las unidades experimentales son homogneas
2. Las unidades homogneas estn agrupadas formando bloques
3. En cada bloque se tiene un nmero de unidades igual al nmero de
tratamientos (bloque completo)
4. Los tratamientos estn distribuidos al azar en cada bloque
5.- El nmero de repeticiones es igual al nmero de bloques.
A N A V A
Fuente de Variacin
SC
TRATAMIENTOS
TC
REPETICIONES
TC
ERROR
TOTAL
TC
GL
CM
t1
r1
(t 1)(r 1)
n1
TC =
78
Variedades
Bayo
Canario
Blanco
Testigo
De Palo
Panamito
Total
Promedio
1
42
32
25
18
35
36
188
31,33
REPETICIONES
2
3
4
46
38
41
38
31
30
32
28
26
20
26
24
42
46
40
25
22
26
203
191
187
33,83 31,83 31,17
total
167
131
111
88
163
109
769
Promedio
41,75
32,75
27,75
22,00
40,75
27,25
32,04
TC =
SC total
SC repeticiones
SC tratamientos
24640 = 1251
SC
GL
CM
Sig.
1251
27
287
1365
5
3
15
23
250.2
9.0
19.13
13.08
0.47
**
n.s.
Los datos indican que se debe rechazar Ho, por lo tanto existe diferencia entre los
tratamientos. La prueba de significacin establecer la superioridad estadstica de una
variedad respecto a otras
El coeficiente de variabilidad del experimento ser igual a
C.V. =
Donde:
Parcela a estimar
r Nmero de repeticiones
B Total del bloque donde se perdi la parcela
t Nmero de tratamientos
T Total del tratamiento donde se perdi la parcela
G Total general
Cuando ya se estima este valor, se coloca en la parcela faltante y se analiza el
experimento normalmente, slo que los grados de libertad del error y total se
disminuyen en una unidad. Esto se debe a que dicho valor o valores estimados no
tienen desviaciones, por tal razn, no contribuyen a la suma de cuadrados del error.
Por lo tanto, en el total, la suma de cuadrados del tratamiento est aumentada en la
cantidad dada por la siguiente ecuacin (siempre y cuando el nmero de tratamientos
sea mayor a diez)
[
]
80
CARACTERISTICAS
- Las unidades experimentales (u.e.) se distribuyen en grupos, bajo dos criterios
de homogeneidad dentro de la fila y dentro de la columna y heterogeneidad en
otra forma
- En cada fila y en cada columna, el nmero de columnas es igual al nmero de
los tratamientos
- Los tratamientos son asignados al azar en las unidades experimentales dentro
de cada fila y dentro de cada columna
- El nmero de filas es igual al nmero de columnas e igual al nmero de
tratamientos
- Los anlisis estadsticos T student, Duncan, Tuckey y en prueba de contraste se
procede como el diseo completo al azar y el diseo de bloques. La desviacin
estndar de la diferencia de los promedios y la desviacin estndar de del
promedio, estn en funcin del cuadrado medio del error experimental.
- El nombre de cuadrado latino, se debe a R. A. Fisher, las primeras aplicaciones
fueron en el campo agronmico, especialmente en los casos de suelos con
tendencias en fertilidad en dos direcciones.
VENTAJAS
La existencia real de dos fuentes de variabilidad entre las unidades
experimentales y su separacin en el anlisis de variancia permite incrementar
la precisin experimental
La prdida de una o ms unidades experimentales (U.E.) no influye
esencialmente el ANAVA de ste diseo, siendo posible estimar los resultados
de las U.E. perdidas
DESVENTAJAS
El diseo no es flexible ya que el nmero de tratamientos depende del nmero
de filas y columnas que se disponga.
La existencia de interacciones de 2 efectos (filas x columnas, filas x
tratamientos, columnas x tratamientos) 3 efectos (filas x columnas x
tratamientos) va incluida en el error experimental
No es recomendable para un elevado nmero de tratamientos ya que en estos
casos se requiere de un elevado nmero de unidades experimentales.
Formacin de cuadrados latinos
Suponga 4 tratamientos A, B, C, D, con estos tratamientos se pueden formar 4 cuadros
diferentes llamados tpicos o estndar (en primera fila y en primera columna se tiene
la misma distribucin
81
A
B
C
D
B
C
D
A
C
D
A
B
D
A
B
C
D
C
A
B
A
B
C
D
B
C
D
A
C
D
A
B
D
A
B
C
D
C
B
A
A
B
C
D
B
A
D
C
C
D
A
B
D
C
B
A
A
B
C
D
B
A
D
C
C
D
B
A
D
C
A
B
A
B
C
D
B
A
D
C
C
D
B
A
A
B
C
D
B
D
A
C
C
A
D
B
D
C
B
A
B
A
D
C
C
B
A
D
De cada cuadro se obtiene 144 formas diferentes, en total se tiene 576 cuadros
diferentes.
La siguiente tabla permite relacionar el nmero de cuadros en funcin del tamao
Tamao No. De formas
del
tpicas
cuadro
3x3
1
4x4
4
5x5
56
6x6
9408
Valor de
n (n
12
144
2880
86400
No. Total de
Cuadrados
diferentes
12
576
161280
812851200
Asignacin de tratamientos
Los tratamientos deben asignarse empleando uno de los cuadro de los posibles, es
decir si son cuatro tratamientos, escoger entre los 576 posibles.
Este diseo se recomienda cuando el nmero de tratamientos oscila entre 3 y 10.
82
ANAVA
Fuente de Variacin
SC
Tratamientos
TC
Hileras
TC
Columnas
TC
Error
Total
GL
CM
t1
r1
c1
(r 1)(r 2)
n1
TC
TC =
Ejemplo:
Un experimento con cuatro variedades de arroz, con gradientes en dos sentidos, se
muestran a continuacin (el rendimiento se d en Kg/parcela)
Total hilera
Total columna
Total de Tratamientos A = 32
B
2
A
7
D
5
C
6
D
3
C
5
B
4
A
9
A
6
B
5
C
9
D
5
C
8
D
7
A
10
B
5
20
21
25
30
B =16
TC =
SC total =
SC hileras =
SC columna =
SC tratamientos =
C = 28
=
19
24
28
25
96
D = 20
= 576
576 = 74
576 10,5
576 = 15,5
576 =40 9,78
83
Fuentes de Variabilidad
Tratamiento
Hilera
Columna
Error
Total
SC
10
10.5
15.5
8
74
A
GL
3
3
3
6
15
CM
13.333
3.5
5.166
1.1333
F
10.00
2.625
3.875
SIG
**
N.S
N.S
F (0,05) = 4,76
(0,01) = 9,78
x 100=17,74%
]
( )( )
Donde:
X = Parcela estimada
H = Total de hileras donde est la parcela perdida
C = Total de columnas donde est la parcela perdida
T = Total del tratamiento donde est la parcela perdida
G = Total general
r = Nmero de repeticiones
Igual que en el diseo de bloques al azar, la suma de cuadrados de los tratamientos se
debe corregir cuando el nmero de tratamientos sea mayor de 10, restndole el
siguiente trmino
[
]
[
84
EXPERIMENTOS FACTORIALES
Los factoriales son combinaciones de factores (nitrgeno, fsforo, variedades, sustancias,
niveles de concentrado, etc.) para formar tratamientos, los cuales se aplican en los
diseos experimentales (DCA, DBCA, DCL). La informacin obtenida de estos
experimentos es amplia, ya que permiten comparar los niveles de cada factor entre si
y evaluar las interacciones que resulten como combinaciones de los factores, as como
la comparacin de niveles de un factor bajo un nivel de otro factor.
En un experimento con factoriales, si todos los niveles de un factor se combinan con
todos los niveles de otro factor, entonces se dice que estos factores estn cruzados. Si
los niveles de un factor se combinan con ciertos niveles de otro factor se dice que
estos factores estn anidados.
Ejemplo
Los niveles de un factor A
Los tratamientos.
Los factores A y B estn cruzados
Ejemplo
Los niveles de un factor A
Los tratamientos.
El factor B esta anidado. Se representa como B(A)
En el presente capitulo ser tratado los factoriales con FACTORES CRUZADOS.
CONCEPTOS GENERALES
FACTOR.
Es sinnimo de tratamiento e involucra diferentes niveles. Por ejemplo el Nitrgeno
en la formacin del abono, este puede contener diferentes porcentajes, cada uno
constituye un nivel que tambin representa un tratamiento.
FACTORIAL
Es una combinacin de factores para formar tratamientos.
85
NIVEL
Es la dosis o cantidad del ingrediente (Factor) empleado en el tratamiento. Ejemplo. 2
% de nitrgeno
EFECTO PRINCIPAL
Es el efecto promedio del factor sobre los otros niveles del mismo factor
independiente de los otros factores. Ejemplo: Efecto de nitrgeno en las unidades
experimentales al aplicar un abono formado por nitrgeno, fsforo y potasio.
EFECTO INTERACCION
Es el efecto adicional debido a la influencia combinada de dos o ms factores.
Ejemplo. Efecto conjunto Nitrgeno-Fsforo en la unidad experimental.
EFECTO SIMPLE
Es el efecto de los niveles del factor en un nivel de otro factor. Ejemplo. Efecto del
nitrgeno bajo la presencia de 0.5 % de fsforo. Es un efecto derivado del efecto de la
interaccin.
EFECTO SIMPLE SIMPLE
Es el efecto de los niveles del factor a una combinacin de los otros factores, por
ejemplo, el efecto del nitrgeno en las unidades experimentales, bajo la presencia de
0.5% de fsforo y 1% de Potasio.
TIPOS DE FACTORES
FACTORES CUANTITATIVOS
Si sus niveles son cantidades cuantificables. Ejemplo. Niveles de Fsforo a 0.5%, 1% y
1.5%
FACTORES CUALITATIVOS
Si sus niveles no tienen orden natural y corresponden a clases o categoras. Ejemplo.
Variedades de frjol.
Ejemplo, un factor es definido por 3 sustancias de crecimiento a 4 niveles de
concentracin aplicados en un experimento para evaluar la propagacin vegetativa de
un cultivo sobre medios artificiales. La formacin de callos se medir a la cuarta
semana.
El factor (A) sustancia de crecimiento con niveles:
: Acido Indolactlco (A/A)
: Cinetina (C)
: Acido Naftalenoactico (ANA)
86
,...,
= 10 M de concentracin de A/A
Si cada tratamiento se aplica a 4 unidades experimentales, se requiere 48 unidades
experimentales (u.e) para realizar el experimento.
Los factoriales son expresados mediante la siguiente notacin:
2A2B = 2x2 = : 2 niveles de A por 2 niveles de B.
2A3B = 2x3 : 2 niveles de A por 3 niveles de B.
2A2B2C = 2x2x2 = ; 3 factores a 2 niveles cada uno.
2A3B3C = 2x : 2 niveles de A por 3 niveles de B y 3 niveles de C.
FORMACION DE FACTORIALES
En la formacin de factoriales, se debe tener presente lo siguiente:
1.- Que factores deben incluirse.
2.- Que factores son fijos (modelo I) y que factores son al Azar (modelo II).
3.- Cuantos niveles por factor
4.- SI son factores cuantitativos, cul debe ser el espaciamiento entre los niveles del
factor. Por ejemplo: 0%, 5% y 10% de nitrgeno, significa igual espaciamiento.
VENTAJAS Y DESVENTAJAS EN EXPERIMENTOS CON FACTORIALES
Los experimentos con factoriales tienen las siguientes ventajas:
87
1.- Permiten el estudio de los niveles de cada factor y las Interacciones entre ellos.
2.- Permiten el estudio de los niveles de un factor en la combinacin de un slo nivel
de otro factor (estudio de efectos simples).
3.- Todas las unidades experimentales intervienen en el estudio de todos los efectos
del factor (principales e interaccin)
Desventajas:
1.- El nmero de unidades experimentales utilizadas es mayor que en experimentos
simples y es ms difcil contar con un nmero suficiente de unidades que requiere
el experimento.
2.- El anlisis se complica, a medida que el nmero de factores y niveles aumenta.
3.- Algunas combinaciones pueda que no sean de importancia, pero deben incluirse
para completar el factorial, esto obliga a usar ms unidades experimentales.
ANALISIS ESTADISTICO DE LOS FACTORIALES
Los factoriales son los tratamientos en los diseos experimentales, esto significa que la
fuente de variacin debida al efecto de tratamientos comprende los efectos derivados
de la combinacin de los factores. As, por ejemplo:
Factor A, con 3 niveles, factor B con 2 niveles. El nmero de tratamientos son 3x2 = 6,
con grados de libertad igual a (6-1)= 5.
Esta fuente (tratamientos) est descompuesta en:
Efecto de A con (3-1) =2 gl.
Efecto de B con (2-1) = 1 gl.
Efecto de AB con (3-1) (2-1) = 2 gl.
La suma de los grados de libertad 2+1+2 = 5, es igual a los gl. de tratamientos.
La descomposicin es ortogonal, esto significa que los tratamientos deben tener
IGUAL NUMERO DE REPETICIONES, de lo contrario no ser posible descomponer en
forma ortogonal la suma de cuadrados de tratamientos. La suma de cuadrados de
tratamiento cumple la siguiente relacin:
SC (Tratamientos) = SC(A) + SC (B) + SC (AB)
En el caso de tres factores combinados (A, B y C), por ejemplo, 2 niveles de A, 3 niveles
de B y 2 niveles de C resulta:
2x3x2 =12 tratamientos, los gl. para tratamientos es 11
Las fuentes de variacin deducidas son:
De lo efectos principales:
A con (2-1) = 1 gl.
B
(3-1) = 2 gl.
C
(2-1) = 1 gl.
88
4.- Construido el cuadro, proceder a obtener los esperados cuadrados medios, segn:
a.- Para un factor, por ejemplo A, no considerar esta columna, luego multiplique los
valores de los casilleros correspondientes a las filas que tienen en el margen
izquierdo la letra correspondiente al factor.
89
b.- Para una interaccin, por ejemplo AB, no considerar las columnas que
corresponden a estos factores (A,B), luego multiplique los valores de los
casilleros correspondiente a las filas que tienen en el margen izquierdo las
letras correspondientes a la interaccin.
c.- Para el error, multiplique los valores que corresponden a la fila del ERROR.
Ejemplo
Considere 3 factores A, B y C que se combinan para formar tratamientos y se aplican
en un DCA con 5 repeticiones.
A: factor al azar con 2 niveles, B: factor fijo con 3 niveles, C: factor fijo con 4
niveles. Aplicando la metodologa, resulta:
A
B
C
AB
AC
BC
ABC
Error
A
1
2
2
1
1
2
1
1
B
3
0
3
0
3
0
0
1
C
4
4
0
4
0
0
0
1
R
5
5
5
5
5
5
5
1
Variancia
A
B
C
AB
AC
BC
ABC
error
F (1,96)
F (2, 2)
F (3, 3)
F (2,96)
F (3,96)
F (6,6)
F (6,96)
90
INTERACCION DE FACTORES
La interaccin de los factores juega un papel importante en el anlisis, de ah que las
pruebas de F, se realizan en el siguiente orden: primero la interaccin de orden
superior, luego la de menor orden y por ltimo los factores principales.
Si la interaccin de mayor orden resulta significativa, termina las pruebas del cuadro
del ANAVA y se procede a los anlisis de los efectos simples-simples, esto significa
comparar los niveles de un factor en la combinacin de los otros factores.
Si la interaccin de mayor orden no es significativa, continan las pruebas de F con las
interacciones de menor orden, si alguna de estas interacciones resulta significativa, se
procede a los anlisis de los efectos simples en estos factores; as, comparar los
niveles del factor bajo la presencia de un nivel de otro factor.
Si en una prueba de una interaccin de menor orden no resulta significativa, se
continan las pruebas de F de cada factor por separado, en el cuadro de ANAVA.
Los resultados de cuadros de ANAVA para 3 factores (ABC) resultan:
Ejemplo.- ABC: *
Termina el ANAVA, continan los anlisis de los efectos simples simples, es decir
comparar los niveles del factor A en cada una de las combinaciones de los otros
factores, B y C de igual forma.
Ejemplo.- ABC: n.s.
Continan el anlisis del ANAVA.
AB: n.s.
AC: n.s.
BC: n.s.
Continan el anlisis del cuadro de ANAVA, para los efectos principales de A, B y C.
Ejemplo.- ABC: ns
Contina el anlisis del ANAVA.
AB: *
AC: n.s.
BC: n.s.
Se prueban los efectos simples en cada factor (A y B), es decir comparar los niveles de
A bajo la presencia de cada nivel de B y comparar los niveles de B bajo la presencia de
cada nivel de A.
Luego continuar con el anlisis en cuadro de ANAVA slo para los efectos principales
de C.
Ejemplo.- ABC: n.s.
91
) B con niveles (
92
Bloques
10
30
20
15
10
40
10
30
20
60
15
10
40
65
25
40
60
125
4,33
2,5
4,15
Cuadro de totales
Cuadro de promedio
93
]
] /3 = 40
] /3 = 103.33
A los grados de libertad de cada efecto simple le corresponde los grados de libertad
del factor correspondiente, as:
gl A( ) = 3-1=2
gl A(b2) = 3-1=2
gl B( ) = 2-1 =1
La prueba estadstica se realiza mediante la prueba de F, los grados de libertad del
efecto en estudio para el numerador y los grados de libertad del error para el
denominador.
El valor de F calculado:
Fc = CM (del efecto) / CM (error)
] /CM (error).
As para A (b2): Fc = CM [
Si el valor de Fc es superior o igual al valor crtico (F), entonces se afirma
estadsticamente que hay diferencia en los niveles del factor A bajo la presencia del
nivel
. Si esto ocurre, puede realizar una prueba de t o Duncan, con los promedios;
as por ejemplo mediante t-student:
Para la comparacin en A (b2), requiere la siguiente informacin:
Promedios :
=3
=3
=3
94
En tablas , gl error
DLS (t-student) = t.Sd
Notar que en la desviacin estndar de la diferencia se considera el valor de "r", es el
nmero de datos que genera un promedio en estos efectos simples.
FACTORIAL 2A2B =
Es el factorial ms elemental en experimentacin, formado por la combinacin de 2 factores a
2 niveles cada uno. Puede aplicarse a cualquier diseo experimental.
EJEMPLO:
Factorial 2A2B en Bloques Completos al Azar
Considere los factores CONTROL DE MALEZAS y FERTILIZANTE.
El factor (A) malezas con niveles:
= sin control de malezas
= con control de malezas
El factor (B) fertilizante con niveles:
= sin aplicacin de fertilizante
= con aplicacin de una dosis de fertilizante
Los tratamientos son:
= sin control de malezas ni fertilizante. Constituye el tratamiento testigo.
= Se aplica dosis de fertilizante.
= Se aplica control de maleza.
= Se aplica control de maleza y fertilizante.
Suponga que estos tratamientos se aplican en un diseo Bloques completos al azar en 5
bloques, entonces el modelo aditivo lineal es el siguiente:
Yijk = + Bk + + j + (
)ij + iyk
=1,2
j=1.2
k=1,2,...,5
= constante: parmetro
Bk = efecto del bloque k: parmetro
= efecto del nivel a : parmetro
j= efecto del nivel bj: parmetro
(
) j = efecto de la interaccin : parmetro
iyk = efecto del error. Valor aleatorio normal e independientemente distribuido con media 0 y
variancia
95
.../ (abr) =
.../20
SC (A) =
.../10 - TC
SC (B) =
/10 - TC
SC (AB) = (
SC (AB) = (
/r - TC
= 110
= 96
= 140
96
Entonces:
944,15
SC (Trata.)
594,05
SC (B)
328, 05
EFECTO
109
81
21
45
96
110
DIVISOR
20
20
20
SC
594,05
328,05
22,05
140
Los signos se colocan segn el nivel; nivel (1) signo (-), nivel (2) signo (+) para los efectos
principales. La fila de la interaccin se obtiene multiplicando los signos de dichos factores: (-)
(-) = (+)y (-)(+) = (-)
Los totales de tratamientos se colocan en la ltima fila.
El valor del efecto, se obtiene sumando los totales de los tratamientos con los signos
correspondientes a la fila de la fuente de variacin.
Efecto en A = -45 - 96 + 110 + 140 = 109
Efecto en B = - 45 + 96 - 110 + 140 = 81
Efecto AB = +45-96- 110+ 140 = -21
El valor del divisor corresponde al producto de los bloques por la suma de cuadrados
de los coeficientes del contraste. As para el efecto de A, se tiene:
r
5[
] = 20
97
GL
4
3
1
1
1
12
SC
1024,16
944,15
594,05
328,05
22,05
390,36
CM
256,04
594,05
328,05
22,05
32,53
Fc
7,87
18,26
10,08
0,68 n.s.
Fc
3,16
9,33
CONCLUSIONES
Hay diferencia altamente significativa en el rendimiento de las parcelas a las que se aplicaron
control de maleza frente a las que no se aplicaron. Las parcelas que recibieron fertilizante
presentan diferencias altamente significativas de las parcelas que no recibieron fertilizante
alguno. La formacin de Bloques permiti disminuir el error experimental, pues el efecto es
significativo.
El coeficiente de variacin es de 29.17%, aceptable dentro de los rangos establecidos para
experimentos de campo.
Las pruebas de comparacin de promedios no son necesarias en este caso, porque cada factor
cuenta solamente con 2 niveles. Segn el rendimiento promedio de los niveles, se puede
afirmar que la fertilizacin y el control de maleza aumentaron el rendimiento.
Para dar conclusiones ms detalladas sobre las combinaciones se deben realizar pruebas sobre
grupos de tratamientos seleccionados o pruebas de promedios de tratamientos.
Dado que Los factoriales forman tratamientos, estos pueden ser sometidos a cualquier prueba
comparativa, segn el inters del investigador, as por ejemplo plantear contrastes.
Ejercicio.
Realizar la prueba de comparacin de tratamientos mediante contrastes ortogonales y
la prueba de Duncan para los promedios, si los tratamientos son:
= tratamiento testigo.
= Se aplica dosis de fertilizante.
= Se aplica control de maleza.
Se aplica control de maleza y fertilizante.
98
vs dems tratamientos.
.
Ejemplo.
10
A1
B1
1
2
3
2
8
A2
B2
2
4
6
4
16
A1 = 24
B1 = 20
TOTAL
B1
1
3
4
4
12
B2
4
7
7
10
28
A2 = 40
B2 = 44
8
16
20
20
64
64
64
TC =
Sc total =
SC de A =
90
= 16
99
SC de B =
256 =36
SC de combinado AB =
56
SC de la interaccin AB = 56 16 36 = 4
SC de block =
256 =24
SC
GL
CM
24
16
36
4
10
90
3
1
1
1
9
15
8
16
36
4
1,11
7,21
14,41
32,43
3,60
SIG
N.S.
Se puede deducir las siguientes conclusiones, relacionadas con los efectos principales
de A y B; tales como: que la variedad Y supera a la variedad X en rendimiento, y que
con el abonamiento nitrogenado aumenta se aumenta la produccin. Por otra parte,
por los resultados obtenidos, no se justifica estudiar los efectos simples A ni de B
Ejemplo
Se tiene el siguiente experimento en el que se estudia tres variedades de soya y la
cantidad de plantas por golpe
Variedades
Cantidad de plantas
= 2 plantas cada 20 cm. en surcos de 80 cm. de ancho
plantas cada 20 cm. en surcos de 80 cm. de ancho
= 4 plantas cada 20 cm. en surcos de 80 cm. de ancho
Se instal en 5 repeticiones o block y el diseo experimental usado fue block
completamente randomizado. Los datos ordenados son:
100
BLOQUE
I
II
II
IV
V
VC
V
C
C1
9
10
11
11
14
55
V1
C2
10
13
15
16
15
69
V1 = 182
C1 = 157
C3
10
12
12
13
11
58
C1
10
9
12
12
15
58
V2
C2
12
10
9
16
13
60
V2 = 182
C2 = 195
C3
13
11
9
17
14
64
C1
6
7
9
12
10
44
V3
C2
10
12
14
16
14
66
V3 = 184
C3 = 196
TOTAL
C3
9
13
16
19
17
74
89
97
107
132
123
548
548
548
TC =
SC de block =
SC de V =
6673,42 = 0,18
SC de C =
SC de VC =
122.18
356,58
SC
GL
CM
141,24
0,18
65,91
56,09
93,16
356,58
4
2
2
4
32
144
35,31
0,09
32,95
14,02
2,91
12,13
0,03
11,32
4,81.
C.V. =
SIG
N.S.
101
SC de C en
SC de C en
A N A V A
Fuentes de variabilidad
Efectos simples de C
Efecto C en
Efecto C en
Efecto C en
Error
SC
GL
CM
SIG
21,7
3,7
96,5
93,16
2
2
2
32
10,85
1,85
48,25
2,91
3,72
0,63
16,58
N.S.
BLOQUE
I
II
III
IV
V
ABC
AB
BC
AC
A
B
C
A1
B0
B1
C0
C1
5
5
7
10
3
5
3
4
2
1
20
25
A0B0 = 45
B0C0 = 50
A0C0 = 40
C0
C1
4
4
7
9
3
4
4
3
2
0
20
20
A0B1 = 40
B0C1 = 45
A0C1 = 45
A0 = 85
B0 = 95
C0 = 100
B0
B1
C0
C1
C0
C1
6
3
6
9
7
7
9
10
6
5
7
9
5
3
4
8
6
2
4
9
30
20
30
45
A1B0 = 50
A1B1 = 75
B1C0 = 50
B1C1 = 65
A1C0 = 60
A1C1 = 65
A1 = 125
B1 = 115
C1 = 100
TOTAL
42
66
42
34
26
210
210
210
210
210
210
210
TC =
SC total =
SC de block =
102
SC de A =
SC de B =
SC de C =
SC de AB =
SC de AB (corregida) = 72,5 40,0
SC de AC =
1102,5 =42,5
1102,5 =22,5
1102,5 = 107,5
SC de ABC (corregido) =107,5 40,0 10,0 2,5 22,5 0,0 10,0 = 22,5
SC de error = 259,5 40,0 10,0 2,5 22,5 0,0 10,0 22,5 112,0
ANAVA
FUENTES DE VARIACION
SC
GL
CM
FuentesBloques
de variabilidad
Efecto principal A
Efecto principal B
Efecto principal C
Efecto de Int. AB
Efecto de Int. AC
Efecto de Int. BC
Efecto de Int. ABC
Error
total
112,0
SC
40,0
10,0
2,5
22,5
0,0
10,0
22,5
40,0
259,5
4
GL
1
1
1
1
1
1
1
28
39
28,8
CM
40,0
10,0
2,5
22,5
0,0
10,0
22,5
1,4
20.00
F
28,57
7,14
1,79
16,07
0,00
7,14
16,07
Sig
N.S.
ANALISIS DE COVARIANCIA
En el anlisis de covariancia se combinan los conceptos del anlisis de variancia para un diseo
experimental y para la regresin. El anlisis de covariancia es utilizado en casos en los que la
variable respuesta de un diseo experimental est relacionada con una o ms variables
concomitantes (variables externas independientes) y se presentara el anlisis para el Diseo
Completamente al Azar y Bloques Completos al Azar
103
Control de variables externas que implican una disminucin del error que se traduce
en una mayor precisin del anlisis.
Ajuste de las medias de tratamiento de la variable independiente ( Y ) , por las
diferentes variables independientes (concomitantes)
Ayuda en la interpretacin de los datos, especficamente en la naturaleza del efecto de
los tratamientos
El peso inicial (X) de animales se relaciona al peso final (Y), cuando estos animales
estn sujetos a diferentes raciones. Se estudia el efecto de las raciones a travs de los
pesos observados.
El nmero de plantes (X) por parcela. Se estudia el rendimiento total (Y) de la parcela.
El rendimiento (X) de las parcelas en una produccin anterior y el rendimiento (Y) de
las mismas parcelas al finalizar el experimento. El estudio consiste en comparar
variedades de un determinado cultivo
La incidencia de plagas (X) en el rendimiento de algunas variedades, el estudio es
comparar las variedades
En cada caso se entiende que la variable X tiene un efecto en la variable Y, sin embargo esta
dependencia deber ser probada estadsticamente mediante el ANLISIS DE REGRESION.
En algunos casos puede existir ms de una variable externa o multivariables, ejemplo
.Este caso puede resolverse matricialmente y con ayuda del computador porque los
procesos manuales son tediosos
Ejemplo:
Se utiliz un experimento para determinar si tres tipos de dietas producen el mismo peso en
gallinas (en cientos de gramos). Por ello se registr el peso inicial (en cientos de gramos) de las
gallinas antes del experimento. Los datos obtenidos fueron
A
Total
n
3
4
7
14
12
14
16
42
8
9
8
25
20.2
21,3
18,9
60,4
10
10
11
31
19,0
19,2
20,0
58,2
Gran total
70
160,6
9
Anlisis de covariancia
I.- Calcular los trminos de correccin
TC X
= 544.44
TC Y
= 2865,82
TC XY
1249,11
Para el total
SC xx
544,44
SC yy =
2865,82
Para tratamiento
Txx =
- TC =
Tyy =
- TC =
Txy =
TC =
544,44 = 49,56
2865,82 = 67,31
1249,11 =51,62
105
= Eyy -
= 11,44 -
= 1,89
=15,49
= 78,76 -
CUADRO DE ANCOVA
Fuentes de
variacin
Tratamientos
GL
t-1
Txx
Txy
Tyy
Error
rt
Exx
Exy
Eyy
Eyy -
Trat + Error
r-1
SCxx
SCxy
SCyy
SCyy -
r.- 2
Diferencia
t-1
Tratamiento
GL
CM
r. - t- 1
CM residual
Diferencia/(t 1)
ajustado
SC
Ajustad.
SC y SP
Fuentes
variacin
de
GL
ajustad
ajustad
0,3789
6,79
49,56
51,62
67,32
Error
10,00
9,77
11,44
1,89
Tratam + Error
59,56
61,39
78,76
15,49
Diferencia
prueba
de
CM
Tratamientos
para
Gl
13,589
0 (el peso final de las gallinas depende linealmente del peso inicial de las
gallinas)
106
Fc
= 25,19
Conclusin.
Con un nivel de significacin del 5% se obtiene que Fc Ft, se rechaza la Ho, es decir podemos
afirmar que existe suficiente evidencia estadstica para afirmar que el peso inicial de las
gallinas depende linealmente de su peso final
Bibliografa:
-
Alvarado Pintado Luis y Agurto Meja Hugo. (2009) Estadstica para Administradores y
Economa con aplicaciones en Excel. Editorial San Marcos E.I.R.L. Per
Di Rienza Julio Alejandro, Casanoves Fernando, Gonzales Laura Alicia, Tablada Elena
Margot, Diza Mara del Pilar, Robledo Carlos Walter, Balzarini Mnica Graciela (2008)
Estadstica para las ciencias agropecuarias. Sptima edicin. Argentina
Toma Inafuko Jorge (2014) Estadstica aplicada segunda parte. Segunda edicin.
Universidad del Pacifico. Lima
107