Sie sind auf Seite 1von 107

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

PRUEBA DE HIPOTESIS
HIPTESIS
a Es el enunciado acerca de una poblacin, elaborado con el propsito de ponerlo a aprueba
PRUEBA DE HIPTESIS
Procedimiento basado en la evidencia muestral y la teora de probabilidad que se emplea para determinar
si la hiptesis es un enunciado razonable.

PROCEDIMIENTO PARA PROBAR UNA HIPTESIS:


1.- Plantear la hiptesis nula
Hiptesis nula

y la hiptesis alternativa

.- Hiptesis planteada con el objetivo de ser probada. Podemos

aceptarla o rechazarla. Tal hiptesis es una afirmacin que se aceptar si los datos
muestrales no pueden proporcionar evidencia convincente que es falsa.
Hiptesis alternativa

.- Denominada tambin hiptesis de investigacin.

Afirmacin que se aceptar si los datos muestrales proporcionaron amplia


evidencia de que
es falsa
2.- Seleccionar el nivel de significancia.- Nivel de significancia es la probabilidad de
rechazar la hiptesis nula cuando es verdadera. Al nivel de significacin se le
denomina , tambin se le conoce con el nombre de nivel de riesgo. Tambin se le
conoce como nivel de significacin.
Generalmente se usa el nivel del 5% para proyectos de investigacin, 1% para el
aseguramiento de calidades y 10% para encuestas polticas.
En el proceso de probar una hiptesis podemos cometer dos tipos de errores: error
del tipo I usualmente denotado por la letra griega alfa () mientras que la
probabilidad de cometer el error tipo II est representada por la letra griega beta (
)
Error tipo I () es rechazar la hiptesis nula (

cuando en realidad es verdadera.

Error tipo II (

cuando en realidad es falsa

es aceptar la hiptesis nula (

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Poblacin

Muestra

Se acepta
Se rechaza

es verdadera
rechaza Ho
Decisin Correcta
Ho
Error Tipo I

es falsa
Ho
Error Tipo II
Decisin correcta

3.-Calcular el valor estadstico de prueba.- Existen muchos valores estadsticos de


prueba: z, t, chi cuadrado, F, etc.
Es el valor obtenido a partir de la informacin muestral que se utiliza para
determinar si se rechaza la hiptesis nula.
Valor estadstico de la prueba.- Valor obtenido a partir de la informacin muestral
que se utiliza para determinar si se rechaza la hiptesis nula. En la prueba de
hiptesis para la media () el valor estadstico de prueba Z t se determinan a
partir de:

4.- Formular la regla de decisin.- Es un enunciado de las condiciones segn las que se
acepta o se rechaza la hiptesis nula.

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Valor crtico es el valor que es el punto divisorio entre la regin de aceptacin y la


regin de rechazo de la hiptesis nula
5.-Toma de decisin.- Es aceptar o rechazar la hiptesis nula.
POTENCIA DE UNA PRUEBA.- Es la probabilidad de tomar la decisin acertada de
rechazar
cuando esta es falsa o de aceptar
cuando esta es verdadera. La
potencia de una prueba se calcula mediante 1

PRUEBA PARA LA MEDIA DE LA POBLACIN: MUESTRA GRANDE


PRUEBA DE HIPTESIS CON MUESTRAS GRANDES ( n30) RESPECTO A UNA MEDIA
DE POBLACIN PARA UNA PRUEBA DE DOS COLAS (BILATERAL) DE LA FORMA:
Ho:

Ha:
Estadstico de prueba:

conocida

Z=
Estadstico de prueba:

desconocida:

Regla de rechazo a un nivel de significancia :


Rechazar

si Z

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Ejemplo
Se desea probar si una nueva tcnica de siembra en vivero produce diferencias en la
longitud de plantines de algarrobo, luego de tres meses de realizada la siembra. Bajo la
tcnica tradicional, las plantas alcanzan una altura promedio de 15 cm, con una
desviacin estndar de 3 cm. El ensayo consisti en evaluar 16 plantines de algarrobo
al cabo de tres meses de sembrado con la nueva tcnica, obtenindose un promedio
de altura de 17 cm. Con =0,05 realizar la prueba de hiptesis correspondiente.
Solucin
Ho: = 15
Ha: 15

El valor estadstico de la prueba es:

Z=

Z=

= 2,66

Como el valor de la prueba est en la regin de rechazo, se rechaza

y, por lo tanto,

se acepta
Ejemplo
La tasa anual de resurtido de botellas de aspirinas es 6.0 (esto indica que las
existencias del medicamento tienen que renovarse en promedio 6 veces al ao en un
establecimiento). La desviacin estndar es 0,50. Se sospecha que el volumen de
4

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

ventas promedio ha cambiado y no es 0,60. Se utilizar el nivel de significancia de 0.05


para probar esta hiptesis.
a.- Plantee la hiptesis nula y alternativa
b.- Cul es la probabilidad de un error tipo I?
c.- Proporcione la frmula para el valor estadstico de la prueba.
d.- Enuncie la regla de decisin
e.- Se selecciona una muestra aleatoria de 64 frascos de tal producto, con una media
de
5.84, Debe rechazarse la hiptesis de que la media poblacional es 0.60?
Interprete los resultados.
Solucin:
a.

Ho: = 6
Ha:
6

b.- = 0,05
c.- El valor estadstico de la prueba es:

d.- El valor crtico de

Z=

1.96

Si el valor del estadstico de prueba resulta mayor a 1.96 o menor a -1.96 se rechaza
la hiptesis nula

Z=

2.56

Como el valor de la prueba est en la regin de rechazo, se rechaza


se acepta

y, por lo tanto,

(la tasa media no es igual a 6).

Ejemplo
El supermercado local gast en una remodelacin miles de nuevos soles durante
muchas semanas. Aunque la interrupcin espant a los clientes temporalmente, el
gerente espera que los clientes vuelvan a disfrutar de las nuevas comodidades. Antes
de remodelar, los recibos de la tienda promediaban $ 32 533 por semana. Ahora que
se ha terminado la remodelacin, el gerente toma una muestra de 36 semanas para
ver si la construccin afect de alguna manera el negocio. Se report una media de
$34 166 y una desviacin estndar de $12 955 Qu puede decir el gerente a un nivel
de significancia del 1%?
5

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Solucin

Rechazar Ho si:

Ho: = 32 533
Ha:

- 2.576

El estadstico de la prueba:

Z=

2.576

0.756
El valor de prueba est dentro de la zona de aceptacin, entonces se acepta Ho Es
decir la media es 32 533
Ejemplo
Una operacin en lnea de montaje automotriz tiene una media del tiempo de
terminacin de 2,2 minutos. Debido al efecto del tiempo de terminacin sobre las
operaciones anteriores y siguientes de ensamblaje, es importante mantener esta
norma de 2,2 minutos. Una muestra aleatoria de 45 tiempos da como resultado una
media del tiempo de 2,39 minutos con una desviacin estndar de 0,20 minutos.
Emplee un nivel de significacin de 0,02 y pruebe si la operacin cumple con la norma
de 2,2 minutos.
PRUEBA DE HIPTESIS CON MUESTRAS GRANDES (n 30) RESPECTO A UNA MEDIA
POBLACIONAL PARA PRUEBAS DE UNA COLA (UNILATERAL) DE LA FORMA
Ho:
Ha: o
Estadstico de prueba:

conocida

Z=

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Estadstico de prueba:

desconocida:
Z=

Regla de rechazo a un nivel de significacin


Rechazar
si
Z Z

Ejemplo
La produccin media de trigo por hectrea en una regin es de 2200 Kg con una
desviacin estndar
450Kg Se desea establecer si la aplicacin de fertilizantes
modifica el rendimiento medio de trigo. Para lo cual se elige 20 has (una en cada
chacra de la regin) y se encontr que el rendimiento promedio fue de 2650 Kg .Con
= 0,05 que se puede concluir.
Ho: 2200 Kg
Ha: 2200 Kg

Z=

= 4,47

En la tablas el valor de Z= 1,645


Como 4,47 es mayor que 1,645 se rechaza Ho.
Luego se concluye que la produccin media de trigo por Ha con fertilizacin, en la
regin, es significativamente mayor que 2200 Kg.

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

PRUEBA DE HIPTESIS CON MUESTRAS GRANDES (n 30) RESPECTO A UNA MEDIA


POBLACIONAL PARA PRUEBAS DE UNA COLA (UNILATERAL) DE LA FORMA
H0:
o
Ha: o
Estadstico de prueba:

conocida
Z=

Estadstico de prueba:

desconocida:
Z=

Regla de rechazo a un nivel de significacin


Rechazar

si

- Z

Ejemplo.Una encuesta nacional reciente, encontr que estudiantes de la Universidad miraban


un promedio de 6.8 DVD por mes. Una muestra aleatoria de 36 estudiantes
universitarios de la facultad de Agronoma, revel que el nmero medio de DVD
observado el mes pasado fue de 6.2, con una desviacin estndar de 0.5. En el nivel de
significancia de 0.05. Puede concluirse que los estudiantes de la facultad de
Agronoma ven menos DVD al mes que los de la Universidad?
H0:
Ha:

6.8
6.8

Regla de la decisin
Rechazar

si

Z - 1.645
8

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Valor de la prueba
Z=

7.2

Como el valor de la prueba est en la zona de rechazo se concluye rechazando la


hiptesis nula, esto es, que los estudiantes de la facultad de Agronoma ven menos
DVD, en promedio, que los estudiantes de la Universidad.
Ejemplo
El gerente de una compaa manufacturera grande estima que la edad media de sus
empleados es 22,8. El tesorero de la firma necesita una cifra de la edad media de los
empleados ms exacta a fin de estimar el costo de una prestacin por antigedad que
se considera para los empleados. El tesorero toma una muestra de 70 trabajadores y
observa que la edad media de los empleados muestreados es 26,2 aos con una
desviacin estndar de 4,6 aos. En el nivel de significacin de 0,01 Qu puede
concluir el tesorero acerca de la exactitud de la estimacin del gerente de produccin?
Ejemplo
La oficina de anlisis econmico, del Departamento de Comercio inform que la media
del ingreso anual de un residente de la ciudad de Piura es de $ 18 688 nuevos soles.
Un investigador de la ciudad de Piura desea probar
= $18 688 y
$ 18 688,
siendo la media del ingreso anual de un residente de la ciudad de Piura Cul es la
conclusin de la prueba de hiptesis si en una muestra de 400 residentes de la ciudad
de Piura se obtiene una media del ingreso anual de 16 860 nuevos soles y una
desviacin estndar de 14 624 nuevos soles? Emplee un nivel de significacin de 0,05.
PRUEBAS RESPECTO A LA PROPORCIN POBLACIONAL.
La prueba de hiptesis sobre proporciones se usa cuando queremos determinar si la
proporcin de los elementos en una poblacin, que tiene cierta caracterstica, es
mayor, igual o menor que algn valor especifico.
Relacin proporcional:
Es la relacin por cociente, o porcin relativa, que tiene un atributo particular de
inters.

Antes de probar una relacin proporcional debemos considerar algunos supuestos y


cumplirse algunas condiciones:
- Los datos muestrales recopilados son el resultado de conteo
9

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

El resultado de un experimento se clasifica como xito o fracaso


La probabilidad de xito se mantiene igual en cada ensayo
Los ensayos son independientes
La prueba es adecuada cuando n y n( 1- ) valen al menos 5

El valor estadstico de prueba Z viene dado por:

Z =

Donde:
= Relacin proporcional poblacional
= Relacin proporcional muestral
n = Tamao de muestra
PRUEBA PARA LA PROPORCIN POBLACIONAL
PRUEBA DE HIPTESIS RESPECTO A UNA PROPORCIN POBLACIONAL PARA
PRUEBAS DE UNA COLA (UNILATERAL) DE LA FORMA:

El estadstico de la prueba
Z

Regla de rechazo a un nivel de significacin

Ejemplo
Una investigacin en la Universidad de Toledo indica que el 50% de los estudiantes
cambian su rea principal de especializacin despus del primer ao en el programa de
estudios. Una muestra de 100 alumnos en la escuela de Administracin revel que 48
de ellos cambi de dicha rea despus del lapso mencionado. Ha habido un
decremento significativo en la proporcin de estudiantes que cambian su rea de

10

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

especializacin despus del primer ao en el programa? Realice la prueba al nivel de


significancia de 0.05.
n 100

0.48

0.05

Regla de decisin
Rechazar

si

- 1.645

El estadstico de la prueba
Z

- 0.4

Como Z

- 0.4, entonces se acepta

, es decir, la proporcin de estudiantes que

cambian de carrera despus del primer ao no ha tenido un decremento significativo.


Ejemplo
El servicio de Inmigracin y Naturalizacin inform que el 79% de los extranjeros que
visitaron los Estados Unidos en el 2005 dijeron que el objetivo principal de su visita era
disfrutar de sus vacaciones. Suponga que, como estudio de seguimiento en el 2012, se
selecciona una muestra de 500 visitantes extranjeros, y que 390 de ellos dijeron que el
motivo principal de su visita a Estados Unidos era disfrutar sus vacaciones. Es menor
la poblacin de visitantes extranjeros en el 2012? Respalde su conclusin con una
prueba estadstica que use el nivel de significacin de 0,05.
PRUEBA DE HIPTESIS RESPECTO A UNA PROPORCIN POBLACIONAL PARA PRUEBA
DE UNA COLA (UNILATERAL) DE LA FORMA:

11

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Estadstico de prueba
Z

Rechazar

si

Ejemplo
Un artculo en la publicacin Piura 21 report que solo hay un empleo disponible para
uno de cada tres egresados de la Universidad. Las principales razones aportadas fueron
que existe una sobrepoblacin de estos ltimos y una economa dbil. Suponga que
una encuesta de 200 egresados recientes de la Universidad de Jan revel que 80
tenan empleo. Al nivel de significancia de 0.02, Se puede concluir que tienen trabajo
una proporcin mayor de egresados de la Universidad de Jan?
n 200

0,02

Regla de la decisin.
Rechazar
si
Z

2,054

Valor de la prueba:
Z

12

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Se acepta
igual

por lo tanto, la proporcin de egresados que tienen trabajo es menor o


a

Ejemplo
Un restaurante de comida rpida planea una oferta especial que permita a sus clientes
comprar vasos de diseo especial con conocidos personajes de caricaturas. Si ms del
15% de los clientes compran estos vasos, se implementar la promocin. En una
prueba preliminar en varios locales, 88 de 500 clientes los compraron. Se debe
implantar la promocin especial? Lleve a cabo una prueba de hiptesis que apoye su
decisin. Use un nivel de significacin de 0,01 Cul es su recomendacin?
PRUEBA DE HIPTESIS RESPECTO A UNA POBLACIN POBLACIONAL PARA PRUEBAS
DE DOS COLAS (BILATERAL) DE LA FORMA:
Ho: P = Po
Ha: P Po
Estadstico de prueba
Z=

Regla de rechazo a un nivel de significancia

Rechazar

si

Ejemplo
Se establece la siguiente hiptesis:
: P = 0.4
:P
Una muestra de 120 observaciones revel

al nivel de significacin de 0.05

Puede rechazarse la hiptesis nula?


a,. Establezca la regla de decisin.
b.- Calcule el valor estadstico de la prueba.
13

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

c.- Cul es su decisin respecto a la hiptesis nula?


Solucin
a.- Regla de decisin

Rechazar

si Z

-1,96

1.96

b.- Valor de prueba


Z

c.- Se rechaza

= -2.24

, pues el estadstico de prueba cae en la zona de rechazo.

PRUEBA DE HIPTESIS CON MUESTRAS GRANDES (n 30) RESPECTO A DOS MEDIAS


POBLACIONALES
PRUEBA DE HIPTESIS CON MUESTRAS GRANDES (n 30) RESPECTO A DOS MEDIAS
POBLACIONALES PARA UNA PRUEBA DE DOS COLAS (BILATERAL) DE LA FORMA
:
:
Estadstico de prueba
Conocida

desconocida

Z=

Z=

Donde:
Tamao de
muestra

Media
muestral

Variancia
poblacional

Poblacin 1
Poblacin 2

14

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Regla de rechazo a nivel de significancia

Ejemplo
Una importante compaa de transporte pblico de Chiclayo debe decidir entre dos
marcas de llantas para su parque automotor, con un nivel de confianza del 95%. Para
tomar una decisin seleccion una muestra aleatoria de 100 llantas de cada marca y
encontr que la marca 1 tiene una vida til de 98 000 Km, en promedio, con una
desviacin estndar de 8 000 Km.
Por otro lado, las estadsticas calculadas para la marca 2 son, en promedio, de 101 000
Km y desviacin estndar de 12 000 Km
Qu marca de llantas debera adquirir la compaa de transporte si la diferencia de
precios es mnima?
Solucin
:

Regla de decisin
Rechazar
si:

= 98 000

= 8 000

=100

= 101 000

= 12 000

= 100

Valor de la prueba
15

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Z=

= - 2.08

Como -2.08 est en la zona de rechazo, se rechaza


a un nivel de significancia del
5%. Esto es, existe diferencia significativa entre la vida til promedio de ambas marcas.
Sin embargo, no hemos contestado a nuestra pregunta inicial de qu marca de llantas
se debe adquirir. Realizamos una nueva prueba de hiptesis suponiendo que la vida
til media de la marca 2 es mayor que la de la marca 1. Para lo cual establecemos la
prueba de hiptesis para una cola
PRUEBA DE HIPTESIS CON MUESTRAS GRANDES (n
RESPECTO A DOS MEDIAS
POBLACIONALES PARA UNA PRUEBA DE 1 COLA DE LA FORMA:
Pruebas de hiptesis:
:
:

Estadstico de prueba
Conocida
-

Z=

desconocida
-

Regla de rechazo a un nivel de significancia

Rechazar

si Z

PRUEBA DE HIPTESIS CON MUESTRAS GRANDES (n


RESPECTO A DOS MEDIAS
POBLACIONALES PARA UNA PRUEBA DE 1 COLA DE LA FORMA:
:
:

:
:

0
0
16

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Estadstico de prueba
Conocida

desconocida

Regla de rechazo a un nivel de significacin

Rechazar

si Z

Del ejercicio anterior, para decidir qu marca comprar, realizamos una nueva prueba
de hiptesis suponiendo que la vida til promedio de la llanta de marca 2 es mayor
que la vida til promedio de la marca 1, esto es:
:
:
Usando los mismos datos anteriores tenemos

Con los datos mostrados se calcula Z


-

= - 2.08

17

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Como 2.08 est en la zona de rechazo tenemos que la marca 2 tiene mayor vida til
promedio que la marca 1.Por lo tanto, la compaa de transporte debe abastecerse de
la marca 2
PRUEBA DE HIPTESIS CON MUESTRAS GRANDES (n
ENTRE DOS PROPORCIONES:

PARA LA DIFERENCIA

La prueba de hiptesis para la diferencia entre dos proporciones se realiza cuando


queremos determinar si las proporciones de dos poblaciones son o no iguales. La
lgica del procedimiento es idntica para la diferencia de las medias poblacionales.
Tomamos una muestra aleatoria de cada poblacin y calculamos las proporciones
muestrales; si la diferencia entre estas proporciones se puede atribuir al azar,
aceptamos la hiptesis de que las dos poblaciones tienen igual proporciones.
Valor estadstico de prueba.
Z=

Tamao de
muestra

Proporcin Proporcin
muestral
ponderada

Poblacin 1
Poblacin 2

Alternativamente

Ejemplo
El departamento de investigacin en la casa Matriz de una compaa aseguradora,
realiza una investigacin acera de las causas de accidentes automovilsticos, las
caractersticas de los conductores, etc. Se seleccion una muestra aleatoria de 400
plizas de seguros expedidas a personas solteras. Se descubri que en el periodo
anterior de tres aos, 120 sufrieron al menos un accidente automovilstico. En forma
semejante, una muestra de 600 plizas expedidas a personas casadas revel que 150
haban tenido al menos un accidente. Al nivel de significancia de 0.05, Hay diferencia

18

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

significativa en las personas solteras y casadas que sufrieron un accidente durante un lapso de
tres aos?

Solucin
400

600

= 0.30

= 0.25

:
:

Regla de decisin
Rechazar
si: Z

Valor de la prueba

Z=

Z=

= 0.27

= 1.74

Como 1.74 est en la regin de aceptacin se acepta


, no hay
diferencia significativa entre las proporciones de personas solteras y casadas que
sufrieron un accidente durante un lapso de tres aos.
PRUEBA DE HIPTESIS PARA MUESTRAS PEQUEAS
En los casos en los que se desconoce y el nmero de observaciones en la muestra es
menor a 30, se puede utilizar la desviacin estndar muestral, s, como una estimacin
de , pero no puede utilizar la distribucin de Z como valor estadstico de prueba. La t
de Student o distribucin t, sirve como valor estadstico de prueba.
PRUEBA PARA LA MEDIA POBLACIONAL
Se utiliza el mismo procedimiento que en el caso de la muestra grande pero el valor
estadstico de prueba es el siguiente:
19

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Ejemplo
Por registros pasados se sabe que la vida til promedio de una pila elctrica que se
utiliza en un reloj digital es de 305 das. La vida til de las pilas se distribuye
normalmente. Tal elemento elctrico fue modificado recientemente para que tenga
mayor duracin. Se prob una muestra de 20 pilas modificadas y se encontr que la
vida media era de 311 das con una desviacin estndar de la muestra de 12 das. Al
nivel de significancia de 0.05. La modificacin increment la duracin promedio de la
pila?
a.- Plantear la hiptesis nula y alternativa.
b.- Ilustrar grficamente la regla de decisin.
c.- Calcular t y llegar a una decisin. Resuma la manera breve el resultado.
Solucin:

Grados de libertad (g.l.): 20 1 = 19

Regla de decisin:

Rechazar

si

Valor de prueba:

t=
Por lo tanto se rechaza

= 2.24

porque 2.24 est en la zona de rechazo.

20

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

PRUEBA DE DOS
INDEPENDIENTES

MEDIAS

POBLACIONALES:

MUESTRAS

ALEATORIAS

Caso I
Cuando
tiene:

son ambas pequeas y se desconoce las varianza poblacionales se

Valor de prueba
t

t con

grados de libertad:

Donde:
Tamao de
muestra

Media
muestral

Variancia
ponderada

Poblacin 1
Poblacin 2

Grados de libertad:

Observacin
Las varianzas son desconocidas, pero iguales:
Donde
es un estimador insesgado de
Ejemplo:
Una muestra de calificaciones en un examen presentado en un curso de Estadstica (en
escala 100) es:
Hombres 72
Mujeres 87

69
90

98
78

66
81

85
80

76
76

79

80

77

Al nivel de significancia de 0.01, La calificacin de las mujeres es ms alta que la


calificacin de los hombres?
Solucin:

:
:

21

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

H
78
9,49
9

S
n

M
82
5,40
6

Regla de decisin:
Rechazar
si t
Valor de la prueba

= 66.6153

= 0.10

Se acepta
porque 0.42 est en la zona de aceptacin. Por lo tanto, no se puede
afirmar que la calificacin de las mujeres es ms alta que la calificacin de los
hombres.
b.. Caso II:
Cuando

Variancias poblacionales desconocidas pero diferentes


Las hiptesis son las mismas, pero la prueba estadstica ser:

Los grados de libertad se calculan de la siguiente manera:

22

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

g.l.
[

]
]

Los dems pasos son los mismos

PRUEBA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES: UNA PRUEBA DE


DIFERENCIA PAREADA
< 30
Variancias poblacionales desconocidas pero iguales
1.-Hiptesis nula: Ho: (12) = d = 0
2.- Hiptesis alternativa:
Prueba de una cola

Prueba de dos colas

Ha: d> 0

Ha: d 0

Ha: d < 0
3.- Estadstico de prueba:

t=

= 1

4.- Regin de rechazo: Rechazar Ho cuando


Prueba de una cola

Prueba de dos colas


t>

t>t

t<

t>t

Ejemplo.Antes de contratar la instalacin de un sistema que trasmita msica a las oficinas de


una empresa, el gerente selecciona al azar 7 oficinas para instalarles el nuevo sistema.
El tiempo promedio en minutos que pasaban los empleados fuera de esas oficinas, fue
registrado antes y despus de instalarse el sistema de msica, obtenindose los
siguientes resultados

23

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Nmero de oficina
No msica
Con msica

1
8
5

2
9
6

3
5
7

4
6
5

5
5
6

Sugerira Ud. que el ejecutivo proceda con la instalacin?


Solucin

6
10
7

7
7
8

= 0.05

Ho: d = 0
Ha: d > 0
No msica
8
9
5
6
5
10
7

=7,14

=6,28

=0,85
t=

En las tablas

Con msica
5
6
7
5
6
7
8

d
3
3
2
1
1
3
1

=2,6457
=

= 1,025

1,943

Conclusin: No hay una evidencia estadstica para afirmar que con la instalacin de la
msica en las oficinas, los empleados pasaran ms tiempo en estas.
PRUEBA DE HIPTESIS PARA LA VARIANZA
Hay casos que se tiene el problema de desconocer la varianza, o desviacin estndar
de la poblacin, en donde las distribuciones son normales. Si se desea probar una
hiptesis acerca de la varianza se puede hacer utilizando la distribucin de Ji cuadrada
(Chi cuadrada). As mismo, supngase que se tiene inters en dos poblaciones
normales independientes, donde las medias y las varianzas de la poblacin son
desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder
comparar las medias de estas dos poblaciones se ha utilizado la distribucin de t de
Student, en la cual podemos tener varianzas iguales o diferentes en la poblacin.

24

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Par conocer esto ltimo se requiere de la distribucin F de Fisher, y despus de


utilizarla se tomar la decisin de tener o no varianzas iguales en la poblacin, dando
pie a realizar la comparacin de las dos medias segn sea el caso. En un primer caso en
el que las varianzas de la poblacin son desconocidas, pero iguales, o en un segundo
caso, donde se tiene varianzas desconocidas, pero diferentes
DISTRIBUCION CHI CUADRADO
La distribucin de Chi cuadrado tiene muchas aplicaciones especialmente en las
ciencias sociales y biolgicas, en donde se estudia una conducta (lo esperado) en
funcin de una respuesta (lo observado). Si el conjunto de valores observados sigue el
mismo comportamiento de lo esperado entonces, estadsticamente, se acepta la
hiptesis que lo observado sigue el comportamiento de lo esperado.
Esta metodologa puede ser utilizada para una prueba de :
-

Frecuencia y bondad de ajuste


Independencia entre variable
Homogeneidad de muestras
Homogeneidad de variancia.

Casos de frecuencia y bondad de ajuste, probar estadsticamente:


-

La relacin de ingresantes a la UNPRG de colegios particulares a nacionales es


de 2 a 1
El nmero de accidentes que ocurre en un determinado lugar sigue una ley de
Poisson
El nmero de tubrculos daados en planta siguen una ley de Poisson
El nmero de artculos defectuosos en caja de 10 , sigue una ley Binomial
El nmero de plantas germinadas de paquetes de 10 semillas sigue una ley
Binomial

Casos de independencia
-

Preferencias a ciertos productos y localidades


Procedencia de colegio nacional y privado y el rendimiento en la universidad
El nivel de pobreza y estudio en la zona rural y urbana

Casos de homogeneidad de muestra


-

La distribucin de consumo de tipo de carne en distritos de la provincia de


Chiclayo
La preferencia o popularidad de candidatos por distritos
La distribucin de estudiantes por lugar de procedencia en las universidades del
Depto. De Lambayeque.
25

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

La distribucin Chi Cuadrado


permite resolver tal inferencia, bajo el supuesto que la
variable aleatoria w est definida:

Donde:
-

Frecuencia observada en una clase o categora


Frecuencia esperada en la misma clase o categora
Distribucin de chi cuadrado, con cierto grado de libertad

Cuando el nmero de grados de libertad es igual a 1, se utiliza la correccin de Yates


(correccin por continuidad)

Pero cuando los datos son mayores de 50 se puede, obviar la correccin.


Prueba de frecuencias
Es til en el estudio de la distribucin de frecuencias de una variable. El nmero de
clases o categoras debe ser al menos 2, lo suficiente como para no tener frecuencias
menores de 5%. Muchas o pocas categoras, dispersan o concentran la frecuencia en
las categoras.
Para la prueba estadstica de frecuencia se requiere hallar los grados de libertad.
Para el caso de frecuencias, los grados de libertad es igual a K 1, donde K es el
nmero de clases o categoras.
Ejemplo
4 candidatos, postulan a la Presidencia de la Republica. Segn los sondeos se tiene la
siguiente distribucin:
- Candidato A = 34%
- Candidato B = 28%
- Candidato C = 14%
- Candidato D =8 %
- Otros = 16%
El estudio se realiz encuestando a 120 personas, donde el resultado de las
preferencias fue:
A = 45 B = 30 C =18 D= 6 y otros =21
Se pregunta si la preferencia de los candidatos ser igual para todos. = 0,10

26

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Solucin:
Ho: La preferencia de los candidatos se mantiene
Ha: No hay cambios en la preferencia
= 0.10
Candidato
A
B
C
D
Otros
Total

Datos
observados
45
30
18
6
21
120

Datos
esperados
120x0,34=40,8
120x0,28=33,6
120x0,14=16,8
120x0,08=9,6
120=0,16=19,2
12,0

%
Terico
34
28
14
8
16
100

= 2,4225

El valor critico se busca en la tabla de Chi cuadrado, con k- 1 grados de libertad y con
un nivel de significancia
En las tablas

con 4 g.l. y = 0,10 es igual 7,77

El valor calculado es inferior al tabular, por lo tanto se acepta la hiptesis que las
frecuencias se mantienen (Hiptesis nula).
Ejemplo en proporciones
Las frecuencias esperadas de un cruce gentico entre la prole estn en una proporcin
fenotipo de 3:1 de normal a mutante. Las frecuencias observadas fueron:
Fenotipo Datos
Observados
Normal
80
Mutante
10
Total
90

Realice la prueba estadstica para la prueba de la proporcin planteada.


Solucin
Ho. La proporcin fenotipo normal y mutuante es de 3:1
Ha: La proporcin no es 3:1
= 0.10
Calculemos las frecuencias esperadas
27

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Fenotipo

Datos
observados

Datos
esperados

Normal
Mutante
Total

80

90x

67,5

10

90x

22,5

90

90

Los grados de libertad es igual a 1, no es necesario la correccin de Yates porque la


muestra es mayor a 50.
El valor de Chi cuadrado ser:

El valor crtico para

se busca con gl= 1 y = 0,10 ser 2,705

Se observa que el valor calculado es mayor que el tabular, entonces se rechaza la


hiptesis nula o planteada, por lo cual se concluye que no hay suficiente razn
estadstica para tal afirmacin sobre la proporcin planteada.
Aplicacin de Yates (caso de dos categoras y total de observaciones menor a 50).
Una moneda supuestamente balanceada, se somete a una prueba para certificar si es
correcta para ser utilizada en una determinada investigacin, razn por la cual se lanza
25 veces, obtenindose como resultado: Cara 10 veces, sello 15 sello. Con estos
resultados Podemos aceptar la hiptesis?
Ho: Moneda correctamente balanceada
Ha: Moneda no es balanceada
= 0,10
Resultado

Datos
observado

Datos
esperados

Cara
Sello

10
15
25

25 x 0,50 = 12,5
25 x 0,50 = 12,5

El valor de

en las tablas para 1 g.l. y = 0,10 es igual a 2,7055


28

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Por lo tanto se acepta la hiptesis Ho, que dice que la moneda es balanceada.
PRUEBA DE INDEPENDENCIA TABLAS DE CONTIGENCIA
Las pruebas aplicadas a cuadros de contingencia, algunos la denominan tambin como
dcimas de independencia. Sin embargo, permiten la realizacin de pruebas de
homogeneidad. Un cuadro de contingencia, es un arreglo en el cual un conjunto de
observaciones se dispone conforme a dos criterios de clasificacin, uno de los cuales se
expresa en columnas y el otro en renglones. Si cada uno de los criterios admite dos
clasificaciones, se obtiene una tabla de contingencia de 2 x 2. Si el primer admite tres
clasificaciones y el segundo criterio 4, se denominar como tabla 3 x 4. Si
designamos las columnas por K y los renglones por J, se tendr una tabla de K x J
Los grados de libertad sern iguales a v=(K 1)(J 1), as en una tabla de 2 x 2, el
valor de v ser igual a 1, o sea v= (2 1)(2 -1); y en la tabla de 3x 4 ser: v= (3 - 1)(4)=6.
Cuando el nmero de grados de libertad es igual a 1, se utiliza la correccin de Yates
(correccin por continuidad)

Pero cuando los datos son mayores de 50 se puede, obviar la correccin.


Ejemplo:
En un consultorio se trat a un grupo de personas que se quejaban de insomnio,
dndole a unas pastillas para dormir y a otras pastillas de azcar (que hacan creer que
eran para dormir). Despus de someterlos a observacin, se obtuvo el siguiente
resultado.
Tratamiento
Pastillas para dormir
Pastillas de azcar
Total

Durmieron
35
45
80

No
durmieron
5
15
20

Total
40
60
100

Pruebe a nivel del 5% que no existe diferencia


Solucin:
Ho: No existe diferencia entre los tipos de pastillas
Ha: Si existe diferencia entre los dos tipos de pastillas
Calcular los datos esperados

29

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Tratamiento
Pastillas para dormir

Durmieron

Pastillas de azcar
Total

No durmieron

Total

= 32

=8

40

= 48

= 12

60

80

20

100

=
Buscamos en las tablas

= 2,3437
, con (2 1) (2 1)= 1

Se acepta la hiptesis nula, la diferencia no es significativa.


Ejemplo
Una asociacin de profesores universitarios quiere determinar si la clasificacin en el
trabajo es independiente de la categora acadmica. Para ello se realiz un estudio
nacional entre los acadmicos universitarios y encontr los resultados que se
muestran a continuacin, Con al 0.05 haga una prueba para saber si son
dependientes la satisfaccin en el trabajo y la categora acadmica

Satisfaccin
En el
trabajo

Categora
Profesor Profesor
Profesor
Asistente auxiliar
asociado
40
60
52
Mucha
78
87
82
Regular
57
63
66
Poca

Profesor
principal
63
88
64

Solucin
Planteamiento de las hiptesis
La satisfaccin en el trabajo y la categora acadmica son independientes
La satisfaccin en el trabajo y la categora acadmica no son independientes
Grados de libertad: (r 1) (c 1) = (3 -1) (4 -1) = 6

30

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Regla de decisin
Rechazar

12.59

Se procede a calcular los valores esperados de cada celda:


Donde:

i= fila

j = columna

Se toma en cuenta los totales del rengln y la columna

Satisfaccin
En el
trabajo

Mucha
Regular
Poca
Total
= 47.03

Profesor
asistente
40
78
57
175

Profesor
auxiliar
60
87
63
210

categora
Profesor
asociado
52
82
66
200

= 73.28

Profesor
principal
63
88
64
215

Total
215
335
250
800

= 54.69

= 56.44

= 87.94

= 65.62

= 53.75

= 83.75

= 62.50

= 57.78

= 62.50

Satisfaccin
En el
trabajo

Mucha
Regular
Poca
Total

= 90.03

Profesor
asistente
47.03
73.28
54.69
175

CATEGORA
Profesor Profesor Profesor
auxiliar
asociado principal
56.44
53.75
57.78
87.94
83.75
90.03
65.62
62.50
67.19
210
200
215

Total
215
335
250
800

Valor de la prueba:

= 2.75

Como 2.75 es menor que el valor critico 12.59, por lo tanto, no se rechaza
y se
concluye con un = 0.05, que la satisfaccin en el trabajo y la categora acadmica son
independes

31

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

PRUEBA DE HIPTESIS PARA LA VARIANZA DE UN DISTRIBUCIN NORMAL


A continuacin se desarrollar el procedimiento para contrastar hiptesis sobre la
varianza poblacional , a partir de una muestra aleatoria de n observaciones de una
poblacin normal.
PRUEBA BILATERAL DE LA VARIANZA DE UNA POBLACIN

Estadstico de prueba:
=

Regla de decisin a un nivel de significancia


Rechazar

si:

Ejemplo
Una manera de evaluar la eficacia de un profesor ayudante es analizar las calificaciones
obtenidas por sus estudiantes en un examen al final del curso. Evidentemente, es
interesante la puntuacin media, sin embargo, la varianza tambin contiene
informacin til; algunos profesores tienen un estilo que funciona muy bien con los
estudiantes ms sobresalientes, pero es ineficiente con los estudiantes con menos
capacidad o menos motivados. Un profesor realiza un examen al final de cada
semestre para todas las secciones del curso, la varianza de las calificaciones de este
examen suelen estar muy prximos a 300 : Un nuevo ayudante tiene una clase de 30
estudiantes, cuyas calificaciones en el examen tuvieron una varianza de 480;
considerando estas calificaciones como una muestra aleatoria de una poblacin
normal, contrastar la hiptesis nula de que la varianza poblacional de sus calificaciones
es 300 frente a una alternativa bilateral con
0.05

32

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Regla de decisin
Rechazar
si:

Valor de prueba
=

Entonces dado que


diferente de 300

= 46.40

45.72, se rechaza

, lo cual significa que la varianza es

PRUEBA UNILATERAL DERECHA DE LA VARIANZA DE UNA POBLACIN

Estadstico de prueba

=
Regla de decisin a un nivel de significancia
Rechazar

si:

Ejemplo
Un producto, se debe maquinar determinada parte con tolerancias muy estrechas,
para que los clientes la puedan aceptar. Las especificaciones del producto piden que la
varianza mxima de las longitudes de las partes sea 0.0004. Suponga que en 30 partes,

33

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

la varianza de la muestra result ser


0.0005. Pruebe con un
violado la especificacin de varianza de la poblacin

0.05 si se ha

Estadstico de prueba
=

= 36.25

Regla de decisin a un nivel de significancia

Regla de decisin
Rechazar
si:
Entonces dado que
, se acepta la Ho, lo cual significa que las
especificaciones del producto no han sido violadas.
PRUEBA UNILATERAL IZQUIERDA DE LA VARIANZA DE UNA POBLACIN

Estadstico de prueba

Regla de decisin a un nivel de significancia


Rechazar

si:

34

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

INFERENCIA ACERCA DE LA VARIANZA DE DOS POBLACIONES NORMALES


DISTRIBUCIN DE F
Denominada as por sir Ronald Fisher, uno de los fundadores de la ciencia estadstica
moderna. Esta distribucin se utiliza como la entidad estadstica de prueba en varios
casos, sirve para probar si dos muestras proceden de poblaciones con varianzas
iguales. Asimismo, tambin sirve cuando se desea comparar simultneamente varias
medias poblacionales, esta comparacin simultanea de varias de tales medias se
denomina anlisis de varianza (ANAVA) (ANOVA), en estos dos casos las poblaciones
deben ser normales.
PRUEBA DE HIPTESIS BILATERAL RESPECTO A LA VARIANZA DE DOS POBLACIONES

Estadstico de prueba
F

Regla de decisin a un nivel de significacin


Rechaza

s:

PRUEBA UNILATERAL DERECHA ACERCA DE LA VARIANZA DE DOS POBLACIONES


NORMALES.

Estadstico de prueba
F
Regla de decisin a un nivel de significacin
Rechaza

si: F
35

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Observacin.- La varianza muestral ms grande se coloca en el numerador, en


consecuencia, la razn F siempre es mayor a 1. Por lo tanto, el valor crtico de la cola
de valores superiores es el nico que se necesita
(

Ejemplo:
La compaa Piura Com. realiz un estudio acerca de los hbitos de escuchar radio
por parte de los hombres y las mujeres. Un aspecto del estudio comprendi el tiempo
promedio de audicin. Se descubri que tal tiempo para los varones es de 35 minutos
al da. La desviacin estndar de la muestra de 11 personas de sexo masculino que se
estudiaron fue de 10 minutos diarios. El tiempo promedio de audicin para las 13
mujeres en el estudio fue tambin de 35 minutos, pero la desviacin estndar de la
muestra, result 12 minutos. Al nivel de significancia de 0.10, es posible concluir que
existe diferencia en la variacin del nmero de minutos que los hombres y las mujeres
escuchan la radio?

Recuerde que
0.36

Rechaza

s: F

36

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Estadstico de prueba
F

1.44

Por lo tanto, al ser F 1.44 se acepta , lo cual significa que la variacin del nmero
de minutos que escuchan radio los hombres es igual al de las mujeres.
Ejemplo
En su incansable bsqueda de un sistema de llenado adecuado, cierta empresa prueba
dos mquinas. Robot Fill se usa para llenar 16 tarros y resulta una desviacin estndar
de 1.9 onzas en el llenado. Con Automatic Fill se llenan 21 frascos que dan desviacin
estndar de 2.1 onzas. Si la empresa tiene que elegir uno de estos sistemas en funcin
de la uniformidad de llenado, Cul deber seleccionar? Use un
0.05
Solucin
Robot Fill

Automatic Fill

De acuerdo a la tabla de F:

Regla de decisin a un nivel de significacin


Rechaza

s:

Estadstico de prueba

37

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Dado que el valor de F es 1.22 se acepta Ho. Por lo tanto, se elige el proceso Automatic
Fill porque es el que presenta mejor uniformidad de llenado.
ANLISIS DE REGRESIN Y CORRELACIN
ANLISIS DE CORRELACIN
Conjunto tcnicas estadsticas empleadas para medir la intensidad y el sentido de la
asociacin de dos ms variables. El concepto de correlacin est estrechamente
vinculado al concepto de regresin, pues para que una ecuacin de regresin sea
razonable los puntos muestrales deben estar ceidos a la ecuacin de regresin,
adems el coeficiente de correlacin debe ser:
-

Grande cuando el grado de asociacin es alto (cerca de


cuando es bajo, cerca de cero
Independiente de las unidades en que se miden las variables.

y pequeo

DIAGRAMA DE DISPERSIN
Grfica que presenta la relacin entre dos variables.
VARIABLE DEPENDIENTE
Variable que se predice o estima. Se muestra en el eje Y.
VARIABLE INDEPENDIENTE
Variable que proporciona la base para la estimacin. Es la variable de pronstico. Se
muestra en el eje X.
Ejemplo
La empresa Rzuri Hnos. un negocio familiar que ha vendido al menudeo en Piura
durante muchos aos, se anuncia ampliamente por radio y televisin, destacando sus
bajos precios y accesibles condiciones de crdito. Al dueo le gustara analizar la
relacin entre las ventas y lo que gasta en publicidad. A continuacin se muestra la
informacin acerca de las ventas y lso gastos de publicidad durante los ltimos cuatro
meses.
Mes
Julio
Agosto
Setiembre
Octubre

Gastos de publicidad
(miles de dlares)
2
1
3
4

Ingreso por ventas


(miles de dlares)
7
3
8
10

38

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Se plantea la hiptesis de que a medida que aumentan los gastos de publicidad,


aumentan los ingresos por ventas.
Debemos comenzar por el diagrama de dispersin, que nos permite tener una idea
sobre el grado (intensidad) y la naturaleza (forma) de la relacin entre las dos
variables. Entonces podemos dar cuenta si la relacin es lineal o no lineal, positiva o
negativa, o simplemente no existe una relacin aparente.

Observando el diagrama podremos establecer lo siguiente:


1.- Existe una relacin lineal entre los gastos de publicidad y el ingreso por ventas en
ese periodo de 4 meses. Por lo tanto, es posible trazar una lnea recta que se ajuste
a los puntos graficados en el diagrama de dispersin
2.- La relacin no es determinstica; vale decir, cualquiera que sea la lnea recta que se
trace, la mayora de los puntos estarn por encima o por debajo de dicha recta.
COEFICIENTE DE CORRELACIN LINEAL SIMPLE (r)
Creado por Karl Pearson alrededor de 1900, describe la fuerza de la relacin entre dos
conjuntos de variables en escala de intervalo o de razn.
Se designa con la letra r, para calcular el valor numrico del coeficiente de correlacin
se utiliza la siguiente expresin:
r=

r=

][

Donde:
n = Nmero de pares de observaciones
x = Suma de los valores de la variable x
39

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

y = Suma de los valores de la variable y


= Suma de los valores de x elevados al cuadrado

Cuadrado de la suma de los valores de x


= Suma de los valores de y elevados al cuadrado

= Cuadrado de la suma de los valores de y


xy = Suma del producto de x e y
CARACTERSTICAS DEL COEFICIENTE DE CORRELACIN
1.- El coeficiente de correlacin de la muestra se identifica con la letra minscula r
2.- Muestra la direccin y la fuerza de la direccin lineal (recta) entre dos variables en
escala de intervalo o en escala de razn
3.- Vara de -1 hasta +1
4.- Un valor cercano a 0 indica que hay poca asociacin entre las variables
5.- Un valor cercano a 1 indica una asociacin directa o positiva entre las variables; es
decir a valores altos de una variable le corresponde valores altos a la otra variable
6.- Un valor cercano a -1 indica una asociacin inversa o negativa entre las variables; es
decir a
valores altos de una variable le corresponde valores bajos a la otra variable
y viceversa
COEFICIENTE DE DETERMINACIN (

Es el estadstico que mide la proporcin de la variacin total en y que puede ser


explicada por la variacin en x.
El coeficiente de determinacin se calcula elevando al cuadrado el coeficiente de
correlacin
Con los datos del problema tenemos:
x
2
1
3
4
10

Total

r=
r=

y
7
3
8
10
28

xy
14
3
24
40
81

[
[

4
1
9
16
30

][

49
9
64
100
222

][

= 0,96

= 92,16%

40

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

1-

= 7,84%

PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE DE CORRELACIN


Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el
modelo de regresin lineal es significativo.
Planteamiento de hiptesis:
0 (la correlacin en la poblacin es cero)
(La correlacin en la poblacin es distinta de cero)

Estadstico de prueba:
t

Rechazar

si:

, con n 2 grados de libertad

Comparamos con el valor de las tablas

= 4,84

, es decir

=4,303

Como el valor calculado es mayor que el valor de la tabla, existe una fuerte correlacin
entre el gasto en publicidad y el ingreso por ventas. (Aceptamos hiptesis alternativa)
ANLISIS DE REGRESIN
A travs del anlisis de regresin buscamos que la lnea de ajuste se aproxime lo mejor
posible a todos los puntos del diagrama de dispersin. La ecuacin para la lnea recta
empleada para calcular y con base en x se conoce como ecuacin de regresin.
ECUACIN DE REGRESIN
Expresin matemtica que define la relacin entre dos variables.

41

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

PRINCIPIO DE MNIMOS CUADRADO


Tcnica empleada para obtener la ecuacin de la regresin, minimizando la suma de
los cuadrados de las distancias verticales entre los valores y verdaderos y los valores
pronosticados .
Dicha recta se define como:
y = a +bx
Par determinar la calidad estimadora de esta recta necesitamos alguna medida de la
distancia de los puntos (
a esta recta. El siguiente grafico muestra, para un solo
punto, como se mide esta distancia.
Para el valor el correspondiente valor y en nuestra recta es a + bx mientras que el
valor realmente observado para la variable dependiente es .La diferencia entre los
dos es:

Ahora bien, cualquier


estimador razonable de la recta de regresin verdadera dejar algunos de los datos
observados por debajo y otros por encima de la recta estimada. Por lo tanto, algunos
de los sern positivos y otros negativos
REGRESIN LINEAL SIMPLE
El anlisis de regresin lineal simple trata el problema de predecir o estimar una
variable, llamada respuesta, a partir de otra variable llamada predictora o explicativa.
A la primera se le conoce tambin como variable dependiente y se le representa
generalmente con la letra Y, mientras que a la segunda se le conoce como variable
independientemente y se representa generalmente con la letra X
Cuando la relacin funcional entre las variables dependiente (Y) e independiente (X) es
una lnea recta, se tiene una regresin lineal simple, dada por la ecuacin

42

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Donde
-

: Es el valor de la ordenada donde la lnea de regresin se inserta al eje Y


: El coeficiente de regresin poblacional (pendiente de la recta)
: Error

SUPOSICIONES DE LA REGRESION LINEAL


1. Los valores de la variable independientes son fijos
2. La variable X se mide sin error (se desprecia el error de medicin en X)
3. Existe una subpoblacin de valores Y normalmente distribuido para cada valor
de X
4. La variancias de las sub poblaciones de Y son todas iguales
5. Todas las medias de las subpoblaciones de Y estn sobre la misma recta
6. Los valores de Y estn normalmente distribuidos y son estadsticamente
independientes
Los supuestos el 3 al 6 equivalen a decir que los errores son aleatorios, que se
distribuyen normalmente con media cero y variancia
Con los datos muestrales se tomar la siguiente ecuacin:

El coeficiente de regresin ( ).- pendiente de la recta de la regresin, represente la


tasa de cambio de respuesta Y al cambio de una unidad en X
Si

0, se dice que no existe relacin lineal entre las dos variables

Ejemplo
Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de
publicidad (en millones de dlares) para 7 marcas principales de refrescos:

43

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Marca
Coca cola
Pepsi
Kola real
Sprite
Inca cola
Concordia
7 up

Gastos de
publicidad
131.3
92.4
60.4
55.7
40.2
29.0
11.6

Ventas
de cajas
1929.2
1384.6
811.4
541.5
536.9
535.6
219.5

a.- Trace un diagrama de dispersin para estos datos, con los gastos de publicidad
como variable independiente.
b.- Qu parece indicar este diagrama acerca de la relacin entre las dos variables?
trace una recta que pase por los datos, para aproximar una relacin lineal entre los
gastos de publicidad y las ventas.
c.- Aplique el mtodo de mnimos cuadrados para plantear la ecuacin estimada de
regresin
d.- Presente una interpretacin de la pendiente de esta ecuacin
Solucin:
Variable independiente: Gastos de publicidad
Variable dependiente: Ventas de cajas
Diagrama de dispersin.

El diagrama parece indicar que la relacin entre las variables es linealmente positiva.
Ahora encontraremos los valores de r,
Gastos de
Publicidad

Sumas

x
131.3
92.4
60.4
55.7
40.2
29
11.6
420.6

17 239.69
8 537.76
3 648.16
3 102.49
1 616.04
841
134.56
35 119.7

Ventas de
cajas
y
1929.2
1 384.6
811.4
541.5
536.9
535.6
219.5
5 958.7

3 721 812.64
1 917 117.16
658 369.96
293 222.25
288 261.61
286 867.36
48 180.25
7 213 831.23

xy
253 303.96
127 937.04
49 008.56
30 161.55
21 583.38
15 532.4
2 546.2
500 073.09

44

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

r=

r=

][

][

= 0.97810014

Como r se aproxima a uno, entonces diremos que la relacin que hay entre las dos
variables es bastante fuerte o intensa.
La ecuacin que mejor se ajusta a los datos es una recta, como se aprecia en el
siguiente grfico.

= 14.42378282
=
=

= - 15.42

Por lo tanto la ecuacin de la regresin lineal seria:

La interpretacin que tiene


eje y

= - 15.42 + 14.424x
es solo matemtica, esto es el punto de corte con el

El valor que toma


se interpreta como: por cada incremento en la variable
dependiente se espera una variacin de 14.424 en la variable dependiente

45

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

COEFICIENTE DE DETERMINACIN (

).

En el ejemplo anterior r = 0.9781, el coeficiente de determinacin ser


0.9567,
luego pude decirse que 95.67% de la variacin en el nmero de cajas vendidas se
explica por la variacin en los gastos de publicidad.
PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE DE CORRELACIN
Del ejemplo anterior, pruebe la hiptesis de que no existe correlacin en la poblacin.
Emplee 0.02 de nivel de significancia
Solucin
Planteamiento de hiptesis
0 (la correlacin en la poblacin es nula)
(la correlacin en la poblacin no es nula)
Regla de la decisin

Rechazar

si: t

Estadstico de prueba

= 10.5093

Se acepta la hiptesis alternativa, es decir existe relacin entre las variables en estudio
ERROR ESTNDAR DE LA ESTIMACIN:
Mide la dispersin de los valores observados, con respecto a la recta de regresin.

46

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Marca

Gastos de
Publicidad
X

Coca cola
Pepsi
Kola real
Sprite
Inca cola
Concordia
7 up

131.3
92.4
60.4
55.7
40.2
29.0
11.6

Ventas
de
Cajas
y
1929.2
1384.6
811.4
541.5
536.9
535.6
219.5

Rendimiento
Pronosticado

Desviaciones
y -

Desviaciones al
cuadrado

1878.45
1317.35
855.78
787.99
564.42
402.87
151.89

50.75
67.25
- 44.38
- 246.49
- 27.52
132.73
67.61

2575.56
4522.56
1969.58
60757.32
757.35
17617.25
4571.11

= 136.21

ESTIMACIN DE LOS INTERVALOS DE CONFIANZA


El error estndar de la estimacin es una medida vlida para utilizarla al fijar los
intervalos de confianza cuando el tamao de muestra es grande y de alguna forma la
dispersin con respeto a la recta de la regresin est distribuida de manera normal.
Un intervalo de confianza se determinar para:
1.- El valor medio de Y para un valor dado de X
2.- Un valor individual de Y para un valor dado de X

t (Syx)

Donde
Y' = es el valor pronosticado para cualquier valor X seleccionado
X = es cualquier valor seleccionado de X
= es la media de X
n = en el nmero de observaciones
Syx = es el error estndar de la estimacin
t = es el valor de t tomado para n 2
Ejemplo
De acuerdo a los datos anteriores. Calcular los intervalos de confianza para la venta de
cajas de gaseosas cuando la inversin en publicidad es 100.00 (millones de dlares)
= es 1426.98 para un X igual a 100
= 60.0857

n= 7

1426.98

Syx = 136.21

t (n 2) = t (7 -2) (0,05)= 2.571

47

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

1426.98

195.1291 = 1622.1091 y 1231.8509

Interpretacin.Cuando se invierte 100 millones de dlares en publicidad, se espera que la venta de


gaseosas est comprendida entre1622.1091 y 1231.8509 miles de cajas
Pero cuando a se trata de un valor individual la frmula es:
(

t(Syx)

Ejemplo.
- Cuanto ser la venta de cajas de Inca cola, cuando esta compaa invierta 100
millones en publicidad:

1426.98
1426.98

1972.305y 881.655

Interpretacin.Con una probabilidad del 0,95 se puede afirmar que cuando la Inca Cola invierta 100
millones en publicidad sus ventas estarn comprendidas entre 1972.305 y 881.655
cajas.
RELACIN ENTRE COEFICIENTE DE CORRELACIN, COEFICIENTE DE DETERMINACIN
Y ERROR ESTANDAR DE ESTIMACIN
Un medio conveniente para mostrar la relacin entre estas tres medidas es la ANAVA,
recordemos que:
El error estndar de la estimacin mide cun cerca de la recta de regresin se
encuentra los valores reales. Cuando el valor es pequeo indica que las dos variables
estn relacionadas muy de cerca.
El coeficiente de correlacin mide la fuerza de la asociacin entre dos variables.
Cundo los puntos del diagrama de dispersin parecen cercanos a la lnea recta, se
observa que el coeficiente de correlacin tiende a ser grande. Luego el error estndar
de la estimacin y coeficiente de correlacin indican la misma informacin, pero
utilizan escalas diferentes.
El coeficiente de determinacin mide el porcentaje de la variacin de Y que se explica
por la variacin de X

48

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

ANLISIS DE VARIANCIA PARA LA REGRESIN LINEAL SIMPLE:


Cuando cada particin se asocia a una porcin correspondiente del total de grados de
libertad, la tcnica es conocida como anlisis de variancia (ANAVA), que generalmente
se presenta en un cuadro de la siguiente manera
A
Fuentes de
Variacin

N A V A

Suma de
Cuadrados

Grados de
Libertad

Cuadrado
Medio

Prueba de
significacin

Regresin

SC r =

Error

SC e = ( ) = SC t SC r

n2

Total

SC t = (

n1

Significacin
estadstica

La prueba de F evalua las hiptesis


Ho:
Ha:

No existe una regresin lineal entre X e Y


Existe regresin lineal de Y en funcin de X

SUMA DE CUADRADOS DEL TOTAL (SCT)


Mide la dispersin (variacin total) en los valores observables de Y. Este trmino se
utiliza para el clculo de la variancia de la muestra.
SUMA DE CUADRADOS EXPLICADA (SUMA DE CUADRADOS DEBIDO A LA REGRESIN
(SCR)
Mide la variabilidad total en los valores observados de y en consideracin a la relacin
lineal entre X e Y
SUMA DE CUADRADOS RESIDUAL (Inexplicada, suma de cuadrados del error, SCE)
Mide la dispersin de los valores de Y observados respecto a la recta de la regresin Y
(es la cantidad que minimiza cuando se obtiene la recta de la regresin)
Fuentes de
Variacin

Suma de
Cuadrados

Regresin
Error
(Residual)
Total

Diferencia
SCY

Grados de
Libertad

Cuadrado
Medio

Prueba de
significacin

n2

Significacin
estadstica

n1

49

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Con los datos de nuestro ejemplo:


(

1929,2
1384,6
811,4
541,5
536,9
535,6
219,5

1878,5
1317,35
855,78
787,99
564,42
402,87
151,89

851,2428
851,2428
851,2428
851,2428
851,2428
851,2428
851,2428

1077,9572
533,3572
- 39,8428
-309,7428
-314,3428
-315,6428
-631,7428

A
Fuentes de
Variacin
Regresin
Error
Total

1161991,725
284469,9028
1587,4487
95940,6021
98811,3959
99630,3771
399098,9654
2141530,417
SC Total

50,75
67,25
- 44,38
- 246,49
- 27,52
132,73
67,61

2575,5625
4522,5625
1969,5844
60757,3201
757,3504
17617,2529
4571,1121
92770,7449
SC Error

1027,2072
466,1072
4,5372
- 63,2528
- 286,8228
- 448,3728
- 699,3528

1055154,632
217255,9219
20,5861
4000,9167
82267,3186
201038,1678
489094,3389
2048831,882
SC Regresin

SC

GL

CM

2048831.882
92770.7449
2141530.417

1
5
6

2048831.882
18554.1489

110.4244

Sign.
Estad.
**

F (1,5)= 6.61 (
16.26 (

Interpretacin: Realizado el anlisis de variancia (ANAVA) para la regresin se


encontr una alta significacin estadstica para la regresin, por lo tanto podemos
decir que existe asociacin entre ambas variables en estudio

=
=

= 1

= 1

= 0,9567 = 95.67%

El 95.67% de las variaciones de la venta de cajas de gaseosas (Y) es explicado por la


inversin que se hizo en publicidad (X)
r=
= 0.9781 (Coeficiente de correlacin)
1 = 4.33% (Coeficiente de no determinacin)
El error estndar de la estimacin tambin puede ser calculado de la siguiente forma
S yx=

= 136.2136

Por ltimo como se observa conforme la Suma de Cuadrado del error disminuye esta
y por el contrario, conforme disminuye el error estndar se incrementa
El ANAVA de una regresin lineal puede ser calculado de la siguiente manera

50

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

A N A V A
Fuentes de
variacin
Regresin
Debido a

Suma de
cuadrados

SC total

Total
(corregida)

Cuadrados
medios

Error
Residual
(no explicada)

Grados de
libertad

INTERVALOS DE CONFIANZA PARA


En muchos casos es de inters conocer entre que valores se encuentra el coeficiente
de regresin de la poblacin
para un cierto grado de confianza fijada, este
procedimiento permite hallas los valores llamados lmites de confianza, as:
{

Donde

es el valor t tabular a nivel de significancia

y n 2 grados de libertad

REGRESION PARABOLICA SIMPLE


La regresin parablica simple, se aplica a aquellos fenmenos que se observan que
presentan una concentracin de puntos inicialmente ascendentes y en seguida
descendentes (puede darse lo contrario). Esta regresin parablica es utilizada en gran
parte, por los economistas, en las funciones de utilidad, ingresos, etc.
La ecuacin ser

Ejemplo
Con los siguientes datos, haga un estudio de regresin parablica

29
35
29
38
40
Total 171

23
34
26
30
35
148

841
1225
841
1444
1600
5951

24389
42875
24389
54872
64000
210525

707281
1500625
707281
2085136
2560000
7560323

667
1190
754
1140
1400
5151

19343
41650
21866
43320
56000
182179

529
1156
676
900
1225
4486
51

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Ecuaciones normales

Calcular:
148 = 5

. (1)

5151 = 171

(2)

182179 = 5951

. (3)

Trabajamos con ecuacin (1) y (2), multiplicando (1) por 34,2


148 = 5

. (1)

5151 = 171

(2)

Tendremos:
5061,6 = -171
5151
89,4

171
0

(4)

Trabajamos con la ecuacin (1) y (3) multiplicando la ecuacin (1) por 1190,2
148 = 5

. (1)

182179 = 5951

. (3)

Tendremos:
= - 5951
182179

5951

6029,4

(5)

Trabajamos con ecuacin (4) y (5)


89,4

6029,4

(4)

(5)

Tendremos:

619822,32
0

69919,2

52

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Reemplazamos

en ecuacin (4) y encontramos

89,4

(4)

89,4
89,4
102,8
102,8

Reemplazamos en ecuacin (1) y encontramos

148 = 5
148 = 5
148 = 5
148 = 5
5
5
5

Cul ser el valor esperado si X = 29

Ahora encontramos la varianza residual no explicada

Total

23
34
26
30
35
148

24,65
32,0
24,65
33,34
33,36
148,00

2,00
1,35
1,64
0,00

)
2,7225
4,0000
1,8225
11,1556
2,6896
22,3902

53

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

= 4,4780
7,464 (corregida)
Tambin se puede cualcular usando la siguiente formula:

Reemplazando tenemos:

4,4703
Error estndar de la estimacin

2,1143

(Corregido)

Lmites de confianza para

Cules sern los lmites de confianza, cuando el valor de X


24,65

(3,182)(2,7320)

r=
r

0,9109
54

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

REGRESION Y CORRELACION EXPONENCIAL Y LOGARITMICA


Cuando las variables estudiadas presentan un crecimiento o decrecimiento aritmtico,
la regresin lineal es la ms adecuada, pero si hay un crecimiento o decrecimiento
geomtrico, se debe adoptar la regresin exponencial.
La funcin exponencial:

Se puede convertir en un funcin lineal cuando trabajamos con logaritmos, ya sean


neperianos o con base 10, dando una funcin logartmica

Log
Para la representacin grfica se debe utilizar papel semilogaritmico, cuando la
variable X, localizada en el eje horizontal o abscisa, se presenta en forma de progresin
aritmtica, mientras que en la ordenada, donde se ubica la variable Y, se expresa en
forma logaritmica, Si ambas variables tienen crecimiento geomtrico, la
representacin grfica se hace en papel logartmico.
Ejemplo:
Con los siguientes datos, calcule la regresin exponencial
Clculos para una regresin exponencial
log

log

Total

0,47712 0,95424

0,22764

0,60768

4,05

16

0,77815 3,11261

0,60552

0,84063

6,93

12

25

1,07918 5,39591

1,16463

0,95710

9,06

24

49

1,38021 9,66147

1,90498

1,19005

15,50

12 45

144 1,65321 19,83855 2,73312

1,77241

59,21

30 90

238 5,36787 38,96278 6,63588

5,36787

94,75

Nota: debe tenerse en cuenta que:

Las ecuaciones normales son:

55

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Reemplazando tenemos:
5,36787 = 5 log

. (1)

38,96278
Eliminamos log

(2)

multiplicando la ecuacin (1) por 6 y lo restamos de la segunda

ecuacin
-

32,20722 = - 30 log

. (1)

38,96278

(2)

6,75556 =

58 log
58 log

= 6,75556

log

log

47
antilog 0,11647

Ahora reemplazamos en la ecuacin (1) luego tenemos:


5,36787 = 5 log
5,36787 = 5 log
5 log

= 5,36787

5 log

= 5,36787
= 5,36787 3,4941

5 log

5 log
log

= 1,87377
=

log
antilog 0,11647

Reemplazamos en la ecuacin general


log
log
Estimar cuando X = 10, tendremos
log
log
56

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Log
= antilog 1,53947
= 34,63
Tambin podemos calcular

de la siguiente manera:

log

log
log

0,11647

antilog de 0,11647
1,3075

log

log

=
log

= 0,37475

2,37

Varianza residual y el error estndar de la estimacin


)

Total

log

log

0,47712

0,60768

0,13056

0,0170459

0,77815

0,84063

0,06248

0,0039038

1,07918

0,95710

0,12208

0,0161493

1,38021

1,19005

0,19016

0,0361608

1,65321

1,77241

0,13056

0,0142086

5,36787

5,36787

0,0000

0,0874684

log

log

0,01749368
Este valor tambin se puede calcular de la siguiente manera

57

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Coeficiente de correlacin al cuadrado

Donde

Luego:
0,9012
Tambin:

r
[

][

][

r
ANLISIS DE REGRESIN MLTIPLE
Estudia la influencia de dos o ms variables independientes sobre la dependencia de
otra variable dependiente.
La ecuacin ser:
= bo + b1X1 +b2X2
X 1, X2 = son las dos variables independientes
58

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

bo = es la interseccin en Y, es decir, la ordenada con el eje del punto de


interseccin con el eje Y
b1= es el cambio neto en Y por cada cambio unitario de X 1 manteniendo x2
constante (o sea sin cambios). Se denomina coeficiente de regresin
parcial, coeficiente de regresin neta, ms brevemente, coeficiente
de regresin.
b2 = Es el cambio neto en Y por unidad de cambio en X 2, manteniendo X1
constante (sin cambios). Tambin se denomina coeficiente de
regresin parcial o simplemente coeficiente de regresin.
La ecuacin de la regresin mltiple se puede ampliar a ms variables independientes.
Y' = bo +b1X1 + b2X2 +b3X3 ++bkXk
El mtodo de mnimos cuadrados, minimiza la suma de cuadrados de las desviaciones
verticales con respecto a la lnea de la regresin, principios que se cumple para la
regresin lineal como para la regresin mltiple.
En el caso de dos variables independientes es necesario resolver las siguientes
ecuaciones:
Y = na + b1X1 +b2X2
X1Y = boX1 + b1

+ b2X1X2

X2Y = boX2 + b1X1X2 + b2

Este sistema de ecuaciones se puede resolver de diferentes maneras, una de ellas es


empleando matrices
Ejemplo.El director de personal de una empresa que tiene un importante grupo de
vendedores, debe entrevistar y seleccionar nuevo personal. Ha diseado una prueba
que ayuda a seleccionar los mejores aspirantes para su personal de ventas A fin de
verificar la validez de una prueba como instrumento de prediccin de las ventas
semanales. Eligi al azar a cinco vendedores y aplic la prueba a cada uno. Los
importes de ventas semanales se aparearon con el puntaje obtenido en la prueba y
con la calificacin que se les hizo a su desempeo
1.- Cul ser la ecuacin de regresin mltiple?
2. Supngase que un solicitante de empleo en el departamento de ventas tuvo un
puntaje de 6,0 en la prueba y una calificacin de desempeo de 3,8. Cules son las
ventas semanales estimadas del solicitante?

59

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Vendedor
Juan
Andrea
Ral
Steffany
Eduardo

Ventas semanales
(en miles de soles) Y
5
12
4
8
11

Puntaje de la
Prueba
4
7
3
6
10

Calificacin de
Desempeo
2
5
1
4
6

Solucin:
1.- La ecuacin podr ser calculada de la siguiente forma:

Total

Y
5
12
4
8
11
40

4
7
3
6
10
30

2
5
1
4
6
18

16
49
9
36
100
210

] [

4
25
1
16
36
82

8
35
3
24
60
130

] =[ ]

20
84
12
48
110
274

10
60
4
32
66
172

Reemplazamos en el arreglo matricial

] [

] =[ ]

Encontramos determinante de la matriz 3x3


[

Procedemos a invertir la matriz cuadrada 3x3


*

+ = 320

+ =120

+ = 120

+ = 120

+ = 120

+ = 86

+ = 110

+ = 110

+ = 150

60

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Luego

][

=[ ]

Calculamos los coeficientes de la regresin mltiple


[

=
=

[(

= 3,5

= 0,975
]

= 2,875

Luego la ecuacin ser igual a:


= bo + b1X1 + b2X2
= 3, 5 + ( 0,975) X1 + 2,875X2
Y' = 3,5 + (0,975)6,0 + 2,875(3,8)
Y' = 8,575 miles de nuevos soles.
ERROR ESTNDAR MLTIPLE DE LA ESTIMACIN:
El error estndar de la estimacin en el anlisis de la regresin mltiple mide el error
para valores de Y con respecto al plano de regresin si es que intervienen dos variables
independientes.

Sy.12 =
Puntaje
de
Prueba

Juan
Andrea
Ral
Steffany
Eduardo

4
7
3
6
10

Calificacin
de
Desempeo

Ventas
semanales
(miles de
soles)

2
5
1
4
6

Sy.12 =

5
12
4
8
11

Ventas
semanales
Pronosticadas
(miles de soles)

5,35
11,05
3,45
9,15
11,00
Total

0,35
0,1225
0,95
0,9025
0,55
0,3025
1,15
1,3225
0,00
0,0000
0,00
2,6500

= 1,151 miles de soles

61

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

COEFICIENTE DE CORRELACIN MULTIPLE. (r)


Es la medida de la fuerza de la asociacin entre la variable dependiente y dos o ms
variables independientes
Este coeficiente toma valores entre 0 y a 1 inclusive, siempre es positiva Ejemplo Un
coeficiente de 0,94 indica una asociacin muy fuerte entre las variables dependiente e
independiente. Un coeficiente de 0,09 revela una relacin muy dbil
Correlacin
pequea

Correlacin
moderada

Correlacin
grande

0,50

1,00

sin correlacin

correlacin perfecta

COEFICIENTE DE DETERMINACIN MLTIPLE (r2).-- Proporcin (porcentaje) de la


variacin total en la variable dependiente Y que se explica por medio del conjunto de
variables independientes
COEFICIENTE DE NO DETERMINACIN MLTIPLE (1 r2).- mide la proporcin de la
variacin total en la variable dependiente Y, que no se debe a las variables
independiente.
A
Fuentes
de
Variacin
Regresin
Error
Total

Suma de
Cuadrados

N A V A

Grados de
Libertad

Cuadrado
Medio

Prueba de
significacin

Significacin
estadstica

n1

El coeficiente de determinacin se puede calcular de la siguiente manera:

Error estndar de la estimacin mltiple ser igual a:

Sy.12 =
(

y
5
12
4
8
11
40

5,39
11,05
3,45
9,15
11
40

8
8
8
8
8

3
4
4
0
3
0

)
9
16
16
0
9
50

0,35
0,95
0,55
1,15
0
0

0,1225
0,9025
0,3025
1,3225
0
2,65

2,65
3,05
4,55
1,15
3
0

)
7,0225
9,3025
20,7025
1,3225
9
47,35

Total

62

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Fuentes de variacin
Regresin
Error
Total
F(2,2)= 19,00 (

A
SC
47.35
2.65
50

GL CM
2
23.675
2
1.325
4
99,50 (

F
17.87

SIG
N.S.

Coeficiente de determinacin:

Quiere decir que el 94,70% de la variacin es explicado por la regresin


Coeficiente de regresin mltiple
r=

= 0,9731

Error estndar de la estimacin mltiple:

Sy.12 =

= 1,1510

FUNDAMENTOS DE LA EXPERIMENTACIN AGRCOLA;


DISEOS EXPERIMENTALES
Sabidura frente a experimentacin. Un rey pregunto un da a sus sabios: Pesa ms
una botella cuando entra en ella una mosca? Uno de los sabios opinaba que no, otro
en cambio deca lo contrario, ambos eran apoyados en sus asesores y ambas razones
fueron convincentes; los argumentos eran muy complejos, elocuentes, filosficos y
eruditos, pero el rey se dio cuenta que no poda tomar ninguna resolucin con
respecto a su pregunta, de manera que sugiri a los sabios que cogieran una botella y
una mosca y que resolvieran el problema, ellos mostraron reaccin a hacerlo,
seguramente porque una simple mosca probara que uno de los grupos estaba
equivocado y naturalmente ninguno quera correr el riesgo. No se precisa el final pero
poco importa, el caso es que el rey es el cientfico. Cmo puede probarse un hecho
con abstracciones? Los hechos slo pueden probarse mediante observaciones reales.
Una teora o ley es una recapitulacin de una serie de hechos congruentes, es decir, la
teora sigue a los hechos no los hechos a la teora, significa que la experimentacin es
la ltima fuente de nuevos conocimientos, nuevas leyes y nuevas aplicaciones.

63

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

DISEO Y ANLISIS
Diseo y anlisis son inseparables para un experimento dado, pueda que exista otro
mtodo igualmente para analizar los datos del experimento, cada metodologa debe
estar justificada y sustentada estadsticamente, nuevas tcnicas se exponen en
artculos cientficos para casos o situaciones muy especiales. El experimentador no
tiene que eliminar datos con el fin que se ajuste a un mtodo estadstico, sino que
debe utilizar la tcnica que se ajusta a su experimento; para que exista concordancia,
en el planeamiento del experimento debe contemplarse el mtodo a utilizar. Hay
lmites que el experimentador deber conocer, esta barrera constituye los lmites a la
libertad de disear un experimento. Hay buenos y malos diseos, los anlisis pueden
ser simples o complicados, el experimentador est obligado a aceptar
estadsticamente un resultado bajo los supuestos que considera como vlidos para la
toma de una decisin.
Ejemplos
Imagine un experimento en el que se alimenta a 300 nios japoneses con pescado y a
300 nios suecos con carnes rojas, durante cinco aos, con resultados: altura media
del grupo japons de 1.55 metros y de los suecos de 1.68 metras. Un experimentador
est interesado en saber el efecto de la dieta en la altura de los muchachos, la consulta
se hace a un estadstico y este responde que el efecto de la dieta y la diferencia racial
se confunden completamente y no hay forma de

dieta y la diferencia racial se confunden completamente y no hay forma de


separarlos, un antroplogo responde que la diferencia de altura se debe a la
diferencia racial.

Ejemplo 2

En experimentos mdicos, clasificar el resultado del diagnstico de un paciente,


a menudo es un problema. Considere el siguiente caso: cinco radilogos
examinan una radiografa y dos de ellos afirma que hay una lesin en el trax,
tres dicen lo contrario; entonces recurren a un estadstico para que decida si el
paciente tiene o no lesin, este caso de identificacin es similar a pesar ratones
con una balanza defectuosa y a partir de estos datos determinar el verdadero
peso de los ratones. El trabajo del experimentador consiste en asegurar la
exactitud de los pesos de los ratones y en el caso mdico el diagnstico del
paciente.

64

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

DISEO DEL EXPERIMENTO.Disear significa planear un experimento de manera que se pueda obtener la
informacin pertinente al problema bajo investigacin y as tomar decisiones
correctas.
El diseo de un experimento es una etapa fundamental de la experimentacin,
permite que los datos que resulten del experimento, conduzcan a un anlisis objetivo y
deducciones vlidas con respecto al problema.
ETAPAS FUNDAMENTALES DE LA EXPERIMENTACION
1.

2.
3.

4.
5.
6.
7.
8.

9.
10.

Especificacin del problema


Antecedentes
Importancia
Objetivos
Nmero o intensidad de los tratamientos
Formulacin de hiptesis
Revisin de la bibliografa respectiva
Planeamiento (Diseo) del experimento (materiales y mtodos)
Lugar del experimento
Tamao de parcela o unidad experimental
Nmero de repeticiones por tratamiento.
Instrumentos y equipos
Mtodos de evaluacin de resultados (Prueba de hiptesis, nivel de
significacin)
Ejecucin y desarrollo de operaciones en el campo o laboratorio.
Recoleccin de datos y observaciones mustrales.
Ordenamiento de los resultados experimentales.
Interpretacin y evaluacin de resultados.
Discusin de los resultados en relacin con los conocimientos tericos, con los
principios del razonamiento riguroso o con resultados obtenidos en
experimentos similares.
Anlisis Econmico y utilidad prctica.
Conclusiones y recomendaciones.

CONCEPTOS GENERALES
Tratamiento
Factor sometido a estudio y comparacin en un experimento.
Una marca de fertilizante
Cantidad de fertilizante Profundidad del sembrado

65

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Una cra de ganado.


El sexo de los animales.
El padre del animal experimental.
La racin particular de alimento de un animal.
Variedad de un cultivo.
Un sistema de riego
En estudios sicolgicos y sociolgicos pueden ser:
Edad
Sexo
Grado de educacin.
Testigo
Es un tratamiento especial del experimento y sirve como comparacin de los
tratamientos en prueba. As por ejemplo:
Fertilizantes formados por diferentes niveles de NPK (nitrgeno, fsforo y potasio) el
testigo es el tratamiento con cero en los niveles de NPK, los tratamientos son
evaluados en parcelas y al final se mide el efecto de cada uno. La inclusin del testigo
permite medir el efecto de los diferentes niveles de NPK.
Unidad Experimental
Es el material al que se aplica los tratamientos y se evala. La respuesta es registrada
en una variable que podra ser altura promedio de plantas de una parcela, rendimiento
total o promedio de la parcela, nmero de plantas sobrevivientes, materia orgnica del
suelo y todas las variables de inters. As, una unidad experimental podra ser:
Una maceta
Una parcela
Una planta
Una persona
Un animal...
La Unidad podra aun estar dividida en subparcelas, o servir como unidad para ser
muestreada y cada unidad de muestreo una subunidad de la unidad experimental. En
resumen la unidad experimental es la afectada por un tratamiento.
Diseo Experimental
Es el plan usado en experimentacin e implica la asignacin de los tratamientos a las
unidades experimentales.
Ejemplos:
Los tratamientos se asignan al azar en la totalidad de unidades experimentales,
en este caso al diseo se le llama DISEO COMPLETAMENTE AL AZAR

66

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Si los tratamientos se asignan al azar dentro de grupos de unidades


homogneas, el diseo se llama BLOQUES AL AZAR, y si an en cada grupo se
encuentra todos los tratamientos, el diseo se llama BLOQUES COMPLETOS AL
AZAR.

Repeticin
Es una rplica de la aplicacin de un tratamiento en otra unidad experimental bajo las
mismas condiciones.
Error experimental
Es una fuente de variacin que permite evaluar el efecto de los tratamientos. El error
experimental se forma por la variacin de las unidades que recibieron el mismo trato
en la aplicacin de los tratamientos y que por efectos no controlables reportan ciertas
diferencias. Se supone que esta variable es totalmente aleatoria.
El error experimental es el fracaso de llegar a resultados idnticos con dos unidades
experimentales tratadas por igual.
Coeficiente de variacin
Es una medida de variacin del experimento en funcin del error experimental y la
magnitud de la variable en estudio. As:
CV = 100%
El valor CV. en experimentos agronmicos no debe ser mayor del 30 %, de ser mayor,
restar confiabilidad a los resultados estadsticos. En experimentos conducidos en
invernadero, laboratorios o centros bajo control ambiental, el CV permitido debe ser
menor del 15 %.
Fuentes de Variacin
Las fuentes de variacin estn referidas a las fuentes controlables y no controlables de
un diseo experimental, la suma parcial de estas fuentes de variacin generan la
variacin total respuesta del experimento.
Grados de Libertad
Son parmetros de la distribucin de probabilidades de la fuente de variacin en
estudio y corresponde al nmero de vectores linealmente independientes que
conforman la matriz de la forma cuadrtica de dicha fuente. Las reglas para determinar
su valor en la prctica son simples, ya estn definidas para los modelos estadsticos en
estudio.

67

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

PRINCIPIOS BSICOS DEL DISEO EXPERIMENTAL


Son tres los principios bsicos: repeticin, aleatorizacln y control local.
REPETICIN
Es importante porque:
a) Proporciona una estimacin del error experimental
b) Obtiene una estimacin ms precisa del efecto medio

Donde:
= Variancia del error experimental verdadero
r = Nmero de repeticiones.
ALEATORIZACION
El proceso de aleatorizacin (asignacin de los tratamientos a las unidades
experimentales) garantiza independencia en los errores. Los errores asociados con
unidades experimentales que estn afectas a espacio o tiempo, tienden a
correlacionarse, y lo que hace la aleatorizacin es asegurar en parte la independencia.
CONTROL LOCAL
Sinnimo de diseo experimental, el control local se refiere al balanceo, bloqueo y
agrupamiento de las unidades experimentales que se utilizan en el experimento,
aunque los tres trminos son sinnimos cada uno explica algo referente a la unidad
experimental, as:
Agrupamiento de unidades experimentales homogneas.
Bloqueo como la distribucin de las unidades experimentales relativamente
homogneas dentro del bloque.
Balance como la asignacin de los tratamientos a las unidades experimentales, de
modo tal que resulte una configuracin balanceada, igual repeticin por tratamiento.
Ejemplos:
Balance completo.
Se distribuye tres raciones para porcinos en grupos de tres animales, en cada grupo se
asigna las tres raciones uno por animal y en cuatro grupos diferentes.
Aproximacin a balance completo.

68

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Caso anterior. Se dispone de cuatro animales por grupo, las tres raciones se aplican
aleatoriamente en cada grupo, en las unidades faltantes de aplica uno de los
tratamientos aplicados, este tendr ocho repeticiones.
Balance parcial.
Caso anterior, se completa el primer grupo a seis cerdos, se tiene dos replicas en el
primer grupo, frente a una rplica en los otros grupos.
El control local es para hacer ms eficiente el diseo, los procedimientos son ms
consistentes. El uso adecuado del control local permite una disminucin del error
experimental.
DISEO COMPLETAMENTE AL AZAR
Es el ms simpe de todos los diseos con distribucin al azar. En este diseo los
tratamientos se distribuyen al azar en todas las unidades experimentales, y el nmero
de repeticiones o unidades por tratamiento puede ser igual o diferente.
El diseo completamente al azar es el diseo ms simple y se usa cuando las unidades
experimentales son homogneas, y la variacin entre ellas es muy pequea. Tal es el
caso de experimentos de laboratorios, invernadero, gallineros, porcinas, etc. En
experimentos en que las condiciones ambientales son controladas, as por ejemplo
puede ser aplicado para estudiar diferentes dosis de una vitamina en aves de una
determinada edad y raza, siempre que estn en el mismo corral o corrales idnticos;
para estudios en macetas, etc, este diseo es una prueba con un solo criterio de
clasificacin.
LAS VENTAJAS DE ESTE DISEO SON:
a.- Es fcil de planear.
b.- Es flexible en cuanto al nmero de tratamientos y repeticiones, el lmite est dado
por el nmero de unidades experimentales en general.
c.- No es necesario que el nmero de tratamientos sea igual al nmero de
repeticiones.
d.- No se estima parcelas perdidas.
e.- El nmero de grados de libertad para el error aumenta al no tener muchas
restricciones.
LAS DESVENTAJAS DEL DISEO SON:
a.- No es eficiente con material experimental heterogneo.
b.- Puesto que no existen restricciones en cuanto a la aleatoriedad, el error
experimental incluye la variacin total entre unidades experimentales

69

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

A
FUENTE DE
VARIACION

SUMA DE
CUADRADOS
SC

Tratamiento
Error

TC

SC tot. SC tra.

Total

Termino de correccin (TC) =

GRADOS DE
LIBERTAD
GL

CUADRADO
MEDIO
CM

PRUEBA
ESTADISTICA
F

t 1

t(r 1)

tr 1

TC

C.V. =

DISEO COMPLETAMENTE AL AZAR CON IGUAL NMERO DE UNIDADES POR


TRATAMIENTO
En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella.
Se tomaron cuatro macetas por tratamiento. Los rendimientos se presentan a
continuacin. Probar las hiptesis correspondientes.

Maceta
1
s 2
3
4
Total
Media

TRATAMIENTOS
1
2
3
4
5
101 51
83
67
29
93
61
68
40
45
93
59
72
46
51
96
58
75
52
42
383 229 298 205 167
93, 57, 74, 51, 41,
75

25

50

25

128
2

75

No existe diferencia entre tratamientos


Si existe diferencia entre tratamientos
TC =

TC

82176

SC total =

SC total
SC tratamientos =

TC = 8168

70

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

SC tratamientos =

7286

SC error = SC total SC tratamientos


= 82176 7286 = 882

A N A V A
Fuentes de Variacin
Tratamiento
VvvAvariacion
(entre muestras)
Error
(Dentro de muestras)
Total

C.V. =

SC
7286

GL
4

CM
1821,5

882

15

58,15

8168

F
30,98

SIG
**

19
F 0.05 = 3,06
0,01= 4,89
100= 46,33%

El coeficiente de variabilidad o coeficiente de variacin indica la confiablidad en los


datos, a medida que su valor disminuye la confiabilidad es mayor.
PRUEBAS DE COMPARACION
Existen muchas pruebas para la comparacin de tratamientos, cada una de las pruebas
tienen un uso y exigencia especifica. Por ejemplo existen pruebas para un par de
tratamientos, para todos los pares de tratamientos, para todos los tratamientos versus
un control, para comparar grupos de tratamientos.
En un experimento no es necesario aplicar diferentes pruebas de comparacin.
Alguna de las pruebas de comparacin son:
Prueba t (para comparacin planeadas de un par de tratamientos)
Prueba DLS (para comparaciones planeadas de un par de tratamientos)
Prueba de Tukey (para todas las comparaciones que no necesariamente son
planeadas
Prueba de Dunnett (para comparar un tratamiento considerado como testigo
versus los dems tratamientos)
Prueba de contrastes ortogonales ( para funciones lineales de la media y
comparaciones paneadas)

PRUEBA DE SIGNIFICACIN DE t
Las pruebas de hiptesis sern:

71

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

1 vs 2

1 vs 3

1 vs 4

1vs 5

2 vs 3

Ho

Ho

Ho

Ho

Ho

Ha

Ha

Ha

Ha

Ha

2 vs 4

2 vs 5

3 vs 4

3 vs 5

4 vs 5

Ho

Ho

Ho

Ho

Ho

Ha

Ha

Ha

Ha

Ha

El error estndar ser


S =

= 5, 39

Se busca en las tablas de t


t
t

0,05= 2,131
0,01= 2,947

Comparaciones
t=

se repite para cada par de comparaciones

= 6, 77**

t=

= 3, 57**

t=

= 7, 88**

t=

= 9, 64**

t=

= 17, 25 *

t=

= 1, 11 N.S.

t=

= 2, 87*

t=

= 4, 31**

t=

= 6, 07**

t=

72

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

t=

= 1, 76 N.S.

PRUEBA DE D. L. S.
Con la prueba de t habra que realizar tantas pruebas como comparaciones, por lo que
si el nmero de tratamientos en el experimento es elevado resultara tedioso realizar
tantas pruebas de t. Esta labor puede aliviarse enormemente empleando la prueba de
DLS, que no es ms que la prueba de t, pero realizada mediante un artificio con el cual
se obtiene los mismos resultados que se obtendran si se hicieran todas las pruebas de
t.
El valor de DLS establece los lmites de separacin de las regiones de aceptacin o de
rechazo de la Hiptesis nula.
Es as que con un solo valor de DLS se acepta o rechaza todas las hiptesis nulas (forma
abreviada de la prueba de t)
D.L.S. = t. S
D.L.S. = 2,131 x 5, 39= 11.48
1 vs 2 = 93,75 57,25 = 36,5*
1 vs 3 = 93,75 74,50 = 19,25*
1 vs 4 = 93,75 51,25 = 42,5*
1 vs 5 = 93,75 41,75 = 52,00*
2 vs 3 = 57,25 74,50 = 17,25*
2 vs 4 = 57,25 51,25 = 6,00 N.S.
2 vs 5 = 57,25 41,75 = 15,50*
3 vs 4 = 74,50 51,25 = 23,25*
3 vs 5 = 74,50 41,75 = 32,75*
4 vs 5 = 51,25 41,75 = 9,5 N.S.
PRUEBA DE SIGNIFICACIN DE DUNCAN
La ventaja de esta prueba consiste en el hecho de que no necesita que el valor de F sea
significativo para poderlo usar.
Es una prueba que permite comparar todas las medias entre s, sin restricciones.
Esta prueba tiene en cuenta el orden de los promedios de cada uno de los
tratamientos.
S =

= 3, 81

Con los grados de libertad del error buscamos en la tabla de Duncan (A.E.S.)
3,01

3,16

3,25

3,31

Encontramos la A.L.S.
73

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

A.L.S. =A.E.S. x S
2
3.01
3.81
11.46

A.E.S.
S
A.L.S.

3
3.16
3.81
12.03

4
3.25
3.81
12.38

5
3.31
3.81
12.61

Ordenamos en orden creciente los promedios


Tratamiento
Promedio

41,75

51,25

57,25

74,50

93,73

Comparamos los promedios desde el mayor hasta el menor


1 5 = 93,73 41,75 = 51,98 > 12,61 *
1 4 = 93,73 51,25 = 42,48 > 12,38 *
1 2 = 93,73 57,25 = 36,48 > 12,03 *
1 3 = 93,73 74,50 = 19,23 > 11,46 *
3 5 = 74,50 41,74 = 32,76 > 12,38 *
3 4 = 74,50 51,25 = 23,25 > 12,03 *
3 2 = 74,50 57,25 = 17,00 > 11,46 *
2 5 = 57,25 41,75 = 15,50 > 12,03 *
2 4 = 57,25 51,25 = 6,00 < 11,46 N.S.
4 5 = 51,25 41,75 = 9,50 < 11,46 N.S.
Otro mtodo
Tratamiento
1
3
2
4
5

Promedio
93,70
74,50
57,25
51,25
41,75

Los tratamientos bajo la misma recta son estadsticamente iguales.


PRUEBA DE SIGNIFICACIN DE TUKEY
Esta prueba se usa para hacer todas las comparaciones mltiples posibles con t
tratamientos y es vlida cuando las repeticiones estn completas. No es necesario que
de F del ANAVA resulte significativa.

=3,81

Buscamos en la tabla de Tukey con los grados de libertad del error y el nmero de
tratamientos.
74

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

A.E.S. (T) = A.E.S. (15 y 5) = 4,37


A.L.S. = S

A.E.S. (T)

A.L.S. = 3,81 X 4,37 =16,64


Realizamos las comparaciones mltiples
Tratamiento
2
4
2
4
5

Promedio
93,70
74,50
57,25
51,25
41,75

Los promedios bajo la misma recta son estadsticamente iguales

DISEO COMPLETAMENTE AL AZAR CON DIFERENTE NMERO DE UNIDADES POR


TRATAMIENTO
A veces se presenta el caso de que por insuficiencia de material para todos los
tratamientos, o porque se han perdido unidades experimentales, no se dispone de
igual nmero de observaciones por tratamiento. Esta es una de las ventajas del diseo
completamente al azar, ya que los datos se pueden analizar directamente sin
necesidad de estimar parcelas perdidas.
Por ejemplo se analiz un experimento de cuatro raciones para cerdos con nueve
cerdos por racin. Durante el experimento se present una enfermedad y murieron 16
cerdos.
La hiptesis a probar es:
No existe diferencia entre los tratamientos
Ha: Si existe diferencia entre los tratamientos

Repeticiones
1
2
3
4
5
6
7
8
9
Total

TC =

1
45
46
49
44

184
46

RACIONES
2
3
35
34
33
34
35
34
33

68
54

170
34

4
41
41
44
43
41
42
44
41
41
378
42

800

Gran Total

=
75

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

SC. Tratamientos =
SC. Total =

32 000=464

SC error = SC total SC tratamientos =464 432 = 32

ANAVA
Fuentes de Variacin
Tratamiento
Error
Total

SC
432
32
464

GL
3
16
19

CM,
72
2

F
36

SIG
**

F 0.05 3,24
0,01 5,29

C.V. =

x 100= 3, 52%

Como F es altamente significativo, nos permite rechazar la hiptesis nula de que no


hay diferencias entre los tratamientos
El coeficiente de variabilidad o coeficiente de variacin indica la confiablidad en los
datos, a medida que su valor disminuye la confiabilidad es mayor.
DISEO DE BLOQUES COMPLETOS AL AZAR
El objetivo del diseo bloques completos al azar es reunir las unidades experimentales
a las cuales se aplicaran los tratamientos, en bloques de cierto tamao, de tal modo de
que los tratamientos se efecten dentro de cada bloque. La variabilidad entre
unidades experimentales de bloques diferentes ser mayor que entre unidades dentro
del mismo bloque, como consecuencia, las diferencias encontradas entre unidades, se
deben principalmente a discrepancias entre tratamientos. La disparidad que no se
deba a tratamientos, se elimina por el diseo y forma parte del error experimental. De
acuerdo con esto, es fcil observar que la variabilidad entre bloques no afecta las
diferencias entre medias de tratamientos, porque en cada bloque aparece una vez por
tratamiento, y as los bloques y tratamientos son ortogonales.
Siempre que se pueda distinguir la presencia de una fuente de variabilidad en las
unidades experimentales debe emplear el diseo de Bloque Completo al Azar
En el Bloque Completa al Azar todas las unidades que corresponden a un mismo nivel
de la fuente forman un bloque, luego debe haber tantos bloques como niveles se
consideren, y el nmero de unidades de cada bloque debe ser igual al nmero de
tratamientos por comparar.

76

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Durante el experimento todas las parcelas dentro del bloque se deben tratar igual,
excepto cuando se aplique un tratamiento cuyo efecto se quiere medir. Por ejemplo, si
los tratamientos son niveles de fertilizacin, todos los dems factores como
preparacin del suelo, poca, densidad de siembra, labores de cultivo, uso de
plaguicidas, riegos y variedades deben ser exactamente iguales para todas las parcelas,
si no es as, se introduciran otras fuentes de variacin cuyo efecto no se podra medir,
y ocultaran el efecto de los tratamientos en estudio.
A continuacin se da una representacin grfica de los diseos completamente
randomizado y bloques completa randomizado, donde las letras indican tratamientos,
los nmeros romanos representan los niveles de variacin de una fuente, cada
casillero corresponde a una unidad experimental.
Este diseo tambin se conoce como diseo de doble via, se aplica cuando el material
es heterogneo. Las unidades experimentales homogneas se agrupan formando
grupos homogneos llamados bloques.
Ventajas
El agrupamiento de las unidades experimentales en bloques, debido a la
existencia real de esta fuente de variabilidad, aumenta la precisin del
experimento con relacin a un D.C.A.
No existe restricciones en cuanto al nmero de tratamientos o bloques
El anlisis estadstico es simple
Si se pierde los datos de un bloque completo, estos pueden omitirse sin
mayores complicaciones para el estudio. Si faltan datos de unidades
experimentales, estos pueden estimarse (estimacin de unidades perdidas)
Ventajas
Cuando la variabilidad entre las unidades experimentales dentro de los bloques
es grande, resulta un error experimental considerable. Esto ocurre usualmente
cuando el nmero de tratamientos es muy grande.
Si existe interaccin entre los bloques y los tratamientos, esta va incluida en el
error experimental
Si no existe una real diferencia entre bloques, habr una perdida de precisin
en el experimento con relacin al D.C.A. debido a la disminucin de los grados
de libertad del error.
COMPLETAMENTE
RANDOMIZADO
B
B
D
B

A
D
C
A

A
C
A
A

C
C
B
C

BLOQUE COMPLETO
RANDOMIZADO
I
II
III
IV

B
A
C
D

D
D
B
A

A
C
A
B

C
B
D
C

77

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

REPETICIONES
J=1,2,3,r
Tratamiento
i=1,2,3t
1
2

Suma Media

t
Suma
Media

Caractersticas:
1. Las unidades experimentales son homogneas
2. Las unidades homogneas estn agrupadas formando bloques
3. En cada bloque se tiene un nmero de unidades igual al nmero de
tratamientos (bloque completo)
4. Los tratamientos estn distribuidos al azar en cada bloque
5.- El nmero de repeticiones es igual al nmero de bloques.
A N A V A
Fuente de Variacin

SC

TRATAMIENTOS

TC

REPETICIONES

TC

ERROR
TOTAL

SC tot. = SCtrat. SC rep.

TC

GL

CM

t1

r1

(t 1)(r 1)

n1

TC =

El siguiente ejemplo presenta los resultados de seis variedades de frijol (rendimiento


expresado en gr/parcela) en el que se usaron cuatro repeticiones por tratamiento.
Se quiere probar la siguiente hiptesis:
Ho: No existe diferencias entre tratamientos
Ha: Existe diferencias entre tratamientos, ms all de lo que puede atribuirse
al azar

78

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Variedades
Bayo
Canario
Blanco
Testigo
De Palo
Panamito
Total
Promedio

1
42
32
25
18
35
36
188
31,33

REPETICIONES
2
3
4
46
38
41
38
31
30
32
28
26
20
26
24
42
46
40
25
22
26
203
191
187
33,83 31,83 31,17

total
167
131
111
88
163
109
769

Promedio
41,75
32,75
27,75
22,00
40,75
27,25
32,04

TC =
SC total
SC repeticiones
SC tratamientos

24640 = 1251

SC error = 1565 27 1251 = 287


A
Fuentes de
Variacin
Tratamiento
Repeticin
Error
Total

SC

GL

CM

Sig.

1251
27
287
1365

5
3
15
23

250.2
9.0
19.13

13.08
0.47

**
n.s.

F (0, 05) (5, 15) = 2, 90

F (0, 05) (3, 15) = 3, 29

F (0, 01) (5, 15) = 4, 56

F (0, 01) (3, 15) = 5, 42

Los datos indican que se debe rechazar Ho, por lo tanto existe diferencia entre los
tratamientos. La prueba de significacin establecer la superioridad estadstica de una
variedad respecto a otras
El coeficiente de variabilidad del experimento ser igual a
C.V. =

x 100= 28, 49%

El coeficiente de variabilidad depende de muchos factores, tales como:


heterogeneidad del suelo, del diseo experimental, colocacin de las parcela, rea de
las parcelas, cultivo, des uniformidad de los riegos, enfermedades, plagas, fallas de
plantas, operaciones culturales, etc.
79

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

ESTIMACIN DE PARCELA PERDIDA:


Cuando se usa el diseo completamente al azar, la perdida de una parcela no afecta el
procedimiento de clculo. Con el diseo de bloques completos al azar, se pude
presentar el caso que un ataque de pjaros, o insectos haya destruido una parcela, o
que en un ensayo con animales uno de ellos haya muerto. En tales casos es necesario
estimar el valor que falta, antes de aplicar el anlisis de variancia, mediante la
ecuacin:

Donde:
Parcela a estimar
r Nmero de repeticiones
B Total del bloque donde se perdi la parcela
t Nmero de tratamientos
T Total del tratamiento donde se perdi la parcela
G Total general
Cuando ya se estima este valor, se coloca en la parcela faltante y se analiza el
experimento normalmente, slo que los grados de libertad del error y total se
disminuyen en una unidad. Esto se debe a que dicho valor o valores estimados no
tienen desviaciones, por tal razn, no contribuyen a la suma de cuadrados del error.
Por lo tanto, en el total, la suma de cuadrados del tratamiento est aumentada en la
cantidad dada por la siguiente ecuacin (siempre y cuando el nmero de tratamientos
sea mayor a diez)
[
]

DISEO DE CUADRADO LATINO


En este diseo la restriccin para controlar la variabilidad est en dos direcciones,
hileras y columnas. Los tratamientos se arreglan en bloques de dos sentidos y cada
tratamiento aparece una vez en cada hilera y columna. El anlisis de los datos puede
eliminar del error la variabilidad debida a la hilera y columna. Por ejemplo,
considrese:
- Tratamiento con cinco niveles de vitamina para el crecimiento.
- Hileras con cinco camadas de cerdos de cinco cerdos cada una.
- Columnas con cinco sistemas de crianza.
Debe existir el mismo nmero de tratamientos, hileras y columnas, o sea, el nmero
de tratamientos es igual al nmero columnas y al nmero de repeticiones.

80

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

CARACTERISTICAS
- Las unidades experimentales (u.e.) se distribuyen en grupos, bajo dos criterios
de homogeneidad dentro de la fila y dentro de la columna y heterogeneidad en
otra forma
- En cada fila y en cada columna, el nmero de columnas es igual al nmero de
los tratamientos
- Los tratamientos son asignados al azar en las unidades experimentales dentro
de cada fila y dentro de cada columna
- El nmero de filas es igual al nmero de columnas e igual al nmero de
tratamientos
- Los anlisis estadsticos T student, Duncan, Tuckey y en prueba de contraste se
procede como el diseo completo al azar y el diseo de bloques. La desviacin
estndar de la diferencia de los promedios y la desviacin estndar de del
promedio, estn en funcin del cuadrado medio del error experimental.
- El nombre de cuadrado latino, se debe a R. A. Fisher, las primeras aplicaciones
fueron en el campo agronmico, especialmente en los casos de suelos con
tendencias en fertilidad en dos direcciones.
VENTAJAS
La existencia real de dos fuentes de variabilidad entre las unidades
experimentales y su separacin en el anlisis de variancia permite incrementar
la precisin experimental
La prdida de una o ms unidades experimentales (U.E.) no influye
esencialmente el ANAVA de ste diseo, siendo posible estimar los resultados
de las U.E. perdidas
DESVENTAJAS
El diseo no es flexible ya que el nmero de tratamientos depende del nmero
de filas y columnas que se disponga.
La existencia de interacciones de 2 efectos (filas x columnas, filas x
tratamientos, columnas x tratamientos) 3 efectos (filas x columnas x
tratamientos) va incluida en el error experimental
No es recomendable para un elevado nmero de tratamientos ya que en estos
casos se requiere de un elevado nmero de unidades experimentales.
Formacin de cuadrados latinos
Suponga 4 tratamientos A, B, C, D, con estos tratamientos se pueden formar 4 cuadros
diferentes llamados tpicos o estndar (en primera fila y en primera columna se tiene
la misma distribucin

81

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

A
B
C
D

B
C
D
A

C
D
A
B

D
A
B
C

D
C
A
B

A
B
C
D

B
C
D
A

C
D
A
B

D
A
B
C

D
C
B
A

A
B
C
D

B
A
D
C

C
D
A
B

D
C
B
A

A
B
C
D

B
A
D
C

C
D
B
A

D
C
A
B

A
B
C
D

B
A
D
C

C
D
B
A

A
B
C
D

B
D
A
C

C
A
D
B

Un arreglo para cuatro tratamientos podra ser:


A
D
C
B

D
C
B
A

B
A
D
C

C
B
A
D

De cada cuadro se obtiene 144 formas diferentes, en total se tiene 576 cuadros
diferentes.
La siguiente tabla permite relacionar el nmero de cuadros en funcin del tamao
Tamao No. De formas
del
tpicas
cuadro
3x3
1
4x4
4
5x5
56
6x6
9408

Valor de
n (n
12
144
2880
86400

No. Total de
Cuadrados
diferentes
12
576
161280
812851200

Asignacin de tratamientos
Los tratamientos deben asignarse empleando uno de los cuadro de los posibles, es
decir si son cuatro tratamientos, escoger entre los 576 posibles.
Este diseo se recomienda cuando el nmero de tratamientos oscila entre 3 y 10.

82

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

ANAVA
Fuente de Variacin

SC

Tratamientos

TC

Hileras

TC

Columnas

TC

Error

SC tot. SCtrat. SCHiler. SCcolum

Total

GL

CM

t1

r1

c1

(r 1)(r 2)

n1

TC

TC =
Ejemplo:
Un experimento con cuatro variedades de arroz, con gradientes en dos sentidos, se
muestran a continuacin (el rendimiento se d en Kg/parcela)
Total hilera

Total columna

Total de Tratamientos A = 32

B
2
A
7
D
5
C
6

D
3
C
5
B
4
A
9

A
6
B
5
C
9
D
5

C
8
D
7
A
10
B
5

20

21

25

30

B =16
TC =

SC total =
SC hileras =
SC columna =
SC tratamientos =

C = 28
=

19
24
28
25
96

D = 20

= 576
576 = 74

576 10,5
576 = 15,5
576 =40 9,78

Sc error = SC total SC tratamiento SC hilera SC columna


= 74 40 10,5 15,5 = 8

83

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Fuentes de Variabilidad
Tratamiento
Hilera
Columna
Error
Total

SC
10
10.5
15.5
8
74

A
GL
3
3
3
6
15

CM
13.333
3.5
5.166
1.1333

F
10.00
2.625
3.875

SIG
**
N.S
N.S

F (0,05) = 4,76
(0,01) = 9,78

La significacin de hileras columnas indica en qu direccin del terreno est la


fertilidad del suelo. En este experimento no se detect dicha variabilidad en ninguna
hilera ni en columna. El coeficiente de variabilidad indicar la confiabilidad en los datos
C.V. =

x 100=17,74%

La prueba de significacin correspondiente indicar cul o cules tratamientos son los


mejores.
ESTIMACIN DE PARCELAS PRDIDAS
Cuando en el diseo de cuadrado latino se pierde una unidad experimental, se puede
estimar con la siguiente ecuacin.
X=

]
( )( )

Donde:
X = Parcela estimada
H = Total de hileras donde est la parcela perdida
C = Total de columnas donde est la parcela perdida
T = Total del tratamiento donde est la parcela perdida
G = Total general
r = Nmero de repeticiones
Igual que en el diseo de bloques al azar, la suma de cuadrados de los tratamientos se
debe corregir cuando el nmero de tratamientos sea mayor de 10, restndole el
siguiente trmino
[

]
[

Cuando se hace el ANAVA debe restarle un grado de libertad al total

84

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

EXPERIMENTOS FACTORIALES
Los factoriales son combinaciones de factores (nitrgeno, fsforo, variedades, sustancias,

niveles de concentrado, etc.) para formar tratamientos, los cuales se aplican en los
diseos experimentales (DCA, DBCA, DCL). La informacin obtenida de estos
experimentos es amplia, ya que permiten comparar los niveles de cada factor entre si
y evaluar las interacciones que resulten como combinaciones de los factores, as como
la comparacin de niveles de un factor bajo un nivel de otro factor.
En un experimento con factoriales, si todos los niveles de un factor se combinan con
todos los niveles de otro factor, entonces se dice que estos factores estn cruzados. Si
los niveles de un factor se combinan con ciertos niveles de otro factor se dice que
estos factores estn anidados.
Ejemplo
Los niveles de un factor A

se combinan con los niveles de un factor B

Los tratamientos.
Los factores A y B estn cruzados
Ejemplo
Los niveles de un factor A

se combinan con los niveles de un factor B

Los tratamientos.
El factor B esta anidado. Se representa como B(A)
En el presente capitulo ser tratado los factoriales con FACTORES CRUZADOS.
CONCEPTOS GENERALES
FACTOR.
Es sinnimo de tratamiento e involucra diferentes niveles. Por ejemplo el Nitrgeno
en la formacin del abono, este puede contener diferentes porcentajes, cada uno
constituye un nivel que tambin representa un tratamiento.
FACTORIAL
Es una combinacin de factores para formar tratamientos.
85

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

NIVEL
Es la dosis o cantidad del ingrediente (Factor) empleado en el tratamiento. Ejemplo. 2
% de nitrgeno
EFECTO PRINCIPAL
Es el efecto promedio del factor sobre los otros niveles del mismo factor
independiente de los otros factores. Ejemplo: Efecto de nitrgeno en las unidades
experimentales al aplicar un abono formado por nitrgeno, fsforo y potasio.
EFECTO INTERACCION
Es el efecto adicional debido a la influencia combinada de dos o ms factores.
Ejemplo. Efecto conjunto Nitrgeno-Fsforo en la unidad experimental.
EFECTO SIMPLE
Es el efecto de los niveles del factor en un nivel de otro factor. Ejemplo. Efecto del
nitrgeno bajo la presencia de 0.5 % de fsforo. Es un efecto derivado del efecto de la
interaccin.
EFECTO SIMPLE SIMPLE
Es el efecto de los niveles del factor a una combinacin de los otros factores, por
ejemplo, el efecto del nitrgeno en las unidades experimentales, bajo la presencia de
0.5% de fsforo y 1% de Potasio.
TIPOS DE FACTORES
FACTORES CUANTITATIVOS
Si sus niveles son cantidades cuantificables. Ejemplo. Niveles de Fsforo a 0.5%, 1% y
1.5%
FACTORES CUALITATIVOS
Si sus niveles no tienen orden natural y corresponden a clases o categoras. Ejemplo.
Variedades de frjol.
Ejemplo, un factor es definido por 3 sustancias de crecimiento a 4 niveles de
concentracin aplicados en un experimento para evaluar la propagacin vegetativa de
un cultivo sobre medios artificiales. La formacin de callos se medir a la cuarta
semana.
El factor (A) sustancia de crecimiento con niveles:
: Acido Indolactlco (A/A)
: Cinetina (C)
: Acido Naftalenoactico (ANA)

86

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

El factor (B) concentracin con niveles:


b1: 0.0
b2: 0.1 M
b3: 1.0 M
b4:10.0 M
Al combinar ambos factores A y B se tiene 3x4 = 12 tratamientos para ser evaluados.
Los factores se identifican con letras maysculas y los niveles con letras minsculas,
por ejemplo:
Factor sustancia = A con niveles
Factor concentracin = B con niveles
La combinacin resultante:

,...,

Estos tratamientos son:


= 0.0 concentracin de A/A
= 0.1 M concentracin de A/A

= 10 M de concentracin de A/A
Si cada tratamiento se aplica a 4 unidades experimentales, se requiere 48 unidades
experimentales (u.e) para realizar el experimento.
Los factoriales son expresados mediante la siguiente notacin:
2A2B = 2x2 = : 2 niveles de A por 2 niveles de B.
2A3B = 2x3 : 2 niveles de A por 3 niveles de B.
2A2B2C = 2x2x2 = ; 3 factores a 2 niveles cada uno.
2A3B3C = 2x : 2 niveles de A por 3 niveles de B y 3 niveles de C.
FORMACION DE FACTORIALES
En la formacin de factoriales, se debe tener presente lo siguiente:
1.- Que factores deben incluirse.
2.- Que factores son fijos (modelo I) y que factores son al Azar (modelo II).
3.- Cuantos niveles por factor
4.- SI son factores cuantitativos, cul debe ser el espaciamiento entre los niveles del
factor. Por ejemplo: 0%, 5% y 10% de nitrgeno, significa igual espaciamiento.
VENTAJAS Y DESVENTAJAS EN EXPERIMENTOS CON FACTORIALES
Los experimentos con factoriales tienen las siguientes ventajas:

87

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

1.- Permiten el estudio de los niveles de cada factor y las Interacciones entre ellos.
2.- Permiten el estudio de los niveles de un factor en la combinacin de un slo nivel
de otro factor (estudio de efectos simples).
3.- Todas las unidades experimentales intervienen en el estudio de todos los efectos
del factor (principales e interaccin)
Desventajas:
1.- El nmero de unidades experimentales utilizadas es mayor que en experimentos
simples y es ms difcil contar con un nmero suficiente de unidades que requiere
el experimento.
2.- El anlisis se complica, a medida que el nmero de factores y niveles aumenta.
3.- Algunas combinaciones pueda que no sean de importancia, pero deben incluirse
para completar el factorial, esto obliga a usar ms unidades experimentales.
ANALISIS ESTADISTICO DE LOS FACTORIALES
Los factoriales son los tratamientos en los diseos experimentales, esto significa que la
fuente de variacin debida al efecto de tratamientos comprende los efectos derivados
de la combinacin de los factores. As, por ejemplo:
Factor A, con 3 niveles, factor B con 2 niveles. El nmero de tratamientos son 3x2 = 6,
con grados de libertad igual a (6-1)= 5.
Esta fuente (tratamientos) est descompuesta en:
Efecto de A con (3-1) =2 gl.
Efecto de B con (2-1) = 1 gl.
Efecto de AB con (3-1) (2-1) = 2 gl.
La suma de los grados de libertad 2+1+2 = 5, es igual a los gl. de tratamientos.
La descomposicin es ortogonal, esto significa que los tratamientos deben tener
IGUAL NUMERO DE REPETICIONES, de lo contrario no ser posible descomponer en
forma ortogonal la suma de cuadrados de tratamientos. La suma de cuadrados de
tratamiento cumple la siguiente relacin:
SC (Tratamientos) = SC(A) + SC (B) + SC (AB)
En el caso de tres factores combinados (A, B y C), por ejemplo, 2 niveles de A, 3 niveles
de B y 2 niveles de C resulta:
2x3x2 =12 tratamientos, los gl. para tratamientos es 11
Las fuentes de variacin deducidas son:
De lo efectos principales:
A con (2-1) = 1 gl.
B
(3-1) = 2 gl.
C
(2-1) = 1 gl.
88

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

De los efectos de la interaccin:


AB (2-1) (3-1) = 2 gl.
AC (2-1) (2-1) = 1 gl.
BC (3-1) (2-1) = 2 gl.
De los efectos de Doble interaccin:
ABC (2-1) (3-1) (2-1) = 2 gl.
La suma de grados de libertad son: 1+2+1+2+1+2+2 =11; que son los correspondientes
grados de libertad de tratamientos. Y la
SC(tratamientos) = SC(A) + SC(B) + SC(C) + SC(AB) + SC(AC) + SC(BC) + SC(ABC)
Los cuadrados medios de estas fuentes se obtienen dividiendo la suma de cuadrados
entre los grados de libertad, y para la prueba de F, se divide cada CM con el CM del
error, solo cuando se tiene factores aleatorios o anidados, es necesario hallar los
esperados cuadrados medios.
COMPONENTES DE LOS ESPERADOS CUADRADOS MEDIOS.
Los esperados cuadrados medios de las fuentes de variacin permiten conocer la
relacin de los cuadrados medios para el clculo del valor de F. Los factores pueden
ser fijos o al azar. Si todos son fijos la relacin es con el cuadrado medio del error, caso
contrario se debe seguir lo siguiente:
1.- Construir un cuadro de doble entrada. En la primera columna colocar las fuentes de
variacin, as: A, B, AB, Error; en la primera fila los factores principales A, B y R
para las repeticiones.
2.- Llenar los casilleros del cuadro, por columnas en la forma siguiente:
a.- Si es un factor al AZAR colocar "1, si es FIJO colocar "0" en todos los casilleros de
la columna respectiva en donde se tenga en el margen izquierdo el factor en
mencin. En el casillero de la columna que en el margen izquierdo est el error
colocar "1", en los casilleros restantes colocar el nmero de niveles del factor en
mencin.
b. En la columna R (repeticiones), colocar "1" en el casillero del que en el margen
Izquierdo est el error y en los casilleros restantes el nmero de repeticiones.
3.- Poner una columna adicional, y en cada casillero escribir las variancias
correspondientes a cada fuente de variacin:

4.- Construido el cuadro, proceder a obtener los esperados cuadrados medios, segn:
a.- Para un factor, por ejemplo A, no considerar esta columna, luego multiplique los
valores de los casilleros correspondientes a las filas que tienen en el margen
izquierdo la letra correspondiente al factor.
89

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

b.- Para una interaccin, por ejemplo AB, no considerar las columnas que
corresponden a estos factores (A,B), luego multiplique los valores de los
casilleros correspondiente a las filas que tienen en el margen izquierdo las
letras correspondientes a la interaccin.
c.- Para el error, multiplique los valores que corresponden a la fila del ERROR.
Ejemplo
Considere 3 factores A, B y C que se combinan para formar tratamientos y se aplican
en un DCA con 5 repeticiones.
A: factor al azar con 2 niveles, B: factor fijo con 3 niveles, C: factor fijo con 4
niveles. Aplicando la metodologa, resulta:
A
B
C
AB
AC
BC
ABC
Error

A
1
2
2
1
1
2
1
1

B
3
0
3
0
3
0
0
1

C
4
4
0
4
0
0
0
1

R
5
5
5
5
5
5
5
1

Variancia
A
B
C
AB
AC
BC
ABC
error

y los esperados cuadrados medios:


A:
+ 60 A
B:
+ 20 AB + 40
C:
+ 15 AC + 30 C
AB:
+ 20 AB
AC:
+ 15 AC
BC:
+ 5 ABC + 10
ABC:
+ 5 ABC
Error:
Las frmulas para hallar los valores de F calculados seran:
Para A: Fc = CM(A)/CM (error)
B: Fc = CM (B)/CM (AB)
C: Fc = CM(C)/CM (AC)
AB: Fc = CM (AB)/CM (error)
AC: Fc = CM (AC)/CM (error)
BC: Fc = CM (BC)/CM (ABC)
ABC: Fc = CM (ABC)/CM (error)

F (1,96)
F (2, 2)
F (3, 3)
F (2,96)
F (3,96)
F (6,6)
F (6,96)

90

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

INTERACCION DE FACTORES
La interaccin de los factores juega un papel importante en el anlisis, de ah que las
pruebas de F, se realizan en el siguiente orden: primero la interaccin de orden
superior, luego la de menor orden y por ltimo los factores principales.
Si la interaccin de mayor orden resulta significativa, termina las pruebas del cuadro
del ANAVA y se procede a los anlisis de los efectos simples-simples, esto significa
comparar los niveles de un factor en la combinacin de los otros factores.
Si la interaccin de mayor orden no es significativa, continan las pruebas de F con las
interacciones de menor orden, si alguna de estas interacciones resulta significativa, se
procede a los anlisis de los efectos simples en estos factores; as, comparar los
niveles del factor bajo la presencia de un nivel de otro factor.
Si en una prueba de una interaccin de menor orden no resulta significativa, se
continan las pruebas de F de cada factor por separado, en el cuadro de ANAVA.
Los resultados de cuadros de ANAVA para 3 factores (ABC) resultan:
Ejemplo.- ABC: *
Termina el ANAVA, continan los anlisis de los efectos simples simples, es decir
comparar los niveles del factor A en cada una de las combinaciones de los otros
factores, B y C de igual forma.
Ejemplo.- ABC: n.s.
Continan el anlisis del ANAVA.
AB: n.s.
AC: n.s.
BC: n.s.
Continan el anlisis del cuadro de ANAVA, para los efectos principales de A, B y C.
Ejemplo.- ABC: ns
Contina el anlisis del ANAVA.
AB: *
AC: n.s.
BC: n.s.
Se prueban los efectos simples en cada factor (A y B), es decir comparar los niveles de
A bajo la presencia de cada nivel de B y comparar los niveles de B bajo la presencia de
cada nivel de A.
Luego continuar con el anlisis en cuadro de ANAVA slo para los efectos principales
de C.
Ejemplo.- ABC: n.s.
91

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Contina el anlisis del ANAVA.


AB:*
AC: *
BC: n.s.
Se prueban los efectos simples en cada factor (A y B), en los factores (A y C) se
compararan los niveles de A bajo la presencia de cada uno de los niveles de C y en C
se comparan sus niveles bajo la presencia de cada uno de los niveles de A.
Ejemplo.- ABC: n.s.
Contina el anlisis del ANAVA.
AB:*
AC: *
BC: *
Se prueban los efectos simples en cada factor (A y B), en (A y C) y en (B y C).
El anlisis de los efectos simples-simples y efectos simples pueden realizarse
mediante la prueba de F (las sumas de cuadrados) una prueba comparativa de
promedios (DLS, TUKEY).
Slo para los casos de factores fijos es vlido el anlisis de efectos simples-simples,
Ejemplo 6. A es fijo y B al azar, AB resulta (*), no procede los anlisis de efectos
simples.
Ejemplo 7. A es fijo y B es fijo, AB resulta (*), procede los anlisis de efectos simples.
GRAFICO DE LA INTERACCION
La interaccin de factores se representa grficamente, la tendencia indica el grado de
interaccin entre los factores, la cual aumenta a medida que las lneas tiendan a
cruzarse.
En los siguientes grficos se muestran los casos posibles de interaccin en dos
factores: A con 3 niveles y B con 2 niveles. En el eje X se registra los niveles de A y en el
eje Y los promedios de la interaccin de A y B. Los puntos son unidos con una lnea,
para cada nivel de B.
EFECTOS SIMPLES
El anlisis de los efectos simples se realiza cuando existe una interaccin de dos
factores por ejemplo A y B. Los efectos simples se calculan a partir del cuadro de
promedios de la combinacin de factores.
Ejemplo:
A con niveles (
repeticiones.

) B con niveles (

). Aplicados en un DCA con 5

92

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Los efectos simples son: A (B) y B(A).


A (B): A ( ). A ( )
B (A): B ( ), B ( ), B (

Bloques
10

30

20

15

10

40

10

30

20

60

15

10

40

65

25

40

60

125

4,33

2,5

4,15

Cuadro de totales

Cuadro de promedio

93

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Efectos simples se obtiene como la diferencia de los promedios, segn el caso:


A ( ): 2 -6 = -4, 4 -2 = 2, 6 -4 = 2; -4, 2, 2
A ( ): 3 - 2 = 1, 8 -3 = 5, 2 -8 = -6; 1, 5, -6
B ( ): 2 -3 = -1
B ( ): 6-2=4
B ( ): 8 - 4=4
Con esta informacin se puede encontrar las sumas de cuadrados de estos efectos,
usando la siguiente frmula:
SC (efecto simple) = n [
Por ejemplo:
] =5[
SC [
] =5 [
SC [
] =5[
] /2 =2.5
SC [
] = 5(42)/2= 40
SC [
] = 5 (42)/2= 40
SC [

]
] /3 = 40
] /3 = 103.33

A los grados de libertad de cada efecto simple le corresponde los grados de libertad
del factor correspondiente, as:
gl A( ) = 3-1=2
gl A(b2) = 3-1=2
gl B( ) = 2-1 =1
La prueba estadstica se realiza mediante la prueba de F, los grados de libertad del
efecto en estudio para el numerador y los grados de libertad del error para el
denominador.
El valor de F calculado:
Fc = CM (del efecto) / CM (error)
] /CM (error).
As para A (b2): Fc = CM [
Si el valor de Fc es superior o igual al valor crtico (F), entonces se afirma
estadsticamente que hay diferencia en los niveles del factor A bajo la presencia del
nivel
. Si esto ocurre, puede realizar una prueba de t o Duncan, con los promedios;
as por ejemplo mediante t-student:
Para la comparacin en A (b2), requiere la siguiente informacin:
Promedios :
=3
=3
=3

94

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

En tablas , gl error
DLS (t-student) = t.Sd
Notar que en la desviacin estndar de la diferencia se considera el valor de "r", es el
nmero de datos que genera un promedio en estos efectos simples.
FACTORIAL 2A2B =
Es el factorial ms elemental en experimentacin, formado por la combinacin de 2 factores a
2 niveles cada uno. Puede aplicarse a cualquier diseo experimental.
EJEMPLO:
Factorial 2A2B en Bloques Completos al Azar
Considere los factores CONTROL DE MALEZAS y FERTILIZANTE.
El factor (A) malezas con niveles:
= sin control de malezas
= con control de malezas
El factor (B) fertilizante con niveles:
= sin aplicacin de fertilizante
= con aplicacin de una dosis de fertilizante
Los tratamientos son:
= sin control de malezas ni fertilizante. Constituye el tratamiento testigo.
= Se aplica dosis de fertilizante.
= Se aplica control de maleza.
= Se aplica control de maleza y fertilizante.
Suponga que estos tratamientos se aplican en un diseo Bloques completos al azar en 5
bloques, entonces el modelo aditivo lineal es el siguiente:
Yijk = + Bk + + j + (

)ij + iyk

=1,2
j=1.2
k=1,2,...,5

= constante: parmetro
Bk = efecto del bloque k: parmetro
= efecto del nivel a : parmetro
j= efecto del nivel bj: parmetro
(
) j = efecto de la interaccin : parmetro
iyk = efecto del error. Valor aleatorio normal e independientemente distribuido con media 0 y
variancia
95

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Con los datos:


No. de bloques = r = 5
Niveles de A = a = 2
Niveles de B = b = 2
Las sumas de cuadrados quedan simplificadas en:
Trmino de correccin =

.../ (abr) =

.../20

SC (A) =

../ (br) -TC = =

.../10 - TC

SC (B) =

.J. /(ar) -TC = =

/10 - TC

SC (AB) = (

ij. /r - TC) - SC (A) - SC (B)

SC (AB) = (

ij. /5 - TC) - SC (A) - SC (B)

La suma de cuadrados de tratamientos, llamada tambin suma de cuadrados del combinado


AB, resulta:
SC (tratamlento) =

/r - TC

Como SC (tratamlento) = SC(A) + SC (B) + SC (AB), entonces


SC (AB) = SC (tratamiento) -SC(A) - SC (B)
SC (AB) = SC (combinado AB) -SC (A) - SC (B)
SC (bloques) =
...k / (ab) - TC =
...k /4 - TC
K
k
SC (Total) =
ijk -TC
ijk
SC (Error) = SC (total) - SC (bloques) - SC (Tratamiento)
Los grados de libertad se encuentran segn el diseo empleado. La fuente de variacin debido
a tratamientos se descompone en fuentes de variacin debido a los efectos de A, B y AB. Los
grados de libertad de tratamientos se descomponen en grados de libertad de A, B y AB.
Trat. = ab 1 = 4 1 = 3
A
= a 1 = 2 1= 1
B

Para el ejemplo, si la suma de cuadrados de bloques es de 1024.16, la suma de cuadrados del


total de 2358.67, y los totales de cada tratamiento:
= 45

= 110

= 96

= 140

96

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Entonces:

944,15

SC (Trata.)

SC (error) = SC (total) - SC (bloques) - SC (tratamientos)


SC (error) = 390.36
SC (A)

594,05

SC (B)

328, 05

SC(AB) = 944.15 - 594.05 -328.05 = 22.05


Otro mtodo para determinar la suma de cuadrados, es mediante CONTRASTES
ORTOGONALES.
DESCOMPOSICION ORTOGONAL
La suma de cuadrados de tratamientos se descompone en la SC(A) + SC (B) + SC (AB). Mediante
Contrastes ortogonales se determinan las sumas de cuadrados, as:
Tratamientos
Fuente
A
B
AB

EFECTO
109
81
21
45

96

110

DIVISOR
20
20
20

SC
594,05
328,05
22,05

140

Los signos se colocan segn el nivel; nivel (1) signo (-), nivel (2) signo (+) para los efectos
principales. La fila de la interaccin se obtiene multiplicando los signos de dichos factores: (-)
(-) = (+)y (-)(+) = (-)
Los totales de tratamientos se colocan en la ltima fila.
El valor del efecto, se obtiene sumando los totales de los tratamientos con los signos
correspondientes a la fila de la fuente de variacin.
Efecto en A = -45 - 96 + 110 + 140 = 109
Efecto en B = - 45 + 96 - 110 + 140 = 81
Efecto AB = +45-96- 110+ 140 = -21

El valor del divisor corresponde al producto de los bloques por la suma de cuadrados
de los coeficientes del contraste. As para el efecto de A, se tiene:
r

5[

] = 20

97

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Se procede de igual forma para las otras fuentes de variacin.

Finalmente las suma de cuadrados se halla por el cociente

El resultado del ejercicio se muestra en el siguiente cuadro del Anlisis de la variancia.


A N A V A
FUENTES
BLOQUES
TRTAMIENTOS
A
B
AB
ERROR

GL
4
3
1
1
1
12

SC
1024,16
944,15
594,05
328,05
22,05
390,36

CM
256,04
594,05
328,05
22,05
32,53

Fc
7,87
18,26
10,08
0,68 n.s.

Fc
3,16
9,33

CONCLUSIONES
Hay diferencia altamente significativa en el rendimiento de las parcelas a las que se aplicaron
control de maleza frente a las que no se aplicaron. Las parcelas que recibieron fertilizante
presentan diferencias altamente significativas de las parcelas que no recibieron fertilizante
alguno. La formacin de Bloques permiti disminuir el error experimental, pues el efecto es
significativo.
El coeficiente de variacin es de 29.17%, aceptable dentro de los rangos establecidos para
experimentos de campo.
Las pruebas de comparacin de promedios no son necesarias en este caso, porque cada factor
cuenta solamente con 2 niveles. Segn el rendimiento promedio de los niveles, se puede
afirmar que la fertilizacin y el control de maleza aumentaron el rendimiento.
Para dar conclusiones ms detalladas sobre las combinaciones se deben realizar pruebas sobre
grupos de tratamientos seleccionados o pruebas de promedios de tratamientos.
Dado que Los factoriales forman tratamientos, estos pueden ser sometidos a cualquier prueba
comparativa, segn el inters del investigador, as por ejemplo plantear contrastes.

Ejercicio.
Realizar la prueba de comparacin de tratamientos mediante contrastes ortogonales y
la prueba de Duncan para los promedios, si los tratamientos son:
= tratamiento testigo.
= Se aplica dosis de fertilizante.
= Se aplica control de maleza.
Se aplica control de maleza y fertilizante.

98

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Los promedios son: 9, 19.2, 22, 28 respectivamente.


Nmero de bloques = 5
CM (error) = 32.53
Contrastes
:
:
:

vs dems tratamientos.
.

Ejemplo.

Para explicar estos factores consideremos un experimento factorial de pq =


que es el ms pequeo de los experimentos factoriales dona tiene dos
niveles y el factor B tambin tiene dos niveles.

Supongamos que el diseo usado sea el completamente randomizado y los resultados


se dan a continuacin

10

Resultados ordenados de un experimento pq =


BLOQUE
I
II
III
IV
AB
A
B

A1
B1
1
2
3
2
8

A2
B2
2
4
6
4
16

A1 = 24
B1 = 20

TOTAL

B1
1
3
4
4
12

B2
4
7
7
10
28
A2 = 40
B2 = 44

8
16
20
20
64
64
64

TC =
Sc total =
SC de A =

90
= 16

99

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

SC de B =

256 =36

SC de combinado AB =

56

SC de la interaccin AB = 56 16 36 = 4
SC de block =

256 =24

SC del error = SC total SC de A SC de B SC de AB SC de Block


= 90 16 36 4 24
= 10
A N A V A
Fuentes de
variabilidad
Block
A
B
AB
Error
Total

SC

GL

CM

24
16
36
4
10
90

3
1
1
1
9
15

8
16
36
4
1,11

7,21
14,41
32,43
3,60

SIG

N.S.

Se puede deducir las siguientes conclusiones, relacionadas con los efectos principales
de A y B; tales como: que la variedad Y supera a la variedad X en rendimiento, y que
con el abonamiento nitrogenado aumenta se aumenta la produccin. Por otra parte,
por los resultados obtenidos, no se justifica estudiar los efectos simples A ni de B
Ejemplo
Se tiene el siguiente experimento en el que se estudia tres variedades de soya y la
cantidad de plantas por golpe
Variedades

Cantidad de plantas
= 2 plantas cada 20 cm. en surcos de 80 cm. de ancho
plantas cada 20 cm. en surcos de 80 cm. de ancho
= 4 plantas cada 20 cm. en surcos de 80 cm. de ancho
Se instal en 5 repeticiones o block y el diseo experimental usado fue block
completamente randomizado. Los datos ordenados son:
100

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

BLOQUE
I
II
II
IV
V
VC
V
C

C1
9
10
11
11
14
55

V1
C2
10
13
15
16
15
69
V1 = 182
C1 = 157

C3
10
12
12
13
11
58

C1
10
9
12
12
15
58

V2
C2
12
10
9
16
13
60
V2 = 182
C2 = 195

C3
13
11
9
17
14
64

C1
6
7
9
12
10
44

V3
C2
10
12
14
16
14
66
V3 = 184
C3 = 196

TOTAL
C3
9
13
16
19
17
74

89
97
107
132
123
548
548
548

TC =
SC de block =
SC de V =

6673,42 = 0,18

SC de C =
SC de VC =

122.18

SC de VC = 122.18 65,91 0,18 = 56,09


SC total =

356,58

SC del error =356,58 141,24 0,18 65,91 56,09 = 93,16


A N A V A
Fuentes de
variacin
Block
V
C
V
VC
Error
variabilid
Total
ad

SC

GL

CM

141,24
0,18
65,91
56,09
93,16
356,58

4
2
2
4
32
144

35,31
0,09
32,95
14,02
2,91

12,13
0,03
11,32
4,81.

C.V. =

SIG

N.S.

Como es significativa la interaccin VC debe estudiarse los efectos simples del


experimento. As, las SC de los efectos simples de los niveles de C en cada nivel de V
estn dadas por:
SC de C en

101

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

SC de C en

SC de C en
A N A V A
Fuentes de variabilidad
Efectos simples de C
Efecto C en
Efecto C en
Efecto C en
Error

SC

GL

CM

SIG

21,7
3,7
96,5
93,16

2
2
2
32

10,85
1,85
48,25
2,91

3,72
0,63
16,58

N.S.

Podemos observar que entre los niveles de c hay diferencias significativas en la


variedad y diferencias altamente significativas en la variedad
EXPERIMENTO FACTORIAL
A continuacin se dan los datos del rendimiento en tm/ ha de arroz obtenido del
siguiente experimento:
Se tiene dos niveles de abonamiento nitrogenado (A), dos niveles de abonamiento
fosforado (B) y dos de potasio (C), y 5 repeticiones, y el estudio se realiz con el
diseo bloque completamente randomizado.
A0

BLOQUE

I
II
III
IV
V
ABC
AB
BC
AC
A
B
C

A1

B0

B1

C0
C1
5
5
7
10
3
5
3
4
2
1
20
25
A0B0 = 45
B0C0 = 50
A0C0 = 40

C0
C1
4
4
7
9
3
4
4
3
2
0
20
20
A0B1 = 40
B0C1 = 45
A0C1 = 45

A0 = 85
B0 = 95
C0 = 100

B0

B1

C0
C1
C0
C1
6
3
6
9
7
7
9
10
6
5
7
9
5
3
4
8
6
2
4
9
30
20
30
45
A1B0 = 50
A1B1 = 75
B1C0 = 50
B1C1 = 65
A1C0 = 60
A1C1 = 65
A1 = 125
B1 = 115
C1 = 100

TOTAL

42
66
42
34
26
210
210
210
210
210
210
210

TC =
SC total =
SC de block =
102

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

SC de A =
SC de B =
SC de C =
SC de AB =
SC de AB (corregida) = 72,5 40,0
SC de AC =

1102,5 =42,5

SC de AC (corregida) = 42,5 40,0 2,5 =0,0


SC de BC =

1102,5 =22,5

SC de BC (corregida) = 22,5 10,0 2,5 =10,0


SC de ABC =

1102,5 = 107,5

SC de ABC (corregido) =107,5 40,0 10,0 2,5 22,5 0,0 10,0 = 22,5
SC de error = 259,5 40,0 10,0 2,5 22,5 0,0 10,0 22,5 112,0
ANAVA
FUENTES DE VARIACION

SC

GL

CM

FuentesBloques
de variabilidad
Efecto principal A
Efecto principal B
Efecto principal C
Efecto de Int. AB
Efecto de Int. AC
Efecto de Int. BC
Efecto de Int. ABC
Error
total

112,0
SC
40,0
10,0
2,5
22,5
0,0
10,0
22,5
40,0
259,5

4
GL
1
1
1
1
1
1
1
28
39

28,8
CM
40,0
10,0
2,5
22,5
0,0
10,0
22,5
1,4

20.00
F
28,57
7,14
1,79
16,07
0,00
7,14
16,07

Sig

N.S.

ANALISIS DE COVARIANCIA
En el anlisis de covariancia se combinan los conceptos del anlisis de variancia para un diseo
experimental y para la regresin. El anlisis de covariancia es utilizado en casos en los que la
variable respuesta de un diseo experimental est relacionada con una o ms variables
concomitantes (variables externas independientes) y se presentara el anlisis para el Diseo
Completamente al Azar y Bloques Completos al Azar
103

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Dentro de los usos del anlisis de covarianza (ANACOVA)

Control de variables externas que implican una disminucin del error que se traduce
en una mayor precisin del anlisis.
Ajuste de las medias de tratamiento de la variable independiente ( Y ) , por las
diferentes variables independientes (concomitantes)
Ayuda en la interpretacin de los datos, especficamente en la naturaleza del efecto de
los tratamientos

Algunos ejemplos de aplicacin:

El peso inicial (X) de animales se relaciona al peso final (Y), cuando estos animales
estn sujetos a diferentes raciones. Se estudia el efecto de las raciones a travs de los
pesos observados.
El nmero de plantes (X) por parcela. Se estudia el rendimiento total (Y) de la parcela.
El rendimiento (X) de las parcelas en una produccin anterior y el rendimiento (Y) de
las mismas parcelas al finalizar el experimento. El estudio consiste en comparar
variedades de un determinado cultivo
La incidencia de plagas (X) en el rendimiento de algunas variedades, el estudio es
comparar las variedades

En cada caso se entiende que la variable X tiene un efecto en la variable Y, sin embargo esta
dependencia deber ser probada estadsticamente mediante el ANLISIS DE REGRESION.
En algunos casos puede existir ms de una variable externa o multivariables, ejemplo
.Este caso puede resolverse matricialmente y con ayuda del computador porque los
procesos manuales son tediosos

Finalidad del anlisis de covarianza


La finalidad ms importante del anlisis de covarianza es:

Disminuir el error experimental, con el consiguiente aumento en la precisin del


experimento
Ajustar los promedios de los tratamientos, por la diferencia entre los promedios de las
variables independientes
Hacer una mejor interpretacin de los resultados de los experimentos especialmente
en cuanto se relaciona con la naturaleza de los efectos de los tratamientos.

Suposiciones en el anlisis de covarianza


Cuando se utiliza el anlisis de covarianza es necesario asumir ciertos requisitos que le den
validez al anlisis. Estas suposiciones son:

La variable X es fija, medida sin error y no es afectada por los tratamientos


Tanto la variable X como la variable Y deben tener varianzas homogneas en los
tratamientos
La variable X e Y deben tener distribucin normal
104

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

La regresin de X sobre Y, debe ser lineal


Los errores e distribuyen independientemente y normal con cero de promedio y con
varianza

Ejemplo:
Se utiliz un experimento para determinar si tres tipos de dietas producen el mismo peso en
gallinas (en cientos de gramos). Por ello se registr el peso inicial (en cientos de gramos) de las
gallinas antes del experimento. Los datos obtenidos fueron
A

Total
n

3
4
7
14

12
14
16
42

8
9
8
25

20.2
21,3
18,9
60,4

10
10
11
31

19,0
19,2
20,0
58,2

Gran total
70
160,6
9

Anlisis de covariancia
I.- Calcular los trminos de correccin
TC X

= 544.44

TC Y

= 2865,82

TC XY

1249,11

II.- Calcular la suma de cuadrados

Para el total
SC xx

544,44

SC yy =

2865,82

604 544,44= 59,56


2944,58 2865,82= 78,76

SP xy = (3 x 12)+ (4 X 14) +.+ (11 X 20) 1249,11 = 1310,5 1249,11 = 61,39

Para tratamiento
Txx =

- TC =

Tyy =

- TC =

Txy =

TC =

544,44 = 49,56
2865,82 = 67,31
1249,11 =51,62

105

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

Para el error (por diferencia)


Exx = SCxx Txx = 59,56 49,56 = 10
Eyy = SC yy Tyy = 78,76 67,32 = 11,44
E xy = SCxy Txy =61,39 51,62 = 9,77

III. Calcular la suma de cuadrados ajustados

= Eyy -

= 11,44 -

= 1,89
=15,49

= 78,76 -

CUADRO DE ANCOVA

Fuentes de
variacin
Tratamientos

GL

t-1

Txx

Txy

Tyy

Error

rt

Exx

Exy

Eyy

Eyy -

Trat + Error

r-1

SCxx

SCxy

SCyy

SCyy -

r.- 2

Diferencia

t-1

Tratamiento

GL

CM

r. - t- 1

CM residual

Diferencia/(t 1)

ajustado

SC
Ajustad.

SC y SP
Fuentes
variacin

de

GL

ajustad

ajustad

0,3789

6,79

49,56

51,62

67,32

Error

10,00

9,77

11,44

1,89

Tratam + Error

59,56

61,39

78,76

15,49

Diferencia

prueba

de

CM

Tratamientos

para

Gl

13,589

medias ajustadas de tratamiento

Pruebe si el peso inicial influye sobre el peso final


Usar = 0,05
Ho:
0 (el peso final de las gallinas no depende linealmente del peso inicial)
Ha:

0 (el peso final de las gallinas depende linealmente del peso inicial de las

gallinas)
106

Fc

Apuntes de clase METODOS ESTADISTICOS CICLO2014 II

= 25,19

E n las tablas se busca de la siguiente manera F (t 1, r. t 1)


Buscamos el valor de F en las tablas F(1,5 y 0,05) = 10,13

Conclusin.
Con un nivel de significacin del 5% se obtiene que Fc Ft, se rechaza la Ho, es decir podemos
afirmar que existe suficiente evidencia estadstica para afirmar que el peso inicial de las
gallinas depende linealmente de su peso final

Bibliografa:
-

Cochan W. (2008) Diseos experimentales. Segunda edicin. Mxico

Montgomey. C. (2003) Diseos y Anlisis de experimentos. Segunda edicin. Editorial


Wackerly.

Alvarado Pintado Luis y Agurto Meja Hugo. (2009) Estadstica para Administradores y
Economa con aplicaciones en Excel. Editorial San Marcos E.I.R.L. Per

Di Rienza Julio Alejandro, Casanoves Fernando, Gonzales Laura Alicia, Tablada Elena
Margot, Diza Mara del Pilar, Robledo Carlos Walter, Balzarini Mnica Graciela (2008)
Estadstica para las ciencias agropecuarias. Sptima edicin. Argentina

Toma Inafuko Jorge (2014) Estadstica aplicada segunda parte. Segunda edicin.
Universidad del Pacifico. Lima

Martnez Bencardino Ciro (2013) Estadstica y Muestreo. Dcima tercera edicin.


Bogot

107

Das könnte Ihnen auch gefallen