Sie sind auf Seite 1von 14

DISEO EXPERIMENTAL

Taller N1
Angie Carolina Muriel
Esteban Duque Mesa
Jaidy Moreno
Yulian Mnera
Carolina Rodrguez Pelayo

1. Muestre que a partir de la siguiente expresin:


El coeficiente de determinacin (

) se puede escribir como:


Demostracin:


Entonces:



CASO DE ESTUDIO 1
Rojas y otros (1990) investigaron la capacidad de absorcin de metales pesados,
entre ellos el cadmio, por la Pistia stratiotis L. Las plantas se sembraron en
estanques con agua contaminada. Parte del experimento consisti en medir el
cadmio absorbido por las plantas (en g Cd/g planta seca) en las primeras 96
horas luego de haber contaminado el agua con 3.0 ppm de cadmio. En cada
tiempo se hicieron cuatro repeticiones y los resultados fueron:


Tiempo (h) 0 24 48 72 96

28,3 195,6 340,0 286,7 514,6

27,6 217,2 300,0 289,9 518,0

33,4 274,3 430,9 431,8 664,7

21,4 269,2 425,5 568,8 650,8

1. ECUACION AJUSTADA DEL MODELO LINEAL





-2 -1 0 1 2
-
1
5
0
-
1
0
0
-
5
0
0
5
0
1
0
0
Normal Q-Q Plot
Theoretical Quantiles
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s
INTERPRETACION: El valor de del parmetro

es diferente de cero indica


que existe una relacin lineal entre el tiempo de exposicin de la planta al
agua contaminada y la absorcin de cadmio. Adems segn el modelo puede
decirse que hay un aumento de 5.308 ppm de cadmio por cada hora que la
planta permanezca expuesta al agua contaminada.

2. VALIDACION DEL SUPUESTO DE LINEALIDAD

Prueba de hiptesis:


Nivel de significancia: = 0,05
Estadstico de prueba: F
cal
= 90,567
Regin de rechazo: Rechazo H
0
si F
cal
> F
; 1; n-2

Dnde: F
0,05; 1; 18
= 4,413873
INTERPRETACION: Hay suficiente informacin para rechazar la hiptesis
nula; se define entonces con un nivel de confianza del 95% que el valor de la
pendiente es diferente de cero lo que indica una relacin lineal entre el tiempo
de exposicin y la cantidad de cadmio absorbido por la planta.

3. ANALISIS DE AJUSTE DE MODELO

72.5;

4516.9;

12521.8;

54333.6

20110.5;


De la tabla ANOVA antes mostrada SCEP= 91555.3




De los datos anteriores se realiza la tabla ANOVA ampliada

FUENTE DE
VARIACION
SC Gl CM F
Regresin 649154 1 649154 90.567
Error 129018 18 7168
Total 778172 19 -
Error puro 91555.3 15 6103.7 2.04
Falta de ajuste 37462.7 3 12487.6

Prueba de Hiptesis:


Nivel de significancia: = 0,05
Estadstico de prueba: F
cal
= 2.04
Regin de rechazo: Rechazo H
0
si F
cal
> F
; m-2; n-m

Dnde: F
0,05; 3; 15
= 3.287382
INTERPRETACION: No hay suficiente informacin para rechazar la hiptesis
nula, por lo cual se puede decir que el modelo lineal de absorcin de cadmio
por la planta a travs del tiempo con el 95% de confianza no presenta falta de
ajuste. El modelo propuesto es bueno para la adaptacin de los datos
obtenidos.

4. COEFICIENTE DE DETERMINACIN




Del resumen del modelo


INTERPRETACION: Este valor tan alto obtenido nos dice que el ajuste del
modelo es bueno. De este valor del coeficiente de determinacin se puede
concluir que el 83.42% de la absorcin de cadmio por la planta se debe al
cambio en el tiempo y no a otros factores aleatorios.

5. COMPROBACIN DE LA SIGNIFICANCIA ESTADSTICA
Para la comprobacin se evalan los tres supuestos de la regresin
DISTRIBUCION DE LOS RESIDUALES


Prueba de hiptesis:


Nivel de significancia: = 0,05
Regin de rechazo: Rechazo H
0
si P-value <
Dnde: P-value = 0.1648 > 0.05
INTERPRETACION: No se rechaza

lo que indica una distribucin normal


de los errores y ms profundamente dice que los errores no siguen un patrn
100 200 300 400 500
-
1
5
0
-
1
0
0
-
5
0
0
5
0
1
0
0
valores.ajustados
r
e
s
i
d
u
a
l
e
s
especfico ni aumentan o disminuyen conforme lo hacen el tiempo y la
concentracin de cadmio.

VARIANZA DE LOS RESIDUALES ES CONSTANTE



Nivel de significancia: = 0,05
Regin de rechazo: Rechazo H
0
si P-value <
Dnde: P-value = 0.002732 < 0.05
INTERPRETACION: Hay suficiente informacin para rechazar la

, por lo
tanto, la varianza de los errores no es constante, esto no nos dice que se debe
abandonar el modelo pues lo que explica el valor no constante de la varianza
de los residuales es la cantidad reducida de datos por cada valor de X. es
5 10 15 20
-
1
5
0
-
1
0
0
-
5
0
0
5
0
1
0
0
tiempo
r
e
s
i
d
u
a
l
e
s
decir, como no se presentan varios valores de Y para cada valor de la variable
X, el anlisis de la homogeneidad de las varianzas no se puede realizar; no
hay ms de una varianza.

INDEPENDENCIA DE LOS ERRORES


Prueba de hiptesis:


Nivel de significancia: = 0,05
Regin de rechazo: Rechazo H
0
si P-value <
Dnde: P-value = 0.1781 > 0.05
INTERPRETACION: No se rechaza

, no hay suficiente informacin para


rechazar la hiptesis nula, por lo tanto se puede decir que los residuales tienen
independencia y que la muestra tomada es aleatoria.

CASO DE ESTUDIO 2
Giraldo y Vargas (1991) investigaron la morfometra de J. lamprotaenia (sardina
azulita) en las Islas del Rosario, departamento de Bolvar, Colombia. Entre otras
caractersticas, midieron la longitud estndar de sardinas hembras en tres
estaciones de muestreo: fondo arenoso, manglar y pasto marino. Los siguientes
datos (en cm) representan parte de los datos obtenidos por las investigadoras.

Fondo
Arenoso 4,09 4,14 3,85 4,04 3,21 4,27 3,81 4,02 3,08 4,72 4,03 4,07 3,83

Manglar 3,8 3,96 4,05 3,47 3,89 3,46 3,94 3,58 4,03 3,68 3,76 3,91 3,32 4,21 3,86 4,02
Fondo Marino 3,78 4,19 4,27 3,65 3,99 3,61 3,55 3,41 3,82 4,11 3,6 3,9 3,99 3,94 3,35



1. OBJETIVO DEL ESTUDIO
Determinar si la estacin de muestreo: fondo arenoso, manglar y marino,
(pueden dar razn de disponibilidad de alimento) tiene algn efecto sobre
la longitud (cm) de las sardinas hembra de la especie J. lamprotaenia.

2. METODOLOGIA ESTADISTICA

Unidad experimental: Sardina hembra de la especie J. lamprotaenia
Variable respuesta: Longitud de cuerpo (cm)
Factor: estacin de muestreo
Niveles: arenoso, manglar, marino.
Tratamientos: arenoso, manglar, marino.
El tipo de modelo de diseo que solucionara el problema de manera
estadstica es un diseo completamente aleatorizado de efectos fijos
desbalanceado porque el experimentador est seleccionando los niveles a
los cuales desea estudiar el efecto que se produce en la longitud corporal
de los objetos de estudio y el nmero de muestras tomadas para cada
tratamiento es diferente.
Una forma posible para aleatorizar el experimento es que se haga un
recorrido en el tramo de estudio en el cual cada 10 m se haga colecta de 5
individuos por estacin de muestreo y se pongan el total de los individuos
para cada una de las 3 en bolsas de las cuales posteriormente se tomaran
al azar la cantidad de individuos que se desea estudiar por estacin.

Modelo estadstico
Se emplea un modelo de efectos fijos, puesto que los niveles del factor han
sido seleccionados por las investigadoras, de modo que los efectos fijados
son los niveles del factor: fondo arenoso, manglar y pasto marino.


Dnde:

= Es la longitud (cm) de las hembras de la especie J. lamprotaenia,


medida en el i-simo tratamiento en la j-sima replica.
= media general

= Efecto debido al i-simo tratamiento sobre la longitud (cm) de J.


lamprotaenia

= Error aleatorio debido a los factores controlados y no controlados



CMO SE ALEATORIZA EL EXPERIMENTO?
La aleatorizacin del experimento se puede llevar a cabo depositando las
sardinas J. lamprotaenia que se hallaban en un estado temprano de su
ciclo de vida (alevinos), en cada uno de los hbitats: fondo arenoso,
manglar y pasto marino; despus se toman aleatoriamente y se evala el
crecimiento en longitud estndar para dichos hbitats.

HIPOTESIS A PROBAR


Las medias de los tratamientos no son diferentes, por lo tanto los
tratamientos de fondo arenoso, manglar y marino no tienen un efecto
diferente sobre la longitud de los especmenes


Al menos dos medias son diferentes, es decir, al menos uno de los
tratamientos tiene un efecto diferente sobre la longitud de las sardinas.
3. CLCULOS
TABLA ANOVA



Regin de rechazo: Rechazo si F > F; a-1; N-a
Dnde:


INTERPRETACION: No se rechaza H
0
. Las estaciones de muestreo de
fondo arenoso, manglar y pasto marino no presentan ningn efecto directo
en la longitud (cm) de los especmenes hembras de la especie J.
lamprotaenia.

VALIDACIN DE LOS SUPUESTOS DEL ERROR
DISTRIBUCION NORMAL DE LOS ERRORES


Nivel de significancia:
Regin de rechazo: Rechazo

si
Dnde:
INTERPRETACION: No se rechaza

, no hay suficiente informacin para


rechazar la hiptesis nula por lo tanto, la distribucin de los residuales es
normal.

VARIANZA DE LOS ERRORES CONSTANTE


Nivel de significancia:
Regin de rechazo: Rechazo

si
Dnde:
INTERPRETACION: No se rechaza

, no hay suficiente informacin para


rechazar la hiptesis nula por lo tanto, la varianza de los errores es
3.82 3.84 3.86 3.88 3.90 3.92 3.94
-
0
.
5
0
.
0
0
.
5
valores.ajustados
r
e
s
i
d
u
a
l
e
s
constante.

INDEPENDENCIA DE LOS ERRORES


Nivel de significancia:
Regin de rechazo: Rechazo

si
Dnde:
INTERPRETACION: Se rechaza

, hay suficiente informacin para


rechazar la hiptesis nula, por lo tanto se puede decir que los residuales no
0 10 20 30 40
-
0
.
5
0
.
0
0
.
5
TRATAMIENTO
r
e
s
i
d
u
a
l
e
s
tienen independencia y que la muestra tomada no es aleatoria o que el
modo de aleatorizacin no fue el adecuado.

CONTROL LOCAL DEL EXPERIMENTO


Donde se realiz una relacin de y se obtuvo
Es decir, la suma de cuadrados del error es veces ms grande
que la suma de cuadrados del tratamiento; lo que indica que el control local
ejercido en este experimento no fue suficiente o adecuado, o que los
factores externos fueron tan fuertes que no permitieron una medicin o
dems procesos posibles y necesarios para la obtencin de datos
confiables.
4) No es necesario realizar prueba post anova, ya que las estaciones de
muestreo en el fondo arenoso, manglar y pasto marino no presentan
ningn efecto directo en la longitud (cm) de los especmenes hembras de la
especie J. lamprotaenia segn lo muestra la prueba de hiptesis (las
medias no presentan diferencias). La post anova solo se realiza cuando
existen diferencias, buscando patrones o relaciones, entre los grupos de
las poblaciones muestreadas, donde se puede encontrar falsos positivos;
ella permite obtener mayor certeza sobre los resultados de un experimento.
5) La media general en el muestro (media de todas las unidades
experimentales) es 3.84. Este resultado no tiene sentido en la prctica, ya
que no existen diferencias entre las medias de las estaciones de muestreo.