Beruflich Dokumente
Kultur Dokumente
Facultad de Agronoma
W1
FRANILIN CHACIN
CONTENIDO
Franklin. Chacn
Captulo 1
DEFINICION, OBJETIVOS
Y FUNDAMENTOS DE LA METODOLOGIA
DE SUPERFICIES DE RESPUESTA
INTRODUCCION
Rojas (1971) al presentar el San Cristbal Ortogonalizado c.- Los dos diseos son igualmente eficientes en la estimacin de los
expresa que el diseo San Cristbal no ortogonal hace ms dificil el coeficientes de regresin que corresponden a las interacciones.
anlisis, pero no altera la validez de las conclusiones.
Villasmil (1978a), hace una descripcin general de los diseos de
Martnez (1971), describe mtodos para determinar dosis tratamiento compuesto central y diseo compuesto no central, la
econmicamente ptimas cuando se obtienen funciones de produccin ortogonalizacin del diseo compuesto central de donde se obtiene el
anmalas. El mtodo consiste en estimar las producciones para diseo compuesto central ortogonal. En el trabajo tambin aparecen
diferentes combinaciones de los elementos dentro de la regin de las varianzas y covarianzas de los estimadores en el diseo compuesto
exploracin y conseguir los beneficios netos que se generan, central ortogonal y la comparacin de este con el diseo factorial
seleccionando los que provocan los mayores beneficios econmicos. completo y con el diseo San Cristbal ortogonalizado basado en el
criterio de la eficiencia relativa. De acuerdo con la comparacin con el
Villasmil, Martnez y Segura (1972), presentan un trabajo sobre
factorial 33 expresa que el diseo compuesto central ortogonal es
el diseo San Cristbal y su utilizacin en ensayos de fertilizacin en
recomendable para estimar un modelo polinmico de segundo orden.
caa de azcar, realizan descripcin del diseo, anlisis econmicos.y
funciones de produccin anmalas que se obtuvieron. Chacn (1980), presenta la descripcin terica de los diseos
rotables y la aplicacin y anlisis estadstico para el diseo no
Cochran y Cox (1980), presentan una descripcin de algunos
replicado y replicado, con una proposicin sobre la divisin de los
diseos utilizados en el estudio de "superficies de respuesta";
errores.
aparecen ejemplos de anlisis estadsticos de diseos rotables de
segundo orden para dos y tres variables. Ruiz (1981), presenta la construccin, propiedades y
comparaciones del Diseo Compuesto Central Doble Estrella.
En Latinoamrica y especficamente en Venezuela a partir de
1970 se han realizado algunas investigaciones importantes, de las Chacn y Villasmil (1983), presentan comparaciones tericas y
cuales referiremos las siguientes: Montano (1972), presenta una prcticas de varios diseos d Superficies de Respuesta.
discusin general de un ejemplo del diseo rotable central compuesto
en experimentos con fertilizantes en algodn. Se describen las carac- Chacn (1988), presenta algunas proposiciones sobre al anlisis
tersticas y la determinacin de dosis .ptimas de fertilizantes, se so- de los diseos de Superficies de Respuesta, para mediciones repetidas.
meten al proceso 14 experimentos dando algunos respuesta y otros no. Machado y Chacn (1992), realizan comparaciones de varios
diseos de Superficies de Respuesta, incluyendo un nuevo diseo al
Villasmil (1978b), hace una descripcin del diseo San Cristbal
doble estrella con adicin de un nuevo ncleo estrella propuesto por
Ortogonalizado, mencionando algunos planes experimentales con este
Villasmil (1986).
diseo para diferentes nmeros de variables. Tambin realiza la
comparacin del diseo con el factorial completo mediante el criterio
de la eficiencia relativa. Las conclusiones a las que llega son las
siguientes: FUNDAMENTOS DE LA METO DO LOGIA
a.- El diseo San Cristbal Ortogonalizado ( k = 3, a = 1, e = 2
DE SUPERFICIES DE RESPUESTA
m = 1 ), es ms eficiente que el factorial 33 en la estimacin de los
coeficientes de regresin correspondientes a los efectos lineales. Supongamos que el investigador est interesado en examinar
b.- El diseo San Cristbal Ortogonalizado ( k = 3, a = 1, e = 2, una respuesta "11", la cual depende de las variables controladas o
m = 1 ), es ms eficiente que el factorial 33 en la estimacin de los regresoras, SPS2'''''Sp bajo el control del experimentador y con un
coeficientes de regresin correspondientes a los trminos mnimo error se denota:
cuadrticos.
Chacn I Anlisis de Regresin y Superficies de Respuesta Chacin I Anlisis de Regresin y Superficies de Respuesta
6 7
Rojas (1971) al presentar el San Cristbal Ortogonalizado c.- Los dos diseos son igualmente eficientes en la estimacin de los
expresa que el diseo San Cristbal no ortogonal hace ms dificil el coeficientes de regresin que corresponden a las interacciones.
anlisis, pero no altera la validez de las conclusiones.
Villasmil (1978a), hace una descripcin general de los diseos de
Martnez (1971), describe mtodos para determinar dosis tratamiento compuesto central y diseo compuesto no central, la
econmicamente ptimas cuando se obtienen funciones de produccin ortogonalizacin del diseo compuesto central de donde se obtiene el
anmalas. El mtodo consiste en estimar las producciones para diseo compuesto central ortogonal. En el trabajo tambin aparecen
diferentes combinaciones de los elementos dentro de la regin de las varianzas y covarianzas de los estimadores en el diseo compuesto
exploracin y conseguir los beneficios netos que se generan, central ortogonal y la comparacin de este con el diseo factorial
seleccionando los que provocan los mayores beneficios econmicos. completo y con el diseo San Cristbal ortogonalizado basado en el
criterio de la eficiencia relativa. De acuerdo con la comparacin con el
Villasmil, Martnez y Segura (1972), presentan un trabajo sobre
factorial 33 expresa que el diseo compuesto central ortogonal es
el diseo San Cristbal y su utilizacin en ensayos de fertilizacin en
recomendable para estimar un modelo polinmico de segundo orden.
caa de azcar, realizan descripcin del diseo, anlisis econmicos.y
funciones de produccin anmalas que se obtuvieron. Chacn (1980), presenta la descripcin terica de los diseos
rotables y la aplicacin y anlisis estadstico para el diseo no
Cochran y Cox (1980), presentan una descripcin de algunos
replicado y replicado, con una proposicin sobre la divisin de los
diseos utilizados en el estudio de "superficies de respuesta";
errores.
aparecen ejemplos de anlisis estadsticos de diseos rotables de
segundo orden para dos y tres variables. Ruiz (1981), presenta la construccin, propiedades y
comparaciones del Diseo Compuesto Central Doble Estrella.
En Latinoamrica y especficamente en Venezuela a partir de
1970 se han realizado algunas investigaciones importantes, de las Chacn y Villasmil (1983), presentan comparaciones tericas y
cuales referiremos las siguientes: Montano (1972), presenta una prcticas de varios diseos d Superficies de Respuesta.
discusin general de un ejemplo del diseo rotable central compuesto
en experimentos con fertilizantes en algodn. Se describen las carac- Chacn (1988), presenta algunas proposiciones sobre al anlisis
tersticas y la determinacin de dosis .ptimas de fertilizantes, se so- de los diseos de Superficies de Respuesta, para mediciones repetidas.
meten al proceso 14 experimentos dando algunos respuesta y otros no. Machado y Chacn (1992), realizan comparaciones de varios
diseos de Superficies de Respuesta, incluyendo un nuevo diseo al
Villasmil (1978b), hace una descripcin del diseo San Cristbal
doble estrella con adicin de un nuevo ncleo estrella propuesto por
Ortogonalizado, mencionando algunos planes experimentales con este
Villasmil (1986).
diseo para diferentes nmeros de variables. Tambin realiza la
comparacin del diseo con el factorial completo mediante el criterio
de la eficiencia relativa. Las conclusiones a las que llega son las
siguientes: FUNDAMENTOS DE LA METO DO LOGIA
a.- El diseo San Cristbal Ortogonalizado ( k = 3, a = 1, e = 2
DE SUPERFICIES DE RESPUESTA
m = 1 ), es ms eficiente que el factorial 33 en la estimacin de los
coeficientes de regresin correspondientes a los efectos lineales. Supongamos que el investigador est interesado en examinar
b.- El diseo San Cristbal Ortogonalizado ( k = 3, a = 1, e = 2, una respuesta "11", la cual depende de las variables controladas o
m = 1 ), es ms eficiente que el factorial 33 en la estimacin de los regresoras, SPS2'''''Sp bajo el control del experimentador y con un
coeficientes de regresin correspondientes a los trminos mnimo error se denota:
cuadrticos.
8 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta
9
Donde la forma de la funcin es muy complicada y/o es donde n es el nmero de puntos experimentales.
desconocida, normalmente la funcin "j " desconocida se expresa en Para la codificacin de valores, se toma:
trminos de las variables especificadas Xi, X2, ... , Xp, las cuales son
funciones lineales simples de las variables originales. Como la funcin i = 1,2, ..., n
generalmente se desconoce, es necesario y comn que se aproxime en
j = 1,2, .", p
trminos de un polinomio de bajo orden; si la funcin se aproxima
mediante una funcin lineal de las variables independientes, en
trminos de las variables codificadas, se crea una funcin de
respuesta de primer orden y se puede escribir as: 2
Sj =
n
kj -~j~
y <;j =
1 n
- <;ij
i=l n
n i=l
11 = ~o +
j=1
Pj Xj +
je l
Pjj x~ +
j=1 ue l
Pju X jXu
j<u
OBJETIVOS DE LA METODOLOGIA
En general, se puede utilizar polinomios de mayor orden, ya que DE SUPERFICIES DE RESPUESTA
" j " , se considera una funcin continua de Xi, X2, ... , Xp con
derivadas sucesivas continuas, siendo posible obtener una expansin
de "f" de la serie de Taylor con respecto a Xi = 0, X2 = ,...,
Xp =
del orden deseado.
1.- Aproximar convenientemente
prediccin de Y.
la funcin f para usarla en la
SUPUESTOS DE LA METODOLOGIA
Los valores de las variables codificadas se eligen de modo que se DE SUPERFICIES DE RESPUESTA
tenga:
i = 1,2, ..., n
1.- La funcin j, debe ser conocida y compleja, o desconocida.
n
L., lJ = n '
"X~ j = 1, 2, ..., P 2.- La. funcin j, puede ser aproximada a un modelo polinmico de
;=1
bajo orden, como se demostrar, al estudiar la serie de Taylor.
8 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta
9
Donde la forma de la funcin es muy complicada y/o es donde n es el nmero de puntos experimentales.
desconocida, normalmente la funcin "j " desconocida se expresa en Para la codificacin de valores, se toma:
trminos de las variables especificadas Xi, X2, ... , Xp, las cuales son
funciones lineales simples de las variables originales. Como la funcin i = 1,2, ..., n
generalmente se desconoce, es necesario y comn que se aproxime en
j = 1,2, .", p
trminos de un polinomio de bajo orden; si la funcin se aproxima
mediante una funcin lineal de las variables independientes, en
trminos de las variables codificadas, se crea una funcin de
respuesta de primer orden y se puede escribir as: 2
Sj =
n
kj -~j~
y <;j =
1 n
- <;ij
i=l n
n i=l
11 = ~o +
j=1
Pj Xj +
je l
Pjj x~ +
j=1 ue l
Pju X jXu
j<u
OBJETIVOS DE LA METODOLOGIA
En general, se puede utilizar polinomios de mayor orden, ya que DE SUPERFICIES DE RESPUESTA
" j " , se considera una funcin continua de Xi, X2, ... , Xp con
derivadas sucesivas continuas, siendo posible obtener una expansin
de "f" de la serie de Taylor con respecto a Xi = 0, X2 = ,...,
Xp =
del orden deseado.
1.- Aproximar convenientemente
prediccin de Y.
la funcin f para usarla en la
SUPUESTOS DE LA METODOLOGIA
Los valores de las variables codificadas se eligen de modo que se DE SUPERFICIES DE RESPUESTA
tenga:
i = 1,2, ..., n
1.- La funcin j, debe ser conocida y compleja, o desconocida.
n
L., lJ = n '
"X~ j = 1, 2, ..., P 2.- La. funcin j, puede ser aproximada a un modelo polinmico de
;=1
bajo orden, como se demostrar, al estudiar la serie de Taylor.
10 Chacn I Anlisis de Regresin y Superiicies de Respuesta
3.- Los valores Xi, Xs,..., Xp, deben ser variables controladas y
medidas con mnimo error, tan pequeo, que se puede decir que
se mide sin error.
Captulo 2
4.- Se pueden desarrollar experimentos para valores combinados de
los X.obtenindose un valor de Y "respuesta" para cada uno de INTRODUCCION AL ALGEBRA
las combinaciones, dependiendo de cuales niveles son DE MATRICES
seleccionados, las combinaciones elegidas determinan el diseo
de tratamiento a utilizar.
5.- Los coeficientes del modelo poblacional (parmetros) pueden ser
estimados a travs de procedimientos de estimacin de
parmetros estadsticos (mnimos cuadrados ordinarios, INTRODUCCION
estimadores mximo verosmiles, entre otros) sin embargo, se
prefieren los estimadores mnimos cuadrados ordinarios, por
sus caractersticas ventajosas en la fijacin del Modelo de El uso del lgebra de matrices es fundamental para comprender
Regresin, los cuales se describen en captulos posteriores. las tcnicas de Superficie de Respuesta. En este captulo se har una
6.- Mediante un anlisis polinomial, se pueden encontrar algunas revisin general de algunas definiciones, propiedades y teoremas
caractersticas importantes en el modelo de superficie (el lector importantes para desarrollar la MSR y bsicamente estudiaremos
aspectos del lgebra de matrices y la frmula de Taylor.
puede estudiar en captulos posteriores estas caractersticas).
CONCEPTOS Y DEFINICIONES
Matriz
ll l2
Azx 3
= la a al31
a2l a22 a23
A = ( au ) = [aij
10 Chacn I Anlisis de Regresin y Superiicies de Respuesta
3.- Los valores Xi, Xs,..., Xp, deben ser variables controladas y
medidas con mnimo error, tan pequeo, que se puede decir que
se mide sin error.
Captulo 2
4.- Se pueden desarrollar experimentos para valores combinados de
los X.obtenindose un valor de Y "respuesta" para cada uno de INTRODUCCION AL ALGEBRA
las combinaciones, dependiendo de cuales niveles son DE MATRICES
seleccionados, las combinaciones elegidas determinan el diseo
de tratamiento a utilizar.
5.- Los coeficientes del modelo poblacional (parmetros) pueden ser
estimados a travs de procedimientos de estimacin de
parmetros estadsticos (mnimos cuadrados ordinarios, INTRODUCCION
estimadores mximo verosmiles, entre otros) sin embargo, se
prefieren los estimadores mnimos cuadrados ordinarios, por
sus caractersticas ventajosas en la fijacin del Modelo de El uso del lgebra de matrices es fundamental para comprender
Regresin, los cuales se describen en captulos posteriores. las tcnicas de Superficie de Respuesta. En este captulo se har una
6.- Mediante un anlisis polinomial, se pueden encontrar algunas revisin general de algunas definiciones, propiedades y teoremas
caractersticas importantes en el modelo de superficie (el lector importantes para desarrollar la MSR y bsicamente estudiaremos
aspectos del lgebra de matrices y la frmula de Taylor.
puede estudiar en captulos posteriores estas caractersticas).
CONCEPTOS Y DEFINICIONES
Matriz
ll l2
Azx 3
= la a al31
a2l a22 a23
A = ( au ) = [aij
12 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta
13
= Columna
El 2x3 indica el orden de la matriz, que de manera general
podemos denotarlo con m x n, es decir:
A=[1348]
ejemplo:
Cuando el orden es de m x 1, se denomina Vector Columna. As:
A=
Sea
A ~ [; ~ :1
[il La traza de la matriz A ser; Tr(A)
Propiedades de la traza de una matriz
= 1 + 5 + 9-= 15
Matriz traspuesta
= Columna
El 2x3 indica el orden de la matriz, que de manera general
podemos denotarlo con m x n, es decir:
A=[1348]
ejemplo:
Cuando el orden es de m x 1, se denomina Vector Columna. As:
A=
Sea
A ~ [; ~ :1
[il La traza de la matriz A ser; Tr(A)
Propiedades de la traza de una matriz
= 1 + 5 + 9-= 15
Matriz traspuesta
Ejemplo: Ejemplo:
A=
[; ;~] y B = [! ~~]
A + B = [H:]
Propiedades de la suma de matrices
Propiedades de la matriz traspuesta
A+B = B+A
(A + B )' = A' + B' A + (B+C)=(A+B) +C
( K A )' = K A' A+O= 0+ A=A
(A' )' = A A + (-A) =( -A) + A = o
( A B )' = B' A' donde Oes la Matriz Nula .
a A = a [aij]m xn = [a a-- ] 1) ID X n
Sean:
A = (aij] m xn y B = (bij] ID x n Ejemplo:
AB=(aij)mxn (bij ]mxn
A B = (aij bij] mx n A = [:~] y a = 2
14 Chacn I Anlisis de Regresin Y Superficies de Respuesta Chacn I Anlisis de Regresin y Superfices de Respuesta 15
Ejemplo: Ejemplo:
A=
[; ;~] y B = [! ~~]
A + B = [H:]
Propiedades de la suma de matrices
Propiedades de la matriz traspuesta
A+B = B+A
(A + B )' = A' + B' A + (B+C)=(A+B) +C
( K A )' = K A' A+O= 0+ A=A
(A' )' = A A + (-A) =( -A) + A = o
( A B )' = B' A' donde Oes la Matriz Nula .
a A = a [aij]m xn = [a a-- ] 1) ID X n
Sean:
A = (aij] m xn y B = (bij] ID x n Ejemplo:
AB=(aij)mxn (bij ]mxn
A B = (aij bij] mx n A = [:~] y a = 2
Chacn I Anlisis de Regresin YSuperficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 17
16
Producto de matrices
Producto de vectores
l: ;l
O
Entonces A x B ser:
Sean: A=
l
realizar el producto.
bl
b2 CII e12
A B = ( al az ... as ] b3 A x B. = e2l e22
COl
e23
donde:
A B = [al bi + aa bs + ... + an bn )lxl = [Cij) cu = 1 xl + 3x4 = 13
donde Cij es la suma de los productos de los elementos C12 = 1xO + 3x2 = 6
correspondientes en el vector fila (A) y el vector columna (B). C13 = 1x3 + 3x1 = 6
Ejemplo: C21 = 4x1 + 2x4 = 12
1 C22 = 4xO + 2x2 = 4
A=[1324] y B =
5 C23 = 4x3 + 2x1 = 14
4 C3l = 6x1 + 1x4 = 10
O
C32 = 6xO + 1x2 = 2
Ax B = [1 x 1 + 3 x 5 + 2 x 4 + 4 x O ) = 24 C33 = 6x3 + 1x 1 = 19
Chacn I Anlisis de Regresin YSuperficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 17
16
Producto de matrices
Producto de vectores
l: ;l
O
Entonces A x B ser:
Sean: A=
l
realizar el producto.
bl
b2 CII e12
A B = ( al az ... as ] b3 A x B. = e2l e22
COl
e23
donde:
A B = [al bi + aa bs + ... + an bn )lxl = [Cij) cu = 1 xl + 3x4 = 13
donde Cij es la suma de los productos de los elementos C12 = 1xO + 3x2 = 6
correspondientes en el vector fila (A) y el vector columna (B). C13 = 1x3 + 3x1 = 6
Ejemplo: C21 = 4x1 + 2x4 = 12
1 C22 = 4xO + 2x2 = 4
A=[1324] y B =
5 C23 = 4x3 + 2x1 = 14
4 C3l = 6x1 + 1x4 = 10
O
C32 = 6xO + 1x2 = 2
Ax B = [1 x 1 + 3 x 5 + 2 x 4 + 4 x O ) = 24 C33 = 6x3 + 1x 1 = 19
Chacn I Anlisis de Regresin y Superficies de Respuesta 19
Chacn I Anlisis de Regresin Y Superficies de Respuesta
18
Matriz diagonal
d O O
O d22 O
Dn =
Propiedades del producto de matrices O O dnn
AB "# BA
Matriz inversa
A ( B C ) =(AB)C
Omxn =
O O
O O ~l ( A B )-1 = B-l A-1
O O .. , ~j ( KA )-1 = ~. A-1
K
Matriz identidad
DETERMINANTES
1 O O
O 1 O Existe un nmero real asociado a una matriz cuadrada que se
conoce con el nombre de determinante y es denotado por I A l.
In =
Considrense una matriz cuadrada 2 x 2
O O 1
Chacn I Anlisis de Regresin y Superficies de Respuesta 19
Chacn I Anlisis de Regresin Y Superficies de Respuesta
18
Matriz diagonal
d O O
O d22 O
Dn =
Propiedades del producto de matrices O O dnn
AB "# BA
Matriz inversa
A ( B C ) =(AB)C
Omxn =
O O
O O ~l ( A B )-1 = B-l A-1
O O .. , ~j ( KA )-1 = ~. A-1
K
Matriz identidad
DETERMINANTES
1 O O
O 1 O Existe un nmero real asociado a una matriz cuadrada que se
conoce con el nombre de determinante y es denotado por I A l.
In =
Considrense una matriz cuadrada 2 x 2
O O 1
20 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta
21
vii)
Cofactor de un determinante de orden n es el correspondiente
menor de -orden n - 1 con signo + - d d
expresin: e acuer o a la
En forma general, para una matriz cuadrada puede darse la
frmula siguiente: Cij = (-1 )i+j I A ij I
viii)
El ~alor del determinante no se altera cuando a cualquier fila
IAI = fC-l)P+iapjIApil co
o umlna, se le suma un mltiple constante de cualquier otra
fil a o co umna. Esto es:
j~1
Adj (A) = [cid' Se dice que los vectores son linealmente independientes si la
expresin:
La adjunta de A es la traspuesta de la matriz de cofactores.
A.l Xi + A.2 X2 + ... + A.m Xm = 0n
Se puede definir a la matriz inversa como:
1
ocurre solamente si A.l A.2 = = ... = A.n = O, de no ser as los vectores son
A-l = - adj (A) linealmente dependientes
\A\ Donde;
Ejemplo: sea A o =
n Vector n x 1 cuyos elementos son ceros
f... = nmeros reales
2 31
A =
U 5
-4 -:J
IAI = 1
Adj (A) = [cid' Se dice que los vectores son linealmente independientes si la
expresin:
La adjunta de A es la traspuesta de la matriz de cofactores.
A.l Xi + A.2 X2 + ... + A.m Xm = 0n
Se puede definir a la matriz inversa como:
1
ocurre solamente si A.l A.2 = = ... = A.n = O, de no ser as los vectores son
A-l = - adj (A) linealmente dependientes
\A\ Donde;
Ejemplo: sea A o =
n Vector n x 1 cuyos elementos son ceros
f... = nmeros reales
2 31
A =
U 5
-4 -:J
IAI = 1
C i es la i-sima fila de e
Sea una matriz A, A es ortogona l si
SI Y solo
o si
SI A' = A-I
e. es la traspuesta de ci, un vector columna
J
RAICES y VECTORES CARACTERISTICOS Las condiciones necesarias y suficientes para que C sea
ortogonal son:
C i es la i-sima fila de e
Sea una matriz A, A es ortogona l si
SI Y solo
o si
SI A' = A-I
e. es la traspuesta de ci, un vector columna
J
RAICES y VECTORES CARACTERISTICOS Las condiciones necesarias y suficientes para que C sea
ortogonal son:
I E(Z~) E(ZlZn)] 1
E (ZZ') =
I E(Z?Zl) E(Z2Zn) .J5
I ~
lE(ZnZ1 ) E(~!) J
Ejemplo:
r
a21
anl
a22
an2 ...
aa,"~
2n
a:"
26 Chacn / Anlisis de Regresin y Superficies de Respuesta Chacn / Anlisis de Regresin y Superficies de Respuesta 27
I E(Z~) E(ZlZn)] 1
E (ZZ') =
I E(Z?Zl) E(Z2Zn) .J5
I ~
lE(ZnZ1 ) E(~!) J
Ejemplo:
r
a21
anl
a22
an2 ...
aa,"~
2n
a:"
Chacn I Anlisis de Regresin y Superficies de Respuesta 29
28 Chacn I Anlisis de Regresin Y Superficies de Respuesta
Si X = y A= n n n n n
Entonces:
X'AX = X~ + 3X2 Xi + 4XilXI + 2XlX2 + 8X~ + 9X3 X2 - Xi X3
2
TIPOS DE FORMAS CUADRATICAS
+ 2X2 X3 - X3
rango de la matriz A.
2
+ (7 + 4) X2 X3- X3 El ndice" u" de una forma cuadrtica Q es el nmero de races
positivas de la ecuacin caracterstica de A.
X' AX = X ~ + 8X2 Xl - 3Xl X2 + 5X3 X. - 2Xl X3 + 8X; + 7Xz X3
2. Usando las definiciones anteriores, se tiene que:
+ 4X3 X2 - X 3
L Cuando la ecuacin caracterstica de A contiene races
positivas y negativas; esto es en trminos de r y u, 1:S; u :s; r,
= X'BX la forma cuadrtica Q es indefinida.
lI. Si Q es de rango r = n y adems u = r = n entonces Q es
definida positiva.
pero, A "* B
lII. Si Q es de rango r = n, pero u = 0, entonces Q es definida
Sin embargo, si a los coeficientes de Xi X2, Xi X3 y X2 X3 los negativa.
dividimos por 2, se tiene que:
IV. Si r < n y adems u = r, entonces Q es semidefinida positiva.
3 3 2
- Xi X3 + - X3Xi + 8X 2 + V. Si r < n y adems u = 0, se dice que Q es semidefinida negati-
2 2
va.
5/2
X' AX = i x, X2 Xa ] 8
11/2
Chacn I Anlisis de Regresin y Superficies de Respuesta 29
28 Chacn I Anlisis de Regresin Y Superficies de Respuesta
Si X = y A= n n n n n
Entonces:
X'AX = X~ + 3X2 Xi + 4XilXI + 2XlX2 + 8X~ + 9X3 X2 - Xi X3
2
TIPOS DE FORMAS CUADRATICAS
+ 2X2 X3 - X3
rango de la matriz A.
2
+ (7 + 4) X2 X3- X3 El ndice" u" de una forma cuadrtica Q es el nmero de races
positivas de la ecuacin caracterstica de A.
X' AX = X ~ + 8X2 Xl - 3Xl X2 + 5X3 X. - 2Xl X3 + 8X; + 7Xz X3
2. Usando las definiciones anteriores, se tiene que:
+ 4X3 X2 - X 3
L Cuando la ecuacin caracterstica de A contiene races
positivas y negativas; esto es en trminos de r y u, 1:S; u :s; r,
= X'BX la forma cuadrtica Q es indefinida.
lI. Si Q es de rango r = n y adems u = r = n entonces Q es
definida positiva.
pero, A "* B
lII. Si Q es de rango r = n, pero u = 0, entonces Q es definida
Sin embargo, si a los coeficientes de Xi X2, Xi X3 y X2 X3 los negativa.
dividimos por 2, se tiene que:
IV. Si r < n y adems u = r, entonces Q es semidefinida positiva.
3 3 2
- Xi X3 + - X3Xi + 8X 2 + V. Si r < n y adems u = 0, se dice que Q es semidefinida negati-
2 2
va.
5/2
X' AX = i x, X2 Xa ] 8
11/2
30 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 31
Ejemplo:
a.- Para la matriz:
o
A= r~~
l-2 1
-~l
1
[W W2 ... Wn]
= 1
1\. W21 + 1
1\.2 w2 2
+
O
O
An
+ AnW II
Wn
2
II ~J
r2
B= DIFERENCIACION USANDO MATRICES
donde, Al =
Como r = n
5
2
=
+
2 Y u
H =
y A2
2,
5
-
2 -H Supngase que se requiere diferenciar f( Z, Z2, ..., Zn) con res-
pecto a Zi, Z2, ... Zn. Considerando los Z' s en forma de vector, sto es:
TEOREMA 8f
-=
Si Al, A2.... , An son races caractersticas (todas reales) de la 8Z
matriz simtrica A, existe una transformacin ortogonal X = PW, tal
que la forma cuadrtica real Q = X'AX es transformada en una
expresin cannica:
A= r~~
l-2 1
-~l
1
[W W2 ... Wn]
= 1
1\. W21 + 1
1\.2 w2 2
+
O
O
An
+ AnW II
Wn
2
II ~J
r2
B= DIFERENCIACION USANDO MATRICES
donde, Al =
Como r = n
5
2
=
+
2 Y u
H =
y A2
2,
5
-
2 -H Supngase que se requiere diferenciar f( Z, Z2, ..., Zn) con res-
pecto a Zi, Z2, ... Zn. Considerando los Z' s en forma de vector, sto es:
TEOREMA 8f
-=
Si Al, A2.... , An son races caractersticas (todas reales) de la 8Z
matriz simtrica A, existe una transformacin ortogonal X = PW, tal
que la forma cuadrtica real Q = X'AX es transformada en una
expresin cannica:
aa'Z
a
Sea: y =
az
.OZ'Z
--= 2Z y --
eaz = 2Z'
az az'
es decir, .ti = E (Yr ), i = 1, 2, ..., n
aa'Z
a
Sea: y =
az
.OZ'Z
--= 2Z y --
eaz = 2Z'
az az'
es decir, .ti = E (Yr ), i = 1, 2, ..., n
en notacin escalar se tiene que: Este teorema puede ser generalizado para funciones de varias
variables. Si se tiene por ejemplo una funcin de tres variables en
torno al punto "p"( xi, yi, Zl )
V(a'Y) = I a~O'2+2I IaajO'ij
i=l i=l je I
i"j
Chacn I Anlisis de Regresin y Superficies de Respuesta 35
34 Chacn I Anlisis de Regresin y Superficies de Respuesta
en notacin escalar se tiene que: Este teorema puede ser generalizado para funciones de varias
variables. Si se tiene por ejemplo una funcin de tres variables en
torno al punto "p"( xi, yi, Zl )
V(a'Y) = I a~O'2+2I IaajO'ij
i=l i=l je I
i"j
Chacin I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 37
36
Con:
-x*
= Xl + t* ( X -xi )
y* = Yl + t* ( Y -yi )
z* = Zl + t* ( Z -zi )
Donde:
o < t* < 1, el punto ( x*, s", z* ) se encuentra entre, (Xl, yi, zr )
Y ( X, y, Z ).
+ fn( a)
( r
x-a g( O) = f( a)
n! por lo tanto,
donde el trmino error o residuo, viene dado por la frmula:
g(1) - g( O) = f( a + y) - f( a )
fn+1(C) ( )n+1 ahora, como g es derivable y continua, por definicin, entonces
pn( x) - f( x) = En( x) = x- a , a < e < x
(n+ 1)! podemos aplicar el polinomio de Taylor para nmeros reales, en este
caso, el de grado uno, centrado en a:
+ fn( a)
( r
x-a g( O) = f( a)
n! por lo tanto,
donde el trmino error o residuo, viene dado por la frmula:
g(1) - g( O) = f( a + y) - f( a )
fn+1(C) ( )n+1 ahora, como g es derivable y continua, por definicin, entonces
pn( x) - f( x) = En( x) = x- a , a < e < x
(n+ 1)! podemos aplicar el polinomio de Taylor para nmeros reales, en este
caso, el de grado uno, centrado en a:
= II
i=1 j=I
n, f( a + cy ). yi . vr : O < e < 1
1 n n
n si y '* O.
= I Di f [ r( J.l) ] . Yi
Despejando, nos queda:
j=1
1 n n .
B (a; r ).
2f I I
con tal que r( J.l) E
n, f( a + e y ) yi Yi =
i=l j=1
l
40 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta
41
= II
i=1 j=I
n, f( a + cy ). yi . vr : O < e < 1
1 n n
n si y '* O.
= I Di f [ r( J.l) ] . Yi
Despejando, nos queda:
j=1
1 n n .
B (a; r ).
2f I I
con tal que r( J.l) E
n, f( a + e y ) yi Yi =
i=l j=1
l
42 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta
43
1 n n
11yl12 E2( a, y) = -21. . [Dij f( a + e y) - Dij f ( a) ]. yi . yj
1=1 J=1 donde:
1 n n 8 f(a)
s -
2
1Dij f ( a + c y ) - n, f ( a ) 11y. yj 1 8X
' 1=1 J=1
.
por desigualdad: triangular: 8fea)
1 n n
8X2
::;
,
2.
i=1 j=1
I"Dij f( a + e y) - Dij f( a )111y 112
afea)
y dividiendo por 11y 112,ya que asumimos v= O, obtenemos que:
8X3
y las derivadas segundas son:
1 n n
IE2(a, y )1s -
2'1=1
1 Dij f( a + e y) - Dij f ( a ) 1 82 fea) 82 fea)
.
J=1 = =
8 21x 8 X 8 X2
O =
pero cada derivada Dij es continua. Por hiptesis en el punto a,
tenemos que: 82 fea) 2
8 fea)
= = /37 =
n, f ( a + e y) ~ Dij f ( a ), cuando y ~ O 8X8X3 8X38X
por lo tanto, E2( a, y) ~ O, cuando y ~ O; demostrando as el
82 fea) 2
8 fea)
teorema.
8X28X3
= O = 8X38X2
r_
42 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta
43
1 n n
11yl12 E2( a, y) = -21. . [Dij f( a + e y) - Dij f ( a) ]. yi . yj
1=1 J=1 donde:
1 n n 8 f(a)
s -
2
1Dij f ( a + c y ) - n, f ( a ) 11y. yj 1 8X
' 1=1 J=1
.
por desigualdad: triangular: 8fea)
1 n n
8X2
::;
,
2.
i=1 j=1
I"Dij f( a + e y) - Dij f( a )111y 112
afea)
y dividiendo por 11y 112,ya que asumimos v= O, obtenemos que:
8X3
y las derivadas segundas son:
1 n n
IE2(a, y )1s -
2'1=1
1 Dij f( a + e y) - Dij f ( a ) 1 82 fea) 82 fea)
.
J=1 = =
8 21x 8 X 8 X2
O =
pero cada derivada Dij es continua. Por hiptesis en el punto a,
tenemos que: 82 fea) 2
8 fea)
= = /37 =
n, f ( a + e y) ~ Dij f ( a ), cuando y ~ O 8X8X3 8X38X
por lo tanto, E2( a, y) ~ O, cuando y ~ O; demostrando as el
82 fea) 2
8 fea)
teorema.
8X28X3
= O = 8X38X2
r_
44 Chacn I Anlisis de Regresin y Superficies de Respuesta
por lo tanto:
1 3 3
f( a + y) - f( a ) = Vf( a ). y + ,.
2.
II
i=l je I
Dij f( a ) Yi yj
+ 11 y 112 E2( a, y )
por lo tanto:
1 3 3
f( a + y) - f( a ) = Vf( a ). y + ,.
2.
II
i=l je I
Dij f( a ) Yi yj
+ 11 y 112 E2( a, y )
donde:
En los modelos de regresin es de inters primordial encontrar
una ecuacin que permita predecir los valores de un factor en estudio, i = 1, 2, 3 -
mediante otros factores relacionados con l. Por ejemplo, predecir el
rendimiento de un cultivo como maz, a partir de factores tales como:
j = 1, 2
nmero de mazorcas, nmero de granos por mazorca, peso de los Con notacin matricial, esta ecuacin puede ser escrita de la
granos, etc. En este caso el modelo sera: siguiente forma:
Yll 1 1 O O cll
c31
repeticiones, podra escribirse de la siguiente manera: Y32 1 O O 1 c32
Yll ~ + TI + cll
c12
Donde y es un vector 6 x 1 de observaciones, es un vector 4 x 1
Y12 = ~ + TI +
Y21 ~ + T2 + c21 de parmetros desconocidos, Q es un vector 6 x 1 de errores no
Y22 = ~ + T2 + c22 observables y X es una matriz cuyos elementos son ceros y unos. Al
Y31 = ~ + T3 + c31 calcular, se tendr que X es una matriz de rango 3 (incompleto), yen
Y32 = ~ + T3 + c32 consecuencia, carecer de inversa, lo cual constituye cierta dificultad
que en general no se plantea en la teora de Modelos Lineales
donde: Generales.
es la j-sima observacin del i-simo tratamiento Definicin A: Sea y un vector aleatorio observable n x 1 tal
media poblacional que:
cij error aleatorio no observable. Donde X es una matriz n x p conocida que contiene slo ceros y
En un modelo de diseo, se le puede incluir la restriccin de: unos; 12 es un vector de parmetros desconocidas y f un vector de
variables aleatorias no observables. Por definicin este es un modelo
de Diseo Experimental. Dado que el rango de X no es completo
[~~~~- Yii]
(
I Ti
;=}
= O ~ ti + t2 + ts O y ~= E
n
i=l je l
tampoco lo ser el de X' X, por lo que esta ltima no tendr inversa.
En general, un modelo de Diseo Experimental se escribir de la
siguiente forma:
El modelo se expresa en forma ms compacta de la siguiente
manera:
yij...m = Jlij...m + c ij...m
~ + Ti + cij
ChacnI Anlisisde Regresiny Superficiesde Respuesta 47
46 Chacn I Anlisisde Regresiny Superficiesde Respuesta
donde:
En los modelos de regresin es de inters primordial encontrar
una ecuacin que permita predecir los valores de un factor en estudio, i = 1, 2, 3 -
mediante otros factores relacionados con l. Por ejemplo, predecir el
rendimiento de un cultivo como maz, a partir de factores tales como:
j = 1, 2
nmero de mazorcas, nmero de granos por mazorca, peso de los Con notacin matricial, esta ecuacin puede ser escrita de la
granos, etc. En este caso el modelo sera: siguiente forma:
Yll 1 1 O O cll
c31
repeticiones, podra escribirse de la siguiente manera: Y32 1 O O 1 c32
Yll ~ + TI + cll
c12
Donde y es un vector 6 x 1 de observaciones, es un vector 4 x 1
Y12 = ~ + TI +
Y21 ~ + T2 + c21 de parmetros desconocidos, Q es un vector 6 x 1 de errores no
Y22 = ~ + T2 + c22 observables y X es una matriz cuyos elementos son ceros y unos. Al
Y31 = ~ + T3 + c31 calcular, se tendr que X es una matriz de rango 3 (incompleto), yen
Y32 = ~ + T3 + c32 consecuencia, carecer de inversa, lo cual constituye cierta dificultad
que en general no se plantea en la teora de Modelos Lineales
donde: Generales.
es la j-sima observacin del i-simo tratamiento Definicin A: Sea y un vector aleatorio observable n x 1 tal
media poblacional que:
cij error aleatorio no observable. Donde X es una matriz n x p conocida que contiene slo ceros y
En un modelo de diseo, se le puede incluir la restriccin de: unos; 12 es un vector de parmetros desconocidas y f un vector de
variables aleatorias no observables. Por definicin este es un modelo
de Diseo Experimental. Dado que el rango de X no es completo
[~~~~- Yii]
(
I Ti
;=}
= O ~ ti + t2 + ts O y ~= E
n
i=l je l
tampoco lo ser el de X' X, por lo que esta ltima no tendr inversa.
En general, un modelo de Diseo Experimental se escribir de la
siguiente forma:
El modelo se expresa en forma ms compacta de la siguiente
manera:
yij...m = Jlij...m + c ij...m
~ + Ti + cij
48 Chacn I Anlisis de Regresin y Superficies de Respuesta
49
Chacn I Anlisis de Regresin y Superficies de Respuesta
b.- Para un diseo de bloques al azar: Los estimadores mximos verosmiles, tienen las siguientes
propiedades:
I.l.ij = I.l. + Ti + ~j
Se plantean entonces dos hiptesis: Los estimadores mnimos cuadrados, presentan las siguientes
propiedades:
A.- son variables aleatorias, normales, no correlacionadas, con
eij
b.- Para un diseo de bloques al azar: Los estimadores mximos verosmiles, tienen las siguientes
propiedades:
I.l.ij = I.l. + Ti + ~j
Se plantean entonces dos hiptesis: Los estimadores mnimos cuadrados, presentan las siguientes
propiedades:
A.- son variables aleatorias, normales, no correlacionadas, con
eij
~ = AX~ + AE (E) = AX~ Ya que E (E) = O En otras palabras, si existe una matriz A, de dimensin n x p,
Luego AX se cumple para todos los valores de ~j por lo que tal que E(AY) = X~, ya que si A, es la i-sima fila de A y Xi~ es
AX = 1. Pero I es la matriz identidad p x p cuyo rango es p, y el rango estimable, se tendr:
del producto de dos matrices no puede ser mayor que la de
cualquiera de ambos. De acuerdo ala definicin A, el rango de X es k E(A1 Y)
< p por lo tanto, el rango de X es menor que el rango de A tal que E E(A2Y)
(AY) *- ~ y por lo tanto, no hay un estimador insesgado de ~. E (AY) = E E(AY) =
En la mayora de los casos, en el diseo del Modelo
Experimental se est interesado en estimar ciertas combinaciones
lineales de los parmetros, por lo tanto:
Definicin B: sea A un vector de p x 1 de constantes conocidas, Xl~ Xl
se dir que la combinacin lineal de ~ dada por
X2~ X2
n
E(AY) = E = ~
X'~= IXi ~i
i=1 Xn~ Xn
ser una funcin estimable, si existe una combinacin lineal de las Y Si A = 1 entonces:
cuyo valor esperado sea A~, en otras palabras A' ~ es estimable si
existe un vector a de dimensin n x 1 tal que: E (I Y) es = E (Y) = E(X~ + E)= E (X~)+ E (E)= X~
E(a'Y) = A'~
50 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 51
~ = AX~ + AE (E) = AX~ Ya que E (E) = O En otras palabras, si existe una matriz A, de dimensin n x p,
Luego AX se cumple para todos los valores de ~j por lo que tal que E(AY) = X~, ya que si A, es la i-sima fila de A y Xi~ es
AX = 1. Pero I es la matriz identidad p x p cuyo rango es p, y el rango estimable, se tendr:
del producto de dos matrices no puede ser mayor que la de
cualquiera de ambos. De acuerdo ala definicin A, el rango de X es k E(A1 Y)
< p por lo tanto, el rango de X es menor que el rango de A tal que E E(A2Y)
(AY) *- ~ y por lo tanto, no hay un estimador insesgado de ~. E (AY) = E E(AY) =
En la mayora de los casos, en el diseo del Modelo
Experimental se est interesado en estimar ciertas combinaciones
lineales de los parmetros, por lo tanto:
Definicin B: sea A un vector de p x 1 de constantes conocidas, Xl~ Xl
se dir que la combinacin lineal de ~ dada por
X2~ X2
n
E(AY) = E = ~
X'~= IXi ~i
i=1 Xn~ Xn
ser una funcin estimable, si existe una combinacin lineal de las Y Si A = 1 entonces:
cuyo valor esperado sea A~, en otras palabras A' ~ es estimable si
existe un vector a de dimensin n x 1 tal que: E (I Y) es = E (Y) = E(X~ + E)= E (X~)+ E (E)= X~
E(a'Y) = A'~
52 Chacin I Anlisis de Regresin y Superficies de Respuesta Chacin I Anlisis de Regresin y Superficies de Respuesta 53
X'
Demostracin
X'
Demostracin
entonces:
Yll 1 1 O En
- [4~+2tl+2t2Jl
21l+2tl =
fYij
Y1i j1
2ft+2t2 Y2i
YI2 1 1 O EI2
= + Aplicando la restriccin I Ti = O ---+ ti + t2 = O
Y21
Y22
1 O 1
1 O 1
[~ 1 E2I
E22
Entonces:
~ =Y..
~] r~ ~]
1 1 2
11 O Sustituyendo:
X'X =
[i 1 O
O 1
101
101
= 2
O Yn =!l + TI +Eu = Y + (Ylj-Y'.) + En
'1 Y (Y
r~ ~]
2
l~~ 2
O
r
t2 J
X'Y
Y22 = !l + T2 + E22
+ Y..)+ IIcij
+ 2j
- Y ..) + E22
[IIY;;l Y;l
ri ~]
1 1 Restando a cada trmino y .. y elevando al cuadrado; tenemos:
YI2
X'Y = 1 O = Ylj
Y21
O 1 Y2j
Y22
desarrollando tenemos:
54 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 55
entonces:
Yll 1 1 O En
- [4~+2tl+2t2Jl
21l+2tl =
fYij
Y1i j1
2ft+2t2 Y2i
YI2 1 1 O EI2
= + Aplicando la restriccin I Ti = O ---+ ti + t2 = O
Y21
Y22
1 O 1
1 O 1
[~ 1 E2I
E22
Entonces:
~ =Y..
~] r~ ~]
1 1 2
11 O Sustituyendo:
X'X =
[i 1 O
O 1
101
101
= 2
O Yn =!l + TI +Eu = Y + (Ylj-Y'.) + En
'1 Y (Y
r~ ~]
2
l~~ 2
O
r
t2 J
X'Y
Y22 = !l + T2 + E22
+ Y..)+ IIcij
+ 2j
- Y ..) + E22
[IIY;;l Y;l
ri ~]
1 1 Restando a cada trmino y .. y elevando al cuadrado; tenemos:
YI2
X'Y = 1 O = Ylj
Y21
O 1 Y2j
Y22
desarrollando tenemos:
Chacn I Anlisis de Regresin y Superficie de Respuestas 57
56 Chacn I Anlisis de Regresin y Superficies de Respuesta
A = [a"
a~1
ami
al2
a22
am2
...
... :~"
aln
mn
1
mxn
A = [a"
a~1
ami
al2
a22
am2
...
... :~"
aln
mn
1
mxn
tales por fila, para obtener una matriz Bn tal que I Bn * o. II.- Si r(A) = m (rango completo por filas) entonces:
Entonces definase AGcomo: -
AG = A'(AA')l y AAG = AA' (AA')l =1
AG = A-lO]
11 Con estos teoremas expuestos y demostrados, se tiene la
[ O O herramienta para resolver sistemas de ecuaciones donde la matriz de
coeficientes no es cuadrada.
Otra consideracin es como calcular la inversa generalizada de
un producto de dos matrices, digamos B.C, donde Bmxr y r(B) = r,
Crxn y r(C) = =
r. Bajo estas condiciones (BC)G CG.BG.
La utilizacin de este tipo de inversa es muy comn en
problemas de regresin y modelos lineales donde con frecuencia se
hace necesario su uso para estimaciones de parmetros.
tales por fila, para obtener una matriz Bn tal que I Bn * o. II.- Si r(A) = m (rango completo por filas) entonces:
Entonces definase AGcomo: -
AG = A'(AA')l y AAG = AA' (AA')l =1
AG = A-lO]
11 Con estos teoremas expuestos y demostrados, se tiene la
[ O O herramienta para resolver sistemas de ecuaciones donde la matriz de
coeficientes no es cuadrada.
Otra consideracin es como calcular la inversa generalizada de
un producto de dos matrices, digamos B.C, donde Bmxr y r(B) = r,
Crxn y r(C) = =
r. Bajo estas condiciones (BC)G CG.BG.
La utilizacin de este tipo de inversa es muy comn en
problemas de regresin y modelos lineales donde con frecuencia se
hace necesario su uso para estimaciones de parmetros.
A = KL (3.2)
r aa
ll
21
al2
a12
a1q
a2q
lI
A= ahora:
I I
lap1 ap2 apq J A
A22
, donde Au es de orden r y I Al1 I
* O de rango r.
Propiedades de Am:
Como las filas [A21 A22] son dependientes de las filas [An A12],
1.- La inversa de la traspuesta de A, es la traspuesta de la inversa
existe una matriz T nica de escalares tal que: AmdeA:
= T (3.4)
2.- La inversa de Ames igual a A:
A = KL (3.2)
r aa
ll
21
al2
a12
a1q
a2q
lI
A= ahora:
I I
lap1 ap2 apq J A
A22
, donde Au es de orden r y I Al1 I
* O de rango r.
Propiedades de Am:
Como las filas [A21 A22] son dependientes de las filas [An A12],
1.- La inversa de la traspuesta de A, es la traspuesta de la inversa
existe una matriz T nica de escalares tal que: AmdeA:
= T (3.4)
2.- La inversa de Ames igual a A:
Inversa condicional ( A e )
AAcA=A (3.8)
(3.9)
4.- SiAes una matriz simtrica, la inversa Ames tambin simtrica, No es necesario que la submatriz no singular de orden est
es decir: ubicada en la posicin An , sta puede estar en cualquier lugar en A.
i A' = A ~ (Am)' = Am El siguiente algoritmo, entonces, puede ser desarrollado:
Se ha demostrado que la inversa generalizada de una matriz En A encuentre cualquier submatriz de orden igual al rango de A.
posee vmas de las propiedades de la inversa de una matriz no Dentelo mediante W.
singular, Estas propiedades pueden ser muy usadas en varias reas
de la estadstica, especialmente en la solucin de sistemas de Invierta y transponga (W-1),.
ecuacioIJeslineales. As, la teora de sistemas de ecuaciones lineales
juega UJ papel muy importante en estadstica como en muchos otros En A reemplace cada elemento de W mediante los elementos
campos ientficos. Se puede discutir otro tipo de inversa, la cual es correspondientes de (W-1),.
llamada inversa condicional Ac (tambin llamada inversa genera-
lizada Iormalizada). Una inversa condicional Ac de una matriz, es Reemplace todos los otros elementos de A por ceros.
generallllente ms fcil de calcular que la inversa Moore-Penrose
(A).
Transponga la matriz resultante.
Ulla inversa condicional se caracteriza por ser no-nica y slo X(X'X)c X'X = X; por lo tanto (X'X)c es una inversa generalizada de
satisface la condicin 1 en (3.1). X.
A Continuacin daremos dos derivaciones de la matriz inversa
X(X'X)cX' es simtrica, si (X' X)c lo es.
condiciOnala travs de un algoritmo sencillo y otro en forma generaL
Supngase que en Apxqla submatriz principal An es no singular de
Ejemplo
ran~o rA.entonces, la inversa generalizada condicional se obtiene a
partir de la particin de A como:
Se tienen los resultados de un experimento donde el
rendimiento en fruto es una funcin de la materia seca en hojas (Xi) y
es A e
qxp
= [AllO -1 00] (3.9) en races (X2). Se desea estimar un modelo de regresin mltiple.
y = X~ + ~
A
y x donde:
.J, .J,
2055
1928
1 5 10
1 6 12
X'X = [1~~112
658
224J
1316
224 1316 2632
1887 148
2181 1 8 16 Verificamos que:
2602 1 7 14
1940 1 5 10 20 112 22~
IX' Xl = 112 658 1316
1900 148 224 1316 263
3322 1 8 16
2000 1 5 10 IX'XI = 34.637.120 + 33.015.808 + 33.015.808
2670 1 7 14
(33.015.808 + 33.015.808 + 34.637.120) = O
2550
= 1 6 12 [::] + Como IX' Xl = O, supone dependencia lineal entre las columnas
2021 1 4 12
de la matriz 3 x 3, en consecuencia la inversa de X' X:
1946 1 5 10
2042 1 5 10 1
O ol
2462 (X'X)-l = -- .C 2464
1 6 12 X'X -1232]
2220 1 5 10 -1232 616
3121 1 7 14 donde C es la matriz de cofactores. Evidentemente, (X' X)-l ser
1914 148 indeterminado, por lo tanto, la matriz as formada no tendr inversa
regular. En este caso se puede resolver el sistema de ecuaciones
1981 1 5 10 desarrollando el uso de la matriz inversa generalizada de Moore-
1830 1 6 12 Penrose o condicional.
66 Chacin I Anlisis de Regresin y Superficie de Respuestas Chacn I Anlisis de Regresin y Superficies de Respuesta 67
Expresado matricialmente: Modelo estimad:
y = X~ + ~
A
y x donde:
.J, .J,
2055
1928
1 5 10
1 6 12
X'X = [1~~112
658
224J
1316
224 1316 2632
1887 148
2181 1 8 16 Verificamos que:
2602 1 7 14
1940 1 5 10 20 112 22~
IX' Xl = 112 658 1316
1900 148 224 1316 263
3322 1 8 16
2000 1 5 10 IX'XI = 34.637.120 + 33.015.808 + 33.015.808
2670 1 7 14
(33.015.808 + 33.015.808 + 34.637.120) = O
2550
= 1 6 12 [::] + Como IX' Xl = O, supone dependencia lineal entre las columnas
2021 1 4 12
de la matriz 3 x 3, en consecuencia la inversa de X' X:
1946 1 5 10
2042 1 5 10 1
O ol
2462 (X'X)-l = -- .C 2464
1 6 12 X'X -1232]
2220 1 5 10 -1232 616
3121 1 7 14 donde C es la matriz de cofactores. Evidentemente, (X' X)-l ser
1914 148 indeterminado, por lo tanto, la matriz as formada no tendr inversa
regular. En este caso se puede resolver el sistema de ecuaciones
1981 1 5 10 desarrollando el uso de la matriz inversa generalizada de Moore-
1830 1 6 12 Penrose o condicional.
Chacn I Anlisis de Regresin y Superficie de Respuestas 69
68 Chacin I Anlisis de Regresin y Superficie de Respuestas
112944 379680J
(X' X) = A, por lo tanto: - Y K' AL' = l76384 2240700
r 1316
(X'X)m =
l
-0,036 -0,018
-0,073 -0,035
0,012
0,024
j
a travs de (3.6) obtenemos T y H
Se deja como ejercicio probar que AAmA = A.
-1
20 112 La solucin de 3.10 ser:
T1x2 =[224 1316lx2 = [O 2]
[
112 658 2x2
]
1. P =
r 1,068 0~27 -0~54] [ 44572]
-0,036 -0,018 0,012 257203
20 112J-1
[ 112 658
224J
. [ 1316
l -0,073 -0,035 0,024 514406
L = [1 H] = [~
O
1 ~l No hay duda que los valores obtenidos de los ~, dependern de la
inversa generalizada que se utilice, por esta razn los coeficientes
PO,Pl,P2, sern estimaciones sesgadas de ~o, ~1 y ~2 respectivamente.
entonces:
Es de notar que en este problema se truncaron el nmero de
decimales en su transcripcin. Se recomienda al estudiante utilizar
11
20 112 al lo todos los decimales posibles para mayor exactitud al chequear las
K' = L'= respuestas.
112 658 2J
lo rl
Chacn I Anlisis de Regresin y Superficie de Respuestas 69
68 Chacin I Anlisis de Regresin y Superficie de Respuestas
112944 379680J
(X' X) = A, por lo tanto: - Y K' AL' = l76384 2240700
r 1316
(X'X)m =
l
-0,036 -0,018
-0,073 -0,035
0,012
0,024
j
a travs de (3.6) obtenemos T y H
Se deja como ejercicio probar que AAmA = A.
-1
20 112 La solucin de 3.10 ser:
T1x2 =[224 1316lx2 = [O 2]
[
112 658 2x2
]
1. P =
r 1,068 0~27 -0~54] [ 44572]
-0,036 -0,018 0,012 257203
20 112J-1
[ 112 658
224J
. [ 1316
l -0,073 -0,035 0,024 514406
L = [1 H] = [~
O
1 ~l No hay duda que los valores obtenidos de los ~, dependern de la
inversa generalizada que se utilice, por esta razn los coeficientes
PO,Pl,P2, sern estimaciones sesgadas de ~o, ~1 y ~2 respectivamente.
entonces:
Es de notar que en este problema se truncaron el nmero de
decimales en su transcripcin. Se recomienda al estudiante utilizar
11
20 112 al lo todos los decimales posibles para mayor exactitud al chequear las
K' = L'= respuestas.
112 658 2J
lo rl
Captulo 4
ANALISIS DE REGRESION
El modelo de regresin lineal mltiple
Graybill (1961), expresa que uno de los propsitos de la ciencia Y=XP+:; (4.1)
es describir y predecir los eventos en el mundo en que vivimos y una
forma es mediante modelos que relacionen cualidades del mundo real. y = vector (n x 1) de respuesta
Chacn y Meneses (1984) y Cobo (1976), sealan algunas ideas X = matriz (n x p) de variables independientes
expresadas por Bunge, Kempthorne, .Federer, Gill, Fisher, Neter y P = vector (p x 1) de constante desconocidas
Graybill. Una relacin funcional entre grupos de eventos en el mundo :; = vector .(n x 1) aleatorio de errores supuestos
72 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 73
Estos supuestos seran resumidamente: real es un modelo y aunque la relacin no sea exacta sino aproximada
a.- Homogeneidad de la varianza de errores es invalorable -la prediccin, por consiguiente cuando se dice que una
relacin funcional existe entre un grupo de variables es en forma muy
b.- Normalidad de los errores aproximada.
c.- Independencia
La funcin del modelo es simular el comportamiento de un
d.- Aditividad de los efectos. sistema bajo ciertas condiciones. La simulacin puede encontrarse
mediante un modelo matemtico que puede ser una ecuacin o
Para el estudio del cumplimiento de los supuestos y alternativas
sistema de ecuaciones que representan cuantitativamente la hiptesis
de soluciones se tendr que realizar algunos anlisis como seran:
formulada en relacin al sistema bajo consideracin y que envuelve
a.- Examen de residuales variables aleatorias y parmetros. Si la ecuacin es lineal en los
parmetros el modelo se convierte en un modelo lineal, dentro de
b.- Estudios y anlisis de la autocorrelacin
estos modelos, el modelo de regresin lineal es uno de los ms
c.- Estudio y anlisis de la multicolinealidad. importantes.
Graybill (1961), expresa que uno de los propsitos de la ciencia Y=XP+:; (4.1)
es describir y predecir los eventos en el mundo en que vivimos y una
forma es mediante modelos que relacionen cualidades del mundo real. y = vector (n x 1) de respuesta
Chacn y Meneses (1984) y Cobo (1976), sealan algunas ideas X = matriz (n x p) de variables independientes
expresadas por Bunge, Kempthorne, .Federer, Gill, Fisher, Neter y P = vector (p x 1) de constante desconocidas
Graybill. Una relacin funcional entre grupos de eventos en el mundo :; = vector .(n x 1) aleatorio de errores supuestos
74 Chacin I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 75
, 2
V(E)=
2
donde: E(E) = O Y E(E E) =0' In O' Si se obtiene la matriz (X'X)-l, y la llamamos C entonces, se
puede denotar al elemento Cjj, donde j = 1, 2, ... p, en la matriz de
Expandiendo la expresin matricial del modelo nos queda:
suma de productos y cuadrados corregidos.
(4.2)
[Cl!C12
C12
C22
1)
Yn
P r"
P2 Y X=
1 Xl2
1 x.,
X22
XZn
siguiente: l~k
76 Chacin I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 77
Yn
P r"
P2 Y X=
1 Xl2
1 x.,
X22
XZn
siguiente: l~k
78 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 79
El modelo de la ecuacin (4.10) se refiere al modelo lineal
general. El lector puede realmente observar que el modelo lineal La suma ~e los cuadrados de los errores o desviaciones a partir
general es fcilmente aplicable a modelos polinomiales, mayores a las de la respuesta observada para el valor. estimado L puede ser escrito
de primer orden. Por ejemplo, supngase que el modelo asumido es un as:
modelo cuadrtico en dos variables, sto es, la respuesta en el i-simo
tratamiento que envuelve los niveles (Xu, X2i) es dado por:
.L = r:y - XP)' r:y XP) (4.12)
entonces:
1
r
Yi = 130 + I3l(Xli - Xl) + 132~2i - X2) + ... + I3K{Xki - Xk) + Ei l 811 812 Slk ,1 [SIY
lj
822 82k I 82y
donde los Xi son los valores promedios de los Xi en la muestra donde COy ~2
j= 1, 2,..,k. .. II .
Si realizamos la estimacin: l~k
8
kk
J . 8ky
~o 1 n O O
El Anlisis de Varianza con la particin de los grados de libertad
para la regresin sera la siguiente:
131 811 812
Tabla 4.2. Anlisis de Varianza del Modelo de Regresin de primer
COy 132- 822 (4.18) orden
F. deV G.deL. 8C
Regresin debido a Po 1 -2
nY
donde 811 es la suma de cuadrados corregidos de la columna de los Xl Regresin de Xi, X2 ... , Xn k ~1 81y+ ~2 82y +...+ I3k 8kY
1
r
Yi = 130 + I3l(Xli - Xl) + 132~2i - X2) + ... + I3K{Xki - Xk) + Ei l 811 812 Slk ,1 [SIY
lj
822 82k I 82y
donde los Xi son los valores promedios de los Xi en la muestra donde COy ~2
j= 1, 2,..,k. .. II .
Si realizamos la estimacin: l~k
8
kk
J . 8ky
~o 1 n O O
El Anlisis de Varianza con la particin de los grados de libertad
para la regresin sera la siguiente:
131 811 812
Tabla 4.2. Anlisis de Varianza del Modelo de Regresin de primer
COy 132- 822 (4.18) orden
F. deV G.deL. 8C
Regresin debido a Po 1 -2
nY
donde 811 es la suma de cuadrados corregidos de la columna de los Xl Regresin de Xi, X2 ... , Xn k ~1 81y+ ~2 82y +...+ I3k 8kY
Grfica
O
Cuando los residuales del ejemplo son graficados, se obtiene el 2 3
10 11 12 13
diagrama presentado en la Figura 4.1. Si nuestro modelo ~s c.orre~~o
estos residuales semejarn once observaciones de una distribucin -5
normal con media cero.
-10
Grfica
O
Cuando los residuales del ejemplo son graficados, se obtiene el 2 3
10 11 12 13
diagrama presentado en la Figura 4.1. Si nuestro modelo ~s c.orre~~o
estos residuales semejarn once observaciones de una distribucin -5
normal con media cero.
-10
Esta se reduce a:
n
(Y- y)=
=1
entonces:
Figura 4.3. Franja de residuales si el modelo fijado es satisfactorio n
n
,,-
"E.
L.J
=1
1
O
L.JE =--=
=1 n
La grfica (Figura 4.1) muestra ligeras irregularidades; stas no
(1)
parecen anormales para una muestra de once observaciones de una
distribucin normal.
Un procedimiento alternativo es construir una grfica media
normal una normal de los residuales sobre papel de probabilidades
(2) estndar. Los puntos caeran aproximadamente sobre una recta.
A
Grficos contra Y
A
8
n
.10
(Y- bo- bX- ...-bkXk) =O .12
:
Figura 4.5. Grfico de residuales contra valores estimados de la
donde la sumatoria se toma sobre i = 1, .., n respuesta
88 Chacn I Anlisis de Regresin Y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 89
Esta se reduce a:
n
(Y- y)=
=1
entonces:
Figura 4.3. Franja de residuales si el modelo fijado es satisfactorio n
n
,,-
"E.
L.J
=1
1
O
L.JE =--=
=1 n
La grfica (Figura 4.1) muestra ligeras irregularidades; stas no
(1)
parecen anormales para una muestra de once observaciones de una
distribucin normal.
Un procedimiento alternativo es construir una grfica media
normal una normal de los residuales sobre papel de probabilidades
(2) estndar. Los puntos caeran aproximadamente sobre una recta.
A
Grficos contra Y
A
8
n
.10
(Y- bo- bX- ...-bkXk) =O .12
:
Figura 4.5. Grfico de residuales contra valores estimados de la
donde la sumatoria se toma sobre i = 1, .., n respuesta
90 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 91
La irregularidad podra indicarse por graficacin de l~ forma
como se muestra en (1), (2), Y (3) en la Figura 4.4. Aqu las grficas
indican:
a.- Varianza no constante: necesidad de mimmos cuadrados
ponderados o una transformacin sobre las observaciones Yi,
antes de hacer un anlisis de regresin.
Esto ser cero solamente cuando el modelo tiene ajuste perfecto.
b.- Error en el anlisis; la particin de la ecuacin de estimacin es De otro modo los residuales graficados contra los Y mostrarn
sistemtica (residuales negativas corresponden a valores bajos pendientes ( 1 - R2).
de los Yr; residuales positivc;>scorresponden a valores altos de las n
Y;).
U.- L(E - e)cY- Y) = LE Y (por similar deduccin).
c.- El modelo inadecuado; necesidad de trminos extras en el =l
Autocorrelacin pura Drapper y Smith (1981) refieren que se puede usar los siguien-
tes mtodos para la deteccin de autocorrelacin.
a.- Observaciones suceaivas en el tiempo o en el espacio tienden a
tener residuales correlacionados ya que ellas estn afectadas por Mtodo grfico: es sumamente sencillo, y consiste en realizar un
condiciones similares. grfico de Jos residuales ei, contra una unidad de espacio o de tiempo.
La interpretacin de estos grficos es similar a la usada en la
b.- Series grandes de errores positivos o negativos son segui~as por
interpretacin grfica de los coeficientes de correlacin simple (todos
series grandes de errores positivos o negativos ya .qu~ residuales
los tipos de correlacin simple: positiva, negativa, no correlacin, etc.).
adyacentes generalmente presentan dimensiones similares.
Uso de estadsticos: entre los estadsticos usados para detectar
Autocorrelacin operativa
autocorrelacin, se pueden mencionar: la prueba de Durbin-Watson y
a.- Sistematizacin en la obtencin de los datos en la variable la prueba de la corridas o de las rachas.
dependiente en series de tiempo. Prueba de Durbin-Watson
b.- Omisin de una o ms variables en el modelo. Cuando los efectos
de secuencias de las variables claves "perdidas" estn correla- La prueba de Durbin-Watson es la base de muchas pruebas
estadsticas ampliamente utilizadas para detectar auto correlacin en
cionados, los trminos de error en el modelo de regresin
el anlisis de regresin. Se basa en el supuesto de que los errores
tendern a estar correlacionas debido a que stos incluyen efectos
constituyen una serie autoregresiva de primer orden llamada:
de las variables perdidas.
c.- Uso de un modelo lineal en lugar de otro ms apropiado Et = p etl + Vt IP I < 1 (4.22)
(curvilineo, exponencial, etc.).
=
et trmino del error en el modelo Y, = XI3+ et en cada perodo o
Consecuencias de la autocorrelacin desplazamiento t.
Neter y Wasserman (1974), expresan las siguientes conse- VI - N(O;cr;), por lo tanto Y es una variable aleatoria.
cuencias de la correlacin seriada.
a.- Los coeficientes de regresin obtenidos por mnimos cuadrados p = Parmetro de autocorrelacin que mide la asociacin de la
ordinarios aunque siguen siendo insesgados pierden la propiedad observacin previa ( t -1) sobre la actual.
de la varianza mnima y pueden ser bastante ineficientes. 2
av
b.- Los cuadrados medios esperados y.el error estndar pueden estar 2 (4.23)
seriamente subestimando las verdaderas varianzas del error y 1- p
desviacin estndar de regresin, respectivamente.
C.- El coeficiente de determinacin puede resultar sobre-estimado, Cov (et. et+s) = t 1, 2, ..., n (4.24)
dando la impresin aparente de exactitud.
d.- Las pruebas de t, F y los intervalos de confianza no son
estrictamente aplicables. (4.25)
94 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacin I Anlisis de Regresin y Superficies de Respuesta 95
Autocorrelacin pura Drapper y Smith (1981) refieren que se puede usar los siguien-
tes mtodos para la deteccin de autocorrelacin.
a.- Observaciones suceaivas en el tiempo o en el espacio tienden a
tener residuales correlacionados ya que ellas estn afectadas por Mtodo grfico: es sumamente sencillo, y consiste en realizar un
condiciones similares. grfico de Jos residuales ei, contra una unidad de espacio o de tiempo.
La interpretacin de estos grficos es similar a la usada en la
b.- Series grandes de errores positivos o negativos son segui~as por
interpretacin grfica de los coeficientes de correlacin simple (todos
series grandes de errores positivos o negativos ya .qu~ residuales
los tipos de correlacin simple: positiva, negativa, no correlacin, etc.).
adyacentes generalmente presentan dimensiones similares.
Uso de estadsticos: entre los estadsticos usados para detectar
Autocorrelacin operativa
autocorrelacin, se pueden mencionar: la prueba de Durbin-Watson y
a.- Sistematizacin en la obtencin de los datos en la variable la prueba de la corridas o de las rachas.
dependiente en series de tiempo. Prueba de Durbin-Watson
b.- Omisin de una o ms variables en el modelo. Cuando los efectos
de secuencias de las variables claves "perdidas" estn correla- La prueba de Durbin-Watson es la base de muchas pruebas
estadsticas ampliamente utilizadas para detectar auto correlacin en
cionados, los trminos de error en el modelo de regresin
el anlisis de regresin. Se basa en el supuesto de que los errores
tendern a estar correlacionas debido a que stos incluyen efectos
constituyen una serie autoregresiva de primer orden llamada:
de las variables perdidas.
c.- Uso de un modelo lineal en lugar de otro ms apropiado Et = p etl + Vt IP I < 1 (4.22)
(curvilineo, exponencial, etc.).
=
et trmino del error en el modelo Y, = XI3+ et en cada perodo o
Consecuencias de la autocorrelacin desplazamiento t.
Neter y Wasserman (1974), expresan las siguientes conse- VI - N(O;cr;), por lo tanto Y es una variable aleatoria.
cuencias de la correlacin seriada.
a.- Los coeficientes de regresin obtenidos por mnimos cuadrados p = Parmetro de autocorrelacin que mide la asociacin de la
ordinarios aunque siguen siendo insesgados pierden la propiedad observacin previa ( t -1) sobre la actual.
de la varianza mnima y pueden ser bastante ineficientes. 2
av
b.- Los cuadrados medios esperados y.el error estndar pueden estar 2 (4.23)
seriamente subestimando las verdaderas varianzas del error y 1- p
desviacin estndar de regresin, respectivamente.
C.- El coeficiente de determinacin puede resultar sobre-estimado, Cov (et. et+s) = t 1, 2, ..., n (4.24)
dando la impresin aparente de exactitud.
d.- Las pruebas de t, F y los intervalos de confianza no son
estrictamente aplicables. (4.25)
96 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 97
Una relacin aproximada entre los estadsticos d y p viene Ho: no autocorrelacin de errores
dada por: Ha: autocorrelacin de errores.
Una relacin aproximada entre los estadsticos d y p viene Ho: no autocorrelacin de errores
dada por: Ha: autocorrelacin de errores.
es una normal unitaria desviada, donde el trmino 112 es la correccin = a (l-p) + 13 (Xt -pXt-l) + Vt (4.33)
de continuidad, que compensa que una distribucin continua esta
luego:
siendo usada para aproximar a una distribucin discreta en la cola
inferior, y sirve para probar la existencia de correlacin positiva, es
decir, pocas corridas. Para probar correlacin negativa, muchas
y; = a + 13x;+ + Vt (4.34)
Et = pse.i + Vt
p
Se puede apreciar que mediante transformaciones del modelo
original:
Yt = a + I3Xt + et (4.31)
c.- Fijar la ecuacin sealada en (4.34), usando las variables
las transformaciones son: (Yt - P ye-i) Y (X, - P Xe.i). Los estimadores de los parmetros en
la ecuacin original son:
Yt - p Yt.l y Xt - pXt.l (4.32)
A a*
a=--
l-p
98 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 99
es una normal unitaria desviada, donde el trmino 112 es la correccin = a (l-p) + 13 (Xt -pXt-l) + Vt (4.33)
de continuidad, que compensa que una distribucin continua esta
luego:
siendo usada para aproximar a una distribucin discreta en la cola
inferior, y sirve para probar la existencia de correlacin positiva, es
decir, pocas corridas. Para probar correlacin negativa, muchas
y; = a + 13x;+ + Vt (4.34)
Et = pse.i + Vt
p
Se puede apreciar que mediante transformaciones del modelo
original:
Yt = a + I3Xt + et (4.31)
c.- Fijar la ecuacin sealada en (4.34), usando las variables
las transformaciones son: (Yt - P ye-i) Y (X, - P Xe.i). Los estimadores de los parmetros en
la ecuacin original son:
Yt - p Yt.l y Xt - pXt.l (4.32)
A a*
a=--
l-p
Chacn I Anlisis de Regresin y Superficies de Respuesta 101
100 Chacn I Anlisis de Regresin y Superficies de Respuesta
SELECCION DE VARIABLES
Chacn y Meneses (1984), refieren que la interpretacin y el uso EN LA ECUACION DE REGRESION MULTIPLE
de los modelos de regresin mltiple depende implcita o explci-
tamente de las estimaciones de los coeficientes de regresin indivi-
duales. Cuando no existen relaciones lineales entre las variables Esta seccin se desarroll en base a los trabajos de Chacn y
regresoras se dice que hay ortogonalidad. Desafortunadamente en Meneses (1984, 1987), realizados durante el dictado del curso de
muchas aplicaciones del anlisis de regresin, las variables regreso- Anlisis de Regresin.
ras no son ortogonales y aunque algunas veces los problemas de no
ortogonalidad no son graves, en muchos casos las variables regreso- . En muchas aplicaciones del anlisis de regresin el conjunto de
ras se encuentran relacionadas linealmente en forma estrecha y en variables a ser incluidas en el modelo no es preestablecida, y con
tal situacin, inferenciasbasadas en los modelos de regresin pueden frecuencia una de las primeras etapas del anlisis consiste en
estar completamente erradas. La multicolinealidad se refiere seleccionar estas variables. Existen ocasiones, donde consideraciones
especficamente a la interdependencia que existe entre las variables tericas o de cualquier otra naturaleza determinan las variables a ser
regresoras y que tiene efecto directo sobre las estimaciones y varianza incluidas en la ecuacin, en estas situaciones el problema de seleccin
de los parmetros, los autores sealan 4 (cuatro) causas posibles de de variables no se presenta, pero en situaciones donde los aspectos
multicolinealidad las cuales seran: tcnicos no son especficos la seleccin de variables dentro del modelo
de regresin llega a ser muy importante.
a.- El mtodo de recoleccin de datos empleado.
b.- Restriccin en el modelo o en la poblacin.
C.- Definicin del modelo.
d.- Modelos sobre-definidos.
Chacn I Anlisis de Regresin y Superficies de Respuesta 101
100 Chacn I Anlisis de Regresin y Superficies de Respuesta
SELECCION DE VARIABLES
Chacn y Meneses (1984), refieren que la interpretacin y el uso EN LA ECUACION DE REGRESION MULTIPLE
de los modelos de regresin mltiple depende implcita o explci-
tamente de las estimaciones de los coeficientes de regresin indivi-
duales. Cuando no existen relaciones lineales entre las variables Esta seccin se desarroll en base a los trabajos de Chacn y
regresoras se dice que hay ortogonalidad. Desafortunadamente en Meneses (1984, 1987), realizados durante el dictado del curso de
muchas aplicaciones del anlisis de regresin, las variables regreso- Anlisis de Regresin.
ras no son ortogonales y aunque algunas veces los problemas de no
ortogonalidad no son graves, en muchos casos las variables regreso- . En muchas aplicaciones del anlisis de regresin el conjunto de
ras se encuentran relacionadas linealmente en forma estrecha y en variables a ser incluidas en el modelo no es preestablecida, y con
tal situacin, inferenciasbasadas en los modelos de regresin pueden frecuencia una de las primeras etapas del anlisis consiste en
estar completamente erradas. La multicolinealidad se refiere seleccionar estas variables. Existen ocasiones, donde consideraciones
especficamente a la interdependencia que existe entre las variables tericas o de cualquier otra naturaleza determinan las variables a ser
regresoras y que tiene efecto directo sobre las estimaciones y varianza incluidas en la ecuacin, en estas situaciones el problema de seleccin
de los parmetros, los autores sealan 4 (cuatro) causas posibles de de variables no se presenta, pero en situaciones donde los aspectos
multicolinealidad las cuales seran: tcnicos no son especficos la seleccin de variables dentro del modelo
de regresin llega a ser muy importante.
a.- El mtodo de recoleccin de datos empleado.
b.- Restriccin en el modelo o en la poblacin.
C.- Definicin del modelo.
d.- Modelos sobre-definidos.
102 Chacn J Anlisis de Regresin y Superficies de Respuesta Chacn J Anlisis de Regresin y Superficies de Respuesta 103
k
= Consecuencias de la eliminacin de variables
Yi = ~o + ~)jXj+E i 1,2, ..., n (4.35)
j;"
Sean p~,p~,...,p;, los estimadores de los parmetros de
regresin cuando se fija el modelo completo (4.35) para las variables
donde ~j son los parmetros o coeficientes de regresin
estimados y Si representa los trminos aleatorios del error.
a ser
Xi, M, ... Xk, Y Po,Pl ' ' 'P P' los estimadores de los parmetros
cuando se fija el modelo parcial para Xi, X2, ... Xp (4.36).
En lugar de proceder con el conjunto completo de variables,
particularmente cuando k es un nmero muy alto, se puede eliminar Si definimos las siguientes matrices y vectores
un determinado nmero de variables y construir una ecuacin con un
subconjunto especifico de variables. Se pretende en este punto sealar
algunos aspectos que nos ayuden a determinar cuales variables deben
X01 X ll ",Xp1 ",Xk1
ser retenidas en el modelo de regresin. X02 X12 ..X pl ,,,Xk2
X =
Si denotamos el subconjunto de variables retenido como Xi, X2,
Xp, y las variables eliminadas como Xp+l, Xp+2, ... , Xk, se puede XOn X1n X pn ",Xkn
sustraer el efecto de la eliminacin de variables bajo dos condiciones:
k
= Consecuencias de la eliminacin de variables
Yi = ~o + ~)jXj+E i 1,2, ..., n (4.35)
j;"
Sean p~,p~,...,p;, los estimadores de los parmetros de
regresin cuando se fija el modelo completo (4.35) para las variables
donde ~j son los parmetros o coeficientes de regresin
estimados y Si representa los trminos aleatorios del error.
a ser
Xi, M, ... Xk, Y Po,Pl ' ' 'P P' los estimadores de los parmetros
cuando se fija el modelo parcial para Xi, X2, ... Xp (4.36).
En lugar de proceder con el conjunto completo de variables,
particularmente cuando k es un nmero muy alto, se puede eliminar Si definimos las siguientes matrices y vectores
un determinado nmero de variables y construir una ecuacin con un
subconjunto especifico de variables. Se pretende en este punto sealar
algunos aspectos que nos ayuden a determinar cuales variables deben
X01 X ll ",Xp1 ",Xk1
ser retenidas en el modelo de regresin. X02 X12 ..X pl ,,,Xk2
X =
Si denotamos el subconjunto de variables retenido como Xi, X2,
Xp, y las variables eliminadas como Xp+l, Xp+2, ... , Xk, se puede XOn X1n X pn ",Xkn
sustraer el efecto de la eliminacin de variables bajo dos condiciones:
La matriz X, la cual tiene n filas y (k+1) columnas, es Si se conoce que ~* y O"~ son estimadores insesgados de J3y 0"2,
particionada en dos sub-matrices Xp de dimensin nx(p+ 1) y Xr de
se puede demostrar que:
dimensin (nxr), donde el rango, r. = k-p. El vector (3 es igualmente
particionado en Pp y Pr cuyos componentes son (p+1) Y r (4.43)
respectivamente.
donde:
El modelo lineal completo que contiene las k variables viene
dado por: (4.44)
, Entonces:
y = XI3+ E = Xpl3p + Xrl3r + E (4.37)
(4.45)
donde los Ei IS son los residuales los cuales son independientes, nor-
malmente distribuidos con media cero y varianza 0"2
(4.46)
El modelo lineal que contiene slo p variables y que contiene
p + 1 trminos viene dado por: y el cuadrado medio del error viene dado por:
La matriz X, la cual tiene n filas y (k+1) columnas, es Si se conoce que ~* y O"~ son estimadores insesgados de J3y 0"2,
particionada en dos sub-matrices Xp de dimensin nx(p+ 1) y Xr de
se puede demostrar que:
dimensin (nxr), donde el rango, r. = k-p. El vector (3 es igualmente
particionado en Pp y Pr cuyos componentes son (p+1) Y r (4.43)
respectivamente.
donde:
El modelo lineal completo que contiene las k variables viene
dado por: (4.44)
, Entonces:
y = XI3+ E = Xpl3p + Xrl3r + E (4.37)
(4.45)
donde los Ei IS son los residuales los cuales son independientes, nor-
malmente distribuidos con media cero y varianza 0"2
(4.46)
El modelo lineal que contiene slo p variables y que contiene
p + 1 trminos viene dado por: y el cuadrado medio del error viene dado por:
1
Entonces:
A2 Y'Y-~*X'Y Y'[I-X(X'Xr x']y
0'. = = (4.47) 1
1
Entonces:
A2 Y'Y-~*X'Y Y'[I-X(X'Xr x']y
0'. = = (4.47) 1
respuesta Y es: cuadrado medio del error de las estimaciones sesgadas es menor
que la varianza de las estimaciones insesgadas, es decir, la
(4.53) cantidad introducida por el sesgo es menor que la reduccin de la
varianza.
con media: 2.- Existe el riesgo de retener variables no significativas, no
E(Y) :: E(X~ ~p) = X~E~p) necesarias o extraas, es decir, variables con coeficientes cero o
coeficientes menor que su correspondiente error estndar del
E(Y) = X~ (pp + APr) (4.54) modelo completo; cuando sto sucede, hay prdida de precisin en
la estimacin de los coeficientes y la prediccin de respuestas ..
donde: 3.- Los modelos de regresin se utilizan en algunos casos con datos
tomados en el tiempo que tienen generalmente valores extraos o
con varianza: extremos, estos valores generalmente incluyen grandes defectos,
que influyen en la seleccin de variables y conducen a modelos
(4.55) mal especificados con consecuencias ya conocidas (si se ha hecho
un buen estudio de valores atpicos, sto se evita).
El cuadrado medio del error de la prediccin viene dado por: 4.- Tambin es frecuente que las variables ms influyentes o
importantes en la respuesta tengan amplitudes muy pequeas y
CME (Y) = E(Y - y)2 + Sesgo
al- ajustar el modelo por mnimos cuadrados, por lo general son
excluidas. Para solucionar sto, el analista debe tratar de
(4.56) recolectar nuevos datos para la reconstruccin del modelo. El
diseo de experimentos es de gran ayuda en estos casos.
A
2. v(y*) ~ V(Y) la varianza de la respuesta estimada por el modelo a.- Descripcin y construccin de modelos
completo es mayor o igual a la varianza del modelo parcial o Una ecuacin de regresin puede ser usada para describir
reducido. procesos que forman parte de un sistema complejo e interactuante. El
propsito de la ecuacin puede ser puramente descriptivo a objeto de
Chacn I Anlisis de Regresin y Superticies de Respuesta 109
108 Chacn I Anlisis de Regresin y Superticies de Respuesta
respuesta Y es: cuadrado medio del error de las estimaciones sesgadas es menor
que la varianza de las estimaciones insesgadas, es decir, la
(4.53) cantidad introducida por el sesgo es menor que la reduccin de la
varianza.
con media: 2.- Existe el riesgo de retener variables no significativas, no
E(Y) :: E(X~ ~p) = X~E~p) necesarias o extraas, es decir, variables con coeficientes cero o
coeficientes menor que su correspondiente error estndar del
E(Y) = X~ (pp + APr) (4.54) modelo completo; cuando sto sucede, hay prdida de precisin en
la estimacin de los coeficientes y la prediccin de respuestas ..
donde: 3.- Los modelos de regresin se utilizan en algunos casos con datos
tomados en el tiempo que tienen generalmente valores extraos o
con varianza: extremos, estos valores generalmente incluyen grandes defectos,
que influyen en la seleccin de variables y conducen a modelos
(4.55) mal especificados con consecuencias ya conocidas (si se ha hecho
un buen estudio de valores atpicos, sto se evita).
El cuadrado medio del error de la prediccin viene dado por: 4.- Tambin es frecuente que las variables ms influyentes o
importantes en la respuesta tengan amplitudes muy pequeas y
CME (Y) = E(Y - y)2 + Sesgo
al- ajustar el modelo por mnimos cuadrados, por lo general son
excluidas. Para solucionar sto, el analista debe tratar de
(4.56) recolectar nuevos datos para la reconstruccin del modelo. El
diseo de experimentos es de gran ayuda en estos casos.
A
2. v(y*) ~ V(Y) la varianza de la respuesta estimada por el modelo a.- Descripcin y construccin de modelos
completo es mayor o igual a la varianza del modelo parcial o Una ecuacin de regresin puede ser usada para describir
reducido. procesos que forman parte de un sistema complejo e interactuante. El
propsito de la ecuacin puede ser puramente descriptivo a objeto de
110 Chacn I Anlisisde Regresiny Superficiesde Respuesta
ChacnI Anlisisde Regresiny Superficiesde Respuesta 111
explicar la naturaleza de esta interaccin compleja. En este sen~ido se
CRITERIOS PARA SELECCIONAR
. presentan dos necesidades antagnicas a saber: una es explicar la.
mayor cantidad de variacin como sea posible, sto sugiere la - ECUACIONES DE REGRESION
inclusin de un nmero elevado de variables en el modelo, la otra
posicin es adherirse al principio del menor nmero de varia~le.s, el
cual sugiere que se deben tratar de entender en forma facil la Existen dos pOSICIOnespor parte de los investigadores en
descripcin de los procesos con tan pocas variables como sea posible. relacin al conjunto de variables independientes que deben formar
parte de la ecuacin de regresin, stas son:
En situaciones donde la descripcin es el principal objetivo, se
debe tratar de seleccionar la menor cantidad de variables indepen- 1.- Incl~ el mayor nmero posible de las variables predictoras, que
dientes que expliquen la mayor-cantidad de variacin de la variable contienen la mayor informacin sobre las variables que puedan
dependiente. influenciar la respuesta, a objeto de que los valores ajustados
sean los ms confiables y seguros con fines de prediccin.
b.- Estimacin y prediccin
2.- Incluir en el modelo solamente las variables de mayor relevancia
Las ecuaciones de regresin pueden ser usadas para prediccin,
en el fenmeno bajo estudio, ya que en la mayora de los casos es
por ejemplo, se podra estar interesado en predecir el valor de una
imprctico u oneroso recabar informacin no necesaria y
futura observacin o estimar la respuesta media que se corresponde
procesarla, adems por que la varianza de las predicciones
con una determinada observacin.
aumenta al aumentar el nmero de variables regresoras.
Tanto la prediccin como la estimacin se hacen dentro del
. La posicin conciliadora entre las dos, parece ser la que ha dado
rango o rangos de las variables independientes, presentes en el
meJor~,sresultados y es la que muchos autores han llamado, "la mejor
modelo. Cuando una ecuacin de regresin es usada con estos fines,
ecua~IOnde regresin" o "la ecuacin ms adecuada". A este respecto
las variables se seleccionan bajo el criterio de minimizar el cuadrado
Hocking (1976), seala que cuando se trata de determinar la ecuacin
medio del error de la prediccin.
ms apropiada, basada en un subconjunto de variables, se deben
c.- Control tener en cuenta tres aspectos:
El propsito de construir la ecuacin de regresin podra ser a.- El criterio utilizado para analizar y seleccionar el sub-conjunto.
determinar la magnitud a la cual las variables independientes se debe
b.- La estimacin de los coeficientes de la ecuacin final.
alterar, para obtener un valor especifico de la variable respuesta. En
este punto la ecuacin de regresin es vista como una funcin c.- La tcnica computacional usada en el anlisis de los datos.
respuesta. Para propsito de control, es deseable que los coeficientes
~n la literatura se han propuesto varios criterios para
de regresin de las variables sean medidas en forma bastante
selec~lOnar la mejor ecuacin de regresin, Hocking (1976), seala
precisa, sto es, que los errores estndar de los coeficientes sean una lista bastante extensa de criterios a saber:
pequeos, por lo tanto hay que ser cuidadoso con los mtodos de
estimacin si la multicolinealidad esta presente. 1.- El cuadrado del coeficiente de correlacin mltiple o coeficiente
de determinacin.
Una consideracin importante de hacer notar es que el
propsito para el cual el modelo de regresin fue construido, determi- 2 SCRp
na el criterio que debe ser optimizado en su formulacin; sto supone R =--
p SCT
.que un sub-conjunto de variables puede ser el mejor para un
propsito, pero no necesariamente ser el mejor para otro. El concepto SCR == Suma de cuadrados debida a regresin
del mejor sub-conjunto de variables a ser 'incluidos en una ecuacin
de regresin siempre requiere de un anlisis adicional. SCT == Suma de cuadrados total
110 Chacn I Anlisisde Regresiny Superficiesde Respuesta
ChacnI Anlisisde Regresiny Superficiesde Respuesta 111
explicar la naturaleza de esta interaccin compleja. En este sen~ido se
CRITERIOS PARA SELECCIONAR
. presentan dos necesidades antagnicas a saber: una es explicar la.
mayor cantidad de variacin como sea posible, sto sugiere la - ECUACIONES DE REGRESION
inclusin de un nmero elevado de variables en el modelo, la otra
posicin es adherirse al principio del menor nmero de varia~le.s, el
cual sugiere que se deben tratar de entender en forma facil la Existen dos pOSICIOnespor parte de los investigadores en
descripcin de los procesos con tan pocas variables como sea posible. relacin al conjunto de variables independientes que deben formar
parte de la ecuacin de regresin, stas son:
En situaciones donde la descripcin es el principal objetivo, se
debe tratar de seleccionar la menor cantidad de variables indepen- 1.- Incl~ el mayor nmero posible de las variables predictoras, que
dientes que expliquen la mayor-cantidad de variacin de la variable contienen la mayor informacin sobre las variables que puedan
dependiente. influenciar la respuesta, a objeto de que los valores ajustados
sean los ms confiables y seguros con fines de prediccin.
b.- Estimacin y prediccin
2.- Incluir en el modelo solamente las variables de mayor relevancia
Las ecuaciones de regresin pueden ser usadas para prediccin,
en el fenmeno bajo estudio, ya que en la mayora de los casos es
por ejemplo, se podra estar interesado en predecir el valor de una
imprctico u oneroso recabar informacin no necesaria y
futura observacin o estimar la respuesta media que se corresponde
procesarla, adems por que la varianza de las predicciones
con una determinada observacin.
aumenta al aumentar el nmero de variables regresoras.
Tanto la prediccin como la estimacin se hacen dentro del
. La posicin conciliadora entre las dos, parece ser la que ha dado
rango o rangos de las variables independientes, presentes en el
meJor~,sresultados y es la que muchos autores han llamado, "la mejor
modelo. Cuando una ecuacin de regresin es usada con estos fines,
ecua~IOnde regresin" o "la ecuacin ms adecuada". A este respecto
las variables se seleccionan bajo el criterio de minimizar el cuadrado
Hocking (1976), seala que cuando se trata de determinar la ecuacin
medio del error de la prediccin.
ms apropiada, basada en un subconjunto de variables, se deben
c.- Control tener en cuenta tres aspectos:
El propsito de construir la ecuacin de regresin podra ser a.- El criterio utilizado para analizar y seleccionar el sub-conjunto.
determinar la magnitud a la cual las variables independientes se debe
b.- La estimacin de los coeficientes de la ecuacin final.
alterar, para obtener un valor especifico de la variable respuesta. En
este punto la ecuacin de regresin es vista como una funcin c.- La tcnica computacional usada en el anlisis de los datos.
respuesta. Para propsito de control, es deseable que los coeficientes
~n la literatura se han propuesto varios criterios para
de regresin de las variables sean medidas en forma bastante
selec~lOnar la mejor ecuacin de regresin, Hocking (1976), seala
precisa, sto es, que los errores estndar de los coeficientes sean una lista bastante extensa de criterios a saber:
pequeos, por lo tanto hay que ser cuidadoso con los mtodos de
estimacin si la multicolinealidad esta presente. 1.- El cuadrado del coeficiente de correlacin mltiple o coeficiente
de determinacin.
Una consideracin importante de hacer notar es que el
propsito para el cual el modelo de regresin fue construido, determi- 2 SCRp
na el criterio que debe ser optimizado en su formulacin; sto supone R =--
p SCT
.que un sub-conjunto de variables puede ser el mejor para un
propsito, pero no necesariamente ser el mejor para otro. El concepto SCR == Suma de cuadrados debida a regresin
del mejor sub-conjunto de variables a ser 'incluidos en una ecuacin
de regresin siempre requiere de un anlisis adicional. SCT == Suma de cuadrados total
Chacin / Anlisis de Regresin y Superficies de Respuesta 113
112 Chacin / Anlisis de Regresin y Superficies de Respuesta
EXisten [ k ] valores de Rp, para cada valor de p, es decir uno Desventajas del jP
p-l .
para cada posible sub-modelo de tamao p, donde k el nmero de 1.- El criterio de iP podra eliminar variables esenciales en la
respuesta.
variables regresoras en el modelo completo.
Por lo tanto para cada subconjunto de tamao p, habr un 2.- La inspeccin cualitativa de R2depende de la escala.
mximo R2.p Tambin R2p aumentar en la medida que aumente p, y -2 .
3.- . R prOp~rCl?~a una informacin de conjunto, y no sobre los
=
ser mximo para p k + 1 (mximo absoluto), es decir, si se refiere aportes individuales de las variables regresoras.
al ptimo R p2 como el ms grande, siempre se obtendr con el modelo
. El decrecimiento en un momento dado al agregar variables,
completo. Pero ese R 2p no amerta seleccin, interesa es una especie de
pu~era ser que esas t variables agregadas son malas regresaras y ya
mximo relativo, es decir, un mximo R~ que no difiera estan representadas por otras, debido a su alta correlacin.
significativamente del R~ del modelo completo y sto podra ser a Su explicacin matemtica sera:
juicio del investigador.
que es un coeficiente de determinacin ponderado por los grados de n-1 SCE n-1 SCE'
libertad del modelo. 1----->1
n-p SCT n-p-t SCT
El R~ no necesariamente se incrementa al adicionar variables al
modelo, llega a un valor mximo y luego empieza descender, en ese Se conoce que:
valor mximo tenemos el modelo adecuado.
n-1 SCE' -2
1 - =R
n-p-t SCT p+t
114 Chacin I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 115
EXisten [ k ] valores de Rp, para cada valor de p, es decir uno Desventajas del jP
p-l .
para cada posible sub-modelo de tamao p, donde k el nmero de 1.- El criterio de iP podra eliminar variables esenciales en la
respuesta.
variables regresoras en el modelo completo.
Por lo tanto para cada subconjunto de tamao p, habr un 2.- La inspeccin cualitativa de R2depende de la escala.
mximo R2.p Tambin R2p aumentar en la medida que aumente p, y -2 .
3.- . R prOp~rCl?~a una informacin de conjunto, y no sobre los
=
ser mximo para p k + 1 (mximo absoluto), es decir, si se refiere aportes individuales de las variables regresoras.
al ptimo R p2 como el ms grande, siempre se obtendr con el modelo
. El decrecimiento en un momento dado al agregar variables,
completo. Pero ese R 2p no amerta seleccin, interesa es una especie de
pu~era ser que esas t variables agregadas son malas regresaras y ya
mximo relativo, es decir, un mximo R~ que no difiera estan representadas por otras, debido a su alta correlacin.
significativamente del R~ del modelo completo y sto podra ser a Su explicacin matemtica sera:
juicio del investigador.
que es un coeficiente de determinacin ponderado por los grados de n-1 SCE n-1 SCE'
libertad del modelo. 1----->1
n-p SCT n-p-t SCT
El R~ no necesariamente se incrementa al adicionar variables al
modelo, llega a un valor mximo y luego empieza descender, en ese Se conoce que:
valor mximo tenemos el modelo adecuado.
n-1 SCE' -2
1 - =R
n-p-t SCT p+t
116 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 117
SCRp+t
-2R =1- [n-11)SCE.
-- --=1- [n-1lJ
-- 1-R 2) CMRp+t =
p n-p SCT n-p p+t
SCRp+t
-2R =1- [n-11)SCE.
-- --=1- [n-1lJ
-- 1-R 2) CMRp+t =
p n-p SCT n-p p+t
2 SCEp
El subconjunto del modelo que minimiza CME(P) tambin har y R =1--- del modelo con p variables (4.58)
p - SCT
mximo R~
Donde SCT = Suma de cuadrados total
R2 =1- n-1(1_R2)
p n-p p SCEp
iP =1 _ n-p =1 _ n-1 SCEp (4.59)
-2 n-1 SCEp p SCT n-p SCT
R =1----
p n-p SCT n-1
2 SCEp
El subconjunto del modelo que minimiza CME(P) tambin har y R =1--- del modelo con p variables (4.58)
p - SCT
mximo R~
Donde SCT = Suma de cuadrados total
R2 =1- n-1(1_R2)
p n-p p SCEp
iP =1 _ n-p =1 _ n-1 SCEp (4.59)
-2 n-1 SCEp p SCT n-p SCT
R =1----
p n-p SCT n-1
La relacin de Cp con R~ viene dada por: El error cuadrtico medio total de la respuesta predicha para el
modelo de los p-trminos.
n
ICMEC'Yi*) I {[E(Yt ~E(YJ]2 +var(Yi*)}
i=l i=l
pero -21 ~
~Var (Av,*) =p (4.66)
(J ie I
Es decir el Cuadrado Medio del Error para la i-sima respuesta. lo cual es fcilmente demostrable (para un modelo con p trminos), de
la siguiente manera: Sea el modelo:
E(Y) es la esperanza de la respuesta debido al verdadero modelo
de regresin. y = ~o + ~lXli + .... + ~p. 1X(p - 1) i +
La relacin de Cp con R~ viene dada por: El error cuadrtico medio total de la respuesta predicha para el
modelo de los p-trminos.
n
ICMEC'Yi*) I {[E(Yt ~E(YJ]2 +var(Yi*)}
i=l i=l
pero -21 ~
~Var (Av,*) =p (4.66)
(J ie I
Es decir el Cuadrado Medio del Error para la i-sima respuesta. lo cual es fcilmente demostrable (para un modelo con p trminos), de
la siguiente manera: Sea el modelo:
E(Y) es la esperanza de la respuesta debido al verdadero modelo
de regresin. y = ~o + ~lXli + .... + ~p. 1X(p - 1) i +
1 [ E(SCEp)-(n-p)cr
<Pp=-2 2
+po 2 ]
o
o2 + ... +cr 2
LV arY.
n
i=L
- ( A* )
1
= e
2
+<l
(p-l)veces
t>
1 2p-n 2
<Pp=-2 E(SCEp)+--z-cr (4.68)
cr cr
t Var(yt)
i=l
= p cr
2
Tambin:
Si &:del modelo completo es un buen estimador de cr2 en el
modelo completo y se sustituye por su valor observado SCE(p) se
SCE =Y'MY para el modelo completo obtiene un buen estimador de <ppdenotado por Cp.
1 [ E(SCEp)-(n-p)cr
<Pp=-2 2
+po 2 ]
o
o2 + ... +cr 2
LV arY.
n
i=L
- ( A* )
1
= e
2
+<l
(p-l)veces
t>
1 2p-n 2
<Pp=-2 E(SCEp)+--z-cr (4.68)
cr cr
t Var(yt)
i=l
= p cr
2
Tambin:
Si &:del modelo completo es un buen estimador de cr2 en el
modelo completo y se sustituye por su valor observado SCE(p) se
SCE =Y'MY para el modelo completo obtiene un buen estimador de <ppdenotado por Cp.
Es conveniente referir que cuando el sesgo tiende a cero o es utilizando p =. k + 1, sto es 1;)1 modelo completo, en la mayora de las
A2 .
despreciable se tendr: veces. Al asumir el e del modelo completo como estimador pueden
haber variables malas predictoras (con coeficientes de regresin
E(SCEp) = (n-p)a2 y como E(&:) = aZ estimado cero o coeficientes menores que su desviacin estndar), lo
cual consecuentemente produce una sobre-estimacin de a2 y por lo
tanto valores de Cp pequeos. Algunos sugieren utilizar dos puntos
(n- p)crz + 2p-n (4.70)
E(Cp/sesgo = O) = del espacio dimensional (k + 1) cercanos para estimar a2
aZ
El Cpes un estimador que mide la eficiencia de las variables, en
E(Cp/sesgo = O) = P 'P~
(4.71) trminos de la suma de cuadrados medios de residual estandarizado
de la prediccin o error total.
Las desviaciones de Cp con respecto a p, se pueden tomar como
Si se expresa (4.69) de la siguiente forma: una medida de sesgo.
Para la escogencia de un modelo adecuado con el criterio de Cp
Cp = :z(SCEp).(n-p)+p
solo, no es muy evidente o claro, se puede dejar a criterio y escoger
a.
entre las siguientes alternativas:
1.- Una ecuacin sesgada que no representa exactamente los datos
porque tiene un cuadrado medio del residual grande pero tiene
[(SCE,) 1
n-p
un estimador pequeo de Cp. Esto es, la discrepancia del error
. total de la respuesta predicha con respecto al verdadero modelo
Cp = (n-p) AZ -11+ P (4.72) que no se conoce, es pequeo.
L a. J 2.- Tambin una ecuacin con ms parmetros (por consiguiente
ms variables), que ajuste mejor los datos, pero con una
discrepancia total mayor, es decir, un Cpmayor.
De las expresiones (4.71) y (4.72) E(Cp/sesgo = O) = p, el sesgo
cero es casi ideal, entonces lo que necesita es un modelo adecuado y
sto se cumplir segn este criterio (Cs), en la. medida que la fraccin
del primer trmino de (4.72) se acerque a cero, de lo contrario (n - p ) METODOS DE SELECCION DE VARIABLES
que es el factor del trmino aumentar Cp Cuando muchas variables
estn presentes se recomienda el uso del Cp como criterio de seleccin.
No existe un solo procedimiento para obtener las mejores
Interpretacin grfica del Cp
variables regresoras, y en consecuencia la mejor ecuacin o el mejor
Cuando se usa el criterio de Cp, es conveniente graficar a Cp subconjunto del modelo completo; por ejemplo, conocer la verdadera
contra p, donde p representa cada subconjunto del modelo completo. varianza a2, facilitara la obtencin de la mejor ecuacin de regresin,
Los modelos con sesgo pequeo tienen valores de Cp cercanos a pero esta situacin muy raras veces se presenta.
p, que caen de la lnea recta Cp =
p, mientras que los modelos con Algunos autores sugieren no hablar del mejor subconjunto del
sesgo severo o alto, el Cp se ubica encima de la recta. modelo de regresin en sentido absoluto, ya que ste depende del
objetivo que se persiga con el modelo; adems existen gran cantidad
El problema que se presenta en la utilizacin delC, es que su
clculo requiere de un buen estimador de a2, y slo se consigue de mtodos de seleccin que se aplican usualmente y que no conducen
necesariamente al mismo resultado, ya que cada uno de ellos utiliza
Chacn J Anlisis de Regresin y Superficies de Respuesta 125
124 Chacn J Anlisis de Regresin y Superficies de Respuesta
Es conveniente referir que cuando el sesgo tiende a cero o es utilizando p =. k + 1, sto es 1;)1 modelo completo, en la mayora de las
A2 .
despreciable se tendr: veces. Al asumir el e del modelo completo como estimador pueden
haber variables malas predictoras (con coeficientes de regresin
E(SCEp) = (n-p)a2 y como E(&:) = aZ estimado cero o coeficientes menores que su desviacin estndar), lo
cual consecuentemente produce una sobre-estimacin de a2 y por lo
tanto valores de Cp pequeos. Algunos sugieren utilizar dos puntos
(n- p)crz + 2p-n (4.70)
E(Cp/sesgo = O) = del espacio dimensional (k + 1) cercanos para estimar a2
aZ
El Cpes un estimador que mide la eficiencia de las variables, en
E(Cp/sesgo = O) = P 'P~
(4.71) trminos de la suma de cuadrados medios de residual estandarizado
de la prediccin o error total.
Las desviaciones de Cp con respecto a p, se pueden tomar como
Si se expresa (4.69) de la siguiente forma: una medida de sesgo.
Para la escogencia de un modelo adecuado con el criterio de Cp
Cp = :z(SCEp).(n-p)+p
solo, no es muy evidente o claro, se puede dejar a criterio y escoger
a.
entre las siguientes alternativas:
1.- Una ecuacin sesgada que no representa exactamente los datos
porque tiene un cuadrado medio del residual grande pero tiene
[(SCE,) 1
n-p
un estimador pequeo de Cp. Esto es, la discrepancia del error
. total de la respuesta predicha con respecto al verdadero modelo
Cp = (n-p) AZ -11+ P (4.72) que no se conoce, es pequeo.
L a. J 2.- Tambin una ecuacin con ms parmetros (por consiguiente
ms variables), que ajuste mejor los datos, pero con una
discrepancia total mayor, es decir, un Cpmayor.
De las expresiones (4.71) y (4.72) E(Cp/sesgo = O) = p, el sesgo
cero es casi ideal, entonces lo que necesita es un modelo adecuado y
sto se cumplir segn este criterio (Cs), en la. medida que la fraccin
del primer trmino de (4.72) se acerque a cero, de lo contrario (n - p ) METODOS DE SELECCION DE VARIABLES
que es el factor del trmino aumentar Cp Cuando muchas variables
estn presentes se recomienda el uso del Cp como criterio de seleccin.
No existe un solo procedimiento para obtener las mejores
Interpretacin grfica del Cp
variables regresoras, y en consecuencia la mejor ecuacin o el mejor
Cuando se usa el criterio de Cp, es conveniente graficar a Cp subconjunto del modelo completo; por ejemplo, conocer la verdadera
contra p, donde p representa cada subconjunto del modelo completo. varianza a2, facilitara la obtencin de la mejor ecuacin de regresin,
Los modelos con sesgo pequeo tienen valores de Cp cercanos a pero esta situacin muy raras veces se presenta.
p, que caen de la lnea recta Cp =
p, mientras que los modelos con Algunos autores sugieren no hablar del mejor subconjunto del
sesgo severo o alto, el Cp se ubica encima de la recta. modelo de regresin en sentido absoluto, ya que ste depende del
objetivo que se persiga con el modelo; adems existen gran cantidad
El problema que se presenta en la utilizacin delC, es que su
clculo requiere de un buen estimador de a2, y slo se consigue de mtodos de seleccin que se aplican usualmente y que no conducen
necesariamente al mismo resultado, ya que cada uno de ellos utiliza
ChacnI Anlisisde Regresiny Superficiesde Respuesta 127
126 ChacnI Anlisisde Regresiny Superficiesde Respuesta
La fundamentacin bsica del procedimientos es analizar el
criterios diferentes. Lo ms conveniente es la asociacin de ellos para ajuste de todas las ecuaciones de regresin que implican una, dos,
una buena seleccin, dependiendo del objetivo para el cual se va a tres, o ms variables candidatas a regresoras. Por lo tanto, si el
usar el modelo. modelo completo posee k variables candidatas a regresoras debe
estudiar 2k - 1 ecuaciones y en todos los casos Xo se considera
Entre los mtodos de seleccin de variables se pueden mencio- includo en el modelo, es debido a eso que Drapper (1981) expresa que
nar: el proceso consiste en ir adicionando a las variables ficticias Xo ( ~oXo
1.- Todas las posibles regresiones usando los criterios R2, R2 CME, el primer trmino del modelo, con Xo = 1) las candidatas a regresoras.
e, Los criterios sobre los que basa la seleccin este procedimiento son R2,
-2
2.- Forward (seleccin progresiva o seleccin hacia adelante R ,CMEyCp
utilizando F-secuenciales y c'orrelaciones parciales).
3.- Backward (seleccin regresiva o seleccin hacia atrs usando
Descripcin del mtodo
F-parciales).
En primer lugar vamos a considerar el modelo completo:
4.- Stepwise (seleccin por pasos o etapas con F-secuenciales,
F-parciales y correlaciones parciales). Yi = ~o + ~1 X1i+ ~2X2i +"'+~k Xki+Ei
j
produjo el mayor coeficiente de correlacin producir la mayor F- -SCRbi SCE
parcial, si esta es mayor que F entrada, esta variable es la
primera seleccionada. Error n-3
Total n=L 3.- Utiliza como criterio de seleccin la correlacin parcial y las
F-parciales, que son ms efectivos que la prueba t para medir
Si Fc > F entrada se selecciona Xj y contina el proceso: aportes individuales.
Y, = f30 + f3jXji + Ei 4.- Menos tiempo computacional que el de todas las regresiones
2.- Se hallan las correlaciones parciales de primer orden que ya se posibles.
defini (Rx'Y.xl) para j = 2, ... k Desventajas
Fundamentalmente su principal desventaja es que no hace un
Se halla el mximo de las (Rx'Y.Xl)
estudio exhaustivo de todos los modelos posibles, adems de los
problemas propios de las F -secuenciales.
134 Chacin I Anlisis de Regresin y Superficies de Respuesta Chacin I Anlisis de Regresin y Superficies de Respuesta 135
j
produjo el mayor coeficiente de correlacin producir la mayor F- -SCRbi SCE
parcial, si esta es mayor que F entrada, esta variable es la
primera seleccionada. Error n-3
Total n=L 3.- Utiliza como criterio de seleccin la correlacin parcial y las
F-parciales, que son ms efectivos que la prueba t para medir
Si Fc > F entrada se selecciona Xj y contina el proceso: aportes individuales.
Y, = f30 + f3jXji + Ei 4.- Menos tiempo computacional que el de todas las regresiones
2.- Se hallan las correlaciones parciales de primer orden que ya se posibles.
defini (Rx'Y.xl) para j = 2, ... k Desventajas
Fundamentalmente su principal desventaja es que no hace un
Se halla el mximo de las (Rx'Y.Xl)
estudio exhaustivo de todos los modelos posibles, adems de los
problemas propios de las F -secuenciales.
Chacn I Anlisisde Regresiny Superficiesde Respuesta 137
136 Chacn I Anlisisde Regresiny Superficiesde Respuesta
mtodo permite determinar si la omisin de la variable del modelo y cuando no la posee. Los valores que toma las variables falsas son
su sustitucin con una de las variables excludas ha incrementado el ceros y unos.
valor de R2.
Chacn refiere que las variables falsas se utilizan en el anlisis
Cuando ya se han realizado todas las posibles comparaciones, se de regresin bajo las dos condiciones siguientes:
elige la ecuacin que tenga el mayor R2. Con el nuevo modelo de
regresin se realizan comparaciones, continuando con el proceso hasta a.- Las observaciones originales pueden ser agrupadas en clases o
que no se consiga un cambio de modelo de regresin que permita grupos de tipo cualitativo.
aumentar el Coeficiente de Determinacin. En este paso se ha logrado b.- El efecto de la agrupacin es alterar la ordenada al origen sin
seleccionar el mejor modelo de dos variables. alterar la pendiente.
El paso siguiente es agiegar una tercera variable realizando el Si los datos originales puede separarse en dos o ms grupos
mismo procedimiento descrito anteriormente, se obtiene el mejor significativos habra que estudiar los efectos de estos grupos, si el
modelo de 3 variables. Luego se selecciona el de cuatro variables de la efecto es solo alterar la ordenada al origen de la ecuacin (coeficiente
misma forma, hasta el de "k" variables. Este procedimiento difiere de posicional) se puede sin usar riesgo variables ficticias.
los mtodos vistos anteriormente (seleccin por pasos) en el sentido
que los cambios de las ecuaciones son evaluados antes de seleccionar El uso de variables falsas en regresin mltiple
uno en particular. Las variables regresoras que forman parte de una ecuacin de
regresin mltiple generalmente toman valores en un rango continuo,
Mtodo del mnimo coeficiente de determinacin sin embargo, algunas veces es necesario introducir en el modelo de
regresin variables medidas en escala nominal u ordinal con dos o
Este procedim-iento es similar al anterior, la diferencia consiste ms niveles distintos. En tales casos no se puede utilizar una escala
en que al producirse los cambios de la ecuacin de regresin, se continua en los datos debido a su naturaleza y escala de medida. Un
realiza el cambio de modelo que se produce al menor incremento en el ejemplo de sto, pudiera ser, el investigador en mango que tenga tres
valor de R2. variedades del cultivo y quiera establecer una ecuacin de regresin
entre las variedades y el rendimiento. El investigador puede asignarle
Procesamiento electrnico a la variable variedad niveles en un determinado orden de tal manera
El programa SAS emplea el procesamiento Paso a Paso que se pueda separar la respuesta de cada uno. Estas variables son
.(Stepwise) con las opciones Forward, Backward, Stepwise, Maxr y llamadas variables falsas .
Minr, que permite la aplicacin de estos mtodos. Uno de los ejemplos clsicos de variables falsas se puede
encontrar en el uso de la variable Xo que siempre toma el valor uno,
Variables Dummy o falsas: para poder estimar el intercepto en un modelo de regresin mltiple.
Otro ejemplo del uso de variables falsas se puede observar en los
Faber (1971), citado por Chacn (1988), expresa que las mtodos de regresin para problemas de anlisis de varianza.
variables falsas son un mtodo para cuantificar caractersticas de tipo
Variables falsas en un grupo de datos
cualitativo (que son susceptibles de ser cuantificadas) o que presentan
la conveniencia de separar en categorias discretas, el procedimiento Supongamos que el investigador en mango tenga dos variedades
necesita la construccin de variables separadas en categorias (Ay B) que producen diferentes niveles de rendimiento en adicin a la
relevantes a las caractersticas en estudio, donde a esta variable se le variacin que ocurre debido a otras variables. Una de las soluciones
asigna un cierto valor si la observacin posee ese atributo y otro valor es agregar el modelo la variable falsa "z" y su coeficiente de regresin
(a) de tal manera que el modelo original debe agregrsele el trmino
(aZ). El coeficiente a puede ser estimado al mismo tiempo que los
138 ChacinI Anlisisde Regresiny Superficiesde Respuesta ChacinI Anlisisde Regresiny Superficiesde Respuesta 139
mtodo permite determinar si la omisin de la variable del modelo y cuando no la posee. Los valores que toma las variables falsas son
su sustitucin con una de las variables excludas ha incrementado el ceros y unos.
valor de R2.
Chacn refiere que las variables falsas se utilizan en el anlisis
Cuando ya se han realizado todas las posibles comparaciones, se de regresin bajo las dos condiciones siguientes:
elige la ecuacin que tenga el mayor R2. Con el nuevo modelo de
regresin se realizan comparaciones, continuando con el proceso hasta a.- Las observaciones originales pueden ser agrupadas en clases o
que no se consiga un cambio de modelo de regresin que permita grupos de tipo cualitativo.
aumentar el Coeficiente de Determinacin. En este paso se ha logrado b.- El efecto de la agrupacin es alterar la ordenada al origen sin
seleccionar el mejor modelo de dos variables. alterar la pendiente.
El paso siguiente es agiegar una tercera variable realizando el Si los datos originales puede separarse en dos o ms grupos
mismo procedimiento descrito anteriormente, se obtiene el mejor significativos habra que estudiar los efectos de estos grupos, si el
modelo de 3 variables. Luego se selecciona el de cuatro variables de la efecto es solo alterar la ordenada al origen de la ecuacin (coeficiente
misma forma, hasta el de "k" variables. Este procedimiento difiere de posicional) se puede sin usar riesgo variables ficticias.
los mtodos vistos anteriormente (seleccin por pasos) en el sentido
que los cambios de las ecuaciones son evaluados antes de seleccionar El uso de variables falsas en regresin mltiple
uno en particular. Las variables regresoras que forman parte de una ecuacin de
regresin mltiple generalmente toman valores en un rango continuo,
Mtodo del mnimo coeficiente de determinacin sin embargo, algunas veces es necesario introducir en el modelo de
regresin variables medidas en escala nominal u ordinal con dos o
Este procedim-iento es similar al anterior, la diferencia consiste ms niveles distintos. En tales casos no se puede utilizar una escala
en que al producirse los cambios de la ecuacin de regresin, se continua en los datos debido a su naturaleza y escala de medida. Un
realiza el cambio de modelo que se produce al menor incremento en el ejemplo de sto, pudiera ser, el investigador en mango que tenga tres
valor de R2. variedades del cultivo y quiera establecer una ecuacin de regresin
entre las variedades y el rendimiento. El investigador puede asignarle
Procesamiento electrnico a la variable variedad niveles en un determinado orden de tal manera
El programa SAS emplea el procesamiento Paso a Paso que se pueda separar la respuesta de cada uno. Estas variables son
.(Stepwise) con las opciones Forward, Backward, Stepwise, Maxr y llamadas variables falsas .
Minr, que permite la aplicacin de estos mtodos. Uno de los ejemplos clsicos de variables falsas se puede
encontrar en el uso de la variable Xo que siempre toma el valor uno,
Variables Dummy o falsas: para poder estimar el intercepto en un modelo de regresin mltiple.
Otro ejemplo del uso de variables falsas se puede observar en los
Faber (1971), citado por Chacn (1988), expresa que las mtodos de regresin para problemas de anlisis de varianza.
variables falsas son un mtodo para cuantificar caractersticas de tipo
Variables falsas en un grupo de datos
cualitativo (que son susceptibles de ser cuantificadas) o que presentan
la conveniencia de separar en categorias discretas, el procedimiento Supongamos que el investigador en mango tenga dos variedades
necesita la construccin de variables separadas en categorias (Ay B) que producen diferentes niveles de rendimiento en adicin a la
relevantes a las caractersticas en estudio, donde a esta variable se le variacin que ocurre debido a otras variables. Una de las soluciones
asigna un cierto valor si la observacin posee ese atributo y otro valor es agregar el modelo la variable falsa "z" y su coeficiente de regresin
(a) de tal manera que el modelo original debe agregrsele el trmino
(aZ). El coeficiente a puede ser estimado al mismo tiempo que los
ChacnI Anlisisde Regresiny Superficiesde Respuesta 141
140 Chacn I Anlisisde Reqresin y Superficiesde Respuesta
(ZI, Z2)= l
(-n
3
~nln3(nl + n3)
,O
)
para Variedad A
Muchos autores expresan en que antes de usar el modelo para
cualquier fin, se deberan realizar algunos chequeos a objeto de
probar la validez del mismo. En muchas instancias los anlisis
reportados no mencionan como, o si el modelo fue validado.
(Zl, Z2)= (O, -
n3) para Variedad B Es conveniente sealar que existe una diferencia considerable
~n2n3(n2+ n3) entre validar un modelo con datos provenientes de un diseo
(Z1,Z2)= l(n 1
~nln3(nl+n3)
, 2
n)
~n2n3(n2+n3)
para Variedad C
experimental y validar un modelo de datos colectados sin el apoyo de
dicho diseo. En un diseo experimental todas las variables se
suponen constantes, excepto aquellas a evaluar dentro del diseo; en
Donde m, nz y na son las observaciones correspondientes de las otras palabras los efectos externos son usualmente esperados y se
variedades A, B, y C. provee mtodos analticos para medir las respuestas. Los datos son
generalmente de buena calidad (si tiene pequeos errores expe-
rimentales) en comparacin a los datos que no provienen de los
diseos.
ChacnI Anlisisde Regresiny Superficiesde Respuesta 141
140 Chacn I Anlisisde Reqresin y Superficiesde Respuesta
(ZI, Z2)= l
(-n
3
~nln3(nl + n3)
,O
)
para Variedad A
Muchos autores expresan en que antes de usar el modelo para
cualquier fin, se deberan realizar algunos chequeos a objeto de
probar la validez del mismo. En muchas instancias los anlisis
reportados no mencionan como, o si el modelo fue validado.
(Zl, Z2)= (O, -
n3) para Variedad B Es conveniente sealar que existe una diferencia considerable
~n2n3(n2+ n3) entre validar un modelo con datos provenientes de un diseo
(Z1,Z2)= l(n 1
~nln3(nl+n3)
, 2
n)
~n2n3(n2+n3)
para Variedad C
experimental y validar un modelo de datos colectados sin el apoyo de
dicho diseo. En un diseo experimental todas las variables se
suponen constantes, excepto aquellas a evaluar dentro del diseo; en
Donde m, nz y na son las observaciones correspondientes de las otras palabras los efectos externos son usualmente esperados y se
variedades A, B, y C. provee mtodos analticos para medir las respuestas. Los datos son
generalmente de buena calidad (si tiene pequeos errores expe-
rimentales) en comparacin a los datos que no provienen de los
diseos.
142 ChacnI Anlisisde Regresiny Superficiesde Respuesta 143
ChacnI Anlisisde Regresiny Superficiesde Respuesta
Recoleccin de datos nuevos desarrollados para los datos simulados, a modo de incrementar
La recoleccin de datos nuevos, los cuales se comparn con las nuestra confianza en el modelo emprico.
predicciones del modelo es un buen mtodo de validacin. La validez
Validacin cruzada
de los supuestos matemticos usados en el desarrollo de un modelo y
en la estimacin de los coeficientes son menos discutibles si el modelo De los tres mtodos discutidos anteriormente, la recoleccin de
provee predicciones precisas con los datos nuevos. En efecto, la datos nuevos es el ms usual de los mtodos de validacin. En muchas
coleccin de datos nuevos provee un chequeo que abarca todo el situaciones prcticas la aplicacin de. este mtodo no es posible, en
proceso de construccin del modelo. este caso un procedimiento que simule la recoleccin de datos nuevos
se hace necesario. Una manera de proceder muy razonable, consiste
El procedimiento se basa en buscar las desviaciones entre los
en dividir a los datos en dos sub-conjuntos: el primer sub-conjunto
valores observados de la respuesta con datos nuevos y los valores de
llamado datos de estimac~n se usa para estimar los coefici~nt~,sdel
la respuesta estimada con el modelo. Si estas desviaciones caen
modelo. El segundo sub-conjunto denominado datos de prediccin se
dentro del error experimental, se considera validado el modelo. La
utiliza para medir la precisin de la prediccin del modelo.
afirmacin anterior se utiliza cuando los datos proviene de un diseo
experimental, en caso contrario habr que buscar otra prueba Snee (1971), considera que los sub-conjuntos de datos deberan
estadstica para analizar las desviaciones, como el caso de la prueba tener el mismo tamao (mitad y mitad). La validacin cruzada provee
de X2 un sub-conjunto de datos que mide la precisin de la prediccin y
simula una replicacin total o parcial del estudio. Existe un mtodo
La ventaja de usar el diseo experimental para generar datos es
denominado "Mtodo Duplex", que permite lograr una divisin de los
que se tiene la oportunidad de incluir un grupo de puntos de chequeo
datos y obtener los dos sub-conjuntos (Cruz y Chacn, 1986).
como parte de la planificacin experimental, puntos que
evidentemente sern los de mayor inters para el investigador. Stone (1974), considera que los datos son colectados secuencial-
mente en el tiempo, entonces, es razonable partir en un punto de
Otra posibilidad, consiste en incluir un grupo de puntos los
tiempo que divida los datos en los sub-conjuntos de estimacin y
cuales deben de estar uniformemente distribuidos en la. regin
prediccin respectivamente. Por ejemplo Cady y Allen (1972), usaron
experimental. La teora del chequeo de puntos uniformemente
el algoritmo, PRESS para desarrollar una ecuacin de prediccin en
distribuidos asociados con el diseo puede ser revisada en Kennard y
maz para cuatro aos de datos. Los datos de los tres primeros aos
Stone (1969) citado por Draper (1981).
fueron usados como datos de estimacin, y los datos del ltimo ao
Comparacin de los resultados con la teora y datos simulados como datos de prediccin.
En algunos casos existe suficiente informacin que nos permite La gran ventaja el mtodo de validacin cruzada, es que los
conocer si el modelo construido es el ms preciso. El uso de la teora modelos se pueden comparar con respecto a la bondad de ajuste de lo.s
nos dar informacin de la direccin y de la magnitud relativa de los datos y con respecto a la precisin de la prediccin.
efectos. En algunos casos un modelo terico puede existir, pero puede Draper y Smith (1966), discuten una variacin interesante al
ser muy complicado para usos prcticos, o puede ignorar usar la variable tiempo para separar sub-conjuntos de datos. En el
complejidades presentes en la realidad experimental. Cuando es caso de cuatro aos de datos, ellos recomiendan que el modelo sea
procedente, la teora se puede usar para chequear la precisin de un fijado para cada ao de datos en forma separada, y los coefic~entes
modelo emprico, en otras palabras fijar una ecuacin para simular sean estimados por estabilizacin. La consistencia de los coeficientes
datos desarrollados de un modelo terico. ao tras ao sugiere que el modelo es bastante bueno. Este chequeo se
El basamento fundamental de este procedimiento es que los realiza si la correlacin entre las variables predictoras son pequeas,
coeficientes de regresin obtenidos a partir de los datos observados luego si las correlaciones son grandes y consistentes aos tras ao, el
estn en general en armona con los coeficientes de regresin
144 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 145
Recoleccin de datos nuevos desarrollados para los datos simulados, a modo de incrementar
La recoleccin de datos nuevos, los cuales se comparn con las nuestra confianza en el modelo emprico.
predicciones del modelo es un buen mtodo de validacin. La validez
Validacin cruzada
de los supuestos matemticos usados en el desarrollo de un modelo y
en la estimacin de los coeficientes son menos discutibles si el modelo De los tres mtodos discutidos anteriormente, la recoleccin de
provee predicciones precisas con los datos nuevos. En efecto, la datos nuevos es el ms usual de los mtodos de validacin. En muchas
coleccin de datos nuevos provee un chequeo que abarca todo el situaciones prcticas la aplicacin de. este mtodo no es posible, en
proceso de construccin del modelo. este caso un procedimiento que simule la recoleccin de datos nuevos
se hace necesario. Una manera de proceder muy razonable, consiste
El procedimiento se basa en buscar las desviaciones entre los
en dividir a los datos en dos sub-conjuntos: el primer sub-conjunto
valores observados de la respuesta con datos nuevos y los valores de
llamado datos de estimac~n se usa para estimar los coefici~nt~,sdel
la respuesta estimada con el modelo. Si estas desviaciones caen
modelo. El segundo sub-conjunto denominado datos de prediccin se
dentro del error experimental, se considera validado el modelo. La
utiliza para medir la precisin de la prediccin del modelo.
afirmacin anterior se utiliza cuando los datos proviene de un diseo
experimental, en caso contrario habr que buscar otra prueba Snee (1971), considera que los sub-conjuntos de datos deberan
estadstica para analizar las desviaciones, como el caso de la prueba tener el mismo tamao (mitad y mitad). La validacin cruzada provee
de X2 un sub-conjunto de datos que mide la precisin de la prediccin y
simula una replicacin total o parcial del estudio. Existe un mtodo
La ventaja de usar el diseo experimental para generar datos es
denominado "Mtodo Duplex", que permite lograr una divisin de los
que se tiene la oportunidad de incluir un grupo de puntos de chequeo
datos y obtener los dos sub-conjuntos (Cruz y Chacn, 1986).
como parte de la planificacin experimental, puntos que
evidentemente sern los de mayor inters para el investigador. Stone (1974), considera que los datos son colectados secuencial-
mente en el tiempo, entonces, es razonable partir en un punto de
Otra posibilidad, consiste en incluir un grupo de puntos los
tiempo que divida los datos en los sub-conjuntos de estimacin y
cuales deben de estar uniformemente distribuidos en la. regin
prediccin respectivamente. Por ejemplo Cady y Allen (1972), usaron
experimental. La teora del chequeo de puntos uniformemente
el algoritmo, PRESS para desarrollar una ecuacin de prediccin en
distribuidos asociados con el diseo puede ser revisada en Kennard y
maz para cuatro aos de datos. Los datos de los tres primeros aos
Stone (1969) citado por Draper (1981).
fueron usados como datos de estimacin, y los datos del ltimo ao
Comparacin de los resultados con la teora y datos simulados como datos de prediccin.
En algunos casos existe suficiente informacin que nos permite La gran ventaja el mtodo de validacin cruzada, es que los
conocer si el modelo construido es el ms preciso. El uso de la teora modelos se pueden comparar con respecto a la bondad de ajuste de lo.s
nos dar informacin de la direccin y de la magnitud relativa de los datos y con respecto a la precisin de la prediccin.
efectos. En algunos casos un modelo terico puede existir, pero puede Draper y Smith (1966), discuten una variacin interesante al
ser muy complicado para usos prcticos, o puede ignorar usar la variable tiempo para separar sub-conjuntos de datos. En el
complejidades presentes en la realidad experimental. Cuando es caso de cuatro aos de datos, ellos recomiendan que el modelo sea
procedente, la teora se puede usar para chequear la precisin de un fijado para cada ao de datos en forma separada, y los coefic~entes
modelo emprico, en otras palabras fijar una ecuacin para simular sean estimados por estabilizacin. La consistencia de los coeficientes
datos desarrollados de un modelo terico. ao tras ao sugiere que el modelo es bastante bueno. Este chequeo se
El basamento fundamental de este procedimiento es que los realiza si la correlacin entre las variables predictoras son pequeas,
coeficientes de regresin obtenidos a partir de los datos observados luego si las correlaciones son grandes y consistentes aos tras ao, el
estn en general en armona con los coeficientes de regresin
Chacn I Anlisis de Regresin y Superficies de Respuesta 147
146 Chacn I Anlisis de Regresin y Superficies de Respuesta
b.- Registro incorrecto de los datos. 3.- Grficos de residuales contra valores predichos tales como se
muestran a continuacin:
C.- Defectos en los instrumentos de medida.
d.- Fallas en los supuestos (que es una de la ms comunes).
b.- Registro incorrecto de los datos. 3.- Grficos de residuales contra valores predichos tales como se
muestran a continuacin:
C.- Defectos en los instrumentos de medida.
d.- Fallas en los supuestos (que es una de la ms comunes).
1 73 :\ \ \ \ RESID
O 74
1 75 :\ \ \ \ 5 A A A AAA
1 76 \ :\ \ \ A A
1 77 \ \ :\ \
A AA AAA B e
O 78
A ABAA AA
A A A AA AA
O 79
1 80 \\\\\ . A A A A A
O 81
A
2 82 \\\\\\\\\:
A
O 83
2 84 \\\\\\\\\\.
1 85 \ \ \ \ \ A
8 86 \ \ \ \ \ \ \ \ : \ \ \ \ \ \ \ \"\,\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \
2 87 \\\\\\\:\\
.3 88 \\\\\:\\\\\\\\\ 70 72 74 76 78 80 82 84
O' 89
o 2 4 6 8
Figura 4.8. Grfico de referencia para detectar valores atpicos Figura 4.10. Grficos de residuales contra valores predichos
84
Existen pruebas estadsticas que ayudan a confirmar o que
sirven para detectar outliers, si stos no son fcilmente visibles por
tcnicas grficas; ya que exhiben modestas desviaciones de la lnea de
72
ajuste. Entre ellas estn:
1 73 :\ \ \ \ RESID
O 74
1 75 :\ \ \ \ 5 A A A AAA
1 76 \ :\ \ \ A A
1 77 \ \ :\ \
A AA AAA B e
O 78
A ABAA AA
A A A AA AA
O 79
1 80 \\\\\ . A A A A A
O 81
A
2 82 \\\\\\\\\:
A
O 83
2 84 \\\\\\\\\\.
1 85 \ \ \ \ \ A
8 86 \ \ \ \ \ \ \ \ : \ \ \ \ \ \ \ \"\,\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \
2 87 \\\\\\\:\\
.3 88 \\\\\:\\\\\\\\\ 70 72 74 76 78 80 82 84
O' 89
o 2 4 6 8
Figura 4.8. Grfico de referencia para detectar valores atpicos Figura 4.10. Grficos de residuales contra valores predichos
84
Existen pruebas estadsticas que ayudan a confirmar o que
sirven para detectar outliers, si stos no son fcilmente visibles por
tcnicas grficas; ya que exhiben modestas desviaciones de la lnea de
72
ajuste. Entre ellas estn:
2. a.- Si los k valores mayores son sospechosos, se calcula es como outliers es igual al nivel de significacin utilizado; debe usarse
estadstico Lk: un nivel de Significacin de 0,01 o menor. Ambas pruebas asumen
distribucin normal de los errores.
(4.73)
Definicin de residual
~ - 2
donde: Syy = (Y- Y) (4.74) Segn el modelo general de regresin se tiene:
1
y = X~ + E (4.79)
y (4.75)
YL = (n- k) Y con las condiciones sobre el vector de E (vector de errores):
b.- Si los k valores menores son sospechosos, se calcula el E (E) = O, Varts) = cr21
estadstico Sk:
Puesto que los errores son no observables se consideran los
residuales "e" como:
S k =-
S
1 (Y-Y) 1 S
2
(4.76)
yy e = y - Y (4.80)
3. Se concluye que las k observaciones son outliers, si el valor al aplicar el mtodo se obtiene:
calculado de Lk o Sk es menor que el mostrado en la tabla
elaborada para la prueba. X'X = X'Xp
4. En caso que existan simultneamente valores extremos grandes
y pequeos sospechosos, puede calcularse el estadstico Ek: por lo tanto:
Ek =-
S
1 (Z.-Z) 1 e
2
(4.78)
yy
Sustituyendo en (4.81):
donde: Zi son las desviaciones absolutas ( I Yi - Y I )ms pequeas, no
outliers y Ze es el valor medio de ellas (Ze = IZi / n-k). y=x(x'xt1X'y
Se concluye que las observaciones sospechosas son outliers si el a la matriz X(X'X)lX' se la llamar V, entonces al sustituir en (4.80)
A
2. a.- Si los k valores mayores son sospechosos, se calcula es como outliers es igual al nivel de significacin utilizado; debe usarse
estadstico Lk: un nivel de Significacin de 0,01 o menor. Ambas pruebas asumen
distribucin normal de los errores.
(4.73)
Definicin de residual
~ - 2
donde: Syy = (Y- Y) (4.74) Segn el modelo general de regresin se tiene:
1
y = X~ + E (4.79)
y (4.75)
YL = (n- k) Y con las condiciones sobre el vector de E (vector de errores):
b.- Si los k valores menores son sospechosos, se calcula el E (E) = O, Varts) = cr21
estadstico Sk:
Puesto que los errores son no observables se consideran los
residuales "e" como:
S k =-
S
1 (Y-Y) 1 S
2
(4.76)
yy e = y - Y (4.80)
3. Se concluye que las k observaciones son outliers, si el valor al aplicar el mtodo se obtiene:
calculado de Lk o Sk es menor que el mostrado en la tabla
elaborada para la prueba. X'X = X'Xp
4. En caso que existan simultneamente valores extremos grandes
y pequeos sospechosos, puede calcularse el estadstico Ek: por lo tanto:
Ek =-
S
1 (Z.-Z) 1 e
2
(4.78)
yy
Sustituyendo en (4.81):
donde: Zi son las desviaciones absolutas ( I Yi - Y I )ms pequeas, no
outliers y Ze es el valor medio de ellas (Ze = IZi / n-k). y=x(x'xt1X'y
Se concluye que las observaciones sospechosas son outliers si el a la matriz X(X'X)lX' se la llamar V, entonces al sustituir en (4.80)
A
Y=VY
Para un modelo de regresin simple (Yi = ~o + ~lXi + ei) el
trmino Vii viene a ser:
La matriz V tiene la caracterstica de ser simtrica (V' = V) e
dempotente (V2 = V) y se dice que "proyecta" cualquier vector sobre el
espacio columna de X. Esta matriz puede separarse como la suma de (4.87)
dos matrices, siguiendo el siguiente procedimiento.
rango q y sea U = Xl(X~Xlrlx~ la matriz de proyeccin para el La importancia de este Vu radica en las siguientes relaciones
para la varianza y esperanza de er; partiendo de (4.83)
espacio columna de Xi, y sea X; el componente de X2 ortogonal a Xi, se tiene:
es decir, si UX2 es la proyeccin de X2 en el espacio generado por las
columnas de Xi, entonces:
1
vn1]le e2
Vn2 ]
Y=VY
Para un modelo de regresin simple (Yi = ~o + ~lXi + ei) el
trmino Vii viene a ser:
La matriz V tiene la caracterstica de ser simtrica (V' = V) e
dempotente (V2 = V) y se dice que "proyecta" cualquier vector sobre el
espacio columna de X. Esta matriz puede separarse como la suma de (4.87)
dos matrices, siguiendo el siguiente procedimiento.
rango q y sea U = Xl(X~Xlrlx~ la matriz de proyeccin para el La importancia de este Vu radica en las siguientes relaciones
para la varianza y esperanza de er; partiendo de (4.83)
espacio columna de Xi, y sea X; el componente de X2 ortogonal a Xi, se tiene:
es decir, si UX2 es la proyeccin de X2 en el espacio generado por las
columnas de Xi, entonces:
1
vn1]le e2
Vn2 ]
E(e) = E (E) -
n
IVijE(E j )=0
Por otra parte, si el modelo es correcto pero Var ( E) cr2 Wl=
j=1
donde W es una matriz desconocida positiva definida y simtrica;
entonces, si se fija el .mcdelo bajo la creencia de que V(E) = cr2l
E(e) = O
entonces E(e) = O pero las varianzas de e estarn dadas por:
Por una deduccin similar la varianza de los e ser:
Por (4.83) V(e) = Var [(I-V) El Var(e) = cr2 (I_V)Wl(I_V)
-V(e) = (I-V) , V(E) (I-V) Dependiendo de Wl las verdaderas varianzas de los residuales
V(e) = (l-V) cr (l-V)
2 podran ser diferentes a cr2 (1 - Vu), y deberan obtenerse siguiendo
un modelo de mnimos cuadrados ponderados.
V(e) = (I-V) (I-V) cr2
V(e) = (I-V) cr2
E(e) = E (E) -
n
IVijE(E j )=0
Por otra parte, si el modelo es correcto pero Var ( E) cr2 Wl=
j=1
donde W es una matriz desconocida positiva definida y simtrica;
entonces, si se fija el .mcdelo bajo la creencia de que V(E) = cr2l
E(e) = O
entonces E(e) = O pero las varianzas de e estarn dadas por:
Por una deduccin similar la varianza de los e ser:
Por (4.83) V(e) = Var [(I-V) El Var(e) = cr2 (I_V)Wl(I_V)
-V(e) = (I-V) , V(E) (I-V) Dependiendo de Wl las verdaderas varianzas de los residuales
V(e) = (l-V) cr (l-V)
2 podran ser diferentes a cr2 (1 - Vu), y deberan obtenerse siguiendo
un modelo de mnimos cuadrados ponderados.
V(e) = (I-V) (I-V) cr2
V(e) = (I-V) cr2
se tiene que: en esta frmula ei y s son estimadores de los mismo datos y son
dependientes, por el contrario, en los internamente estudentizados el
Var(e1)=cr
2
(l-Vll
{
l+(l-Vll
{1-~JJ
W II (4.91)
S2 es independiente de ei y la estimacin de S2 sin considerar el
residual "i" viene a ser:
2 n- p' 2
(4.92)
s(i) = ,s - p' = p+1
n-p-1 (n-p'-l)(l- Vii)
trmino Wl, sin embargo, si P~j es grande hay que considerar el el cual sigue distribucin "t" con (n-p' -1) grados de libertad.
efecto de W 1 sobre los otros residuales. Si W 1 es pequeo, la varianza La relacin entre ti y n se halla sustituyendo (4.93) en (4.94).
de los errores se ve inflada. .
n-p'-l] (4.95)
t=r. ,2
1 1 ( n-p=r,
Tipos de residuales
Adems de los residuales estudiados se puede considerar otras Tambin se pueden considerar los "residuos predichos" los
transformaciones sobre stos, para ello se considerar la estimacin cuales se basan en el ajuste de los datos cuando el caso" i " es
cr2 a travs de los residuales: excluido:
n n ' A
(n- p)
~
n-p
(e~Ie;ln=o]
1=1
distribucin normal estandarizada, sto es ~ - N(O, 1). en donde ~(i) es el vector de parmetros estimados por mnimos
o cuadrados sin considerar el caso (i), La relacin entre e(i) y ei viene a
Otro tipo de residuales "estandarizados" son los que pueden ser:
serlo interna o, externamente. Los residuales internamente
estudentizados se definen como:
se tiene que: en esta frmula ei y s son estimadores de los mismo datos y son
dependientes, por el contrario, en los internamente estudentizados el
Var(e1)=cr
2
(l-Vll
{
l+(l-Vll
{1-~JJ
W II (4.91)
S2 es independiente de ei y la estimacin de S2 sin considerar el
residual "i" viene a ser:
2 n- p' 2
(4.92)
s(i) = ,s - p' = p+1
n-p-1 (n-p'-l)(l- Vii)
trmino Wl, sin embargo, si P~j es grande hay que considerar el el cual sigue distribucin "t" con (n-p' -1) grados de libertad.
efecto de W 1 sobre los otros residuales. Si W 1 es pequeo, la varianza La relacin entre ti y n se halla sustituyendo (4.93) en (4.94).
de los errores se ve inflada. .
n-p'-l] (4.95)
t=r. ,2
1 1 ( n-p=r,
Tipos de residuales
Adems de los residuales estudiados se puede considerar otras Tambin se pueden considerar los "residuos predichos" los
transformaciones sobre stos, para ello se considerar la estimacin cuales se basan en el ajuste de los datos cuando el caso" i " es
cr2 a travs de los residuales: excluido:
n n ' A
(n- p)
~
n-p
(e~Ie;ln=o]
1=1
distribucin normal estandarizada, sto es ~ - N(O, 1). en donde ~(i) es el vector de parmetros estimados por mnimos
o cuadrados sin considerar el caso (i), La relacin entre e(i) y ei viene a
Otro tipo de residuales "estandarizados" son los que pueden ser:
serlo interna o, externamente. Los residuales internamente
estudentizados se definen como:
De esta manera:
Se tienen, luego, los residuales "no correlacionados", los cuales
son producto de una transformacin lineal en los valores de 'Y'
observados tal que:
(4.98)
e=C'Y A I 1 t
para k = 1,2,... ,p
=
e =
kY -x, P -
k1
--r============== k=p+1,p+2, ... n
1
~1+X'k(X'k_lXk_lrl x, - -(X'xt
1 '
X.X.(X'xt
1
Xy
'
1-V I~I
en donde Pk-1 y Xk_1 son calculados utilizando los primeros k-1
11 Vii
X'Xp = X'Y = ~_
~ [ (xx): 1 Xi 'J(Y-V ..Y-Y.+V ..Y]
1 11 1 1 11 1
1- v.
Se transforma en:
(4.97)
= ~~- --1- 1V.. [(X'X)-1'X J ( Y 1 I
~) = 13-
- Y. ~ -- 1
1 1- V
(X'X)-1X.e.
'
1 1
11
Chacn I Anlisis de Regresin y Superficies de Respuesta 159
158 Chacn I Anlisis de Regresin y Superficies de Respuesta
De esta manera:
Se tienen, luego, los residuales "no correlacionados", los cuales
son producto de una transformacin lineal en los valores de 'Y'
observados tal que:
(4.98)
e=C'Y A I 1 t
para k = 1,2,... ,p
=
e =
kY -x, P -
k1
--r============== k=p+1,p+2, ... n
1
~1+X'k(X'k_lXk_lrl x, - -(X'xt
1 '
X.X.(X'xt
1
Xy
'
1-V I~I
en donde Pk-1 y Xk_1 son calculados utilizando los primeros k-1
11 Vii
X'Xp = X'Y = ~_
~ [ (xx): 1 Xi 'J(Y-V ..Y-Y.+V ..Y]
1 11 1 1 11 1
1- v.
Se transforma en:
(4.97)
= ~~- --1- 1V.. [(X'X)-1'X J ( Y 1 I
~) = 13-
- Y. ~ -- 1
1 1- V
(X'X)-1X.e.
'
1 1
11
160 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 161
e.e.
1 1
(4.101)
DFBeta =
1- Vii
p= ey
del "punto" P - P(i) en un espacio n dimensional, entonces:
(4.105)
y el DFBeta estandarizado ser:
Sustituyendo por DFBeta:
e
1
(4.102)
"- (4.106)
y se obtiene se tiene el DFFits (Desvo de ajuste de Y). Para
estandarizar este valor se utilizar el siguiente desarrollo:
Esta expresion de la Distancia de Cook usa el residual
estudentizado externamente.
de aqu se deduce que:
(4.103)
160 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 161
e.e.
1 1
(4.101)
DFBeta =
1- Vii
p= ey
del "punto" P - P(i) en un espacio n dimensional, entonces:
(4.105)
y el DFBeta estandarizado ser:
Sustituyendo por DFBeta:
e
1
(4.102)
"- (4.106)
y se obtiene se tiene el DFFits (Desvo de ajuste de Y). Para
estandarizar este valor se utilizar el siguiente desarrollo:
Esta expresion de la Distancia de Cook usa el residual
estudentizado externamente.
de aqu se deduce que:
(4.103)
ChacnI Anlisisde Regresiny Superficiesde Respuesta 163
162 Chacn I Anlisisde Regresiny Superficiesde Respuesta
Observacin Xl X2 Xs Y
Segn caractersticas estudiadas de la matriz V se tiene: 1 1,5 6,0 1315 243 243
O < v < 1 L vf = v, 2 1,5 6,0 1315 261 261
r0l) = tr0l) = LVii = p' 3 1,5 9,0 1890 244 244
i = 1,2, ..., n- 4 1,5 9,0 1890 285 285
j = 1,2, ..., n- 5 2,0 7,5 1575 202 202
De aqu que se debe prestar atencin a las observaciones con 6 2,0 7,5 1575 180 180
valor de Vu ~ Y2 pues indica que tendr mucha influencia en ei.
7 2,0 7,5 1575 183 183
Con respecto al DFBeta, si el valor de ste es mayor que (4/n)1I2, 8 2,0 7,5 1575 207 207
la estimacin est sufriendo alteraciones significativas.
9 2,5 9,0 1315 216 216
Para el DFFits el valor crtico est en 2(p'/n)1I2y para el D() de
10 2,5 9,0 1315 160 160
Cook es aproximadamente D() ~ Fr/2; p; n-p), observaciones que
superan estos valores crticos deben ser analizados como posibles 11 2,5 6,0 1890 104 104
"outliers" .
12 2,5 6,0 1890 110 110
Fuente: Clculos propios
Ejemplo ilustrativo del anlisis de residuales
Observacin Xl X2 Xs Y
Segn caractersticas estudiadas de la matriz V se tiene: 1 1,5 6,0 1315 243 243
O < v < 1 L vf = v, 2 1,5 6,0 1315 261 261
r0l) = tr0l) = LVii = p' 3 1,5 9,0 1890 244 244
i = 1,2, ..., n- 4 1,5 9,0 1890 285 285
j = 1,2, ..., n- 5 2,0 7,5 1575 202 202
De aqu que se debe prestar atencin a las observaciones con 6 2,0 7,5 1575 180 180
valor de Vu ~ Y2 pues indica que tendr mucha influencia en ei.
7 2,0 7,5 1575 183 183
Con respecto al DFBeta, si el valor de ste es mayor que (4/n)1I2, 8 2,0 7,5 1575 207 207
la estimacin est sufriendo alteraciones significativas.
9 2,5 9,0 1315 216 216
Para el DFFits el valor crtico est en 2(p'/n)1I2y para el D() de
10 2,5 9,0 1315 160 160
Cook es aproximadamente D() ~ Fr/2; p; n-p), observaciones que
superan estos valores crticos deben ser analizados como posibles 11 2,5 6,0 1890 104 104
"outliers" .
12 2,5 6,0 1890 110 110
Fuente: Clculos propios
Ejemplo ilustrativo del anlisis de residuales
Tabla 4.2. Residuales y estadsticos usados para anlisis de Es indispensable precisar con exactitud los objetivos del trabajo
re siduale s y delimitar la naturaleza del modelo a plantear.
Tabla 4.2. Residuales y estadsticos usados para anlisis de Es indispensable precisar con exactitud los objetivos del trabajo
re siduale s y delimitar la naturaleza del modelo a plantear.
el problema. Discusiones posteriores con los especialistas reducir Si el proyecto, tal como est planteado, es aceptable se pasa a la
una lista muy extensa a un nmero ms razonable. fase de desarrollo del modelo.
el problema. Discusiones posteriores con los especialistas reducir Si el proyecto, tal como est planteado, es aceptable se pasa a la
una lista muy extensa a un nmero ms razonable. fase de desarrollo del modelo.
un anlisis de los coeficientes de regresin. Se debe considerar si expresin de ~~)' el vector de coeficientes de regresin obtenido al
son estables, y si sus signos y magnitudes son razonables.
eliminar la observacin "i":
Coeficientes con signos no esperados, o que son demasiado
grandes en valor absoluto indican, ocasionalmente, que fueron
pobre o equivocadamente estimados. Los V.I.F. son una gua
apropiada en este sentido.
b. La recoleccin de datos nuevos es el mtodo ms efectivo para en donde X(i)y Y(i) son los vectores X e Y con la observacin "i"
validar un modelo de regresin. Si el modelo da predicciones eliminada. De esta manera, el residual vendr expresado como:
precisas de los datos nuevos se puede tener confianza del modelo
y del proceso empleado para construirlo. Se requieren de 15 a 20
nuevas observaciones para obtener una validacin confiable.
c. No siempre se pueden colectar datos nuevos debido a falta de
presupuesto, cambios radicales en las condiciones de campo o =Y-X~(i) (4.108)
laboratorio, y otra razones. En estos casos, lo ms conveniente es
dividir el conjunto de datos en dos grupos, uno para construir el
modelo de regresin (datos para estimacin) y el otro para validar
(datos para prediccin). Este sistema se le denomina "validacin
cruzada". ya se ha demostrado que:
Este procedimiento puede ser realizado en una diversidad de
formas. Una de stas es por medio del estadstico PRESS (Suma de
cuadrados del Error de Prediccin). (4.109)
Presa (4.107)
un anlisis de los coeficientes de regresin. Se debe considerar si expresin de ~~)' el vector de coeficientes de regresin obtenido al
son estables, y si sus signos y magnitudes son razonables.
eliminar la observacin "i":
Coeficientes con signos no esperados, o que son demasiado
grandes en valor absoluto indican, ocasionalmente, que fueron
pobre o equivocadamente estimados. Los V.I.F. son una gua
apropiada en este sentido.
b. La recoleccin de datos nuevos es el mtodo ms efectivo para en donde X(i)y Y(i) son los vectores X e Y con la observacin "i"
validar un modelo de regresin. Si el modelo da predicciones eliminada. De esta manera, el residual vendr expresado como:
precisas de los datos nuevos se puede tener confianza del modelo
y del proceso empleado para construirlo. Se requieren de 15 a 20
nuevas observaciones para obtener una validacin confiable.
c. No siempre se pueden colectar datos nuevos debido a falta de
presupuesto, cambios radicales en las condiciones de campo o =Y-X~(i) (4.108)
laboratorio, y otra razones. En estos casos, lo ms conveniente es
dividir el conjunto de datos en dos grupos, uno para construir el
modelo de regresin (datos para estimacin) y el otro para validar
(datos para prediccin). Este sistema se le denomina "validacin
cruzada". ya se ha demostrado que:
Este procedimiento puede ser realizado en una diversidad de
formas. Una de stas es por medio del estadstico PRESS (Suma de
cuadrados del Error de Prediccin). (4.109)
Presa (4.107)
utilizar mtodos arbitrarios para dividir los datos, ya que si los datos
Dado que por la definicin X'Y = X~i)Y(i) + X; Y i se tiene que: utilizados para validar se ubican dentro del intervalo de los datos
para estimacin. no se puede conocer el valor predictivo del modelo.
(1-V..)V.-X.
11 1 1
y]
(X'X)-l [X'Y-X~ 1 1
Se ha desarrollado el algoritmo Duplex como metodologa formal
1-Vii para realizar eficientemente la divisin de los datos. Para su
aplicacin primero se tiene las "n" observaciones transformadas de la
siguiente manera:
i 1,2...p
1-Vii
(4.110)
En donde L..J
" (Xij - -2
X) es la suma corregida del
i=1
regresor j, por lo tanto. se estn normalizado los valores de las
Y-X.
1
Po
1 .. variables regresoras, luego la matriz Z'Z se "ortonormaliza" con una
factorizacin como:
i-v,
Z'Z = T'T
Ntese que el numerador de la expresin (4.110) es el residual
en donde T es una matriz nica h x h triangular superior se hace la
ordinario ei, por lo tanto:
transformacin:
W ZT-l
(4.111)
resultando un conjunto nuevo de variables que son ortogonales y
tienen varianza uno. Luego se calcula la distancia euclidiana entre los
De esta manera el Press se puede expresar como:
(;) puntos Y los dos ms alejados se colocan en el conjunto
. ( e. )2
n
Press = L ~
1 Vi
1=1 estimacin. y as sucesivamente.
Para medir las propiedades estadsticas de los datos utilizados
Se observa que el Press es una suma ponderada de residuales
para prediccin y estimacin se compara el cociente entre la raz
cuadrticos, en donde se afectan ms a los residuales de las
observaciones ms influyentes.
=
psima ( p nmero de parmetros) de los dos determinantes de las
matrices X'X para los dos conjuntos de datos, Si XE y Xp denotan las
Si se tienen varios modelos cuyo objetivo 'sea la prediccin se matrices de X en los conjuntos de datos de estimacin y prediccin
puede seleccionar aquel cuyo valor de Press sea menor. respectivamente, se tiene entonces:
Si se tienen datos recolectados en una secuencia temporal o
espacial, se pueden utilizar como datos para estimacin los
correspondientes a un mismo intervalo o zona y como datos de
prediccin los de otra poca o regin. Sin embargo, es arriesgado
ChacnI Anlisisde Regresiny Superficiesde Respuesta ChacnI Anlisisde Regresiny Superficiesde Respuesta 171
170
utilizar mtodos arbitrarios para dividir los datos, ya que si los datos
Dado que por la definicin X'Y = X~i)Y(i) + X; Y i se tiene que: utilizados para validar se ubican dentro del intervalo de los datos
para estimacin. no se puede conocer el valor predictivo del modelo.
(1-V..)V.-X.
11 1 1
y]
(X'X)-l [X'Y-X~ 1 1
Se ha desarrollado el algoritmo Duplex como metodologa formal
1-Vii para realizar eficientemente la divisin de los datos. Para su
aplicacin primero se tiene las "n" observaciones transformadas de la
siguiente manera:
i 1,2...p
1-Vii
(4.110)
En donde L..J
" (Xij - -2
X) es la suma corregida del
i=1
regresor j, por lo tanto. se estn normalizado los valores de las
Y-X.
1
Po
1 .. variables regresoras, luego la matriz Z'Z se "ortonormaliza" con una
factorizacin como:
i-v,
Z'Z = T'T
Ntese que el numerador de la expresin (4.110) es el residual
en donde T es una matriz nica h x h triangular superior se hace la
ordinario ei, por lo tanto:
transformacin:
W ZT-l
(4.111)
resultando un conjunto nuevo de variables que son ortogonales y
tienen varianza uno. Luego se calcula la distancia euclidiana entre los
De esta manera el Press se puede expresar como:
(;) puntos Y los dos ms alejados se colocan en el conjunto
. ( e. )2
n
Press = L ~
1 Vi
1=1 estimacin. y as sucesivamente.
Para medir las propiedades estadsticas de los datos utilizados
Se observa que el Press es una suma ponderada de residuales
para prediccin y estimacin se compara el cociente entre la raz
cuadrticos, en donde se afectan ms a los residuales de las
observaciones ms influyentes.
=
psima ( p nmero de parmetros) de los dos determinantes de las
matrices X'X para los dos conjuntos de datos, Si XE y Xp denotan las
Si se tienen varios modelos cuyo objetivo 'sea la prediccin se matrices de X en los conjuntos de datos de estimacin y prediccin
puede seleccionar aquel cuyo valor de Press sea menor. respectivamente, se tiene entonces:
Si se tienen datos recolectados en una secuencia temporal o
espacial, se pueden utilizar como datos para estimacin los
correspondientes a un mismo intervalo o zona y como datos de
prediccin los de otra poca o regin. Sin embargo, es arriesgado
172 ChacnI Anlisisde Regresiny Superficiesde Respuesta ChacnI Anlisisde Regresiny Superficiesde Respuesta 173
Se calcula luego la k-sima raz del determinante del cociente d . Polinomios ortogonales
las matrices X'X para los dos conjuntos de datos, lo cual indica una .
medida relativa de los "volmenes" abarcados por los dos conjuntos de Los polinomios ortogonales constituyen una metodologa
datos. Idealmente debera estar cercano a la unidad. aplicada al anlisis de Regresin Mltiple, a travs del procedimiento
Para aplicar este algoritmo se deben tener las siguientes de Mnimos Cuadrados Ordinarios, cuando la (s) variable(s) inde-
precauciones: pendiente(s) est(n) igualmente espaciada(s). Tales mtodos son
tiles para observaciones de la(s) variable(s) independiente(s) desi-
a. Para tener un nmero razonable de grados de libertad para el gualmente espaciada(s), pero muy dificiles de aplicar y no es expues-
error se debe tener un n ~ 2p + 25 donde p es el n de
to en este trabajo (Kendall y Stuart, 1958; Cox, 1958).
parmetros en el modelo.
. El uso de polinomios ortogonales tiene algunas ventajas sobre
b. El algoritmo Duplex no necesariamente reparte los datos los mtodos directos de regresin. Principalmente, el tiempo de
equitativamente, pero deberan haber ms datos en el conjunto clculo para ajustar' curvas utilizando esta metodologa, es mucho
de estimacin que en el de prediccin; por lo tanto se puede menor. Esta ventaja es ms apreciable cuanto mayor es el grado del
utilizar el algoritmo hasta obtener al menos 15 puntos para polinomio. Por otra parte, los polinomios ortogonales son construidos
prediccin y el resto de los datos se utilizan para construir el de forma tal que cualquier trmino del polinomio del modelo plan-
modelo. teado, es independiente del resto de los trminos. Esta propiedad de
c. Se deben eliminar los datos replicados pues puede darse que los independencia permite que se obtenga un coeficiente de regresin
conjuntos de datos sean demasiado similares. . para cada trmino y pueda ser probada su significacin por separado
en el Anlisis de la Varianza.
En este acapite se plantea el caso en el que se tiene una sola
Falta de ajuste sistemtico observacin de la variable Y para cada valor de la(s) variable(s)
Los residuales deben ser examinados de todas las maneras independiente(s). No obstante puede presentarse el caso en que para
. posibles para determinar si se han omitido variables importantes. un solo valor de la(s) variable(s) independiente (s), se obtenga ms de
una observacin para Y.
Por otra parte, si el modelo va a ser usado por personas no
estadsticas, debe llamarse la atencin hacia el riesgo de hacer
Modelo supuesto cuando utilizamos polinomios ortogonales
extrapolaciones basndose nicamente en cambios en una sola
variable pues puede que haya mucha colinelidad y esta prctica
puede llegar a conclusiones errneas. En estos casos se debe utilizar Supongamos que se asume el siguiente modelo de regresin
el modelo para hacer estimaciones dentro del intervalo de las X polinmico para el caso de una sola variable independiente:
considerado en la construccin del modelo. Yi = ~o + ~lX + ~2X2 + ... + ~qXq + ci (4.112)
Mantenimiento del modelo
Pueden haber cambios en las condiciones originales en donde un
modelo se ha venido utilizando, por lo que una revisin peridica de
las cualidades predictivas del modelo es conveniente.
172 ChacnI Anlisisde Regresiny Superficiesde Respuesta ChacnI Anlisisde Regresiny Superficiesde Respuesta 173
Se calcula luego la k-sima raz del determinante del cociente d . Polinomios ortogonales
las matrices X'X para los dos conjuntos de datos, lo cual indica una .
medida relativa de los "volmenes" abarcados por los dos conjuntos de Los polinomios ortogonales constituyen una metodologa
datos. Idealmente debera estar cercano a la unidad. aplicada al anlisis de Regresin Mltiple, a travs del procedimiento
Para aplicar este algoritmo se deben tener las siguientes de Mnimos Cuadrados Ordinarios, cuando la (s) variable(s) inde-
precauciones: pendiente(s) est(n) igualmente espaciada(s). Tales mtodos son
tiles para observaciones de la(s) variable(s) independiente(s) desi-
a. Para tener un nmero razonable de grados de libertad para el gualmente espaciada(s), pero muy dificiles de aplicar y no es expues-
error se debe tener un n ~ 2p + 25 donde p es el n de
to en este trabajo (Kendall y Stuart, 1958; Cox, 1958).
parmetros en el modelo.
. El uso de polinomios ortogonales tiene algunas ventajas sobre
b. El algoritmo Duplex no necesariamente reparte los datos los mtodos directos de regresin. Principalmente, el tiempo de
equitativamente, pero deberan haber ms datos en el conjunto clculo para ajustar' curvas utilizando esta metodologa, es mucho
de estimacin que en el de prediccin; por lo tanto se puede menor. Esta ventaja es ms apreciable cuanto mayor es el grado del
utilizar el algoritmo hasta obtener al menos 15 puntos para polinomio. Por otra parte, los polinomios ortogonales son construidos
prediccin y el resto de los datos se utilizan para construir el de forma tal que cualquier trmino del polinomio del modelo plan-
modelo. teado, es independiente del resto de los trminos. Esta propiedad de
c. Se deben eliminar los datos replicados pues puede darse que los independencia permite que se obtenga un coeficiente de regresin
conjuntos de datos sean demasiado similares. . para cada trmino y pueda ser probada su significacin por separado
en el Anlisis de la Varianza.
En este acapite se plantea el caso en el que se tiene una sola
Falta de ajuste sistemtico observacin de la variable Y para cada valor de la(s) variable(s)
Los residuales deben ser examinados de todas las maneras independiente(s). No obstante puede presentarse el caso en que para
. posibles para determinar si se han omitido variables importantes. un solo valor de la(s) variable(s) independiente (s), se obtenga ms de
una observacin para Y.
Por otra parte, si el modelo va a ser usado por personas no
estadsticas, debe llamarse la atencin hacia el riesgo de hacer
Modelo supuesto cuando utilizamos polinomios ortogonales
extrapolaciones basndose nicamente en cambios en una sola
variable pues puede que haya mucha colinelidad y esta prctica
puede llegar a conclusiones errneas. En estos casos se debe utilizar Supongamos que se asume el siguiente modelo de regresin
el modelo para hacer estimaciones dentro del intervalo de las X polinmico para el caso de una sola variable independiente:
considerado en la construccin del modelo. Yi = ~o + ~lX + ~2X2 + ... + ~qXq + ci (4.112)
Mantenimiento del modelo
Pueden haber cambios en las condiciones originales en donde un
modelo se ha venido utilizando, por lo que una revisin peridica de
las cualidades predictivas del modelo es conveniente.
174 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 175
que expresado en forma matricial sera: Con estas restricciones en los Pj, la determinacin de los
X2 xq coeficientes del modelo (4.114) a travs de la estimacin de mnimos
YI 1 Xl 1 1 13 El cuadrados se ve gravemente simplificada.
xq
Y2 1 X2 X22 2 132 E2 Para nuestro ejemplo la matriz X del modelo (4.114) sera:
Y3 1 X3 X23 xq 133 + E3 (4.113)
3
l~
siguiente forma:
y X
P1 (Xn) P2(Xn) Pq(Xn)
YI x.
Y2 X2
De las condiciones de ortogonalidad en los polinomios, la suma
de productos de cualquier par de polinomios es cero; por lo tanto la
Yn Xn matriz X'X es una matriz diagonal y sus valores son:
en donde n > q y las observaciones Xi, X2, ..., Xn estn igualmente
espaciadas; sto es: X2 Xi + d; Xa = =
Xz + d, ete. Se puede plantear
el modelo (4.112) de la siguiente forma:
Y; = <lO + o,IPI(xj) + o,2P2(xj) + ... + aqPq(Xj) + Ei (4.114)
en donde j = 1, 2, ..., n
y donde Pj(X) es un polinomio en X de orden j. Los p son escogidos de
forma tal que estos sean ortogonales; sto es:
Simultneamente;
n
Pj(X) =O (j = 1, 2, ..., q) r
ie I
n n
,""p
.f.... 2(X.):tO
J J (j = 1, 2, ..., q) P2(Xj)Yi
je I
j=L
174 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 175
que expresado en forma matricial sera: Con estas restricciones en los Pj, la determinacin de los
X2 xq coeficientes del modelo (4.114) a travs de la estimacin de mnimos
YI 1 Xl 1 1 13 El cuadrados se ve gravemente simplificada.
xq
Y2 1 X2 X22 2 132 E2 Para nuestro ejemplo la matriz X del modelo (4.114) sera:
Y3 1 X3 X23 xq 133 + E3 (4.113)
3
l~
siguiente forma:
y X
P1 (Xn) P2(Xn) Pq(Xn)
YI x.
Y2 X2
De las condiciones de ortogonalidad en los polinomios, la suma
de productos de cualquier par de polinomios es cero; por lo tanto la
Yn Xn matriz X'X es una matriz diagonal y sus valores son:
en donde n > q y las observaciones Xi, X2, ..., Xn estn igualmente
espaciadas; sto es: X2 Xi + d; Xa = =
Xz + d, ete. Se puede plantear
el modelo (4.112) de la siguiente forma:
Y; = <lO + o,IPI(xj) + o,2P2(xj) + ... + aqPq(Xj) + Ei (4.114)
en donde j = 1, 2, ..., n
y donde Pj(X) es un polinomio en X de orden j. Los p son escogidos de
forma tal que estos sean ortogonales; sto es:
Simultneamente;
n
Pj(X) =O (j = 1, 2, ..., q) r
ie I
n n
,""p
.f.... 2(X.):tO
J J (j = 1, 2, ..., q) P2(Xj)Yi
je I
j=L
176 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 177
(r = 1, 2, ..., n)
176 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 177
(r = 1, 2, ..., n)
178
Chacn I Anlisis de Regresin y Superficies de Respuesta 179
Chacn I Anlisis de Regresin y Superficies de Respuesta
construir fcilmente una tabla dando el valor de Pi y P2 para las y = 2,8329 + 0,064X - 0,1041X2
observaciones de variable X. Estos valores se presentan en la Tabla
4.4. Los resultados estimados generales son:
R;j = 54,0560
La diagonal de la matriz X'X y el vector X'Y son:
R2 = 69,3700
A 19,83
uo = -- = 2,8329
7
1,80
A
u
1="28 = 0,064
-8,75
=
A
u2 =~ -0,1041
F
178
Chacn I Anlisis de Regresin y Superficies de Respuesta 179
Chacn I Anlisis de Regresin y Superficies de Respuesta
construir fcilmente una tabla dando el valor de Pi y P2 para las y = 2,8329 + 0,064X - 0,1041X2
observaciones de variable X. Estos valores se presentan en la Tabla
4.4. Los resultados estimados generales son:
R;j = 54,0560
La diagonal de la matriz X'X y el vector X'Y son:
R2 = 69,3700
A 19,83
uo = -- = 2,8329
7
1,80
A
u
1="28 = 0,064
-8,75
=
A
u2 =~ -0,1041
180 Chacn / Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 181
Ejemplo ilustrativo
ESQUEMA D~L DESARROLLO Y VALIDACION DEL MODELO
CONSTRUCCION DE UN MODELO DE PREDICCION
DEL RENDIMIENTO DEL CULTIVO DE SOYA
Ejemplo ilustrativo
ESQUEMA D~L DESARROLLO Y VALIDACION DEL MODELO
CONSTRUCCION DE UN MODELO DE PREDICCION
DEL RENDIMIENTO DEL CULTIVO DE SOYA
I
Tabla 4.5. Datos de .rendimiento 00, y de 15 variables que
caracterizan la plantacin de soya
Evaluacin del
subconjunto de Desv.
modelos Variables Codo Media estandar c.v.
R 2
N plantas/m. 1 x. 7,58 2,64 34,86
Criterios utilizados Cp de Mallow
N vainas/m. 1 X2 484,28 173,76 35,88
Submodelos N vainas/plantas x, 65,14 19,99 30,68
seleccionados
- N" vainas vanas X4 12,98 14,04 108,16
Peso vainas vanas X5 0,85 0,91 106,54
Estudio de los
submodelos ANAVAR Vainas con 1 semilla X6 49,46 2,88 46,24
seleccionados Peso de las vainas con X7 13,83 7,02 50,73
Normalidad una semilla
Mtodo Grfico Vainas con 2 semillas Xs 251,90 93,93 37,28
Mtodo Analtico
(Wilks-Shapiro) Peso de las vainas con 2 X9 117,51 51,48 43,80
Estudio del semillas
Homocedasticidad
cumplimiento de los Vainas con 3 semillas XlO 172,08 74,26 43,15
Grficos:
sunuestos
res Vs t; Peso de las vainas con 3 Xl1 113,35 59,03 52,07
res Vs X's semillas
Validacin de los
Peso total de las vainas Xl2 247,52 107,80 46,54
submodelos finales Autocorrelacin
seleccionados Peso de 100 vainas Xl3 50,86 7,36 14,47
(P. Durbin-Watson)
Peso de las semillas de Xl4 32,73 6,59 20,12
Multicolinealidad las 100 vainas
Criterios utilizados VIF's Peso de 100 semillas Xl5 16,00 2,15 13,41
Autovalores
Peso total de las semillas Y 145,49 62,61 43,03
2
R pred Fuente: Clculos propios
Press
El tipo de anlisis a efectuar es el Anlisis de Regresin
Conclusiones Estabilidad de Signos y
Mltiple.
Magnitudes de los
coeficientes Para el procesamiento de los datos, se usaron los paquetes
estadsticos SAS, SPSS/PC y Statgraphics.
Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 183
182
I
Tabla 4.5. Datos de .rendimiento 00, y de 15 variables que
caracterizan la plantacin de soya
Evaluacin del
subconjunto de Desv.
modelos Variables Codo Media estandar c.v.
R 2
N plantas/m. 1 x. 7,58 2,64 34,86
Criterios utilizados Cp de Mallow
N vainas/m. 1 X2 484,28 173,76 35,88
Submodelos N vainas/plantas x, 65,14 19,99 30,68
seleccionados
- N" vainas vanas X4 12,98 14,04 108,16
Peso vainas vanas X5 0,85 0,91 106,54
Estudio de los
submodelos ANAVAR Vainas con 1 semilla X6 49,46 2,88 46,24
seleccionados Peso de las vainas con X7 13,83 7,02 50,73
Normalidad una semilla
Mtodo Grfico Vainas con 2 semillas Xs 251,90 93,93 37,28
Mtodo Analtico
(Wilks-Shapiro) Peso de las vainas con 2 X9 117,51 51,48 43,80
Estudio del semillas
Homocedasticidad
cumplimiento de los Vainas con 3 semillas XlO 172,08 74,26 43,15
Grficos:
sunuestos
res Vs t; Peso de las vainas con 3 Xl1 113,35 59,03 52,07
res Vs X's semillas
Validacin de los
Peso total de las vainas Xl2 247,52 107,80 46,54
submodelos finales Autocorrelacin
seleccionados Peso de 100 vainas Xl3 50,86 7,36 14,47
(P. Durbin-Watson)
Peso de las semillas de Xl4 32,73 6,59 20,12
Multicolinealidad las 100 vainas
Criterios utilizados VIF's Peso de 100 semillas Xl5 16,00 2,15 13,41
Autovalores
Peso total de las semillas Y 145,49 62,61 43,03
2
R pred Fuente: Clculos propios
Press
El tipo de anlisis a efectuar es el Anlisis de Regresin
Conclusiones Estabilidad de Signos y
Mltiple.
Magnitudes de los
coeficientes Para el procesamiento de los datos, se usaron los paquetes
estadsticos SAS, SPSS/PC y Statgraphics.
184 Chacn I Anlisisde Regresiny Superficiesde Respuesta Chacn I Anlisisde Regresiny Superficiesde Respuesta 185
Y = - 47,74 - 4,18Xl + 0,64X2 - 0,49Xa - 0,79X4 + 8,43Xs - X14 0,19148 1,87421 0,02014 0,102 0,9192
0,78X6 + 1,58X7 - 0,84Xs + 1,22X9 - 0,21XlO + 0,20Xn- X8 0,83879 0,76715 -1,25852 -1,093 0,2819
0,28X12 - 0,33X13 + 0,19X14 + 7,54X15
X6 -0,78688 0,91216 -0,28752 -0,863 0,3944
X5 8,43132 15,52564 0,12257 0,543 0,5906
X13 0,33492 1,91345 0,03938 0,175 0,8621
R mltiple. 0,91260 Xl -4,17849 5,11983 0,17638 -0,816 0,4201
R2. 0,83284
2 Xll 0,19850 0,33774 0,18715 0,588 0,5606
Radj . 0,75909
X9 1,22792 1,48056 1,00967 0,829 0,4127
Error Estandar 30,72817
X12 -0,27848 0,75609 -0,47949 -0,368 0,7149
X2 0,64367 0,62043 1,78652 1,037 0,3068
(cte) -43,74606 91,63134 -0,477 0,6361
ANAVAR
El modelo, present un coeficiente de determinacin
F. deV. G. de L. Suma de Cuad. Cuad. Medios
R2 = 83,28%, lo cual se ajusta a los objetivos.
Y = - 47,74 - 4,18Xl + 0,64X2 - 0,49Xa - 0,79X4 + 8,43Xs - X14 0,19148 1,87421 0,02014 0,102 0,9192
0,78X6 + 1,58X7 - 0,84Xs + 1,22X9 - 0,21XlO + 0,20Xn- X8 0,83879 0,76715 -1,25852 -1,093 0,2819
0,28X12 - 0,33X13 + 0,19X14 + 7,54X15
X6 -0,78688 0,91216 -0,28752 -0,863 0,3944
X5 8,43132 15,52564 0,12257 0,543 0,5906
X13 0,33492 1,91345 0,03938 0,175 0,8621
R mltiple. 0,91260 Xl -4,17849 5,11983 0,17638 -0,816 0,4201
R2. 0,83284
2 Xll 0,19850 0,33774 0,18715 0,588 0,5606
Radj . 0,75909
X9 1,22792 1,48056 1,00967 0,829 0,4127
Error Estandar 30,72817
X12 -0,27848 0,75609 -0,47949 -0,368 0,7149
X2 0,64367 0,62043 1,78652 1,037 0,3068
(cte) -43,74606 91,63134 -0,477 0,6361
ANAVAR
El modelo, present un coeficiente de determinacin
F. deV. G. de L. Suma de Cuad. Cuad. Medios
R2 = 83,28%, lo cual se ajusta a los objetivos.
.****
2,67 v
a
0,91 .*
1,67
2,00 d
o .25
. **
1 2,74
1,67
1,33 * ***
**
2 4,03 1,00 ** **
*****---+--------+--------+------~
5 5,31 25
0,67 ****. Esperado
9 6,26 -0,33 *****.***
Wilk-Shapiro = 0,8936
* 6,62 0,00 ******.******
9 6,26 -0,33 Figura 4.12. Pruebas de normalidad para el modelo completo
*****.***
Across - *PRED Down - *RESID
5 5,31 -0,67 ****. Out ++-----+-----r-----r----+-----r---~+
3 4,03 -1,00 3
*** Symbols:
MaxN
2,74
1,67
-1,33
2
O 0,91
-1,67
-2,00
1.0
2.0
0,45
0,20
-2,33
0,08
-2,67 o ... ,:
1 0,04
-3,00
Out * -1 - - - - - - - - - _.- - - - - - - - - - - - - - - -
-2
Figura 4.11. Histograma de residuales estandarizados para el modelo
completo
-3
Out
- 3 -2 - 1 - O 2 3 Out
.****
2,67 v
a
0,91 .*
1,67
2,00 d
o .25
. **
1 2,74
1,67
1,33 * ***
**
2 4,03 1,00 ** **
*****---+--------+--------+------~
5 5,31 25
0,67 ****. Esperado
9 6,26 -0,33 *****.***
Wilk-Shapiro = 0,8936
* 6,62 0,00 ******.******
9 6,26 -0,33 Figura 4.12. Pruebas de normalidad para el modelo completo
*****.***
Across - *PRED Down - *RESID
5 5,31 -0,67 ****. Out ++-----+-----r-----r----+-----r---~+
3 4,03 -1,00 3
*** Symbols:
MaxN
2,74
1,67
-1,33
2
O 0,91
-1,67
-2,00
1.0
2.0
0,45
0,20
-2,33
0,08
-2,67 o ... ,:
1 0,04
-3,00
Out * -1 - - - - - - - - - _.- - - - - - - - - - - - - - - -
-2
Figura 4.11. Histograma de residuales estandarizados para el modelo
completo
-3
Out
- 3 -2 - 1 - O 2 3 Out
Del grfico de residuales (ei) vs Yi ' se observa que los valores B) Otro indicio de la presencia de la multicolinealidad es que l~ F
estn en una franja horizontal, por lo tanto concluimos que no hay fue altamente significativa pero las t no lo son (aunque esto
heterocedasticidad (la varianza es constante). podra deberse a otras causas).
AUTOCORRELACION C) Anlisis de los VIF.
La autocorrelacin de Durbin-Watson da un valor de 1,95788, Variable G. de L. Inflador de Variable G. de L. Inflador de
valor indicativo de que no hay autocorrelacin. Varianza Varianza
X4 0,253 0,182 -0,000 1,000 O,~13* 0,126 0,132 00,175 0,122 0,020 0,005 0,064 .0,165 -0,137 -0,134 0,039
hay diez VIF > 10, que indica la existencia de multicolinealidad.
X5 0,184 0,144 0,005 0,913* 1,000 0,058 0,083 0,137 0,046 0,002 -0,043 0,001 .0,200 .0,182 -0,216 -0,003 D) Para determinar la severidad de la multicolinealidad detectada,
X6 0,585* 0,730* 0,302 0,126 0,058 1,000 0,829* 0,707* 0,689* 0,462* 0,512* 0,646* 362* 0,344* 0,342* 0,55* estudiamos los valores propios de la matriz XIX y calculamos el
X7 0,704*0,725* 0,062 0,132 0,0830,829* 1,0000,747*0,751*0,467*0,523*0,695*0,361*0,370* 0,249 0,610* coeficiente de multicolinealidad.
X8 0,780* 0,944* 0,189 0,175 0,137 0,707* 0,747* 1,000 0,960* 0,694* 0,728* 0,893* 0,357* 0,301 0,331* 0,756* Nmero Valor Propio Nmero Valor Propio
X9 0,734* 0,915* 0,228 0,122 0,046 0,689* 0,751 * 0,960* 1,000 0,692* 0,781* 0,941* 543* 0,481* 0,519* 0,833*
1 14,24422 9 0,02346
X10 0,616* 0,872* 0,294 0,020 0,002 0,462* 0,467* 0,694* 0,692* 1,000 0,931* 0,880* 0,389* 0,328* 0,336* 0,753*
XlI 0,633* 0,865* 0,257 0,005 -0,043 0,512* 0,523* 0,728* 0,781* 0,931* 1,000 0,929* 0,542* 0,472* 0,486* 0,826*
2 0,98344 10 0,00837
X12 0,726* 0,952* 0,273 0,064 0,001 0,646* 0,695* 0,893* 0,941* 0,880* 0,929* 1,000 0,583* 0,523* 0,529* 0,880* 3 0,32077 11 0,00532
X13 0,284 0,404* 0,124 -0,165 -0,2000,362*0,361* 0,357* 0,543* 0,389* 0,542* 0,583* 1,000 0,914* 0,804* 0,629* 4 0,17136 12 0,00411
X14 0,2280,345* 0,097 -0,137 -0,182 0,344*0,370* 0,3010,481*0,328*0,472*0,523*0,914* 1,000 0,756*0,573*
5 0,10081 13 0,00187
X15 0,2040,360* 0,236 -0,134 -0,2160,342* 0,2490,331*0,519*0,336*0,486*0,529*0,804*0,756* 1,0000,618*
6 0,05005 14 0,0008478
Y 0,616* 0,813* 0,199 0,039 -0,003 0,555* 0,610* 0,756* 0,833* 0,753* 0,826* 0,880* 0,629* 0,573 0,618* 1,000
7 0,04724 15 0,0002217
8 0,03781 16 0,0001263
Segn se observa en la matriz de correlacin, hay muchos
coeficientes altos, y 15 de ellos son mayores que el Coeficiente de
Determinacin, lo cual nos indica que estamos en presencia de V.P. mayor 0,98344
multicolinealidad. K = 7.786,53
V.P. menor 0,0001263
(muticolinealidad severa)
188 Chacn I Anlisis de Regresin y Superficies de Respuesta
Chacn I Anlisis de Regresin y Superficies de Respuesta 189
A
Del grfico de residuales (ei) vs Yi ' se observa que los valores B) Otro indicio de la presencia de la multicolinealidad es que l~ F
estn en una franja horizontal, por lo tanto concluimos que no hay fue altamente significativa pero las t no lo son (aunque esto
heterocedasticidad (la varianza es constante). podra deberse a otras causas).
AUTOCORRELACION C) Anlisis de los VIF.
La autocorrelacin de Durbin-Watson da un valor de 1,95788, Variable G. de L. Inflador de Variable G. de L. Inflador de
valor indicativo de que no hay autocorrelacin. Varianza Varianza
X4 0,253 0,182 -0,000 1,000 O,~13* 0,126 0,132 00,175 0,122 0,020 0,005 0,064 .0,165 -0,137 -0,134 0,039
hay diez VIF > 10, que indica la existencia de multicolinealidad.
X5 0,184 0,144 0,005 0,913* 1,000 0,058 0,083 0,137 0,046 0,002 -0,043 0,001 .0,200 .0,182 -0,216 -0,003 D) Para determinar la severidad de la multicolinealidad detectada,
X6 0,585* 0,730* 0,302 0,126 0,058 1,000 0,829* 0,707* 0,689* 0,462* 0,512* 0,646* 362* 0,344* 0,342* 0,55* estudiamos los valores propios de la matriz XIX y calculamos el
X7 0,704*0,725* 0,062 0,132 0,0830,829* 1,0000,747*0,751*0,467*0,523*0,695*0,361*0,370* 0,249 0,610* coeficiente de multicolinealidad.
X8 0,780* 0,944* 0,189 0,175 0,137 0,707* 0,747* 1,000 0,960* 0,694* 0,728* 0,893* 0,357* 0,301 0,331* 0,756* Nmero Valor Propio Nmero Valor Propio
X9 0,734* 0,915* 0,228 0,122 0,046 0,689* 0,751 * 0,960* 1,000 0,692* 0,781* 0,941* 543* 0,481* 0,519* 0,833*
1 14,24422 9 0,02346
X10 0,616* 0,872* 0,294 0,020 0,002 0,462* 0,467* 0,694* 0,692* 1,000 0,931* 0,880* 0,389* 0,328* 0,336* 0,753*
XlI 0,633* 0,865* 0,257 0,005 -0,043 0,512* 0,523* 0,728* 0,781* 0,931* 1,000 0,929* 0,542* 0,472* 0,486* 0,826*
2 0,98344 10 0,00837
X12 0,726* 0,952* 0,273 0,064 0,001 0,646* 0,695* 0,893* 0,941* 0,880* 0,929* 1,000 0,583* 0,523* 0,529* 0,880* 3 0,32077 11 0,00532
X13 0,284 0,404* 0,124 -0,165 -0,2000,362*0,361* 0,357* 0,543* 0,389* 0,542* 0,583* 1,000 0,914* 0,804* 0,629* 4 0,17136 12 0,00411
X14 0,2280,345* 0,097 -0,137 -0,182 0,344*0,370* 0,3010,481*0,328*0,472*0,523*0,914* 1,000 0,756*0,573*
5 0,10081 13 0,00187
X15 0,2040,360* 0,236 -0,134 -0,2160,342* 0,2490,331*0,519*0,336*0,486*0,529*0,804*0,756* 1,0000,618*
6 0,05005 14 0,0008478
Y 0,616* 0,813* 0,199 0,039 -0,003 0,555* 0,610* 0,756* 0,833* 0,753* 0,826* 0,880* 0,629* 0,573 0,618* 1,000
7 0,04724 15 0,0002217
8 0,03781 16 0,0001263
Segn se observa en la matriz de correlacin, hay muchos
coeficientes altos, y 15 de ellos son mayores que el Coeficiente de
Determinacin, lo cual nos indica que estamos en presencia de V.P. mayor 0,98344
multicolinealidad. K = 7.786,53
V.P. menor 0,0001263
(muticolinealidad severa)
Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 191
190
Variable SE (p)
A
Variables eliminadas
ANAVAR
Beta de. Parcial Tolerancia t Sig t
entrada mnima Suma de Cuad. Cuad. Medios
G.deL.
Xl 0,3780 0,05163 0,02785 0,343 0,7333
Regresin 4 154392,98169 38598,24542
X3 -0,10219 -0,21372 0,02756 -1,451 0,1538
X4 -0,03565 -0,07725 0,02829 -0,514 0,6098 Residual 45 37658,61511 836,85811
X5 -1,309x103 -0,00277 0,02785 -0,018 0,9854 F = 46,12281 Signif F = 0,0000
X6 -0,12660 -0,19206 0,02781 -1,298 0,2010
ESTIMACION DE PARAMETROS
X7 6,7259x103 0,00963 0,02799 . 0,064 0,9494
XlO 0,24299 0,15427 0,01633 1,036 0,3060 Variable
A A
Beta t Sig t
P SE(P)
Xl1 0,22198 0,16976 0,01663 1,143 0,2594
X12 0,5819 0,16081 0,01079 1,081 0,2857 X15 5,61160 3,211222 0,19241 1,747 0,0874
X13 0,05984 0,07018 0,02308 0,467 0,6430 Xs -0,53311 0,26155 -0,79988 -2,038 0,0474
X14 0,05512 0,07450 0,02439 0,496 0,6227
X2 0,27910 0,07361 0,77465 3,792 0,0004
Variable SE (p)
A
Variables eliminadas
ANAVAR
Beta de. Parcial Tolerancia t Sig t
entrada mnima Suma de Cuad. Cuad. Medios
G.deL.
Xl 0,3780 0,05163 0,02785 0,343 0,7333
Regresin 4 154392,98169 38598,24542
X3 -0,10219 -0,21372 0,02756 -1,451 0,1538
X4 -0,03565 -0,07725 0,02829 -0,514 0,6098 Residual 45 37658,61511 836,85811
X5 -1,309x103 -0,00277 0,02785 -0,018 0,9854 F = 46,12281 Signif F = 0,0000
X6 -0,12660 -0,19206 0,02781 -1,298 0,2010
ESTIMACION DE PARAMETROS
X7 6,7259x103 0,00963 0,02799 . 0,064 0,9494
XlO 0,24299 0,15427 0,01633 1,036 0,3060 Variable
A A
Beta t Sig t
P SE(P)
Xl1 0,22198 0,16976 0,01663 1,143 0,2594
X12 0,5819 0,16081 0,01079 1,081 0,2857 X15 5,61160 3,211222 0,19241 1,747 0,0874
X13 0,05984 0,07018 0,02308 0,467 0,6430 Xs -0,53311 0,26155 -0,79988 -2,038 0,0474
X14 0,05512 0,07450 0,02439 0,496 0,6227
X2 0,27910 0,07361 0,77465 3,792 0,0004
1
0,91
1,67
2,00
1,67 *
.*
*-----+-----~---~----~
0,25 1,0
3 2,74 1,33 **. Figura 4.15. Prueba de normalidad para el modelo reducido.
Standatized Scatterplot
2
3
4,03
5,31
1,00
0,67
** Across
Out 1
'PRED
1 1
'RESIO
I
.
I
.
I SymboIs:
*** 3 MaxN
***.**
* 6,62 0,00 ******.*** 2
9 6,26 -0,33 *****.*** 1,0
: 2,0
7 5,31 -0,67 ****.** * 4,0
2 4,03 -1,00 **
o
1 2,74 -1,33 * . * *
1 1,67 -1,67 *
0,91 -2,00
-1
0,45 -2,33 -2
0,20 -2,67
0,08 -3,00 -3.
Out
I
Figura 4.14. Histograma de residuales estandarizados para el modelo 3 2 -1 O 1 2 3
reducido
Figura. 4.16. Prueba de homogeneidad de varianza para el modelo
reducido
192 Chacin I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 193
1
0,91
1,67
2,00
1,67 *
.*
*-----+-----~---~----~
0,25 1,0
3 2,74 1,33 **. Figura 4.15. Prueba de normalidad para el modelo reducido.
Standatized Scatterplot
2
3
4,03
5,31
1,00
0,67
** Across
Out 1
'PRED
1 1
'RESIO
I
.
I
.
I SymboIs:
*** 3 MaxN
***.**
* 6,62 0,00 ******.*** 2
9 6,26 -0,33 *****.*** 1,0
: 2,0
7 5,31 -0,67 ****.** * 4,0
2 4,03 -1,00 **
o
1 2,74 -1,33 * . * *
1 1,67 -1,67 *
0,91 -2,00
-1
0,45 -2,33 -2
0,20 -2,67
0,08 -3,00 -3.
Out
I
Figura 4.14. Histograma de residuales estandarizados para el modelo 3 2 -1 O 1 2 3
reducido
Figura. 4.16. Prueba de homogeneidad de varianza para el modelo
reducido
194 Chacin I Anlisis de Regresin y Superficies de Respuesta
AUTOCORRELACION
Prueba Durbin-Watson 1,934
Autocorrelacin de primer orden 0,072
El estadstico de Durbin-Watson fue de 1,934, como es mayor
que el dv = 1,72 obtenido de la tabla, indica que no existe
autocorrelacin
MULTICOLINEALIDAD
a) Examen de la matriz de correlacin de las variables regresoras.
Correlations X2 x, X9 X15 y
X2 1,0000 0,9449** 0,9154** 0,3601* 0,8134**
x, 0,9449** 1,0000 0,9604** 0,3311* 0,7567**
X9 0,9154** 0,9604** 1,0000 0,5198** 0,8332**
X15 0,3601* 0,3311* 0,5198** 1,0000 0,6183**
Y 0,8134"** 0,7567** 0,8332** 0,6183** 1,0000
C.v. 19,88322
194 Chacn / Anlisis de Regresin y Superficies de Respuesta
Chacn / Anlisis de Regresin y Superficies de Respuesta 195
El grfico de residuales us valores predichos, nos indica que no
Estimacin de Parmetros
hay indicios de heterocedasticidad.
Variable G. deL. Estimacin de Error t Prob> Itl
AUTOCORRELACION los parmetros estandar
Prueba Durbin-Watson 1,934 Intercep 1 -58,398070 51,70694978 -1,129 0,2647
Autocorrelacin de primer orden 0,072 0,0004
X2 1 0,279103 0,07360959 3,792
El estadstico de Durbin-Watson fue de 1,934, como es mayor X15 1 5,611604 3,21121866 1,747 0,0874
que el dv = 1,72 obtenido de la tabla, indica que' no existe
autocorrelacin Xs 1 -0,533531 0,26155352 -2,038 0,0474
ANAVAR
Fuente G. deL. Suma de Cuad. Diagnstico de multicoliriealidad
Cuad. Medios F Prob>F
Regresin Nmero Valor propio
4 154392,98169 38598,24542 46,123 0,0001
Residual 45 1 4,83775
37658,61511 836,85811
C Total 49 2 0,13807
192051,59680
3 0,01539
Raz Cuadrada del CME 28,92850 R2 = 0,8039
Promedio 4 0,00734
145,49200 2
Radj = 0,7865
5 0,00145
C.V. 19,88322
Chacn I Anlisis de Regresin y Superficies de Respuesta 197
196 Chacn I Anlisis de Regresin y Superficies de Respuesta
200 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 201
200 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 201
X2 Xs X9 Xl1 ANAVAR
4 0,79549320 6,50960
4 0,79111177 7,50604 X2 X7 x, X9 Fuente G. de L. Suma de Cuad. Cuad. Medio F Prob > F
4 0,78890304 8,00835 X7 Xs X9 Xl1 Regresin 3 154407,83884 51469,27761 62,895 0,0001
4 0,78614549 8,63548 X2 X7 X9 X15 Residual 46 37643,75796 818,34256
4 0,78593354 8,68369 X2 X7 Xs X15
Total 49 192051,59680
4 0,77694610 10,72764 X2 X7 X9 Xll
4 0,74298213 18,45183 X2 X7 Xs Xl1 Raz Cuadrada del C.M.E. 28,60669 R2 0,8040
2
4 0,74223351 18,62209 X7 Xs X9 X15 Promedio 145,49200 Radj 0,7912
C.v. 19,66203
5 0,80956521 5,30929 X2 x, X9 x., X15
5 0,80940488 5,34576 X2 X7 X9 Xll X15
5 0,80796992 5,67210 X7 x, X9 Xl1 X15
5 0,80641327 6,02612 X2 X7 Xs Xl1 X15 =
En el ANAVAR el Fc 62,895 nos indica que hay una relacin
5 0,80393224 6,59036 X2 X7 Xs X9 X15 funcional mltiple entre Y y las variables regresoras.
5 0,79550822 8,50618 X2 X7 Xs X9 Xu
Estimacin de parmetros
6 0,81092521 7,00000 X2 X7 x, X9 Xl1 X15 Variable G. deL. Estimacin de Error t Prob> It I
parmetros estandar
De acuerdo a esta informacin, se concluye que por tener menor' Intercep 1 -59,121583 31,8795539 -1,855 0,0700
Cp y mayor R2, seleccionamos el modelo que incorpora las variables X9 1 0,495277 0,13160617 3,763 0,0005
Xs, Xl1, X15, el cual se estudia a continuacin.
Xl1 1 0,430646 0,11222726 3,837 0,0004
X15 1 6,099460 2,25410793 2,706 0,0095
ESTUDIO DEL MODELO DEFINITIVO
MODELO POBLACIONAL La tabla anterior nos indica que los parmetros son signi-
ficativos a un nivel a. = 0,10.
MODELO ESTIMADO
X2 Xs X9 Xl1 ANAVAR
4 0,79549320 6,50960
4 0,79111177 7,50604 X2 X7 x, X9 Fuente G. de L. Suma de Cuad. Cuad. Medio F Prob > F
4 0,78890304 8,00835 X7 Xs X9 Xl1 Regresin 3 154407,83884 51469,27761 62,895 0,0001
4 0,78614549 8,63548 X2 X7 X9 X15 Residual 46 37643,75796 818,34256
4 0,78593354 8,68369 X2 X7 Xs X15
Total 49 192051,59680
4 0,77694610 10,72764 X2 X7 X9 Xll
4 0,74298213 18,45183 X2 X7 Xs Xl1 Raz Cuadrada del C.M.E. 28,60669 R2 0,8040
2
4 0,74223351 18,62209 X7 Xs X9 X15 Promedio 145,49200 Radj 0,7912
C.v. 19,66203
5 0,80956521 5,30929 X2 x, X9 x., X15
5 0,80940488 5,34576 X2 X7 X9 Xll X15
5 0,80796992 5,67210 X7 x, X9 Xl1 X15
5 0,80641327 6,02612 X2 X7 Xs Xl1 X15 =
En el ANAVAR el Fc 62,895 nos indica que hay una relacin
5 0,80393224 6,59036 X2 X7 Xs X9 X15 funcional mltiple entre Y y las variables regresoras.
5 0,79550822 8,50618 X2 X7 Xs X9 Xu
Estimacin de parmetros
6 0,81092521 7,00000 X2 X7 x, X9 Xl1 X15 Variable G. deL. Estimacin de Error t Prob> It I
parmetros estandar
De acuerdo a esta informacin, se concluye que por tener menor' Intercep 1 -59,121583 31,8795539 -1,855 0,0700
Cp y mayor R2, seleccionamos el modelo que incorpora las variables X9 1 0,495277 0,13160617 3,763 0,0005
Xs, Xl1, X15, el cual se estudia a continuacin.
Xl1 1 0,430646 0,11222726 3,837 0,0004
X15 1 6,099460 2,25410793 2,706 0,0095
ESTUDIO DEL MODELO DEFINITIVO
MODELO POBLACIONAL La tabla anterior nos indica que los parmetros son signi-
ficativos a un nivel a. = 0,10.
MODELO ESTIMADO
Probabilidad Normal
ANALlSIS DEL CUMPLIMIENTO DE LOS SUPUESTOS
Residual Estandarizado
1,0
+----+----4-----1----"
O 0,04 Out ..... .
.....
O 0,08 3,00
O 0,20 2,67
0,7 ...
0,45 2,33 ",
O
1 0,91 2,00
o
b
s
....
"1:
v
4 4,03 1,00 *** a
d
6 5,31 0,67 **** . * o 0,2
6
9
6,26
6,62
0,33
0,00
***** .
****** . **
.
."*'"
...
..
"'
.--+----t----+----+ Esperado
9 6,26 -0,33 *****. ***
0,25 0,5 0,75 1,0
5 5,31 -0,67 ****
5 4,03 -1,00 ***. *
Figura 4.18. Prueba de normalidad para el modelo reducido definitivo
1 2,74 -1,33 *
Across - "PRED Down - "RESID
O 1,67 -1,67 Out~r--~--_+--_+--_+--_+--++
3 Symbols:
O 0,91 -2,00 MaxN
O 0,45 -2,33
O 0,20 -2,67 2
1,0
O 0,08 -3,00 2,0
3,0
1 0,04 Out *
Wilk - Shapiro = 0,9175
o
Figura 4.17. Histograma de residuales estandarizados para el modelo . , .. ,
reducido definitivo
. 1
-2
-3
Out
.3 2 . 1 -o -1 2 3 Out
Figura 4.19. Prueba de homogeneidad de varianza para el modelo
reducido definitivo
De los grficos' y la prueba analtica se concluye que hay
normalidad en los residuales y no existe heterocedasticidad. .
Chacn I Anlisisde Regresin y Superficiesde Respuesta 205
204 Chacn I Anlisisde Regresiny Superficiesde Respuesta
Probabilidad Normal
ANALlSIS DEL CUMPLIMIENTO DE LOS SUPUESTOS
Residual Estandarizado
1,0
+----+----4-----1----"
O 0,04 Out ..... .
.....
O 0,08 3,00
O 0,20 2,67
0,7 ...
0,45 2,33 ",
O
1 0,91 2,00
o
b
s
....
"1:
v
4 4,03 1,00 *** a
d
6 5,31 0,67 **** . * o 0,2
6
9
6,26
6,62
0,33
0,00
***** .
****** . **
.
."*'"
...
..
"'
.--+----t----+----+ Esperado
9 6,26 -0,33 *****. ***
0,25 0,5 0,75 1,0
5 5,31 -0,67 ****
5 4,03 -1,00 ***. *
Figura 4.18. Prueba de normalidad para el modelo reducido definitivo
1 2,74 -1,33 *
Across - "PRED Down - "RESID
O 1,67 -1,67 Out~r--~--_+--_+--_+--_+--++
3 Symbols:
O 0,91 -2,00 MaxN
O 0,45 -2,33
O 0,20 -2,67 2
1,0
O 0,08 -3,00 2,0
3,0
1 0,04 Out *
Wilk - Shapiro = 0,9175
o
Figura 4.17. Histograma de residuales estandarizados para el modelo . , .. ,
reducido definitivo
. 1
-2
-3
Out
.3 2 . 1 -o -1 2 3 Out
Figura 4.19. Prueba de homogeneidad de varianza para el modelo
reducido definitivo
De los grficos' y la prueba analtica se concluye que hay
normalidad en los residuales y no existe heterocedasticidad. .
Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 207
206
23 2 21 5 135 54 79 45 107 49 32 15 82
4 258 65
2 O 49 16 264 150 145 122 289 69 45 21 213
7 460 66
3 O 64 19 363 223 301 261 503 70 50 21 341
8 731 104
4 77 24 363 201 367 279 503 61 40 21 306
11 811 74 O
36 3 75 19 375 142 288 162 326 46 31 13 195
9 774 86
27 6 80 31 60 37 73 52 36 15 49
4 167 42 O O
3 O 28 8 183 82 208 36 226 53 37 16 116
5 423 85
9 756 84 O O 51 16 387 210 318 251 478 65 46 18 146 Captulo 5
35 10 221 105 280 198 313 54 35 17 207
8 536 67 O O
12 784 65 12 1 88 25 368 172 316 220 418 58 37 15 211
6 332 55 O O 20 14 206- 99 106 76 190 49 33 14 143 DETERMINACION DE LAS CONDICIONES
16 294 149 213 163 330 60 41 18 219
9 594 66 27 2 60
22 342 155 159 105 282 51 35 16 164
OPTIMAS DE OPERACION
9 582 65 3 O 78
10 624 62 7 O 70 16 280 123 267 184 322 50 30 16 150
11 726 66 18 2 70 19 389 176 249 162 359 44 30 16 181
10 624 48 17 1 95 35 338 164 173 116 316 56 38 15 179
11 568 52 11 1 55 17 315 125 187 110 253 49 26 14 116
En muchos casos en la investigacin, el inters de los trabajos
9 384 43 9 O 36 12 171 76 168 92 180 45 25 13 90
41 26 16 83
cientficos est centrado en determinar las condiciones experimen-
7 348 50 2 O 21 4 180 62 145 70 136
43 22 13 103
tales que ms favorecen el comportamiento del problema o fenmeno
7 416 59 12 1 19 6 215 80 170 95 182
54 33 17 140 bajo estudio, dependiendo por supuesto de algunos criterios previa-
9 579 66 3 O 54 12 375 171 165 126 309
45 29 15 182 mente establecidos.
9 690 77 9 O 78 19 393 178 210 137 335
12 500 42 20 1 52 12 280 136 148 107 256 54 34 19 182 Por ejemplo en la investigacin agrcola es de sumo inters
9 531 59 6 O 57 13 303 140 165 111 264 46 27 15 152 establecer los niveles de nutrimento que optimizan la respuesta o
6 368 61 O O 28 8 212 99 128 85 192 53 28 16 110 rendimiento de los cultivos, tanto en trminos fsicos como econ-
9 621 69 12 O 63 19 297 155 249 166 341 59 38 20 231 micos. En la agroindustria puede ser importante por ejemplo, la
7 478 68 7 1 49 13 282 130 140 96 239 52 33 17 204
temperatura, presin y concentracin de materia prima que minimi-
zan la sntesis de un determinado subproducto indeseable en un pro-
ceso dado.
La solucin a estos planteamientos puede abordarse a travs de
la Metodologa de Superficies de Respuesta. Es posible que ms de
una "respuesta" sea de inters. El propsito del investigador puede
ser, citando el ejemplo anterior, maximizar la cantidad de producto
comercial y minimizar la cantidad de subproducto indeseable. En la
prctica, el problema de las respuestas mltiples requiere la
determinacin de las condiciones ptimas de operacin.
En este captulo se describen algunos procedimientos para
hallar el "ptimo". En tal sentido se puede presentar cualquiera de
estas situaciones: a) El caso en el cual el investigador tiene elementos
suficientes como para suponer que el ptimo se encuentra contenido
ChacnI Anlisisde Regresiny Superficiesde Respuesta
208
23 2 21 5 135 54 79 45 107 49 32 15 82
4 258 65
2 O 49 16 264 150 145 122 289 69 45 21 213
7 460 66
3 O 64 19 363 223 301 261 503 70 50 21 341
8 731 104
4 77 24 363 201 367 279 503 61 40 21 306
11 811 74 O
36 3 75 19 375 142 288 162 326 46 31 13 195
9 774 86
27 6 80 31 60 37 73 52 36 15 49
4 167 42 O O
3 O 28 8 183 82 208 36 226 53 37 16 116
5 423 85
9 756 84 O O 51 16 387 210 318 251 478 65 46 18 146 Captulo 5
35 10 221 105 280 198 313 54 35 17 207
8 536 67 O O
12 784 65 12 1 88 25 368 172 316 220 418 58 37 15 211
6 332 55 O O 20 14 206- 99 106 76 190 49 33 14 143 DETERMINACION DE LAS CONDICIONES
16 294 149 213 163 330 60 41 18 219
9 594 66 27 2 60
22 342 155 159 105 282 51 35 16 164
OPTIMAS DE OPERACION
9 582 65 3 O 78
10 624 62 7 O 70 16 280 123 267 184 322 50 30 16 150
11 726 66 18 2 70 19 389 176 249 162 359 44 30 16 181
10 624 48 17 1 95 35 338 164 173 116 316 56 38 15 179
11 568 52 11 1 55 17 315 125 187 110 253 49 26 14 116
En muchos casos en la investigacin, el inters de los trabajos
9 384 43 9 O 36 12 171 76 168 92 180 45 25 13 90
41 26 16 83
cientficos est centrado en determinar las condiciones experimen-
7 348 50 2 O 21 4 180 62 145 70 136
43 22 13 103
tales que ms favorecen el comportamiento del problema o fenmeno
7 416 59 12 1 19 6 215 80 170 95 182
54 33 17 140 bajo estudio, dependiendo por supuesto de algunos criterios previa-
9 579 66 3 O 54 12 375 171 165 126 309
45 29 15 182 mente establecidos.
9 690 77 9 O 78 19 393 178 210 137 335
12 500 42 20 1 52 12 280 136 148 107 256 54 34 19 182 Por ejemplo en la investigacin agrcola es de sumo inters
9 531 59 6 O 57 13 303 140 165 111 264 46 27 15 152 establecer los niveles de nutrimento que optimizan la respuesta o
6 368 61 O O 28 8 212 99 128 85 192 53 28 16 110 rendimiento de los cultivos, tanto en trminos fsicos como econ-
9 621 69 12 O 63 19 297 155 249 166 341 59 38 20 231 micos. En la agroindustria puede ser importante por ejemplo, la
7 478 68 7 1 49 13 282 130 140 96 239 52 33 17 204
temperatura, presin y concentracin de materia prima que minimi-
zan la sntesis de un determinado subproducto indeseable en un pro-
ceso dado.
La solucin a estos planteamientos puede abordarse a travs de
la Metodologa de Superficies de Respuesta. Es posible que ms de
una "respuesta" sea de inters. El propsito del investigador puede
ser, citando el ejemplo anterior, maximizar la cantidad de producto
comercial y minimizar la cantidad de subproducto indeseable. En la
prctica, el problema de las respuestas mltiples requiere la
determinacin de las condiciones ptimas de operacin.
En este captulo se describen algunos procedimientos para
hallar el "ptimo". En tal sentido se puede presentar cualquiera de
estas situaciones: a) El caso en el cual el investigador tiene elementos
suficientes como para suponer que el ptimo se encuentra contenido
Chacn I Anlisis de Regresin y Superficies de Respuesta 211
210 Chacn I Anlisis de Regresin y Superficies de Respuesta
en la regin de exploracin seleccionada, (o cerca a ella) y b) cuando el excepcin de las pruebas "t" de Student, ya que han sido cuestionadas
ptimo est lejos de dicha regin. por la independencia que suponen dichas pruebas.
Por supuesto, en la prctica, el investigador no desea estar en el En: cualquier caso, el anlisis de la' superficie fijada requiere la
ltimo de los casos. Es por ello que se requiere una planificacin obtencin de un modelo lgico, en torno al cual es necesario establecer
estricta y prudente de los experimentos, basada en la informacin consideraciones ligadas a la experiencia y al conocimiento que tenga
previa existente acerca del problema bajo estudio, adems del el investigador sobre el material experimental. Cabe destacar en este
basamento terico y la experiencia del investigador. momento que el modelo al cual se hace referencia es un modelo de
regresin, para el cual se deben cumplir todos los supuestos y
Cuando no se dispone de los elementos antes sealados es muy condiciones que el anlisis de regresin establece.
factible hallarse en la ltima de.Ias situaciones planteadas, en cuyo
caso la experimentacin secuencial es una alternativa, sobre todo en En esta seccin se considera la situacin en la cual el
experimentos controlados o de laboratorio. investigador ha seleccionado una regin de exploracin en la cual est
contenido el ptimo, conduce una serie de experimentos y decide
analizar una funcin de respuesta de segundo orden para las "k"
variables includas en el experimento.
ANALISIS DE LA SUPERFICIE FIJADA
El modelo polinmico de segundo orden asumido para alguna
regin de los X' s ser:
Al abordar este anlisis puede adaptarse uno de los siguientes
criterios: Tli =
k
po + "p.X.
~
i=I
I 1 ~
k
+ "p
i=l
..X~+
11 1
""A..
k k-l
~~PIJ
i( j
X.X.+E.
1 J 1
(5.1)
Incluir todos los trminos del modelo independientemente de los
resultados de las pruebas de significacin (Anavar). Este criterio
supone que la inclusin de todas las variables tiene importancia desde Si un diseo experimental ha sido elegido y conducido un
el punto de vista biolgico, qumico, etc. (segn sea el caso), y por ello experimento, se podra utilizar entonces la tcnica de los modelos
son de inters para el investigador, el cual las h'a considerado lineales generales para estimar los coeficientes de la ecuacin
inicialmente en su estudio. Desde luego que para que un modelo de anterior. Los estimadores seran denotados por bo, bi ,..., bi, bu, ..., bkk;
este tipo pueda ser considerado como una funcin de respuesta bis ,..., b(k.l)k.La ecuacin de estimacin o ecuacin de prediccin,
aplicada al fenmeno bajo estudio, debe existir significacin en el frecuentemente referida como la Superficie de Respuesta Fijada, es
anlisis de regresin. dada por la expresin (5.2):
en la regin de exploracin seleccionada, (o cerca a ella) y b) cuando el excepcin de las pruebas "t" de Student, ya que han sido cuestionadas
ptimo est lejos de dicha regin. por la independencia que suponen dichas pruebas.
Por supuesto, en la prctica, el investigador no desea estar en el En: cualquier caso, el anlisis de la' superficie fijada requiere la
ltimo de los casos. Es por ello que se requiere una planificacin obtencin de un modelo lgico, en torno al cual es necesario establecer
estricta y prudente de los experimentos, basada en la informacin consideraciones ligadas a la experiencia y al conocimiento que tenga
previa existente acerca del problema bajo estudio, adems del el investigador sobre el material experimental. Cabe destacar en este
basamento terico y la experiencia del investigador. momento que el modelo al cual se hace referencia es un modelo de
regresin, para el cual se deben cumplir todos los supuestos y
Cuando no se dispone de los elementos antes sealados es muy condiciones que el anlisis de regresin establece.
factible hallarse en la ltima de.Ias situaciones planteadas, en cuyo
caso la experimentacin secuencial es una alternativa, sobre todo en En esta seccin se considera la situacin en la cual el
experimentos controlados o de laboratorio. investigador ha seleccionado una regin de exploracin en la cual est
contenido el ptimo, conduce una serie de experimentos y decide
analizar una funcin de respuesta de segundo orden para las "k"
variables includas en el experimento.
ANALISIS DE LA SUPERFICIE FIJADA
El modelo polinmico de segundo orden asumido para alguna
regin de los X' s ser:
Al abordar este anlisis puede adaptarse uno de los siguientes
criterios: Tli =
k
po + "p.X.
~
i=I
I 1 ~
k
+ "p
i=l
..X~+
11 1
""A..
k k-l
~~PIJ
i( j
X.X.+E.
1 J 1
(5.1)
Incluir todos los trminos del modelo independientemente de los
resultados de las pruebas de significacin (Anavar). Este criterio
supone que la inclusin de todas las variables tiene importancia desde Si un diseo experimental ha sido elegido y conducido un
el punto de vista biolgico, qumico, etc. (segn sea el caso), y por ello experimento, se podra utilizar entonces la tcnica de los modelos
son de inters para el investigador, el cual las h'a considerado lineales generales para estimar los coeficientes de la ecuacin
inicialmente en su estudio. Desde luego que para que un modelo de anterior. Los estimadores seran denotados por bo, bi ,..., bi, bu, ..., bkk;
este tipo pueda ser considerado como una funcin de respuesta bis ,..., b(k.l)k.La ecuacin de estimacin o ecuacin de prediccin,
aplicada al fenmeno bajo estudio, debe existir significacin en el frecuentemente referida como la Superficie de Respuesta Fijada, es
anlisis de regresin. dada por la expresin (5.2):
extensin del anlisis depende de las metas y objetivos del La ecuacin (5.7)representa el punto estacionario, el cual no es
investigador. necesariamente- el punto que maximiza la respuesta, puede ser
cualquiera de los tres casos descritos anteriormente.
Supngase que el objetivo consiste en estimar las condiciones en
Xi, X2 ,... Xk que maximizan la respuesta n. Si la superficie fijada de En el primer caso, si el punto estacionario es un mximo,
segundo orden tiene slo una variable, el modelo sera: cuando se' mueve imaginariamente del punto Xo resulta un
decrecimiento de la respuesta. Si Xo es un mnimo y se mueve del
(5.3) punto Xose obtiene como resultado uh incremento en la respuesta. En
el tercer caso, cuando se genera un punto de silla (saddle point) , se
al derivar e igualar a cero se obtiene: puede producir un incremento o un decrecimiento de la respuesta al
moverse del punto estacionario, dependiendo de la direccin que se
tome.
&y/&X = b + 2bX = O = > I X = -b /2b I (5.4) Si el investigador est buscando la localizacin de la mejor
respuesta posible y el punto estacionario encontrado fuese un punto
este valor de X representa el punto estacionario, el cual puede ser de silla, podra estar muy interesado en conocer cual es la direccin
mximo si &2Y/&X2 es negativa; en caso contrario si &2Y/8X2es que se debe tomar para obtener un incremento en la respuesta. En
positiva se tendra un mnimo. este caso el investigador no averiguara la naturaleza del punto
estacionario solamente calculndolo sino mediante otros procedi-
Cuando la superficie fijada envuelve ms de una variable
mientos que se vern posteriormente.
independiente, el punto estacionario ser un conjunto de condiciones
(Xi, X2, ..., Xk) tal que las derivadas &YIXI, 8YIM, ... 8YIXk sean En el caso especial de una o dos variables, se pueden elaborar
simultneamente iguales a cero, tal como se describe a continuacin. grficos donde se obtienen contornos de respuesta constantes y de
Expresado matricialmente el modelo general; esta forma obtener una clara indicacin de la naturaleza de Xo.En las
Figuras 5.1 a la 5.3 se ilustra esta situacin utilizando los resultados
de un experimento realizado en al ao 1992 por Machado y Chacn, en
y = bo + X'b + X'BX, en donde (5.5) el cual se prob el efecto de niveles de nitrgeno y densidades de
siembra sobre el rendimiento y algunos de sus componentes en el
bll b12/2
cultivo de maz (Zea mays) , utilizando el diseo Compuesto Central
Y B= b22 Rotable Doble Estrella (D.C.C.R.D.E.) con la adicin de un nuevo
[ ncleo estrella (k =2, e = 2, no = 4) desarrollado por Villasmil (1987),
simetrica
ejecutado en bloques al azar.
X'b da los trminos de primer orden en la funcin de respuesta y Para el caso de tres o ms variables el anlisis grfico se
la forma cuadrtica X'BX da la contribucin cuadrtica. Al derivar la complica considerablemente, por lo cual en esta situacin y en
ecuacin (5.5) e igualar a cero se obtiene finalmente: general, es necesario recurrir a otros procedimientos.
extensin del anlisis depende de las metas y objetivos del La ecuacin (5.7)representa el punto estacionario, el cual no es
investigador. necesariamente- el punto que maximiza la respuesta, puede ser
cualquiera de los tres casos descritos anteriormente.
Supngase que el objetivo consiste en estimar las condiciones en
Xi, X2 ,... Xk que maximizan la respuesta n. Si la superficie fijada de En el primer caso, si el punto estacionario es un mximo,
segundo orden tiene slo una variable, el modelo sera: cuando se' mueve imaginariamente del punto Xo resulta un
decrecimiento de la respuesta. Si Xo es un mnimo y se mueve del
(5.3) punto Xose obtiene como resultado uh incremento en la respuesta. En
el tercer caso, cuando se genera un punto de silla (saddle point) , se
al derivar e igualar a cero se obtiene: puede producir un incremento o un decrecimiento de la respuesta al
moverse del punto estacionario, dependiendo de la direccin que se
tome.
&y/&X = b + 2bX = O = > I X = -b /2b I (5.4) Si el investigador est buscando la localizacin de la mejor
respuesta posible y el punto estacionario encontrado fuese un punto
este valor de X representa el punto estacionario, el cual puede ser de silla, podra estar muy interesado en conocer cual es la direccin
mximo si &2Y/&X2 es negativa; en caso contrario si &2Y/8X2es que se debe tomar para obtener un incremento en la respuesta. En
positiva se tendra un mnimo. este caso el investigador no averiguara la naturaleza del punto
estacionario solamente calculndolo sino mediante otros procedi-
Cuando la superficie fijada envuelve ms de una variable
mientos que se vern posteriormente.
independiente, el punto estacionario ser un conjunto de condiciones
(Xi, X2, ..., Xk) tal que las derivadas &YIXI, 8YIM, ... 8YIXk sean En el caso especial de una o dos variables, se pueden elaborar
simultneamente iguales a cero, tal como se describe a continuacin. grficos donde se obtienen contornos de respuesta constantes y de
Expresado matricialmente el modelo general; esta forma obtener una clara indicacin de la naturaleza de Xo.En las
Figuras 5.1 a la 5.3 se ilustra esta situacin utilizando los resultados
de un experimento realizado en al ao 1992 por Machado y Chacn, en
y = bo + X'b + X'BX, en donde (5.5) el cual se prob el efecto de niveles de nitrgeno y densidades de
siembra sobre el rendimiento y algunos de sus componentes en el
bll b12/2
cultivo de maz (Zea mays) , utilizando el diseo Compuesto Central
Y B= b22 Rotable Doble Estrella (D.C.C.R.D.E.) con la adicin de un nuevo
[ ncleo estrella (k =2, e = 2, no = 4) desarrollado por Villasmil (1987),
simetrica
ejecutado en bloques al azar.
X'b da los trminos de primer orden en la funcin de respuesta y Para el caso de tres o ms variables el anlisis grfico se
la forma cuadrtica X'BX da la contribucin cuadrtica. Al derivar la complica considerablemente, por lo cual en esta situacin y en
ecuacin (5.5) e igualar a cero se obtiene finalmente: general, es necesario recurrir a otros procedimientos.
/~
h -.............
Tal como se sealara en prrafos anteriores, la funcin de
~ , . respuesta de segundo orden viene dada por:
.13.8
k k k k-l
Yi = be + "b.X.
~ 1 1
+ "b
~
..X2
II 1
+ ~~
""b ..X.X.
lJ 1 J
< j
!:::/IX~I~flll
i=l i=l i
/~
h -.............
Tal como se sealara en prrafos anteriores, la funcin de
~ , . respuesta de segundo orden viene dada por:
.13.8
k k k k-l
Yi = be + "b.X.
~ 1 1
+ "b
~
..X2
II 1
+ ~~
""b ..X.X.
lJ 1 J
< j
!:::/IX~I~flll
i=l i=l i
Wl, W2, ..., Wk. Consiguindose ejes relacionados con los principales
La reduccin de la superficie de respuesta en la forma cannica
es denominado Anlisis Cannico, cuyo desarrollo metodolgico es
ejes del sistema de contorno. Esta situacin se ilustra en la
expuesto a continuacin.
Figura 5.4 para el caso de dos variables.
La respuesta estimada en el punto estacionario, Yo' puede ser
x, w, escrita en trminos de bo, del punto estacionario Xo y del vector b de
los coeficientes de primer orden (Ecuacin 5.10).
Yo = bo + X~b + X~BXo
b'
Yo = bo-b'B-1 b/2 + I- -B-I B (-B-I b/2)]
2
X,
sustituyendo: Xo = -B-l b/2
Yo = bo + X~b - X~b/2
Figura 5.4. Ilustracin de la forma cannica para una superficie de
respuesta con dos variables
El origen ha sido trasladado como centro del sistema de
I Yo = bo + X~ b/2 I
respuesta y los ejes de nuevas variables W 1 y W 2 han sido formados. La funcin de respuesta trasladada al nuevo origen Xo, en
La forma de la funcin en trminos de esas variables es llamada trminos del vector Z (Z = X - Xo), equivale, sustituyendo en (5.8) a:
Forma Cannica y es dada por:
2 2 W2
y = bo + (Z' + X~) b + (Z' + X~) B (Z + Xo)
y = Yo +
A A
(lW 1 + n2 W 2 + ..... + nk k (5.9)
Wl, W2, ..., Wk. Consiguindose ejes relacionados con los principales
La reduccin de la superficie de respuesta en la forma cannica
es denominado Anlisis Cannico, cuyo desarrollo metodolgico es
ejes del sistema de contorno. Esta situacin se ilustra en la
expuesto a continuacin.
Figura 5.4 para el caso de dos variables.
La respuesta estimada en el punto estacionario, Yo' puede ser
x, w, escrita en trminos de bo, del punto estacionario Xo y del vector b de
los coeficientes de primer orden (Ecuacin 5.10).
Yo = bo + X~b + X~BXo
b'
Yo = bo-b'B-1 b/2 + I- -B-I B (-B-I b/2)]
2
X,
sustituyendo: Xo = -B-l b/2
Yo = bo + X~b - X~b/2
Figura 5.4. Ilustracin de la forma cannica para una superficie de
respuesta con dos variables
El origen ha sido trasladado como centro del sistema de
I Yo = bo + X~ b/2 I
respuesta y los ejes de nuevas variables W 1 y W 2 han sido formados. La funcin de respuesta trasladada al nuevo origen Xo, en
La forma de la funcin en trminos de esas variables es llamada trminos del vector Z (Z = X - Xo), equivale, sustituyendo en (5.8) a:
Forma Cannica y es dada por:
2 2 W2
y = bo + (Z' + X~) b + (Z' + X~) B (Z + Xo)
y = Yo +
A A
(lW 1 + n2 W 2 + ..... + nk k (5.9)
La ecuacin (5.11) puede ser escrita sustituyendo: Xo = -Bl b/2 caractersticas de la matriz A. La matriz 11 usada en la trans-
= z' formacin es ua matriz ortogonal k x k. Esto es u'u = h. Las ni
Y Yo + [ b + 2BXo + BZ]
(todas reales dado que B es una matriz simtrica), son las constantes
Y = Yo + z' [b + 2B(-B-l b/2 + BZ] que aparecen en la forma cannica mostrada en la ecuacin (5.9). La
matriz W se obtiene por premultiplicacin de Z por 11':
Y = Yo + z' [b - 2BBl (b/2) + BZ]
W = Il'Z
Y = Yo + Z' BZ (5.12)
donde Il = [ur, 1l2, ... , Ilk 1 Y Ili es la i-sima columna de u. Ili se
Esta es la ecuacin cannica de la superficie de respuesta de obtiene de un autovector asociado con ni y normalizado de manera
segundo orden trasladada al nuevo origen (Xl,O,X2,O,..., Xk,O). que la suma de cuadrados de los elementos en Ili sea la unidad,
siendo ste encontrado de la ecuacin:
La Forma Cannica de la ecuacin (5.9) es obtenida de la Forma
Cuadrtica Z'BZ, que debe ser reducida a una expresin que envuelva (B - ni h) Ili = o (5.14)
solamente trminos cuadraticos en las variables Wl, W2,..., Wk. Si
hacemos donde Ilies:
Z = 11
W, donde Il es el vector de medias: (5.13)
La ecuacin (5.11) puede ser escrita sustituyendo: Xo = -Bl b/2 caractersticas de la matriz A. La matriz 11 usada en la trans-
= z' formacin es ua matriz ortogonal k x k. Esto es u'u = h. Las ni
Y Yo + [ b + 2BXo + BZ]
(todas reales dado que B es una matriz simtrica), son las constantes
Y = Yo + z' [b + 2B(-B-l b/2 + BZ] que aparecen en la forma cannica mostrada en la ecuacin (5.9). La
matriz W se obtiene por premultiplicacin de Z por 11':
Y = Yo + z' [b - 2BBl (b/2) + BZ]
W = Il'Z
Y = Yo + Z' BZ (5.12)
donde Il = [ur, 1l2, ... , Ilk 1 Y Ili es la i-sima columna de u. Ili se
Esta es la ecuacin cannica de la superficie de respuesta de obtiene de un autovector asociado con ni y normalizado de manera
segundo orden trasladada al nuevo origen (Xl,O,X2,O,..., Xk,O). que la suma de cuadrados de los elementos en Ili sea la unidad,
siendo ste encontrado de la ecuacin:
La Forma Cannica de la ecuacin (5.9) es obtenida de la Forma
Cuadrtica Z'BZ, que debe ser reducida a una expresin que envuelva (B - ni h) Ili = o (5.14)
solamente trminos cuadraticos en las variables Wl, W2,..., Wk. Si
hacemos donde Ilies:
Z = 11
W, donde Il es el vector de medias: (5.13)
x, w,
silla. Por ejemplo, supngase que nl<O y n2>0; un movimiento del
punto estacionario en el eje W 1 se traducira en una disminucin en la
respuesta obtenida y un movimiento en el eje W2 se correspondera
con un incremento en la respuesta. Esta situacin pudiera implicar en
la prctica, la existencia de un sistema con dos "picos" donde dos
mximos estaran ocurriendo en dos regiones diferentes.
La magnitud de los ni 's puede ofrecer una valiosa informacin
para estudiar el sistema. Por ejemplo para k = 2, YnI y n2 negativos y
In21 considerablemente superior que Inll se tiene un punto esta-
cionario mximo; sin embargo una situacin interesante en este
sistema es la diferencia en sensibilidad de la respuesta con respecto a
las variables Wl y W2. Un movimiento en el eje Wl a partir del punto
estacionario producira un pequeo cambio en la respuesta estimada x,
'comparado con el cambio ocurrido con un movimiento de la misma
magnitud en el eje W2 a partir del punto estacionario mximo o punto Figura 5.5. Ilustracin de una forma cannica con mayor elongacin
estacionario mnimo o punto de silla. Esta situacin se ilustra en la en el eje WI.
Figura 5.5. x,
El extremo de esta situacin para el caso de dos variables es el
denominado punto estacionario ridge, en el cual uno de los ni es igual 65
a cero (Figura 5.6). En la prctica es muy dificil conseguir esta 70
situacin, sin embargo si puede ocurrir un valor muy pequeo de
alguno de los ni con la consecuente aproximacin al punto esta-
70
cionario ridge. Por ejemplo si el punto estacionario fuera un mximo y
ni estuviera muy cercano a cero, el sistema tendra un ptimo no 65
x, w,
silla. Por ejemplo, supngase que nl<O y n2>0; un movimiento del
punto estacionario en el eje W 1 se traducira en una disminucin en la
respuesta obtenida y un movimiento en el eje W2 se correspondera
con un incremento en la respuesta. Esta situacin pudiera implicar en
la prctica, la existencia de un sistema con dos "picos" donde dos
mximos estaran ocurriendo en dos regiones diferentes.
La magnitud de los ni 's puede ofrecer una valiosa informacin
para estudiar el sistema. Por ejemplo para k = 2, YnI y n2 negativos y
In21 considerablemente superior que Inll se tiene un punto esta-
cionario mximo; sin embargo una situacin interesante en este
sistema es la diferencia en sensibilidad de la respuesta con respecto a
las variables Wl y W2. Un movimiento en el eje Wl a partir del punto
estacionario producira un pequeo cambio en la respuesta estimada x,
'comparado con el cambio ocurrido con un movimiento de la misma
magnitud en el eje W2 a partir del punto estacionario mximo o punto Figura 5.5. Ilustracin de una forma cannica con mayor elongacin
estacionario mnimo o punto de silla. Esta situacin se ilustra en la en el eje WI.
Figura 5.5. x,
El extremo de esta situacin para el caso de dos variables es el
denominado punto estacionario ridge, en el cual uno de los ni es igual 65
a cero (Figura 5.6). En la prctica es muy dificil conseguir esta 70
situacin, sin embargo si puede ocurrir un valor muy pequeo de
alguno de los ni con la consecuente aproximacin al punto esta-
70
cionario ridge. Por ejemplo si el punto estacionario fuera un mximo y
ni estuviera muy cercano a cero, el sistema tendra un ptimo no 65
(K o X3) que maximicen, la respuesta (rendimiento) de una especie de donde los estimadoresmnimos cuadrticos de los coeficientes se
inters agronmico, para lo cual se empleo un diseo de bloques al obtienen al resolver el sistema de ecuaciones normales:
azar en un diseo compuesto central rotable con precisin uniforme X'Xb = X'Y
para la estimacin de la superficie de respuesta. Los niveles
en donde b es el vector columna de los coeficientes de regresin, X es
codificados de los factores se muestran en la matriz de diseo (D), as
la matriz de diseo y Y es el vector columna que contiene las
como su correspondiente vector Y de respuesta:
observaciones de la variable respuesta.
-1 -1 -1 1872
Una vez resuelto el sistema, fijamos nuestra funcin polinmica:
-1 -1 1 1921
-1 1 -1 2132
Yi = 2576,45 + 643,76N + 1132,46P + 69,02K + 140,l1N2
-21,87p2 - 27,96K2 + 31NP + 42,62NK - 3,75PK
-1 1 1 1981
1 -1 -1 2723 En este punto se aplica un anlisis de la varianza donde se
prueba la significacin de cada uno de los trminos del modelo, el
1 -1 1 2621
efecto de regresin, la falta de ajuste y efecto aleatorio de bloques
1 1 -1 2931 (Tabla 5.1). El esquema de este anlisis fue incluido en la parte
1 1 1 3132 terica.
-1,682 O O 1431 Para el anlisis de la superficie fijada se tom el criterio de
1,682 O O 4150 inclusin de todos los trminos del modelo, adems se supuso que bajo
D O -1,682 O y 2130 las condiciones de ejecucin del experimento, se ha seleccionado la
regin de exploracin que contiene el mximo. El punto estacionario
O 1,68.2 O 2821
es calculado a travs de la formula:
O O -1,682 2150
Xo = -Bl.b/2
O O 1,682 2721
O O O 2521 -1,399]
x, = [
1,841
O O O 2729
0,389
O O O 1987
O O O 2523
O O O 2321
O O
2470
(K o X3) que maximicen, la respuesta (rendimiento) de una especie de donde los estimadoresmnimos cuadrticos de los coeficientes se
inters agronmico, para lo cual se empleo un diseo de bloques al obtienen al resolver el sistema de ecuaciones normales:
azar en un diseo compuesto central rotable con precisin uniforme X'Xb = X'Y
para la estimacin de la superficie de respuesta. Los niveles
en donde b es el vector columna de los coeficientes de regresin, X es
codificados de los factores se muestran en la matriz de diseo (D), as
la matriz de diseo y Y es el vector columna que contiene las
como su correspondiente vector Y de respuesta:
observaciones de la variable respuesta.
-1 -1 -1 1872
Una vez resuelto el sistema, fijamos nuestra funcin polinmica:
-1 -1 1 1921
-1 1 -1 2132
Yi = 2576,45 + 643,76N + 1132,46P + 69,02K + 140,l1N2
-21,87p2 - 27,96K2 + 31NP + 42,62NK - 3,75PK
-1 1 1 1981
1 -1 -1 2723 En este punto se aplica un anlisis de la varianza donde se
prueba la significacin de cada uno de los trminos del modelo, el
1 -1 1 2621
efecto de regresin, la falta de ajuste y efecto aleatorio de bloques
1 1 -1 2931 (Tabla 5.1). El esquema de este anlisis fue incluido en la parte
1 1 1 3132 terica.
-1,682 O O 1431 Para el anlisis de la superficie fijada se tom el criterio de
1,682 O O 4150 inclusin de todos los trminos del modelo, adems se supuso que bajo
D O -1,682 O y 2130 las condiciones de ejecucin del experimento, se ha seleccionado la
regin de exploracin que contiene el mximo. El punto estacionario
O 1,68.2 O 2821
es calculado a travs de la formula:
O O -1,682 2150
Xo = -Bl.b/2
O O 1,682 2721
O O O 2521 -1,399]
x, = [
1,841
O O O 2729
0,389
O O O 1987
O O O 2523
O O O 2321
O O
2470
i=l i=l i ( j
anlisis requiere las races caractersticas 01, 02, Y 03 de la matriz B,
se precisa entonces, resolver la ecuacin del determinante y se esta interesado en obtener los puntos estacionarios del
modelo, restringiendo los puntos a esferas de radio variable que de
acuerdo a la codificacin usual sera:
(140,11-0) 15,5 21,31 k
i=l i=l i ( j
anlisis requiere las races caractersticas 01, 02, Y 03 de la matriz B,
se precisa entonces, resolver la ecuacin del determinante y se esta interesado en obtener los puntos estacionarios del
modelo, restringiendo los puntos a esferas de radio variable que de
acuerdo a la codificacin usual sera:
(140,11-0) 15,5 21,31 k
otros ensayos complementarios en funcin de los resultados obtenidos Investigadores como Hottelling (1941) citado por Cochran y Cox
en el primero con el cual se logre sucesivamente estudiar el punto (1980) han referido que iguales distanciamiento s, no constituyen en
estacionario y la naturaleza de la superficie vecina. general el procedimiento ms eficiente para localizar el ptimo.
El investigador puede haber realizado un ensayo Cuando los puntos experimentales no definen especificamente la
suficientemente completo con el cual pueda estimar la posicin del mxima respuesta, este punto puede estimarse mediante el siguiente
punto estacionario dentro de la regin de exploracin, en este caso, polinomio de segundo orden:
debe recurrir al anlisis cannico para establecer si el punto A 2
estacionario es un mximo, mnimo o un punto de silla. En este caso Y = bo+ b1X1+ bllX1
la situacin queda solucionada cuando ocurre un mximo o un el ptimo se obtiene por la ecuacin
mnimo; sin embargo, si se produce un punto de silla, es posible que el XlQ = -bl/2bll
experimentador decida examinar nuevos puntos experimentales en la
direccin del mayor o menor segn sea el caso, incremento o En algunas oportunidades el valor de Xi con el cual se obtiene la
decremento de la respuesta. Para examinar el recorrido de los puntos mayor respuesta observada est bastante cercana al ptimo estimado
ptimos se puede utilizar el anlisis de la cordillera o de las lomas. o respuesta mxima estimada (X1O).
Para descubrir la ruta experimental' existen varios mtodos que En el segundo ensayo, Xi se fija al nivel de la mxima respuesta
describiremos a continuacin. estimada (X1O),X2 se ensaya a varios niveles y X3, ... Xk permanece
constante a sus niveles iniciales, con este experimento se trata de
Mtodo del factor nico obtener al nivel ptimo (X20).
En el tercer ensayo se investiga el factor X3 de la misma forma,
El mtodo fue descrito por Friedman y Savage (1947). El los otros factores mantienen los niveles XlO, X20, X41, ... Xkl
investigador hace en primer lugar una estimacin preliminar de la respectivamente. El proceso continua hasta obtener la respuesta
combinacin ptima de los niveles de los factores, el cual se debe ptima (mxima, mnima) para los k factores.
denotar como (X11, X21, ... Xxi). Cada experimento trata con un solo
factor. Los factoresse arreglan en el orden en que sern probados. Lo En este momento ha finalizado la primera etapa de experimen-
conveniente es ir probando los factores de acuerdo a su posible mayor tacin, la combinacin ptima estimada de los factores es (XlQ,X20,...,
contribucin a la respuesta. . XkO).Si esta nueva combinacin de niveles o dosis es parecida al
conjunto inicial (X11, X21,..., Xkl) Y si los valores de la respuesta "Y"
En el primer ensayo todos los factores excepto el primero se han mejorado durante la primera etapa, el investigador puede tomar
mantienen constantes en sus niveles iniciales (X21, X31,..:.,XkI).El la decisin de terminar los ensayos, concluyendo que no es posible
objetivo primordial de este experimento es conseguir el nivel del mejorar apreciablemente la estimacin inicial del ptimo. Si se
factor Xi, el cual maximiza la respuesta a los niveles fijados como producen cambios considerables, se sigue con una segunda etapa.
ptimos de los otros factores, Cochran y Cox (1980) sealan cmo
puede realizarse dicho ensayo. Para establecer un mximo, deben La segunda etapa se inicia con los niveles constantes fijados en
compararse al menos 3 niveles del factor Xi, Son convenientes 4 5 la primera etapa (X1O,X20,X30,... , XkO)y se prueban varios niveles de
niveles si la amplitud de Xi es grande y la posicin de su ptimo casi Xi para determinar si el nivel del punto para Xi ha cambiado del nivel
no se conoce, o realizarse un ensayo inicial con 5 niveles, XlO, conseguido en la primera etapa. Al final de esta etapa se ha
ampliamente espaciados seguidos de un ensayo con 3 niveles con un encontrado un nuevo conjunto de estimaciones o nuevo punto
espaciamiento estrecho. estacionario
,
(X , ,)
10 ,X 20 '''' X kO
230 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 231
otros ensayos complementarios en funcin de los resultados obtenidos Investigadores como Hottelling (1941) citado por Cochran y Cox
en el primero con el cual se logre sucesivamente estudiar el punto (1980) han referido que iguales distanciamiento s, no constituyen en
estacionario y la naturaleza de la superficie vecina. general el procedimiento ms eficiente para localizar el ptimo.
El investigador puede haber realizado un ensayo Cuando los puntos experimentales no definen especificamente la
suficientemente completo con el cual pueda estimar la posicin del mxima respuesta, este punto puede estimarse mediante el siguiente
punto estacionario dentro de la regin de exploracin, en este caso, polinomio de segundo orden:
debe recurrir al anlisis cannico para establecer si el punto A 2
estacionario es un mximo, mnimo o un punto de silla. En este caso Y = bo+ b1X1+ bllX1
la situacin queda solucionada cuando ocurre un mximo o un el ptimo se obtiene por la ecuacin
mnimo; sin embargo, si se produce un punto de silla, es posible que el XlQ = -bl/2bll
experimentador decida examinar nuevos puntos experimentales en la
direccin del mayor o menor segn sea el caso, incremento o En algunas oportunidades el valor de Xi con el cual se obtiene la
decremento de la respuesta. Para examinar el recorrido de los puntos mayor respuesta observada est bastante cercana al ptimo estimado
ptimos se puede utilizar el anlisis de la cordillera o de las lomas. o respuesta mxima estimada (X1O).
Para descubrir la ruta experimental' existen varios mtodos que En el segundo ensayo, Xi se fija al nivel de la mxima respuesta
describiremos a continuacin. estimada (X1O),X2 se ensaya a varios niveles y X3, ... Xk permanece
constante a sus niveles iniciales, con este experimento se trata de
Mtodo del factor nico obtener al nivel ptimo (X20).
En el tercer ensayo se investiga el factor X3 de la misma forma,
El mtodo fue descrito por Friedman y Savage (1947). El los otros factores mantienen los niveles XlO, X20, X41, ... Xkl
investigador hace en primer lugar una estimacin preliminar de la respectivamente. El proceso continua hasta obtener la respuesta
combinacin ptima de los niveles de los factores, el cual se debe ptima (mxima, mnima) para los k factores.
denotar como (X11, X21, ... Xxi). Cada experimento trata con un solo
factor. Los factoresse arreglan en el orden en que sern probados. Lo En este momento ha finalizado la primera etapa de experimen-
conveniente es ir probando los factores de acuerdo a su posible mayor tacin, la combinacin ptima estimada de los factores es (XlQ,X20,...,
contribucin a la respuesta. . XkO).Si esta nueva combinacin de niveles o dosis es parecida al
conjunto inicial (X11, X21,..., Xkl) Y si los valores de la respuesta "Y"
En el primer ensayo todos los factores excepto el primero se han mejorado durante la primera etapa, el investigador puede tomar
mantienen constantes en sus niveles iniciales (X21, X31,..:.,XkI).El la decisin de terminar los ensayos, concluyendo que no es posible
objetivo primordial de este experimento es conseguir el nivel del mejorar apreciablemente la estimacin inicial del ptimo. Si se
factor Xi, el cual maximiza la respuesta a los niveles fijados como producen cambios considerables, se sigue con una segunda etapa.
ptimos de los otros factores, Cochran y Cox (1980) sealan cmo
puede realizarse dicho ensayo. Para establecer un mximo, deben La segunda etapa se inicia con los niveles constantes fijados en
compararse al menos 3 niveles del factor Xi, Son convenientes 4 5 la primera etapa (X1O,X20,X30,... , XkO)y se prueban varios niveles de
niveles si la amplitud de Xi es grande y la posicin de su ptimo casi Xi para determinar si el nivel del punto para Xi ha cambiado del nivel
no se conoce, o realizarse un ensayo inicial con 5 niveles, XlO, conseguido en la primera etapa. Al final de esta etapa se ha
ampliamente espaciados seguidos de un ensayo con 3 niveles con un encontrado un nuevo conjunto de estimaciones o nuevo punto
espaciamiento estrecho. estacionario
,
(X , ,)
10 ,X 20 '''' X kO
232 Chacin I Anlisis de Regresin y Superficies de Respuesta Chacnl Anlisis de Regresin y Superficies de Respuesta 233
Experimentos realizados con el mtodo del factor nico en el X2 -1,9054 0,32372 -5,89 0,000
I
cultivo de la yuca (Manihot esculentum), usando tres factores
nitrgeno, fsforo y potasio (N, P y K respectivamente). Los ensayos R2 = 64,54%
fueron realizados a nivel de umbrculo en un diseo completamente A
Experimentos realizados con el mtodo del factor nico en el X2 -1,9054 0,32372 -5,89 0,000
I
cultivo de la yuca (Manihot esculentum), usando tres factores
nitrgeno, fsforo y potasio (N, P y K respectivamente). Los ensayos R2 = 64,54%
fueron realizados a nivel de umbrculo en un diseo completamente A
Ensayo 2 El modelo
A 2
Y = 25,861 -O,197X2 -1,748X2
Niveles Niveles Observaciones de
codificados reales rendimiento (tlha) Se obtiene el punto mximo de la manera siguiente:
Trat N P K N P K 1 2 3 4
ay I aX2 = -0,197 -3, 496X2 = o
X2 = -0,0565
1 -0,0859 2 -2 96 o O 19,3 21,2 19,2 18,2
Este valor es equivalente a lo siguiente:
2 -0,0859 1 -2 96 25 O 22,1 23,1 22,3 23,4 1 25kglha
0,0565 x ==> x=I,4125 - 1,5
3 -0,0859 O -2 96 50 O 27,3 28,3 28,1 30,1
Por consiguiente con 48,5 kg de fsforo y 96 kg de nitrgeno se
4 -0,0859 1 -2 96 75 O 21,4 22,4 21,3 23,1 obtiene el mximo rendimiento que es de 25,87 tonlha. Se ha
mejorado el rendimiento, continuamos el proceso.
5 -0,0859 2 -2 96 100 17,8 19,3 18,4 20,4
Ensayo 3
El anlisis de varianza obtenido: Niveles Niveles Observaciones de
codificados reales rendimiento
(tonlha)
ANAVAR
Trat N P K N P K 1 2 3 4
F. deV. G.deL. se CM Fc
19,1
1 -0,0859 -0,0565 -2 96 48,5 O 23,2 21,3 20,4
TRAT 4 225,02 56,256 52,53
2 -0,0859 -0,0565 -1 96 48,5 50 26,4 25,8 27,1 25,3
TOTAL
EE 15
19
16,06
241,08
1,070
3 -0,0859 -0,0565 96 48,5 100 21,3 20,4 23,0 20,2
Ensayo 2 El modelo
A 2
Y = 25,861 -O,197X2 -1,748X2
Niveles Niveles Observaciones de
codificados reales rendimiento (tlha) Se obtiene el punto mximo de la manera siguiente:
Trat N P K N P K 1 2 3 4
ay I aX2 = -0,197 -3, 496X2 = o
X2 = -0,0565
1 -0,0859 2 -2 96 o O 19,3 21,2 19,2 18,2
Este valor es equivalente a lo siguiente:
2 -0,0859 1 -2 96 25 O 22,1 23,1 22,3 23,4 1 25kglha
0,0565 x ==> x=I,4125 - 1,5
3 -0,0859 O -2 96 50 O 27,3 28,3 28,1 30,1
Por consiguiente con 48,5 kg de fsforo y 96 kg de nitrgeno se
4 -0,0859 1 -2 96 75 O 21,4 22,4 21,3 23,1 obtiene el mximo rendimiento que es de 25,87 tonlha. Se ha
mejorado el rendimiento, continuamos el proceso.
5 -0,0859 2 -2 96 100 17,8 19,3 18,4 20,4
Ensayo 3
El anlisis de varianza obtenido: Niveles Niveles Observaciones de
codificados reales rendimiento
(tonlha)
ANAVAR
Trat N P K N P K 1 2 3 4
F. deV. G.deL. se CM Fc
19,1
1 -0,0859 -0,0565 -2 96 48,5 O 23,2 21,3 20,4
TRAT 4 225,02 56,256 52,53
2 -0,0859 -0,0565 -1 96 48,5 50 26,4 25,8 27,1 25,3
TOTAL
EE 15
19
16,06
241,08
1,070
3 -0,0859 -0,0565 96 48,5 100 21,3 20,4 23,0 20,2
1 89
X=--
1 ~ 8X
236 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 237
Modelo de regresin obtenido Mtodo de ascenso ms pronunciado o pendiente en ascenso
Variable Coeficiente
regresora regresin El mtodo fue propuesto por Box y Wilson (1951) y establece un
procedimiento que permite pasar de una regin experimental al
Constantes (bo) 22,854 centro de otra subregin con la intencin de encontrar la respuesta
X3 -1,342 mxima. Este procedimiento se puede emplear dentro de un
2 programa de experimentacin secuencial.
X 3 -1,905
Tal como en el mtodo del factor nico, el mximo se localiza
R2 = 61,07% mediante una serie de experimentos cada uno planificado en base a
los resultados del anterior.
El modelo de regresin polinominal cuadrtico sera: Fundamentacin terica
Si se supone que las derivadas de la funcin de respuesta de
y = 22,854 - 1,342X3 -, 1 905X 32
inters son contnuas en la parte interior de una sub-regin
experimental, el inters fundamental estara centrado en movernos
El punto de la mxima respuesta:
de un punto "O" a un punto "p" en el espacio "k" dimensional de
ay / aXa = -1,342 3,810 X3 = o factores, donde la ganancia en la respuesta es mxima en el punto
"p". Sea "d" distancia entre O y p. (Sinha. 1976).
X3 = -1,342/3,810 = -0,352
Se tomar "O" como el origen de un sistema de coordenadas "k"
Este valor es equivalente a lo siguiente: dimensional, por consiguiente la respuesta en el punto "O" sera:
1 50 kglha
0,352 x ==> x = 17,6 - 18 kg/ha 9(0) y en el punto "p" es 9(P) = 9(Xl,. X2,..., XK) Y d2 = L.JXi'2
'"
1 89
X=--
1 ~ 8X
238 Chacn I Anlisis de Regresin y Superficies de Respuesta 239
Chacn I Anlisis de Regresin y Superficies de Respuesta
B.- Direccionalidad de la pendiente en ascenso. De manera tal que el cambio de Xi en busca de la maxima
?uando ha terminado el primer experimento, la regin pendiente es proporcional a b., considerando por supuesto que la
expenmental se cambia a otra. Este ltimo conjunto se cambia a una ecuacin lineal es valida.
regin donde se procura encontrar el mximo incremento esperado de C.- Prueba de una investigacin factorial simple en algn punto del
la respuesta. Si el centro de los niveles del primer ensayo se toma transito hacia la mxima pendiente.
como el origen del segundo, el problema es como transitar de X (O, O, =
....0) a la posicin "p" con coordenadas (X1',X2', ... , Xk') de manera El objetivo es conseguir si el incremento de la respuesta pre-
que la respuesta sea mxima. dicha realmente se efecta. La magnitud de la distancia a recorrer la
fija el investigador de acuerdo con su criterio. Recorridos rela-
El cambio en 8 va a depender de la amplitud de cambio de "O" a tivamente muy grandes pueden dar origen a que sobrepasemos la
"p". La distancia "d" de "O" a "p" se define como se ha referido regin estacionaria o semiestacionaria. Si el rendimiento verdadero
del nuevo experimento est cercano al predicho, se d otro salto.
Se conduce un nuevo experimento factorial Zs, con el centro en el
ltimo punto del experimento anterior, si la regresin lineal se ajusta
Con el supuesto de que el investigador ha seleccionado la
satisfactoriamente a los nuevos datos, se encuentra un nuevo
distancia "d" que determina los valores de X' que maximizan la recorrido a la mxima pendiente y las pruebas se hacen a este nuevo
superficie de respuesta 8(Xl, Xz, ... , Xi). El recorrido de la pendiente recorrido.
en ascenso es aquel que va desde "O" hasta "p" cuyas coordenadas
maximiza a X'. A medida que se efectan estos experimentos se puede llegar a
I
uno de los siguientes resultados (Cochran y Cox, 1980).
Se haba referido-que el valor que maximiza a Xi es 1.- La regresin lineal an parece ajustarse, pero los coeficientes "bi"
1 08 son pequeos. Esto sugiere que se ha llegado a una regin
X=--
u sx,
(i = 1,.2, ... k) semiestacionaria.
2.- Los trminos de la falta de ajuste muestran que la aproximacin
donde: lineal es inadecuada. Esto implica que se ha llegado a una regin
l/2
en la cual la curvatura de la superficie debe tomarse en cuenta.
f..l=
[ I8~(p) J En estos casos se deben usar posteriormente diseos de segundo
orden en los cuales la superficie 8 se aproxima por una funcin
cuadrtica de las variables regresaras.
d
D.- Correccin de errores en la escogencia de los niveles del primer
experimento.
8 puede representarse mediante la ecuacin:
Este paso se realiza si la eleccin de los niveles del primer
8 = 80 +blXli + bzX2i+ ... + bkXki experimento ha sido inapropiada y es necesario hacer la debida
correccin.
donde 80es el valor de 8 en el origen.
Cuando una variable o factor, muestra un efecto pequeo en el
De la relacin funcional lineal se tiene que: primer experimento y el cambio en los niveles o dosis se considera
pequeo, se debe hacer un cambio mayor en las dosis o cantidades de
o 810 X, = b, tal manera que esto permita el recorrido de la mxima pendiente en
240 ChacnI Anlisisde Regresiny Superficiesde Respuesta ChacnI Anlisisde Regresiny Superficiesde Respuesta 241
B.- Direccionalidad de la pendiente en ascenso. De manera tal que el cambio de Xi en busca de la maxima
?uando ha terminado el primer experimento, la regin pendiente es proporcional a b., considerando por supuesto que la
expenmental se cambia a otra. Este ltimo conjunto se cambia a una ecuacin lineal es valida.
regin donde se procura encontrar el mximo incremento esperado de C.- Prueba de una investigacin factorial simple en algn punto del
la respuesta. Si el centro de los niveles del primer ensayo se toma transito hacia la mxima pendiente.
como el origen del segundo, el problema es como transitar de X (O, O, =
....0) a la posicin "p" con coordenadas (X1',X2', ... , Xk') de manera El objetivo es conseguir si el incremento de la respuesta pre-
que la respuesta sea mxima. dicha realmente se efecta. La magnitud de la distancia a recorrer la
fija el investigador de acuerdo con su criterio. Recorridos rela-
El cambio en 8 va a depender de la amplitud de cambio de "O" a tivamente muy grandes pueden dar origen a que sobrepasemos la
"p". La distancia "d" de "O" a "p" se define como se ha referido regin estacionaria o semiestacionaria. Si el rendimiento verdadero
del nuevo experimento est cercano al predicho, se d otro salto.
Se conduce un nuevo experimento factorial Zs, con el centro en el
ltimo punto del experimento anterior, si la regresin lineal se ajusta
Con el supuesto de que el investigador ha seleccionado la
satisfactoriamente a los nuevos datos, se encuentra un nuevo
distancia "d" que determina los valores de X' que maximizan la recorrido a la mxima pendiente y las pruebas se hacen a este nuevo
superficie de respuesta 8(Xl, Xz, ... , Xi). El recorrido de la pendiente recorrido.
en ascenso es aquel que va desde "O" hasta "p" cuyas coordenadas
maximiza a X'. A medida que se efectan estos experimentos se puede llegar a
I
uno de los siguientes resultados (Cochran y Cox, 1980).
Se haba referido-que el valor que maximiza a Xi es 1.- La regresin lineal an parece ajustarse, pero los coeficientes "bi"
1 08 son pequeos. Esto sugiere que se ha llegado a una regin
X=--
u sx,
(i = 1,.2, ... k) semiestacionaria.
2.- Los trminos de la falta de ajuste muestran que la aproximacin
donde: lineal es inadecuada. Esto implica que se ha llegado a una regin
l/2
en la cual la curvatura de la superficie debe tomarse en cuenta.
f..l=
[ I8~(p) J En estos casos se deben usar posteriormente diseos de segundo
orden en los cuales la superficie 8 se aproxima por una funcin
cuadrtica de las variables regresaras.
d
D.- Correccin de errores en la escogencia de los niveles del primer
experimento.
8 puede representarse mediante la ecuacin:
Este paso se realiza si la eleccin de los niveles del primer
8 = 80 +blXli + bzX2i+ ... + bkXki experimento ha sido inapropiada y es necesario hacer la debida
correccin.
donde 80es el valor de 8 en el origen.
Cuando una variable o factor, muestra un efecto pequeo en el
De la relacin funcional lineal se tiene que: primer experimento y el cambio en los niveles o dosis se considera
pequeo, se debe hacer un cambio mayor en las dosis o cantidades de
o 810 X, = b, tal manera que esto permita el recorrido de la mxima pendiente en
242 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 243
experimentos posteriores. Si el factor no produce efecto, esto se aclara 3.- Algunas races caractersticas son positivas y otras negativas. Se
posteriormente incluso hasta eliminar dicho factor. En forma ha obtenido un punto de silla o Minimax, siendo mnimo el punto
alternativa Cochran y Cox (1980) recomiendan un ensayo confir- estacionario para unas variables de "X" y mximo para otras. Si
matorio, manteniendo los otros factores fijos a sus mejores niveles. este es el caso, se espera que la respuesta se incremente ms
Si la amplitud o distancia entre las dosis es muy alta, de rpidamente a medida que se incremente~ las variables. regre-
soras "X" que tienen la ms alta Ai (positiva). Puede incluso
manera que la respuesta al factor es curvilinea en el intervalo entre
los dos niveles estudiados, el error cometido se revelar en la probarse varias combinaciones que den valores incrementados a
regresin obtenida, por la significacin de la falta de ajuste. En este este "Xi".
caso el investigador disear experimentos que le permitan obtener la 4.- La superficie cuadrtica no se ajusta, La solucin para este caso
respuesta cuadrtica como los diseos de segundo orden. particular es variable: .
E.- Simplificacin de la superficie cuadrtica. Adicin de puntos para estudiar la superficie cbica.
Cuando se ha logrado obtener el modelo polinomial de segundo Nuevos experimentos en la regin vecina de un punto de
orden, el punto estacionario se calcula diferenciando la respuesta relativa alta respuesta con amplitudes pequeas entre los
predicha con respecto a los valores de X tal como referimos en factores.
secciones anteriores de este capitulo.
Si las soluciones en el punto estacionario la denotamos "Xa", El mtodo de la pendiente ascendente tiene la desventaja de que
A
sto permite encontrar el punto estacionario" Yo" y posteriormente se no es invariante ante cambios de escala, condicin que da lugar a
diferentes rutas. (Martnez Garza, 1988).
simplifica la ecuacin cannica (ya descrita).
F.- Interpretacin y ensayos adicionales.
Ejemplo ilustrativo
Una vez realizado los experimentos y analizados los resultados
se pueden presentar las siguientes situaciones.
1.- Todas las races caractersticas Ai son negativas, en este caso la Un ingeniero agrnomo especialista en agroindustria est
superficie cuadrtica tiene un mximo. Si el punto esta dentro de interesado en determinar los valores de tiempo y temperatura que
la regin de exploracin se ha tenido xito en la obtencin de la maximizan el rendimiento de una reaccin qiimica. Inicialmente se
mxima respuesta. Es conveniente realizar posteriores pruebas trabajo con un tiempo de 35 minutos a una temperatura de 70C sto
de validacin del mximo y de la superficie de respuesta. produce un rendimiento cercano al 50%. Se aplic en este caso el
Tambin, el anlisis grfico es una ayuda muy valiosa para la mtodo de la pendiente en ascenso.
interpretacin, tal como lo hemos referido en secciones anterio-
res.
1.- El primer experimento se dise en un factorial z'' aumenta~o en
2.- Todas las races caractersticas Ai, son negativas pero el punto
5 puntos centrales. Las observaciones repetidas del tratamIento
mximo se determina fuera de la regin de exploracin. En este control sirven para estimar el error experimental (Tabla 5.2).
caso es aconsejable proceder a moverse en la direccin del
mximo estimado. Si este camino conduce a valores variables, es
conveniente realizar otros ensayos para ajustar una nueva
superficie, considerando los resultados de la primera.
242 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 243
experimentos posteriores. Si el factor no produce efecto, esto se aclara 3.- Algunas races caractersticas son positivas y otras negativas. Se
posteriormente incluso hasta eliminar dicho factor. En forma ha obtenido un punto de silla o Minimax, siendo mnimo el punto
alternativa Cochran y Cox (1980) recomiendan un ensayo confir- estacionario para unas variables de "X" y mximo para otras. Si
matorio, manteniendo los otros factores fijos a sus mejores niveles. este es el caso, se espera que la respuesta se incremente ms
Si la amplitud o distancia entre las dosis es muy alta, de rpidamente a medida que se incremente~ las variables. regre-
soras "X" que tienen la ms alta Ai (positiva). Puede incluso
manera que la respuesta al factor es curvilinea en el intervalo entre
los dos niveles estudiados, el error cometido se revelar en la probarse varias combinaciones que den valores incrementados a
regresin obtenida, por la significacin de la falta de ajuste. En este este "Xi".
caso el investigador disear experimentos que le permitan obtener la 4.- La superficie cuadrtica no se ajusta, La solucin para este caso
respuesta cuadrtica como los diseos de segundo orden. particular es variable: .
E.- Simplificacin de la superficie cuadrtica. Adicin de puntos para estudiar la superficie cbica.
Cuando se ha logrado obtener el modelo polinomial de segundo Nuevos experimentos en la regin vecina de un punto de
orden, el punto estacionario se calcula diferenciando la respuesta relativa alta respuesta con amplitudes pequeas entre los
predicha con respecto a los valores de X tal como referimos en factores.
secciones anteriores de este capitulo.
Si las soluciones en el punto estacionario la denotamos "Xa", El mtodo de la pendiente ascendente tiene la desventaja de que
A
sto permite encontrar el punto estacionario" Yo" y posteriormente se no es invariante ante cambios de escala, condicin que da lugar a
diferentes rutas. (Martnez Garza, 1988).
simplifica la ecuacin cannica (ya descrita).
F.- Interpretacin y ensayos adicionales.
Ejemplo ilustrativo
Una vez realizado los experimentos y analizados los resultados
se pueden presentar las siguientes situaciones.
1.- Todas las races caractersticas Ai son negativas, en este caso la Un ingeniero agrnomo especialista en agroindustria est
superficie cuadrtica tiene un mximo. Si el punto esta dentro de interesado en determinar los valores de tiempo y temperatura que
la regin de exploracin se ha tenido xito en la obtencin de la maximizan el rendimiento de una reaccin qiimica. Inicialmente se
mxima respuesta. Es conveniente realizar posteriores pruebas trabajo con un tiempo de 35 minutos a una temperatura de 70C sto
de validacin del mximo y de la superficie de respuesta. produce un rendimiento cercano al 50%. Se aplic en este caso el
Tambin, el anlisis grfico es una ayuda muy valiosa para la mtodo de la pendiente en ascenso.
interpretacin, tal como lo hemos referido en secciones anterio-
res.
1.- El primer experimento se dise en un factorial z'' aumenta~o en
2.- Todas las races caractersticas Ai, son negativas pero el punto
5 puntos centrales. Las observaciones repetidas del tratamIento
mximo se determina fuera de la regin de exploracin. En este control sirven para estimar el error experimental (Tabla 5.2).
caso es aconsejable proceder a moverse en la direccin del
mximo estimado. Si este camino conduce a valores variables, es
conveniente realizar otros ensayos para ajustar una nueva
superficie, considerando los resultados de la primera.
Chacn/ Anlisisde Regresiny Superficiesde Respuesta 245
244 Chacn/ Anlisisde Regresiny Superficiesde Respuesta
Estimacin del error experimental
Tabla 5.2. Datos del primer ensayo para ajustar un modelo de primer
(50,3)2 + (50;ll + (50,3)2 + (50,6)2 + (50,1)2 - (50,3 + 50,1 + 50,3 + 50,6 + 50,1)2/5
orden.
A
0'=
4
Niveles Codificadas Niveles Reales Respuesta
Xl Xz Xl X2 y e? = 0,168/4 = 0,0452
-1 -1 30 65 49,3 El modelo polinomial del primer orden supone que las variables
Xl y Xz tienen efectos aditivos sobre la respuesta.
-1 1 30 75 50,0
La estimacin mnimo cuadrada de ~12es bia
1 -1 40 65 50,8
b12 = -0,24784*10'10
1 1 40 75 51,5
La suma de cuadrados para la interaccin
35 70 50,3
35 70 50,1
SCXlM = 0,24*10-20 con un grado de libertad
50,3
CMXlM = SCXlM/1 = 0,24*10-20
35
35
70
70 50,6
una prueba de F de las interacciones con el residual nos permite
35 70 50,1
obtener la prueba estadstica de la falta de ajuste.
F = CMXlX2/CMresidual = 0,24*10.20/0,042< 1 ns
0'=
4
Niveles Codificadas Niveles Reales Respuesta
Xl Xz Xl X2 y e? = 0,168/4 = 0,0452
-1 -1 30 65 49,3 El modelo polinomial del primer orden supone que las variables
Xl y Xz tienen efectos aditivos sobre la respuesta.
-1 1 30 75 50,0
La estimacin mnimo cuadrada de ~12es bia
1 -1 40 65 50,8
b12 = -0,24784*10'10
1 1 40 75 51,5
La suma de cuadrados para la interaccin
35 70 50,3
35 70 50,1
SCXlM = 0,24*10-20 con un grado de libertad
50,3
CMXlM = SCXlM/1 = 0,24*10-20
35
35
70
70 50,6
una prueba de F de las interacciones con el residual nos permite
35 70 50,1
obtener la prueba estadstica de la falta de ajuste.
F = CMXlX2/CMresidual = 0,24*10.20/0,042< 1 ns
En la Figura 5.7 se realiza el grfico del rendimiento en la ruta La ecuacin de regresin de primer orden ajustada a los datos
del mximo en ascenso. codificados es:
A
100,----------- -,
Y = 85,367 + 210XI + 120M
En la Figura 5.7 se realiza el grfico del rendimiento en la ruta La ecuacin de regresin de primer orden ajustada a los datos
del mximo en ascenso. codificados es:
A
100,----------- -,
Y = 85,367 + 210XI + 120M
LlXi = ~)~/~XJ i=1,2, ...k j=1,2, ...k Tabla 5.7. Datos obtenidos con un diseo compuesto central rotable
K = 2, no =
5 (Ensayo 3).
Codificadas Reales Respuesta
3. Se convierte ~i de variables codificadas a las reales. Xl Xz Xl X2 y
LlXi = ~)~/~XJ i=1,2, ...k j=1,2, ...k Tabla 5.7. Datos obtenidos con un diseo compuesto central rotable
K = 2, no =
5 (Ensayo 3).
Codificadas Reales Respuesta
3. Se convierte ~i de variables codificadas a las reales. Xl Xz Xl X2 y
El modelo Tabla 5.10. Anlisis del Modelo Polinomial cuadrtico reducido del
ensayo 3.
A 2 2
Y = 87,56 + 2,72Xl + 1,77X2- 4,07 Xl -2,29 X2 -0,3XIM Variable Coeficiente Error t P
regresara de regresin estandar
El anlisis de varianza se muestra en la Tabla 5.9.
Constantetbo) 87,560 0,823 106,28 0,0000
Tabla 5.9 Anlisis de Varianza para el modelo de segundo orden del
ensayo 3. Xl 2,721 0,651 4,18 0,0041
M 1,776 0,651 2,73 0,0294
F. de V. G. de L. SC CM Fc
X21 -4,074 0,698 -5,83 0,0006
Regresin 5 222,38 44,475 13,11**
X2 -2,298 0,698 -3,29 0,0133
2
Residual 7 23,75 3,393
Falta de ajuste
R2 = 90,20% R2.
a.J
= 8330%
'
3 14,01 4,673 1,92 ns
Error puro 4 0,03 2,433 Determinacin del mximo
ay
Total 12 246,13
aX1
= 2,721 - 8,149XI = => Xl =
2,721
8,149
= 0,334
El modelo Tabla 5.10. Anlisis del Modelo Polinomial cuadrtico reducido del
ensayo 3.
A 2 2
Y = 87,56 + 2,72Xl + 1,77X2- 4,07 Xl -2,29 X2 -0,3XIM Variable Coeficiente Error t P
regresara de regresin estandar
El anlisis de varianza se muestra en la Tabla 5.9.
Constantetbo) 87,560 0,823 106,28 0,0000
Tabla 5.9 Anlisis de Varianza para el modelo de segundo orden del
ensayo 3. Xl 2,721 0,651 4,18 0,0041
M 1,776 0,651 2,73 0,0294
F. de V. G. de L. SC CM Fc
X21 -4,074 0,698 -5,83 0,0006
Regresin 5 222,38 44,475 13,11**
X2 -2,298 0,698 -3,29 0,0133
2
Residual 7 23,75 3,393
Falta de ajuste
R2 = 90,20% R2.
a.J
= 8330%
'
3 14,01 4,673 1,92 ns
Error puro 4 0,03 2,433 Determinacin del mximo
ay
Total 12 246,13
aX1
= 2,721 - 8,149XI = => Xl =
2,721
8,149
= 0,334
Tabla 5.11 Comparacin de mtodos para encontrar un mximo en en todas las etapas, para el mtodo de la superficie en ascenso o de la
cuatro superficies de respuesta. mxima pendiente.
Mtodo 1 2 3 4
Mtodo secuencial sugerido por el autor para experimentos
Factor nico 0,990 0,984 0,926 0,984
agrcolas y otros campos de la ciencia.
Mxima pendiente 0,993 0,989 0,979 0,985
Factorial 0,955 0,977 0,927 0,976 En la mayora de los experimentos agrcolas, con la excepcin de
los ensayos en laboratorio o en la Agroindustria, reunir las
Al azar 0,902 0,911 0,913 0,936 condiciones para desarrollar el mtodo de la mxima pendiente de la
Fuente: Cochran y Cox (1980) pendiente en ascenso como son fundamentalmente: 1) Errores
pequeos y 2) Experimentos secuenciales en cortos periodos; son
El mximo verdadero para cada superficie fue 1, por sumamente dificiles. El investigador agrcola generalmente lo que
consiguiente todos los mtodos resultaron apropiados y el mtodo de hace son experimentos nicos, tratando a travs de dichos
la pendiente en ascenso fue el mejor en las superficies. (figura 5.8). El experimentos conseguir una buena aproximacin de la superficie de
mtodo del factor nico fue casi tan bueno en todas las superficies respuesta verdadera, sin embargo, en la mayora de los casos se
excepto en la tercera. Este es el caso, refiere Cochran y Cox (1980) en consigue que la superficie estimada no ajusta apropiadamente los
el cual una de las races caractersticas (A.) en la forma cannica de la datos, obtenindose resultados insatisfactorios.
aproximacin cuadratica es pequea. Esta es la situacin de lomas
Por consiguiente parece necesaria una investigacin previa que
ascendentes en el cual el mtodo del factor nico hace leves progresos
permita ajustar mas adecuadamente los niveles de los factores
despus de la primera etapa. El mtodo del experimento nico con el
obviando las dificultades del mtodo de la pendiente en ascenso.
factorial fue consistentemente inferior a los dos mtodos anteriores
Debido a lo expresado anteriormente sugiere la aplicacin del mtodo
(secuenciales), excepto en la superficie 3, que llega a ser casi igual al
descrito a continuacin.
mtodo del factor nico. Una dificultad evidente con este mtodo es
que la superficie polinomial (cuadrtica o cbica) no ajust los datos 1.- Iniciar el proceso con un experimento 1 que denominaremos
J
o
..
...
5 2 -2 -2 ............ -2
256 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacin I Anlisis de Regresin y Superficies de Respuesta 257
Tabla 5.11 Comparacin de mtodos para encontrar un mximo en en todas las etapas, para el mtodo de la superficie en ascenso o de la
cuatro superficies de respuesta. mxima pendiente.
Mtodo 1 2 3 4
Mtodo secuencial sugerido por el autor para experimentos
Factor nico 0,990 0,984 0,926 0,984
agrcolas y otros campos de la ciencia.
Mxima pendiente 0,993 0,989 0,979 0,985
Factorial 0,955 0,977 0,927 0,976 En la mayora de los experimentos agrcolas, con la excepcin de
los ensayos en laboratorio o en la Agroindustria, reunir las
Al azar 0,902 0,911 0,913 0,936 condiciones para desarrollar el mtodo de la mxima pendiente de la
Fuente: Cochran y Cox (1980) pendiente en ascenso como son fundamentalmente: 1) Errores
pequeos y 2) Experimentos secuenciales en cortos periodos; son
El mximo verdadero para cada superficie fue 1, por sumamente dificiles. El investigador agrcola generalmente lo que
consiguiente todos los mtodos resultaron apropiados y el mtodo de hace son experimentos nicos, tratando a travs de dichos
la pendiente en ascenso fue el mejor en las superficies. (figura 5.8). El experimentos conseguir una buena aproximacin de la superficie de
mtodo del factor nico fue casi tan bueno en todas las superficies respuesta verdadera, sin embargo, en la mayora de los casos se
excepto en la tercera. Este es el caso, refiere Cochran y Cox (1980) en consigue que la superficie estimada no ajusta apropiadamente los
el cual una de las races caractersticas (A.) en la forma cannica de la datos, obtenindose resultados insatisfactorios.
aproximacin cuadratica es pequea. Esta es la situacin de lomas
Por consiguiente parece necesaria una investigacin previa que
ascendentes en el cual el mtodo del factor nico hace leves progresos
permita ajustar mas adecuadamente los niveles de los factores
despus de la primera etapa. El mtodo del experimento nico con el
obviando las dificultades del mtodo de la pendiente en ascenso.
factorial fue consistentemente inferior a los dos mtodos anteriores
Debido a lo expresado anteriormente sugiere la aplicacin del mtodo
(secuenciales), excepto en la superficie 3, que llega a ser casi igual al
descrito a continuacin.
mtodo del factor nico. Una dificultad evidente con este mtodo es
que la superficie polinomial (cuadrtica o cbica) no ajust los datos 1.- Iniciar el proceso con un experimento 1 que denominaremos
J
o
..
...
5 2 -2 -2 ............ -2
258 Chacn I Anlisisde Regresiny Superficiesde Respuesta
Chacn I Anlisisde Regresiny Superficiesde Respuesta 259
Los pasos del anlisis estadsticos sern los mismos del Tabla 5.12. Resultados del experimento 1 utilizando el mtodo de
experimento 1 y un quinto paso que seria: comparacin de los experimentacin secuencial sugerido por el autor.
resultados del experimento 1 y 2.
Ensayo1
En este caso puede ocurrir que:
Tratamiento Niveles Codificados Observaciones deY
a) La respuesta en cada uno de los experimentos sean similares. En
este caso se utilizan estos niveles como el tratamiento central del Xl X2 1 2 3 4 5
experimento 3. 1 -2 -2 1,4 1,3 1,6 1,3 1,6
b) La respuesta en cada uno de los experimentos sean diferentes. En 2 -1 -2 1,9 1,7 1,9 1,6 1,9
este caso se utilizan ambos niveles en el experimento 3, como 3 2,3 2,1 2,3 2,1 2,3
niveles intermedios, por ejemplo, si el experimento 3 tiene los
niveles (-a, -1, 0, 1, a) para cada factor, los niveles obtenidos con el 4
1 -2
-2 2,8 2,4 2,6 2,7 2,9
experimento 1 y 2 se utilizarn como niveles (-1 y 1) en el 5 2 -2 1,9 1,6 2,1 2,0 2,1
experimento 3, salvo que los niveles encontrados en estos
experimentos sean extremos o se encuentren fuera de la regin de
exploracin. En este caso el investigador debe utilizar criterios Ensayoz
aproximados para la seleccin de los niveles en el experimento 3. Tratamiento Niveles Codificados Observaciones deY
3.- Experimento 3. Xl M 1 2 3 4 5
Experimento realizado preferiblemente con un diseo de 1 -2 -2 2,5 2,2 2,4 2,3 2,6
superficie de respuesta,' Compuesto Central, San Cristbal, doble 2 -2 -1 2,9 2,6 2,7 2,8 2,7
Estrella, etc. Cualquiera de los que estudiaremos posteriormente con
3 3,1 3,2 3,4 3,1 3,0
el objeto de ajustar la superficie de respuesta y de esta forma obtener
los puntos ptimos, fsicos, econmicos y la naturaleza de la 4
-2
-2
1 2,4 2,1 2,4 2,8 2,5
superficie. 2,1 2,2
5 -2 2 2,1 1,9 2,0
En algunas reas de la agricultura por las caractersticas
propias, podra obviarse la realizacin del experimento comprobatorio
y pasar directamente al experimento 3 para ajustar la superficie de ANALISIS ESTADISTICO
respuesta, utilizando como tratamiento central los niveles ptimos
obtenidos en el experimento 1. 1.- Anlisis de varianza para cada uno de los "k" ensayos
1.1.- Anlisis de la varianza (Ensayo 1).
Ejemplo ilustrativo del mtodo
F. deV. G. deL. SC CM Fc
A. Experimento 1. Un experimento realizado en laboratorio de
cultivo de tejidos con el objetivo de encontrar una superficie de Trat. 4 4,333 1,083 40,43
respuesta entre el peso de las races (Y) y dos variables predctoras; EE 20 0,540 0,027
Xl = ppm de Hormona A y M = ppm de hormona B.
Total 24 4,873
El experimento 1, esta constituido por dos ensayos que fueron
planificados completamente al azar, con 5 niveles en cada variable
regresara y en cada uno de los ensayos. A continuacin describiremos
los resultados (Tabla 5.12).
260 Chacn I Anlisis de Regresin y Superficies de Respuesta 261
Chacn I Anlisis de Regresin y Superficies de Respuesta
Los pasos del anlisis estadsticos sern los mismos del Tabla 5.12. Resultados del experimento 1 utilizando el mtodo de
experimento 1 y un quinto paso que seria: comparacin de los experimentacin secuencial sugerido por el autor.
resultados del experimento 1 y 2.
Ensayo1
En este caso puede ocurrir que:
Tratamiento Niveles Codificados Observaciones deY
a) La respuesta en cada uno de los experimentos sean similares. En
este caso se utilizan estos niveles como el tratamiento central del Xl X2 1 2 3 4 5
experimento 3. 1 -2 -2 1,4 1,3 1,6 1,3 1,6
b) La respuesta en cada uno de los experimentos sean diferentes. En 2 -1 -2 1,9 1,7 1,9 1,6 1,9
este caso se utilizan ambos niveles en el experimento 3, como 3 2,3 2,1 2,3 2,1 2,3
niveles intermedios, por ejemplo, si el experimento 3 tiene los
niveles (-a, -1, 0, 1, a) para cada factor, los niveles obtenidos con el 4
1 -2
-2 2,8 2,4 2,6 2,7 2,9
experimento 1 y 2 se utilizarn como niveles (-1 y 1) en el 5 2 -2 1,9 1,6 2,1 2,0 2,1
experimento 3, salvo que los niveles encontrados en estos
experimentos sean extremos o se encuentren fuera de la regin de
exploracin. En este caso el investigador debe utilizar criterios Ensayoz
aproximados para la seleccin de los niveles en el experimento 3. Tratamiento Niveles Codificados Observaciones deY
3.- Experimento 3. Xl M 1 2 3 4 5
Experimento realizado preferiblemente con un diseo de 1 -2 -2 2,5 2,2 2,4 2,3 2,6
superficie de respuesta,' Compuesto Central, San Cristbal, doble 2 -2 -1 2,9 2,6 2,7 2,8 2,7
Estrella, etc. Cualquiera de los que estudiaremos posteriormente con
3 3,1 3,2 3,4 3,1 3,0
el objeto de ajustar la superficie de respuesta y de esta forma obtener
los puntos ptimos, fsicos, econmicos y la naturaleza de la 4
-2
-2
1 2,4 2,1 2,4 2,8 2,5
superficie. 2,1 2,2
5 -2 2 2,1 1,9 2,0
En algunas reas de la agricultura por las caractersticas
propias, podra obviarse la realizacin del experimento comprobatorio
y pasar directamente al experimento 3 para ajustar la superficie de ANALISIS ESTADISTICO
respuesta, utilizando como tratamiento central los niveles ptimos
obtenidos en el experimento 1. 1.- Anlisis de varianza para cada uno de los "k" ensayos
1.1.- Anlisis de la varianza (Ensayo 1).
Ejemplo ilustrativo del mtodo
F. deV. G. deL. SC CM Fc
A. Experimento 1. Un experimento realizado en laboratorio de
cultivo de tejidos con el objetivo de encontrar una superficie de Trat. 4 4,333 1,083 40,43
respuesta entre el peso de las races (Y) y dos variables predctoras; EE 20 0,540 0,027
Xl = ppm de Hormona A y M = ppm de hormona B.
Total 24 4,873
El experimento 1, esta constituido por dos ensayos que fueron
planificados completamente al azar, con 5 niveles en cada variable
regresara y en cada uno de los ensayos. A continuacin describiremos
los resultados (Tabla 5.12).
262 Chacn I Anlisis de Regresin y Superficies de Respuesta Chacn I Anlisis de Regresin y Superficies de Respuesta 263
y / 1) X2 =- 0,118 0,397X2 =
5,440
X2 = - 0,118/0,397 = - 0,297
Total 24
4.- Interpretacin conjunta
2.- Anlisis de Regresin para cada uno de los "k" ensayos De acuerdo con los resultados del experimento 1, que incluye
efectos independientes de las dos variables bajo estudio, el punto
2.1.- Anlisis de Regrestn (Ensayo 1)
ptimo de la variable respuesta se obtiene con valores codificados de
Variable Coeficiente Error t p =
Xi 0,609 Y Xz =-
0,297.
Regresora de Regresin estandar
Constante (bo) 2,3246 0,079743 29,15 0,0000 B.- Experimento 2. (Experimento comprobatorio) Los resultados del
0,0000 experimento 2 aparecen a continuacin (Tabla 5.13).
Xl 0,1880 0,036183 5,28
-0,1542 0,030588 -5,05 0,0000
X21 Tabla 5.13. Resultados del experimento 2 utilizando el mtodo de
experimentacin secuencial sugerida por el autor
RZ = 70,45% RZ.
a, = 6776%
, Cp= 3 CMresid = 0,06546
Ensayo1
2.2.- Anlisis de Regresin (Ensayo 2)
Tratamiento Niveles codificados Observaciones de Y
Variable Coeficiente Error t p
Regresora de Regresin estandar Xl Xz 1 2 3 4 5
1)
A
y / 1) X2 =- 0,118 0,397X2 =
5,440
X2 = - 0,118/0,397 = - 0,297
Total 24
4.- Interpretacin conjunta
2.- Anlisis de Regresin para cada uno de los "k" ensayos De acuerdo con los resultados del experimento 1, que incluye
efectos independientes de las dos variables bajo estudio, el punto
2.1.- Anlisis de Regrestn (Ensayo 1)
ptimo de la variable respuesta se obtiene con valores codificados de
Variable Coeficiente Error t p =
Xi 0,609 Y Xz =-
0,297.
Regresora de Regresin estandar
Constante (bo) 2,3246 0,079743 29,15 0,0000 B.- Experimento 2. (Experimento comprobatorio) Los resultados del
0,0000 experimento 2 aparecen a continuacin (Tabla 5.13).
Xl 0,1880 0,036183 5,28
-0,1542 0,030588 -5,05 0,0000
X21 Tabla 5.13. Resultados del experimento 2 utilizando el mtodo de
experimentacin secuencial sugerida por el autor
RZ = 70,45% RZ.
a, = 6776%
, Cp= 3 CMresid = 0,06546
Ensayo1
2.2.- Anlisis de Regresin (Ensayo 2)
Tratamiento Niveles codificados Observaciones de Y
Variable Coeficiente Error t p
Regresora de Regresin estandar Xl Xz 1 2 3 4 5
1)
A
ANALISIS ESTADISTICO 3.- Obtencin de los puntos ptimos o estacionarios para cada
uno de los "k".ensayos
1 Anlisis de varianza para cada uno de los "k" ensayos
Ensayo 1
1.1.- Anlisis de la varianza (Ensayo 1).
A 2
F.deV. G.deL. SC CM Fc Y = 3,809 - 0,07XI - 0,272 Xl
Trat 4 6,869 1,719 35,48**
A
O Y / O X. =- 0,07 - 0,545XI =
EE 20 0,968 0,048 Xl = - 0,07/0,545 = - 0,128
Total 24 7,837 Ensayo 2
2
Y = 3,118 - 0,044X2 - 0,314X2
A
R2 = 69,62% R!j = 66,86% Cp = 3 CMResid. = 0,010 De acuerdo a estos resultados el nivel ptimo de una variable
depende de la cantidad a la cual se encuentra la otra variable. En el
2.2.- Anlisis de Regresin (Ensayo 2 )
primer experimento la cantidad de la variable Xi que optimiza la
Variable regresara Coeficiente Error t P respuesta es de 0,609 (Valor Codificado), cuando X2 est a su nivel
de regresin estandar mnimo (ausencia) y el valor de X2 que optimiza las respuesta es de
Constante (be) 3,118 0,153 20,27 0,000 - 0,297 (Valor Codificado) cuando no est presente Xl (nivel mnimo).
Xl -0,044 0,069 -0,63 0,535 En el experimento 2, cuando se utiliza los niveles ptimos de las
X2 -0,314 0,059 -5,25 0,000 dos variables, el punto ptimo disminuye para Xi y aumenta para X2.
1
ANALISIS ESTADISTICO 3.- Obtencin de los puntos ptimos o estacionarios para cada
uno de los "k".ensayos
1 Anlisis de varianza para cada uno de los "k" ensayos
Ensayo 1
1.1.- Anlisis de la varianza (Ensayo 1).
A 2
F.deV. G.deL. SC CM Fc Y = 3,809 - 0,07XI - 0,272 Xl
Trat 4 6,869 1,719 35,48**
A
O Y / O X. =- 0,07 - 0,545XI =
EE 20 0,968 0,048 Xl = - 0,07/0,545 = - 0,128
Total 24 7,837 Ensayo 2
2
Y = 3,118 - 0,044X2 - 0,314X2
A
R2 = 69,62% R!j = 66,86% Cp = 3 CMResid. = 0,010 De acuerdo a estos resultados el nivel ptimo de una variable
depende de la cantidad a la cual se encuentra la otra variable. En el
2.2.- Anlisis de Regresin (Ensayo 2 )
primer experimento la cantidad de la variable Xi que optimiza la
Variable regresara Coeficiente Error t P respuesta es de 0,609 (Valor Codificado), cuando X2 est a su nivel
de regresin estandar mnimo (ausencia) y el valor de X2 que optimiza las respuesta es de
Constante (be) 3,118 0,153 20,27 0,000 - 0,297 (Valor Codificado) cuando no est presente Xl (nivel mnimo).
Xl -0,044 0,069 -0,63 0,535 En el experimento 2, cuando se utiliza los niveles ptimos de las
X2 -0,314 0,059 -5,25 0,000 dos variables, el punto ptimo disminuye para Xi y aumenta para X2.
1
C.- Experimento 3. Se ha realizado con un diseo Compuesto El anlisis indica que hay efecto evidente de la regresin, pero
Central Rotable Uniformemente preciso (k = 2, no = 5), en un existe falta de ajuste, lo cual implica que existe algn efecto
diseo completamente al azar. De acuerdo a la metodologa, los significativo no considerado en el modelo polinomial fijado. Estos
niveles reales del punto central (0, O) son los niveles ptimos efectos deben ser estudiados en futuros ensayos.
encontrados en el experimento 2 los resultados aparecen a
continuacin (Tabla 5.14).
2.- Anlisis de Regresin
Tabla 5.14. Datos obtenidos con el diseo Compuesto Central Rotable
Variable Coeficiente Error t P
k = 2, no = 5 (Experimento 3)
regresora de regresion estandar
Tratamiento Codificadas Respuesta
Constante (ha) 5,21987 0,29158 17,902 0,0000
Xl x, Y
Xl 0,15519 0,23535 0,673 0,5224
1 -1 -1 3,0
2 -1 X2 0,28021 0,23053 1,216 0,2036
1 4,5
3 1 -1 4,0 X21 -0,96630 0,24755 -3,908 0,0058
4 1 1 4,6 X22 -0,76624 0,24755 -3,099 0,0173
5 -1,414 2,7
6 1,414 XIX2 -0,22500 0,32600 -0,690 0,5123
7 2,8
= =
8 -1,414 3,1 R2 70,785% SC(residual) 2,97558 Press = 20,784
9 1,414 3,2
En este anlisis los efectos cuadrticos son significativos y los
10 5,1
lineales no son estadsticamente significativos. Esto .'debido proba-
12 5,4
5,1
Se determin el punto estacionario Xo = [
0,060048l
0.174035
J.y se estudi
1.- Anlisis estadstico su naturaleza en base a los signos de las races caractersticas.
Anlisis de la varianza para el modelo de primer orden Races caractersticas Vectores propios
F.deV. G.deL. SC CM Fc Xl X2
Tratamiento 8 13,3243 1,6655 97,97** -1,431038 -0,409588 0,912271
Regresin 5 10,4165 2,0833 122,54** -2,033016 0,912271 0,409588
Falta de ajuste 3 2,9078 0,9693 57,02**
Error puro
Al = -1,431038 A2 = -2,033016
4 0,0680 0,0170
TOTAL 12 13,3923
266 Chacn / Anlisis de Regresin y Superticies de Respuesta Chacn I Anlisis de Regresin y Superticies de Respuesta 267
C.- Experimento 3. Se ha realizado con un diseo Compuesto El anlisis indica que hay efecto evidente de la regresin, pero
Central Rotable Uniformemente preciso (k = 2, no = 5), en un existe falta de ajuste, lo cual implica que existe algn efecto
diseo completamente al azar. De acuerdo a la metodologa, los significativo no considerado en el modelo polinomial fijado. Estos
niveles reales del punto central (0, O) son los niveles ptimos efectos deben ser estudiados en futuros ensayos.
encontrados en el experimento 2 los resultados aparecen a
continuacin (Tabla 5.14).
2.- Anlisis de Regresin
Tabla 5.14. Datos obtenidos con el diseo Compuesto Central Rotable
Variable Coeficiente Error t P
k = 2, no = 5 (Experimento 3)
regresora de regresion estandar
Tratamiento Codificadas Respuesta
Constante (ha) 5,21987 0,29158 17,902 0,0000
Xl x, Y
Xl 0,15519 0,23535 0,673 0,5224
1 -1 -1 3,0
2 -1 X2 0,28021 0,23053 1,216 0,2036
1 4,5
3 1 -1 4,0 X21 -0,96630 0,24755 -3,908 0,0058
4 1 1 4,6 X22 -0,76624 0,24755 -3,099 0,0173
5 -1,414 2,7
6 1,414 XIX2 -0,22500 0,32600 -0,690 0,5123
7 2,8
= =
8 -1,414 3,1 R2 70,785% SC(residual) 2,97558 Press = 20,784
9 1,414 3,2
En este anlisis los efectos cuadrticos son significativos y los
10 5,1
lineales no son estadsticamente significativos. Esto .'debido proba-
12 5,4
5,1
Se determin el punto estacionario Xo = [
0,060048l
0.174035
J.y se estudi
1.- Anlisis estadstico su naturaleza en base a los signos de las races caractersticas.
Anlisis de la varianza para el modelo de primer orden Races caractersticas Vectores propios
F.deV. G.deL. SC CM Fc Xl X2
Tratamiento 8 13,3243 1,6655 97,97** -1,431038 -0,409588 0,912271
Regresin 5 10,4165 2,0833 122,54** -2,033016 0,912271 0,409588
Falta de ajuste 3 2,9078 0,9693 57,02**
Error puro
Al = -1,431038 A2 = -2,033016
4 0,0680 0,0170
TOTAL 12 13,3923
268 Chacn I Anlisisde Regresin y Superficiesde Respuesta
Tabla 5.15. Ilustracin del anlisis de aristas para la estimacin de la Anscombe, F. J.; J. W. Tukey. 1963. The Examinations and Analysis
mxima respuesta ofResiduals. Teehnometrics 5: 141-160.
Radios Respuesta Error Valores no Codificados Atkinson, A. C.; W. G. Hunter. 1968. The Design o Experiments for
Codificados estimada estndar Xl X2 Parameter Estimations. Technometrics 10: 271~289.
0,0 5,219870 0,291585 0,000000 0,000000 Ben-Israel, A.; T. N. Greville. 1974. Generalizad Inverse Theoryand
0,051464 0,131702 Aplications. New York, John Wiley and Son. 480 p.
0,1 5,247387 0,290581
0,068458 0,274389 Bliss, C. 1. 1970 . .8tatistics in Biology. New York, Me Graw-:fIill.
0,2 5,240938 0,287858
Volumen Il. 120 p.
0,3 5,202584 0,285067 0,058576 0,420136
Box G., E. P. 1954. The Exploration and Explotation of Response
0,4 5,133678 0,284740 0,031845 0,564703 Surface: Some General considerations and Examples. Biometrics
-0,004853 0,706983 10: 16-60.
0,5 5,033486 0,290443
-0,047596 0,847064 Box G.; E. P.; N. R. Draper, 1959. A Basie for the aeleetion of a
0,6 4,906933 0,306175
Response Surface Design ..J. Amer. Statist. Assoc. 54: 622"-654.
0,7 4,749765 0,335350 -0,094184 0,985309
Box G., E. P.; J. S. Hunter. 1957. Multifactor experimental Design for
0,8 4,562631 0,379895 -0,143340 1,122082 exploring response surfaces. J. R. Statis. Soc., Serie B. 13(1):
1,257682 195-241.
0,9 4,348626 0,440140 -0,194288
-0,246530 1,292343 Box G., E. P.; H. L. Lucas. 1959. Design of Experiments in Nonlinear
1,0 4,104814 0,015415
Situations. Biometrika 46: 77-90.
Los resultados presentados en l.a Tabla 5.15 indican que la
Box G., E. P.; K. B. Wilson. 1951. On the Experimental Attainment of
respuesta mxima se obtiene con Xi = 0,060048, Xz = 0,1740035. Con
Optimum Conditions. J. R. Statis. SocoSerie B 13: 1-45
estos resultados se cumple el objetivo fundamental de estos
experimentos secuenciales, y es la. obtencin de puntos ptimos (en Box G., E. P.; P. V. Youle. 1955. The Explorations and Explotation o
este caso puntos mximos). Response Surface: An Example o the link Between the Fitted
Surface and the Basic Mechanism o the System. Bometrics
11:287322.
Box, M. J. 1971. Bias in Nonlinear Estimation (with discussion). J. R.
Statist. SocoSerie B. 33: 171-201.
Boyd, D. A. 1972. Some Recent Ideas on Fertilizer Response Curves.
Proc. Ninth. Int. Conj. Potash. Instit: 461-473.
Cady, F. B.; D. M. Allen. 1972. Combining experimentos to predict
future Yield data. Agronomy J. 64: 21-24.
268 Chacn I Anlisisde Regresin y Superficiesde Respuesta
Tabla 5.15. Ilustracin del anlisis de aristas para la estimacin de la Anscombe, F. J.; J. W. Tukey. 1963. The Examinations and Analysis
mxima respuesta ofResiduals. Teehnometrics 5: 141-160.
Radios Respuesta Error Valores no Codificados Atkinson, A. C.; W. G. Hunter. 1968. The Design o Experiments for
Codificados estimada estndar Xl X2 Parameter Estimations. Technometrics 10: 271~289.
0,0 5,219870 0,291585 0,000000 0,000000 Ben-Israel, A.; T. N. Greville. 1974. Generalizad Inverse Theoryand
0,051464 0,131702 Aplications. New York, John Wiley and Son. 480 p.
0,1 5,247387 0,290581
0,068458 0,274389 Bliss, C. 1. 1970 . .8tatistics in Biology. New York, Me Graw-:fIill.
0,2 5,240938 0,287858
Volumen Il. 120 p.
0,3 5,202584 0,285067 0,058576 0,420136
Box G., E. P. 1954. The Exploration and Explotation of Response
0,4 5,133678 0,284740 0,031845 0,564703 Surface: Some General considerations and Examples. Biometrics
-0,004853 0,706983 10: 16-60.
0,5 5,033486 0,290443
-0,047596 0,847064 Box G.; E. P.; N. R. Draper, 1959. A Basie for the aeleetion of a
0,6 4,906933 0,306175
Response Surface Design ..J. Amer. Statist. Assoc. 54: 622"-654.
0,7 4,749765 0,335350 -0,094184 0,985309
Box G., E. P.; J. S. Hunter. 1957. Multifactor experimental Design for
0,8 4,562631 0,379895 -0,143340 1,122082 exploring response surfaces. J. R. Statis. Soc., Serie B. 13(1):
1,257682 195-241.
0,9 4,348626 0,440140 -0,194288
-0,246530 1,292343 Box G., E. P.; H. L. Lucas. 1959. Design of Experiments in Nonlinear
1,0 4,104814 0,015415
Situations. Biometrika 46: 77-90.
Los resultados presentados en l.a Tabla 5.15 indican que la
Box G., E. P.; K. B. Wilson. 1951. On the Experimental Attainment of
respuesta mxima se obtiene con Xi = 0,060048, Xz = 0,1740035. Con
Optimum Conditions. J. R. Statis. SocoSerie B 13: 1-45
estos resultados se cumple el objetivo fundamental de estos
experimentos secuenciales, y es la. obtencin de puntos ptimos (en Box G., E. P.; P. V. Youle. 1955. The Explorations and Explotation o
este caso puntos mximos). Response Surface: An Example o the link Between the Fitted
Surface and the Basic Mechanism o the System. Bometrics
11:287322.
Box, M. J. 1971. Bias in Nonlinear Estimation (with discussion). J. R.
Statist. SocoSerie B. 33: 171-201.
Boyd, D. A. 1972. Some Recent Ideas on Fertilizer Response Curves.
Proc. Ninth. Int. Conj. Potash. Instit: 461-473.
Cady, F. B.; D. M. Allen. 1972. Combining experimentos to predict
future Yield data. Agronomy J. 64: 21-24.