Beruflich Dokumente
Kultur Dokumente
MONOGRAFIA
RESUMEN
El anlisis de regresin no lineal en el crecimiento de aves, es una monografa que presenta y describe los diferentes modelos de regresin de funciones no lineales, enfatizando en los mtodos de solucin, especficamente funciones potenciales y exponenciales, como gompertz, logstica entre otros, cuyas graficas se asemejan al comportamiento del crecimiento de animales, especialmente el de aves. Se determina la importancia de las funciones no lineales en la determinacin de comportamientos y carateristicas biolgicas de cierta especie.
INDICE
Introduccin
I. Conceptos tericos de regresin no lineal
I.1. Introduccin I.2. Descripcin de una ecuacin de regresin I.3. Representatividad de la curva de regresin. I.3.1. Poder explicativo del modelo I.3.2. Poder explicativo frente a poder predictivo I.3.3. Causalidad I.3.4. Extrapolacin I.4. Regresin no lineal e inferencia I.5. Linealizacin
I.6.
Mtodos de ajuste en una regresin no lineal I.6.1. Mnimos cuadrados ordinarios y ponderados I.6.2. Estimacin de los parmetros con el mtodo monte carlo I.6.3. Algoritmo de gaussnewton
I.7.6. Modelo polinomial II. Aplicacin de la regresin no lineal en la curva de crecimiento de aves II.1. Modelos matemticos no lineales utilizadas para estudiar el crecimiento animal: II.2. Investigaciones que hacen uso de los modelos matemticos Conclusiones Bibliografa
INTRODUCCION
Este trabajo tiene por objetivo presentar en forma descriptiva y conocer la aplicabilidad de un modelo matemtico, situado en el rea de estadstica, especficamente en el tema de regresin no lineal, que permita estimar valores entre variables correlacionadas, mediante
funciones no lineales, muchas veces desarrolladas mediante el concepto de linealizacin, en el cual se aplican logaritmos para reducir la expresin a funciones lineales, en otros casos se recurre a software estadsticos que determinan el tipo de funcin que representa a los datos en evaluacin.
Se incluyen conceptos tericos de regresin y tipos de regresin no lineal, condiciones y supuestos para cada mtodo, a la vez se presentan investigaciones realizadas en el mbito de biologa, especficamente en aves, donde se hace uso de la regresin no lineal como herramienta de anlisis.
El objetivo para presentar esta monografa es visualizar en la misma, la amplia gama de modelos matemticos (funciones no lineales), utilizadas como herramienta de anlisis en mltiples investigaciones, realizadas en el mbito de la biologa, la zootecnia entre otros, reas que aparentemente no estn relacionadas con los conceptos matemticos, sin
Bach. Levy Csar Samam Mendoza Pgina 5
embargo hacen uso de estos modelos para determinar los requerimientos especficos por cada etapa en funcin al desarrollo fisiolgico del animal, a la vez se observa que se relaciona el peso corporal de las aves con la base gentica de las mismas.
El autor
Observ, que si los padres son altos, los hijos generalmente tambin lo son, y si los padres son bajos los hijos son tambin de menor estatura. Pero ocurra un hecho curioso: cuando el padre es muy alto o muy bajo, aparece una perceptible "regresin" hacia la estatura media de la poblacin, de modo que sus hijos retroceden hacia la media de la que sus padres, por cierto, estn muy alejados. Hoy da, el trmino no se utiliza en ese sentido.
En muchas ocasiones, se desea conocer algo acerca de la relacin o dependencia entre dos caractersticas cuantitativas, o ms de una, consideradas sobre la misma poblacin objeto de estudio (por
Bach. Levy Csar Samam Mendoza Pgina 8
Si ambas variables estn realmente relacionadas entre s o si, por el contrario, pueden considerarse independientes.
Si existe dependencia, es necesario conocer el "grado de relacin", as como el "tipo" de relacin entre ambas.
Si puede predecirse la variable que es considerada como dependiente a partir de los valores de la otra, que es
Para analizar si dos variables aleatorias estn relacionadaso no (de ahora en adelante se denominarn X e Y , siendo Y la variable dependiente, y X la variable independiente o regresora), consiste en tomar una muestra aleatoria. Sobre cada individuo de la muestra seanalizan las dos caractersticas en estudio, de modo que para cada individuo se tenga un par de valores(xi,yi)(1,2,,n).
Para representar los valores, se presentan en los ejes cartesianos, dando lugar a un diagrama dedispersin o nube de puntos. As,
Bach. Levy Csar Samam Mendoza Pgina 9
Evaluar si existe dependencia funcional o dependencia estocstica. En el primercaso la relacin es perfecta: Y= f(X), es decir, los puntos del diagrama de dispersincorrespondiente aparecen sobre la funcin Y= f(X) , por ejemplo la relacin lineal perfecta entre las variables:
Muchas veces, no existe una dependencia funcional perfecta, sino otra dependencia orelacin menos rigurosa o dependencia estocstica Entonces, la relacin entre X e Y , se escribira, de de la forma Y=a+bX+e , donde es un error (o residual), debidopor ejemplo, a no incluir variables en el modelo que sean importantes a la hora de explicar el comportamiento de Y , y cuyos efectos sean diferentes a los de X ; errores aleatorios o de medida, o simplemente a que se ha especificando mal el
En la dependencia estocstica, se distinguen dos tipos de tcnicas: (a) Anlisis de regresin; (b) Anlisis de correlacin.
En el primer caso: El anlisis de correlacin, tiene como fin dar respuesta a las preguntas: Existe dependencia estocstica entre las variables?; Cul es el grado de dicha dependencia?
Con qu precisin?.
Se dice que existe regresin de los valores de una variable con respecto a los de otra, cuando hay alguna lnea, llamada lnea de regresin que se ajusta ms o menos claramente a la nube de puntos.
Si existe regresin, se denominar ecuacin de regresin a la ecuacin que describe la relacin entre lasdos variables.
En
general,
la
variable
se
conoce
como
variable
independiente, y la Y como variable dependiente. Evidentemente puede ser arbitrario el determinar la existencia de regresin as como el tipo de la misma, yaque depende del autor o del estado de nimo de la persona en un momento determinado. Por lo tanto, se hacen necesarios mtodos estadsticos objetivos, independientes del investigador, para determinar la existencia o no de relacin y el tipo de la misma.
Cuando hay ms de una variable independiente(X1,X2,,Xn), y una sola variable dependiente Y , se habla de regresin mltiple. Las variables
Xise
denominan,
regresoras,
predictoras
independientes.
DE
LA
CURVA
DE
Si la varianza residual es grande, el modelo ser malo, es decir, la curva no explicar el comportamiento general de la nube.
La cota mxima de la varianza residual es la varianza que se trata de explicar mediante el modelo de regresin, es decir, la varianza de la variable dependiente. Por tanto, sin ms que hacer relativa la varianza residual respecto de su mximo valor, y multiplicando por 100, se obtiene el porcentaje de variacin no explicado por el modelo:
% devariacionsinexplicar=Se2SY2100.
En el que es fcil obtener una medida R2o coeficiente de determinacin que indique el porcentaje de variacin controlada o explicada mediante el modelo. Expresado en tantos por 1, ser:
R2=1-Se2SY2
Por tanto:
Si R2=1 no hay residuos: habr una dependencia funcional. Cuanto ms se acerque dicho valor a la unidad, mayor poder explicativo tendr el modelo de regresin. Cuanto ms cercano a 0 est dicho valor, menor poder explicativo;
Si R2=0 entonces X no explica en absoluto ninguna de las variaciones de la variable Y, de modo que o bien el modelo es inadecuado, o bien las variables son independientes.
I.1.1.
PODER
PREDICTIVO
Un modelo de regresin con un alto porcentaje de variaciones explicado, puede no ser bueno para predecir,ya que el que la mayora de los puntos se encuentren cercanos a la recta de regresin, no implica que todos lo estn, y puede ocurrir, que justamente para aquel rango de valores en el que el investigador est interesado, se alejen de la recta, y por tanto, el valor predictivo puede alejarse mucho de la realidad.
La nica forma de poder evaluar el poder predictivo del modelo es tras la observacin y el anlisis de los grficos de residuales, es decir, de diagramas de dispersin, en los que
Bach. Levy Csar Samam Mendoza Pgina 16
I.1.2. CAUSALIDAD
Es muy importante resaltar el hecho, de que un modelo sea capaz de explicar de manera adecuada las variaciones de la variable dependiente en funcin de la independiente, no implica que la primera sea causa de la segunda.
El hecho de que las variables estn relacionadas no implica que una sea causa de la otra, ya que puede ocurrir el hecho de que se est dando una variacin concomitante, por el simple hecho de que las dos son causa de una tercera.
Por ejemplo, si se realiza un estudio en el que se analiza el nmero de canas ( X) y la presin arterial (Y ) podra encontrarse una relacin lineal casi perfecta. Eso no significa
Bach. Levy Csar Samam Mendoza Pgina 17
I.1.3. EXTRAPOLACIN
Es importante resaltar el hecho de que al hacer predicciones, no deben extrapolarse los resultados ms all del rango de la variable X utilizado para ajustar el modelo, ya que ms all de ese rango se desconoce qu puede estar ocurriendo.
basado en datos multidimensionales x , y , donde f es alguna funcin no lineal respecto a algunos parmetros desconocidos .
Como mnimo, se pretende obtener los valores de los parmetros asociados con la mejor curva de ajuste (habitualmente, con el mtodo de los mnimos cuadrados). Con el fin de determinar si el modelo es adecuado, puede ser necesario utilizar conceptos de
procedimientos computacionales para la regresin polinomial son procedimientos de regresin lineal (mltiple), en este caso con dos variables predictoras x y x2 . Sin embargo, en ocasiones se sugiere que la regresin no lineal es necesaria para ajustar polinomios. Las consecuencias prcticas de esta mala interpretacin conducen a que un procedimiento de optimizacin no lineal sea usado cuando en realidad hay una solucin disponible en trminos de regresin lineal. Paquetes (software) estadsticos consideran, por lo general, ms alternativas de regresin lineal que de regresin no lineal en sus procedimientos.
I.3. LINEALIZACIN
Algunos problemas de regresin no lineal pueden linealizarse mediante una transformacin en la formulacin del modelo. Por ejemplo, considrese el problema de regresin no lineal (ignorando el trmino de error):
y=aexp(bx)
lo
cual
sugiere
una
estimacin
de
los
parmetros
desconocidos a travs de un modelo de regresin lineal de ln ( y) con respecto a x , un clculo que no requiere procedimientos de optimizacin iterativa. De todas formas, la
Bach. Levy Csar Samam Mendoza Pgina 20
Hay que distinguir entre la "linealizacin" usada en los prrafos anteriores y la "linealizacin local" que se adopta para algoritmos clsicos como el de Gauss-Newton.
I.1.1. MNIMOS
CUADRADOS
ORDINARIOS
PONDERADOS
Se considera la mejor curva de ajuste aquella que minimiza la suma de las desviaciones (residuales) al cuadrado (SRC). Esta es la aproximacin por el mtodo de mnimos cuadrados (MMC). Sin embargo, en aquellos casos donde se tienen diferentes varianzas de error para diferentes errores, es necesario minimizar la suma de los residuales al cuadrado ponderados ponderados). (SRCP) (mtodo de mnimos cuadrados
En general, no hay una expresin de forma cerrada para los parmetros de mejor ajuste, como sucede en el caso de la regresin lineal. Mtodos numricos de optimizacin son aplicados con el fin de determinar los parmetros de mejor ajuste. Otra vez, en contraste con la regresin lineal, podra haber varios mximos locales de la funcin a ser optimizada. En la prctica se suponen algunos valores iniciales los cuales junto con el algoritmo de optimizacin conducen a encontrar el mximo global.
observacin es aleatorizada de acuerdo a su media y su desviacin estndar. Con el nuevo conjunto de datos, una nueva curva es ajustada y las estimaciones de los parmetros registradas. Las observaciones son entonces
Bach. Levy Csar Samam Mendoza Pgina 22
Al final, se generan varios conjuntos de parmetros y pueden ser calculadas la media y desviacin tpica.
El problema:
Dadas m funciones f1,f2,,fmde n parmetrosp1,p2,
,pmcon mn, se desea minimizar la suma:
Sp=i=1n(fi(p))2
El algoritmo
El algoritmo de Gauss-Newton es un procedimiento iterativo. Esto significa que debemos proporcionar una estimacin inicial del parmetro vector que
denominaremos p0.
Bach. Levy Csar Samam Mendoza Pgina 23
Donde f=(f1,..., fm) yJf(p) denota el Jacobianode f en p (ntese que no es necesario que Jf sea cuadrada). La matriz inversa, en la prctica, nunca se computa explcitamente. en lugar de ellos se utiliza
una buena implementacin del algoritmo de GaussNewton utiliza tambin un algoritmo de bsqueda lineal: en lugar de la frmula anterior para pk+1, se utiliza
En muchos casos, es una funcin de segundo grado la que se ajusta lo suficiente a la situacin real dada. La expresin general de un polinomio de 2 grado es:
Y=a+bX-cX2
donde a, b y c son los parmetros. El problema consiste, por tanto, en determinar dichos parmetros para una distribucin dada. Seguiremos para ello, un razonamiento similar al que hicimos en el caso del modelo de regresin lineal simple, utilizando el procedimiento de ajuste de los mnimos cuadrados, es decir, haciendo que la suma de los cuadrados de las desviaciones con respecto a la curva de regresin sea mnima:
Bach. Levy Csar Samam Mendoza Pgina 25
e los valores
estimados segn el modelo; por tanto, podemos escribir D de la forma: D=i=1n(yi-yi*)2=i=1n(yi-a-bxi-cxi2)2 Para encontrar los valores de a, b y c que hacen mnima la expresin anterior, deberemos igualar las derivadas parciales de D con respecto a dichos parmetros a cero y resolver el sistema resultante. Las ecuaciones que forman dicho sistema se conocen como ecuaciones normales de Gauss (igual que en el caso de la regresin lineal simple). i=1nyi=na+bi=1nxi+ci=1nxi2 i=1nxiyi=ai=1nxi+bi=1nxi2+ci=1nxi3 i=1nxi2yi=ai=1nxi2+bi=1nxi3+ci=1nxi4
I.1.2.
REGRESIN HIPERBLICA
Cuando la dependencia entre las variables X e Y es de forma hiperblica, interesa ajustar a la nube de puntos una funcin del tipo:
y=a+bx
Donde
yi=a+bxi
Por tanto,
M=i,j=1n(a+bxi-yj)2
Para minimizar la expresin, se calculan las derivadas parciales respecto a los parmetros a y b ,igualando a cero:
Ma=2i,j=1na+bxi-yj=0Mb=2i,j=1na+bxi-yj1xi=0
Es decir. Si en la expresin de la funcin potencial se toman logaritmos, se obtiene: Log Y= log A+ b log X
y=ea+bx
Mediante una transformacin lineal, tomando logaritmos neperianos, se convierte el problema en una cuestin de regresin lineal.
Y
Bach. Levy Csar Samam Mendoza Pgina 29
Se tiene:
Y=a+bx (Regresin lineal).
Para simplificar, descartando multiplicidades y suponiendo que cada par se repite una sola vez, las ecuaciones normales sern:
aN+bi=1nxi=i=1nlnyiai=1nxi+bi=1nxi2=i=nxilnyi
Numero de datos=n=8
x promedio=x=1ni=1nai=20,98=2,6125 y promedio=lny=1ni=1nai=11,46288=1,4328
I.1.5. MODELO LOGARTMICO La curva logartmica Y=a+blogX es tambin una recta, pero en lugar de estar referida a las variables originales X e Y , est referida a log X y a Y .
Ejemplo x 1 1.2 1.5 2 3 3.7 4 4.5 20.9 y 3 3.4 5 2 4.1 5 7 6.5 36 ln x 0 0.1823 0.4054 0.6931 1.0986 1.3083 1.3862 1.5040 6.5779 ln x2 0 0.0332 0.1643 0.4803 1.2069 1.7116 1.9215 2.2620 7.7798 ln x * y 0 0.6198 2.027 1.3862 4.5042 6.5415 9.7034 9.776 34.5581 y2 9 11.56 25 4 16.81 25 49 42.25 182.62
a=xy-
yxx2-xx=34.5581-4.5(6.5779)7.7798-
Ejemplo: x 1 1.2 1.5 2 3 3.7 4 4.5 y 3 3.4 5 2 4.1 5 7 6.5 xy 3 4.08 7.5 4 12.3 18.5 28 29.25 x2 1 1.44 2.25 4 9 13.69 16 20.25 67.63 20.9 36 106.63 182.62 376.121 246.881 958.6147 y2 9 11.56 25 4 16.81 25 49 42.25 x2y 3 4.896 11.25 8 36.9 68.45 112 131.625 x3 1 1.728 3.375 8 27 50.653 64 91.125 x4 1 2.0736 5.0625 16 81 187.4161 256 410.0625
1.
MODELO LOGISTICO:
Funcin no lineal utilizado para describir el crecimiento (Verhulst, 1838); una de sus formas de expresin se describe como:
Pt=P(1+b*e-c*t )
Donde Ptes el peso a una determinada edad, P es el peso adulto, e es la base de los logaritmos naturales, b es un parmetro de ajuste del modelo y c la tasa de maduracin y t es la edad en das.
Este modelo puede ser usado para crecimientos de tipo sigmoideo, en los cuales el punto de inflexin es cercano al 50% del peso adulto.
2. MODELO DE GOMPERTZ.
Bach. Levy Csar Samam Mendoza Pgina 35
Donde Ptes el peso en la edad t, P es el peso adulto (peso asinttico), e es la base de los logaritmos naturales, by cson parmetros de ajuste del modelo y se relacionan con la fuerza ascendente y descendente respectivamente que ajustan la forma de la curva sigmoidea.
3. MODELO DE BERTALANFFY.
Fundamentados en las premisas propuestas por Bertalanffy (1957) en relacin a que el crecimiento corresponde a una diferencia entre la tasa de anabolismo y la tasa de catabolismo se han postulado funciones para describir el crecimiento de diferentes magnitudes, en este contexto para describir el crecimiento en trminos de longitud ha sido propuesta y ampliamente usada la ecuacin:
Lt=L(1-e-c(t-t0))
Donde Lt es la longitud total del pez en el tiempo t, L es la longitud asinttica, e es la base de los logaritmos naturales, c
4. MODELO DE RICHARDS.
Una ecuacin ms generalizada, desarrollada para el
crecimiento en plantas pero con frecuente utilizacin en animales es descrita por Richards en 1959 y se caracteriza por su flexibilidad para adaptarse a la forma de la curva. Dicha ecuacin se describe como:
Pt=P(1+eb(-c*t) )(1d)
5. MODELO DE JANOSCHECK.
Otro modelo que ofrece gran flexibilidad para adaptarse a la forma de la curva de crecimiento es el propuesto por el alemn Janoscheck en 1957 citado por Salomn et al. (1999). La ecuacin de este es:
Pt=P-(P-P0)*e(b-c*tP))
6. MODELO MICHAELIS-MENTEN.
Lpez et al. (2000) fundamentados en la cintica enzimtica documentada por Michaelis y Menten, proponen la siguiente ecuacin en un esfuerzo por obtener una ecuacin ms generalizada para el anlisis del crecimiento de los animales.
Pt=(P0kc+Ptc)(kc+tc)
En esta Ptcorresponde el peso corporal en el tiempo t, Pal peso corporal asinttico, P0 al peso corporal cuando t=0, k la edad a la cual se logra la mitad del mximo crecimiento y c un parmetro de ajuste del modelo que determina la forma de curva as: cuando c1 la curva describe una hiprbola y no tiene un punto de inflexin, cuando c > 1 la curva toma una forma sigmoidea.
I.1. INVESTIGACIONES
QUE
HACEN
USO
DE
LOS
MODELOS MATEMTICOS
Bach. Levy Csar Samam Mendoza Pgina 38
A continuacin presentamos las diferentes investigaciones en las cuales han hecho uso de la regresin no lineal para determinar el crecimiento de aves:
1. Canet,
Nacional de Tecnologa Agropecuaria EEA Pergamino), BM Romera, Ricardo Jos Di Masso (Ctedra de Gentica, Facultad de Ciencias Veterinarias, Universidad Nacional de Rosario). Argentina, En el Anlisis dinmico del peso corporal de cinco estirpes maternas de reproductoras destinadas a la produccin de pollos camperos.
En sta investigacin se evalu el crecimiento de cinco estirpes maternas (A, E, CE, DE y ES) de reproductoras destinadas a la produccin de pollos camperos. El ajuste no lineal de los datos longitudinales peso corporal-edad cronolgica registrados a intervalos semanales entre el crecimiento y las 50 semanas de edad con el modelo sigmoideo de Gompertz permiti
caracterizar el patrn de crecimiento de las hembras de cada estirpe en trminos de dos parmetros con significado biolgico que definen la forma de la curva de modificacin del Dnde: W (t) = peso corporal (g) en el tiempo t
Bach. Levy Csar Samam Mendoza Pgina 39
Toledo,
en
PROGRAMAS
DE
ALIMENTACIN
EN
AVICULTURA:PONEDORAS COMERCIALES.
En esta investigacin se relaciona la cantidad de alimento EM (metionina) con el peso de la gallina y la produccin de huevos:
EMi=Ingestin de EM (kcal/d) metionina; P=Peso de la gallina (g); P= Peso de la gallina (kg); P=Ganancia de peso (g/d); P.Hu=Produccin de huevos (g/d).
Donde:
Wt=Representa el peso (g) al tiempo t; W0=Peso (g) inicial o peso (g) a la eclosin; L= Tasa inicial de crecimiento; K=Tasa exponencial de decadencia de L.
Funcin de Gompertz.
Wt=W0eLK(1-e(-Kt))
Hauschild; Melina Aparecida Bonato; Cleber Franklin Santos de Oliveira. FCAV/UNESP, Brasil, en su investigacin:. Modelo de prediccin de los requerimientos de lisina digestible para aves de postura, en el cual,el modelo de prediccin
propuesto fue capaz de expresar los requerimientos de lisina digestible de acuerdo con el desarrollo fisiolgico del animal, contribuyendo as a adecuar las recomendaciones nutricionales para las diferentes fases del crecimiento de las aves de postura.
Obtenindose:
Lis=151.2.PBm0.73.u+0.01.PP.18+ [(75.DPBc/0,80)+(18.DPBP/0,80) ]
CONCLUSIONES
El diagrama de dispersin determinar la forma especfica de la curva que se ajustar a los datos.
Las funciones no lineales, se linealiza para proceder con el mtodo de regresin lineal.
Las
determinan mediante software estadstico, pero sin embargo, es necesario conocer las caractersticas y restricciones de las mismas para su aplicacin. En opinin de los especialistas, las funciones logsticas y sus variantes (Gompertz, Bertalanffy y otros, ajustan a los datos, y a la vez sus parmetros representan caractersticas biolgicas especificas de la especie.
BIBLIOGRAFA
PEREZ DE VARGAS LUQUE, Alberto. MARTINEZ CALVO, Mara. Una EstadsticaBiomtrica. Una prospectiva Instrumental. Editorial Sntesis S.A. Espaa. 2000.
LEVIN Richards, RUBIN, David. Estadstica para Administracin y Economa. Pearson Educacin. Sptima Edicin. Mxico. 2004.
PEA SANCHEZ DE RIVERA, Daniel. Regresin y Diseo de Experimentos. Alianza Editorial S.A. Madrid. 2002.
CANET, Sulma. FAIN, Virginia. Anlisis dinmico del peso corporal de cinco estirpes maternas de reproductoras destinadas a la produccin de pollos camperos. Disponible en http://www.engormix.com/MAavicultura/genetica/articulos/analisis-dinamico-peso-corporal-t3473/103p0.htm