Beruflich Dokumente
Kultur Dokumente
Regresin
Es un proceso estadstico para estimar las relaciones entre variables. Incluye muchas tcnicas para el
modelado y anlisis de diversas variables, cuando la atencin se centra en la relacin entre una
variable dependiente y una o ms variables independientes (o predictoras). Ms especficamente, el
anlisis de regresin ayuda a entender cmo el valor de la variable dependiente vara al cambiar el
valor de una de las variables independientes, manteniendo el valor de las otras variables
independientes fijas. Ms comnmente, el anlisis de regresin estima la esperanza condicional de la
variable dependiente dadas las variables independientes - es decir, el valor promedio de la variable
dependiente cuando se fijan las variables independientes. Con menor frecuencia, la atencin se
centra en un cuantil, u otro parmetro de localizacin de la distribucin condicional de la variable
dependiente dadas las variables independientes. En todos los casos, el objetivo es la estimacin de
una funcin de las variables independientes llamada la funcin de regresin. En el anlisis de
Siendo:
Cov (x;y): la covarianza entre el valor x e y.
(x): desviacin tpica de x.
(y): desviacin tpica de y.
Valores que puede tomar la correlacin
= -1
=0
No existe correlacin
= +1
Para ello existen varios mtodos, siendo el ms utilizado el de los mnimos cuadrados. Consiste en
hacer mnima la suma de los cuadrados de las diferencias entre los valores experimentales y los
obtenidos mediante la recta. Por lo tanto, si consideramos la Y=aX+b, mediramos lo bien (o mal) que
se ajusta a nuestros puntos por medio de la cantidad
i=1 N ( y i ( a x i +b ) ) 2 = i=1 N ( y i a x i b ) 2
y la recta que estamos buscando es la que haga esta cantidad lo ms pequea posible.
Una vez realizados los clculos correspondientes, se tiene que la ecuacin de la recta de regresin
es:
y y = xy x 2 (x x )
donde x y son las desviaciones tpicas de x e y.
Se comprueba que, como indicamos anteriormente, la recta obtenida pasa por el punto (x, y) que
coincide con el centro de gravedad de la nube de puntos.
Ejemplo: Para el ejemplo de
Pesos (kgs.) - Estaturas (cms.)
Peso en
60 65 70 70 68 50 60
Kgs.
Altura en 16 17 17 18 17 15 16
cms.
7 0 0 0 0 5 0
Frecuenc
1 5 2 4 2 1 1
ias (ni)
y - y = 1.11(x-x )
atan (1.11) = 47,89
Interpretacin
El valor del ndice de correlacin vara en el intervalo [-1,1]:
Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total entre
las dos variables denominada relacin directa: cuando una de ellas aumenta, la otra tambin
lo hace en proporcin constante.
Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables son
independientes: pueden existir todava relaciones no lineales entre las dos variables.
Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia total entre
las dos variables llamada relacin inversa: cuando una de ellas aumenta, la otra disminuye en
proporcin constante.