Beruflich Dokumente
Kultur Dokumente
Correlación
RELACIÓN NO LINEAL
Ajuste de curvas
• Diagrama de dispersión
• Curva de aproximación
• Relación lineal
• Relación no lineal
• Curva de ajuste
Ecuaciones de curvas de
aproximación
• Linea recta
• Parábola
• Curva cúbica
• Curva cuártica
• Curva de grado n
• Hipérbola
• Exponencial
• Geométrica
El método de los mínimos cuadrados:
Y=mX+b
Coeficiente de Correlación
16
14
Area de la hoja
12
10
8
6
4
2
0
4 6 8 10 12 14 16 18 20 22 24 26
Largo x Ancho de la hoja
Examina la relación
Relacion entre LxA y el area de las
hojas del arbol A
16
14
xi − x
12 -+ yi − y
Area de la hoja
10
++
8 y
6
4
-- +-
2
0
x
4 6 8 10 12 14 16 18 20 22 24 26
∑( x i − x ) ( yi − y )
ya que m = i =1
n >0
∑ i
( x − x
i =1
) 2
Coeficiente de
∑ (x i − x )( y i − y )
s xy
correlación
r = i =1
=
n n sx s y
∑ (x
i =1
i − x) 2
∑ (y
i =1
i − y) 2
Significado de la correlación
n n
∑ (x i − x )( y i − y ) ∑ (x
i =1
i − x) 2
r= i =1
=m
n n n
∑ i
( x
i =1
− x ) 2
∑ i
( y − y ) 2
i =1
∑ i
( y
i =1
− y ) 2
r<0
No hay relación
lineal
Propiedades de r
r > 0 si y solo si m > 0
-1 = < r <= 1
r cerca de 1 indica dependencia lineal creciente
fuerte
r cerca de 0 indica no hay dependencia estadística
lineal
r cerca de -1 indica dependencia lineal decreciente
fuerte
Propiedades de r
• x, y pueden estar correlacionadas, pero no
quiere decir que x causa y o que y causa a
x.
• x, y pueden ser dependientes, pero su
coeficiente de correlación puede ser 0:
• Ejemplo:
– x = -1, 0, 1 y = x2 r=0
– (la dependencia entre x , y NO es lineal)
Dependientes pero no
correlacionadas
Y
-1 0 1 X
x
xi
Suposiciones sobre ei = yi – yi
1, 2, ..., n
• Para cada valor de xi
– ei es un error aleatorio con media cero
– ei son independientes
– ei tiene distribución normal
• ei y ej son independientes i≠ j
• ei tiene desviación estándar común σ e
Distribución de ei
Línea de regresión
poblacional
y
x
LxA Area Predicted Area Residuals
1 13.4 8.28 7.73 0.55
2 15.9 9.36 8.59 0.77
3 13.7 8.28 7.83 0.45
4 14.6 8.64 8.13 0.51
Residuos
∑ ( e − 0)i
2
∑ i i
( y
i =1
− ˆ
y ) 2
se = i =1
=
n−2 n−2
n
∑( y i − ( mxi + b))
2 SSE
= = n−2
i =1
n−2
Correlación múltiple y parcial
• Correlación múltiple
• Ecuación de regresión.Plano de regresión
• Coeficiente de correlación múltiple
• Regresión múltiple no lineal
X1 = b1.23 + b12.3 X2 +b13.2 X3
S 21.23
R1.23 = 1 − =
s21
ANOVA de la Regresión
MS=SS/df F=MSR/MSE Valor p
Signif.
ANOVA df SS MS F
F
Regression 1 43.041 43.041 12.610 0.003
Residual 14 47.785 3.413
Total 15 90.826
SSE SSR
Grados de
SST
libertad
Estimado de σ e en la regresión
de las hojas
• SSE = 47.785
• n = 16, df = 14
• MSE = 47.785/14 = 3.413 = se2
se = (3.413).5 = 1.85
Referencias
• Mann: Sec. 13.1, 13.2, 13.3
– probs: 1-14, 21, 24, 25, 29