Sie sind auf Seite 1von 12

19/09/2016

Tema 2
Descripcin estadstica
de variables bidimensionales

1.
2.
3.
4.

Introduccin
Definiciones
Representacin grfica
Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

1. Introduccin
1. Introduccin
2. Definiciones
3. Representacin grfica
4. Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

Se trata de estudiar 2 caracteres


simultneamente, en cada elemento de
la poblacin.
Si ambas variables estn relacionadas
de forma lineal, puede construirse un
modelo que nos sirva para realizar
predicciones de una variable a partir de
la otra (regresin simple).

19/09/2016

2. Definiciones
1. Introduccin
2. Definiciones
3. Representacin grfica
4. Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

2. Definiciones
xi
1
1
2
2
2
3

Distribucin conjunta de frecuencias


de dos variables
es la tabla que representa
los valores observados
y las frecuencias (relativas o absolutas)
de aparicin de cada par.
Variable cualitativa tabla de contingencia

fr( x , y ) 1
i

2. Definiciones
yj
2
3
1
2
4
5

f (xi, yj)
2
1
1
2
1
3
10

fr (xi, yj)
0,2
0,1
0,1
0,2
0,1
0,3
1

2
0,1

0,2

0,2

0,1

4
5

xi

yj

f (xi, yj)

fr (xi, yj)

0,2

0,1

0,1

0,2

0,1

0,3

10

0,1
0,3

19/09/2016

2. Definiciones

2. Definiciones

Distribucin marginal
Distribucin de cada una de las variables,
consideradas por separado
(distribucin de los valores de una
sin tener en cuenta los de la otra).

fr( xi ) fr( xi , x j )

0,2

0,1

fr( y j ) fr( xi , x j )

0,1

0,1

0,2

0,4
0,1

0,1

5
0,3

0,4

0,1
0,3

0,3

0,3

Aparece en los mrgenes de la tabla.

2. Definiciones

2. Definiciones
Distribucin condicionada de y para x=xi
es la distribucin que se obtiene imponiendo la
condicin x = xi
fr ( y j / xi 2)
Y

Hijos nicos:
Chicas:
Chicos:

9
3
6

1
2
3
4
5

2
0,1
0,1 0,2
0,2
0,1

fr ( y j / xi )

fr ( xi , y j )
fr ( xi )

0,3

1 0,1/0,4 = 0,25
2 0,2/0,4 = 0,5
3
4 0,1/0,4 = 0,25
5

19/09/2016

3. Representacin grfica

1. Introduccin
2. Definiciones
3. Representacin grfica
4. Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

Diagrama de dispersin o nube de puntos

115
95

Peso

1. Introduccin
2. Definiciones
3. Representacin grfica
4. Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

75
55
35
1,4

1,6

1,8

2,2

Altura

4.1. Tipos de covariacin


Variacin conjunta o relacin de dependencia
entre las variables estudiadas (X, Y).
Dependencia causal unilateral:
X influye e Y, pero no la inversa.

Interdependencia:

X influye en Y, y viceversa.

Dependencia indirecta:

Las variables muestran una covariacin a


travs de una tercera variable que influye en
ellas.

Concordancia.
Covariacin casual.

19/09/2016

4.1. Tipos de covariacin


Charles Darwin (1809-1882)

+ naufragios

+ viudas
+ gatos
- ratones

Casual?

+ abejorros
+ polinizacin
+ trbol

4.2. Covarianza

1.
2.
3.
4.

Introduccin
Definiciones
Representacin grfica
Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

4.2. Covarianza

Es una medida descriptiva de la relacin lineal


entre cada par de variables.
n

cov( x, y ) s xy

( x x)( y
i 1

y)
y

Covarianza +

Covarianza 0

Covarianza -

19/09/2016

1.
2.
3.
4.

Introduccin
Definiciones
Representacin grfica
Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

4.3. Coeficiente de correlacin


r vara entre 1 y 1

4.3. Coeficiente de correlacin


* La covarianza tiene el inconveniente de
depender de las unidades de medida.
* Para evitarlo, se emplea el coeficiente de

correlacin lineal:

rxy

cov( x, y)
sx s y

Sir Francis Galton


(1822-1911)

4.4. Matriz de covarianzas


* Frecuentemente, las medidas de dependencia

r= -1

Correlacin lineal perfecta e inversa.


La nube de puntos es una recta
de pendiente negativa.

lineal de un conjunto de datos bidimensionales


se presentan en forma de matriz.

r= 1

Correlacin lineal perfecta y directa.


La nube de puntos es una recta
de pendiente positiva.

Matriz de
covarianzas muestrales

r= 0

No existe correlacin.
O bien existe una relacin no lineal
entre las variables.

sx 2
cov( x, y )

M
2
cov( y, x)

sy

1
corr ( x, y )

Matriz de

R
1
corr ( y, x)
correlaciones muestrales
corr(x,x)=corr(y,y)

19/09/2016

5.1. Recta de regresin


1.
2.
3.
4.

Introduccin
Definiciones
Representacin grfica
Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

* Recta que refleja de la manera ms aproximada


la evolucin conjunta de dos variables.
* Cuanto ms prximo a 1 est el coeficiente
de correlacin, mayor ser la capacidad de
explicacin de la recta.
ajuste de
una recta

Variable
respuesta

Variable
explicativa

5.1. Recta de regresin


Para cada xi tendremos
ordenada real yi
ordenada sobre la recta de regresin
yi
y i

ei

5.1. Recta de regresin

y i

yi y i ei
ei yi y i
xi

residuo

19/09/2016

5.1. Recta de regresin


yi

Posible criterio de construccin:


minimizar la suma de los errores.

ei

y i

5.1. Recta de regresin

ei yi y i
n

yi yi

ei min

min
xi

i 1

Si lo que queremos ajustar es una recta:

y i a bxi
Llamamos funcin de prdida S(a,b) a:
n

yi a bxi

i 1

Para evitar la influencia de los signos:


n

min

i 1

y i

Mtodo de los mnimos cuadrados


Carl Friedrich Gauss (1777-1855)

e
i 1

i 1

Cuantifica lo que se pierde al usar una


recta de regresin simple (la parte de y
que no viene explicada por x).

5.1. Recta de regresin


Minimizando llegamos a:

y y

s xy
sx

x x

(recta de regresin de Y sobre X)

o bien:

xx

s xy
sy

y y

(recta de regresin de X sobre Y)

1.
2.
3.
4.

Introduccin
Definiciones
Representacin grfica
Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

19/09/2016

5.2. Interpretacin de los coeficientes


Como

y a bx

dy
b
dx

b es la pendiente (slope) de la recta


(incremento de y cuando x aumenta en
una unidad).

y y ( xi 1) y ( xi )

a bxi 1 a bxi b

a es el valor de la recta cuando x=0 (intercept)

5.3. Evaluacin del modelo


En general, una recta de regresin
adecuada debe cumplir dos condiciones:
Relacin lineal entre y e x.
La nube de puntos debe ser lo ms
estrecha posible alrededor de la recta de
regresin.

1.
2.
3.
4.

Introduccin
Definiciones
Representacin grfica
Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

5.3. Evaluacin del modelo


La linealidad puede verificarse mediante:
a) Grfico de dispersin XY.

r= 0,96

No hay relacin lineal a pesar del elevado r.

19/09/2016

5.3. Evaluacin del modelo

5.3. Evaluacin del modelo

b) Grfico de valores previstos frente a


valores observados.

c) Grfico de residuos frente a valores


previstos.

linealidad puntos distribuidos linealmente


alrededor de la recta.

linealidad puntos distribuidos al azar

fuente: Weisberg, S (1985)


Applied Linear Regression.
John Wiley & Sons

5.4. Bondad del ajuste


1.
2.
3.
4.

Introduccin
Definiciones
Representacin grfica
Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

* La regresin simple ser tanto mejor


cuanto ms estrecha sea la nube de puntos
alrededor de la muestra.
* La dispersin viene cuantificada por el
coeficiente de correlacin, o por el
coeficiente de determinacin R2, que vara
entre 0 y 1:
n

R 1

e
i 1

Variabilidad
de los residuos

2
yi y

i 1

Variabilidad de los datos

10

19/09/2016

5.4. Bondad del ajuste


Cuanto ms explicativa sea la regresin,
menor ser la variabilidad que queda en los
residuos respecto a la de los datos, y R2
ser mayor.
Nos indica la proporcin de la dispersin de
la variable respuesta y que es capaz de
explicar la recta de regresin.

1.
2.
3.
4.

Introduccin
Definiciones
Representacin grfica
Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

6. Transformaciones

6. Transformaciones

Cuando las hiptesis del modelo no se


cumplen es necesario transformar los datos,
de manera que los datos transformados
cumplan las hiptesis.

Las ms utilizadas son:


Logaritmo
y=ln x x=ln y
Potencia
y= yc x=xc
Inversa
y=1/y x=1/x
Raz cuadrada
y y

x x

11

19/09/2016

1.
2.
3.
4.

Introduccin
Definiciones
Representacin grfica
Covariacin
4.1. Tipos
4.2. Covarianza
4.3. Coeficiente de correlacin
4.4. Matriz de covarianzas
5. Regresin simple
5.1. Recta de regresin
5.2. Interpretacin de los coeficientes
5.3. Evaluacin del modelo
5.4. Bondad del ajuste
6. Transformaciones

12

Das könnte Ihnen auch gefallen