Sie sind auf Seite 1von 174

ESTADSTICA PARA FINANZAS

IMPORTANCIA
En el pasado, tratar gran volumen de datos era una
tarea costosa y tediosa que exiga muchas horas de
trabajo.
Hace como dos dcadas, ya es posible estudiar, analizar
y obtener conclusiones de gran cantidad de datos con
un programa informtico en un computador personal.
El computador contribuye grandemente en la difusin y
uso de los mtodos estadsticos.

NECESIDAD
Los programas informticos pueden conducir a una
automatizacin que orienten a un individuo no preparado
a utilizar tcnicas de forma inadecuada para resolver un
problema.
Es necesario as, una mnima comprensin de los
conceptos de la estadstica as como suposiciones para
su uso con criterio.

OBJETIVO
En el anlisis de datos cuando se dispone de un conjunto
de datos que son
. mediciones,
. observaciones,
. valores

Se busca conocer al menos las caractersticas bsicas


de esa coleccin de datos.

Cmo se puede hacer?

Analizando datos y su conclusiones


ESTADSTICA

ESTADSTICA

DESCRIPTIVA
Organizar y presentar datos
en resmenes numricos, tablas,
cuadros y grficos.

INFERENCIAL
Conjunto de mtodos utilizados para
establecer afirmaciones
probabilsticas acerca de una
poblacin a partir de una muestra

Describe las principales


caractersticas de un conjunto de
datos.

Analiza e interpreta los valores


estadsticos para extraer conclusiones
sobre la poblacin.

(en la poblacin o en la muestra)

(slo en la muestra)

Produciendo datos
Censo

Muestreo

Registro de datos
secundarios
Poblacin

Registro de datos
secundarios
Muestra

Proceso por el
cual se registran
observaciones de
inters de toda
la poblacin en
estudio.

Proceso por el
cual se registran
observaciones de
inters de una
parte de la
poblacin en
estudio llamada
muestra y que
debera ser
representativa.

Proceso por el
cual toman
observaciones ya
registradas de
bases de datos
disponibles y que
son apropiadas
para estudiar la
poblacin.

Proceso por el
cual toman
observaciones ya
registradas de
bases de datos
disponibles y que
son apropiadas
para estudiar la
poblacin.

Registros de toda
la poblacin.

Registros de
apenas una
muestra.

ESTADSTIC
A

DESCRITIVA

Univariada

No agrupada
Agrupada

Bivariada

No
Agrupada
Agrupada

Multivariada

Glosario de trminos

Datos
Estadstica
Estadstica descriptiva
Inferencia Estadstica
Probabilidad
Censo
Muestreo
Unidad de Estudio
Poblacin
Tamao de la poblacin
Muestra
Parmetro
Estadstico

Conceptos

DATOS
Existen varias definiciones de data, dos ejemplos a
continuacin:

Hechos, conceptos o derivados de forma que puedan


ser comunicados e interpretados. (p. 57), Galland (1982).

Hechos en bruto que pueden ser modelados y formados


para crear informacin (p.14), Laudon and Laudon (1991).
Aunque las definiciones no son iguales, la mayora coincide en
que son un paso previo para la obtencin de informacin.

ESTADSTICA
Se la conoce como una ciencia o disciplina que incluye un conjunto
de tcnicas que permite, de forma sistemtica o no, organizar,
resumir, modelar, describir, analizar e interpretar datos originales de
estudios o experimentos, realizados en cualquier rea del
conocimiento.

ESTADSTICA BSICA

Se puede dividir en tres reas:

Estadstica Descriptiva,

Inferencia Estadstica y

Probabilidad

ESTADSTICA DESCRIPTIVA

ESTADSTICA DESCRIPTIVA

En resumen, se busca entender La Distribucin del


conjunto de los valores de los datos.
Dnde caen a lo largo del eje de medicin?
Qu clase de patrn forman?
Cules son los cuartiles de la distribucin ? (a lo largo
de la escala de observacin)
Alguna de esas observaciones son discrepantes del
resto? (caen muy lejos de la mayora)
Se repiten esos valores?

Cul es la densidad o concentracin relativa de las


observaciones en diversos intervalos a lo largo de
la escala de medida?
La data se acumula al medio de su rango?
La data se acumula en uno de los trminos?
La data se acumula en varios lugares?
La data est simtricamente distribuida?

POR EJEMPLO:
Para todos los estados de USA, acerca del Producto
Nacional Bruto, se deseara preguntar:
. Cul es un valor promedio, central o
tpico del
conjunto total?
. Cun dispersa est la data alrededor del
centro?
. Cun lejos del valor tpico estn los valores ms
extremos, tanto los altos como los bajos?
. Qu fraccin de los nmeros son menores que el
valor de para un Estado en particular?

Notacin poblacional vs
muestral
Medida
Media
Varianza
Desviacin estndar
Proporcin
Total

Poblacional

Muestral

Medidas de tendencia central


y de posicin

Datos No agrupados

Medidas de Tendencia Central

Definicin general:
Son aquellas medidas que
ubican el centro de una
distribucin o de un grupo de datos y reciben el nombre de
medidas de tendencia central.

Se utilizan cuando se est interesado en estadgrafos que


representen valores centrales en torno a los cuales se agrupan
las observaciones o datos.

Medidas de tendencia central

Media Aritmtica
Mediana
Moda
Media Geomtrica
Media Armnica

Media Aritmtica
n

i1

xi

xi : Valores que toma la variable X


n : Nmero de
observaciones

Propiedades:
a) Todos los valores de la data estn considerados e incluidos en el
clculo de la media aritmtica.
b) Existe una nica media aritmtica para un conjunto de datos.
c) La suma de las desviaciones alrededor de la media es igual a cero.
d) Es sensible a los valores extremos.
e) Usa toda la informacin disponible sobre las observaciones.
f) Matemticamente es fcil trabajar con ella.

Ejemplo:
Promedio de la edad de las 20 personas
n

45 41 ... 45 37
M X xi n

20
i1

43.5

xi
n

: valores que toma una variable


X
: nmero de observaciones

Media ponderada:

Para superar la influencia de los valores extremos en el


clculo
de la media se utiliza la media ponderada.
k

wi xi

x 1 , x 2 ,,...., x n
w1 x1 w 2
w 1 , w 2 ,....,
x 2 ....
wn
wn xn
i1

valores observados

wi
i1

pesos asociados a cada observacin

Ejemplo:
En una empresa de produccin se tienen los siguientes
datos: el sueldo promedio de

mensuales,
los empleados es de
S/.2500
mensuales y
los los
operarios
es de
de
ejecutivos
es de S/. S/. 3800 mensuales
1850

Cul ser el sueldo promedio en esta empresa si se


sabe que el 10% son ejecutivos, el 30% son empleados y
el resto son operarios?

Media total:
Es un promedio ponderado en el cual la ponderacin est determinada
por el nmero de elementos de cada grupo. Se utiliza cuando se
desea hallar un promedio de promedios cuando se tienen k grupos
diferentes.
K

n x
T

n x n x ... n x
i1k
1 1n 2n 2 ... k k
1
2
k
n

i
n
i 1
i

Ejemplo:
En una central telefnica se recibieron,

entre las 9 a.m. y las 10 a.m. 70 llamadas con una


duracin menor a 3 minutos, cuyo tiempo promedio fue
de
2.4 minutos;
50 llamadas con una duracin de 3 minutos o ms pero
menor a 10 minutos, cuyo tiempo promedio de
duracin fue de 6.4 minutos;
30 llamadas con una duracin superior a loa 10
minutos
con un tiempo promedio de 15.3 minutos.
Cul ser el tiempo promedio por llamada en esta central
telefnica en ese periodo de tiempo?

Propiedades de la media:
1) El promedio de una constante es la misma constante:

M (b) b,

b es una cons tante

2) Si a todos los valores de una conjunto de datos se le


suma o resta una constante C, entonces la media
quedar sumada o restada por esa misma constante:

Si Y X b
b

M (Y ) M ( X )

Propiedades de la media:
3) Si a todos los valores de una conjunto de datos los
multiplicamos por una constante a, entonces el promedio
quedar multiplicado por ese mismo valor.

Si
)

Y aX

M (Y ) a M ( X

4) Si consideramos las dos ltimas caractersticas


tendremos que: (a y C son constante numricas)

Si Y aX b
(X ) b

M (Y ) aM

Caracterstica de la media aritmtica


1) Es la medida de tendencia central ms conocida y utilizada.

2) Se calcula tomando en cuenta la magnitud de todos y cada uno


de los datos.

3) Es sensible a valores extremos, tienden a sesgarla o desplazarla


hacia esos extremos, Por lo que no es representativa para
datos con estas caractersticas.

4) Es una medida nica, es decir para una grupo de datos, existe


una sola media.

5) Permite
calcular el promedio de los valores transformados,
utilizando las propiedades algebraicas.
6) No puede calcularse cuando la tabla de distribucin de
frecuencias tiene intervalos de clase abiertos indefinidos.
7) La suma de las desviaciones
(diferencias)
variable X y su media aritmtica es cero:
n

(xi

a,

entre los valores de la

Mediana (Me)
Es aquel punto o posicin en la escala de la variable que divide a
los datos en dos grupos con igual nmero de observaciones

X1 , X

Se tienen los siguientes datos:


Ordenados del siguiente modo:

,, Xn

X 1 X 2 X n

entonces:

n1
2

Me
1
X
2

si n es
impar

si
n
es

X n 1
par
2

Mediana (Me)
a)Una distribucin tiene una nica mediana.
b) La mediana no est afectada por valores extremos.
c)No usa toda la informacin sobre el tamao y magnitud de las
observaciones, tan solo su posicin relativa en las
observaciones ordenadas.
d)Su clculo es ms complejo, pues requiere ordenar previamente las
observaciones de menor a mayor y determinar si el tamao de la
muestra es par o impar (es menos manejable matemticamente).

Caracterstica de la Mediana

Le sigue en importancia a la media aritmtica, como medida


de tendencia central.
No es sensible a valores extremos,
por eso se recomienda
usarla en distribuciones asimtricas
Es una medida nica, es decir, para una grupo de datos, existe
solo
una mediana.
La mediana puede ser calculada en cuadros de distribucin
con intervalos
La suma de las desviaciones absolutas de las observaciones
con
relacin a la mediana es mnima:
de
Eln clculo de la mediana es independiente a,
de la magnitud
X i Me
es minima
las observaciones.

i1

,b

Moda (Mo)
Es el valor que se presenta con mayor frecuencia en un
conjunto de observaciones.
Una distribucin puede tener una moda (unimodal), ms de
una moda (bimodal, trimodal, etc.), o ninguna.
En distribuciones continuas, se puede hallar un intervalo modal
(o
ms de uno).
Es la nica medida de tendencia central que puede utilizarse
con datos en escala nominal.
Moda

0,5000
0,4500
0,4000
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
0,0000

Rango

Media armnica

(Xa )

xa

n
n

i 1

xi

Se emplea cuando lo que se quiere promediar son razones,


donde los numeradores son los mismos para todas las razones
pero los denominadores son diferentes.
Razones: son ratios que muestran comparaciones o indican una
divisin:
Se utiliza para algunos clculos como el costo promedio de
las acciones adquiridas a lo largo del tiempo.
Ejemplo:
Poblacin por kilmetro cuadrado, ingreso per-capita,
unidades producidas por hora, etc.

Percentiles Cuantiles
Son medidas descriptivas que permiten dividir, distribuir o subclasificar los datos, a uno y otro lado en porcentajes dados,
una vez ordenados y clasificados.

Pk
X

2
100

kn

Percentil k

Percentiles Cuantiles
Percentiles con que ocasionan divisiones
particulares

Qk X

kn

Dk X

1
2

k-simo cuartil de un total de 3

kn


10 2

k-simo cuartil de un total de 9

Pk X


100 2

kn

k-simo cuartil de un total de 99

Percentiles Cuantiles
Ejemplos:

Q1 X

1n

D3 X

1
2

primer cuartil de un total de 3

3n


10 2

tercer decil de un total de 9

P70 X

1
100 2

70n

percentil 70 de un total de 99

La mediana divide la distribucin en la mitad.


Los cuartiles dividen la distribucin en cuartos.
Los quintiles dividen la distribucin en quintos.
Los deciles dividen la distribucin en dcimos.
Los percentiles dividen la distribucin en centsimos.

Percentiles Cuantiles
Para determinar la posicin de una observacin en un percentil
y donde n datos son ordenados ascendentemente, se utiliza la
siguiente frmula:

Ly (n
1)

y
100

Cmo determinar la posicin de un percentil


Py es el valor por debajo del cual cae el y% de la distribucin, o el ysimo percentil. Para n observaciones ordenadas ascendentemente,
la posicin Ly del y-simo percentil Py es:

Ly (n
1)

y
100

Si Ly = entero, la localizacin corresponde a una observacin.


Si Ly entero, la localizacin cae entre los dos enteros ms cercanos
(por encima y por debajo), y se debe utilizar la interpolacin lineal
para hallar Py.

Media Geomtrica ( X
g

La media Geomtrica de los nmeros X 1 , X 2 ,..., X n


se calcula mediante la siguiente frmula:

xg

X1 X

... X n

FORMULA 1: Factor de crecimiento promedio


(Cuando slo se tienen los factores de crecimiento)

xg
t

F C 1 F C 2 ... F C t

: Nmero de periodos transcurridos

FCt : Factor de Crecimiento en el periodo t con respecto al periodo t-1

FORMULA 1: Factor de crecimiento promedio

Se utiliza con frecuencia para calcular el retorno de una


inversin en mltiples periodos o cuando se miden ratios de
crecimiento compuesto.
Para calcular la media geomtrica de una serie de retornos
se debe sumar 1 a cada valor, y luego restarle 1 al
resultado:

Rg n 1 R1 1 R2 ... 1 Rn
1

Las aplicaciones ms comunes de esta medida estn


cuando se tienen variables que cambian a travs del
tiempo.
Considerando esto tendremos las siguientes frmulas
para calcular la media geomtrica:

FORMULA 2: Factor de crecimiento


Se calcula a partir de la siguiente expresin:

Xt
FC t
Xt

Xt

:Valor de la variable en el periodo t

X t 1 : Valor de la variable en el periodo t-1

Nota:

Si FC>1,
quiere decir que el valor de la variable
se incremento.

Si FC<1,
quiere decir que el valor de la variable
disminuy.

Si multiplicamos el
Factor de Crecimiento por
100,
entonces este quedar expresado en porcentaje.

La media geomtrica en el
factor de
crecimiento promedio, de la variable en
estudio, a travs del tiempo.

FORMULA 3: Factor de crecimiento promedio


(Cuando solo se tiene la cantidad del periodo inicial y
la cantidad del periodo final)

xg

X : Valor de la variable del periodo inicial


0

: Valor de la variable del periodo final

t : Nmero de periodos

Tasa de Crecimiento (TC)

Cuantifica la variacin de una variable a travs del


tiempo.
Las tasas de crecimiento pueden ser
anuales, mensuales, semanales, etc.

Se calcula a

partir del FC del siguiente modo:

TCt

TC t % FC t %
100%

FCt 1

Por ejemplo si el FC=1.36, entonces la TC=0.36, es decir


la variable se increment en 0.36 (o la variable se
increment en un 36%)

Como
la media geomtrica es el Factor de
Crecimiento promedio, entonces Tasa de crecimiento
promedio ,
que la
denotaremos como r ser:

r xg 1

Es decir si tengo una media geomtrica de 1.65 ( 165%),


significar que la Tasa promedio de crecimiento fue de
0.65 ( 65%)

Cmo interpretara

se FC=3.45?

Medidas de tendencia central

La media geomtrica representa la tasa de crecimiento o tasa de retorno


compuesta de una inversin. Es til en el anlisis de rentabilidad de una
inversin en un horizonte de varios perodos.
La media aritmtica es de inters para medir el desempeo promedio en un
solo perodo.
Media geomtrica

A mayor dispersin de los datos, mayor diferencia entre estas dos medidas.
Slo son iguales cuando todas las observaciones son iguales.
Para valores diferentes,
Media harmnica

Media aritmtica

Media geomtrica Media aritmtica

La media harmnica es apropiada para promediar ratios cuando stos son


aplicados repetidamente a una monto fijo para producir una cantidad variable
de unidades. Por ejemplo, el beneficio de invertir cada mes o cada semana el
mismo monto de dlares para la compra de cuotas de un fondo mutuo
(costo promedio).

Medidas de dispersin

Datos No agrupados

Medidas de dispersin
Dispersin es la variabilidad alrededor de la tendencia central.
La dispersin es una medida del riesgo.
Dispersin absoluta.- Es el monto de variabilidad observada
sin
compararlo con ningn punto de referencia.
Las medidas de dispersin absoluta ms comunes son: el
rango, desviacin absoluta de la media, varianza y desviacin
estndar.
Dispersin relativa.- Es el monto de variabilidad con relacin a
un punto de referencia .
Las medidas de dispersin relativa ms comunes son:
el coeficiente de variacin y el ratio de Sharpe.

Medidas de dispersin

Rango
Rango intercuartlico
Desviacin absoluta de la media
Varianza
Desviacin estndar
Semivarianza y semidesviacin
Coeficiente de variacin
Ratio de Sharpe
Asimetra
Curtosis
Desigualdad de Chebyshev

Rango
El Rango es una medida de variabilidad o Dispersin. Es la diferencia
entre el Valor Mximo y el Valor Mnimo de las observaciones.
Puede resultar una informacin distorsionada del comportamiento de la
variacin.

RX

max

min

Rango intercuartlico
Es una medida que mantiene la idea del rango pero no es influenciado por
los valores extremos. El Rango Intercuartil mide la dispersin de la mitad
(50%) de los datos. La idea es dividir los datos ordenados en cuatro partes
iguales y ver cuan alejadas estn las dos partes extremas. Para
distribuciones sesgadas o con datos discordantes, RI tiende a ser la mejor
Medida de la dispersin

RI

Q3 Q1

Desviacin absoluta media


(Mean Absolute Deviation - MAD)
Es el promedio de los valores absolutos de las desviaciones de
observaciones individuales respecto de la media aritmtica.

DAM

i1

X
n

Varianza y desviacin estndar


Es el promedio de las desviaciones al cuadrado respecto de la media
aritmtica.
N

Poblacional:

i
i1

Muestral:

s2

i1

Al calcular la varianza muestral se utiliza n-1 como denominador


debido a que se mejoran las propiedades estadsticas de s 2.
En trminos estadsticos, s 2 es un estimador insesgado de 2 .
La cantidad n-1 representa los grados de libertad al estimar la
varianza poblacional ya que cuando se calcul la media, solo quedaron
n-1 desviaciones independientes respecto de la media.

Semivarianza y semidesviacin

Estas mediciones nacen de la preocupacin de los inversionistas por


medir el riesgo de los retornos que se encuentran por debajo de la
media.
Se calculan considerando solo las observaciones que son menores
que la media.

Coeficiente de variacin
Mide cunta dispersin respecto de la media existe en una distribucin.
Permite la comparar de forma directa diferentes conjuntos de datos.
En inversiones el CV mide el riesgo por unidad de retorno
esperado
(media).

CV

SXX

Ratio de Sharpe

Mide el exceso de retorno por unidad de riesgo.


Es utilizado para medir la performance de inversiones.
Basado en informacin histrica de los retornos, el ratio
Sharpe de un portafolio se define como:

Ratio de Sharpe

rp rf

donde:

rp
rf
p

= retorno del portafolio


= retorno libre de riesgo
= desviacin estndar de los retornos del

Ratio de Sharpe
Los inversionistas adversos al riesgo que toman
decisiones basados en
el retorno promedio y
desviacin estndar prefererirn
su
portafolios con
ratios de Sharpe mayores.
Limitaciones:

Interpretacin de ratios de Sharpe negativos.

Solo
considera
solo desviacin
estndar.

un aspecto del riesgo: la

Asimetra

Una distribucin simtrica es aquella que mantiene la


misma forma a ambos lados de la media.
El sesgo describe el grado de asimetra de una distribucin
con relacin a su media.

( Xi

n
SK

X ) s3
(n 1)(n 2)

Para n muy grandes


la expresin se reduce
a:

SK

i
1

n X ) s3

(X

Como referencia, para un


muestra de 100 observaciones a ms,
un sesgo de 0.5 es alto.

Asimetra

Distribucin simtrica -->


SK = 0
Distribucin con sesgo positivo (hacia la derecha) -->
SK >
0
Moda < Mediana < Media
Distribucin con sesgo negativo (hacia la izquierda) --> SK <
0
Moda > Mediana > Media

Curtosis
Mide si una distribucin es ms o menos puntiaguda que una
distribucin normal y provee de informacin sobre la probabilidad
de resultados extremos.
Leptocrtica.- Distribucin ms puntiaguda (y con colas ms
gordas) que una distribucin normal.
Platicrtica.- Distribucin menos puntiaguda que una
distribucin normal.
Mesocrtica.- Distribucin idntica (en curtosis) a la normal.
La curtosis de una distribucin normal es igual a
3. El exceso de curtosis se mide como: curtosis 3.
Un exceso de curtosis > 1 en valor absoluto se

Curtosis
El exceso de curtosis en una muestra
es:
n

Xi X

n(n
i1
4
KE
1)
s
(n 1)(n 2)(n
3)

2
(n
1)
2)(n
(n
3)
3

grandes la expresin se reduce


Para n muy

a:
n

KE
1

X i X
i1
s4

Leptocrtica --> KE > 0

Platicrtica --> KE < 0

Mesocrtica o Normal -->


=0

KE

Desigualdad de Chebyshev
La desigualdad de Chebyshev declara que la proporcin de las
observaciones dentro de k desviaciones estndar de la media es
al menos 1 1/k2 para todo k > 1.
Segn esto, para cualquier distribucin se cumple:

36% de las observaciones caen en un intervalo de


estndar.
56% de las observaciones caen en un intervalo de
estndar.
75% de las observaciones caen en un intervalo de
estndar.
89% de las observaciones caen en un intervalo de
estndar.
94% de las observaciones caen en un intervalo de
estndar.

1.25 desviaciones
1.50 desviaciones
2 desviaciones
3 desviaciones
4 desviaciones

La importancia de esta regla es su generalidad. Se cumple


para cualquier conjunto de datos ya sea de una muestra o de
una poblacin y sin importar la forma de la distribucin.

Desigualdad de Chebyshev
Sea X una variable aleatoria con media
y varianza 2 finita.
Para cualquier k>0 (positiva) se verifica:

P Z k

1
k

P Z k 1

Donde:
Z

( X )

P k X k 1 2
k
1

Desigualdad de Chebyshev
Ejemplo:
Obtener cul es la probabilidad mxima de que una variable
aleatoria difiera de su media en al menos 2,3,4 y 5 veces la
desviacin tpica
Si k=2

P[ X- 2 ] 1 /22

P[ X- 2 ] 1-1 /22

Si k=3

P[ X- 3 ] 1 /32

P[ X- 3 ] 1-1 /32

Si k=4

P[ X- 4 ] 1 /42

P[ X- 4 ] 1-1 /42

Si k=5

P[ X- 5 ] 1 /52

P[ X- 5 ] 1-1 /52

Desigualdad de Chebyshev

Si k=2

P[ X- 2 ] 1-1 /22

Si

P[ X- 3 ] 1-1 /32 75 % al menos el

k=3

al menos el
89 %

Covarianza
La varianza y la
desviacin
estndar son
medidas de
dispersin o
volatilidad
de una variable.
En finanzas, interesa conocer cmo dos variables aleatorias se comportan
con relacin a la otra, por ejemplo en el caso de los retornos de dos
inversiones.
La covarianza y la correlacin son medidas que proveen de informacin
muy til.
Se expresa:
Mide cmo una variable aleatoria se mueve respecto de otra variable
aleatoria.
Es el valor esperado
del
estndar
de jlas dos
i
j producto de
i las desviaciones
i
j
variables aleatorias respecto de sus valores esperados.

Cov R , R E

Ri

Retorno
R de la inversin
E(Ri

Rj

Retorno de la inversin j

E(R )

Covarianza

Poblacin

Cov( X ,Y ) X ,

N
i
1

( X i )(Yi
) N

Muestra

Cov( X ,Y ) SX ,
Y

n
i
1

( Xi X )(Yi
X)n
1

Covarianza
PROPIEDADES
1.Representa el mismo concepto que la varianza.
2.La covarianza de una variable aleatoria consigo misma es su propia varianza.
3.El rango de la covarianza puede extenderse desde - hasta +.
4.Cov(Ri, Rj) > 0 -- El retorno de ambas inversiones tiende a ir en el mismo
sentido (por encima o debajo) de sus valores esperados.
5.Cov(Ri, Rj) < 0 -- Cuando el retorno de una inversin est por encima de su
valor esperado, el retorno de la otra inversin tender a estar por debajo de su
valor esperado (relacin inversa).
6.Cov(Ri, Rj) = 0
No existe relacin entre los resultados de las variables (inversiones).

Correlacin
Mide el movimiento conjunto (relacin lineal) entre dos
variables
aleatorias.
Esta medida hace ms fcil la interpretacin de la
covarianza. Se expresa:

R , R
i

j
ij

Cov R R

(Ri ) (R j
)

i
j

Correlacin
PROPIEDADES
1.Mide la fuerza de la relacin lineal entre variables aleatorias
2.No tiene unidades
3.Su rango es -1 (Ri, Rj) 1
4.Si (Ri, Rj) = 1 -- las variables tienen correlacin positiva perfecta,
es decir, el movimiento de una variable resulta en un movimiento de la
otra en el mismo sentido y en la misma magnitud respecto de su media.
5.Si (Ri, Rj) = -1 -- las variables tienen correlacin negativa perfecta.
El movimiento de una variable en un sentido har que la otra lo haga
en el sentido opuesto.
6.Si (Ri, Rj) = 0

-- no existe relacin lineal entre las variables.

Correlacin
APLICACIN
Para un portafolio de n activos donde wi es el peso de cada activo
en el portafolio.
El valor esperado de los retornos puede determinarse como:
n

E RP w1 E R1 w2 E R2 wn E Rn wi E Ri

i1

Var RP

w w Cov R , R

La varianza de dichos retornos se determina mediante:

i1

Aplicacin

Medidas de posicin

Datos A-grupados

Media
k

xf

i i

i1

xi h

i1 i

xi

k : nmero de intervalos de clase

xi : marca de clase
f i : Frecuencia absoluta simple

hi : Frecuencia relativa simple


n : Nmero de datos

(x
0
i1

x) f i

Mediana
Usaremos la frmula siguiente

2 F i1

M e Li c
fi
donde:

Li : Lmite inferior del intervalo mediano


c : amplitud de clase del intervalo mediano

: Frecuencia absoluta acumulada anterior al


Fi intervalo mediano
: Frecuencia absoluta simple del intervalo
1
mediano

fi

Cuando no se tienen las frecuencias absolutas, se puede


utilizar la siguiente frmula, con frecuencias relativas:

0 .5 H

Donde:

hi

Me L

: Frecuencia relativa acumulada anterior al intervalo


Hi mediano
1 : Frecuencia relativa simple del intervalo mediano

hi

c
i1

Cmo ubicar el Intervalo Mediano?

El intervalo mediano (o clase mediana) es el primer intervalo


cuya frecuencia absoluta acumulada sea igual o mayor a la
mitad de observaciones; o tambin es el primer intervalo cuya
frecuencia relativa acumulada sea igual o mayor al valor 0.5
(50% de los datos)

Es decir, ubicar el primer intervalo donde:

n
Fi
2

H i 0.5

Moda (Mo)
La Moda es el valor obtenido de la tabla de frecuencias, que se repite
ms frecuentemente en un conjunto de datos agrupados, se
encuentra en el intervalo con mayor frecuencia.

Intervalo modal
Es aquel intervalo cuya frecuencia absoluta simple es mayor, o es
aquel intervalo cuya frecuencia relativa simple es mayor.

Moda

d1

Mo Li

c
d1 d 2
L

c
fi1
fi

1 f i f i 1
d

donde

d2

fi fi 1

: Lmite inferior de la clase modal


: Amplitud de la clase modal
: Frecuencia absoluta simple anterior a la
clase modal ( Frecuencia pre-modal)
: Frecuencia absoluta simple de la clase
modal

f i 1 : Frecuencia absoluta simple posterior a la

clase modal (frecuencia postmodal)

Caractersticas de la Moda:

En una curva de distribucin de frecuencias representa el


punto ms alto de esta.
No es afectada por valores extremos.
El clculo de la moda es independiente de la magnitud de
las observaciones.
No es nica, para un grupo de datos la moda puede no
existir, existir y ser nica o existir y no ser nica
(distribuciones multimodales)
En datos agrupados, puede calcularse cuando existen
intervalos de clase de la forma:

a,

,b

Relaciones entre la media, la mediana y la moda

En una distribucin simtrica:

x Me Mo

Si en una distribucin unimodal se cumple que:

x Me Mo

Entonces la distribucin ser asimtrica negativa


(tiene sesgo o cola hacia la izquierda)

Si en un distribucin unimodal se cumple que:

x Me Mo

Entonces la distribucin ser asimtrica positiva


(tiene un sesgo o cola hacia la derecha)

Para distribuciones unimodales asimtricas se tiene la


siguiente relacin emprica:

x Mo 3(x
Me)

Media armnica datos agrupados

xa

n
k

i 1

fi
xi

Percentiles (Pk)

k
1
nk

Pk Li c 100 f i

k
1,2,...99

Li : Lmite inferior de la clase percentlica


Fi-1 : Frecuencia absoluta acumulada del Intervalo pre-percentlico
fi : Frecuencia absoluta simple del intervalo percentlico
c : Amplitud de clase del intervalo percentlico
n : Nmero de datos

Frmula alternativa (con frecuencias relativas)

Pk L i c 1 0 0

hi

k 1

k 1,2,...99

Hi-1 : Frecuencia relativa acumulada anterior al


intervalo percentlico.
hi : Frecuencia
relativa
simple
del
intervalo percentlico

Graficos

Diagrama de Pastel
Diagrama de Barras
Diagrama de Bastones
Diagrama de Frecuencia
Diagrama de Cajas (Box Plot)
Diagrama de Tallos y Hojas
Histogramas
Diagramas temporales

MTODOS GRAFICOS PARA ANALIZAR DATOS


Muchas respuestas pueden ser obtenidas de un estudio
minucioso al presentar la data en una tabla, sin
embargo, muchas preguntas distribucionales son
difciles de responder desde una tabla.
Hay mtodos grficos nuevos y mtodos grficos
conocidos antiguos.
Algunos mtodos grficos pueden ser elaborados a
mano y otros necesitarn un programa de
computadora.
En diversas situaciones, un conjunto de datos grande o
pequeo puede analizarse slo a travs de mtodos
grficos que pueden ser ms reveladores.

MOTIVOS PARA ANALIZAR DATOS CON GRAFICOS


Existen diversos motivos para la Visualizacin grfica:
1.- Registrar y guardar data en forma compacta.
2.- Comunicar informacin a otros.
3.- Analizar un conjunto de datos para conocer ms
acerca de su estructura.

Diagrama de Pastel
Para variables cualitativas o categricas
y a veces cuantitativa categorizada

El Pastel o Torta representa la totalidad de las unidades y


cada divisin de la torta es la frecuencia, proporcin o
porcentaje de una categora o valor de una variable
cualitativa o cuantitativa respectivamente.

Trazo de pastel con de los tems


teniendo la misma propiedad
Trazo de pastel con 7/8 de los tems
teniendo la misma propiedad

Diagrama de Barras
variables cualitativas o categricas
a veces cuantitativas categorizadas

Son grficos en barras de porcentajes, proporciones o


frecuencias de cada categora de los tems.
La altura de cada barra es el porcentaje, proporcin
o frecuencia de tems en cada categora.
El ancho de las barras no tiene significado pero debe
ser
el mismo para todas las categoras.

Diagrama de Barras
De una muestra de 20 personas,
en un estudio mdico de presin
sangunea, se analiza la proporcin
del gnero objeto del estudio.

Se observ que 8 de los


pacientes, 40% de los analizados,
eran mujeres mientras que 12 de
ellos, es decir, 60% eran hombres.

Diagrama de bastones
variables cuantitativas
discretas
6/36

5/36

5/36

4/36

4/36

3/36

3/36

2/36

2/36

1/36

1/36

10

11

12

Grficos de dispersin
variable cuantitativa continua

Diagrama de
Cajas o
Box Plots
variables cuantitativas continua
Cuando el anlisis exige conocer medidas
estadsticas, el box Plot es un mtodo de
resumen grfico de estas medidas.
El Box Plot ofrece una rpida impresin de
ciertos detalles prominentes de la
distribucin de la variable.

Box Plot:
La mediana, muestra el centro o localizacin de
la distribucin.
La dispersin del grueso de la data (del 50% central) es
visto como la longitud de la caja (del Box).
La longitud de las lneas punteadas relacionadas con la
caja,
muestran cuan estrechas estn las colas de la distribucin.
Los valores individuales fuera de las lneas, proporcionan
al espectador la oportunidad de considerar la existencia de
outliers que son medidas insualmente o implausiblemente
grandes o pequeas.

Box Plot:
Los valores fuera de las lneas punteadas, no
necesariamente son outliers.
Cualquier outlier siempre caer fuera de las
lneas
punteadas del Box Plot.

Box Plot:
El Box Plot permite una evaluacin parcial de la
simetra de la distribucin.
Si la distribucin es simtrica, el Box Plot es
simtrico respecto de la mediana,
La mediana corta la caja por la mitad.
Las lneas punteadas superior e inferior son
aproximadamente de la misma longitud.
Los puntos fuera de las lneas punteadas son
iguales en nmero y simtricamente
colocados.

La distribucin es simtrica ?

Podra existir asimetra en la data y el Box Plot no


llegue a revelarla.
En general, el Box Plot ofrece una buena
indicacin
aproximada.

Box Plot:

La primera parte de la caja a (Q1, Q2),


La segunda parte de la caja a (Q2, Q3)
El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1)
El bigote de la derecha viene dado por (Q3, Xmx).

Box Plot:

El rango intercuartlico es la distancia entre Q3 y Q1


RIQ = Q3 Q1
Valores atpicos inferiores a

Valores atpicos superiores a

Q1 - 1.5 *
RIQ
Q3 - 1.5 *
RIQ

Box Plot:
Grfico en resumen

Ejercicio
Buscar un conjunto de datos cuantitativos para una
variable
Calcular todos los estadsticos del Diagrama de Cajas
Interpretar los estadsticos de acuerdo a la naturaleza de
la data

Histograma:
Para variables cuantitativas discretas o continuas

Es el diagrama ms utilizado por tcnicos y no tcnicos.


Es la particin del rango de los datos en varios intervalos
de igual longitud.
Contar el nmero de observaciones en cada intervalo y
graficar los conteos como longitudes de barras en un
histograma.

Histograma:

Histograma:

Histograma:

Tallos y Hojas:
Para variables cuantitativas discretas o
continuas
El Diagrama de Tallos y Hojas es un diagrama hbrido entre una tabla y
un grfico.
Muestra nmeros apilados y a la vez se muestra como una figura.
Es una forma compacta de registrar la data. Podra reducir
la representacin a por ejemplo la mitad de dgitos.
Es como un histograma apoyado de lado.

Ejemplo:
En la presente base de datos
de Mximas Concentraciones
de Ozono Diarias en Stanford
Connecticut, hay 319 dgitos.

Con el diagrama de Tallos y


Hojas se puede representar
con tan solo 175 dgitos.

Adems, se puede apreciar


visualmente un comportamiento
grfico.

Ejemplo:

Considerado
como un
histograma,
tiene longitud
de intervalos
igual a 10.

La data de ozono es asimtrica.


La mayor parte de los das en
Stanford, tuvieron
concentraciones mximas de
ozono entre 30 y 90 ppb.
Existe una leva contraccin de
ocurrencia alrededor de los 50
ppb, que sera difcil apreciar en
un grfico quantil-quantil por
ejemplo. Podra haber una
explicacin o es talvez un simple
accidente de los datos.
Los dos valores de 14ppb se
notan menos excepcionales en
este diagrama que en un grfico
quantil lo haran.

Ejemplo:

Alternativas:
En ocasiones, la data es tan abundante que podra graficarse en dos
o ms tallos, para que las grficas muestren mayores detalles.
En estos casos, se puede alterar la longitud de los
intervalos. Considerar slo los datos de ozono entre 60 y 89
ppb
Primera forma.- Hay muy pocas
filas como para que el diagrama
sea informativo.
Segunda forma.- Cada tallo tiene dos filas.
La primera es para las hojas del 0 al 4.
La segunda es para las hojas del 5 al 9.
La longitud del intervalo es 5.

Alternativas:
Tercera forma.- Cada tallo tiene cinco filas.
Los parntesis son para recordar qu
hojas (dgitos) irn en cada tallo.
La primera fila es para las hojas del 0 al
1. La segunda es para las hojas del 2 al
3.
La longitud del intervalo es 2.

Tallos y Hojas:
Es posible, segn la necesidad:
Multiplicar por alguna potencia de 10 para facilitar la
elaboracin del diagrama.
Truncar la data
Transformar la data
Cambiar la longitud de los intervalos
Las hojas pueden ser de un dgito, de dos dgitos,
etc.
Se pueden elaborar diagramas de Tallos y Hojas con
data no ordenada (las hojas no sern ordenadas dentro

Formas Distribucionales
variables cuantitativas discretas o
continuas

FORMAS DISTRIBUCIONALES:

FORMAS DISTRIBUCIONALES:

FORMAS DISTRIBUCIONALES:

Distribucin Normal

Distribucin Normal

Distribucin Normal

Distribucin Normal

Z es el nmero de
desviaciones estndar
respecto de la media

Distribucin t-Student

Inferencia

Inferencia

Muestreo

Intervalos de confianza

Intervalos de confianza

Intervalos de confianza

Modelo de Regresin
Lineal
Docente: MAGEN INFANTE
magen.infante@gmail.com

Relacin entre dos variables

Esteestudio
est dirigido a descubrir las
relaciones entre dos variables o entre dos
conjuntos de observaciones.

Los datos
usados para describir la
relacin entre dos variables son llamados
bivariantes.

Relacin entre dos variables


Seguir los siguientes pasos:

Registrar n observaciones de 2 variables, una dependiente


de la otra.

Construir el grfico Diagrama de Dispersin de los Datos


(Scatterplot).

Analizar y decidir si es posible resumir la relacin de las dos


variables con un modelo simple.

Desarrollar un Modelo de Regresin Lineal para predecir el


valor de una variable a partir del valor de la otra variable.

Discutir la correlacin que mide la fuerza (validez,


intensidad) y direccin de la relacin lineal entre las dos
variables.

Algunas variables con asociacin


Variable respuesta

Variable explicatoria

Altura de una persona


Altura de uno de los padres o la edad
Peso
Edad, Peso promedio de los padres, etc.
Presin sangunea
Edad, Peso, etc.
Examen semestral (nota)
Examen anterior semestre (nota)
Demanda de un producto
Demanda anterior, precio, peso, nro de competidores, etc.

Ejemplo:
Sean dos variables cuantitativas: Examen Parcial y Examen Final.
Se desea analizar la relacin entre las notas del exmen parcial y las
notas del examen final de un curso.
Podra utilizarse un modelo que podra para predecir la nota del
Examen final para un estudiante de quien ya se conoce su
calificacin del Examen parcial.
stas dos notas son las variables cuantitativas.

: Notas del Examen Final (variable respuesta)

x:

Notas del Examen Parcial (variable explicativa)

Queremos responder:

Cmo saber si la variable Y


puede escribir comoseuna funcin
lineal de la variable X? o
Modelo de Regresin Simple:

Y a bX

Ejemplo: tabla de datos o variables


Estudiante N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Notas
examen
final
39
44
32
40
45
46
33
39
32,5
21
30
39
44
28,5
38
43
42
25,5
47
36
31,5
32
42
21
41

Notas
examen
parcial
62
69
68
86
88,5
88,5
76
66,5
75
38
71
88
96,5
71,5
96
82,5
85
28
95
39
58
49
62
59
90

Y= variable respuesta

X= variable explicativa

Modelo lineal entre las dos variables

Y a bX

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Notas
examen
final
39
44
32
40
45
46
33
39
32,5
21
30
39
44
28,5
38
43
42
25,5
47
36
31,5
32
42
21
41

Notas
examen
parcial
62
69
68
86
88,5
88,5
76
66,5
75
38
71
88
96,5
71,5
96
82,5
85
28
95
39
58
49
62
59
90

Scatterpl
ot

10
0
8
0
Examen Final

Estudiante N

Y= variable respuesta

Ejemplo: Diagrama dispersin de los datos

6
0
4
0
1
20
0
0

2
0

30
Examen
Parcial

4
0

X= variable explicativa

5
0

Ejemplo: Anlisis del Diagrama de puntos y de la


asociacin entre las variables Examen Parcial
(X) y Examen Final (Y)
Diagrama de puntos del Examen Final vs Examen
Parcial

Examen Final

10
0
8
0
6
0
4
0
2
0

Se
observa
que
las
est
observaciones
asociadas
positivamente,
n
de una forma lineal es decir
que cuanto ms alta tiende a
ser la nota de un alumno en el
Parcial, en el Final tender a
tener una nota alta tambin.
Aunque la asociacin entre
las variables es ligeramente
fuerte, hay indicios que se
puede modelar a travs de
una Regresin Simple.

0
1
0

2
0

30
40
Examen Parcial

5
0

No se observan
comportamientos
discrepantes.

Diagrama de dispersin
En un diagrama de puntos, generalmente, los valores de la variable
respuesta son colocados en el eje vertical y los valores de la variable
explicativa son colocados en el eje horizontal.

Diagrama de puntos del Examen Final vs Examen Parcial

100

Examen Final

80
60
40
20
0
10

20

30
40
Examen Parcial

50

Definiciones bsicas:
Asociacin positiva.- Existe si cuando aumentan los valores de ,
los valores de tienden a aumentar.

Asociacin negativa.- Si cuando aumentan los valores ,


los valores de tienden a disminuir.

Asociacin lineal.- Cuando sucede cualquiera de los dos casos


anteriores de una forma aproximadamente lineal.

Definiciones bsicas:
Asociacin positiva.- Existe si cuando aumentan los valores de ,
los valores de tienden a aumentar.
50
45
40
35
30
Serie1

25
20
15
10
5
0
0

5
0

10
0

15
0

20
0

25
0

30
0

35
0

Definiciones bsicas:
Asociacin negativa.- Si cuando aumentan los valores ,
los valores de tienden a disminuir.
1,
2
1
0,
0,8

Serie1

6
0,
4
0,
2
0

1
0

2
0

3
0

4
0

5
0

Direccin-Forma-Fuerza :
Direccin.- Se observa un comportamiento de direccin cuando
las variables estn positivamente asociadas, negativamente
asociadas o asociadas de una forma lineal.

. .
. . .. ..
.. .
.. . .

. ....
..

.
..

.
. .. . .
..
X

Asociacin
Negativa
(lineal)

. .

Asociacin
Positiva
(lineal)

..
.
. ..
.
..
. ....
..
Asociacin
Negativa
.
(lineal)

Direccin-Forma-Fuerza :
Forma.- Cuando se observa que la relacin entre las variables
podra ser lineal, encorvada, cuadrtica, estacional, cclica o
quizs no existe ninguna forma definida de asociacin entre esas
variables.
Y

..
..

.
.
. . . . . .. .
. .
.. .

Encorvada

.. . ..

..

..

Cclica

.
.

Cuadrtica

. .
. . . ...
.. .
X

.
.
. .. ..
.
.. . . .
.
.
.
..
. . . ... .
..
.
.

.
.
..

.. ..

. . .. .
. . .. . . ... . . .
. . . ..
.
. .. .
.

Cuadrtica

Direccin-Forma-Fuerza:
Forma.- Cuando se observa que la relacin entre las variables
podra ser lineal, encorvada, cuadrtica, estacional, cclica o
quizs no existe ninguna forma definida de asociacin entre esas
variables.

..

.
.. .. .
. .
.. . .
.... . .. .
.

.. .. . ... . . . .
. .. .
.. . ... .. . .. .
.. . . . . . .
. . . . ... . .

Lineal

Ninguna

.
Y

.
. ... . ..... . .
. .. . ...

. .. . .. .. .. ... .
.. . . . . . ...
X

Estacional

Direccin-Forma-Fuerza :
Fuerza.- Cuando se observa que firmemente los puntos estn
rodeando la forma observada. En este caso es necesario ser muy
cuidadosos porque un cambio en la escala de los ejes puede
ofrecer otra visin diferente de la realidad.
Y

.. . . .
.
.
..
.
.
..
.
.
..

.
.

Asociacin fuerte

.
..

..
.
. ..
. ..
. ..
. . . .
.

... .
.. .

Asociacin dbil

.
..
.
. ..
.. . .
.
.
. .
.
.
.
.
.
..
.
.. .
.
.

Asociacin ligeramente fuerte

Regresin Lineal Simple


En el ejemplo de los exmenes se mostr que existe
asociacin positiva, de una forma lineal, ligeramente
fuerte, entre las variables Examen Parcial (X) y Examen
Final (Y).

Esto justifica proponer un modelo o ecuacin lineal para esa


relacin (Modelo de Regresin Simple).

Objetivos de una Regresin Lineal Simple

Ese

modelo servir como un RESUMEN de la


relacin entre esas dos variables.

Sirve para predecir la calificacin futura del


examen de un estudiante basado en
calificacin del examen parcial.
la

Qu se debe hacer?
Encontrar una lnea
recta todos los puntos.

lo ms
cercana

posible a

Del ejemplo anterior:


Diagrama de puntos del Examen Final vs Examen Parcial
Lnea
1
Lnea 2

100

Examen Final

80
60
40
20
0
10

20

30
40
Examen Parcial

50

Se necesita un criterio para hallar esa lnea


Cmo se puede ver, sin un critrio se pueden encontrar
ms de una lnea que se acerque a todos los puntos.
Diagrama de puntos del Examen Final vs
Examen Parcial

Lnea
1
Lnea 2

100

Examen Final

80
60
40
20
0
10

20

30
40
Examen Parcial

50

Definiciones: Ecuacin de una lnea recta

a:
b
:

ya
bx

pendiente, cantidad que cambia cuando x aumenta en una unidad


intercepto-, el valor que toma cuando

es cero.

En regresin lineal simple,


y es la variable respuesta,
x
es la variable
explicativa.
El problema se reduce a
calcular
valores
x
losy con
y
de cual
queda
lo
definida
la recta.

Definiciones: Residuo
Residuo:
Un residuo es la diferencia entre la respuesta
observada y la respuesta predicha
usando la lnea
de la Cada par de observaciones , es decir, cada
regresin.
el
scatterplot
punto
produce
en un residuo.

Definiciones: Residuo
Residuo:
Esas diferencias verticales son llamadas
residuos
residuos= (valor
- valor
observadyo

Re
siduo :

e yi
y

predictado)y

y representan los errores


en la prediccin.

Para cada punto en el scatterplot


hay correspondiente.

un
residuo

Necesitamos entonces construir una recta de tal forma que


estos errores sean tan pequeos como sea posible.

Definiciones: Lnea de Regresin de Mnimos Cuadrados


Lnea de Regresin de Mnimos Cuadrados: Es la lnea que
hace que la suma de las desviaciones verticales cuadradas de los
puntos a la recta sea lo ms pequea posible. Con frecuencia se
denota como la Regresin de Y en X.

y a bx
Es la lnea de Regresin Lineal Simple

buscada

Clculo de los estimadores:


Lnea de Regresin de Mnimos Cuadrados: es lo mismo que
hallar a y b para el modelo

y a bx
n

n ( xi yi ) ( xi ) (
i1 n
i1
b y )i 1 n
i
x2) (
x )2

n(
n

a y i 1 bx

i1

i1

y yi1
i

Interpretacin de los estimadores:


Interpretacin es lo mismo que hallar a y b para el modelo

Es el que toma la variable Y


Cuando la variable X es cero.

Es el valor en que se incrementa


d
oisminuye la variable Y cuando la variable
X aumenta en una unidad.

y a
bx

Evaluacin del modelo:


Coeficiente de correlacin: Denotado por r y obtenido de la
muestra, mide la fuerza de la relacin lineal entre dos variables
cuantitativas.
Describe la direccin de la asociacin lineal e indica en un
escatterplot qu tan ajustados estn los puntos en la lnea de
regresin de mnimos cuadrados.

n xi y i xi y i
2
2
n xi xi
n yi2 yi

Evaluacin del modelo:


Propiedades del coeficiente de correlacin:
Rango:

1 r 1

Signo: El signo del coeficiente de correlacin indica la


[ 1 , 0 o positiva
de
direccin
asociacin (negativa si r est
).
entre

0,si e1s}t entre


Magnitud:

r
1

r 0

La magnitud del coeficiente de correlacin


indica la fuerza de la asociacin lineal.
indica que la pendiente es positiva
indica que la pendiente es negativa
indica que no hay ninguna asociacin
lineal

Evaluacin del modelo:


Propiedades del coeficiente de correlacin:
El coeficiente de correlacin se calcula usando los resultados
de las dos variables. No vara al cambiar las unidades de
medida de x y.

Evaluacin del modelo:


Coeficiente de determinacin: Mide la proporcin de
variabilidad total de la variable dependiente respecto a su media
que es explicada por el modelo de regresin.
Es usual expresar esta medida
multiplicndola por cien.

en

tanto por

( y y ) 2

(y y)

ciento,

Evaluacin del modelo:


Error estndar de estimacin: Es una medida de variabilidad
como la desviacin estndar, pero esta desviacin es con
respecto al valor ajustado de la regresin, no con la media.

Error Estndar de Estimacin

SCE

n
2

y
i

yn
2

Prediccin Puntual:
Con los estimadores a y b, se pueden hacer
predicciones

y 7.5 1.75x
Cul sera el valor de la respuesta y si fuera igual a 2.72 ?.
Cul sera el valor de la respuesta y si fuera igual a 12.1 ?.
Cul sera el valor de la respuesta y para cualquier valor de x ?.
Qu significa que el valor de la pendiente b en una lnea de regresin es 0 ?.

Das könnte Ihnen auch gefallen