Beruflich Dokumente
Kultur Dokumente
rojo 1 2 3 4 5 6
Supongamos que tenemos dos dados, uno rojo y otro verde, cada uno de los cuales toma
valores entre 1 y 6 con igual probabilidad. Definiremos la variable aleatoria x como la suma
de los valores que toman los dos dados.
2
Ejemplo de distribucin de probabilidades: x es la suma de dos dados
r 1 2 3 4 5 6
v
1
2
3
4
5
6 10
r 1 2 3 4 5 6
v
1
2
3
4
5 7
6
4
Ejemplo de distribucin de probabilidades: x es la suma de dos dados
r 1 2 3 4 5 6
v
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Esta tabla muestra todos los posibles resultados, que van de 2 a 12.
r 1 2 3 4 5 6
x f
v 2
3
1 2 3 4 5 6 7 4
5 4
2 3 4 5 6 7 8 6
3 4 5 6 7 8 9 7
8
4 5 6 7 8 9 10 9
5 6 7 8 9 10 11 10
11
6 7 8 9 10 11 12 12
r 1 2 3 4 5 6
x f p
v 2 1
3 2
1 2 3 4 5 6 7 4 3
5 4
2 3 4 5 6 7 8 6 5
3 4 5 6 7 8 9 7 6
8 5
4 5 6 7 8 9 10 9 4
5 6 7 8 9 10 11 10 3
11 2
6 7 8 9 10 11 12 12 1
r 1 2 3 4 5 6
x f p
v 2 1
3 2
1 2 3 4 5 6 7 4 3
5 4
2 3 4 5 6 7 8 6 5
3 4 5 6 7 8 9 7 6
8 5
4 5 6 7 8 9 10 9 4
5 6 7 8 9 10 11 10 3
11 2
6 7 8 9 10 11 12 12 1
Hay 1/6 de probabilidad de obtener cada nmero del dado rojo y lo mismo para el dado
verde. Por lo tanto, cada valor en la tabla ocurre con probabilidad 1/36.
8
Ejemplo de distribucin de probabilidades: x es la suma de dos dados
r 1 2 3 4 5 6
x f p
v 2 1 1/36
3 2 2/36
1 2 3 4 5 6 7 4 3 3/36
5 4 4/36
2 3 4 5 6 7 8 6 5 5/36
3 4 5 6 7 8 9 7 6 6/36
8 5 5/36
4 5 6 7 8 9 10 9 4 4/36
5 6 7 8 9 10 11 10 3 3/36
11 2 2/36
6 7 8 9 10 11 12 12 1 1/36
Por lo tanto, para obtener las probabilidades asociadas a cada valor de x, se dividen las
frecuencias por 36.
9
probabilidad
1/ 2
__ 3
__ 4
__ 5
__ 6
__ 5
__ 4
__ 3
__ 2 1
__
/
36 36 36 36 36 36 36 36 36 36 36
2 3 4 5 6 7 8 9 10 11 12 x
10
VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA
El valor esperado de una variable aleatoria, conocido tambin como la media poblacional,
es la suma ponderada de los valores que toma la variable aleatoria, donde los pesos son
las probabilidades ligadas a esos valores. 11
xi pi xi pi xi pi
x1 p1 x1 p1 2 1/36
x2 p2 x2 p2 3 2/36
x3 p3 x3 p3 4 3/36
x4 p4 x4 p4 5 4/36
x5 p5 x5 p5 6 5/36
x6 p6 x6 p6 7 6/36
x7 p7 x7 p7 8 5/36
x8 p8 x8 p8 9 4/36
x9 p9 x9 p9 10 3/36
x10 p10 x10 p10 11 2/36
x11 p11 x11 p11 12 1/36
! xi pi = E(x)
En el caso de la variable x, definida como la suma de los dados verde y rojo, se adjunta a
cada posible valor su probabilidad.
12
Valor esperado de una variable aleatoria
xi pi xi pi xi pi xi pi
x1 p1 x1 p1 2 1/36 2/36
x2 p2 x2 p2 3 2/36 6/36
x3 p3 x3 p3 4 3/36 12/36
x4 p4 x4 p4 5 4/36 20/36
x5 p5 x5 p5 6 5/36 30/36
x6 p6 x6 p6 7 6/36 42/36
x7 p7 x7 p7 8 5/36 40/36
x8 p8 x8 p8 9 4/36 36/36
x9 p9 x9 p9 10 3/36 30/36
x10 p10 x10 p10 11 2/36 22/36
x11 p11 x11 p11 12 1/36 12/36
! xi pi = E(x) 252/36 = 7
Por lo tanto, el valor esperado es 7. Este resultado era esperable si tenemos en cuenta que
la distribucin es simtrica en 7, como se vio en la transparencia del histograma
13
Ejemplo:
14
Valor esperado de una funcin de una variable aleatoria
16
Independencia de dos variables aleatorias
17
La varianza poblacional de x :
18
La varianza poblacional de una variable aleatoria discreta
2 1/36 -5 25 0.69
3 2/36 -4 16 0.89
4 3/36 -3 9 0.75
5 4/36 -2 4 0.44
6 5/36 -1 1 0.14
7 6/36 0 0 0.00
8 5/36 1 1 0.14
9 4/36 2 4 0.44
10 3/36 3 9 0.75
11 2/36 4 16 0.89
12 1/36 5 25 0.69
5.83
pop.var(x)
20
La varianza poblacional de una variable aleatoria discreta
21
probabilidad
1/ 2
__ 3
__ 4
__ 5
__ 6
__ 5
__ 4
__ 3
__ 2 1
__
/
36 36 36 36 36 36 36 36 36 36 36
2 3 4 5 6 7 8 9 10 11 12 x
Una variable aleatoria discreta slo toma un conjunto finito de valores, con probabilidad
positiva, como la suma del valor de dos dados.
22
Variables aleatorias continuas
densidad de
probabilidad
0.05
55 60 65 70 75 x
Sin embargo, la mayora de las variables aleatorias en econometra son contInuas, como
puede ser, por ejemplo, la temperatura en un cuarto, que puede tomar valores entre 55 y 75
grados Farenheit. 23
densidad de
probabilidad
0.05
55 60 65 70 75 x
Observar que la probabilidad de que una variable continua tome un valor determinado es
infinitamente pequea (cero, en realidad). Por este motivo, la probabilidad de variables
continuas se calcula para intervalos de valores de x. El rea que corresponde a ese 24
intervalo es la probabilidad del mismo.
Variables aleatorias continuas
densidad de
probabilidad
0.05
0.05
55 56 60 65 70 75 x
densidad de
probabilidad
0.05
55 5758 60 65 70 75 x
La probabilidad por unidad es el rea del rectngulo definida por dicha unidad, es decir
0.05.
26
Variables aleatorias continuas
0.05
55 5758 60 65 70 75 x
La probabilidad por intervalo unitario se llama densidad y es igual a la altura del intervalo
unidad (dado que el rea es base por altura)
27
Matemticamente, la densidad se escribe como una funcin de la variable f(x).
f(x) = 0.05 si 55 x 75
f(x) = 0 si x < 55 y x > 75
f(x)
0.05
55 5758 60 65 70 75 x
0.05 0.25
55 60 65 70 75 x
30
LOS COMPONENTES FIJOS Y ALEATORIOS DE UNA VARIABLE ALEATORIA
Lo que nos interesa ver aqu es cmo podemos escribir una variable aleatoria formada por
dos componentes: una parte, la media, que sera el componente fijo y otra parte, que es
lo que puede llamarse perturbacin, que es el componente aleatorio puro. 31
33
34
3. ESTIMADORES
Estimadores y estimaciones:
Estimadores
Media: x
Varianza :
36
Estimadores
37
Estimadores
38
Estimadores
39
Estimadores
Densidad de x Densidad de x
x x x x
Estimadores
Densidad de x Densidad de x
x x x x
Insesgadez de x:
Insesgadez y Eficiencia
Insesgadez de x:
Insesgadez de x :
Insesgadez y Eficiencia
Insesgadez de x:
El estimador general Z lo definimos como la suma ponderada de las dos observaciones que
tenemos, donde los pesos son!1 y !2. Por ejemplo, en el caso de la media muestral los dos
pesos son iguales a 1/n = 1/2 porque slo tenemos dos observaciones. 46
Insesgadez y Eficiencia
Insesgadez de x:
Cmo deben ser esos ponderadores para que el valor esperado del estimador sea igual a
la media poblacional?
47
Insesgadez y Eficiencia
Insesgadez de x:
48
Insesgadez y Eficiencia
Insesgadez de x:
49
Insesgadez y Eficiencia
Insesgadez de x:
50
Insesgadez y Eficiencia
Insesgadez de x:
Insesgadez y Eficiencia
densidad
estimator B
estimador A
densidad
estimator B
estimador A
Insesgadez y Eficiencia
Analicemos la varianza poblacional del estimador general buscando definir los pesos que
minimicen dicha varianza
54
Insesgadez y Eficiencia
densidad
estimador B
estimador A
"
Supongamos que tenemos dos estimadores alternativos para estimar ", uno que es
insesgado y el otro que es sesgado pero con varianza menor que el primero: cul de los
dos elegimos? 56
Conflicto entre varianza mnima e insesgadez
prdida
Una forma para decidir entre uno y otro es definirse una funcin de prdida y decidir en
funcin de la prdida mayor o menor: es decir, nos quedaremos con aqul que tenga menor
prdida. 57
densidad
"
Una funcin muy utilizada es la que se conoce como el error cuadrtico medio (mean
squared error MSE), que se define como el valor esperado del cuadrado de las desviaciones
del estimador y el parmetro poblacional. 58
Conflicto entre varianza mnima e insesgadez
densidad
sesgo
" Z
El error cuadrtico medio puede escribirse como la suma del sesgo al cuadrado ms la
varianza: es decir, combina el conflicto entre varianza y sesgo en un solo indicador.
Supongamos que el sesgo del estimador Bcon respecto a Z es el que aparece en el grfico.
59
densidad
sesgo
" Z
densidad
estimador B
estimador A
"
Cmo elegiremos entre ambos estimadores? Buscando aquel que tenga menor MSE.
61
n #x
0.08 1 50
0.06
0.04
0.02 n=1
n #x
0.08 1 50
0.06
0.04
0.02 n=1
Supongamos que x tiene media poblacional 100 y desviacin tpica 50. Supongamos,
adems, que no conocemos esta media y que queremos estimarla
63
n #x
0.08 1 50
0.06
0.04
0.02 n=1
De las propiedades de la media muestral, sabemos que su media coincide con la media
poblacional, que es insesgada y que su desviacin tpica ser igual a la desviacin tpica
poblacional dividida por la raz cuadrada del nmero de observaciones
Efecto de un aumento del tamao muestral
densidad de x
n #x
0.08 1 50
0.06
0.04
0.02 n=1
Por tanto, cuanto mayor sea n, menor ser la varianza de la media muestral.
65
n #x
0.08 n = 100 1 50
4 25
25 10
0.06 100 5
0.04
0.02
66
Efecto de un aumento del tamao muestral
densidad de x
n = 5000 n #x
0.8 1 50
4 25
25 10
0.6 100 5
1000 1.6
5000 0.7
0.4
0.2
En el lmite, la desviacin tpica de la media muestral tiende a cero, por lo que la media
muestral tender, en el lmite, a la media poblacional: consistencia.
67
plim x =
densidad de Z
n = 20
"$ Z
70
7
Ejemplo de un estimador sesgado pero consistente
densidad de Z
n = 20
"$ Z
n = 100
n = 20
"$ Z
Para que el estimador sea consistente, deben pasar dos cosas cuando la muestra aumenta.
El sesgo debe disminuir.
72
7
Ejemplo de un estimador sesgado pero consistente
n = 1000
n = 100
n = 20
"$ Z
73
n = 100000
n = 1000
n = 100
"$ Z
74
7
RELACIONES ENTRE VARIABLES
75
COVARIANZA POBLACIONAL
76
Covarianza Poblacional
77
COVARIANZA MUESTRAL
78
La covarianza muestral es un estimador sesgado de la covarianza
poblacional
79
Reglas de la covarianza
1. Si Y = V + W,
Cov(X, Y) = Cov(X, V) + Cov(X, W)
3. Si Y = a, donde a es constante,
Cov(X, Y) = Cov(X, a) = 0
Ejemplo: Cov(X, 10) = 0
80
EXPRESIONES ALTERNATIVAS DE LA COVARIANZA
POBLACIONAL
D
#XY =E((X-X) (Y-Y))=E(XY)- X Y
MUESTRAL
81
82
Por tanto, las reglas de la varianza se pueden deducir a partir
de las reglas de la covarianza
83
Regla 1:
Si Y = V + W, Var(Y) = Var(V) + Var(W) + 2Cov(V, W)
Prueba:
Var(Y) = Cov(Y, Y) = Cov(Y, [V + W])
= Cov(Y, V) + Cov(Y, W)
= Cov([V + W], V) + Cov([V + W], W)
= Cov(V, V) + Cov(W, V)
+ Cov(V, W) + Cov(W, W)
= Var(V) + Var(W) + 2Cov(V, W)
84
Regla 2:
Si Y = bZ, donde b es constante, Var(Y) = b2Var(Z)
Prueba:
Var(Y) = Cov(Y, Y) = Cov(Y, bZ)
= bCov(Y, Z)
= bCov(bZ, Z)
= b2Cov(Z, Z)
= b2Var(Z)
85
Regla 3:
Si Y = b, donde b es constante, Var(Y) = 0
Prueba:
Var(Y) = Cov(Y, Y)
= Cov(b, b)
=0
86
Regla 4:
Si Y = V + b, donde b es constante, Var(Y) = Var(V)
Prueba:
Var(Y) = Var(V + b)
= Var(V) + Var(b) + 2Cov(V, b)
= Var(V)
0 V
0 V+b
Sumar una constante slo tiene un efecto de traslacin: la varianza no cambiar y la media
se ver desplazada por la constante de la traslacin.
87
COEFICIENTE DE CORRELACIN
88
Coeficiente de Correlacin
89