Sie sind auf Seite 1von 118

UNIVERSIDAD DE PIURA

FACULTAD DE CIENCIAS ECONÓMICAS Y


EMPRESARIALES

ESTADÍSTICA 2 PARA ECONOMÍA


CUADERNO DE TRABAJO

p(x, y)
p(x2, y1)
p(x1, y1) p(xn, y1)
p(x1, y2) x1 x2 xn
X
y1
p(x1, ym)
y2 p(xn, ym)

ym
Y
Contenido
Capítulo 1: Variable aleatoria bidimensional...............................1
1.1. VARIABLE ALEATORIA BIDIMENSIONAL .................................1
1.2. FUNCIÓN DE DISTRIBUCIÓN ACUMULADA O FUNCIÓN DE
DISTRIBUCIÓN ............................................................................ 6
1.3. DISTRIBUCIÓNES MARGINALES .............................................. 8
1.4. VARIABLES ALEATORIAS ESTADÍSTICAMENTE
INDEPENDIENTES ..................................................................... 11
1.5. DISTRIBUCIÓN DE PROBABILIDAD CONDICIONAL ............. 11
1.8. VALOR ESPERADO Y VARIANZA DE UNA FUNCIÓN DE
VARIABLES ALEATORIAS ..........................................................13
1.9. PROBLEMAS PROPUESTOS ...................................................... 19
Capítulo 2: Distribución Normal Bidimensional ...................... 23
2.1. DISTRIBUCIÓN NORMAL BIDIMENSIONAL .......................... 23
2.2. DISTANCIA DE MAHALANOBIS ............................................... 25
2.3. DENSIDADES MARGINALES .................................................... 26
2.4. FUNCIONES DE DENSIDADES CONDICIONAL ...................... 28
2.5. PROBLEMAS PROPUESTOS ...................................................... 29
Capítulo 3: Convergencia de sucesiones de variables
aleatorias ........................................................................31
3.1. SUCESIÓN DE VARIABLES ALEATORIAS ................................31
3.2. TIPOS DE CONVERGENCIA ...................................................... 32
3.3. RELACIONES ENTRE LOS DISTINTOS TIPOS DE
CONVERGENCIA (Martín, 1997) ............................................... 42
3.4. LEYES DE LOS GRANDES NÚMEROS ...................................... 42
3.5. PROBLEMAS PROPUESTOS ...................................................... 45
Capítulo 4: Muestreo, distribuciones muestrales e intervalos
de confianza ................................................................... 49
4.1. MUESTREO. ............................................................................... 49
4.2. MÉTODOS DE MUESTREO. ...................................................... 50
4.3. PARÁMETROS Y ESTADÍSTICOS. ............................................. 54
4.4. DISTRIBUCIONES MUESTRALES. ........................................... 55
4.5. ESTIMACIÓN PUNTUAL DE PARÁMETROS. .......................... 60
2 Estadística para economía
4.6. PROBLEMAS PROPUESTOS. .................................................... 67
4.7. ESTIMACIÓN DE PARÁMETROS POR INTERVALOS. ............ 70
4.8. INTERVALO DE CONFIANZA PARA 𝝁 CUANDO LA VARIANZA
SUPUESTA ES DESCONOCIDA. ................................................ 72
4.9. INTERVALO DE CONFIANZA PARA LA PROPORCIÓN, 𝒑...... 74
4.10. INTERVALO DE CONFIANZA PARA LA VARIANZA, 𝝈𝟐 . .........75
4.11. PROBLEMAS PROPUESTOS ..................................................... 76
Capítulo 5: Prueba de hipótesis ..................................................... 79
5.1. HIPÓTESIS ESTADÍSTICAS. ..................................................... 79
5.2. PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE
HIPÓTESIS. ................................................................................ 82
5.3. EMPLEO DE LOS VALORES P ................................................... 82
5.4. PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA: VARIANZA
𝝈𝟐 SUPUESTA DESCONOCIDA ................................................. 83
5.5. PRUEBA DE HIPÓTESIS ACERCA DE LA RAZÓN DE DOS
VARIANZAS ................................................................................ 84
5.6. PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS .............. 85
5.7. PROBLEMAS PROPUESTOS ...................................................... 91
Capítulo 6: Regresión lineal múltiple .......................................... 97
6.1. RELACIÓN ENTRE VARIABLES ............................................... 97
6.2. DETERMINACIÓN DE LA ECUACIÓN DE REGRESIÓN
MUESTRAL ................................................................................. 98
6.3. PRUEBA DE HIPÓTESIS...........................................................103
6.4. PROBLEMAS PROPUESTOS ..................................................... 111
Bibliografía ......................................................................................... 113
Capítulo 1: Variable aleatoria
bidimensional
En algunas investigaciones, no necesariamente el análisis se realiza con
una sola variable, sino que se busca la interacción entre estas. En tal
sentido, es de utilidad el análisis bivariado o bidimensional para la toma
de decisiones, especialmente en ciencias sociales como economía.

El presente capítulo aborda los conceptos y propiedades


matemáticas de las que gozan las variables aleatorias bidimensionales o
también denominados vectores aleatorios. Es una extensión a dos
dimensiones de la teoría de probabilidad estudiada el curso preliminar de
estadística.

1.1. VARIABLE ALEATORIA BIDIMENSIONAL


Si  es el espacio muestral asociado a un experimento aleatorio , y X e Y
dos funciones, que asigna un número real 𝑥 = 𝑋(𝜔), 𝑦 = 𝑌(𝜔) a cada uno
de los elementos ; el par (𝑋, 𝑌) se llama variable aleatoria
bidimensional o vector bidimensional (V.A.B), (Moya, 2004)

 RX

X • X = X()
•
Y RY

• Y = Y()

El rango de la variable aleatoria bidimensional (𝑋, 𝑌) es el


conjunto de todos los valores posibles del vector aleatorio (𝑋, 𝑌) definido
y denotado por
𝑅𝑋×𝑌 = {(𝑥, 𝑦)⁄𝑥 ∈ 𝑅𝑋 , 𝑦 ∈ 𝑅𝑌 }
2 Estadística para economía
Ejemplos:
1.1. Una tienda cuenta con dos cajas, A y B. Si X es el número de clientes
que realizan sus pagos en la caja A y Y el número de clientes que
realizan sus pagos en la caja B, entonces (𝑋, 𝑌) es una V.A.B con
𝑅𝑋×𝑌 = {(𝑥, 𝑦)⁄𝑥 ∈ 𝑅𝑋 , 𝑦 ∈ 𝑅𝑌 }. Donde, por ejemplo,
𝑅𝑋 = {0,1,2, … , 𝑛} y 𝑅𝑌 = {0,1,2, … , 𝑚
1.2. Sean X el ingreso de un trabajador y Y el gasto. Si se sabe que los
ingresos donde labora el trabajador van desde 2500 hasta 4300
soles y que los gastos de los trabajadores oscilan desde 2000 hasta
3200 soles, entonces (𝑋, 𝑌) es una V.A.B con
𝑅𝑋×𝑌 = {(𝑥, 𝑦)⁄𝑥 ∈ 𝑅𝑋 , 𝑦 ∈ 𝑅𝑌 }
Donde, 𝑅𝑋 = [2500, 4300] y 𝑅𝑌 = [2000, 3000].

1.1.1. Variable aleatoria bidimensional discreta


Sean X y Y Vs.As. discretas. La función de probabilidad conjunta o
bivariante para X y Y está dada por (Mendehall, 2010)
𝑝(𝑥, 𝑦) = 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦); 𝑥, 𝑦 ∈ ℝ
Teorema 1.1: (Mendehall, 2010)
Si X y Y son Vs.As. discretas con función de probabilidad conjunta 𝑝(𝑥, 𝑦),
entonces:
i) 𝑝(𝑥, 𝑦) ≥ 0 para toda x, y.
ii) ∑𝑥,𝑦 𝑝(𝑥, 𝑦) = 1, donde la suma es para todos los valores (𝑥, 𝑦) a los que
se asignan probabilidades diferentes de cero.
Ejemplo 1.3: Obtener el valor de k para que:
𝑝(𝑥, 𝑦) = 𝑘(𝑥 2 + 𝑦 2 ); 𝑥 = −1,0,1,3; 𝑦 = −1,2,3
sea función de probabilidad conjunta de X y Y. (Miller, 2000)
Variables aleatorias bidimensionales 3
Representación tabular de la función de probabilidad
conjunta (Moya)
y
y1 y2  ym – 1 ym
x
x1 𝑝(𝑥1 , 𝑦1 ) 𝑝(𝑥1 , 𝑦2 )  𝑝(𝑥1 , 𝑦𝑚−1 ) 𝑝(𝑥1 , 𝑦𝑚 )
x2 𝑝(𝑥2 , 𝑦1 ) 𝑝(𝑥2 , 𝑦2 )  𝑝(𝑥2 , 𝑦𝑚−1 ) 𝑝(𝑥2 , 𝑦𝑚 )
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
xn 𝑝(𝑥𝑛 , 𝑦1 ) 𝑝(𝑥𝑛 , 𝑦2 )  𝑝(𝑥𝑛 , 𝑦𝑚−1 ) 𝑝(𝑥𝑛 , 𝑦𝑚 )

Representación gráfica de la función de probabilidad conjunta


(Moya)

p(x, y)
p(x2, y1)
p(x1, y1) p(xn, y1)
p(x1, y2) x1 x2 xn
X
y1
p(x1, ym)
y2 p(xn, ym)

ym
Y

Ejemplo 1.4: Un supermercado local tiene tres cajas. Dos clientes llegan
a las cajas en momentos diferentes cuando las cajas no atienden a otros
clientes. Cada cliente escoge una caja de manera aleatoria,
independientemente del otro. Si X es el número de clientes que escogen la
caja 1 y Y el número que selecciona la caja 2. Encuentre la función de
probabilidad conjunta de X y Y (Mendehall, 2010).
4 Estadística para economía

1.1.2. Variable aleatoria bidimensional Continua


Sean X y Y dos Vs.As. continuas. Si existe una función 𝑓(𝑥, 𝑦) tal que la
probabilidad conjunta (Canavos, 1988):
𝑏 𝑑

𝑃(𝑎 < 𝑋 < 𝑏, 𝑐 < 𝑌 < 𝑑) = ∫ ∫ 𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥 ; 𝑎, 𝑏, 𝑐, 𝑑 ∈ ℝ


𝑎 𝑐
∞ ∞
donde 𝑓(𝑥, 𝑦) ≥ 0, −∞ < 𝑥, 𝑦 < ∞ y ∫−∞ ∫−∞ 𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥 = 1, entonces
𝑓(𝑥, 𝑦) es la función de densidad de probabilidad conjunta de X y
Y.

Ejemplo 1.5: Determine el valor de k para que 𝑓(𝑥, 𝑦) sea una función de
densidad de probabilidad conjunta
𝑘𝑥𝑦; 0 < 𝑥 < 1; 0 < 𝑦 < 1; 𝑥 + 𝑦 < 1
𝑓(𝑥, 𝑦) = {
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Variables aleatorias bidimensionales 5

Ejemplo 1.6: Una empresa privada opera un local que da servicio a


clientes que llegan en automóvil y otro que da servicio a clientes que llegan
caminando. En un día elegido al azar, sean X y Y, respectivamente, las
proporciones de tiempo que ambos locales están en servicio, y suponiendo
que la función de densidad conjunta de estas variables aleatorias es
(Walpole, 2012)
2
(2𝑥 + 3𝑦) ; 0 ≤ 𝑥 ≤ 1,0 ≤ 𝑦 ≤ 1
𝑓(𝑥, 𝑦) = { 5
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
1 1 1
Calcular 𝑃 (0 < 𝑥 < 2 , 4 < 𝑦 < 2 ).
6 Estadística para economía
1.2. FUNCIÓN DE DISTRIBUCIÓN ACUMULADA O
FUNCIÓN DE DISTRIBUCIÓN
1.2.1. Caso Discreto
Sean X y Y Vs.As. discretas, la función dada por (Miller, 2000)

𝐹(𝑥, 𝑦) = 𝑃(𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦) = ∑ ∑ 𝑝(𝑠, 𝑡) ; 𝑥, 𝑦 ∈ ℝ


𝑠≤𝑥 𝑡≤𝑦

se llama función de distribución conjunta, o distribución


acumulativa conjunta, de X e Y.
Ejemplo 1.7: Del ejemplo 1.3, obtener F(1,2).

1
; 𝑥, 𝑦
= 1,2
Ejemplo 1.8: Obtener 𝐹(𝑥, 𝑦) sabiendo que 𝑓(𝑥, 𝑦) = {4 .
0; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

1.2.2. Caso Continuo


Sean X y Y Vs.As. continuas, la función dada por (Miller, 2000)
𝑦 𝑥

𝐹(𝑥, 𝑦) = 𝑃(𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦) = ∫ ∫ 𝑓(𝑠, 𝑡)𝑑𝑠𝑑𝑡 ; 𝑥, 𝑦 ∈ ℝ


−∞ −∞

se llama función de distribución conjunta, o distribución


acumulativa conjunta, de X e Y.
Variables aleatorias bidimensionales 7
Ejemplo 1.9: Obtener la función de distribución conjunta de la función
de densidad (Canavos, 1988)
3𝑥(1 − 𝑥𝑦); 𝑥, 𝑦 ∈ [0,1]
𝑓(𝑥, 𝑦) = {
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Nota 1.1: (Miller, 2000)


𝜕 2 𝐹(𝑥, 𝑦)
𝑓(𝑥, 𝑦) =
𝜕𝑥𝜕𝑦
Ejemplo 1.10: Obtener 𝑓(𝑥, 𝑦) y 𝑃(1 < 𝑋 < 3; 1 < 𝑌 < 2) si (Miller,
2000):
(1 − 𝑒 −𝑥 )(1 − 𝑒 −𝑦 ); 𝑥 > 0; 𝑦 > 0
𝐹(𝑥, 𝑦) = {
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
8 Estadística para economía

1.3. DISTRIBUCIÓNES MARGINALES

1.3.1. Caso Discreto


Sean X y Y Vs.As. discretas con función de probabilidad conjunta 𝑝(𝑥, 𝑦).
Las funciones marginales de probabilidad de X y Y están dadas,
respectivamente, por (Canavos, 1988)

𝑝𝑋 (𝑥) = ∑ 𝑝(𝑥, 𝑦) ; 𝑝𝑌 (𝑦) = ∑ 𝑝(𝑥, 𝑦)


𝑦 𝑥

Ejemplo 1.11: Obtener la distribución marginal de X e Y si (Moya, 2004)


𝑥+𝑦
𝑝(𝑥, 𝑦) = ; 𝑥 = 1,2; 𝑦 = 1, 2, 3, 4.
32
Variables aleatorias bidimensionales 9

1.3.2. Caso Continuo


Sean X y Y Vs.As. continuas con función de densidad de probabilidad
conjunta 𝑓(𝑥, 𝑦). Las funciones marginales de probabilidad de X y Y están
dadas, respectivamente, por (Canavos, 1988)
∞ ∞

𝑓𝑋 (𝑥) = ∫ 𝑓(𝑥, 𝑦)𝑑𝑦 ; 𝑓𝑌 (𝑥) = ∫ 𝑓(𝑥, 𝑦)𝑑𝑥


−∞ −∞

Ejemplo 12: Obtener la distribución marginal de X e Y si (Rincón, 2007)


3(𝑥 2 + 𝑦 2 )
𝑓(𝑥, 𝑦) = { ; 𝑠𝑖 0 < 𝑥 < 𝑦 < 2
16
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
10 Estadística para economía

Nota 1.2: Para Vs.As continuas conjuntas, si se conoce F(x, y), las
distribuciones acumulativas marginales de X y Y, respectivamente, son
(Canavos, 1988)
𝐹𝑋 (𝑥) = 𝐹(𝑥, ∞) ; 𝐹𝑌 (𝑦) = 𝐹(∞, 𝑦)
Es decir, en cada caso, se evalúa para cada variable que corresponda en el
límite superior de su recorrido.
Ejemplo 1.13: Obtener las distribuciones marginales acumuladas de X e
Y en el ejemplo 1.9.
Variables aleatorias bidimensionales 11
1.4. VARIABLES ALEATORIAS ESTADÍSTICAMENTE
INDEPENDIENTES
Sea (X, Y) una V.A. bidimensional con una función conjunta. Se dice que
X y Y son estadísticamente independientes si y solo si (Canavos,
1988)
𝑝(𝑥, 𝑦) = 𝑝𝑋 (𝑥)𝑝𝑌 (𝑦) si X y Y son Vs.As. discretas.
𝑓(𝑥, 𝑦) = 𝑓𝑋 (𝑥)𝑓𝑌 (𝑦) si X y Y son Vs.As. continuas.

caso contrario se dice que son dependientes.


Ejemplo 1.14: Determinar si X e Y son estadísticamente independientes,
si (Rincón, 2007)
4𝑥𝑦 ; 𝑠𝑖 0 ≤ 𝑥, 𝑦 ≤ 1
𝑓(𝑥, 𝑦) = {
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

1.5. DISTRIBUCIÓN DE PROBABILIDAD


CONDICIONAL

1.6. Caso Discreto


Sean X y Y Vs.As. discretas con función de probabilidad conjunta p(x, y)
y funciones de probabilidad marginal 𝑝𝑋 (𝑥) y 𝑝𝑌 (𝑦), respectivamente,
entonces la función de probabilidad discreta condicional de X
dado Y y de Y dado X, respectivamente son (Mendehall, 2010)
𝑝(𝑋 = 𝑥, 𝑌 = 𝑦) 𝑝(𝑥, 𝑦)
𝑝(𝑥 ⁄𝑦) = 𝑃(𝑋 = 𝑥⁄𝑌 = 𝑦) = = ; 𝑝𝑌 (𝑦) > 0
𝑃(𝑌 = 𝑦) 𝑝𝑌 (𝑦)
𝑝(𝑋 = 𝑥, 𝑌 = 𝑦) 𝑝(𝑥, 𝑦)
𝑝(𝑦⁄𝑥 ) = 𝑃(𝑌 = 𝑦⁄𝑋 = 𝑥 ) = = ; 𝑝𝑋 (𝑥) > 0
𝑃(𝑋 = 𝑥) 𝑝𝑋 (𝑥)
Ejemplo 1.15: Del ejemplo 1.11, determinar la distribución condicional
de X, dado que Y = y y la distribución condicional de Y, dado X = x (Moya,
2004)
12 Estadística para economía

1.7. Caso Continuo


Sean X y Y Vs.As. continuas con función de densidad de probabilidad
conjunta f(x, y) y funciones de densidad marginal 𝑓𝑋 (𝑥) y 𝑓𝑌 (𝑦),
respectivamente, entonces la función de densidad de probabilidad
condicional de X dado Y y de Y dado X, respectivamente son
(Mendehall, 2010)
𝑓(𝑥, 𝑦) 𝑓(𝑥, 𝑦)
𝑓(𝑥 ⁄𝑦) = ; 𝑓𝑌 (𝑦) > 0 𝑓(𝑦⁄𝑥 ) = ; 𝑓𝑋 (𝑥) > 0
𝑓𝑌 (𝑦) 𝑓𝑋 (𝑥)

Ejemplo 1.16: Del ejemplo 1.12, determinar la densidad condicional de


X, dado que Y = y y la densidad condicional de Y, dado X = x (Mendehall,
2010)
Variables aleatorias bidimensionales 13
1.8. VALOR ESPERADO Y VARIANZA DE UNA
FUNCIÓN DE VARIABLES ALEATORIAS

1.8.1. Valor esperado


Sean X y Y Vs.As. que se distribuyen conjuntamente. El valor esperado
de una función de X y Y, g(X, Y) para variables discretas y continuas,
respectivamente es (Canavos, 1988)

∑ ∑ 𝑔(𝑥, 𝑦)𝑝(𝑥, 𝑦)
𝑥 𝑦
𝐸[𝑔(𝑋, 𝑌)] = ∞ ∞

∫ ∫ 𝑔(𝑥, 𝑦)𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥


{−∞ −∞

1.8.2. Momento producto


a) Alrededor del origen
El r y s-ésimo, 𝑟, 𝑠 ∈ ℕ, momento producto de X y Y, alrededor del
origen para variables discretas y continuas, respectivamente es
(Canavos, 1988)

𝜇𝑟,𝑠 = 𝐸(𝑋 𝑟 𝑌 𝑠 ) = ∑ ∑ 𝑥 𝑟 𝑦 𝑠 𝑝(𝑥, 𝑦)
𝑥 𝑦
∞ ∞
′ 𝑟 𝑠)
𝜇𝑟,𝑠 = 𝐸(𝑋 𝑌 = ∫ ∫ 𝑥 𝑟 𝑦 𝑠 𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥
−∞ −∞

b) Alrededor de las medias


El r y s-ésimo, 𝑟, 𝑠 ∈ ℕ, momento producto de X y Y, alrededor de
las medias, 𝜇𝑋 , 𝜇𝑌 , para variables discretas y continuas,
respectivamente es (Canavos, 1988)

𝜇𝑟,𝑠 = 𝐸[(𝑋 − 𝜇𝑋 )𝑟 (𝑌 − 𝜇𝑌 )𝑠 ] = ∑ ∑(𝑥 − 𝜇𝑋 )𝑟 (𝑦 − 𝜇𝑌 )𝑠 𝑝(𝑥, 𝑦)


𝑥 𝑦

∞ ∞

𝜇𝑟,𝑠 = 𝐸[(𝑋 − 𝜇𝑋 )𝑟 (𝑌 − 𝜇𝑌 )𝑠 ] = ∫ ∫ (𝑥 − 𝜇𝑋 )𝑟 (𝑦 − 𝜇𝑌 )𝑠 𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥


−∞ −∞
14 Estadística para economía
c) Covarianza
El primer momento producto alrededor de las medias se denomina
covarianza de X y Y y se denota con 𝜎𝑋𝑌 o Cov(X, Y) o C(X, Y). Esto
es (Canavos, 1988)
𝜇1,1 = 𝐸[(𝑋 − 𝜇𝑋 )(𝑌 − 𝜇𝑌 )]
Al igual que la varianza, que es una medida de dispersión de una V.A.,
la covarianza es una mediad de variabilidad conjunta de X y Y. De esta
forma, la covarianza es una media de asociación entre los valores de X
y Y y sus respectivas dispersiones. Si se tiene una alta probabilidad de
que valores grandes de X se encuentren asociados con valores grandes
de Y, la covarianza será positiva. Por otro lado, si existe una alta
probabilidad de que valores grandes de X se encuentren asociados con
valores pequeños de Y o viceversa, la covarianza será negativa.
Variables aleatorias bidimensionales 15
Teorema 1.2: (Rincón, 2007)
Sean X y Y Vs.As. con esperanza finita. Entonces
𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)

Ejemplo 1.17: Sean A y B dos vendedores de una agencia inmobiliaria, y


sean X, Y el número de pisos vendidos semanalmente por cada uno de los
vendedores, cuya distribución de probabilidades viene dada por (Casas,
1996)
X Y 0 1 2
0 0.2 0.15 0.05
1 0.05 0.2 0.05
2 0.05 0.05 0.2
Obtener el número total esperado de pisos vendidos por ambos
vendedores.

Teorema 1.3: (Mendehall, 2010)


Sean X y Y Vs.As. independientes y sean g(X) y h(Y) funciones sólo de X y
Y respectivamente. Entonces
𝐸[𝑔(𝑋)ℎ(𝑌)] = 𝐸[𝑔(𝑋)]𝐸[ℎ(𝑌)]
Siempre que existan los valores esperados.
16 Estadística para economía

Teorema 1.4: (Mendehall, 2010)


Si X y Y son Vs.As. con medias 𝜇𝑋 , 𝜇𝑌 , entonces
𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌)

Teorema 1.5: (Mendehall, 2010)


Si X y Y son Vs.As. independientes, entonces
𝐶𝑜𝑣(𝑋, 𝑌) = 0
Variables aleatorias bidimensionales 17

Nota 1.3: Si 𝐶𝑜𝑣(𝑋, 𝑌) = 0 no necesariamente implica que X y Y son


independientes.
Ejemplo 1.18: Si la distribución de probabilidad conjunta de X y Y es
(Miller, 2000)

X Y –1 0 1
–1 1/6 0 1/6
0 1/3 0 0
1 1/6 0 1/6

calcular la covarianza y determinar si X y Y son estadísticamente


independientes.
18 Estadística para economía
Ejemplo 1.19: Calcular la covarianza de
𝑓(𝑥, 𝑦) = 24𝑥𝑦; 0 ≤ 𝑥 ≤ 1; 0 ≤ 𝑦 ≤ 1; 𝑥 + 𝑦 ≤ 1

d) Correlación
El coeficiente de correlación de las variables aleatorias X y Y, denotado
por 𝜌(𝑋, 𝑌), es el número (Rincón, 2007)
𝐶𝑜𝑣(𝑋, 𝑌)
𝜌(𝑋, 𝑌) =
√𝑉𝑎𝑟(𝑋)𝑉𝑎𝑟(𝑌)
Variables aleatorias bidimensionales 19
Ejemplo 1.20: Del ejemplo 1.19, calcular el coeficiente de correlación.

1.9. PROBLEMAS PROPUESTOS


1.21. Si (X, Y) es una V.A.B continua con función de densidad f (x, y)
entonces la probabilidad, p(x, y), geométricamente representa
_________________________________
1.22. Si cov(X, Y) = 0, entonces se dice que X e Y ______________
___________________________
1.23. Si (X, Y) es una variable aleatoria con 𝜎𝑥2 = 2; 𝜎𝑦2 = 4, entonces
var(X – Y) es __________________
𝑐
1.24. Sea 𝑝(𝑥, 𝑦) = para x = 0, 1, 2; y = 1, 2. Calcular el valor de c para
2𝑥+𝑦
que p(x, y) sea función de probabilidad bivariante.
1.25. Sea (X, Y) una variable aleatoria con función de densidad de
probabilidad conjunta dada por:
𝑘𝑥 2 𝑦 ; 0 < 𝑥 2 ≤ 𝑦 < 1
𝑓(𝑥, 𝑦) = {
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a) Calcular k para que f (x, y) sea función de densidad.
b) Calcular P(X ≥ Y)
20 Estadística para economía
1.26. La función de densidad conjunta de la variable aleatoria (X, Y) es
dada por:
2𝑒 −𝑥 𝑒 −2𝑦 ; 𝑥 > 0, 𝑦 > 0
𝑓(𝑥, 𝑦) = {
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a) Calcular P(1 < X < 2; 3 < Y < 7).
b) Calcular P(1 – X < Y)
c) Obtener las condicionales.
1.27. Se ha de almacenar gasolina en un enorme tanque una vez al
principio de cada semana y luego se vende a clientes individuales.
Denote con X el nivel de gasolina (proporción) que alcanza el tanque
después de surtirlo. Debido a suministros limitados, X varía de una
semana a otra. Denote con Y la proporción de la capacidad del
tanque que se vende durante la semana. Como X y Y son
proporciones, estas dos variables toman valores entre 0 y 1. Además,
la cantidad de gasolina vendida, y, no puede ser mayor que la
cantidad disponible, x. Suponga que la función de densidad
conjunta para X y Y está dada por
3𝑥 ; 0 ≤ 𝑦 ≤ 𝑥 ≤ 1
𝑓(𝑥, 𝑦) = {
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Encuentre la probabilidad de que más de la mitad del tanque tenga
gasolina y menos de un cuarto del tanque se venda.
1.28. Con los siguientes datos:
P(1, 2) = P(1, 3) = P(2, 2) = P(2, 3) = 1/6 y P(3, 3) = 1/3
a) Construir la tabla de distribución conjunta.
b) Calcular P(X + Y  4)
c) Calcular la función de distribución acumulada.
1.29. Sea (X, Y) una variable aleatoria con función de densidad de
probabilidad conjunta dada por:
𝑥 + 𝑦 ; 0 ≤ 𝑥, 𝑦 ≤ 1
𝑓(𝑥, 𝑦) = {
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Calcular la función de distribución acumulada.
1.30. Determine el valor de k para que
𝑝(𝑥, 𝑦) = 𝑘𝑦(2𝑦 − 𝑥) con x = 0, 3; y = 0, 1, 2
sea función de probabilidad bivariante.
Variables aleatorias bidimensionales 21
1.31. Sea X la calificación relativa a una prueba general de inteligencia y
Y la calificación relativa de un test de preferencia ocupacional. La
función de densidad de probabilidad conjunta es:
𝑘
𝑓(𝑥, 𝑦) = {1000 ; 0 ≤ 𝑥 ≤ 100; 0 ≤ 𝑦 ≤ 10
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a) Calcular k.
b) Obtener la función de distribución acumulada.
c) Obtener el momento producto de primer orden.
d) Obtener el primer momento alrededor de la media.
1.32. Dada la función conjunta acumulada
(1 − 𝑒 −𝑥/5 )(1 − 𝑒 −10𝑦 ) ; 𝑥, 𝑦 > 0
𝐹(𝑥, 𝑦) = {
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a) Obtener la función de densidad conjunta.
b) Obtener las funciones marginales acumuladas.
c) Calcular .
1.33. Sea (X, Y) una variable aleatoria bidimensional definida por:
𝑥+𝑦
𝑝(𝑥, 𝑦) = ; 𝑥 = 0,1,2; 𝑦 = 0,1,2,3
30
a) Determinar si X e Y son estadísticamente independientes.
b) Obtener p(x/y) y p(y/x)
c) Calcular 𝐸(𝑥 2 + 𝑦); 𝑐𝑜𝑣(𝑋, 𝑌)
1.34. Los contratos para dos trabajos de construcción se asignan
aleatoriamente a una o más de tres empresas, A, B y C. Si X es el
número de contratos asignados a la empresa A y Y el número de
contratos asignados a la empresa B, tienen como distribución
conjunta
X Y 0 1 2
0 1/9 2/9 1/9
1 2/9 2/9 0
2 1/9 0 0
a) Encuentre las distribuciones marginales.
b) Calcular .
c) Calcular P(x = 1 / y = 0).
22 Estadística para economía
1.35. Un restaurante de comida rápida opera tanto en un local que da
servicio en el automóvil, como en un local que atiende a los clientes
que llegan caminando. En un día elegido al azar, represente las
proporciones de tiempo que el primero y el segundo local están en
servicio con X y Y, respectivamente, y suponga que la función de
densidad conjunta de estas variables aleatorias es:
2
𝑓(𝑥, 𝑦) = {3 (𝑥 + 2𝑦) ; 0 ≤ 𝑥 ≤ 1; 0 ≤ 𝑦 ≤ 1
0; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a) Hallar las distribuciones marginales.
b) ¿X e Y son estadísticamente independientes?
c) Obtener 𝐸(3𝑥 − 𝑦); 𝑐𝑜𝑣(𝑋, 𝑌)
1.36. Sean a, , b y c constantes y X e Y variables aleatorias, ¿cuál es la
covarianza entre aX +  e bY + c?
1.37. Sean X e Y variables aleatorias. Demuestre que: −1 ≤ 𝜌 ≤ 1.
1.38. La función de probabilidad conjunta de X e Y está dado por:
X\Y 0 1
0 1/8 1/8
1 2/8 1/8
2 2/8 1/8
Calcular: 𝑉𝑎𝑟(𝑋); 𝑉𝑎𝑦(2𝑌); 𝐶𝑜𝑣(2𝑋 + 1; 𝑌 − 4)
Capítulo 2: Distribución
Normal Bidimensional
Para realizar inferencia estadística mediante intervalos de confianza, es
necesario ciertas condiciones, entre otras que la distribución de datos de
la variable de interés se ajuste a una distribución normal. De forma
similar, para procedimientos multivariados es necesario que el vector de
variables tenga distribución normal multivariada.

En el presente capítulo se desarrolla las propiedades de la


distribución normal bivariada.

2.1. DISTRIBUCIÓN NORMAL BIDIMENSIONAL


Se dice que las variables aleatorias continuas X y Y tienen una distribución
normal bivariada si su función de densidad conjunta es (Rincón, 2007)
1 1 𝑥 − 𝜇1 2
𝑓(𝑥, 𝑦) = 𝑒𝑥𝑝 (− [( )
2𝜋𝜎1 𝜎2 √1 − 𝜌2 2(1 − 𝜌2 ) 𝜎1
𝑥 − 𝜇1 𝑦 − 𝜇2 𝑦 − 𝜇2 2
− 2𝜌 ( )( )+( ) ])
𝜎1 𝜎2 𝜎2

para cualesquiera valores reales de x y y; |𝜌| < 1;  1 ,  2 > 0 y μ1, μ2 son


dos constantes reales sin restricción. Se escribe (𝑋, 𝑌)~𝑁(𝜇1 , 𝜎12 , 𝜇2 , 𝜎22 , 𝜌).
Observación 2.1: La distribución normal bivariada escrita de forma
matricial es:
1 1 𝑥 − 𝜇1
𝑓(𝑥, 𝑦) = 𝑒𝑥𝑝 [− (𝑥 − 𝜇1 𝑦 − 𝜇2 )Σ−1 (𝑦 − 𝜇 )] ;
2𝜋√|Σ| 2 2

donde:
𝜎2 𝜌𝜎1 𝜎2
Σ=( 1 )
𝜌𝜎1 𝜎2 𝜎22
24 Estadística para economía

Ejemplo 2.1: Escribir la función de densidad conjunta de la distribución


normal bivariada, 𝑓(𝑥, 𝑦), para 𝜇1 = 1, 𝜇2 = 3, 𝜎12 = 2, 𝜎22 = 1 y 𝜌 = −0.8.
(Johnson, 2008)
Distribución normal bivariada 25
2.2. DISTANCIA DE MAHALANOBIS
Para cada punto (x, y) en un contorno elíptico, la ecuación:
1 𝑥 − 𝜇1 2 𝑥 − 𝜇1 𝑦 − 𝜇2 𝑦 − 𝜇2 2
[( ) − 2𝜌 ( ) ( ) + ( ) ]=𝑘
(1 − 𝜌2 ) 𝜎1 𝜎1 𝜎2 𝜎2
Mide el cuadrado de la distancia de Mahalanobis entre (x, y) y el centro
(𝜇1 , 𝜇2 ). (Jobson, 1991)
Ejemplo 2.2: Obtener la distancia de Mahalanobis entre (71, 73) y el
centro si (Jobson, 1991)
𝜇1 = 𝜇2 = 72, 𝜎12 = 𝜎22 = 6 y 𝜌 = 0.8.

Observación 2.2: Para verificar normalidad bivariada se espera que


aproximadamente el 50% de las observaciones de la muestra grande (≥
30) se encuentren en la elipse (Johnson, 2008)
𝑥−𝑥 2
(𝑥 − 𝑥 𝑦 − 𝑦)S −1 ( ) ≤ 𝜒(2,0.5) = 1.386
𝑦−𝑦
Donde 𝑥, 𝑦 y S, son estimadores de 𝜇1 , 𝜇2 y Σ respectivamente.
Ejemplo 2.3: Del ejemplo 2.2, el punto (81,70), ¿se encuentran dentro
de la elipse?

Observación 2.3: Cuando  = 0 y 𝜎1 = 𝜎2 los contornos de densidad de


probabilidad son círculos y la función de densidad conjunta se denomina
distribución normal circular. (Freund, 2000)
26 Estadística para economía
Ejemplo 2.4: En el ejemplo 2.2, hacer  = 0, obtener los contornos y
graficar para un valor de k.

2.3. DENSIDADES MARGINALES


Las funciones marginales están dadas por (Gallego, 2010)
1 (𝑥 − 𝜇1 )2
𝑓𝑥 (𝑥) = 𝑒𝑥𝑝 [− ] ≅ 𝑁(𝜇1 , 𝜎12 )
√2𝜋𝜎12 2𝜎12

1 (𝑦 − 𝜇2 )2
𝑓𝑦 (𝑦) = 𝑒𝑥𝑝 [− ] ≅ 𝑁(𝜇2 , 𝜎22 )
√2𝜋𝜎22 2𝜎22
Distribución normal bivariada 27
28 Estadística para economía

Ejemplo 2.5: En el ejemplo 2.1, obtener las funciones marginales.

2.4. FUNCIONES DE DENSIDADES CONDICIONAL


Están dadas por (Gallego, 2010)
(𝑥 − 𝜇1 )𝜌𝜎2 2
𝑓(𝑌/𝑋) ≅ 𝑁 (𝜇2 + , 𝜎2 (1 − 𝜌2 )) y
𝜎1

(𝑦 − 𝜇2 )𝜌𝜎1 2
𝑓(𝑋/𝑌) ≅ 𝑁 (𝜇1 + , 𝜎1 (1 − 𝜌2 ))
𝜎2
Distribución normal bivariada 29
Ejemplo 2.6: Para el ejemplo 2.1, obtener la media, varianza y la función
de densidad condicional de f (X / 1.5)

2.5. PROBLEMAS PROPUESTOS


2.7. Sean X y Y variables aleatorias independientes tal que 𝑋~𝑁(20; 52 )
y 𝑌~𝑁(17; 42 ). Luego:
a) el vector, (X, Y), se distribuye como ___________________.

b) la matriz varianzas-covarianzas, , es __________________

c) la ecuación de la curva de nivel, en el nivel 1.386, es


____________________________.
2.8 En un conjunto de 30 pares de observaciones. Para esperar que se
ajustan a una distribución normal bivariante, el número mínimo de
pares que caen dentro de la curva que proyecta al plano esta
distribución es _______________.
2.9. En una distribución normal bivariante, cuando las varianzas de las
variables aleatorias son iguales y 𝜌 = 0, entonces la curva de nivel
que se proyecta en el plano representa una ________________
________________.
30 Estadística para economía
2.10. La distribución de los gastos en dos productos (X, Y) de un grupo de
consumidores sigue una distribución normal bivariante con medias
respectivas de 3 y 2 euros y matriz de varianzas covarianzas ∑ =
1 0.8
( ). Obtener la media, varianza y la función de densidad
0.8 2
condicional de f (X / 2.5).
2.11. Sea 𝑋~𝑁(0; 12 ) y 𝑌/𝑋 normal de media x y varianza uno
a) Obtener la función de densidad conjunta, f (x, y).
b) Si la función f (x, y) obtenida en el ítem (a) adopta la forma de
una distribución normal bivariada, ¿Cuál es la matriz de
varianzas-covarianzas, ?
c) Determine si la matriz de varianzas-covarianzas, , es definida
positiva.
2.12. La función de densidad conjunta de probabilidad para la demanda
mensual de dos productos es una distribución normal bivariada
dada por:
1 2 𝑥 − 50 2 𝑥 − 50 𝑦 − 25
𝑓(𝑥, 𝑦) = 𝑒𝑥𝑝 {− [( ) −( )( )
100𝜋√3 3 10 10 10
𝑦 − 25 2
+( ) ]}
10
Hallar el coeficiente de correlación y escriba de forma matricial.
2.13. Un economista del departamento de recursos humanos de Florida
State está preparando un estudio sobre el comportamiento del
consumidor. Él recolectó los datos que aparecen en la siguiente
tabla en miles de dólares.
Ingreso 24.3 12.5 31.2 28 35.1 10.5
Consumo 16.2 8.5 15 17 24.2 11.2
Ingreso 23.2 10 8.5 15.9 14.7 15
Consumo 15 7.1 3.5 11.5 10.7 9.2
a) Realice el gráfico de dispersión.
b) Obtener el coeficiente de correlación muestral.
c) Escribir la expresión para verificar la normalidad bivariada.
d) ¿La matriz  es definida positiva? Use el método de los
autovalores.
e) Obtener los autovectores.
f) Graficar la forma cuadrática asociada.
Capítulo 3: Convergencia de
sucesiones de variables
aleatorias
En este capítulo se desarrollará, de forma intuitiva y desde la perspectiva
del cálculo, algunos tipos de convergencia de sucesiones de variables
aleatorias y sus propiedades. Además de la relación que existe entre los
tipos de convergencia de sucesiones de variables aleatorias.

En la práctica, los tipos de convergencia más usuales son los


asociados a las leyes de los grandes números y el teorema del límite
central, por ser de considerable importancia en la probabilidad y la
estadística inferencial.

3.1. SUCESIÓN DE VARIABLES ALEATORIAS


Se le llama así al conjunto infinito numerable 𝑋1 , 𝑋2 , … , 𝑋𝑛 , …, y se
denota por {𝑋𝑛 }𝑛∈ℕ (Martín, 1997).

Ejemplo 3.1: Sea B(n, p) una distribución de probabilidad binomial. La


siguiente gráfica muestra el comportamiento de la distribución de
probabilidad para diferentes valores de n y un valor fijo de p. (Martín,
1997)
32 Estadística para economía

Como se observa en la figura, en la medida que crece n el comportamiento


de la distribución converge a la distribución normal.

3.2. TIPOS DE CONVERGENCIA

3.2.1. Convergencia casi segura o fuerte o con probabilidad 1


Una sucesión de VV.AA {𝑋𝑛 }𝑛∈ℕ converge casi seguro o con
probabilidad 1 a X cuando se verifica (Martín, 1997):

𝑃 ( lim 𝑋𝑛 = 𝑋) = 1
𝑛→∞
que equivale a verificar
lim 𝑃[|𝑋𝑚 − 𝑋| > 𝜀 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑚 > 𝑛] = 0
𝑛→∞
y se denota por:
𝑐𝑠
𝑋𝑛 → 𝑋
1
Ejemplo 3.2: Demuestre que la sucesión 𝑋𝑛 (𝜔) = 1, si 𝜔 ∈ [0, 𝑛] y
1
𝑋𝑛 (𝜔) = 0, si 𝜔 ∈ ]𝑛 , 1] converge casi seguro a cero. (Rincón, 2007)
33 Convergencia de variables aleatorias

3.2.1.1. Propiedades: (Martín, 1997)


𝑐𝑠
1. Si 𝑋𝑛 → 𝑋, se cumple:
𝑐𝑠
i) 𝑋𝑛 − 𝑋 → 0.
𝑐𝑠
ii) Si 𝑐 ∈ ℝ − {0}, 𝑐𝑋𝑛 → 𝑐𝑋.
𝑐𝑠
iii) Si g(x) es una función real y continua, 𝑔(𝑋𝑛 ) → 𝑔(𝑋).
𝑐𝑠
iv) Si k es real y k > 0, 𝑋𝑛𝑘 → 𝑋 𝑘 .
34 Estadística para economía
𝑐𝑠 𝑐𝑠
2. Si 𝑋𝑛 → 𝑋 y 𝑌𝑛 → 𝑌, se cumple:
𝑐𝑠
i) 𝑋𝑛 ± 𝑌𝑛 → 𝑋 ± 𝑌.
𝑐𝑠
ii) 𝑋𝑛 ∙ 𝑌𝑛 → 𝑋 ∙ 𝑌.
𝑋𝑛 𝑐𝑠 𝑋
iii) 𝑌𝑛
→ 𝑌, siempre que los cocientes existan.
𝑐𝑠
iv) Si g(x, y) es una función real y continua, 𝑔(𝑋𝑛 , 𝑌𝑛 ) → 𝑔(𝑋, 𝑌).

3.2.2. Desigualdad de Chebyschev


Sea X una variable aleatoria con media 𝜇 y varianza finita 𝜎 2 . Para
cualquier 𝜀 > 0
𝜎2 1
𝑃(|𝑋 − 𝜇| ≥ 𝜀) ≤ 2 𝑜 𝑃(|𝑋 − 𝜇| ≥ 𝜎𝜀) ≤ 2
𝜀 𝜀
35 Convergencia de variables aleatorias

3.2.3. Convergencia en probabilidad


Una sucesión de VV.AA {𝑋𝑛 }𝑛∈ℕ , independientes o no, converge
en probabilidad a la V.A.  si,  > 0, se cumple que: (Uña y
otros, 2003)
lim 𝑃(|𝑋𝑛 − 𝑋| ≥ 𝜀) = 0
𝑛→∞

Que, expresado como suceso contrario, es:


lim 𝑃(|𝑋𝑛 − 𝑋| < 𝜀) = 1
𝑛→∞

La notación de la convergencia en probabilidad es:


𝑝
𝑝 lim 𝑋𝑛 = 𝑋 ó 𝑋𝑛 → 𝑋
𝑛→∞
36 Estadística para economía
Observación 3.1: La convergencia en probabilidad indica que la
diferencia entre Xn y X es muy pequeña con probabilidad alta.
Nota: El límite de {𝑋𝑛 }𝑛∈ℕ puede ser una constante, en tal caso se cambia
X por la constante.
Ejemplo 3.3: Demuestre que la sucesión de variables aleatorias {𝑋𝑛 }
converge en probabilidad a cero si su distribución de probabilidad está
dada por: (Casas, 1996)
0; 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 𝑎𝑛
𝑋𝑛 = {
1; 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑎𝑛 , 0 ≤ 𝑎 < 1

Ejemplo 3.4: Sea {𝑋𝑛 } una sucesión de variables aleatorias


independientes, todas con función de densidad: (Cabrejas, 2012)
𝑓(𝑥) = 𝑒 −(𝑥−𝜆) , 𝑥 > 𝜆
𝑃
Demuestre que: {𝑍𝑛 } → 𝜆, siendo 𝑍𝑛 = 𝑚𝑖𝑛{𝑋1 , 𝑋2 , … , 𝑋𝑛 }.
37 Convergencia de variables aleatorias

3.2.3.1. Propiedades: (Martín, 1997)


𝑝
1. Si 𝑋𝑛 → 𝑋, se cumple:
𝑝
i) 𝑋𝑛 − 𝑋 → 0.
𝑝
ii) Si 𝑐 ∈ ℝ − {0}, 𝑐𝑋𝑛 → 𝑐𝑋.
𝑝
iii) Si  es una V.A., entonces 𝑋𝑛 ∙ 𝜂 → 𝑋 ∙ 𝜂.
𝑝
iv) Si g(x) es una función real y continua, 𝑔(𝑋𝑛 ) → 𝑔(𝑋).
𝑝
v) Si k es real y k > 0, 𝑋𝑛𝑘 → 𝑋 𝑘 .
38 Estadística para economía
𝑝 𝑝
2. Si 𝑋𝑛 → 𝑋 y 𝑌𝑛 → 𝑌, se cumple:
𝑝
i) 𝑋𝑛 ± 𝑌𝑛 → 𝑋 ± 𝑌.
𝑝
ii) 𝑋𝑛 ∙ 𝑌𝑛 → 𝑋 ∙ 𝑌.
𝑋𝑛 𝑝 𝑋
iii) 𝑌𝑛
→ 𝑌, siempre que los cocientes existan.
𝑝
iv) Si g(x, y) es una función real y continua, 𝑔(𝑋𝑛 , 𝑌𝑛 ) → 𝑔(𝑋, 𝑌).

3.2.4. Convergencia en distribución o ley o débil


Una sucesión de VV.AA {𝑋𝑛 }𝑛∈ℕ con funciones de distribución
Fn(x), converge en distribución a la V.A. X, con distribución
F(x), si y sólo si la sucesión {𝐹𝑛 (𝑥)}𝑛∈ℕ converge a F(x), es decir:
lim 𝐹𝑛 (𝑥) = 𝐹(𝑥)
𝑛→∞

en todos los puntos de continuidad de F(x).


𝑑
La convergencia en distribución se denota por: 𝑋𝑛 → 𝑋.
39 Convergencia de variables aleatorias
Ejemplo 3.5: Demuestre que {𝑋𝑛 } converge en distribución a cero: (Uña
y otros, 2003)
0 ; 𝑐𝑜𝑛 𝑃( 𝑋𝑛 = 0) = 1 − (1/2)𝑛
𝑋𝑛 = {
1 ; 𝑐𝑜𝑛 𝑃( 𝑋𝑛 = 1) = (1/2)𝑛

3.2.4.1. Propiedades: (Martín, 1997)


𝑑
1. Si 𝑋𝑛 → 𝑋, se cumple:
𝑑
i) 𝑋𝑛 − 𝑋 → 0.
𝑑
ii) Si 𝑐 ∈ ℝ, 𝑋𝑛 + 𝑐 → 𝑋 + 𝑐.
𝑑
iii) Si 𝑐 ∈ ℝ − {0}, 𝑐𝑋𝑛 → 𝑐𝑋.
𝑑
iv) Si g(x) es una función real y continua, 𝑔(𝑋𝑛 ) → 𝑔(𝑋).
40 Estadística para economía

𝑑 𝑑
2. Si 𝑋𝑛 → 𝑋 y 𝑌𝑛 → 𝑐, se cumple:
𝑑
i) 𝑋𝑛 ± 𝑌𝑛 → 𝑋 ± 𝑐.
𝑑
ii) 𝑋𝑛 ∙ 𝑌𝑛 → 𝑋 ∙ 𝑐.
𝑋𝑛 𝑑 𝑋
iii) → , siempre que los cocientes existan.
𝑌𝑛 𝑌

3.2.5. Convergencia en media cuadrática


Una sucesión de VV.AA {𝑋𝑛 }𝑛∈ℕ tales que existe 𝐸[𝑋𝑛2 ] converge
en media cuadrática a la V.A. X cuando 𝐸[𝑋 2 ] existe, si y sólo
si: (Casas, 1996)
lim 𝐸[(𝑋𝑛 − 𝑋)2 ] = 0
𝑛→∞

La convergencia en media cuadrática se denota por:


𝑚𝑐 2 𝐿2
𝑋𝑛 → 𝑋; 𝑋𝑛 → 𝑋; 𝑋𝑛 → 𝑋
41 Convergencia de variables aleatorias
𝑚𝑐
Ejemplo 3.6: Demuestre que 𝑋𝑛 → 0. Las VV.AA. de {𝑋𝑛 } son
independientes. (Casas, 1996)
1
𝑋𝑛 = { 𝑛4 ; 𝑐𝑜𝑛 𝑝𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1/𝑛
0 ; 𝑐𝑜𝑛 𝑝𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 1/𝑛

3.2.5.1. Propiedades: (Martín, 1997)


𝑚𝑐
1. Si 𝑋𝑛 → 𝑋, se cumple:
𝑚𝑐
i) 𝐸(𝑋𝑛 ) → 𝐸(𝑋).
𝑚𝑐
ii) 𝐸(𝑋𝑛2 ) → 𝐸(𝑋 2 ).
𝑚𝑐
iii) De i y ii se deduce que 𝑉𝑎𝑟(𝑋𝑛 ) → 𝑉𝑎𝑟(𝑋).

𝑚𝑐 𝑚𝑐 𝑚𝑐
2. Si 𝑋𝑛 → 𝑋 y 𝑌𝑛 → 𝑌, entonces 𝐸(𝑋𝑛 ∙ 𝑌𝑛 ) → 𝐸(𝑋 ∙ 𝑌).
42 Estadística para economía
3.3. RELACIONES ENTRE LOS DISTINTOS TIPOS DE
CONVERGENCIA (Martín, 1997)

casi segura
en probabilidad en distribución
en media cuadrática

3.4. LEYES DE LOS GRANDES NÚMEROS

3.4.1. Ley débil de los grandes números


Si {𝑋𝑛 }𝑛∈ℕ es una sucesión de VV.AA independientes, igualmente
distribuidas y con la misma esperanza matemática 𝐸(𝑋𝑛 ) = 𝜇,
entonces se cumple (Uña, 2003)
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 𝑝
𝑋̅𝑛 = →𝜇
𝑛
es decir,
∀𝜀 > 0; lim 𝑃(|𝑋̅𝑛 − 𝜇| ≥ 𝜀) = 0
𝑛→∞

equivalentemente:
∀𝜀 > 0; lim 𝑃(|𝑋̅𝑛 − 𝜇| < 𝜀) = 1
𝑛→∞

Es decir, para un valor de n grande, es muy probable que la media


se aproxime al valor esperado.
Ejemplo 3.7: Sea {𝑋𝑛 }𝑛∈ℕ es una sucesión de VV.AA independientes e
igualmente distribuidas con distribución Bernoulli de parámetro p,
entonces  > 0; (Blanco, 2004)
𝑛
𝐾𝑛 1
𝑃 (| − 𝑝| ≥ 𝜖) ≤ ; 𝐾 = ∑ 𝑋𝑖
𝑛 4𝑛𝜖 2 𝑛
𝑖=1
43 Convergencia de variables aleatorias

3.4.2. Desigualdad de Markov


Sea X una V.A. con esperanza finita. Para cualquier  > 0, (Rincón,
2007)
𝐸(𝑋)
𝑃(𝑋 ≥ 𝜀) ≤
𝜀

Ejemplo 3.8: Por experiencia, un profesor sabe que el puntaje obtenido


por un estudiante en el examen final de su materia es una variable
aleatoria con media 75. Obtener una cota superior para la probabilidad de
que el estudiante obtenga un puntaje mayor o igual a 85. (Blanco, 2004)

3.4.3. Ley fuerte de los grandes números


Si {𝑋𝑛 }𝑛∈ℕ es una sucesión de VV.AA independientes, igualmente
distribuidas y con la misma esperanza matemática 𝐸(𝑋𝑛 ) = 𝜇,
entonces se cumple: (Uña, 2003)
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 𝑐𝑠
𝑋̅𝑛 = →𝜇
𝑛
44 Estadística para economía
3.4.4. Teorema del límite central
Sea {𝑋𝑛 }𝑛∈ℕ una sucesión de VV.AA independientes, igualmente
distribuidas, con la misma esperanza matemática 𝐸(𝑋𝑛 ) = 𝜇, y la
misma varianza 𝑉𝑎𝑟(𝑋𝑛 ) = 𝜎 2 . Si
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋̅𝑛 =
𝑛
entonces la V.A.
𝑋̅𝑛 − 𝜇 𝑑
𝑍= 𝜎 → 𝑁(0,1)
√𝑛
cuando n crece indefinidamente. (Uña, 2003)
Ejemplo 3.9: Un elevador de carga grande puede transportar un
máximo de 10000 libras. Supóngase que una carga, que contiene 45 cajas,
se debe transportar mediante el elevador. La experiencia ha demostrado
que el peso de una caja de este tipo de carga se ajusta a una distribución
de probabilidad con una media de 200 libras y una desviación estándar de
55 libras. Calcular la probabilidad de que las 45 cajas se puedan
transportar simultáneamente en el elevador. (Blanco, 2004)
45 Convergencia de variables aleatorias
3.5. PROBLEMAS PROPUESTOS
3.10. Si la sucesión de VV.AA. {𝑋𝑛 }𝑛∈ℕ converge C.S. a la V.A. X.
𝐶.𝑆.
entonces 𝑠𝑒𝑛(𝑋𝑛 ) → 𝑠𝑒𝑛(𝑋) debido a que la función _________ es
_________________________.
𝑝 𝑝
3.11. Si 𝑋𝑛 → (𝑐 − 1) y 𝑌𝑛 → (𝑐 + 1), 𝑐 > 0. Luego, 𝑋𝑛 𝑌𝑛 converge en
__________________ a ______________________.
1
3.12. Si 𝑣𝑎𝑟(𝑋) = 0.002, 𝑃 (|𝑋 − 𝜇| ≥ 10) ≤ ______________.
𝑝
3.13. Demuestre que 𝑋𝑛 → 𝜃, si {𝑋𝑛 } es una sucesión de variables
uniformes en el intervalo [0, 𝜃]; 𝜃 > 0.
3.14. Sea {𝑋𝑛 }𝑛∈ℕ una sucesión de V.A. independientes tales que:
𝑋𝑛 –n 0 n
1 1 1
Probabilidad 1−
2𝑛2 𝑛2 2𝑛2
𝑉𝑎𝑟(𝑋𝑛 ) 𝑐.𝑠
¿ → 0?
𝑛

3.15. La sucesión
1
1; 𝑠𝑖 𝑤 ∈ ]0, 2𝑘 ]
𝑋2𝑘 (𝑤) = { ; 𝑘 = 1,2,3, …
0; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
¿converge casi seguramente a cero?
𝑚𝑐
3.16. Determinar si {𝑋𝑛 } → 𝑎, donde:
1
𝑎 ; 𝑐𝑜𝑛 𝑃( 𝑋𝑛 = 𝑎) = 1 −
𝑋𝑛 = { 𝑛
1
𝑎 + 𝑛𝑏 ; 𝑐𝑜𝑛 𝑃( 𝑋𝑛 = 𝑎 + 𝑛𝑏) = ; 𝑏 ≠ 0
𝑛
3.17. Si 𝑍~𝑈(– 1,1) tal que:
1
−1; −1 < 𝑍 < −
𝑛
1 1 −1: −1 < 𝑍 < 0
𝑋𝑛 = 0 ; − < 𝑍 < 𝑊={
𝑛 𝑛 1; 0 < 𝑧 < 1
1
{ 1; 𝑛 < 𝑍 < 1

Demuestre que {𝑋𝑛 } converge en distribución a W.


46 Estadística para economía
3.18. Sea {𝑋𝑛 }𝑛∈ℝ una sucesión de variables aleatorias idénticamente
distribuidas con función de densidad común
−𝑥+𝜃
𝑓(𝑥) = {𝑒 ;𝑥 ≥ 𝜃
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑋1 +𝑋2 +⋯+𝑋𝑛
Demuestre que 𝑋𝑛 = 𝑛
converge en probabilidad a 1 + .

3.19. Sean 𝑋1 , 𝑋2 , … , 𝑋𝑛 VV.AS. independientes cada una con función de


𝑃
densidad uniforme en [𝛼, 𝛽]. Demuestre que {𝑍𝑛 } → 𝛽, siendo 𝑍𝑛 =
𝑚á𝑥{𝑋1 , 𝑋2 , … , 𝑋𝑛 }.
3.20. Sean 𝑋1 , 𝑋2 , … , 𝑋𝑛 VV.AS. idénticamente distribuidas cada una con
función de densidad
1+𝛼
𝑓(𝑥) = ; 𝑥 ≥ 1; 𝛼 > 0
𝑥 2+𝛼
1
por la ley débil de los grandes números, la sucesión 𝑠̅𝑛 = 𝑛 ∑𝑛𝑖=1 𝑋𝑖
¿hacia dónde converge?
3.21. Para la siguiente función:
1
𝑠𝑖 𝑥 = −1,1
18
𝑓(𝑥) = { 16
18
𝑠𝑖 𝑥 = 0

Demuestre que el valor exacto de la probabilidad 𝑃(|𝑋 − 𝜇| ≥ 3𝜎)


coincide con la estimación dada por Chebyshev.
3.22. El número de ingresos a internet que ocurre diariamente en
determinada computadora personal es una V.A. X con distribución
de probabilidad
X 0 2 4
P(X = x) 0.125 0.75 0.125
Calcule la probabilidad que ocurran entre 50 y 70 ingresos a internet
a tal computadora en un periodo de 30 días.
3.23. El costo de producción de cierto artículo tiene media de $8 y
desviación estándar de $1. Si se adquieren 36 artículos para su
comercialización, hallar el valor de la venta de cada uno de ellos de
manera que los 36 se gane al menos $ 98.13 con probabilidad 0.95.
47 Convergencia de variables aleatorias
3.24. Una empresa produce láminas de acero de 4 m. El número de
defectos que se encuentran al desenrollar las láminas es una V.A.
Poisson que tiene media de 2 defectos por lámina, ¿Cuál es la
probabilidad que se encuentren a lo más 50 defectos al desenrollar
32 rollos de lámina?
3.25. La demanda semanal de cierta marca de néctar es una V.A. de media
3000 litros y varianza 8100 litros cuadrados. Calcular la
probabilidad que en 60 semanas supere los 166800 litros.
3.26. Suponga que 𝑋1 , 𝑋2 , … , 𝑋20 son VV.AA. independientes con función
de densidad
𝑓(𝑥) = 2𝑥; 0 ≤ 𝑥 ≤ 1
Sea 𝑆 = ∑20
𝑖=1 𝑋𝑖 . Aproxime 𝑃(𝑆 ≤ 10).
48 Estadística para economía
Capítulo 4: Muestreo,
distribuciones muestrales e
intervalos de confianza
Las distribuciones muestrales desempeñan un papel muy importante en
el análisis estadístico y la toma de decisiones. Se inicia el capítulo
revisando los conceptos de población, muestra y los tipos de muestreo
aleatorio. Las distribuciones de muestreo proporcionan el vínculo entre la
teoría de probabilidad y la inferencia estadística.
Existe una diferencia entre la distribución de la población de la cual
se tomó la muestra y la distribución de la estadística de la muestra, pues
por lo general, una población tiene una distribución llamada distribución
poblacional, que generalmente se desconoce, mientras que una estadística
tiene una distribución de muestreo, que generalmente es diferente de la
distribución de la población.

4.1. MUESTREO.
4.1.1. Población
Es un conjunto de elementos sobre los que se desea realizar una
inferencia.
4.1.2. Unidades de muestreo
Son conjuntos no solapados de la población que cubren la
población completa.
4.1.3. Marco
Es una lista de unidades de donde se selecciona la muestra.
4.1.4. Muestra
Es una colección de unidades de muestreo obtenidas a partir de un
marco o marcos.
50 Estadística para economía
4.1.5. Muestra aleatoria
Sea X una V.A. con función de probabilidad 𝑝(𝑥) o función de
densidad 𝑓(𝑥), con media 𝜇 y varianza 𝜎 2 . Una muestra
aleatoria (m.a.) de tamaño n de X, es un conjunto de n variables
aleatorias 𝑋1 , 𝑋2 , … , 𝑋𝑛 que cumplen:
i) Cada 𝑋𝑖 tiene la misma distribución de X. Es decir, 𝐹𝑋𝑖 (𝑥) = 𝐹𝑋 (𝑥),
para todo x, con 𝑖 = 1,2, … , 𝑛. En consecuencia,
𝜇𝑋𝑖 = 𝐸(𝑋𝑖 ) = 𝐸(𝑋) = 𝜇 y 𝜎𝑋2𝑖 = 𝑉𝑎𝑟(𝑋𝑖 ) = 𝑉𝑎𝑟(𝑋) = 𝜎 2
ii) Las variables aleatorias Xi son independientes. En consecuencia,
las funciones de probabilidad conjunta, para el caso
discreto y continuo, respectivamente son:
𝑝𝑋1 ,𝑋2 ,…,𝑋𝑛 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) = 𝑝𝑋1 (𝑥1 )𝑝𝑋2 (𝑥2 ) … 𝑝𝑋𝑛 (𝑥𝑛 )
𝑓𝑋1 ,𝑋2 ,…,𝑋𝑛 (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) = 𝑓𝑋1 (𝑥1 )𝑓𝑋2 (𝑥2 ) … 𝑓𝑋𝑛 (𝑥𝑛 )
Ejemplo 4.1: Sea X una V.A. con función de densidad exponencial, para
una muestra de tamaño n, obtener la función de probabilidad conjunta
(Canavos).

4.2. MÉTODOS DE MUESTREO.


Los métodos de muestreo pueden ser de dos tipos: aleatorios y no
aleatorios, dependiendo del método de obtención de la muestra. En la
siguiente gráfica se muestra los métodos de muestreo más usuales
(Morilas).
Distribuciones muestrales e intervalos de confianza 51

Muestreos
Aleatorios

Unidad muestral Unidad muestral


elemental grupo

Muestreo Muestreo Muestreo Muestreo por


Muestreo
aleatorio aleatorio aleatorio áreas y
por etapas
simple sistemático estratificado conglomerados

Muestreos NO
Aleatorios

Muestreo por Muestreo de Muestreo Muestreo por


cuotas juicio u intencional bola de nieve
opinión

4.2.1. Muestreo aleatorio simple


Es el procedimiento de seleccionar una muestra de tamaño n de una
población de tamaño N, donde cada elemento de la población tiene la
misma probabilidad de ser elegido. Para la obtención de la muestra
generalmente se usa una tabla de números aleatorios.
Observación 4.1: El muestreo aleatorio puede realizarse con o sin
reemplazamiento. Cuando es con reemplazamiento, la probabilidad de
1
ser seleccionado de cada elemento es 𝑁
y, cuando es sin
reemplazamiento, la probabilidad de ser seleccionado cada elemento
1 1 1
de es en la primera extracción, en la segunda extracción, en la
𝑁 𝑁−1 𝑁−2
tercera extracción, etc.
52 Estadística para economía
4.2.2. Muestreo aleatorio sistemático
Es el procedimiento de seleccionar una muestra de tamaño n de una
población de tamaño N a intervalos uniformes a partir de un listado
ordenado. Una forma de proceder es:
𝑁
i) Calcular el k-ésimo elemento de la muestra es 𝑘 = (el menor de los
𝑛
enteros en caso no ser entero).
ii) Elegir aleatoriamente un número m, entre 1 y k.
iii) La muestra es la lista {𝑥𝑚 , 𝑥𝑚+𝑘 , 𝑥𝑚+2𝑘 , … , 𝑥𝑚+(𝑛−1)𝑘 }.
Ejemplo 4.2: Elegir una muestra sistemática de 40 estudiantes de una
población que tiene 390 estudiantes.

4.2.3. Muestreo aleatorio estratificado


Un muestreo aleatorio estratificado se obtiene en dos etapas, la
primera etapa es separar los elementos de la población en grupos no
solapados, llamados estratos, y la segunda etapa es seleccionar una
muestra aleatoria simple o sistemática de cada estrato.
Población (N)
Muestra (n)

N1 N2 n1 n2
… …
Nk nk

Observación 4.2: En el muestreo estratificado los estratos son


heterogéneos entre sí y cada estrato tiene elementos
homogéneos. El tamaño de cada sub-muestra debe ser proporcional al
tamaño del estrato con la finalidad de asegurar representatividad.
Distribuciones muestrales e intervalos de confianza 53
Ejemplo 4.3: Indicar el tamaño de cada sub-muestra de una m.a. de 500
personas, con la finalidad de realizar un estudio de mercado, de una
población de 20000 personas de las cuales 10000 son de nivel
socioeconómico D, 4400 de nivel C, 3600 de nivel B y 2000 de nivel A.

4.2.4. Muestreo aleatorio por conglomerado


Consiste en seleccionar aleatoriamente un cierto número de
conglomerados1 (el necesario para alcanzar el tamaño muestral
establecido) e investigar después todos los elementos pertenecientes a los
conglomerados elegidos.
Observación 4.3: En el muestreo por conglomerados los grupos son
homogéneos entre sí y cada grupo es heterogéneo dentro de él.
Cuando los conglomerados son áreas geográficas se habla de muestreo por
áreas.
Ejemplo 4.4: Para estudiar el costo de las mensualidades en colegios
particulares de Piura, de la lista de colegios particulares (conglomerados),
se extrae una muestra aleatoria y luego se obtienen el costo de las
mensualidades.

4.2.5. Muestreo por etapas


Es una generalización del muestreo por conglomerados. En la primera
etapa se selecciona un número determinado de conglomerados (unidades
primarias de muestreo). En la segunda se seleccionan conglomerados más
pequeños pertenecientes a los anteriores (unidades secundarias de
muestreo). Y así sucesivamente (procedimiento de “embudo”) hasta llegar
a los elementos de la población que van a ser observados (unidades
últimas).

1 Grupo de elementos de la población que forman una unidad (familias, empresas, municipios, etc.).
54 Estadística para economía
Observación 4.4: Cuando se realiza un muestreo por etapas sólo se
necesita contar con un listado de los elementos de la última etapa.

4.3. PARÁMETROS Y ESTADÍSTICOS.

4.3.1. Parámetro
Es una caracterización numérica de la distribución de la población.

4.3.2. Estadístico
Es cualquier función real de las variables aleatorias que integran
la muestra, es decir, es una función de las observaciones
muestrales, la cual no contiene ningún valor o parámetro
desconocido.

Ejemplo 4.5: Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una m.a. simple de una población con


función de distribución F(X, ), donde  es el parámetro desconocido. Las
siguientes funciones son estadísticos:
𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑔(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) = ;
𝑛
𝑋12 + 𝑋22 + ⋯ + 𝑋𝑛2
ℎ(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) =
𝑛

4.3.3. Estadísticos usuales


Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una m.a. simple de tamaño n, los estadísticos media,
varianza y proporción muestral se definen, respectivamente, como:
𝑛 𝑛
1 1 2
𝑋 = ∑ 𝑋𝑖 ; 𝑆 2 = ∑(𝑋𝑖 − 𝑋 )
𝑛 𝑛−1
𝑖=1 𝑖=1

𝑋 número de éxitos en 𝑛 pruebas


𝑃𝑋 = =
𝑛 número de pruebas
Distribuciones muestrales e intervalos de confianza 55
4.4. DISTRIBUCIONES MUESTRALES.

4.4.1. Distribución muestral


Es la distribución de probabilidad de un estadístico.

4.4.2. Error estándar del estadístico


Es la desviación estándar de la distribución muestral de un
estadístico.

4.4.3. DISTRIBUCIÓN MUESTRAL DE LA MEDIA.


Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una m.a. simple de tamaño n, escogida de una población
1
con media  y varianza 𝜎 2 . Si 𝑋 = ∑𝑛𝑖=1 𝑋𝑖 es la media muestral, entonces
𝑛

𝜎𝑋2 𝜎 2
𝜇𝑋 = 𝐸( 𝑋 ) = 𝜇 y 𝜎𝑋2 = 𝑉𝑎𝑟( 𝑋 ) = =
𝑛 𝑛
Observación 4.5:
𝜎2
1. La aproximación de 𝑋 a la normal, 𝑁 (𝜇, 𝑛
), es buena cuando n ≥ 30,
para cualquier población, finita o infinita, discreta o continua. Si la
población es normal, la aproximación se cumple para n ≥ 2.

2. La varianza de 𝑋 es válida cuando el muestreo es con o sin


reemplazo en una población infinita, o es con reemplazo en
una población finita de tamaño N. En caso de ser población
finita de tamaño N y el muestreo sin reemplazo, 𝜎𝑋2 =
𝜎 2 𝑁−𝑛
𝑉𝑎𝑟( 𝑋 ) = (
𝑛 𝑁−1
). Es decir, la varianza es afectada por el factor de
𝑁−𝑛
corrección para poblaciones finitas, 𝑁−1 .
56 Estadística para economía
Ejemplo 4.6: Suponga que una población finita consiste de los valores:
6, 8; 12; 15; 20.
a) Calcular la media y la varianza de la población.
b) Si se extraen muestras al azar de tamaño dos con reposición, obtener
la distribución muestral de la media.
c) Del ítem (b) calcular la media y varianza y, verificar mediante la
observación 4.5.
d) Si se extraen muestras al azar de tamaño dos sin reposición, obtener la
distribución muestral de la media.
e) Del ítem (d) calcular la media y varianza y, verificar mediante la
observación 4.5.
Distribuciones muestrales e intervalos de confianza 57
Ejemplo 4.7: Una máquina empaqueta un determinado producto, en
paquetes cuyo peso, en gramos, se distribuye normalmente con desviación
estándar de 25 gramos y con media  que debe ser bien regulada.
a) La media  está bien regulada si sólo el 98.5% de los pesos de todos los
paquetes que produce la máquina tienen pesos inferiores a 555 gramos,
¿cuánto es el valor de ?
b) Con la media bien regulada, se programa el siguiente control del peso
del producto: cada hora se escogen al azar 5 paquetes, si el promedio
de los pesos no está entre 475 y 515 gramos, se para la máquina para
mantenimiento. En caso contrario se continúa con el proceso. ¿Cuál
es la probabilidad de parar la máquina cuando realmente está bien
regulada?
58 Estadística para economía
4.4.4. DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN.
Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una m.a. simple de tamaño n, escogida de una población
Bernoulli, 𝐵(1, 𝑝), donde p es el porcentaje de éxitos en la población y, sea
1 𝑋
𝑃 = 𝑛 ∑𝑛𝑖=1 𝑋𝑖 = 𝑛, la proporción muestral,
𝑝𝑞
i) 𝜇𝑃 = 𝐸( 𝑃 ) = 𝑝 y 𝜎𝑃2 = 𝑉𝑎𝑟( 𝑃 ) = 𝑛
.
ii) Para n suficientemente grande, por el teorema del límite central, 𝑍 =
𝑃−𝑝
𝑝𝑞
, tiene distribución aproximadamente normal estándar.
√𝑛

Observación 4.6:
𝑝𝑞
1. La aproximación de 𝑃 a la normal 𝑁 (𝑝, ) se cumple cuando la
𝑛
población es infinita y para cualquier tipo de muestreo y, cuando la
población finita y el muestreo es con reemplazamiento.
2. Cuando el muestreo es sin reemplazo en una población finita
𝑁−𝑛
de tamaño N, la varianza es afectada por el factor de corrección, 𝑁−1
.
𝑝𝑞 𝑁−𝑛
Es decir, 𝜎𝑃2 = 𝑉𝑎𝑟( 𝑃 ) = (
𝑛 𝑁−1
).

Ejemplo 4.8: Un encuestador político efectúa un análisis de los


resultados de la muestra para hacer pronósticos para la elección. Suponga
que se trata de una elección con dos candidatos; si un candidato específico
recibe, cuando menos 58% de votos en la muestra, entonces se
pronosticará que ese candidato será el ganador de la elección. Si se
selecciona una muestra aleatoria de 600 votantes, ¿cuál es la probabilidad
de que se pronostique ganador a ese candidato cuando el porcentaje real
de sus votos es 60%?
Distribuciones muestrales e intervalos de confianza 59
Ejemplo 4.9: En un proceso de producción el porcentaje de unidades
defectuosas producidas es 3%. Para controlar el proceso, se revisan
periódicamente los objetos producidos.
a) Calcular aproximadamente la probabilidad de que en una muestra
aleatoria de 180 unidades revisadas se encuentren 5% de defectuosos.
b) Si el proceso de producción se para al encontrar al menos 4% de
unidades producidas defectuosas al revisar muestras aleatorias de 100
objetos cada vez, ¿cuál es la probabilidad de que el proceso continúe si
realmente produce 5% de defectuosos del total de la producción?

4.4.5. DISTRIBUCIÓN MUESTRAL DE LA VARIANZA.


Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una m.a. simple de tamaño n, escogida de una población
normal, 𝑁(𝜇, 𝜎 2 ) y, sean 𝑋 y 𝑆 2 la media y varianza muestral
respectivamente, entonces:

i) Las variables aleatorias 𝑋 y 𝑆 2 son independientes.


2
(𝑛−1)𝑆2 ∑𝑛
𝑖=1(𝑋𝑖 −𝑋 )
ii) La función de la varianza muestral, 𝜎2
= 𝜎2
, tiene
2
distribución 𝜒(𝑛−1) .
60 Estadística para economía
Ejemplo 4.10: Considere una medición física proporcionada por un
instrumento de precisión, donde el interés recae en la variabilidad de la
lectura. Suponga que, en base a la experiencia, la medición es una V.A.
normalmente distribuida con media 10 y desviación estándar 0.1. Si se
toma una muestra aleatoria procedente del proceso de manufactura de los
instrumentos de tamaño 25, ¿cuál es la probabilidad de que el valor de la
varianza muestral sea mayor de 0.014 unidades cuadradas?

4.5. ESTIMACIÓN PUNTUAL DE PARÁMETROS.

4.5.1. Estimador puntual


Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una m.a. de tamaño n de una población de distribución
𝑓(𝑥, 𝜃), donde 𝜃 es el parámetro. El estimador puntual de 𝜃 es
cualquier estadística Θ ̂ = 𝐻(𝑋1 , 𝑋2 , … , 𝑋𝑛 ), cuyo valor 𝜃̂ = 𝐻(𝑥1 , 𝑥2 , … , 𝑥𝑛 )
proporcionará una estimación de 𝜃.
Observación 4.7: Un estimador puntual del parámetro es una variable
aleatoria, mientras que su valor numérico es una estimación puntual.

4.5.2. Insesgadez
̂ = 𝐻(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) es un estimador insesgado del
La estadística Θ
̂ ) = 𝜃, caso contrario es sesgado.
parámetro 𝜃 si 𝐸(Θ
Distribuciones muestrales e intervalos de confianza 61
Observación 4.8: Si un estimador es sesgado de sesgo
̂ ) − 𝜃 y lim 𝑏(𝜃) = 0
𝑏(𝜃) = 𝐸(Θ
𝑛→∞

entonces el estimador es asintóticamente insesgado.

Ejemplo 4.11: Determinar si los siguientes estimadores son o no


insesgados.
̂ = 𝑋 es estimador de p, si 𝑋~𝐵(𝑛, 𝑝). (Freund J. y otros)
a) Θ 𝑛
̂ = 𝑋̅ es estimador de , si 𝐸(𝑋) = 𝜇 y 𝑉𝑎𝑟(𝑋) = 𝜎 2 . (Moya)
b) Θ

4.5.3. Estimador más eficiente


Es el estimador insesgado de menor varianza de entre todos los
estimadores insesgados de un mismo parámetro . (Walpole)
62 Estadística para economía
Ejemplo 4.12: Sea X1, X2, X3 y X4 una m.a. de tamaño cuatro extraídas
de una población de media µ y varianza 𝜎 2 . Considere los siguientes tres
estimadores puntuales de µ:
𝑋1 + 𝑋2 𝑋3 + 𝑋4 𝑋1 + 2𝑋2 + 3𝑋3 + 4𝑋4
𝑇1 = + ; 𝑇2 = ;
6 3 5
𝑋1 + 𝑋2 + 𝑋3 + 𝑋4
𝑇3 =
4
¿Cuál de los estimadores es más eficiente?

4.5.4. Eficiencia
̂ es cualquier estimador insesgado del parámetro  tal que 2
Si Θ
1
̂) =
𝑉𝑎𝑟(Θ 2
𝜕𝑙𝑛𝑓(𝑋; 𝜃)
𝑛𝐸 [( ) ]
𝜕𝜃

̂ es estimador eficiente de . (Canavos)


Entonces se dice que Θ
Ejemplo 4.13: Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una m.a. de una distribución Poisson,
𝑒 −𝜆 𝜆𝑥
𝑝(𝑥; 𝜆) = 𝑥!
, obtener el estimador eficiente de . (Canavos)

2 El lado derecho de la ecuación coincide con la cota de Frechet-Cramer-Rao (Casas)


Distribuciones muestrales e intervalos de confianza 63

4.5.5. Consistencia
̂ es un estimador consistente del parámetro  si y sólo sí
La estadística Θ
para cada c > 0 (Freund)
̂ − 𝜃| < 𝑐) = 1
lim 𝑃(|Θ ̂ − 𝜃| ≥ 𝑐) = 0
ó lim 𝑃(|Θ
𝑛→∞ 𝑛→∞

̂ es insesgado para 𝜃 y lim 𝑉𝑎𝑟(Θ


Observación 4.9: Si Θ ̂ ) = 0 entonces
𝑛→∞
̂ es estimador consistente de .
Θ

Ejemplo 4.14: Sea X1, X2, X3, …, Xn una muestra aleatoria de una
distribución normal. Muestre que la media de la muestra es un estimador
consistente de 𝜇. (Casas)
64 Estadística para economía

4.5.6. Función de verosimilitud


Si 𝑥1 , 𝑥2 , … , 𝑥𝑛 son los valores de una m.a. de una población con parámetro
, la función de verosimilitud de la muestra está dada por:
𝐿(𝜃) = 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 ; 𝜃) = 𝑓(𝑥1 ; 𝜃)𝑓(𝑥2 ; 𝜃) … 𝑓(𝑥𝑛 ; 𝜃)
𝑛

= ∏ 𝑓(𝑥𝑖 ; 𝜃)
𝑖=1
Para los valores de  dentro de un dominio dado. En este caso
𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 ; 𝜃) es el valor de la distribución de probabilidad conjunta o
de la densidad de probabilidad conjunta de las variables aleatorias
𝑋1 , 𝑋2 , … , 𝑋𝑛 en
𝑋1 = 𝑥1 , 𝑋2 = 𝑥2 , … , 𝑋𝑛 = 𝑥𝑛

4.5.7. Suficiencia
Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una m.a. de una distribución con función de probabilidad
𝑓(𝑥; 𝜃). Se dice que la estadística 𝑇 = 𝑢(𝑥1 , … , 𝑥𝑛 ) es suficiente para  si
y solo sí la función de verosimilitud puede factorizarse como3: (Canavos)
𝐿(𝑥1 , 𝑥2 , … , 𝑥𝑛 ; 𝜃) = ℎ(𝑡; 𝜃) ∙ 𝑔(𝑥1 , 𝑥2 , … , 𝑥𝑛 )

Ejemplo 4.15: Muestre que 𝑋 es un estimador suficiente de la media 


de una población normal con varianza conocida 𝜎 2 . (Freund)

3 Factorización de Fisher-Neyman, h y g factores no negativos (Casas).


Distribuciones muestrales e intervalos de confianza 65

4.5.8. Método de máxima verosimilitud.


Consiste en elegir como estimador del parámetro desconocido  aquel
valor 𝜃̂ = 𝐻(𝑥1 , 𝑥2 , … , 𝑥𝑛 ) que hace máxima la función de verosimilitud.
Es decir, consiste en encontrar aquel valor 𝜃̂ = 𝐻(𝑥1 , 𝑥2 , … , 𝑥𝑛 ) tal que:
𝐿(𝑥1 , 𝑥2 , … , 𝑥𝑛 ; 𝜃̂) = 𝑚á𝑥𝐿(𝑥1 , 𝑥2 , … , 𝑥𝑛 ; 𝜃)
Con frecuencia la función de verosimilitud es complicada, y al ser
positiva y coincidir los máximos con los de la función 𝐿 =
𝑙𝑛𝐿(𝑥1 , 𝑥2 , … , 𝑥𝑛 ; 𝜃), por ser la función logaritmo monótona y creciente,
entonces se realizan los cálculos con la función L (Casas).
A este estimador 𝜃̂ = 𝐻(𝑥1 , 𝑥2 , … , 𝑥𝑛 ) se denomina estimador
Máximo-verosímil (MV) o estimador de máxima verosimilitud
del parámetro . Si la distribución de probabilidad tiene varios
parámetros desconocidos, entonces se presentarán varias ecuaciones a
partir de las cuales se obtiene las estimaciones de los parámetros. (Moya)
66 Estadística para economía
Ejemplo 4.16: Para la distribución Bernoulli de parámetro p, obtener el
estimador MV. (Casas)

Ejemplo 4.17: Para la distribución normal, obtener los estimadores MV


de 𝜇 y 𝜎 2 . (Canavos)
Distribuciones muestrales e intervalos de confianza 67
Ejemplo 4.18: Para la distribución 𝑈(0, 𝜃), obtener el estimador MV de
𝜃. (Casas)

4.6. PROBLEMAS PROPUESTOS.


4.19. En el m.a. estratificado, los estratos entre sí son _____________
4.20. De una población que se distribuye normalmente con media 15 y
desviación 5 se extrae la m.a. 𝑋1 , 𝑋2 , … , 𝑋15 , ¿cómo se distribuye 𝑋 =
1 15
∑ 𝑋?
15 𝑖=1 𝑖
4.21. De una población normal de media 6 y varianza 36 se selecciona la
m.a. 𝑋1 , 𝑋2 , … , 𝑋9 . Si 𝑋 es la media de la muestra aleatoria:
a) Describa la distribución de probabilidades de 𝑋.
b) Si Y = 3X – 5, calcular 𝑃( 𝑌 > 28).
4.22. El número de horas de duración de una pila para transistores tiene
una distribución normal con media de 120 horas y desviación 20
horas. Si se seleccionan muestras aleatorias de 20 pilas:
a) ¿Qué proporción de las medias muestrales estará entre 120 y 145
horas?
b) ¿Por debajo de qué valor en horas caerá el 95% de las medias
muestrales?
c) ¿Dentro de qué límites caerá el 99% de las medias muestrales
alrededor de la media de la población?
68 Estadística para economía
4.23. La vida útil (en miles de horas) de una batería es una variable
aleatoria X con función de densidad:
2 − 2𝑥; 0 ≤ 𝑥 < 1
𝑓(𝑥) = {
0; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Si 𝑋36 es la media de la m.a. 𝑋1 , 𝑋2 , … , 𝑋36 escogida de X, ¿con qué
probabilidad 𝑋36 es mayor que 420 horas?
4.24. Una compañía tiene un número grande de empleados. La
probabilidad de que un empleado seleccionado aleatoriamente
participe de un programa de inversión de acciones de compañía es
0.3. Si se escoge aleatoriamente 20 empleados:
a) ¿Cuál es la probabilidad que la proporción de participantes sea
exactamente 0.7?
b) ¿Cuál es la probabilidad que la proporción de participantes sea
por lo menos 0.8?
4.25. Se estima que el 40% de los votos de los electores de la ciudad
favorecen al candidato A:
a) Si se selecciona una muestra aleatoria de 600 electores de la
ciudad, ¿qué probabilidad hay de que la proporción muestral de
votos a favor del candidato A esté entre 37% y 45%?
b) ¿Qué tamaño de muestra se debería escoger si se quiere tener una
probabilidad igual a 0.97 de que la proporción de votos a favor
del candidato A en la muestra no se diferencie de su proporción
estimada en más del 2%?
4.26. Si 𝑋1 , 𝑋2 , … , 𝑋8 son 8 VV.AA. independientes y distribuidas cada una
2
según 𝑁(10, √32 ), calcular la probabilidad de que la varianza
1 2
muestral 𝑆 2 = 7 ∑(𝑋𝑖 − 𝑋 ) sea menor o igual que 56.28.

4.27. Un fabricante de baterías para automóviles garantiza que sus


baterías durarán, en promedio, 3 años con una desviación estándar
de un año. Si 5 de estas baterías tienen duraciones de 1.9, 2.4, 3, 3.5
y 4.2 años, ¿está el fabricante convencido aún que sus baterías
tienen una desviación estándar de 1 año?
4.28. Si se extrae una muestra aleatoria de tamaño n de una población de
distribución exponencial, obtener el estimador de máxima
verosimilitud de  y demostrar que es suficiente para .
Distribuciones muestrales e intervalos de confianza 69
4.29. Si 𝑋1 , 𝑋2 , … , 𝑋𝑛 es una m.a. de X tal que:
1 + 𝜃𝑥
𝑓(𝑥) = { 2 ; −1 ≤ 𝑥 ≤ 1; |𝜃| ≤ 1
0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Determinar si 𝑇 = 3𝑋 es consistente para .

4.30. Sean 𝑋1 media de una muestra aleatoria de tamaño n de una


población 𝑁(𝜇, 𝜎12 ) y 𝑋2 media de una muestra aleatoria de tamaño
n de una población 𝑁(𝜇, 𝜎22 ). Si las dos muestras son
independientes:
a) Demuestre que 𝑇 = 𝑤𝑋1 + (1 − 𝑤)𝑋2 con 0 ≤ 𝑤 ≤ 1 es insesgado
para .
b) Demuestre que T es consistente para .
c) Determine el valor de 𝑤 = ℎ(𝜎12 , 𝜎22 ) que hace que 𝑣𝑎𝑟(𝑇) sea
mínimo.
4.31. Sea e el error máximo de estimación para estimar  mediante 𝑋, en
una población finita de tamaño N. Demuestre que con un nivel de
confianza del (1 − 𝛼) × 100%:
2
𝑧𝛼/2 𝜎2𝑁
𝑛= 2
𝑧𝛼/2 𝜎 2 + 𝑒 2 (𝑁 − 1)

4.32. Si 𝑋1 , 𝑋2 , … , 𝑋𝑛 y 𝑌1 , 𝑌2 , … , 𝑌𝑛 son muestras aleatorias independientes


de poblaciones con medias 𝜇1 y 𝜇2 y varianzas 𝜎12 = 𝜎22 = 𝜎 2 ,
respectivamente. Demuestre que
2 2
∑𝑛𝑖=1(𝑋𝑖 − 𝑋) + ∑𝑛𝑖=1(𝑌𝑖 − 𝑌)
𝑇=
2(𝑛 − 1)
2
Es consistente de 𝜎 .
4.33. Si 𝑋1 , 𝑋2 , … , 𝑋𝑛 es una m.a. de X tal que:
2𝑥 𝑥 2
𝑓(𝑥) = {( 𝜃 ) 𝑒 ; 𝑥 > 1; 𝜃 > 0
𝜃

0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Determinar si 𝑇 = ∑𝑛𝑖=1 𝑥𝑖2 es suficiente para .
4.34. Sea X una V.A. binomial, B(n, p). Se considera un estimador de p al
𝑋
estadístico 𝑝̂ = 𝑛 (insesgado), donde 𝑋̅ es la media muestral de
muestras aleatorias de tamaño n. Demuestre que 𝑝̂ es eficiente para
p.
70 Estadística para economía
4.35. En una muestra aleatoria de 100 seleccionados de una gran
población, 30 están a favor del producto A, 38 a favor de B y 32 a
favor de C. Obtener la estimación de máxima verosimilitud para las
proporciones de las personas a favor de los productos A, B y C,
respectivamente.

4.7. ESTIMACIÓN DE PARÁMETROS POR


INTERVALOS.
Debido a que la estimación de un punto no indica que tan próximo está la
estimación al parámetro que se estima, la estimación no es muy
significativa sino se tiene alguna medida de error que se comete en la
estimación. En tal sentido, es deseable tener cierto grado de confianza de
que la estimación del punto se encuentre dentro de cierta variación.

4.7.1. INTERVALO DE CONFIANZA PARA 𝝁 CUANDO LA


VARIANZA SUPUESTA ES CONOCIDA.

Si 𝑥̅ es el valor de 𝑋 para una muestra aleatoria de tamaño n escogida de


una población con varianza conocida 𝜎 2 , el intervalo de confianza del
(1 − 𝛼) × 100% para 𝜇 es:
𝜎 𝜎
𝑥̅ − 𝑧𝛼 ≤ 𝜇 ≤ 𝑥̅ + 𝑧𝛼
2 √𝑛 2 √𝑛

Observación 4.10:
𝜎2
1. Para población normal, 𝑋~𝑁 (𝜇, 𝑛
) si 𝑛 ≥ 2, caso contrario 𝑛 ≥ 30.

2. La desviación estándar del estimador se denomina error estándar.


Distribuciones muestrales e intervalos de confianza 71
3. Cuando la población es finita de tamaño N, con varianza conocida, el
intervalo del (1 − 𝛼) × 100% para  es:

𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
𝑥̅ − 𝑧𝛼 √ ≤ 𝜇 ≤ 𝑥̅ + 𝑧𝛼 √
2 √𝑛 𝑁 − 1 2 √𝑛 𝑁 − 1

4. El tamaño de muestra para estimar  es:


𝑧𝛼 𝜎 2
2
𝑛=( ) ó
𝑒
2
𝑁𝑧𝛼/2 𝜎2
𝑛= 2 ; 𝑒: error máximo de estimación
(𝑁 − 1)𝑒 2 + 𝑧𝛼/2 𝜎2

Ejemplo 4.34: Una muestra aleatoria de 200 hogares de la ciudad de


Chiclayo indica que el promedio de los ingresos mensuales es 1250 soles.
Halle el intervalo de confianza del 95% para la media poblacional de los
ingresos de todos los hogares de dicha ciudad. Suponga  = 320 soles.

Ejemplo 4.35: Un especialista en investigación de mercados selecciona


una muestra aleatoria de 150 clientes de un total de 750 clientes de un
supermercado que declaran ingresos mensuales superiores a 4800 soles.
Él encuentra que los clientes de la muestra gastaron en la tienda en
promedio 2200 soles y sabe que la desviación estándar de la población es
500 soles. Si con la información de la muestra se estima que el gasto
promedio de la población finita varía de 2120.71 a 2279.29 soles, ¿qué
nivel de confianza se utilizó?
72 Estadística para economía

Ejemplo 4.36: En el ejemplo 4.34, calcule el tamaño de muestra si el


error de estimación no es mayor de 35 soles.

Ejemplo 4.37: En el ejemplo 4.35, se tiene una confianza del 95% de que
al estimar la media de la población, el error de la estimación no será mayor
de 110 soles. Halle el tamaño de la muestra.

4.8. INTERVALO DE CONFIANZA PARA 𝝁 CUANDO LA


VARIANZA SUPUESTA ES DESCONOCIDA.

4.8.1. INTERVALO DE CONFIANZA para población no


normal.
Si la población no es normal, pero 𝑛 ≥ 30, se sustituye s por  en
las dos expresiones anteriores.
Ejemplo 4.38: Una compañía de seguros emplea 500 agentes de ventas
a nivel nacional. En una muestra aleatoria de 30 cuentas de gastos de
representación en una semana del mes marzo, los auditores encuentran
que un gasto promedio de 1100 soles y una desviación estándar de 120
soles. Halle un intervalo de confianza del 99% para la cantidad promedio
de gastos.
Distribuciones muestrales e intervalos de confianza 73

4.8.2. INTERVALO DE CONFIANZA para población normal.


Si la población es normal el intervalo del (1 − 𝛼) × 100% para
 es:
𝑠 𝑠
𝑥̅ − 𝑡(𝛼,𝑛−1) ≤ 𝜇 ≤ 𝑥̅ + 𝑡(𝛼,𝑛−1)
2 √𝑛 2 √𝑛
Ejemplo 4.39: Un fabricante de una determinada marca de vehículos de
lujo sabe que el consumo de gasolina de sus vehículos se distribuye
normalmente. Se selecciona una muestra aleatoria y se observa el
consumo cada 100 km., obteniendo los siguientes datos.
19.2 19.4 19.1 18.8 19.8 20.5
20.7 20.2 19.5 19.9 18.9 19
Encuentre un intervalo de confianza del 99% para el consumo medio de
gasolina de todos los vehículos de esa marca.
74 Estadística para economía
4.9. INTERVALO DE CONFIANZA PARA LA
PROPORCIÓN, 𝒑.
Si se extrae una m.a. 𝑋1 , 𝑋2 , … , 𝑋𝑛 de tamaño n, seleccionada de una
población Bernoullí y 𝑝 es la proporción en la muestra, el intervalo del
(1 − 𝛼) × 100% para p es:

𝑝̅ ∙ 𝑞̅ 𝑝̅ ∙ 𝑞̅
𝑝̅ − 𝑧𝛼 √ ≤ 𝑝 ≤ 𝑝̅ + 𝑧𝛼 √
2 𝑛 2 𝑛

Observación 4.11: Si el muestreo es sin reemplazo en una población


𝑝̅ ∙𝑞̅ 𝑁−𝑛
finita de tamaño N, el error estándar estimado es √ 𝑛

𝑁−1
. Para estimar
la proporción, el tamaño de muestra es
2 2
𝑧𝛼/2 𝑝𝑞 𝑁𝑧𝛼/2 𝑝𝑞
𝑛= ó 𝑛=
𝑒2 (𝑁 − 1)𝑒 2 + 𝑧 2 𝑝𝑞
Ejemplo 4.40: Un fabricante asegura, a una compañía que le compra un
producto en forma regular, que el porcentaje de productos defectuosos no
es mayor del 5%. La compañía decide comprobar la afirmación del
fabricante seleccionando, de su inventario, 250 unidades de este producto
y probándolas. ¿Deberá sospechar la compañía de la afirmación del
fabricante si se descubren un total de 20?

Ejemplo 4.41: Como empleado recién contratado en la división de


mercadeo para un importante asunto sobre ventas minoristas, a usted se
le ha asignado la tarea de estimar la proporción de consumidores que
prefieren su producto al de la competencia. ¿Cuántos consumidores se
deben tomar en la muestra si usted desea restringir el error al 10%, pero
desea proporcionar un nivel de confianza del 99%?
Distribuciones muestrales e intervalos de confianza 75

4.10. INTERVALO DE CONFIANZA PARA LA VARIANZA,


𝝈𝟐 .
Si se extrae una m.a. 𝑋1 , 𝑋2 , … , 𝑋𝑛 de tamaño n, seleccionada de una
población normal con varianza desconocida, 𝜎 2 , y si 𝑠 2 es la varianza de
la muestra, el intervalo del (1 − 𝛼) × 100% para 𝜎 2 es:
(𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
2 ≤ 𝜎2 ≤ 2
𝜒(𝛼/2,𝑛−1) 𝜒(1− 𝛼/2,𝑛−1)

Ejemplo 4.42: Se selecciona una muestra aleatoria de 10 empleados de


una compañía, se registra el salario anual de cada empleado de la muestra
y se calcula la media y la varianza muestral de los salarios (en soles),
obteniéndose respectivamente 14400 soles y 40000 soles 2. Si se sabe que
la distribución de los salarios es normal, construya un intervalo de
confianza del 90% para la varianza poblacional.
76 Estadística para economía
4.11. PROBLEMAS PROPUESTOS
4.43. Un analista de investigación de mercados escoge una muestra
aleatoria de 130 clientes de un conjunto de 600 clientes de una gran
tienda que declaran ingresos mayores a s/5000. Él encuentra que
los clientes de la muestra gastaron en la tienda un promedio de
s/2500. Si con este valor de la muestra se estima que el gasto
promedio de la población finita varía de 2446 a 2554, ¿qué nivel de
confianza se utilizó? Suponga que la desviación estándar de la
población es s/300.
4.44. Los contenidos de una muestra aleatoria de 10 latas de café
instantáneo de un productor han dado los siguientes pesos netos en
gramos. Suponga una distribución normal:
280 290 295 285 275
277 284 287 292 289
a) Encuentre un intervalo de confianza del 95% para la media de los
contenidos de todas las latas de café del productor.
b) ¿Con qué nivel de confianza se estima que el contenido promedio
de café tenga los límites de confianza 279.584 y 291.216?
c) Obtenga un intervalo de confianza al 98% para la desviación
estándar.
4.45. Una encuestadora utilizo una muestra aleatoria de 480 amas de casa
que acaban de realizar una compra en un supermercado de mucha
afluencia y encontró que 180 compraron el producto A.
a) Estimar el porcentaje de amas de casa que adquieren el producto
A en toda la población, utilizando un nivel de significancia del
5%.
b) Si la proporción de amas de casa que prefieren el producto A se
estima en 37.5%, ¿cuánto es el error máximo de estimación, si se
quiere tener una confianza del 98%?
c) Si con la misma muestra la proporción de amas de casa que
prefieren el producto B se estima en 35% con una confianza del
98% y con un error máximo del 4.62%, ¿se puede afirmar que el
producto A es el más preferido?
d) ¿Cuál es el tamaño de la muestra si se desea tener una confianza
del 93% de que el error de estimación de p no sea superior al 2%?
Distribuciones muestrales e intervalos de confianza 77
4.46. El director de la oficina de colocación de una escuela de
administración de empresas quiere estimar los sueldos anuales
medios que perciben los licenciados cinco años después. Una
muestra aleatoria de 25 licenciados tenía una media muestral de
$42470 y una desviación típica muestral de $4780. Halle el
intervalo de confianza de la media poblacional al 90%, suponiendo
que la población sigue una distribución normal.
4.47. En un estudio socioeconómico se tomó una muestra aleatoria de 100
comerciantes informales y se encontró que el ingreso medio es de
$600, la desviación estándar de $50 y sólo el 30% tienen ingresos
superiores a $800.
a) Estimar la proporción de todos los comerciantes con ingresos
superiores a $800, mediante un intervalo de confianza del 98%.
b) Si la proporción de todos los comerciantes con ingresos
superiores a $800 se estima entre 20.06% y 39.94%, ¿qué grado
de confianza se utilizó?
4.48. Un fabricante está preocupado por la variabilidad de los niveles de
impurezas de los envíos de una materia prima de un proveedor. Una
muestra aleatoria de 15 envíos ha mostrado una desviación típica de
2.36 en la concentración de los niveles de impurezas. Suponga que
la población sigue una distribución normal.
a) Halle el intervalo de confianza al 95 por ciento de la varianza
poblacional.
b) ¿Sería el intervalo de confianza al 99 por ciento de esta varianza
mayor o menor que el obtenido en el apartado (a)?
4.49. Se escoge una muestra aleatoria de 13 tiendas y se encuentra que las
ventas semanales de un determinado producto de consumo popular
tienen desviación estándar de $6. Se supone que las ventas del
producto tienen una distribución normal. Estimar la varianza y la
desviación estándar poblacional mediante un intervalo de confianza
al 95%.
4.50. Una empresa de material eléctrico fabrica bombillas que tienen una
duración distribuida de forma aproximadamente normal, con una
desviación estándar de 40 horas. Si una muestra de 30 bombillas
tiene una duración promedio de 780 horas, calcule un intervalo de
confianza del 95% para la media de la población de todas las
bombillas producidas por esta empresa.
78 Estadística para economía
4.51. Suponga que obtenemos una sola observación Y de una distribución
exponencial con media . Use Y para construir un intervalo de
confianza para  con un coeficiente de confianza de 0.90.
4.52. Una muestra aleatoria de 10 barras energéticas de chocolate de
cierta marca tiene, en promedio, 230 calorías por barra y una
desviación estándar de 15 calorías. Construya un intervalo de
confianza del 99% para el contenido medio verdadero de calorías de
esta marca de barras energéticas de chocolate. Suponga que la
distribución del contenido calórico es aproximadamente normal.
4.53. Calcule intervalos de confianza del 95% para la proporción de
artículos defectuosos que resultan de un proceso cuando se
encuentra que una muestra de tamaño 100 produce 8 defectuosos.
4.54. Una muestra aleatoria de 20 estudiantes obtuvo una media de 72 y
una varianza de 16 en un examen universitario de matemáticas.
Suponga que las calificaciones se distribuyen normalmente y con
base en esto construya un intervalo de confianza del 95% para la
varianza.
4.55. El representante de la empresa “El economista” indica que las cajas
de cereal que producen contienen 160 gramos. Un inspector de
INDECOPI tomó una muestra aleatoria de 15 cajas para calcular los
pesos en gramos y algunos de sus resultados fueron

∑ 𝑥𝑖 = 2386.5 ; ∑ 𝑥𝑖2 = 379699

¿El inspector multa a la empresa? Justifique su respuesta con un


intervalo del 95% de confianza. Defina variables y considere los
supuestos para el cálculo sea válido.
Capítulo 5: Prueba de
hipótesis
Si se desea determinar si los salarios son superiores en una ciudad
respecto a otra para una misma actividad, o si la mayoría de los
consumidores de un determinado sector económico son optimistas sobre
la economía del país, o si el grado de instrucción impacta en el ingreso de
los trabajadores. En estos casos, el interés radica en hacer inferencia sobre
cómo el valor de un parámetro se relaciona con un valor numérico
específico, ¿es menor, igual o mayor que un número establecido? Cuando
se trata de este tipo de inferencia, se está frente a una prueba de hipótesis
paramétrica. En el capítulo anterior se vio cómo se puede utilizar la
información muestral para obtener una estimación mediante un intervalo
de confianza para el parámetro de una población. Frente a estas dos
opciones de hacer inferencia, ¿cuál se utiliza? depende de la pregunta que
se plantee. Por ejemplo, si se desea conocer las cantidades vendidas para
usarla como base para un plan de almacenamiento, entonces sería
apropiado un cálculo de intervalo. Por el contrario, si se desea saber si las
ventas han cambiado, entonces usaríamos una prueba de hipótesis.

En este capítulo se desarrollan los conceptos sobre prueba de


hipótesis, así como las pruebas de hipótesis de algunos parámetros.

5.1. HIPÓTESIS ESTADÍSTICAS.


Es cualquier afirmación que se hace acerca de la distribución de una o más
poblaciones.
80 Estadística para economía
Observación 5.1: Cuando la hipótesis se refiere a un parámetro se trata
de un contraste paramétrico, pero si se refiere a la forma de la función
de distribución o de densidad se trata de un contraste no
paramétrico.

5.5.1. Hipótesis nula


Se representa por 𝐻0 , a la hipótesis que es aceptada provisionalmente
como verdadera y se somete a comprobación experimental para
determinar su validez.

5.5.2. Hipótesis alternativa


Se representa por 𝐻1 , a la hipótesis que se acepta en caso 𝐻0 sea rechazada.

Observación 5.2: Cuando 𝐻0 se refiere a un parámetro generalmente


será establecida en forma tal que especifique un valor exacto del
parámetro, mientras que 𝐻1 admite la posibilidad de varios valores.
Prueba de hipótesis 81
Observación 5.3: La aceptación de una hipótesis significa que los datos
de la muestra no proporcionan evidencia suficiente para refutarla. El
rechazo significa que los datos de la muestra lo refutan.

5.5.3. Tipo de prueba o contraste


Se denomina prueba o contraste de una cola o unilateral a toda
prueba de hipótesis donde 𝐻1 es unilateral (menor o mayor que). Si 𝐻1 es
bilateral (diferente) se denomina contraste bilateral.

5.5.4. Error tipo I


Se dice que se comete error tipo I cuando se rechaza 𝐻0 siendo
verdadera. La probabilidad de cometer este error se denota con .

5.5.5. Error tipo II


Se dice que se comete error tipo II cuando se acepta 𝐻0 siendo falsa. La
probabilidad de cometer este error se denota con .
Observación 5.4: Las posibles situaciones que pueden darse al probar
una hipótesis estadística son:

𝐻0 es verdadera 𝐻0 es falsa
Decisión correcta Error tipo II
Se acepta 𝐻0
Probabilidad: 1 − 𝛼 Probabilidad: 𝛽
Error tipo I Decisión correcta
Se rechaza 𝐻0
Probabilidad: 𝛼 Probabilidad: 1 − 𝛽

5.5.6. Potencia de la prueba


La probabilidad de rechazar 𝐻0 cuando es falsa se denomina potencia
del contraste o potencia de la prueba, 1 − 𝛽.

5.5.7. Nivel de significación


Es la probabilidad de cometer un error tipo I, 𝛼.
82 Estadística para economía
5.5.8. Tipo de región de decisión
La región crítica está constituida por el conjunto de muestras para las
cuales se rechaza 𝐻0 y, la región complementaria se denomina región de
aceptación.

5.5.9. Valor crítico


Es el valor o valores que separan la región crítica de la región de
aceptación.
Observación 5.5: El gráfico de la región de aceptación y crítica depende
del tipo de contraste que se realice.

5.2. PROCEDIMIENTO PARA REALIZAR UNA PRUEBA


DE HIPÓTESIS.
1. Formular las hipótesis, 𝐻0 y 𝐻1 .
2. Especificar el nivel de significancia, .
3. Determinar el estadístico de prueba apropiado.
4. Determinar la región crítica y establecer la regla de decisión.
5. Calcular el valor del estadístico de prueba con los datos de la muestra.
6. Decidir si se acepta o no 𝐻0 , según la ubicación del valor del estadístico
de prueba.

5.3. EMPLEO DE LOS VALORES P


Otro método que se suele usar para decidir si se acepta o no 𝐻0 se basa en
el valor p o p-value, también llamado nivel observado de significancia.
El valor p se define como la probabilidad de obtener un resultado al
menos tan extremo como el que realmente se ha obtenido (valor del
estadístico calculado), suponiendo que la hipótesis nula es cierta. Es
fundamental tener en cuenta que el valor p está basado en la asunción de
la hipótesis de partida (o hipótesis nula).
Prueba de hipótesis 83
Se rechaza 𝐻0 si el valor p asociado al resultado observado es
igual o menor que el nivel de significación establecido, caso
contrario se acepta. Es decir, el valor p nos muestra la probabilidad
de haber obtenido el resultado que hemos obtenido si suponemos que la
hipótesis nula es cierta. Si el valor p es inferior al nivel de significación
nos indica que lo más probable es que la hipótesis de partida sea falsa.

5.4. PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA:


VARIANZA 𝝈𝟐 SUPUESTA DESCONOCIDA

5.4.1. Si la población NO tiene distribución normal


Para probar hipótesis acerca de la media , donde la distribución de
datos no se ajusta a una normal, sólo si n  30, se utiliza la
𝑋−𝜇0
estadística de prueba 𝑧= 𝑠 cuya distribución es
√𝑛
aproximadamente N(0, 1).

5.4.2. Si la población tiene distribución normal,


Si la distribución de datos se ajusta a una normal, para n  2, la
𝑋−𝜇0
estadística de prueba acerca de la media  es 𝑇 = 𝑠 , cuya
√𝑛
distribución es t-Student con n – 1 grados de libertad.
Observación 5.6: En caso 𝜎 2 sea conocida, para población normal (n  2)
o no (n  30), la estadística de prueba es Z. Además, el estadístico de prueba
es el mismo para cualquier tipo de prueba de hipótesis (unilateral o
bilateral).
Ejemplo 5.1: Por experiencia se sabe que peso de paquetes de 8 onzas de
galletas sigue una distribución normal con desviación estándar de 0.16
onzas. Para comprobar si su producción está bajo control en un día dado
los empleados seleccionan una muestra aleatoria de 25 paquetes y
encuentran que la media es 8.091 onzas. Determinar si la empresa que
produce el producto se afecta a sí misma o a consumidor con un nivel de
confianza del 99% (Freund).
84 Estadística para economía

Ejemplo 5.2: Las especificaciones para cierta clase de cinta piden una
media de la resistencia al rompimiento de 185 libras. Si se selecciona
aleatoriamente piezas de diferentes rodillos y la resistencia al
rompimiento es: 171.6; 191.8; 178.3; 184.9 y 189.1 libras, ¿se puede afirmar
que la clase de cinta cumple las especificaciones? (Freund).

5.5. PRUEBA DE HIPÓTESIS ACERCA DE LA RAZÓN


DE DOS VARIANZAS
Sean 𝑆12 y 𝑆22 las varianzas de dos muestras aleatorias independientes de
tamaños n1 y n2 elegidas de dos poblaciones normales cuyas varianzas
desconocidas respectivas son 𝜎12 y 𝜎22 . Si se supone verdadera 𝐻0 : 𝜎12 = 𝜎22 ,
𝜎12 𝑆12
equivalentemente 𝐻0 : = 1 entonces la estadística de prueba es 𝐹 = tal
𝜎22 𝑆22
que 𝐹~𝐹(𝑛1 −1,𝑛2 −1).
Prueba de hipótesis 85
1
Observación 5.7: 𝐹(𝑛1 −1,𝑛2 −1,1−𝛼) = .
𝐹(𝑛2 −1,𝑛1 −1,𝛼)

Ejemplo 5.3: Al comparar la variabilidad de la resistencia a la tracción


de dos clases de acero estructural, un experimento dio los siguientes
resultados: 𝑛1 = 13; 𝑠12 = 19.2; 𝑛2 = 16; 𝑠22 = 3.5, donde las unidades de
medición son en miles de libras por pulgadas cuadradas. Si las mediciones
son variables independientes de dos poblaciones normales y usted
necesita adquirir barras de acero, ¿de qué tipo adquiere? (Freund)

5.6. PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS

5.6.1. Si se supone conocidas las varianzas poblacionales

Sean 𝑋1 y 𝑋2 las medias de dos muestras aleatorias independientes


de tamaños n1 y n2 respectivamente, seleccionadas de dos
poblaciones independientes, con medias 𝜇1 y 𝜇2 , y varianzas 𝜎12 y 𝜎22
respectivas, supuestas conocidas.
➢ Si las dos poblaciones son normales

Las estadísticas 𝑋1 y 𝑋2 tienen, respectivamente, distribución


𝜎12 𝜎22
normal 𝑁 (𝜇1 , 𝑛 ) y 𝑁 (𝜇2 , 𝑛 ) para n1, n2  2. Luego, la estadística
1 2
𝜎2 𝜎2
𝑋1 − 𝑋2 tienen distribución normal 𝑁 (𝜇1 − 𝜇2 , 𝑛1 + 𝑛2 ).
1 2
86 Estadística para economía
➢ Si las dos poblaciones NO son normales

Para n1, n2  30, la estadística 𝑋1 − 𝑋2 tienen distribución


𝜎2 𝜎2
aproximadamente normal 𝑁 (𝜇1 − 𝜇2 , 𝑛1 + 𝑛2 ).
1 2

Para ambos casos, si se supone verdadera la hipótesis nula


𝐻0 : 𝜇1 = 𝜇2 o equivalentemente 𝐻0 : 𝜇1 − 𝜇2 = 0, la estadística de
prueba es:
𝑥1 − 𝑥2
𝑍=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2
Observación 5.8: Cuando la diferencia de medias es d, la estadística de
prueba es:
𝑥1 − 𝑥2 − 𝑑
𝑍=
𝜎2 𝜎2
√ 1 + 2
𝑛1 𝑛2

Ejemplo 5.4: El gerente de ventas de la empresa R&A analiza las técnicas


de venta A y B. Para tal fin selecciona dos muestras aleatorias
independientes de 50 y 60 vendedores y, aplica respectivamente las
técnicas. Al final de un mes el número de ventas por vendedor generó las
medias de 62 y 66 y, varianzas de 100 y 225 respectivamente (Córdova)
a) Al 5% de significancia, ¿existe suficiente evidencia para afirmar que la
técnica B es mejor?
b) Al 5% de significancia, ¿se puede afirmar que la media de B es mayor
que la media de A en más de 3?
Prueba de hipótesis 87

5.6.2. Si se supone desconocidas las varianzas


poblacionales
➢ Si las dos poblaciones NO son normales
En el estadístico de prueba de la sección anterior se hace el cambio de
varianzas poblacionales por muestrales sólo si n1, n2  30.
Ejemplo 5.5: En una muestra aleatoria de 70 folletos en los que se
revelan las predicciones sobre las ventas de acciones, el cociente medio
entre la deuda y el capital propio antes de la oferta es 3.97 y la desviación
típica muestral es 6.14. En una muestra aleatoria independiente de 51
folletos en los que no se revelan las predicciones sobre las ventas, el
cociente medio entre la deuda y el capital propio es 2.86 y la desviación
típica muestral es 4.29. Al 5% de significancia, ¿las medias poblacionales
de los cocientes de los que no revelan las predicciones sobre las ventas y
los de las que sí las revelan son diferentes? (Newbold y otros)
88 Estadística para economía
➢ Si las dos poblaciones son normales e independientes
En este caso primero se realiza prueba de varianzas para determinar
si estas son iguales o diferentes.
✓ Si las varianzas son desconocidas e iguales: 𝝈𝟐𝟏 = 𝝈𝟐𝟐 =
𝝈𝟐
La estadística:

𝑋1 − 𝑋2 − (𝜇1 − 𝜇2 ) (𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22


𝑇= ; con 𝑆𝐶2 =
1 1 𝑛1 + 𝑛2 − 2
√𝑆𝐶2 ( + )
𝑛1 𝑛2
tiene distribución t-student con n1 + n2 – 2 grados de libertad.
Si se supone verdadera la hipótesis nula, 𝐻0 : 𝜇1 − 𝜇2 = 0,
la estadística de prueba es:
𝑥1 − 𝑥2
𝑡=
1 1
√𝑆𝐶2 ( + )
𝑛1 𝑛2
Ejemplo 5.6: Diez barras de acero fabricadas por un proceso A tienen
una fuerza de ruptura media de 50 y desviación estándar 10, mientras que
8 fabricadas por un proceso B tienen fuerza de ruptura media de 55 con
desviación estándar de 12. Si la distribución de fuerzas de ruptura es
normal con igual varianza, ¿los dos procesos producen barras de acero con
igual fuerza de ruptura? (Moya)
Prueba de hipótesis 89
✓ Si las varianzas son desconocidas y distintas 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐
La estadística:
𝑋1 − 𝑋2 − (𝜇1 − 𝜇2 )
𝑇=
𝑠2 𝑠2
√ 1+ 2
𝑛1 𝑛2

tiene distribución t-student con r grados de libertad, donde:


2
𝑠12 𝑠22
( + )
𝑛1 𝑛2
𝑟= 2 2
𝑠2 𝑠2
(𝑛1 ) (𝑛2 )
1 2
𝑛1 − 1 + 𝑛2 − 1
Si r no es entero, se redondea al entero más cercano.
Si se supone verdadera la hipótesis nula, 𝐻0 : 𝜇1 − 𝜇2 = 0,
la estadística de prueba es:
𝑥1 − 𝑥2
𝑡=
𝑠2 𝑠2
√ 1+ 2
𝑛1 𝑛2
Ejemplo 5.7: En un estudio se compararon los niveles de ácido ascórbico
en plasma en mujeres embarazadas fumadoras con los de no fumadoras.
Se seleccionaron 32 mujeres que estuvieran en los últimos 3 meses de
embarazo, que no tuvieran padecimientos importantes y que sus edades
fluctuaran entre los 15 y los 32 años. Antes de tomar muestras de 20 ml
de sangre se pidió a las participantes que fueran en ayunas, que no
tomaran suplementos vitamínicos y que evitaran alimentos con alto
contenido de ácido ascórbico. A partir de las muestras de sangre se
determinaron los siguientes valores de ácido ascórbico en el plasma de
cada mujer, en miligramos por 100 mililitros: (Walpole)
0.97 1.16 0.72 0.86 1 0.85 0.81 0.58
No
0.9 0.92 0.74 0.78 0.62 0.57 1.32 0.64
fumadoras
1.24 0.98 0.99 1.09 0.88 1.24 0.94 1.18
Fumadoras 0.48 0.71 0.98 0.68 1.18 1.36 0.78 1.64
¿Existe suficiente evidencia para concluir que hay una diferencia entre los
niveles de ácido ascórbico en plasma de mujeres fumadoras y no
fumadoras?
90 Estadística para economía
Prueba de hipótesis 91
5.7. PROBLEMAS PROPUESTOS
5.8. La afirmación: La distribución de datos se ajusta a una distribución
exponencial, corresponde al tipo de hipótesis _______________
5.9. Halle la región crítica de la prueba de hipótesis 𝐻0 : 𝜇 = 50 contra
𝐻1 : 𝜇 < 50, si la población es normal con varianza desconocida. Si se
sabe que n = 9 y el nivel de significancia es 1%.
5.10. Si 𝑋1 ~𝑁(𝜇1 , 22 ) y 𝑋2 ~𝑁(𝜇2 , 22 ) son poblaciones independientes de
donde se extraen muestras de tamaño 12 y 16 respectivamente,
entonces el estadístico que se usa para probar H0: 1 = 2 es ______
debido a que _____________________________________
5.11. El nivel de significación o de significancia es la probabilidad de:
a) Rechazar 𝐻0 cuando ésta es falsa.
b) Rechazar 𝐻0 dado que 𝐻0 es verdadera.
c) No rechazar 𝐻0 cuando 𝐻0 es falsa.
d) No rechazar 𝐻0 dado que 𝐻0 es verdadera.
5.12. Un determinado proceso de empacar un producto que está
controlado, si el peso medio del producto empacado es 500 gramos.
Si en una muestra aleatoria de 90 paquetes del producto se ha
encontrado que el peso medio es de 495 gramos, ¿se puede concluir
que el proceso está fuera de control al nivel de significancia del 5%?
Suponga que el peso de los productos empacados se distribuye
normalmente con desviación estándar de 15 gramos.
5.13. Un gran centro comercial que opera en la capital estudia la
posibilidad de abrir una sucursal en la provincia de Sechura, la
gerencia establece el siguiente criterio para tomar la decisión: abrir
la sucursal sólo si el ingreso promedio familiar mensual en dicha
provincia no es menos de s/.1500 y no abrirla en caso contrario. Si
una muestra aleatoria de 120 ingresos familiares de esa provincia ha
dado una media de s/. 1400. Suponga que la distribución de los
ingresos tiene una desviación estándar igual a s/. 450.
a) ¿Cuál es la decisión a tomar al nivel de significancia del 5%?
b) ¿Con qué probabilidad la prueba anterior detecta la diferencia de
s/. 140 en el promedio de ingresos y por debajo de lo que se indica
en la hipótesis nula?
c) Calcular la potencia de la prueba si el ingreso promedio
realmente es s/. 1320.
92 Estadística para economía
5.14. Una empresa que recibe envíos de pilas comprueba una muestra
aleatoria de 9 antes de aceptar un envío. Quiere que la verdadera
duración media de todas las pilas del envío sea al menos de 50 horas.
Sabe por experiencia que la distribución poblacional de la duración
es normal y tiene y tiene una desviación típica de 3 horas. La
duración media de la muestra es de 48.2 horas. Contraste al nivel
del 10% la hipótesis nula de que la media poblacional de la duración
es al menos de 50 horas.
5.15. En una encuesta que realizó Gallup se encontró que la contribución
de beneficencia promedio por declaraciones de impuestos federales
fue de 1075 dólares. Suponga que una muestra de declaraciones de
impuestos de abril de 2001 se utilizará para llevar a cabo una prueba
de hipótesis diseñada para determinar si ocurrió algún cambio en
las contribuciones de beneficencia promedio.
a) Suponga que una muestra de 200 declaraciones de impuestos
tiene una media muestral de 1160 dólares y una desviación de
840 dólares, ¿Cuál es el estadístico de prueba?
b) Con  = 5%, ¿cuál es su conclusión?
5.16. Alexandra, gerente de ventas de la compañía A&B afirma que sus
vendedores venden en promedio diariamente s/4500. Realice una
prueba para la hipótesis de Alexandra si se quiere que la
probabilidad sea 1.5% de rechazarla cuando realmente es verdadera
y la probabilidad sea de 0.8% de aceptarla cuando el promedio de
las ventas diarias es realmente s/4565. Suponga que la distribución
de las ventas es normal con una desviación estándar de s/.150. De
ser el caso, obtener la potencia de la prueba.
5.17. Las cajas de cierto tipo de cereal procesado por una fábrica deben
tener un contenido promedio de 200 gramos. Por queja ante el
defensor del consumidor de que tales cajas de cereal tienen menos
contenido, un inspector tomó una muestra aleatoria de las cajas
encontrando los siguientes pesos de cereal en gramos:
197 203 198 197 201 199
202 199 202 195 198 196
¿Es razonable que el inspector multe al fabricante? Use un nivel de
significancia del 5% y suponga que los contenidos tienen
distribución normal.
Prueba de hipótesis 93
5.18. Un fabricante produce un cable de alambre de cierto tipo, que tiene
una resistencia a la ruptura no mayor de 280 kg. Se descubre un
proceso nuevo y más barato que desea emplearse, siempre que el
cable así producido tenga una resistencia media a la ruptura mayor
de 280 kg. Si una muestra aleatoria de 31 cables producidos con el
nuevo proceso ha dado una media de 285.5 kg. y una desviación
estándar de 14 kg. ¿debería el fabricante adoptar el nuevo proceso,
si está dispuesto a asumir un error tipo I del 5%? Suponga que la
distribución de la resistencia a la ruptura es:
a) Normal
b) Desconocida No normal
5.19. Se afirma que los fumadores adultos del país consumen en
promedio al menos 10 cigarrillos por día. Para comprobar esta
afirmación, se escoge una muestra aleatoria de 36 fumadores
adultos y se observa X i el número de cigarrillos que fuman por día,
resultando ∑ 𝑥𝑖 = 324 y ∑ 𝑥𝑖2 = 3231. Utilizando  = 0.01,
a) ¿Parecería esto indicar que el promedio del consumo es menor
que 10?
b) Encuentre la probabilidad del error del tipo II de la prueba si el
valor real de la media es 8 cigarrillos por día.
5.20. Un inversionista está por decidir entre dos provincias A y B para
abrir un centro comercial. Para esto debe probar la hipótesis de que
hay diferencia en el promedio de ingresos familiares de las dos
provincias. Si para una muestra de 300 hogares de la provincia A:
𝑥𝐴 = 400 y 𝑠𝐴 = 90 y, para otra muestra de 400 hogares de la
provincia B: 𝑥𝐵 = 420 y 𝑠𝐵 = 120. ¿Se puede inferir que las dos
medias poblacionales son diferentes?, si es así, ¿en cuál de las
provincias debería abrir la sucursal? Use  = 5%.
5.21. Un proceso que produce botes de champú, cuando funciona
correctamente, produce botes cuyo contenido pesa, en promedio, 20
gramos. Una muestra aleatoria procedente de un lote tiene el
siguiente peso (en gramos):
21.4 19.7 19.7 20.6 20.8
20.1 19.7 20.3 20.9
Suponiendo que la distribución poblacional es normal, contraste al
nivel del 5% de que el proceso funciona correctamente.
94 Estadística para economía
5.22. Un fabricante quiere comparar dos marcas de máquinas, A y B; para
fabricar un tipo de artículo. Observa dos muestras de 50 artículos
procesados por A y B respectivamente y encuentra que las medias
respectivas son 1250 y 1210 segundos. Suponga 𝜎𝐴 = 110 𝑦 𝜎𝐵 = 80
segundos.
a) Al nivel de significancia del 5%, ¿se puede inferir que la máquina
B es más rápida que la máquina A?
b) Al nivel de significancia del 5%, ¿se puede inferir que la media de
la máquina B es menor que la media de la máquina A en menos
de 7 segundos?
c) ¿En por lo menos cuánto deberían incrementarse los tamaños de
las muestras de cada proceso para que la diferencia observada de
40 segundos en los tiempos promedios muestrales de A menos B
sea significativa al nivel  = 1%?
5.23. El medicamento A es aplicado a 10 pacientes aquejados de cierta
enfermedad y el medicamento B es aplicado a otros 9 pacientes
aquejados de la misma enfermedad. Los tiempos de recuperación de
los pacientes, en días, fueron:
7 5 6 7 4
Medicina A
6 5 5 3 4
9 8 7 9 6
Medicina B
8 9 7 6
Utilizando un nivel de significancia del 5% y suponiendo
poblaciones normales de igual varianza,
a) ¿Se puede aceptar la hipótesis nula que son iguales las medias de
los tiempos de tratamiento de las dos medicinas?
b) ¿Cuál de los medicamentos es más eficaz?
5.24. Se ha elaborado un método de selección para medir las actitudes de
los directivos hacia las minorías. Una elevada puntuación indica una
actitud negativa y una baja puntuación una actitud positiva. Se han
tomado muestras aleatorias independientes de 151 analistas
financieros varones y 108 analistas financieros mujeres. En el caso
del primer grupo, la media muestral y la desviación típica muestral
de las puntuaciones son 85.8 y 19.13, mientras que en el segundo
son 71.5 y 12.2, ¿la verdadera puntuación media es mayor en el caso
de los hombres que en el de las mujeres? Use un nivel de
significancia del 10%.
Prueba de hipótesis 95
5.25. Se quiere determinar la diferencia entre los promedios de tiempos
(en minutos) que utilizan los hombres y las mujeres para realizar
determinada tarea. Con este fin se escogen16 hombres y 16 mujeres
al azar resultando los tiempos promedios respectivos 40 y 35
minutos, y desviaciones estándar respectivas de 9 y 8 minutos.
Suponga que las poblaciones de ambos tiempos son independientes
y que tienen distribución normal con varianzas iguales. Al nivel de
significancia del 1% ¿es el tiempo promedio de hombres mayor al
tiempo promedio de las mujeres?
5.26. Una compañía de transporte terrestre de pasajeros está por decidir
si comprar una marca A o una marca B de llantas para su flota de
ómnibus. Se prueban 9 llantas elegidas al azar de cada una de las
marcas, resultando los siguientes rendimientos en kilómetros:
32000 30000 33000 31000 32000
Marca A
35000 34000 35000 31000
35000 37000 36000 38000 37000
Marca B
39000 32000 33000 40000
Utilizando un nivel de significancia del 1% y suponiendo
poblaciones normales de igual varianza, ¿qué marca de llanta rinde
más?
5.27. Para comparar los promedios de los tiempos en minutos que
emplean dos máquinas 1 y 2 en producir un tipo de objeto, se
registra el tiempo, al azar, de objetos producidos por las máquinas
dando los siguientes resultados:
12 28 10 25 24
Máquina 1
19 22 33 17
16 20 16 20 16
Máquina 2
17 15 21

Utilizando un nivel de significancia del 5% y suponiendo


poblaciones normales de distinta varianza, ¿los tiempos promedio
de las dos máquinas son diferentes?
5.28. Una muestra de 17 latas de leche marca A presentan una media de
171 mililitros, con desviación estándar de 15 mililitros, y 13 latas de
leche de la marca B producen 181 mililitros de promedio y 11
mililitros de desviación estándar. Bajo el supuesto que las
96 Estadística para economía
distribuciones de datos son normales y que las varianzas
poblacionales son iguales, al 2% de significancia ¿cuál es su
conclusión?
5.29. Un banco cuya sucursal se encuentra ubicada en el centro financiero
de San Isidro desarrolló un proceso de mejora del servicio a sus
clientes en el horario de almuerzo. Se registra el tiempo de espera
(desde que el cliente llega a la cola hasta que llega a caja) de todos
los clientes en ese horario durante una semana. Se selecciona una
muestra aleatoria de 15 clientes y los resultados, en minutos, fueron:
7.2 8.5 6.1 8.1 7.8 5.4 6.5 6.2
7.5 9.1 3.4 8.1 9.5 9.2 6.8

Si otra sucursal ubicada en Santa Anita también preocupada por el


horario de atención en el tiempo de almuerzo selecciona una
muestra aleatoria de 15 clientes, obteniendo los resultados en
minutos
9.6 5.9 8 5.8 8.7 4 8 8.4
9 6.2 5.1 4.1 6.2 9 5.2

a) Al 2% de significancia, ¿existe diferencia significativa en la


variabilidad?
b) Al 5% de significancia, ¿en qué sucursal el cliente está más
satisfecho?
5.30. Frente a la crisis del covid-19 los auditores están preocupados por la
posibilidad de que existan fraudes por parte de las empresas. Los
auditores pueden averiguar las posibilidades de que existan fraudes
si calculan minuciosamente el flujo de caja. Para evaluar esta
posibilidad, unas muestras de auditores de nivel medio que trabajan
en empresas de auditoría reciben información sobre el flujo de caja
de un caso de fraude y se les pide que indiquen la posibilidad de que
haya un fraude material en una escala de 0 a 100. Una muestra
aleatoria de 30 auditores utiliza la información sobre el flujo de caja
y obtiene media es de 36.2 y la desviación estándar de 22.6. En el
caso de una muestra aleatoria independiente de 30 auditores que no
utilizan la información sobre el flujo de caja, la media y desviación
estándar son 47.5 y 27.6, respectivamente. Suponiendo
poblacionales normales con igual varianza, ¿existe diferencia en las
medias?
Capítulo 6: Regresión lineal
múltiple
En este capítulo se desarrolla la aplicará la idea de estimar parámetros,
desarrollada en el capítulo 4, de un modelo estadístico para la asociación
entre una variable dependiente y varias independientes.
También se incluye pruebas de hipótesis que permitirán
determinar si el modelo que se obtiene a partir de la información muestral
será de utilidad.

6.1. RELACIÓN ENTRE VARIABLES


Un modelo estadístico lineal que relaciona una respuesta aleatoria Y
con un conjunto de variables independientes o predictoras 𝑥1 , 𝑥2 , … , 𝑥𝑘 es
de la forma (Mendehall)
𝑌 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝜀
donde 𝛽0 , 𝛽1 , … , 𝛽𝑘 son parámetros desconocidos,  una variable aleatoria
y las variables 𝑥1 , 𝑥2 , … , 𝑥𝑘 toman valores conocidos. Suponiendo que
𝐸(𝜀) = 0
𝐸(𝑌) = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘
98 Estadística para economía
Observación 6.1: La variable dependiente (respuesta o explicada) Y se
mide con un error que no se controla en el experimento, por tanto, es
aleatoria; mientras que las variables independientes (predictoras o
explicativas) 𝑥1 , 𝑥2 , … , 𝑥𝑘 se miden con un error despreciable, que en la
mayoría de casos se controla en el experimento, por tanto, no tiene la
propiedad de ser aleatoria (Córdova). A  se le denomina perturbación
aleatoria y aparece por varias razones, entre otras, porque no se puede
esperar captar toda la influencia de una variable económica en un modelo,
por muy elaborado que éste sea (Greene).
Observación 6.2: Existen dos formas diferentes de relacionar las
variables a partir de una m.a.: La relación funcional (para predecir) de Y
con las xi, análisis de regresión y, la asociación entre las variables
mediante un coeficiente o índice, análisis de correlación. (Córdova).

6.2. DETERMINACIÓN DE LA ECUACIÓN DE


REGRESIÓN MUESTRAL
Se busca hacer inferencia sobre los parámetros 𝛽0 , 𝛽1 , 𝛽2 , … , 𝛽𝑘 . Los datos
de la muestra de tamaño n satisfacen la ecuación de regresión poblacional
(Córdova)
𝑌𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + ⋯ + 𝛽𝑘 𝑥𝑖𝑘 + 𝜀𝑖 ; 𝑖 = 1,2, … , 𝑛
También a la ecuación de regresión muestral
𝑌𝑖 = 𝛽̂0 + 𝛽̂1 𝑥𝑖1 + 𝛽̂2 𝑥𝑖2 + ⋯ + 𝛽̂𝑘 𝑥𝑖𝑘 + 𝑒𝑖
Dado que 𝐸(𝜀) = 0, la estimación de la ecuación poblacional es
𝑌̂ = 𝛽̂0 + 𝛽̂1 𝑥1 + 𝛽̂2 𝑥2 + ⋯ + 𝛽̂𝑘 𝑥𝑘
Regresión lineal 99
Luego:
𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖
Evaluando el modelo para cada i:
𝑌1 = 𝛽0 + 𝛽1 𝑥11 + 𝛽2 𝑥12 + ⋯ + 𝛽𝑘 𝑥1𝑘 + 𝜀1
𝑌2 = 𝛽0 + 𝛽1 𝑥21 + 𝛽2 𝑥𝑖2 + ⋯ + 𝛽𝑘 𝑥2𝑘 + 𝜀2

𝑌𝑛 = 𝛽0 + 𝛽1 𝑥𝑛1 + 𝛽2 𝑥𝑛2 + ⋯ + 𝛽𝑘 𝑥𝑛𝑘 + 𝜀𝑛

Matricialmente:
𝑌 = 𝑋𝛽 + 𝜀
Donde:
𝑌1 1 𝑥11 𝑥12 ⋯ 𝑥1𝑘 𝛽0 𝜀1
𝑌2 1 𝑥21 𝑥22 ⋯ 𝑥2𝑘 𝛽 𝜀
𝑌 = [ ]; 𝑋=[ ⋱ ] ; 𝛽 = [ 1] ; 𝜀 = [ 2]
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑌𝑛 1 𝑥𝑛1 𝑥𝑛2 ⋯ 𝑥𝑛𝑘 𝛽𝑘 𝜀𝑛

De forma similar:
𝑌̂ = 𝑋𝛽̂
Así:
𝜀 = 𝑌 − 𝑋𝛽̂
100 Estadística para economía
Mediante el método más común para estimar el modelo, el de los mínimos
cuadrados ordinarios (MCO)
𝑡
𝑆𝐶𝐸 = (𝑌 − 𝑋𝛽̂ ) (𝑌 − 𝑋𝛽̂ )
De donde, al minimizar SCE, se obtiene:
𝛽̂ = (𝑋 𝑡 𝑋)−1 𝑋 𝑡 𝑌
Regresión lineal 101
Observación 6.3: Los coeficientes 𝛽̂𝑖 ; 𝑖 ≥ 1, indican el cambio promedio
de Y correspondiente a un incremento unitario en 𝑋𝑖 cuando las demás X
permanecen constantes (Córdova).
Ejemplo 6.1: En economía, la función de demanda de un producto a
menudo se estima mediante una regresión de la cantidad vendida (Q)
sobre el precio (P). La compañía Bamsy está tratando de estimar la
función de demanda para su nueva muñeca “Ma’am”, y ha recabado los
siguientes datos: (Levine)
P 20 17.5 16 14 12.05 10 8 6.5
Q 125 156 183 190 212 238 250 276
Graficar los datos, obtenga la ecuación de regresión, interprete 𝛽̂1 , 𝑟 𝑦 𝑟 2 .
102 Estadística para economía
Ejemplo 6.2: El dueño de Showtime Movie Theater, Inc., desea estimar
el ingreso bruto semanal en función de los gastos en publicidad. A
continuación, se presentan los datos históricos de 10 semanas
(Anderson):
Ingreso semanal (en Publicidad en TV (en Publicidad en periódico
miles de dólares) miles de dólares) (en miles de dólares)
96 5 1.5
90 2 2
95 4 1.5
92 2.5 2.5
95 3 3.3
94 3.5 2.3
94 2.5 4.2
94 3 2.5

Obtenga la ecuación de regresión e interprete 𝛽̂𝑖 . Use todos los decimales.


Regresión lineal 103
PROPIEDADES
6.1. 𝐸[𝛽̂ ] = 𝛽; 𝑉𝑎𝑟(𝛽̂ ) = 𝜎 2 (𝑋 𝑡 𝑋)−1
6.2. 𝑉𝑎𝑟(𝑌) = 𝑉𝑎𝑟(𝜀)
6.3. Sea (𝑋 𝑡 𝑋)𝑚×𝑚 , 𝑚 = 𝑘 + 1, un estimador insesgado de la varianza del
error es
𝑌 𝑡 𝑌 − 𝛽̂ 𝑡 𝑋 𝑡 𝑌 𝑆𝐶𝐸
𝜎̂ 2 = 𝑆 2 = =
𝑛−𝑚 𝑛−𝑚

6.3. PRUEBA DE HIPÓTESIS


6.3.1. Prueba para 
Las hipótesis de correlación, entre las dos variables de regresión simple,
son:
𝐻0 : 𝜌 = 0; 𝐻1 : 𝜌 ≠ 0
Si se supone verdadera la hipótesis nula, la estadística de prueba es:

𝑛−2
𝑡 = 𝑟√
1 − 𝑟2
con 𝑛 − 2 grados de libertad.
104 Estadística para economía
Ejemplo 6.3: Del ejemplo 6.1, determine si la cantidad vendida se
correlaciona con el precio, al 5% de significancia.

6.3.2. Prueba global para los 𝜷𝒊 , i > 0.


Bajo el caso de la teoría normal, 𝑌~𝑁(𝑋𝛽, 𝜎 2 𝐼) y 𝜀~𝑁(0, 𝜎 2 𝐼) (Canavos)
𝐻𝑜 : 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑘 = 0
𝐻1 : 𝛽𝑗 ≠ 0 para algún j = 1, 2, …, k.

Observación 6.4: Aceptar 𝐻0 implica que no existe relación igual a la


especificada por el modelo entre la respuesta y el conjunto de variables de
predicción. No obstante, rechazar 𝐻0 no necesariamente implica que la
ecuación estimada de regresión sea de utilidad para efectuar predicciones.
𝑅𝐶 = {𝐹 ⁄𝐹 > 𝐹(𝛼,𝑚−1,𝑛−𝑚) }

Tabla ANOVA para la prueba de hipótesis de análisis global (Canavos).


Fuente de Grados de Estadística
Suma de cuadrados Cuadrados medios
variación libertad F
(∑ 𝑌𝑖 )2 𝑆𝐶𝑅
Regresión 𝑘 =𝑚−1 𝑆𝐶𝑅 ≔ 𝛽̂ 𝑡 𝑋 𝑡 𝑌 − 𝐶𝑀𝑅 =
𝑛 𝑚−1
𝐶𝑀𝑅
𝑆𝐶𝐸
𝐶𝑀𝐸 = 𝐶𝑀𝐸
Error 𝑛−𝑚 𝑆𝐶𝐸 ≔ 𝑌 𝑡 𝑌 − 𝛽̂ 𝑡 𝑋 𝑡 𝑌 𝑛−𝑚
= 𝑠2
(∑ 𝑌𝑖 )2
Total 𝑛−1 𝑆𝐶𝑇 ≔ 𝑌 𝑡 𝑌 −
𝑛

Observación 6.5: Si la decisión es aceptar 𝐻0 , se concluye que no hay


regresión de Y globalmente con los 𝑋𝑖 y el análisis termina. Pero si se
rechaza (algún 𝛽𝑗 ≠ 0) se continúa con el análisis individual, para
determinar qué variables independientes influyen en la regresión
(Córdova).
Regresión lineal 105
Ejemplo 6.4: Del ejemplo 6.1, pruebe la significación de la ecuación de
regresión muestral, al 5% de significancia.
106 Estadística para economía
Ejemplo 6.5: Del ejemplo 6.2, pruebe la significación de la ecuación de
regresión muestral, al 5% de significancia.
Regresión lineal 107
Ejemplo 6.6: En una granja experimental se llevó a cabo un experimento
para determinar si es posible pronosticar el peso final (Y) de ganado
porcino después de 6 meses sobre la base de su peso inicial (𝑋1 ) y la
cantidad de alimento que recibe (𝑋2 ). El experimento se realizó con una
muestra de tamaño 23 y los resultados en Kg son:

∑ 𝑥1 = 260; ∑ 𝑥2 = 2748; ∑ 𝑦 = 1339; ∑ 𝑥12 = 3016;

∑ 𝑥1 𝑥2 = 31284; ∑ 𝑥1 𝑦 = 15214;

∑ 𝑥22 = 328976; ∑ 𝑥2 𝑦 = 160208; ∑ 𝑦 2 = 78035

Obtenga el modelo de regresión, usando todos los decimales, y realice la


prueba global al 5% de significancia (Córdova).
108 Estadística para economía
6.3.3. Prueba individual para los 𝜷𝒊 , i > 0.
Si existe regresión global (significancia) de Y con el conjunto de las
X, se debe determinar qué variables contribuyen de forma significativa al
modelo, si algún 𝑋𝑖 resulta no significativo, se debe descartar y buscar la
ecuación lineal adecuada (Córdova). El proceso es:
𝐻0 : 𝛽𝑖 = 0; 𝐻1 : 𝛽𝑖 ≠ 0
Si la decisión es aceptar 𝐻0 : 𝛽𝑖 = 0, a un nivel de significancia dado,
entonces 𝑋𝑖 no contribuye significativamente al modelo y se descarta. Se
encuentra la ecuación con las variables significativas y se repite el análisis
hasta encontrar la ecuación satisfactoria. Una forma de realizar la prueba
individual es:
La región crítica es:
𝑅𝐶 = {𝑡⁄𝑡 < −𝑡(𝑛−𝑚) ∨ 𝑡 > 𝑡(𝑛−𝑚) }
La estadística de prueba es:
𝛽̂𝑖
𝑇= ~𝑡(𝑛−𝑚)
𝐸𝑆(𝛽̂𝑖 )

𝐸𝑆(𝛽̂𝑖 ) = √𝑉𝑎𝑟(𝛽̂𝑖 ) = 𝑆√𝑐𝑖𝑖 ; 𝑐𝑖𝑖 : 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑑𝑒 (𝑋 𝑡 𝑋)−1 ; 𝑖 = 0, . . , 𝑘

Ejemplo 6.7: Con los resultados del ejemplo 6.6, realizar las pruebas
individuales, y de ser necesario obtener el nuevo modelo.
Regresión lineal 109

6.3.4. Bondad de ajuste del modelo


Una forma de determinar la utilidad de la recta de regresión es mediante
la bondad de ajuste. Mientras mayor es el valor del coeficiente de
determinación 𝑅 2 mejor será el ajuste y más útil la ecuación para predecir.
Esto resulta de:
𝑆𝐶𝐸 𝑆𝐶𝑅 𝑆𝐶𝑅 𝑆𝐶𝐸
𝑆𝐶𝑇 = 𝑆𝐶𝐸 + 𝑆𝐶𝑅 ⟹ 1 = + ⇒ 𝑅2 = =1−
𝑆𝐶𝑇 𝑆𝐶𝑇 𝑆𝐶𝑇 𝑆𝐶𝑇
Sin embargo, cuando n es pequeño (regresión lineal simple) el
coeficiente 𝑅 2 es sesgado positivo y crece con el número de variables
independientes (regresión lineal múltiple). Para corregir estas tendencias
2
se usa el coeficiente ajustado o corregido, 𝑅 (Córdova):
2 𝐶𝑀𝐸
𝑅 =1−
𝐶𝑀𝑇
Ejemplo 6.8: Con los resultados del ejemplo 6.2, obtenga la bondad de
ajuste del modelo.
110 Estadística para economía

6.3.5. Matriz de correlación de orden cero


La matriz simétrica de correlación de orden cero es aquella que
contiene las correlaciones simples de Pearson entre las variables
independientes y, de las variables independientes con la variable
dependiente:
1 𝑟𝑥1 𝑥2 ⋯ 𝑟𝑥1 𝑦
1 ⋯ 𝑟𝑥2 𝑦
𝑅=[ ]
⋱ ⋮
1
Observación 6.6: La matriz de correlación se usa para verificar si se
cumple o no la hipótesis de independencia entre variables. Cuando esto
no se cumple se dice que el modelo presenta “multicolinearidad”.
Empíricamente las correlaciones descriptivas entre – 0.7 y 0.7 NO causan
dificultades (Córdova). Para probar la significación de los 𝑟𝑥𝑖𝑥𝑗 se usa:
𝑛−2
𝑡 = 𝑟𝑥𝑖𝑥𝑗 √ ~𝑡
1 − 𝑟𝑥2𝑖𝑥𝑗 (𝑛−2)

Ejemplo 6.9: Con los resultados del ejemplo 6.2, obtenga la matriz de
orden cero y verificar la significación de los 𝑟𝑥𝑖𝑥𝑗 .
Regresión lineal 111
6.4. PROBLEMAS PROPUESTOS
6.10. Los siguientes datos representan el PBI (X) y los gastos de
consumo (Y) en miles de millones de dólares de un país
X 737 756.6 800.2 832.5 876.4 929.3
Y 452 461.4 482 500.5 528 557.5
X 1011.4 1058.1 1087.6 1085.6 1122.4 1185.9
Y 602.7 634.4 657.9 672.1 696.8 737.1
X 1248 1233.9 1300.4 1371.7 1436.9 1483
Y 763.6 780.2 823.7 863.9 904.8 930.9
X 984.8 1255 1480.7
Y 585.7 768.5 935.1
a) Obtener el modelo lineal e interprete los coeficientes.
b) ¿El modelo es significativo?
6.11. Una empresa pretende predecir el tiempo de trabajo necesario
para acabar el diseño de un avión en millones de horas. Se pensaba
que las variables independientes eran la velocidad máxima (𝑥1 ), su
peso (𝑥2 ) y el número de piezas en común con otros modelos
construidos (𝑥3 ). Una muestra aleatoria de 27 aviones generó la
siguiente información
𝑦 = 0.661𝑥1 + 0.065𝑥2 − 0.018𝑥3 ; 𝑆𝐶𝑇 = 3.881; 𝑆𝐶𝑅 = 3.549
a) Calcular e interpretar el coeficiente de determinación.
b) Determine si el modelo es significativo.
c) Si además 𝑆𝑏1 = 0.099; 𝑠𝑏2 = 0.032; 𝑠𝑏3 = 0.002, al 5% de
significancia, ¿existe significancia local?
6.12. Suponga que la variable dependiente está relacionada con k
variables independientes a través de un modelo de regresión
múltiple. Sea 𝑅 2 el coeficiente de determinación y 𝑅̅ 2 el coeficiente
corregido. Suponga que se utilizan n conjuntos de observaciones
para ajustar la regresión. Demuestre que
(𝑛 − 1)𝑅 2 − 𝑘
𝑅̅ 2 =
𝑛−𝑘−1
6.13. Usted tiene una parrilla caliente y un panecillo de hamburguesa
vacío, pero ha jurado dejar las hamburguesas grasientas. ¿Es
buena una hamburguesa sin carne? Los datos de la tabla siguiente
dan puntuación de sabor y textura (entre 0 y 100) para 12 marcas
de hamburguesas sin carne junto con el precio (en soles), número
de calorías y cantidad de grasa por hamburguesa
112 Estadística para economía

Puntos 70 45 43 41 39 30
Precio 6.50 5 6 5.50 6 4.50
Calorías 110 90 80 120 90 140
Grasa 4 0 1 5 0 4
Puntos 68 56 40 34 30 26
Precio 5 6 4.50 5 6.50 6
Calorías 120 170 130 110 100 130
Grasa 4 6 4 2 1 2

a) Obtener el modelo.
b) ¿El modelo es significativo?
c) ¿Las variables son significativas?
6.14. Una compañía de mudanza proporciona los pesos en miles de
libras, las distancias en miles de kilómetros que se traslada y el
daño en que incurre
Peso 4 3 1.6 1.2 3.4 4.8
Distancia 1.5 2.2 1 2 0.8 1.6
Daño 160 112 69 90 123 186

a) Obtener el modelo.
b) ¿El modelo es significativo?
c) ¿Las variables son significativas?
6.15. Demuestre que:
𝑛 𝑛 𝑛
2 )2
∑(𝑦𝑖 − 𝑦̅) = ∑(𝑦𝑖 − 𝑦̂𝑖 + ∑(𝑦̂𝑖 − 𝑦̅)2
𝑖=1 𝑖=1 𝑖=1
Bibliografía
Alvarado Pintado, L., & Agurto Mejía, H. (2009). Estadística para
Administración y Economía con aplicaciones en Excel. Lima:
Editorial San Marcos.
Anderson, D., Sweeney, D., & Thomas, W. (2008). Estadística para
administración y economía (Décima ed.). México: Cengage
Learning.
Blanco Castañeda, L. (2004). PROBABILIDAD. Bogotá: Universidad
Nacional de Colombia.
Canavos, G. (1988). PROBABILIDAD Y ESTADÍSTICA Aplicaciones y
métodos. México: McGraw-Hill.
Casas Sánchez, J. M. (1997). Inferencia estadística. Madrid: Centro de
estudios Ramón Areces, S.A.
Casas, J., & Santos, J. (1996). Introducción a la estadística para
Economía y Administración de Empresas. Madrid: Centro de
estudios Ramón Areces, S.A.
Casella, G., & Berger, R. (2002). Statistical Inference (Segunda ed.).
Duxbury.
Córdova Zamora, M. (2003). ESTADÍSTICA Descriptiva e Inferencial.
Aplicaciones (Quinta ed.). Lima: MOSHERA S.R.L.
Córdova Zamora, M. (2006). Estadística Inferencial. Lima: Moshera
S.R.L.
Freund, J., Miller, I., & Miller, M. (2000). Estadística matemática con
aplicaciones. Naucalpan de Juárez: Pearson.
Gallego, F. (2010). Análisis Multivariado. La distribución normal
bivariada. Manizales: Universidad Nacional de Colombia.
Hogg, R., & Craig, A. (2004). Introduction to Mathematical Statistics
(Quinta ed.). Pearson Education.
Jobson, J. (1991). Applied Multivariate Data Analysis I. New York:
Springer-Verlag.
Johnson, R., & Wichern, D. (2008). Applied Multivariate Statistical
Analysis. Pearson Prentice Hall.
Levine, D., Krehbiel, T., & Berenson, M. (s.f.). ESTADÍSTICA PARA
ADMINISTRACIÓN (Cuarta ed.). México: Pearson Educación.
Lind, D., Marchal, W., & Wathen, S. (2012). ESTADÍSTICA APLICADA A
LOS NEGOCIOS Y LA ECONOMÍA (Decimoquinta ed.). México:
McGRAW-HILL.
114 Estadística para economía
Marian Wisnieswski, P., & Velasco Sotomayor, G. (2001). Problemario de
probabilidad. México: Thomson.
Maya Perez, L., & Pliego Lopez, J. (1997). Estadística I: Probabilidad.
Madrid: AC.
McCLAVE, J., BENSON, G., & SlNClCH, T. (s.f.). A FIRST COURSE IN
BUSINESS STATISTICS (octava ed.). PRENTICE HALL.
Miller, I., & Miller, M. (2000). Estadística matemática con aplicaciones.
México: Pearson Educación.
Mitacc, M. (1996). Estadística y probabilidad. Lima.
Morillas, A. (s.f.). Muestreo en poblaciones finitas. Obtenido de
https://www.u-
cursos.cl/ingenieria/2010/1/IN3401/1/material_docente/bajar?i
d_material=280296
Moya, R. (2007). Estadística descriptiva. Lima: San Marcos.
Moya, R., & Saravia, G. (2004). Probabilidad e inferencia estadística.
Lima: San Marcos.
Newbold, P., Carlson, W., & Thorne, B. (2008). Estadística para
Administración y Economía. Madrid: PEARSON EDUCACIÓN,
S.A.
Ramachandran, K., & Tsokos, C. (2009). Mathematical Statistics with
Applications. California: Elsevier Academic Press.
Rice, J. (1995). Mathematical Statistics and Data Analysis (Segunda ed.).
California: Duxbury Press.
Rincón, L. (2007). Curso intermedio de PROBABILIDAD. México:
Facultad de Ciencias de la UNAM
(mx/larshttp://www.matematicas.unam.mx/lars).
Ross, S. (2007). Introduction to Probability Models (Novena ed.).
California: Elsevier Inc.
Triola, M. (2004). Estadística (Novena ed.). México: PEARSON
EDUCACIÓN.
Wackerly, D., Mendehall, W., & Scheaffer, R. (2010). Estadística
matemática con aplicaciones. México: Cengage Learning
Editores, S.A.
Walpole, R., Myers, R., Myers, S., & Ye, K. (2012). Probabilidad y
estadística para ingeniería y ciencias. México: Pearson.
Webster, A. (2000). Estadística aplicada a los negocios y la economía
(Tercera ed.). Santa Fe de Bogotá: McGRAW-HILL.

Das könnte Ihnen auch gefallen