Apuntes Probabilidad Santiago

Contenidos
1 Preliminares 4
1.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Sumas …nitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Ejemplos de sumatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2 Propiedades de las sumatorias . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.3 Suma telescópica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.4 Suma geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Principios de combinatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1 Principio básico del conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2 Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.3 Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.4 Ejemplos adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.5 Portafolios, bolas y cajas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.6 La fórmula del binomio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.7 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2 Espacios de probabilidad discretos 22

2.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Muestras y eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1 Operaciones booleanas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3 Probabilidad clásica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.1 Propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.2 Algunos ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.3 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4 Espacios …nitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4.1 Algunas propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4.2 Principio de inclusión-exclusión . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.3 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.5 Probabilidad condicional e independencia . . . . . . . . . . . . . . . . . . . . . . . 38
2.5.1 Fórmula de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.5.2 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1
S. Cambronero 2
3 Teoría general de probabilidades 47

3.1 Espacios de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.1.1 No todo conjunto es un evento . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.1.2 Medidas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.1.3 Continuidad de las medidas de probabilidad . . . . . . . . . . . . . . . . . . 50
3.1.4 Espacios contables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.1.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.2 El concepto de variable aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.2.1 Variables Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2.2 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3 Esperanza de una variable discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3.1 Propiedades de la esperanza . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.3.2 Funciones de variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3.3 Aproximación binomial de una Poisson . . . . . . . . . . . . . . . . . . . . . 72
3.3.4 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.4 Varianza y desviación estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.4.1 Independencia de variables aleatorias . . . . . . . . . . . . . . . . . . . . . . 81
3.4.2 Sumas de variables no independientes . . . . . . . . . . . . . . . . . . . . . 83
3.4.3 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4 Funciones de distribución 87
4.1 El concepto de función de distribución . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.1.1 Cálculos usando funciones de distribución . . . . . . . . . . . . . . . . . . . 88
4.1.2 Propiedades de las funciones de distribución . . . . . . . . . . . . . . . . . . 90
4.1.3 Funciones de densidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.2 Variables aleatorias continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.2.1 Variables uniformes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.2.2 Distribuciones exponenciales . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.2.3 Distribuciones normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.2.4 La distribución de g (X) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.2.5 Esperanza de una variable continua . . . . . . . . . . . . . . . . . . . . . . 102
4.2.6 La esperanza de g (X) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.2.7 Varianza en el caso continuo . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.2.8 Variables gaussianas o normales . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.3 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5 Otras distribuciones continuas 112

5.1 La función gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.2 La distribución gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.3 La distribución beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
5.4 La distribución Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6 Distribuciones conjuntas 120

6.1 De nuevo independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.2 Distribución de la suma de variables independientes . . . . . . . . . . . . . . . . . 126
6.3 Esperanza de g (X; Y ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
6.4 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
S. Cambronero 3
7 Correlación y transformaciones 133

7.1 Transformaciones de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.2 Covarianzas y correlaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
7.3 Distribuciones condicionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.4 Esperanzas condicionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
7.5 Cálculos con esperanzas condicionadas . . . . . . . . . . . . . . . . . . . . . . . . . 145
7.6 Funciones generadoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
7.6.1 De probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
7.6.2 De momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
7.7 Interpretación de los momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
7.7.1 Asimetría, variación y curtosis . . . . . . . . . . . . . . . . . . . . . . . . . 154
7.7.2 Colas de distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
7.8 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
8 Convergencia 159
8.1 Algunas desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
8.2 La ley débil de grandes números . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
8.3 El lema de Borel –Cantelli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
8.4 Ley fuerte de grandes números . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
8.5 Teorema del límite central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
8.6 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
Capítulo 1
Preliminares
1.1 Introducción
Este primer capítulo presenta una serie de herramientas de vital importancia para el estudio de
las probabilidades. Se asume un conocimiento adecuado del cálculo en una variable, con el nivel
de profundidad típico de un curso introductorio en el tema. Especí…camente, asumimos que el
lector domina los conceptos de límite, continuidad, diferenciabilidad e integrabilidad en el sentido
de Riemann, para funciones reales de variable real. Lo anterior tanto desde el punto de vista
conceptual como práctico. Es deseable además un dominio adecuado del tema de sucesiones y
series, al menos en cuanto a los tipos más comunes como las series geométricas, telescópicas,
alternadas, la serie armónica y los criterios de convergencia más comunes. Finalmente, temas de
cálculo a nivel intermedio como desarrollos limitados, integrales impropias y series de potencias,
incluyendo series de Taylor, serán usados en la segunda mitad del curso. Se comienza con un
repaso de notación de sumas …nitas, con el …n de establecer un lenguaje básico para los primeros
capítulos.
1.2 Sumas …nitas

Dados números reales am ; am+1 ; : : : ; an se denota su suma por
n
X
ak = am + : : : + an :
k=m
El lector que por primera vez se enfrenta a esta notación, encontrará especial importancia en los
siguientes ejemplos.
1.2.1 Ejemplos de sumatorias

1
Ejemplo 1 Para ak = k se tiene
5
X 1 1 1 1 1 1 137
= + + + + = :
k 1 2 3 4 5 60
k=1
4
S. Cambronero 5
Ejemplo 2 Para ak = c (una constante) se tiene

3
X n
X
c = c + c + c = 3c: En general c = c + c + : : : + c = nc:
| {z }
k=1 k=1 n veces
Similarmente
n
X n
X
c = (n + 1) c: En general c = (n m + 1) c:
k=0 k=m
Ejemplo 3 Si ak = k se tiene
100
X 100 101
S= k= = 5050:
2
k=1
En efecto, nótese que

S = 1 + 2 + 3 + : : : + 99 + 100
= 100 + 99 + 98 + : : : + 2 + 1:
Al sumar las dos expresiones para S; asociando 1 con 100; 2 con 99; etc. se obtiene
2S = 101 + : : : + 101 = 100 101:
| {z }
100 veces
En general, este mismo argumento demuestra que

n
X n(n + 1)
k= :
2
k=1
Ejemplo 4 Para calcular la suma 15 + 16 + : : : + 27 se puede escribir

27
X 27
X 14
X 27 28 14 15
k= k k= = 273:
2 2
k=15 k=1 k=1
1.2.2 Propiedades de las sumatorias

Las siguientes propiedades se pueden deducir en forma intuitiva.
1. Si c 2 R se tiene
n
X n
X
cak = c ak :
k=m k=m
En otras palabras, se puede factorizar un escalar en cualquier sumatoria …nita.
2. Dados am ; : : : ; an ; bm ; : : : bn se tiene
n
X n
X n
X
(ak + bk ) = ak + bk :
k=m k=m k=m
Esta propiedad es una generalización de la conmutatividad de la suma. En efecto, se puede

cambiar el orden de las sumas para sumar primero todos los ak y luego todos los bk :
S. Cambronero 6
3. Si para cada k se tiene ak bk ; entonces

n
X n
X
ak bk : (1.1)
k=m k=m
Lo mismo ocurre con desigualdad estricta. Es decir, si ak > bk para cada k entonces
n
X n
X
ak > bk : (1.2)
k=m k=m
P
n
En particular, si cada ak es positivo, se sigue que ak es un número positivo.
k=m
4. Dados a0 ; : : : ; an+1 2 R se tiene

n
X n+1
X
ak+1 = ak :
k=0 k=1
Equivalentemente
n
X n+1
X
ak = ak 1:
k=0 k=1
Ejemplo 5 Un cliente abre una cuenta de ahorros con 1000 dólares. Al …nal de cada mes, el
cliente retira los intereses y deposita otros 1000 dólares en la cuenta. Si el banco le paga el 6% de
interés anual sobre el saldo de cada mes, calcular el total de intereses retirados durante 3 años.
Al principio del mes k; una vez hecho el depósito el saldo en la cuenta es de 1000k dólares, así que
al …nal de dicho mes habrá ganado 0:06 12 1000k = 5k dólares. El total de intereses retirados es
36
X
36 37
5k = 5 2 = 3330:
k=1
Ejemplo 6 Para calcular la suma

T = 1 + 4 + 7 + : : : + 100
se puede escribir
33
X 33
X 33
X 33 34
T = (3k + 1) = 3 k+ 1=3 + 34 = 1717:
2
k=0 k=0 k=0
Ejemplo 7 Para calcular la suma

50
X
(k + 1)
k=0
se puede proceder de la siguiente manera:
50
X 50
X 50
X 50 51
(k + 1) = k+ 1= + 51 = 1326:
2
k=0 k=0 k=0
Alternativamente
50
X 51
X
51 52
(k + 1) = k= 2 = 1326:
k=0 k=1
S. Cambronero 7
1.2.3 Suma telescópica

Cuando se puede expresar ak = bk bk+1 , la sumatoria de los ak se puede calcular de manera
sencilla. En efecto se tiene
Xn
(bk bk+1 ) = b0 bn+1 :
k=0
La idea es que
n
X
(bk bk+1 ) = (b0 b1 ) + (b1 b2 ) + + (bn 1 bn ) + (bn bn+1 )
k=0
= b 0 + ( b1 + b 1 ) + : : : + ( bn + bn ) bn+1
donde todos los términos intermedios se cancelan. En genral se tiene

n
X
(bk bk+1 ) = bm bn+1 :
k=m
P
n
1 1 1 1
Ejemplo 8 Para calcular la suma k(k+1) se puede observar que k(k+1) = k k+1 . Esta es la
k=1
forma telescópica, de modo que
n
X X n
1 1 1 1 1 n
= = = :
k(k + 1) k k+1 1 n+1 n+1
k=1 k=1
P
33
3
Ejemplo 9 La suma k 2 se puede calcular observando que (k + 1) k 3 = 3k 2 + 3k + 1; de
k=0
donde
33
X 33
X 33
X 33
X
3
(k + 1) k3 = 3k 2 + 3k + 1 = 3 k2 + (3k + 1) :
k=0 k=0 k=0 k=0
Dado que el lado izquierdo es una suma telescópica, se tiene:

33
X
343 03 = 3 k 2 + 1717
k=0
donde se ha usado el ejemplo 6. Despejando se obtiene:

33
X
k2 = 1
3 343 1717 = 12529:
k=0
Procediendo como en el ejemplo anterior, se puede deducir que en general

n
X
k 2 = 16 n (n + 1) (2n + 1) :
k=1
Ejemplo 10 De acuerdo con la fórmula anterior se tiene
12 + 22 + 32 + : : : + 172 = 16 17 18 35 = 1785
S. Cambronero 8
1.2.4 Suma geométrica

Un caso particular de suma telescópica es
n
X
rk rk+1 = r0 rn+1 = 1 rn+1 :
k=0
Observando que rk rk+1 = (1 r) rk ; la suma del lado izquiedo se puede escribir

n
X n
X
(1 r) rk = (1 r) rk :
k=0 k=0
Al despejar se obtiene
n
X 1 rn+1
rk = ;
1 r
k=0
siempre que r 6= 1: Esta es la suma geométrica de razón r:

Nota: El lector puede observar que esta es una variante de la conocida fórmula de factorización
xn+1 an+1 = (x a) xn + axn 1

+ : : : + an 1
x + an :
En efecto, basta tomar x = 1; a = r. Rigurosamente hablando, nuestro argumento de arriba es en

esencia la demostración de este método de factorización.
Ejemplo 11 Un cliente abre una cuenta de ahorros con 1000 dólares y continúa depositando 1000
dólares al …nal de cada mes. Si los intereses se acumulan mensualmente, al 6% anual, calcular la
cantidad de dinero en la cuenta, al cabo de tres años.
Los primeros 1000 dólares generan 1000r36 dólares al …nal de dos años, donde
0:06
r =1+ = 1: 005
12
El depósito del …nal del primer mes, genera 1000r35 dólares y así sucesivamente. Finalmente, al
…nal del mes 36 el cliente deposita 1000 dólares, que no generan interés. Tomando en cuenta este
último depósito, la cantidad de dólares en la cuenta al …nal del tercer año es
36
X r37 1
1000 r36 + r35 + : : : + r + 1 = 1000 rk = 1000 = 40533:
r 1
k=0
En otras palabras, la cuenta ha producido 3533 dólares en intereses. Compare con el ejemplo 5
donde el interés ganado, es de 3330 dólares. La diferencia radica en que ahora los intereses que se
acumulan generan nuevos intereses.
Ejemplo 12 Un cliente toma un préstamo de 10 000 dólares y debe pagar un interés del 12%
anual, calculado mensualmente. Al …nal de cada mes, paga una cuota …ja que cubre los intereses
devengados en el periodo más cierta amortización. Si el préstamo es a 8 años plazo, calcular la
cuota mensual respectiva.
Vamos a llamarle C a la cuota mensual. Al …nal del primer mes, después de pagar la cuota la
deuda es de
1
10000 1 + 100 C = 10000R C;
S. Cambronero 9
1
donde R = 1 + 100 = 1:01: Al …nal del segundo mes, la deuda será, después de pagar la cuota:
(10000R C) R C = 10000R2 C (1 + R) :
Siguiendo este proceso, después de 96 meses la deuda se reduce a
R96 1
10000R96 C 1 + R + : : : + R95 = 10000R96 C :
R 1
Queremos que la deuda se reduzca a 0 al pagar la cuota número 96; así que la condición es:
R96 1
10000R96 = C :
R 1
Resolviendo se obtiene
10000R96 (R 1)
C= = 162: 5 dólares (aproximadamente).
R96 1
Nota: En general, para un monto M; un interés anual i y a un plazo de n meses, la cuota se
calcula como:
M Rn (R 1)
C=
Rn 1
i
donde R = 1 + 12 :
1.2.5 Ejercicios
1. Calcule directamente las siguientes sumas
7
X 15
X p 9
X
1 p k
k+ ; k+1+ k ; :
k 2k
k=4 k=12 k=5
2. Calcule las siguientes sumas usando las propiedades e identidades estudiadas en este capítulo
17
X 25
X p 19
X
1 p 3
k+ ; k+1 k ; :
k (k + 1) 2k
k=4 k=12 k=5
3. Exprese cada una de las sumas siguientes en notación de sumatoria y encuentre el resultado
S = 2 + 4 + 6 + : : : + 68; T = 15 + 16 + : : : + 50 + 51:
4. Calcule
41
X 27
X 25
X
k; k2 ; k (k + 1) :
k=7 k=3 k=5
5. Veri…que la fórmula
n
X 2
n2 (n + 1)
k3 =
4
k=1
para n = 2; 3; 4; 6:
S. Cambronero 10
6. Veri…que la fórmula
6
X
k k! = (n + 1)! 1
k=0
para n = 1; 3; 5; 6:
7. Calcule las sumas:
47
X 93
X
1 k k+1
; :
k (k + 2) k+1 k+2
k=1 k=17
8. Calcule las sumas:

21
X 19
X 99
X n+1 n
( 1) 3
2k ; 2 3k
; 2n
:
2
k=5 k=0 k=1
9. Un cliente toma un préstamo de 10 000 dólares y debe pagar un interés del 12% anual,
calculado mensualmente. Al …nal de cada mes, paga una cuota …ja que cubre los intereses
devengados en el periodo más cierta amortización. Si el cliente desea una cuota de 120 dólares
al mes, ¿cuál debe ser el plazo aproximado del préstamo? R. 180 meses.
10. Resuelva el ejercicio anterior con una cuota de 101 dólares. ¿Por qué no puede ser la cuota
menor que 100?
11. En el ejemplo 12, si se quiere pagar una cuota C > 100; deduzca que el plazo en meses debe
ser alrededor de
ln C ln (C 100)
:
ln R
12. Una cuenta de ahorro paga 8% de interés anual, compuesto trimestralmente. Si depositan
$100 dólares en esta cuenta, calcule el monto que habrá en la cuenta al término de:
(a) seis meses

(b) un año
(c) dos años
(d) n años
(e) 3n meses
13. De depositan $100 en una cuenta que paga un interés anual del 5%: Calcule el monto acu-
mulado al término de un año si el interés es compuesto:
(a) mensualmente
(b) semanalmente
(c) diariamente
(d) cada hora
(e) cada minuto
14. ¿A qué se acerca el monto calculado en el eejrcicio anterior cuando el número de periodos en
el año tiende a in…nito?
S. Cambronero 11
15. De deposita una cantidad M0 en una cuenta que paga un interés anual r: Si el interés se
compone n veces al año, el monto al …nal del año es
r n
M = M0 1 + :
n
Nótese que el límite de esta cantidad cuando n ! 1 es M0 er : Más generalmente, en cualquier
tiempo t el límite obtenido es M (t) = M0 ert : Este es el interés compuesto en forma continua.
Si M0 = 100 y el interés es r = 6%; calcule el monto en la cuenta después de:
(a) seis meses

(b) nueve meses
(c) dos años
(d) 15 meses
1.3 Principios de combinatoria

1.3.1 Principio básico del conteo
Supongamos que tiramos un dado y una moneda, y queremos saber el número total de posibles
resultados. Para cada uno de los dos resultados de la moneda, hay 6 posibles resultados del dado.
Consecuentemente, hay 6 + 6 = 6 2 = 12 posibles resultados combinados. En cierta forma hemos
aplicado lo que se conoce como el principio básico de conteo. En forma general, se realizan dos
experimentos, uno de los cuales tiene m posibles resultados y el otro n posibles resultados. En
principio básico del conteo dice que la combinación de los dos experimentos tiene m n posibles
resultados.
Ejemplo 13 ¿Cuantos números naturales (se incluye el 0) menores que 1 000 000 están formados
por solamente ceros y unos? Tales números están formados por 6 dígitos, si se colocan ceros a
la izquierda cuando sea necesario. Es decir, por ejemplo el 0 se escribe 000000; el 11 se escribe
000011, etc. De esta forma, el problema se reduce a realizar 6 escogencias, donde cada uno tiene dos
posibles resultados. Se obtiene entonces que el número total de resultados es 2 2 2 2 2 2 = 26 = 64:
En este ejemplo, se empleó una generalización del principio básico del conteo, usando seis experi-
mentos. En general, si se realizan k experimentos, donde el i ésimo experimento tiene ni posibles
resultados, la combinación de los k experimentos tendrá
n = n1 n2 : : : nk
posibles resultados.
Ejemplo 14 Un total de 300 clientes solicitan préstamo en un Banco durante la expomóvil. Los
clientes que son aceptados forman una cartera especial llamada segmento expomóvil. Hallar el
número de carteras posibles que pueden resultar.
Este ejemplo es equivalente al ejemplo anterior. Cada cliente tiene dos posibles resultados, ser
aceptado o ser rechazado. Como son 300 clientes, hay un total de 2300 posibles resultados.
Nota: Un argumento similar demuestra que un conjunto de n elementos tiene un total de 2n
subconjuntos. En efecto, para formar un subconjunto cada elemento tiene dos posibles resultados:
pertenecer o no pertenecer al subconjunto.
S. Cambronero 12
1.3.2 Permutaciones
Ahora trataremos ejemplos con arreglos o permutaciones. Esto es, de n elementos se escogen k
elementos y se ordenan.
Ejemplo 15 Siete personas esperan para ubicarse en la …la de una ventanilla. De cuántas maneras
se pueden ordenar?
Para el primer campo existen 7 posibilidades. Para cada una de las posibilidades anteriores, quedan
6 posibilidades para el segundo espacio, y así sucesivamente. El número de maneras en que se
pueden ubicar en la …la es:
7 6 : : : 2 1 = 7! = 5040:
Ejemplo 16 Supongamos ahora que se trata de 12 clientes, de los cuales solamente 7 tendrán
espacio en la …la. El primer espacio tiene 12 posibilidades, el segundo tiene 11, y así sucesivamente.
En total se tiene
12 11 : : : 6 = 3991 680
posibilidades
Note que la respuesta del ejemplo anterior se puede escribir

12! 12!
12 11 : : : 6 = = :
5! (12 7)!
Ejemplo 17 Se desea crear un portafolio con una inversión de 15 millones en un instrumento, 12

en otro y 9 en un tercero. Se dispone de 8 instrumentos en total. ¿De cuántas maneras se puede
hacer?
Se trata de escoger 3 instrumentos de los 8: La cantidad a invertir en cada instrumento nos dice
que la escogencia se debe realizar en forma ordenada. Para escoger el primer instrumento se tienen
8 posibilidades. Cada una de las escogencias del primero, deja 7 opciones al segundo, y cada una
de estas deja 6 al tercero. Se obtiene:
8!
8 7 6= = 336:
(8 3)!
En general, si de n objetos se deben escoger k en forma ordenada, existen

n!
= n (n 1) : : : (n k + 1)
(n k)!
maneras de hacerlo. En particular, el número de permutaciones de n objetos es n!.
Ejemplo 18 A 5 Bancos estatales se les aplica un ranking. De cuántas maneras pueden quedar
ordenados?
Este problema es equivalente a encontrar el número de permutaciones de 5 objetos, lo cal nos da
5! = 120:
S. Cambronero 13
1.3.3 Combinaciones
Ejemplo 19 Supongamos que tenemos 7 personas, y de ellas queremos escoger 3 para darles em-
pleo. Aquí los 3 puestos son iguales, así que no importa el orden en que se escojan las personas.
La idea es pensar primero que el orden sí importa, y luego eliminar las permutaciones. Más pre-
cisamente, si los puestos fueran distintos, tendríamos (7 7!3)! = 7 6 5 = 210 maneras de escogerlas.
Pero, al ser los puestos iguales, cada escogencia de las tres personas la estamos contando 6 veces
(3! = 6): Consecuentemente, debemos dividir por 3!: Es decir, al …nal hay
7! 210
= = 35
(7 3)!3! 6
maneras de escoger las tres personas.
Este ejemplo se puede resumir y generalizar de la siguiente manera:

Si de n objetos (o individuos) se escogen k sin importar el orden, el número de manera de hacerlo
(número de combinaciones) es
n n!
= :
k k! (n k)!
n
Un poco más matemáticamente, un conjunto de n elementos tiene k subconjuntos de k elementos.
Ejemplo 20 Se desea crear un portafolio con tres instrumentos, cada uno con una inversión de
12 millones. ¿De cuántas maneras se puede hacer?
Se trata de escoger 3 instrumentos de los 8: Dado que la inversión en cada instrumento es idéntica,
el orden no importa. Consecuentemente hay
8
= 56
3
maneras de hacerlo. Compare con el ejemplo 17 donde el orden sí importaba.
Ejemplo 21 ¿Cuántas palabras se pueden formar con las letras A y B, de manera que la A
aparezca tres veces y la B cuatro veces? Note que las palabras son de siete letras. Para for-
mar una de ellas, se deben escoger los tres espacios en que se va a colocar la letra A, así que el
problema es el de hallar la cantidad de combinaciones de siete elementos, tomando 3 a la vez. La
respuesta es entonces
7 7! 7 6 5
= = = 35:
3 4! 3! 3 2
Note que la misma respuesta se obtiene escogiendo los cuatro espacios para la letra B. Esta solución
se puede también razonar de la siguiente manera: Se permutan las 7 letras como si fueran distintas,
es decir por ejemplo se pueden pintar todas de distinto color. Luego se deben eliminar todas las
permutaciones que producen la misma palabra, es decir todas las permutaciones de la letra A y
todas las de la letra B: Se debe dividir entonces por 4!3!:
Ejemplo 22 ¿Cuántas palabras se pueden formar con las letras A, B y C, de manera que la A
aparezca tres veces, la B cuatro veces y la C cinco veces? Ahora las palabras tienen 12 letras.
Primero escogemos los espacios para la A, luego para la B, y los de la C quedan automáticamente
determinados. Los espacios para la letra A se pueden escoger de 12
3 = 220 maneras distintas. Para
S. Cambronero 14
cada una de esas escogencias, se procede luego a escoger cuatro espacios de los nueve restantes, y
esto se puede hacer de 94 = 126 maneras distintas. En total hay entonces
12 9
= 220 126 = 27720
3 4
palabras. La solución se puede argumentar también de la siguiente manera: Primero se consideran
todas las letras como distintas, podríamos pensar en pintarlas todas de distinto color. Se tienen 12!
maneras de hacerlo. Dado que todas las permutaciones de la letra A son idénticas, se debe dividir
por 3!; Similarmente, se debe dividir por 4! y 5! para eliminar las repeticiones por permutaciones
de la letra B y las de la letra C: Se obtiene
12!
= 27720:
3!4!5!
Nota: Para i + j + k = n se denota
n n!
=
i; j; k i! j! k!
y en general, para k1 + : : : + km = n el coe…ciente multinomial
n n!
= :
k1 ; k2 ; : : : ; km k1 ! : : : km !
1.3.4 Ejemplos adicionales

Ejemplo 23 Tres hombres y cuatro mujeres se quieren sentar en …la de modo que los tres hombres
queden juntos ¿Cuántas maneras hay de hacerlo?
Hay 5 maneras de escoger los espacios para los hombres. Una vez escogidos los espacios, hay 3! = 6
maneras de ubicar los hombres en esos espacios, y 4! = 24 maneras de ubicar las mujeres en los
restantes. En total hay 5 6 24 = 720 maneras de sentar las siete personas.
Ejemplo 24 Tres hombres y cuatro mujeres se quieren sentar en …la de modo que los hombres no
queden todos juntos (es decir, al menos un hombre quede separado de los otros). ¿Cuántas maneras
hay de hacerlo?
Del total de 7! = 5040 posibles ordenamientos, se debe restar el número de ordenamientos en los
que quedan los tres hombres juntos. Esta cantidad fue calculada en el ejemplo anterior. De manera
que hay
5040 720 = 4320
maneras de hacerlo.
Ejemplo 25 Considere ahora el caso en que exactamente dos hombres queden juntos. Existen 20
maneras distintas de escoger los espacios para los hombres. Entonces la respuesta es 20 6 24 = 2880
maneras.
Ejemplo 26 Finalmente, si queremos los tres hombres están separados (no haya dos hombres
juntos). Los espacios para los hombres se pueden escoger de 10 maneras (¿por qué?). En total
hay entonces 10 6 24 = 1440 maneras de sentar las siete personas, con las condiciones dadas.
Otra manera de resolver este caso es restando al total de posibilidades 7! = 5040; los casos de los
ejemplos 23 y 25. Se obtiene:
5040 2880 720 = 1440:
S. Cambronero 15
Ejemplo 27 De cuántas maneras se pueden ordenar n personas en n sillas alrededor de una mesa
redonda. Aquí lo que importa es la posición relativa de cada persona con respecto a las otras. Si
fuera una …la de personas, sería n!: Pero, para cada posición de estas, hay n rotaciones que son
idénticas al considerarse como posiciones alrededor de la mesa. Entonces la respuesta es
n!
= (n 1)!
n
Ejemplo 28 Se quiere formar un portafolio que conste de 4 bonos soberanos y 3 corporativos.
Se dispone de 6 tipos de bonos soberanos y 9 tipos de bonos corporativos. Hallar el número de
portafolios que se pueden formar, asumiendo que solo se puede elegir un bono de cada ipo.
Los 4 bonos soberanos se pueden elegir de 64 maneras, es decir de 15 maneras. Mientras que
los 3 corporativos se pueden escoger de 93 maneras, esto es 84 maneras. Luego, hay un total de
15 84 = 1260 portafolios distintos.
Ejemplo 29 Cuántos portafolios de inversión de 7 títulos se pueden crear si disponemos de 15
emisores, cada uno de los cuales ofrece títulos en tres monedas distintas? Solo se permite invertir
un título por emisor.
Como los emisores deben ser distintos, debemos escoger 7 emisores de los 15. Esto se puede lograr
de
15
= 6453
7
maneras distintas. Una vez escogidos los emisores, cada uno tiene 3 posibilidades, es decir, dada
la escogencia de los emisores, hay 37 maneras de escoger las monedas. Entonces hay
6453 37 = 14 112 711
posibles portafolios.
1.3.5 Portafolios, bolas y cajas

Se dispone de cuatro tipos de acciones y se quiere formar un portafolio que conste de 11 acciones.
Por ejemplo, un posible portafolio consiste en comprar todas las 11 acciones del primer tipo.
Otra posibilidad es comprar 4 acciones del primer tipo, 3 del segundo, 2 del tercero y 2 del cuarto.
Queremos determinar cuántos portafolios posibles hay. Este tipo de problema se caracteriza porque
el número de acciones de cada tipo no está determinado. Esto lo hace caer en una categoría no
estudiada hasta el momento.
Para comenzar resolvamos el problema bajo la restricción de que cada tipo de acción debe aparecer
en el portafolio. Es decir, se debe comprar al menos una acción de cada tipo. El problema es
equivalente a distribuir 11 bolas idénticas en 4 cajas, de manera que cada caja tenga al menos una
bola. Las cajas sí son distinguibles. Una distribución de bolas en las 4 cajas se puede realizar
colocando las bolas en …la y escogiendo 3 espacios de los determinados por las bolas.
En la …gura 1.1 se muestra el ejemplo en el que se escogen los espacios 2; 5 y 9; que signi…ca colocar
2 bolas en la primera caja, 3 en la segunda, 4 en la tercera y 2 en la cuarta. Dado que las bolas
dejan 10 espacios entre sí, existen
10
= 120
3
maneras de escoger los espacios. Consecuentemente, existen 120 posibles portafolios. Veamos otros
problemas equivalentes a este.
S. Cambronero 16
Figure 1.1: Distribución de bolas idénticas en cajas.
Ejemplo 30 Supongamos que tenemos 3 posibles instrumentos para invertir 7 millones de colones.
La inversión en cada instrumento debe ser una cantidad positiva y en múltiplos del millón.
El problema es equivalente a distribuir 7 bolas idénticas en 3 cajas, de manera que ninguna caja
quede vacía. Hay un total de
6
= 15
2
posibles portafolios.
Ejemplo 31 ¿De cuántas maneras se puede escribir el número 7 como suma de tres enteros posi-
tivos? Es decir, ¿de cuántas maneras se puede expresar 7 = a + b + c; con a; b; c enteros positivos?
Este problema es equivalente al del ejemplo anterior, si pensamos en a; b y c como las cantidades
de millones a ser invertidas en cada instrumento. Hay un total de 15 maneras de escribir el 7 de
esa manera. Es un buen ejercicio determinar todas estas posibles maneras en forma explícita. Por
ejemplo
7 = 5 + 1 + 1 = 1 + 5 + 1 = 4 + 2 + 1 = 3 + 3 + 1 = ::::
En general, si se quiere distribuir n bolas idénticas en m cajas, el número de maneras de hacerlo

es
n 1 (n 1)!
= :
m 1 (m 1)! (n m)!
Ahora consideremos la posibilidad de que algunos instrumentos queden por fuera, es decir algunas
cajas queden vacías. En el caso de 7 millones y 3 instrumentos, podría tenerse posibilidades como
0 millones en el instrumento A; 6 millones en el instrumento B y 1 millón en el instrumento C: Si
xi es la cantidad de millones a ser invertida en el instrumento i; se trata entonces de hallar todas
las posibles soluciones de la ecuación xA + xB + xC = 7, con xi entero y xi 0. Si tomamos
yi = xi + 1 obtenemos yi > 0 y
yA + yB + yC = 10:
Este arti…cio de sumar 1 es equivalente a realizar una inversión …ja de un millón en cada instru-
mento, adicional a la distribución de los 7 millones. Esto no altera el número de portafolios. En la
interpretación con bolas y cajas, esto equivale a introducir 3 bolas adicionales, colocando una en
cada caja. Esas bolas no se van a mover, por lo que no altera la cantidad de posibles distribuciones.
Entonces el problema es equivalente al anterior, pero con 10 millones para invertir en vez de 7: En
total hay
9
= 36
2
S. Cambronero 17
posibles portafolios. En general, con n millones para invertir en m instrumentos, con la posibilidad
de dejar instrumentos por fuera se obtiene un total de
n+m 1
m 1
posibles portafolios. Note que en este último caso no se requiere m n:
Ejemplo 32 Se quiere formar un portafolio con 11 acciones compradas de un total de 5 tipos de

acciones. Calcule el número de posibles portafolios si se debe comprar al menos una acción de cada
tipo. Haga lo mismo con la posibilidad de omitir algunos tipos de acciones.
En el primer caso hay
11 1 10
= = 210
5 1 4
posibles portafolios. En el segundo hay
11 + 5 1 15
= = 1365:
5 1 4
1.3.6 La fórmula del binomio

La manera como arribamos al símbolo combinatorio nk no nos dejaba dudas de que se trata de
un número entero. Sin embargo, si solo se observara su de…nición algebraica
n n!
=
k k! (n k)!
no sería tan claro que estamos en presencia de un número entero. Por otro lado, el cómputo de este
coe…ciente puede volverse impreciso incluso usando computadoras si no se hace adecuadamente,
debido a los grandes valores de los factoriales. A continuación veremos una identidad que no solo
nos aclara algebraicamente que nk es un entero, sino que además nos permite su cálculo recursivo
de manera sencilla.
Para establecer la identidad, pensemos en un grupo de n personas, del cual queremos extraer grupos
de k personas. Sabemos que se pueden escoger en total nk grupos de k personas. Tomemos una de
esas personas, llamémosle Ana: De los grupos de k personas que se pueden elegir, algunos incluyen
a Ana y otros no. Los que incluyen a Ana son un total de nk 11 ; puesto que se deben elegir k 1
integrantes de las restantes n 1 personas. Los grupos que no incluyen a Ana son un total de
n 1
k puesto que todos los k integrantes deben elegirse de las restantes n 1 personas. Arribamos
así a la identidad
n 1 n 1 n
+ = : (1.3)
k 1 k k
Claramente esta identidad se puede veri…car en forma algebraica. El lector puede hacerlo como
ejercicio. Como mencionamos antes, esta identidad permite en primera instancia calcular todos
los coe…cientes binomiales en forma recursiva. Como valor agregado se obtiene en forma clara e
intuitiva el hecho que todos estos coe…cientes son enteros. En efecto, la recursión anterior se puede
resumir grá…camente en el llamado triángulo de Pascal.
S. Cambronero 18
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1
Es un buen ejercicio continuar el triángulo unas cuantas …las más. La …la n (comenzando con
n = 0) contiene los coe…cientes nk desde k = 0 hasta k = n: La fórmula (1.3) se ve re‡ejada
en el hecho que cada entrada del triángulo, excepto los unos, se obtiene como la suma de las dos
entradas que están sobre ella en la …la anterior. Del triángulo se deduce por ejemplo
8 7 7
= 56; = 35; = 21:
5 4 5
Además, si se usa la fórmula (1.3) se obtiene por ejemplo
9 8 8 9 8 8
= + = 56 + 28 = 84; = + = 28 + 8 = 36:
6 5 6 7 6 7
El triángulo de Pascal es particularmente útil en el desarrollo binomial

n
X
n n n k k
(a + b) = a b :
k
k=0
8
Por ejemplo, para calcular (a + b) bastará con observar la última …la del triángulo mostrado
arriba:
8
(a + b) = a8 + 8a7 b + 28a6 b2 + 56a5 b3 + 70a4 b4 + 56a3 b5 + 28a2 b6 + 8ab7 + b8 :
1.3.7 Ejercicios
1. Seis personas se quieren sentar en una sala en la que hay nueve asientos. ¿De cuántas maneras
se pueden distribuir en dichos asientos?
2. Dos hombres y cinco mujeres se quieren sentar en …la de manera que los dos hombres queden
separados. ¿De cuántas maneras lo pueden hacer?
3. Dos hombres y cinco mujeres se quieren sentar en …la de manera que las cinco mujeres queden
juntas. ¿De cuántas maneras lo pueden hacer?
4. Resuelva el ejercicio anterior, pero de manera que exactamente dos mujeres queden juntas.
5. Usando la fórmula del binomio, deduzca que un conjunto de n elementos tiene exactamente
2n subconjuntos.
6. ¿De cuántas maneras se pueden ordenar en …la cuatro mujeres y tres hombres, si...
S. Cambronero 19
(a) ...no hay restricciones?

(b) ...los hombres deben quedar seguidos, y las mujeres también?
(c) ...los hombres deben quedar seguidos pero las mujeres no?
7. De ocho mujeres y seis hombres, se quiere escoger un comité que conste de 3 mujeres y tres
hombres. Determine el número de maneras en que se puede hacer si...
(a) ...no hay restricciones.

(b) ...dos hombres se rehusan a participar juntos en el comité.
(c) ...dos mujeres se rehusan a participar juntas en el comité.
(d) ...un hombre y una mujer se rehusan a participar juntos en el comité.
8. Considere el experimento de lanzar dos dados distintos.
(a) ¿Cuántos resultados posibles hay?

(b) ¿En cuántos casos sale el mismo número en ambos?
(c) ¿En cuántos casos, el primer dado muestra un número menor que el segundo?
9. Una cartera de inversión consta de:
(a) Una inversión de 1 millón de dólares en un índice X que puede rendir un 10%, un 0%
ó un 10%:
(b) Una nota estructurada con un principal de 5 millones de dólares que devuelve el principal
y un 8% del mismo en caso que el índice X tenga rendimiento negativo. En caso contrario
solo devuelve el principal.
Determine el número de posibles rendimientos de la cartera, y cuál es el óptimo.

10. En una cartera de crédito, se clasi…can los clientes de acuerdo con su estado civil en cuatro
categorías, de acuerdo con sus estudios en cinco categorías, de acuerdo con la tenencia de
vivienda en tres categorías y de acuerdo con su trabajo, en tres categorías. Si se agrupan los
clientes que coinciden en todas la categorías, ¿cuantos grupos son?
11. De una población de 3000 individuos, se quiere escoger una muestra de 1200 para calibrar
el Score de Comportamiento. ¿Cuántas posibles muestras hay? Puede dejar la respuesta
indicada como un coe…ciente binomial.
12. Se dispone de 9 millones para invertir en 7 instrumentos, siendo la inversión en cada in-
strumento un número entero de millones. Calcule el número de posibles portafolios si no se
pueden dejar instrumentos por fuera. Haga lo mismo con la posibilidad de dejar instrumentos
por fuera.
13. Se dispone de 7 millones para invertir en 12 instrumentos, siendo la inversión en cada instru-
mento un número entero de millones. Calcule el número de posibles portafolios (note que de
…jo deben quedar instrumentos por fuera).
14. De una asamblea de 17 miembros, se debe escoger a 5 de ellos para partir en una misión
diplomática. ¿De cuántas maneras se puede hacer?
S. Cambronero 20
15. En el ejercicio anterior, suponga que los 5 miembros se eligen para formar la junta directiva.
Es decir, cada uno tendrá un puesto distinto (presidente, vicepresidente, etc.) ¿De cuántas
maneras se puede hacer?
16. Se dispone de 12 millones de colones para invertir en 3 instrumentos disponibles. En cada
instrumento se puede invertir solo en múltiplos de un millón. Halle el número de portafolios
que se pueden formar si:
(a) Se debe invertir al menos un millón en cada instrumento

(b) Se debe invertir al menos dos millones en cada instrumento
(c) Se debe invertir 5 millones, 4 millones y 3 millones respectivamente
17. De un total de 9 bancos, hay 3 en estado normal, 4 en estado inde…nido y 2 en estado

irregular. Se va a realizar una campaña de seguimiento a 4 Bancos elegidos al azar. De
cuántas maneras se puede elegir el grupo de 4 Bancos si:
(a) No se escogen Bancos en estado inde…nido

(b) Se escoge a lo sumo 2 Bancos en estado normal
(c) Se escoge al menos 2 Bancos en estado irregular
18. Un juego consiste en tirar una moneda y un dado. Si sale escudo entonces se gana el número
de colones que indica el dado. Si sale corona, se pierden 5 colones pero se gana el doble de
lo que indique el dado. Determine:
(a) El peor resultado posible para el jugador

(b) El mejor resultado posible para el jugador
(c) El número de posibles resultados.
19. Se dispone de 12 millones de colones para invertir en 3 de 20 instrumentos disponibles. Halle

el número de portafolios que se pueden formar en cada caso:
(a) Se debe invertir 4 millones en cada uno de los tres instrumentos

(b) Se debe invertir 6 millones, 3 millones y 3 millones respectivamente
(c) Se debe invertir 7 millones, 3 millones y 2 millones respectivamente
20. Se quiere formar un portafolio con la compra de 27 acciones, repartidas en 5 tipos de acción
disponibles. Halle el número de portafolios que se pueden formar si:
(a) No hay restricciones

(b) Debe aparecer al menos una acción de cada tipo
(c) Deben aparecer al menos dos acciones de cada tipo
21. Cada día el tipo de cambio cae un colón, se mantiene igual o sube 2 colones. Si se observa el
tipo de cambio durante los próximos 7 días, ¿cuántos caminos posibles hay? Por ejemplo, si
el tipo de cambio actual es 555; un posible camino es
(555; 557; 557; 556; 558; 560; 559; 559)
que se puede resumir como smcsscm, donde s representa una subida, c una caida y m
signi…ca que se mantiene.
S. Cambronero 21
7
22. Halle el coe…ciente de x6 y 4 en la expansión de x2 + y :
23. Halle el coe…ciente de x4 y 4 en el desarrollo de
9 8
(xy + 1) (x + y) :
24. En cada uno de los siguientes casos, determine si el polinomio p (x; y) tiene un término
semejante al monomio dado:
15
(a) p (x; y) = x3 + y 2 ; x9 y 26
13
(b) p (x; y) = x2 + y 3 ; x18 y 12
9
(c) p (x; y) = x x + y 4 ; x6 y 16 :
Capítulo 2
Espacios de probabilidad discretos
2.1 Introducción
La teoría de probabilidad se podría de…nir en forma intuitiva como una herramienta para capturar
de alguna forma las creencias, opiniones, tendencias, frecuencias, y en general para expresar el
grado de seguridad que tenemos de que cierto evento ocurra en el futuro. La posibilidad de que
esas creencias u opiniones se conviertan en verdaderas previsoras de la realidad futura, es de vital
importancia en áreas tan variadas como los juegos de azar, las …nanzas, la política, etc. La teoría
de probabilidades nace y se desarrolla en estrecha relación con ese tipo de problemas en los que
se requiere o se desea prever eventos futuros con base en cierta medida de veracidad previamente
asignada.
Para entender mejor el concepto de probabilidad, tomemos uno de los ejemplos más usados por la
literatura. Supongamos que lanzamos una moneda al aire un número grande de veces. Es esperable
que, más o menos en la mitad de los casos, la moneda nos mostrará un escudo. Esto se traduce
en términos probabilísticos en lo siguiente: Al tirar una moneda equilibrada, la probabilidad de
que salga escudo es 12 : Intuitivamente, esta noción de probabilidad está ligada a la frecuencia con
que un evento aleatorio ocurre. Si lanzamos la moneda n veces, la proporción de escudos en los
primeros n lanzamientos está dada por
n(E )
; (2.1)
n
donde n ( E ) es la cantidad de lanzamientos que resultan en escudo.
A pesar de que nadie esperaría que n(nE ) sea siempre igual a 12 , es de esperarse que si repetimos el
experimento un número su…ciente de veces, esta proporción sea cercana a un medio. Es decir, es
de esperar que
n(E ) 1
lim = : (2.2)
n!1 n 2
Planteemos un problema ligeramente distinto: Supongamos que tenemos una caja con 10 bolas del
mismo tamaño y forma, pero algunas son blancas y otras son negras. Comenzamos a extraer bolas
de la caja al azar, es decir, sin observar su color en el momento de la extracción. Una vez fuera de
la caja anotamos el color y la devolvemos a la caja. Si de 100 veces, sale 32 veces una bola blanca,
estaríamos tentados a pensar que el número de bolas blancas en la caja es 3. Si seguimos el proceso
22
S. Cambronero 23
y en 1000 repeticiones sale 280 veces una bola blanca, estaríamos casi (o tal vez completamente)
seguros de que hay exactamente 3 bolas blancas en la caja.
Toda esta intuición detrás de los experimentos antes descritos, es lo que trata de formalizar la
teoría de las probabilidades. Desde luego que la intuición es solo la motivación inicial en esta
teoría, y como el lector podrá ir enterándose, la teoría desarrollada sabrá retribuir con resultados
interesantes a aquellos problemas que le dieran sustento.
2.2 Muestras y eventos

La teoría de probabilidades se desarrolla sobre un espacio de probabilidad, que en principio es un
conjunto , llamado espacio muestral. Los elementos de se llaman muestras y los subconjuntos
de se llaman eventos. Los eventos están formados por muestras o elementos de : Los eventos se
pueden combinar para producir nuevos eventos mediante las operaciones elementales de conjuntos.
Conviene repasar brevemente estos tipos de operaciones.
2.2.1 Operaciones booleanas

Todos los eventos, salvo el evento o conjunto vacío (denotado por ;), están formados por elementos
(muestras). Para indicar que una muestra pertenece a un evento A se escribe a 2 A: Para indicar
que a no es pertenece al conjunto A se escribe a 2 = A.
Dos eventos se consideran iguales si tienen exactamente los mismos elementos. Se dice que A está
contenido en B (es subconjunto de B) si todo elemento de A es también elemento de B. Para
indicar que A está contenido en B se escribe A B:
Ejemplo 33 Suponga que = f1; 2; 3; 4; 5g : El evento A = f3; 4g está contenido en el evento

B = f1; 3; 4g :
Para de…nir un evento particular, es necesario precisar los elementos que lo forman. Para esto se
procede de dos maneras. Una manera es por enumeración de todos sus elementos (extensión).
Ejemplo 34 El conjunto formado por las los números 1; 2; 3; 5; 7 se denota A = f1; 2; 3; 5; 7g :
La otra manera es por comprensión, es decir ofreciendo un criterio para determinar si un elemento
pertenece o no al evento.
Ejemplo 35 En = f1; 2; 3; 4; 5g : El evento A = f2; 4g se puede de…nir por comprensión así:
A = fx 2 : x es parg :
Intersección de eventos
Dados dos eventos A y B, se de…ne su intersección como el evento formado por los elementos
que pertenecen simultáneamente al evento A y al evento B. Tal evento se denota por A \ B o
simplemente AB: Simbólicamente
A \ B = AB = fx 2 : x 2 A y x 2 Bg:
S. Cambronero 24
Ejemplo 36 Sea el conjunto de los números naturales y considere los eventos
A = fx 2 : x es divisor de 18g
B = fx 2 : x es divisor de 45g
Por extensión tenemos
A = f1; 2; 3; 6; 9; 18g; B = f1; 3; 5; 9; 15; 45g:
Luego A \ B = f1; 3; 9g:
Ejemplo 37 Sea el conjunto de los números naturales y considere
A = fx 2 : x es múltiplo de 4g
B = fx 2 : x es imparg
Note que A = f4; 8; 12; 16; 20; :::g y B = f1; 3; 5; 7; 9; 11; :::g: Entones A \ B = ;: En casos como
este se dice que A y B son disjuntos o mutuamente excluyentes.
Propiedades de la intersección
1. Para todo par de eventos A y B se cumple
A\B A; A\B B:
2. La intersección de eventos es conmutativa: A \ B = B \ A:

3. La intersección es asociativa: (A \ B) \ C = A \ (B \ C):
4. Si A B se tiene A \ B = A:
5. Si D AyD B entonces D A \ B:
Uso de diagramas o pinturas A veces es conveniente utilizar diagramas para darse una idea
geométrica de lo que signi…ca una operación entre conjuntos, o cierta identidad. En dichos diagra-
mas los conjuntos se pintan como …guras geométricas en un plano, por lo que debe tenerse cuidado
y recordar que estas pinturas son solo un arti…cio para darse una mejor idea y no sustituyen en
absoluto el concepto. En el caso de la intersección, la podemos representar así:
Representación grá…ca de la intersección de conjuntos.

Una buena práctica para el lector es convencerse de las propiedades enunciadas arriba, mediante
el uso de diagramas.
S. Cambronero 25
Unión de eventos
Dados dos eventos A y B, se de…ne su unión como el evento formado por los elementos que
pertenecen al menos a uno de ellos. Lo denotamos por A [ B: Simbólicamente:
A [ B = fx 2 : x 2 A o x 2 Bg:
Grá…camente podríamos representar la unión de conjuntos así:
Representación grá…ca de la unión de conjuntos.

Ejemplo 38 Sea = N y sean
A = fx 2 E : x es divisor de 20g
B = fx 2 E : x es divisor de 16g :
Por extensión se tiene A = f1; 2; 4; 5; 10; 20g y B = f1; 2; 4; 8; 16g: Luego
A [ B = f1; 2; 4; 5; 8; 10; 16; 20g:
Propiedades de la unión
1. Para dos eventos A y B se tiene que: A A[B y B A [ B:
2. La unión de eventos es conmutativa: A [ B = B [ A:
3. La unión de eventos es asociativa: (A [ B) [ C = A [ (B [ C):
4. Si A B se tiene A [ B = B:
5. Si A DyB D entonces A [ B D:
Complemento y diferencia
Dados dos eventos A y B; la diferencia B A se de…ne como el evento formado por los elementos
de B que no están en A: Más precisamente se tiene
B A = fx 2 B : x 2
= Ag :
B A
Representación grá…ca de la diferencia de conjuntos.

S. Cambronero 26
Figure 2.1: Representación grá…ca del complemento.
A la diferencia A se le llama complemento de A. Este conjunto lo denotaremos por Ac . Se

tiene entonces:
Ac = A = fx 2 : x2
= Ag :
El complemento de A en lo podemos representar como se muestra en la siguiente …gura:
Ejemplo 39 Sea = R y sea A = fx 2 : x < 2g: Entonces
Ac = fx 2 :x 2g:
Ejemplo 40 Sean A = [1; 4] y B = [3; 6]: Entonces A [ B = [1; 6]; A \ B = [3; 4] y A B = [1; 3[:
Leyes de De Morgan
Si A y B son eventos se tiene:
(A [ B)c = Ac \ B c
(A \ B)c = Ac [ B c
En efecto, para que un elemento pertenezca al complemento de A [ B es necesario y su…cienet

que no pertenezca a ninguno de estos conjuntos, es decir que pertenezca a ambos complementos.
Similarmente, para pertenecer al complemento de la intersección es necesario y su…ciente que no
pertenezca a alguno de ellos, es decir que pertenezca a la unión de los complementos. En modo
prosa, estas leyes se enuncian así:
El complemento de la unión es la intersección de los complementos,

y el complemento de la intersección, es la unión de los complementos.
En caso que A y B y E son eventos, las leyes de De Morgan toman la siguiente forma:
E (A [ B) = (E A) \ (E B)
E (A \ B) = (E A) [ (E B) :
S. Cambronero 27
2.3 Probabilidad clásica

Los ejemplos mencionados en la introducción, y muchos otros que iremos analizando, tienen que
ver con la noción clásica de la probabilidad. Consideramos un conjunto …nito :
Si A es un evento, se de…ne la probabilidad (clásica) de A como
jAj
P (A) = :
j j
Aquí jAj denota el número de elementos de A: Por ejemplo, si se tira la moneda una vez, una
escogencia de podría ser = fE; Cg : En tal caso, de la de…nición se tiene
jfEgj 1
P (fEg) = = :
jfE; Cgj 2
Nótese que, en general, con esta de…nición se tiene P ( ) = 1:
Ejemplo 41 Considere una caja con 3 bolas blancas y 7 bolas negras, de la cual queremos sacar
una bola al azar. Nuestro podría ser
= fB1 ; B2 ; B3 ; N1 ; N2 ; :::; N7 g
donde los Bi denotan las bolas blancas y los Nj denotan las bolas negras. Queremos sacar al azar
una bola y nos preguntamos cuál es la probabilidad de que sea blanca. Estamos preguntándonos por
P (A) ; donde A = fB1 ; B2 ; B3 g : De acuerdo con nuestra de…nición se tendrá:
jAj 3
P (A) = = :
j j 10
2.3.1 Propiedades
Supongamos que tiene N elementos. Si A tiene n elementos, es claro que su complemento
Ac = A tiene N n elementos, así que
jAc j N n n
P (Ac ) = = =1 =1 P (A) :
j j N N
En particular
P (;) = 1 P ( ) = 0:
Por otro lado, si A y B son mutuamente excluyentes (disjuntos) se tiene que jA [ Bj = jAj + jBj ;
luego
jAj + jBj
P (A [ B) = = P (A) + P (B) :
j j
En general, si A1 ; A2 ; :::; An son disjuntos dos a dos se tiene1
n
! n
[ X
P Ai = P (Ai ) :
i=1 i=1
En resumen, la probabilidad clásica sobre un conjunto …nito cumple:

1 Cuando decimos "disjuntos dos a dos" queremos decir dos cualesquiera de ellos son disjuntos, es decir que
Ai \ Aj = ; siempre que i 6= j:
S. Cambronero 28
1. P ( ) = 1; P (;) = 0:
2. P (Ac ) = 1 P (A) para todo A :
3. Si A1 ; A2 ; :::; An son disjuntos dos a dos se tiene:
n
! n
[ X
P Ai = P (Ai ) :
i=1 i=1
Esta última propiedad se conoce como aditividad …nita.
2.3.2 Algunos ejemplos

A continuación se presentan varios ejemplos que ayudarán a aclarar el concepto de probabilidad
clásica y sus propiedades.
Ejemplo 42 De un grupo de 3 clientes buenos y 4 malos, se escogen dos clientes al azar. ¿Cuál
es la probabilidad de que los dos escogidos sean clientes buenos?
Primero veamos quién es . Como se escogen 2 clientes de los 7, los elementos de son combi-
naciones de dos elementos tomadas de un conjunto de siete. Se sigue entonces
7
j j= = 21:
2
Ahora, el evento A al que queremos calcularle la probabilidad, está formado por combinaciones de
dos clientes buenos, así que
3
jAj = = 3:
2
3
Finalmente, la probabilidad buscada es P (A) = 21 = 17 :
Ejemplo 43 Si se lanza un dado dos veces ¿cuál es la probabilidad de que los resultados obtenidos
sumen 6? ¿De que sumen 7?
2
En este caso se puede elegir = f1; 2; : : : ; 6g ; así que j j = 36: En el primer caso buscamos la
probabilidad del evento
A = f(1; 5) ; (5; 1) ; (2; 4) ; (4; 2) ; (3; 3)g ;
5
la cual es P (A) = 36 : En el segundo caso el evento es
B = f(1; 6) ; (6; 1) ; (2; 5) ; (5; 2) ; (3; 4) ; (4; 3)g ;

6
así que P (B) = 36 = 16 :
Ejemplo 44 Si se lanza una moneda 20 veces, hallar la probabilidad de que el escudo salga exac-
tamente una vez.
20
Se puede tomar = f0; 1g ; donde 0 signi…ca que sale corona y 1 signi…ca que sale escudo.
Es decir, los elementos de son 20 étuplas cuyas entradas son 0 ó 1: Si A es el evento "sale
exactamente un escudo" se tiene jAj = 20: Entonces P (A) = 220
20 :
S. Cambronero 29
Este problema se puede resolver también considerando A1 = f(1; 0 : : : 0)g ; A2 = f(0; 1; 0; : : : ; 0)g y
así sucesivamente. Cada Ai tiene un elemento, así que P (Ai ) = 2120 . Dado que los eventos son
mutuamente excluyentes, la probabilidad buscada es:
20
! 20
[ X 20
P Ai = P (Ai ) = 20 :
i=1 i=1
2
Ejemplo 45 En una cartera de crédito, se clasi…can los clientes en buenos, regulares y malos, de
acuerdo con su historial de impago. Se supone que la cartera consta de 75 clientes buenos, 300
regulares y 125 malos. Si se escogen 3 clientes al azar, hallar:
1. La probabilidad de que al menos uno sea bueno.

2. La probabilidad de que todos sean buenos.
El espacio muestral consiste de todas las combinaciones de 500 elementos, tomando 3 a la vez.
Entonces
500
j j= :
3
1. Si A es el evento respectivo, entonces Ac es el conjunto formado por las combinaciones

tomadas de clientes regulares o malos. Se tiene
425
P (Ac ) = 3
500 = 0:613 47
3
Luego P (A) = 1 0:613 47 = 0:386 53:

2. En este caso se quiere hallar la probabilidad del evento B formado por combinaciones de
clientes buenos. Por lo tanto
75
3
P (B) = 500 = 0:00326:
3
Ejemplo 46 En una cartera de crédito que consta de 3000 clientes, se observa el comportamiento
de estos durante un año. Se considera que un cliente cae en impago, si en algún momento del año
tuvo más de 90 días de atraso en el pago de sus cuotas. Supongamos que la cartera se divide en
cuatro grupos: A; B; C y D; de acuerdo con algún criterio previamente establecido. En cada grupo
se calcula el número de clientes que cae en impago y se divide por el número de clientes del grupo.
Dicho cociente se interpreta como la probabilidad de impago de cada cliente en el grupo. Si por
ejemplo, el grupo A consta de 200 clientes, de los cuale 45 cayeron en impago, la probabilidad de
impago de este grupo será
45
P DA = = 0:225
200
Se espera entonces, que de los clientes de este grupo, aproximadamente un 22:5% caerá en impago
durante el año siguiente.
S. Cambronero 30
Ejemplo 47 Una manera distinta de asignar probabilidades de impago con base en el compor-
tamiento de los clientes, podría ser observar el comportamiento del cliente por un período más
largo de tiempo, contar el número de meses que cada cliente estuvo atrasado en sus cuotas, y
dividirlo por el número total de meses observados. De esta forma, cada cliente podría tener una
probabilidad de impago distinta. Por ejemplo, si se observa el comportamiento dutante 8 años y
cierto cliente estuvo atrasado durante 7 meses, se obtiene la siguiente probabilidad de impago para
este cliente:
7
PD = 0:073
96
2.3.3 Ejercicios
1. Si se lanzan dos monedas equilibradas, halle la probabilidad de que salga al menos un escudo.
2. Si se lanzan dos dados, halle la probabilidad de que la suma de los números resultantes sea
par. Haga lo mismo con impar.
3. Se extraen tres bolas aleatoriamente de una urna que contiene 5 blancas y 7 negras. Halle la
probabilidad de que una de ellas sea blanca y las otras dos sean negras.
4. Siete personas escogen al azar sillas para sentarse, de un total de once sillas que están
numeradas del 1 al 11. Halle la probabilidad de que las sillas 5 y 7 no sean elegidas.
5. Dos hombres y cinco mujeres se sientan en …la. Halle la probabilidad de que:
(a) los hombres queden separados

(b) las cinco mujeres queden juntas
(c) exactamente tres mujeres queden juntas
(d) los hombres queden seguidos, y las mujeres también
(e) los hombres queden seguidos pero las mujeres no queden todas seguidas.
6. De ocho mujeres y seis hombres, se escoge aleatoriamente un comité que conste de 4 mujeres
y 3 hombres. Halle la probabilidad de que:
(a) Dos hombres determinados no sean elegidos juntos

(b) Dos mujeres determinadas no sean elegidas juntas
(c) Un hombre y una mujer determinados no sean elegidos juntos.
7. Si se lanza un dado dos veces, halle la probabilidad de que:
(a) los resultados sumen a lo sumo 7

(b) los resultados sumen al menos 6
(c) salga el mismo número en ambos lanzamientos
(d) el primer lanzamiento muestra un número menor que el segundo.
8. Una cartera de crédito consta de 75 clientes malos, 130 indeterminados y 695 buenos. Si se
escogen 3 clientes al azar calcule:
S. Cambronero 31
(a) la probabilidad de que a lo sumo uno sea malo

(b) la probabilidad de que ninguno sea malo.
9. De un grupo de 350 clientes de crédito, se sabe que en el último año, 70 cayeron en impago.
Si se escogen 7 clientes al azar, halle la probabilidad de que ninguno haya caído en impago.
10. Un cliente de crédito estubo en atraso durante 5 meses, en los últimos 3 años. Si se escogen 4
meses al azar, halle la probabilidad de que, en al menos uno de esos meses, se haya encontrado
al día en sus pagos.
11. Nueve personas se distribuyen aleatoriamente en 13 asientos que están en …la. Halle la
probabilidad de que los 4 asientos que quedan vacíos estén juntos.
12. De trece asientos que están en …la y son blancos, se escogen 9 y pintan de azul. Halle la
probabilidad de que los 4 asientos que quedan blancos estén juntos. Comente la relación
entre este ejercicio y el anterior.
13. De 8 mujeres y 6 hombres, se escoge un grupo de 5 personas. Halle la probabilidad de que
(a) el grupo conste solo de hombres

(b) el grupo conste solo de mujeres
(c) el grupo conste de 3 hombres y 2 mujeres
14. Un portafolio de inversión consta de:
(a) Una inversión de 1 millón de dólares en un índice X que puede rendir un 10%, un 0%
ó un 10%:
(b) Una nota estructurada con un principal de 5 millones de dólares que rinde un 8% en
caso que el índice X tenga rendimiento negativo. En caso contrario el rendimiento en
nulo.
Si los tres escenarios del índice X tienen la misma probabilidad, halle la probabilidad de que
el portafolio tenga un rendimiento positivo.
15. En una cartera de crédito, se clasi…can los clientes de acuerdo con su estado civil en cuatro
categorías, de acuerdo con sus estudios en cinco categorías, de acuerdo con la tenencia de
vivienda en tres categorías y de acuerdo con su trabajo, en tres categorías. Dos clientes son
elegidos al azar. Halle la probabilidad de que
(a) coincidan exactamente en dos categorías

(b) coincidan en exactamente tres categorías
16. De un total de 9 bancos, hay 3 en estado normal, 4 en estado inde…nido y 2 en estado

irregular. Se eligen 4 Bancos al azar para realizarles una auditoría. Halle la probabilidad de
que
(a) no se escojan Bancos en estado inde…nido

(b) se escojan a lo sumo 2 Bancos en estado normal
S. Cambronero 32
(c) se escojan al menos 2 Bancos en estado irregular
17. Un juego consiste en tirar una moneda y un dado. Si sale escudo entonces se gana el número
de colones que indica el dado. Si sale corona, se pierden 5 colones pero se gana el doble de
lo que indique el dado. Determine:
(a) la probabilidad de obtener una ganancia positiva

(b) la probabilidad de ganar al menos 4 colones
18. Cada día el tipo de cambio cae un colón, se mantiene igual o sube 2 colones. Halle la
probabilidad de que dentro de 3 días el tipo de cambio sea igual al de hoy. Todos los posibles
caminos tienen la misma probabilidad.
19. En una cartera de 2500 clientes, hay exactamente 300 de categoría AAA. Se realiza una rifa
para exonerar del pago a 5 de esos clientes. Halle la probabilidad de que:
(a) los 5 clientes elegidos sean AAA

(b) al menos uno sea AAA
(c) exactamente dos de los 5 sean AAA.
2.4 Espacios …nitos

Retomemos uno de los ejemplos de la introducción. Tomemos una caja con 3 bolas blancas y 7
bolas negras. Aparte del color, las bolas son indistinguibles. Sin embargo, para ser consecuentes
con la intuición y crear un modelo adecuado, debimos considerarlas como distintas al escribir
= fB1 ; B2 ; B3 ; N1 ; :::; N7 g : Pero realmente no nos interesa distinguir entre las bolas blancas, o
entre las bolas negras, en realidad solo hay dos resultados posibles; b y n (blanco y negro). Podemos
entonces tomar un nuevo espacio = fb; ng ; solo que ahora se de…ne
3 7
P (fbg) = ; P (fng) = :
10 10
Para esto debemos extender entonces el concepto de probabilidad, apartándonos un poco del caso
clásico.
De…nición 1 Si es un conjunto …nito, una medida de probabilidad en es una función P;

de…nida en los subconjuntos de ; que toma valores no negativos y que cumple:
1. P ( ) = 1
2. Si A; B son disjuntos, se cumple P (A [ B) = P (A) + P (B) :
Nótese que P (;) = 0: En efecto, dado que y ; son disjuntos se tiene
1 = P ( ) = P ( [ ;) = P ( ) + P (;) = 1 + P (;)
de donde al cancelar se obtiene el resultado.

Por otro lado, como todo evento satisface A [ Ac = se sigue que
P (Ac ) = 1 P (A) :
S. Cambronero 33
Ejemplo 48 Con = f0; 1g ; una medida de probabilidad se puede de…nir mediante P (f1g) = p;
P (f0g) = 1 p; donde 0 p 1:
Nota: Considere una medida de probabilidad P en = f! 1 ; ! 2 ; :::; ! n g : Si se de…ne pi = P (f! i g)
se tiene que los pi son positivos y suman 1
n
X
pi = 1:
i=1
En algunos contextos a pi se le llama el peso de la muestr ! i : Si A se tiene

X
P (A) = pi :
i2A
Toda medida de probabilidad en un conjunto …nito tiene esta forma.

Ejemplo 49 Siguiendo con la caja de 3 bolas blancas y 7 negras, suponga que sacamos una bola
y observamos su color, luego la devolvemos a la caja y realizamos otra extracción aleatoria. Para
modelar este experimento podemos tomar
= f! 1 ; ! 2 ; ! 3 ; ! 4 g
33
donde ! 1 = (b; b) representa la muestra en que ambas bolas son blancas y tiene un peso p1 = 100 =
9 37 21
100 : Similarmente ! 2 = (b; n) y ! 3 = (n; b) tienen peso p 2 = p 3 = 100 = 100 y ! 4 = (n; n) tiene
49
peso p4 = 100 : Nótese que
9 + 21 + 21 + 49
p1 + p 2 + p 3 + p4 = = 1:
100
Ejemplo 50 Considere el experimento de lanzar un dado dos veces y observar la suma de los
resultados. En este caso el espacio muestral es
= f2; 3; : : : ; 12g
k 1
y los pesos son pk = 36para k = 2; : : : ; 7 y pk = 1336 k para k = 8; : : : ; 12: Se invita al lector a
veri…car estos datos y a observar que p1 + : : : + p12 = 1: Es interesante observar cierta simetría
5
en estos pesos, con respecto a k = 7: En efecto, note que p8 = p6 = 36 ; p9 = p5 = 19 : Es
importante aclarar que los pesos se calculan usando la probabilidad clásica en el espacio de las 36
posibles combinaciones de los dos lanzamientos. Sin embargo, esto nos permite crear un modelo
más pequeño, dado que el interés está puesto en la suma de los dos lanzamientos y no en los
resultados de cada uno de ellos.
2.4.1 Algunas propiedades

Sea …nito, P una medida de probabilidad sobre ; y sean A y B eventos. Si el evento A está
contenido en el evento B (en símbolos A B), entonces B es la unión de los eventos A y
B A = fx 2 B : x 2
= Ag :
Como estos eventos son disjuntos se obtiene
P (B) = P (A) + P (B A)
es decir
P (B A) = P (B) P (A) : (2.3)
S. Cambronero 34
Ejemplo 51 En cierta Universidad, el 1.5% de los estudiantes son de San José y estudian Eco-
nomía. Los estudiantes que estudian Economía representan el 2.3% del total de estudiantes de la
Universidad. Si un estudiante es elegido al azar, hallar la probabilidad de que estudie Economía y
no sea de San José.
Sea E es el evento formado por los estudiantes de Economía y A el evento formado por los estudi-
antes de Economía que son de San José. Nos interesa la probabilidad del evento E A: Tenemos
P (E A) = P (E) P (A) = 0:023 0:015 = 0:008 :
Cuando A no es subconjunto de B; la identidad (2.3) no necesariamente se cumple. Sin embargo,
dado que
B A = B (A \ B)
y A\B B se tiene
P (B A) = P (B) P (A \ B) :
Ejemplo 52 El ejemplo anterior se puede resolver tomando el mismo evento E y el evento S for-
mado por todos los estudiantes de San José. Se tiene P (E \ S) = 1:5 de forma que la probabilidad
buscada es
P (E S) = P (E) P (E \ S) = 0:023 0:015 = 0:008 :
Nótese además que A [ B se escribe como
A [ B = (A B) [ (B A) [ (A \ B) :
En palabras, los elementos de A [ B son aquellos que están solo en A (en A B) solo en B (en
B A) o en ambos (en A \ B). Dado que esta es una unión de tres conjuntos que son mutuamente
excluyentes, se deduce que
P (A [ B) = P (A B) + P (B A) + P (A \ B)
= P (A) P (A \ B) + P (B) P (A \ B) + P (A \ B) :
En resumen se tiene
P (A [ B) = P (A) + P (B) P (A \ B) : (2.4)
Intuitivavamente, al sumar P (A) y P (B) se toma dos veces la probabilidad de la intersección, por
lo que debe corregirse restando ese valor.
Ejemplo 53 En un grupo de 10 personas hay dos parejas de esposos. Si se escogen al azar 7 de
esas 10 personas, hallar la probabilidad de que salga al menos una de las dos parejas.
Si A es el evento que salga la primera pareja, y B es el evento que salga la segunda, se debe calcular
P (A [ B) : Se tiene
8 8 6
5 5 3 23
P (A [ B) = P (A) + P (B) P (A \ B) = 10 + 10 10 = :
7 7 7
30
Nota: La propiedad anterior demuestra, en particular, que siempre se tiene
P (A [ B) P (A) + P (B) :
En general, utilizando el principio de inducción, se puede demostrar la desigualdad
n
! n
[ X
P Ai P (Ai ) :
i=1 i=1
S. Cambronero 35
2.4.2 Principio de inclusión-exclusión

La propiedad (2.4) se generaliza de la siguiente manera
n
! n
[ X X X
P Ai = P (Ai ) P (Ai1 \ Ai2 ) + P (Ai1 \ Ai2 \ Ai3 ) :::
i=1 i=1 i1 <i2 i1 <i2 <i3
n+1
+ ( 1) P (A1 \ ::: \ An ) :
Este es el principio de inclusión-exclusión, de gran utilidad en el cálculo de probabilidades. In-

tuitivamente, primero sumamos todas las probabilidades como si fueran disjuntos. Haciendo eso,
todas las intersecciones de dos conjuntos se están contando dos veces, las de tres se cuentan tres
veces, y así sucesivamente. Se procede entonces a restar todas las intersecciones de dos conjuntos
para corregir, pero al hacer esto, las intersecciones de tres conjuntos también se restan y por tanto
debemos sumarlas de nuevo. El proceso sigue en forma recursiva.
Ejemplo 54 Se quiere formar una cartera de inversión, escogiendo al azar 11 instrumentos …-

nancieros. Existen 7 emisores, cada uno de los cuales contiene 5 instrumentos. Hallar la proba-
bilidad de que salgan elegidos todos los instrumentos de al menos un emisor.
Considere los eventos A1 ; :::; A7 ; donde Ai es el evento: "todos los instrumentos del emisor i son
elegidos". Se quiere calcular !
[7
P Ai :
i=1
Nótese que
30 25
6 3 1 8
P (Ai ) = 35 = 1: 423 1 10 P (Ai \ Aj ) = 35 = 5: 992 0 10 :
11 11
Las intersecciones de más de 2 de estos eventos son vacías. Luego

7
!
[ 7
P Ai = 7 1: 423 1 10 3 5: 992 0 10 8 = 9: 960 4 10 3
:
i=1
2
Ejemplo 55 A una …esta llegan n personas. Cada uno da a guardar su abrigo. En medio de la
…esta se va la luz y cada uno debe elegir su abrigo al azar. Hallar la probabilidad de que al menos
una persona escoja su propio abrigo.
Denotemos por
Sn Ai el evento "la persona i escoge su abrigo". Se debe calcular la probabilidad del
evento A = i=1 Ai : Nótese que
(n 1)! 1 (n 2)! 1
P (Ai ) = = ; P (Ai Aj ) = = :
n! n n! n (n 1)
En general, para que las personas i1 ; : : : ; ik escojan su abrigo, hay (n k)! casos favorables, así
que
(n k)!
P (Ai1 : : : Aik ) = :
n!
S. Cambronero 36
Luego
X X n+1
P (A) = P (Ai ) P (Ai1 Ai2 ) + : : : + ( 1) P (A1 : : : An )
i i1 ;i2
X1 X 1 n+1 1
= + : : : + ( 1)
i
n i1 ;i2
n (n 1) n!
n 1 n+1 1
= 1 + : : : + ( 1) :
2 n (n 1) n!
El k ésimo sumando en esta suma es
k+1 n (n k)! k+1 1
( 1) = ( 1) :
k n! k!
Se obtiene
1 n+1 1
P (A) = 1 + : : : + ( 1) :
2! n!
Nótese que esta es la suma parcial de la serie de Taylor para la exponencial, evaluada en x = 1:
Consecuentemente, cuando n ! 1 la probabilidad de A se acerca a e 1
1
lim P (A) = e :
n!1
2.4.3 Ejercicios
1. Resuelva el ejemplo 54, manteniendo todo igual excepto que ahora se deben escoger 17
instrumentos.
instrumentos.
instrumentos.
4. Resuelva el ejemplo 54, suponiendo que uno de los 7 emisores tiene solamente 4 instrumentos
y los demás tienen 5.
5. Una cartera de inversión consta de:
(a) Una inversión de 3 millones de dólares en un índice X que rinde un 8% con probabilidad
0:4; 0% con probabilidad 0:35 y 12% con probabilidad 0:25:
(b) Una nota estructurada con un principal de 5 millones de dólares que rinde 8% en caso
que el índice X tenga rendimiento negativo. En caso contrario el rendimiento es nulo.
Halle la probabilidad de que el rendimiento de la cartera sea positivo. Halle la probabilidad

que sea al menos un 5%:
6. Un 46% de los clientes de la cartera de un Banco tiene préstamo de vivienda, el 28% tiene
préstamo de consumo y el 22% de producción. El 12% de los clientes tiene préstamos de
vivienda y de consumo, el 9% tiene de vivienda y producción, mientras que el 7% tiene de
consumo y producción. Finalmente, el 5% tiene de los tres tipos de préstamo. Si un cliente
se elige al azar de la cartera total, calcule la probabilidad de que:
S. Cambronero 37
(a) tenga préstamo de vivienda pero no de consumo ni de producción

(b) tenga préstamo de al menos uno de estos tres tipos
7. En cierta universidad, el 42% de los estudiantes de Economía son mujeres, mientras que el
47% de los estudiantes de Estadística son hombres. Además, el 63% de los estudiantes de
Administración son mujeres. Se sabe que no hay estudiantes que estudien dos carreras, y que
las tres carreras tienen el mismo número de estudiantes. Si se escoge un estudiante al azar
de la población total de estas tres carreras, detemine:
(a) la probabilidad de que sea mujer y no estudie Economía

(b) la probabilidad de que sea un hombre que estudia Economía
8. Resuelva el ejercicio anterior con todo igual excepto que ahora el número de estudiantes de
Economía duplica el de Estadística y triplica el de Administración.
9. En la cátedra de Cálculo III hay 7 grupos de 30 estudiantes cada uno. Del total de estudiantes
se escogen al azar 100 estudiantes para una prueba piloto. Halle la probabilidad de que:
(a) todos los estudiantes del grupo 1 sean escogidos

(b) todos los estudiantes de los grupos 1 y 2 sean escogidos
(c) todos los estudiantes de los grupos 1; 2 y 3 sean escogidos
(d) al menos de un grupo, todos los estudiantes sean escogidos.
10. Un juego consiste en tirar un dado dos veces. Si la primera vez sale un número par, se paga
en colones lo que indique la suma de los dos dados. Si la primera vez sale un número impar,
se paga solamente lo que indique el segundo dado. Calcule:
(a) la probabilidad de ganar al menos 5 colones

(b) la probabilidad la de ganar exactamente 8 colones
(c) la probabilidad de ganar al menos 8 colones
11. A una reunión llegan 3 delegados de Argentina, 3 de Brasil, 3 de Colombia y 3 de Ecuador.

De estos 12 delegados se escogen 7 al azar. Si todos tienen la misma probabilidad de ser
escogidos, calcule la probabilidad de que:
(a) los tres delegados de Brasil sean escogidos

(b) los tres delegados de Colombia y los tres de Ecuador sean escogidos
(c) al menos un país resulte con todos sus delegados escogidos.
12. Un juego consiste en tirar un dado 4 veces. El juego se pierde si sale un 1 sin haber salido
antes un 2. En cualquier otro caso se gana el juego.
(a) Describa el espacio muestral

(b) Para cada secuencia de resultados, diga si el juego se gana o se pierde: (5; 2; 1; 4) ;
(3; 6; 4; 4) ; (3; 1; 2; 2).
(c) Para i = 1; 2; 3; 4 halle la probabilidad de perder al realizar el i ésimo lanzamiento
S. Cambronero 38
(d) Halle la probabilidad de ganar el juego.
13. Un 36% de los clientes de la cartera de un Banco tiene un préstamo de vivienda, el 18% uno
de consumo y el 12% uno de producción. El 8% tiene tanto de vivienda como de consumo,
el 5% tiene de vivienda y producción, mientras que el 4% tiene de consumo y producción.
Finalmente, el 3% tiene de los tres tipos de préstamo. Si un cliente se elige al azar de la
cartera total calcule la probabilidad de que:
(a) tenga préstamo de vivienda pero no de consumo ni de producción

(b) tenga préstamo de consumo y de vivienda
(c) no tenga préstamo de ninguno de estos tres tipos
14. Se quiere formar un portafolio con 7 bonos. Los bonos se escogen de un grupo que contiene
3 bonos de Alemania, 3 de Bélgica, 3 de Canadá y 3 de Dinamarca. Si los bonos se escogen
al azar, calcule:
(a) la probabilidad de que todos los bonos de Alemania sean escogidos

(b) la probabilidad de que todos los bonos de Bélgica y todos los de Canadá sean elegidos
(c) la probabilidad de que todos los bonos de algún país sean escogidos
2.5 Probabilidad condicional e independencia

Para introducir el concepto de probabilidad condicional, pensemos en un ejemplo concreto.
Ejemplo 56 Supongamos que compramos tres números de lotería, digamos el 09; el 17 y el 72:
Nuestra probabilidad de pegar el número mayor (denotaremos por A a este evento) es
3
P (A) = :
100
Supongamos que alguien nos dice que salió un número menor que 45: Ahora la probabilidad de
pegar el premio mayor será
2
Pb (A) = :
45
Nótese que en el momento que conocemos que el número es menor que 45; el espacio de proba-
bilidad cambia. A este nuevo espacio le llamaremos momentáneamente B: Nótese que B mismo
es un evento en el espacio de probabilidad original. En este nuevo espacio, nos interesa ahora la
probabilidad de que ocurra el evento A: Pero el evento A no está contenido en este nuevo espacio.
45 2
Sin embargo, para que ocurra A debe ocurrir A \ B: Nótese que P (B) = 100 y P (A \ B) = 100 :
Finalmente
2 P (A \ B)
Pb (A) = = :
45 P (B)
En general, dado un evento B cualquiera, nos preguntamos cuál será la probabilidad de otro evento
A; dado que sabemos que se da B: En caso de probabilidad clásica se tiene
jA \ Bj jA \ Bj = j j P (A \ B)
Pb (A) = = = :
jBj jBj = j j P (B)
Lo anterior motiva la siguiente de…nición:
S. Cambronero 39
De…nición 2 Si P (B) > 0; se de…ne la probabilidad condicional de A dado B como
P (A \ B)
P (AjB) = :
P (B)
Ejemplo 57 Se tiran dos dados y se obtiene que la suma de los lados obtenidos es 7: Hallar la
probabilidad de que una de las caras sea un 3:
Sea A es el evento "una de las caras es 3" y B es el evento "suman 7". El evento A tiene 11
elementos, mientras B tiene 6 elementos. Además
A \ B = f(3; 4); (4; 3)g :

1
11 1 1
Entonces P (A) = 36 ; P (B) = 6 y P (A \ B) = 18 : Finalmente P (AjB) = 18
1 = 13 :
6
En el ejemplo anterior es claro que P (AjB) es distinta de P (A) : Cuando la probabilidad de A no

cambia al condicionarla a B; se dice que A y B son independientes. Nótese que esto equivale a
tener: P (A \ B) = P (A) P (B) : Escribimos esto como una de…nición formal.
De…nición 3 Dos eventos A y B se llaman independientes si cumplen
P (A \ B) = P (A) P (B) :
Ejemplo 58 Como se observó en el ejemplo anterior, los eventos A y B no son independientes

(son dependientes).
Ejemplo 59 Tiramos una moneda dos veces y consideramos los eventos A: "sale escudo el primer
tiro" y B : "sale corona el segundo tiro". En este caso = f(0; 0) ; (0; 1) ; (1; 0) ; (1; 1)g ; donde
un 1 signi…ca que salió escudo y un 0 que salió corona. Entonces A = f(1; 0) ; (1; 1)g y B =
f(0; 0) ; (1; 0)g : Es claro que entonces
1 1
P (A) = P (B) = ; P (A \ B) = = P (A) P (B) :
2 4
Entonces A y B son independientes, como era de esperarse.
Ejemplo 60 Tiramos dos dados y consideramos los eventos A: "ambas caras son pares" y B :
9
"ambas caras suman 6": Tenemos P (A) = 36 = 14 ; P (B) = 36
5 2
y P (A \ B) = 36 1
= 18 : Conse-
cuentemente:
1
2
P (AjB) = 185 = 5:
36
Nótese que P (AB) 6= P (A) P (B) ; así que A y B no son independientes.
De…nición 4 Una familia de eventos A1 ; : : : ; An se llama independiente si cualesquiera elementos

Ai1 ; : : : ; Aik que se escojan satisfacen
P (Ai1 \ : : : \ Aik ) = P (Ai1 ) : : : P (Aik ) : (2.5)
Es importante tener presente las siguientes propiedades de independencia:

S. Cambronero 40
1. Si A y B son independientes, entonces Ac y B son independientes (por simetría, A y B c

también). También Ac y B c son independientes.
P (Ac \ B) = P (B) P (A \ B)
= P (B) P (A) P (B)
= [1 P (A)] P (B) = P (Ac ) P (B) :
2. Si A1 ; : : : ; An son independientes, entonces son independientes 2 a 2: Esto se sigue de la

de…nición, tomando dos elementos en (2.5).
3. El hecho que en una familia de eventos, estos sean independientes 2 a 2; no implica que la
familia sea independiente, como lo muestra el siguiente ejemplo.
Ejemplo 61 Tiramos dos dados y consideramos los siguientes eventos:
A = fel primer resultado es parg ; B = fel segundo resultado es imparg

1 1
mientras que C = flos dos resultados suman 7g : En este caso P (A) = P (B) = 2 y P (C) = 6:
Además
AC = BC = ABC = f(6; 1) ; (2; 5) ; (4; 3)g :
1
Dado que P (AC) = 12 = P (A) P (C) se tiene independencia entre A y C: Similarmente, B y C
son independientes. Además, claramente A y B son independientes. Concluimos que la familia
A; B y C son independientes 2 a 2: Sin embargo, estos tres eventos no son independientes, dado
que:
1
P (ABC) = 12
1
mientras que P (A) P (B) P (C) = 24 :
Los siguientes ejemplos muestran cómo se puede usar el concepto de independencia en el cálculo
de probabilidades.
Ejemplo 62 Se lanza un dado 12 veces. Hallar la probabilidad de que el 2 salga por primera vez
en el tercer lanzamiento. El evento A : "el 2 sale por primera vez en el tercer lanzamiento" se
puede expresar como A = E1 E2 E3 ; donde E1 : "no sale el 2 en el primer lanzamiento", E2 : "no
sale el 2 en el segundo lanzamiento" y E3 : "sale el 2 en el tercer lanzamiento". Se tiene
5 1
P (E1 ) = P (E2 ) = ; P (E3 ) = :
6 6
Como los lanzamientos son independientes se tiene
5 5 1 25
P (A) = P (E1 ) P (E2 ) P (E3 ) = = :
6 6 6 216
Es importante notar que en el ejemplo anterior, el número de veces que se lance el dado es irrele-
vante, siempre que sea al menos 3: La idea es que una vez que se tira el dado por tercera vez, ya
se sabe si ocurre el evento A y por lo tanto no hace falta realizar los lanzamientos siguientes.
S. Cambronero 41
Ejemplo 63 En el ejemplo 49, suponga que repetimos el proceso ocho veces. Hallar la probabilidad
de que salga 3 veces una bola blanca y 5 veces negra.
Como se repite 8 veces el experimento que tiene dos posibles resultados, se tiene
j j = 28 = 256:
Sin embargo, este dato no se va a usar en forma explícita debido a que la medida probabilidad usada
no es clásica. Denotemos por A nuestro evento, el cual tiene 56 elementos, obtenidos al escoger
los tres lanzamientos que correponden a las bolas blancas: 83 = 56: Dado que las extracciones son
independientes, cada elemento de A tiene probabilidad
3 5
3 7 3
= 4: 537 9 10
10 10
Como el evento A está formado por 56 muestras con el mismo peso se tiene
3
P (A) = 56 4: 537 9 10 = 0:254 12:
Ejemplo 64 Una caja contiene 7 bolas negras y 4 bolas blancas. Se extraen dos bolas ordenada-
mente y sin reemplazo. Hallar la probabilidad de que ambas bolas sean negras.
Sea E1 el evento "la primera bola es negra" y E2 el evento "la segunda bola es negra". Se quiere
calcular P (E1 \ E2 ) : Nótese que
7 6 21
P (E1 \ E2 ) = P (E1 ) P ( E2 j E1 ) = = :
11 10 55
Este problema se puede resover también directamente, el número de casos favorables es 7 6 = 42;
mientras que el número de casos total es 11 10 = 110; así que
42 21
P (E1 \ E2 ) = = :
110 55
Ejemplo 65 Modi…quemos el ejemplo anterior para que ahora las bolas negras tengan un peso de
5gr; mientras las bolas blancas pesan 9gr: En cada extracción, la probabilidad de que cierta bola
sea la escogida es su peso relativo, es decir su peso dividido por el peso total de las bolas en la caja
en ese instante. Hallar la probabilidad de que ambas bolas sean negras.
Nótese que ahora la probabilidad no es clásica, así que se debe usar la probabilidad condicional.
Tenemos
5 35 5 15
P (E1 ) = 7 = ; P ( E 2 j E1 ) = 6 = :
7 5+4 9 71 6 5+4 9 33
35 15 175
P (E1 \ E2 ) = P (E1 ) P ( E2 j E1 ) = = :
71 33 781
Nota: Existe una manera de cambiar el ejemplo anterior por otro equivalente en el que es posible
utilizar la probabilidd clásica. Se invita al lector a intentar esa modi…cación.
En general, para calcular la probabilidad de una intersección, se puede aplicar reiteradamente la
idea de este ejercicio obteniendo
P (E1 : : : En ) = P (E1 ) P ( E2 j E1 ) : : : P ( En j E1 : : : En 1) :
S. Cambronero 42
Ejemplo 66 En el ejemplo 55, el cálculo de P (Ai1 : : : Aik ) se puede realizar usando esta identidad.
En efecto
1 1
P (A1 A2 ) = P (A1 ) P ( A2 j A1 ) =
n n 1
y en general
1 1 1
P (Ai1 : : : Aik ) = P (A1 ) P ( A2 j A1 ) : : : P Aik j Ai1 : : : Aik 1
= ::: :
n n 1 n k 1
2.5.1 Fórmula de Bayes

Para introducir la fórmula de Bayes considere el siguiente ejemplo.
Ejemplo 67 Un juego consiste en lanzar un dado y una moneda. Si la moneda cae en escudo, el
jugador gana lo que indique el dado (en millones de colones); si cae en corona entonces gana el
doble de lo que indique el dado. Vamos a calcular la probabilidad de ganar al menos 6 millones de
colones.
Para resolver este problema, considere los eventos
E : "la moneda cae en escudo", A : "la ganancia es al menos 6 millones
Claramente se tiene P (E) = P (E c ) = 21 : Además, dado E hay solo un caso favorable para el
evento A (que el dado caiga en 6). Por su parte, dado E c existen 4 casos favorables (3, 4, 5 y 6).
Se tiene entonces
1 4 2
P ( Aj E) = ; P ( Aj E c ) = = :
6 6 3
Debido a que A = (AE) [ (AE c ) y esta es una unión disjunta
P (A) = P (AE) + P (AE c )

= P ( Aj E) P (E) + P ( Aj E c ) P (E c )
donde se usó la de…nición de probabilidad condicional. Finalmente

11 21 5
P (A) = + = :
62 32 12
El método de este ejemplo se puede generalizar. En efecto, lo que permitió el cálculo es el hecho que
E y E c forman una partición del espacio muestral, en el sentido que son mutuamente excluyentes
y cubren todo el espacio. En general, una partición del espacio muestral es una familia de
conjuntos E1 ; : : : ; En que son mutuamente excluyentes y cubre el espacio muestral, es decir
n
[
Ai = :
i=1
Por la aditividad de la probabilidad, si A es un evento cualquiera se tiene

n
X n
X
P (A) = P (A \ Ei ) = P ( Aj Ei ) P (Ei ) :
i=1 i=1
S. Cambronero 43
Ejemplo 68 En una cartera de crédito hay 300 clientes buenos, 500 regulares y 200 malos. Los
clientes buenos tienen una probabilidad de impago de 0:002; los regulares 0:01 y los malos 0:08: Si
se escoge un cliente al azar, cuál es la probabilidad de que caiga en impago?
Sea E1 es el evento formado por los cliente buenos, E2 el de los regulares y E3 el de los malos.
Entonces E1 ; E2 y E3 forman una partición del espacio muestral. Si A es el evento "el cliente cae
en impago" se tiene
3
X 3 1 1
P (A) = P ( Aj Ei ) P (Ei ) = 0:002 + 0:01 + 0:08 = 0:021 6:
i=1
10 2 5
La fórmula anterior se puede utilizar para obtener la probabilidad de uno de los eventos Ei ; dado
que se da el evento A: En efecto
P (Ej \ A) P ( Aj Ej ) P (Ej )
P ( Ej j A) = = Pn :
P (A) i=1 P ( Aj Ei ) P (Ei )
Esta es la fórmula de Bayes.
Ejemplo 69 En el ejemplo anterior, supongamos que se escoge un cliente al azar, y al …nal del
período cae en impago. Hallar la probabilidad de que el cliente sea malo.
En este caso debemos hallar P ( E3 j A) : Dado que ya se había hecho el cálculo de P (A) se tiene
P (AE3 ) P ( Aj E3 ) P (E3 ) 0:016

P ( E3 j A) = = == 0:74:
P (A) P (A) 0:0216
La fórmula anterioor fue usada en forma implícita, debido a que el denominador es la sumatoria
calculada en el ejemplo anterior. En efecto
1
P ( Ej A3 ) P (A3 ) 0:08 5
P ( E3 j A) = P3 = 3 1 1 0:74:
i=1 P ( Ej Ai ) P (Ai )
0:002 10 + 0:01 2 + 0:08 5
2.5.2 Ejercicios
1. Una moneda se lanza dos veces. Halle la probabilidad condicional de que ambos lanzamientos
caigan en escudo, sabiendo que
(a) el primero cae en escudo

(b) al menos uno cae en escudo
2. Se escogen 7 bolas en orden de una caja que contiene 5 bolas rojas y 6 bolas negras. Dado
que 3 de las bolas escogidas son rojas, halle la probabilidad condicional de que la primera
bola escogida sea roja.
3. Se escogen m bolas en orden de una caja que contiene n bolas rojas y k bolas negras. Dado
que p de las bolas escogidas son rojas, halle la probabilidad condicional de que la primera
bola escogida sea roja.
4. Una población de 3000 individuos se divide en dos muestras, una de calibración (1200 indi-
viduos) y otra de prueba (1800 individuos). La proporción de clientes buenos en la muestra
de calibración es de 0:8 y en la de prueba es de 0:75: Halle:
S. Cambronero 44
(a) la proporción de clientes buenos en la población total

(b) la probabilidad de que un cliente pertenezca a la muestra de calibración, sabiendo que
es bueno
5. Ante una pregunta de selección, un estudiante tiene probabilidad 34 de saber la respuesta. Si

no la sabe, responderá al azar, donde cada una de las 4 opciones tiene la misma probabili-
dad de ser la correcta. Dado que el estudiante acertó la respuesta, cuál es la probabilidad
(condicional) de que haya sabido la respuesta.
6. Ante una pregunta de selección, un estudiante tiene probabilidad p de saber la respuesta. Si

no la sabe, responderá al azar, donde cada una de las m opciones tiene la misma probabi-
lidad de ser la correcta. Dado que el estudiante acertó la respuesta, cuál es la probabilidad
(condicional) de que haya sabido la respuesta.
7. En el ejemplo 68 calcule la probablidad de que un cliente caiga en impago dado que no es
bueno.
8. En el ejemplo 69 calcule la probabilidad de que un cliente sea bueno dado que
(a) cayó en impago

(b) no cayó en impago
9. Un 46% de los clientes de la cartera de un Banco se clasi…can como de tipo A, un 30% como
tipo B y un 24% como tipo C: En en año pasado cayó en impago el 3% de los tipo A, el 5%
de los tipo B y el 7% de los tipo C.
(a) Determine el porcentaje de clientes que cayó en impago de la cartera total

(b) Determine la probabilidad de que un cliente caiga en impago, condicionado a que no es
del tipo A
(c) Dado que un cliente cayó en impago, determine la probabilidad de que haya sido de tipo
A
10. Si A y B son eventos mutuamente excluyentes, con P (A) > 0 y P (B) > 0; veri…que que A
y B no son independientes.
11. Considere tres eventos A; B; C tales que B y C son independientes y
P (A [ B) = 0:7; P (Ac ) = 0:4; P (BC) = 0:07; P (C) = 0:35
(a) Determine P (B [ C) y P ( Aj B)
(b) Son A y B independientes? Explique.
12. Si P (B) > 0 calcule P ( Ac j B) en términos de P ( Aj B) :

13. Se lanza una moneda un número in…nito de veces. Halle la probabilidad de que el escudo
salga por primera vez en un lanzamiento impar. Hay dos maneras de hacerlo:
(a) Sumando una serie in…nita

S. Cambronero 45
(b) Condicionando en el resultado del primer lanzamiento y obteniendo una ecuación lineal
para la probabilidad p
14. Veri…que que para eventos cualesquiera se tiene
P ( A [ Cj B) = P ( Aj B) + P ( Cj B) P ( ACj B)
15. Considere el siguiente modelo para el tipo de cambio. Cada día, independientemente de
lo que haya sucedido antes, el tipo de cambio sube dos colones con probabilidad 0:45; se
mantiene con probabilidad 0:3 y cae dos colones con probabilidad 0:25: El primero de abril el
tipo de cambio es 549 colones. Condicionado a que el 2 de abril no hubo una subida, calcule
la probabilidad de que el 04 de abril sea al menos 551:
16. En el ejemplo 64 calcule la probabilidad de que
(a) la primera bola sea negra y la segunda blanca

(b) ambas bolas sean blancas
(c) al menos una bola sea blanca
17. En el ejemplo 65 calcule la probabilidad de que
(a) la primera bola sea negra y la segunda blanca

(b) ambas bolas sean blancas
(c) al menos una bola sea blanca
18. Considere el ejemplo 64 pero ahora se extraen 3 bolas sin reemplazo. Calcule la probabilidad
de que
(a) las tres sean negras

(b) las tres sean blancas
(c) la primera sea negra y las otras dos sean blancas
19. Considere el ejemplo 65 pero ahora se extraen 3 bolas sin reemplazo. Calcule la probabilidad
(a) las tres sean negras

(b) las tres sean blancas
(c) la primera sea negra y las otras dos sean blancas
20. Considere el ejemplo 64 pero ahora se extraen k bolas sin reemplazo. Calcule la probabilidad
de que
(a) las k sean negras

(b) las k sean blancas
(c) la primera sea negra y las otras sean blancas
21. Considere el ejemplo 65 pero ahora se extraen k bolas sin reemplazo. Calcule la probabilidad
S. Cambronero 46
(a) las k sean negras

(b) las k sean blancas
(c) la primera sea negra y las otras sean blancas
22. Si se lanza un dado reiteradamente, halle la probabilidad de que el 6 salga por primera vez
en el...
(a) ...cuarto lanzamiento

(b) ...noveno lanzamiento
(c) ... n ésimo lanzamiento
Capítulo 3
Teoría general de probabilidades
En este capítulo se introduce el concepto de medida de probabilidad en un contexto general,

para posteriormente introducir las variables aleatorias, tanto discretas como continuas. Se estudia
además el concepto de distribución de una variable aleatoria, enfatizando el uso de los tipos más
comunes de distribuciones.
3.1 Espacios de probabilidad

3.1.1 No todo conjunto es un evento
Para hablar de espacios de probabilidad en general, se presenta el problema de que no siempre es
posible de…nir las medidas de probabilidad en todos los subconjuntos del espacio muestral. Es aquí
donde el concepto de evento cobra relevancia. Los eventos serán los conjuntos que se pueden medir
de una manera consistente. Para aclarar este punto pensemos en un ejemplo sencillo. Supongamos
que queremos de…nir una media de probabilidad en = f1; 2; 3; 4g de manera que
1 1 3
P (f1g) = ; P (f2g) = ; P (f1; 2g) = :
3 2 4
Claramente esto no es posible debido a que la aditividad debería conducirnos a
1 1 5
P (f1; 2g) = P (f1g [ f2g) = P (f1g) + P (f2g) = + = :
3 2 6
En espacios …nitos, como hemos visto, se puede evitar estas inconsistencias asignando pesos a los
eventos unitarios. Eso se puede realizar sin problema incluso en el caso que sea numerable,
pero no así en el caso general. Por tal motivo, típicamente la medida de probabilidad se puede
de…nir únicamente para los elementos de cierta familia de conjuntos. Los elementos de la familia
de conjuntos medibles se llaman eventos.
Lo importante del concepto de evento es que al unir una cantidad contable de eventos o tomar
complementos de eventos obtenemos nuevos eventos. En resumen los eventos se caracterizan por:
1. El espacio muestral es un evento

2. Siempre que A sea un evento, Ac también lo es
47
S. Cambronero 48
3. Siempre que An sea un evento para cada n 2 N, también lo es

[
A= An :
n2N
Los ejemplos son siempre útiles en este tipo de situaciones.
Ejemplo 70 Dado =R
F = f;; ; ] 1; 0] ; ]0; 1[ ; Ac g
es una familia de eventos.
Ejemplo 71 Cuando = N, la familia F cuyos elementos son todos los subconjuntos de N es

una familia de eventos.
Las leyes de De Morgan permiten concluir que las intersecciones contables de eventos son eventos.
En efecto, si An es un evento para cada n 2 N, se sigue que cada complemento Acn es un evento.
Luego la unión [
B= Acn
n2N
es un evento y, consecuentemente, su complemento

\
Bc = An
n2N
es un evento. Se concluye así que la intersección contable de eventos es un evento.

El conjunto vacío ; es un evento dado que es el complemento de . El siguiente ejemplo muestra
un espacio que no es numerable, construido mediante un proceso discreto, es decir a partir de
realiar un experimento reitaradamente un número in…nito de veces.
Ejemplo 72 Considere el experimento de escoger al azar un número entero entre 0 y 9 (inclusive).

Se podría pensar en lanzar un dado de 10 lados. Si se repite este experimento un número in…nito
de veces, el espacio muestral está compuesto por sucesiones in…nitas formadas por números enteros
entre 0 y 9
= f(x1 ; x1 ; : : :) : xn 2 f0; 1; : : : ; 9gg :
Este espacio es no numerable. En efecto, tiene tantos elementos como todo R, debido a que cada
elemento de puede verse como una expansión decimal de un número real.
Un ejemplo ligeramente distinto se obtiene al lanzar un dardo hacia un objetivo. Vamos a suponer
que la probabilidad de acertar en una región especí…ca del blanco es proporcional al área respectiva.
Suponemos que el blanco es un círculo de radio r: Entonces por ejemplo la probabilidad de que el
dardo quede a una longitud menor que 2r del centro es
r 2
2 1
Pr = = :
r2 4
La probbilidad de acertar en el semicírculo superior es 12 ; lo mismo que la probabilidad de acertar
en el inferior, o en el de la derecha. Es importante observar que el área de un punto o de una línea
es cero. Así que, por ejemplo, la probabilidad de acertar el centro del círculo en cero, lo mismo que
S. Cambronero 49
acertar un diámetro dado. De la misma manera, la probabilidad de que el dardo quede a distancia
r
2 del centro, es cero. La probabilidad de acertar en un sector circular de ángulo es
1
2 r2
= :
r2 2
A manera de ejemplo, considere el evento A mostrado en la …gura 3.1.1. Este evento es la unión
de un triángulo de base 2r y altura r; con un sector circular de ángulo 2 (un cuarto de círculo).
Consecuentemente
1
(2r) r + 14 r2 1 1
P (A) = 2 2
= + :
r 4
3.1.2 Medidas de probabilidad

De…nición 5 Una medida de probabilidad es una función que asigna un número real P (A) a cada
evento A; de manera que P ( ) = 1 y P es contablemente aditiva. Es decir, siempre que A0 ; A1 ; : : :
sean eventos mutuamente excluyentes se tiene
1
! 1
[ X
P An = P (An ) : (3.1)
n=0 n=0
Una medida de probabilidad satisface todas las propiedades de medidas sobre espacios …nitos,
estudiadas en capítulos anteriores. Recordemos algunas de ellas.
1. P (;) = 0: En efecto, esto se deduce de
1 = P ( ) = P ( [ ;) = P ( ) + P (;) = 1 + P (;) :
2. Toda medida de probabilidad es aditiva. Es decir, si A1 ; : : : ; An son eventos mutuamente

excluyentes se tiene !
[n Xn
P Ak = P (Ak ) :
k=1 k=1
Esto se obtiene de (3.1) tomando An+1 = An+2 = : : : = ;:

3. Si A y B son eventos se tiene
P (B A) = P (B) P (A \ B)
En particular, si A B se tiene:
P (B A) = P (B) P (A) :
S. Cambronero 50
4. Dados dos eventos A y B se tiene
P (A [ B) = P (A) + P (B) P (A \ B) :
5. En particular, de la propiedad anterior se sigue que
P (A [ B) P (A) + P (B) :
6. El principio de inclusión-exclusión en su versión general sigue siendo válido en este contexto

general de medidas de probabilidad.
7. La fórmula de Bayes sigue siendo válida en espacios de probabilidad general. Es decir, si los
eventos A1 ; : : : ; An tienen probabilidad positiva y forman una partición del espacio muestral
(son disjuntos dos a dos y cubren todo el espacio) entonces para cualquier evento E se tiene
n
X P ( Ej Ak ) P (Ak )
P (E) = P ( Ej Ak ) P (Ak ) ; P ( Ak j E) = Pn :
k=1 j=1 P ( Ej Aj ) P (Aj )
3.1.3 Continuidad de las medidas de probabilidad

Las siguientes propiedades tienen que ver con uniones e intersecciones de sucesiones monótonas de
eventos. Diremos que una sucesión de eventos (An )n2N es creciente si cada evento está contenido
en el siguiente, es decir si An An+1 para cada n. Similarmente, la sucesión se llama decreciente
si cada evento contiene al siguiente, es decir cumple An+1 An para cada n. En el primero de los
casos, se de…ne
1
[
A= An = f! 2 : x pertenece a algún An g :
n=1
Representación grá…ca de una sucesión creciente de eventos.

En la …gura 3.1.3 se ha representado el crecimiento de una sucesión de eventos. Cada An está
representado por la región encerrada por uno de los óvulos. El óvulo naranja representa A1 ; el
óvulo celeste representa A2 y así sucesivamente. En cierta forma los eventos An se acercan al
evento A; lo que sugiere usar la notación
A = lim An :
n!1
En el segundo caso, ocurre lo mismo con la intersección

1
\
A= An = f! 2 : x pertenece a todos los An g = lim An :
n!1
n=1
S. Cambronero 51
Teorema 1 (Continuidad de las medidas de probabilidad) Si (An ) es una sucesión monótona de

eventos y A = lim An entonces
n!1
P (A) = lim P (An ) :
n!1
Vamos a hacer el caso creciente, el caso decreciente es similar. Se de…ne B1 = A1 y Bn = An An 1

para n 2: Los eventos B1 ; B2 ; : : : son disjuntos dos a dos y además para n 2 se tiene
P (Bn ) = P (An ) P (An 1)
Dado que
1
[
A= Bn
n=1
se obtiene
1
X
P (A) = P (A1 ) + [P (An ) P (An 1 )] :
n=2
Esta es una serie telescópica, así que
P (A) = P (A1 ) + lim [P (An ) P (A1 )] = lim P (An ) :
n!1 n!1
Ejemplo 73 Lanzamos un dado in…nitas veces, y consideramos el evento An que signi…ca obtener
un 3 antes del lanzamiento n: Claramente se tiene An An+1 : En efecto, si se obtiene un 3 antes
del lanzamiento n; ese 3 se obtuvo antes del lanzamiento n + 1: La probabilidad de An la podemos
calcular como
5 n 1
P (An ) = 1 P (Acn ) = 1 6 :
Si se de…ne
1
[
A= An = fsale un 3 en algún lanzamientog
n=1
se tiene
5 n 1
P (A) = lim P (An ) = lim 1 6 = 1:
n!1 n!1
c
En particular, la probabilidad de A = fnunca sale un 3g es cero. En lenguaje común, si lanzamos
un dado reiteradamente, estamos 100% seguros de que obtendremos un 3 en algún momento.
Teorema 2 Si A0 ; A1 : : : son eventos cualesquiera, se tiene
1
! 1
[ X
P An P (An ) :
n=0 n=0
En efecto, un argumento inductivo permite demostrar que esto es válido para familias …nitas. Los
resultados anteriores permiten realizar el paso al límite. Explícitamente, si
1
[ N
[
A= An = lim An
N !1
n=0 n=0
se tiene !
N
[ N
X 1
X
P (A) = lim P An lim P (An ) = P (An ) :
N !1 N !1
n=0 n=0 n=0
S. Cambronero 52
3.1.4 Espacios contables

En espacios contables, la construcción de medidas de probabilidad se puede realizar sin mayor
problema, de la misma forma que para espacios …nitos. Un conjunto se llama contable si es el
rango de una sucesión, equivalentemente si se puede escribir como
= f! n : n 2 Ng :
La sucesión de los pesos es una sucesión de números reales positivos pn que satisface
1
X
pn = 1:
n=0
Para A se de…ne X
P (A) = pn :
! n 2A
Esto de…ne una medida de probabilidad sobre todos los subconjuntos de : Es decir, en este caso
todo conjunto se puede considerar como un evento. En particular
P (f! n g) = pn
así que pn es el peso de ! n :

1
Ejemplo 74 Considere = N y pn = 2n para n = 1; 2; : : : : Dado que p1 + p2 + : : : = 1 se puede
de…nir
X 1
P (A) =
2n
n2A
para cada A N . Nótese que, en particular

X1 1
1 4 1
P (f2; 4; 6; : : :g) = = 1 = :
22k 1 4
3
k=1
Si vemos este espacio como una representacción de un experimento que devuelve un número natural,
el resultado será par con probabilidad 31 : El resultado será impar con probabilidad 23 :
Ejemplo 75 Un ejemplo más común está relacionado con la distribución de Poisson. Tomamos
n
e
ahora = N y pn = n! , donde > 0 es un número real …jo. Nótese que
1
X n 1
X n
e
=e =e e =1
n=0
n! n=0
n!
así que esta es una buena de…nición.
Ejemplo 76 Se tira una moneda hasta que salga un escudo. En este caso se puede de…nir como
= fe; ce; cce; ccce; : : :g = f! n : n 2 Ng
donde ! n = c : : : ce (n 1 veces c y luego e). Este es un espacio numerable. El peso de ! n es 21n :

Esencialmente este espacio es el mismo del ejemplo 74. Consecuentemente, el escudo saldrá por
primera vez en un lanzamiento par con probabilidad 31 :
S. Cambronero 53
3.1.5 Ejercicios
1. En cada caso, halle la constante c para que los pk de…nan una medida de probabilidad sobre
= f1; 2; 3g :
c c c
pk = c; pk = ck; pk = ; pk = 2k c; pk = :
k+1 k k+1
2. En cada caso, halle la constante c para que los pk de…nan una medida de probabilidad sobre
= f1; 2; : : : ; ng :
c c
pk = c; pk = ck; pk = 2k c; pk = ; pk = ck 2 :
k k+1
3. En cada caso, halle condiciones sobre c para que los pk de…nan una medida de probabilidad
sobre = f1; 2; 3 : : :g :
n
2n c c c n n c
pn = ; pn = ; pn = (1 ) c; pn = :
n! 2n + 3 2n+1 + 3 n!
4. Si 0 < < 1; considere el espacio = N con la medida de probabilidad de…nida por los
pesos pn = n n+1
.
(a) Veri…que que, efectivamente, P es una medida de probabilidad.

(b) Calcule la probabilidad del evento formado por los números pares.
2+( 1)n n
5. Considere pn = c n! ; donde > 0:
(a) Halle c para que estos pn de…nan una medida de probabilidad P sobre = f0; 1; 2 : : :g
(b) Calcule P (f1; 3; 5; 7; 8g) y P (f3; 4; 5 : : :g) :
(c) Calcule P (fn : n es parg) :
6. Un jugador tira la moneda hasta que salga el escudo por tercera vez.
(a) Describa el espacio muestral

(b) Calcule el peso de cada elemento de
(c) Veri…que que, efectivamente, los pesos calculados suman 1. Para esto debe derivar dos
veces la serie geométrica.
3.2 El concepto de variable aleatoria

En forma intuitiva, una variable aleatoria es una cantidad cuyo valor exacto no se conoce, pero al
menos se puede decir con qué probabilidad ese valor coincide con valores especí…cos de la recta. Más
formalmente, una variable aleatoria es una función X cuyo dominio es un espacio de probabilidad.
Para poder determinar si X cae en un intervalo I; se requiere que el conjunto
[X 2 I] = fX cae en Ig
sea un evento. Como es costumbre en matemática, la de…nición pide lo mínimo que se puede pedir
para demostrar las demás propiedades a partir de ella. En el caso especí…co, basta con la siguiente
de…nición.
S. Cambronero 54
De…nición 6 Dado un espacio de probabilidad , una variable aleatoria es una función
X: !R
tal que, para cada 2 R; el conjunto [X ] = f! 2 : X (!) g es un evento.
Note que la medida de probabilidad P no interviene de forma explícita en esta de…nición. En la

práctica, especialmente en el caso discreto, no es necesario veri…car que [X ] sea un evento.
Esto se debe a que típocamente en espacios discretos todo conjunto es un evento. Sin embargo,
para efectos teóricos es importante tener en cuenta esta condición.
Ejemplo 77 Considere el experimento de lanzar una moneda. Se de…ne X = 1 si la moneda cae

en escudo y X = 1 si cae en corona. En este caso = fe; cg, X (e) = 1; X (c) = 1: La variable
X se puede interpretar como la ganancia al apostar un colón tirando la moneda. Una ganacia
X = 1 signi…ca una pérdida de un colón.
c
Dado que [X > ] = [X ] , se sigue que [X > ] es un evento para cada 2 R. Además, dado
que
\ 1
[X ]= X>
n
n2N
este conjunto es también un evento. Más interesante aún es el siguiente resultado.
Lema 1 Si X es una variable aleatoria, el conjunto [X 2 A] es un evento para cada intervalo A.
Si E es un evento en el espacio de probabilidad , la variable aleatoria 1E de…nida por
1 si ! 2 E
1E (!) =
0 si ! 2
=E
se llama la variable indicadora o característica de E:
Ejemplo 78 En el ejemplo anterior, la variable X se puede expresar como
X = 1feg 1fcg :
En efecto, 1feg (e) 1fcg (e) = 1 0 = X (e) y 1feg (c) 1fcg (c) = 0 1 = X (c) :
Las variables aleatorias se pueden combinar para formar nuevas variables, de distintas maneras.
Por ejemplo, se puede multiplicar una variable X por un escalar, se pueden sumar variables, tomar
el máximo de dos o más variables, etc. Los siguientes ejemplos tratan este tipo de combinaciones.
Ejemplo 79 Un juego consiste en lanzar una moneda. El jugador tiene la posibilidad de apostar
la cantidad que desee. Si sale escudo se gana una cantidad igual a lo apostado. Si sale corona se
pierde lo apostado. Si se apuesta un colón, la ganancia X satisface
1
P [X = 1] = P [X = 1] = :
2
Si se apuestan 3 colones, la ganancia es 3X: Si el jugador tiene 4 colones al inicio y apuesta 3; su
capital después del juego es representado por la variables 3X + 4: En general, si el capital inicial
es b y apuesta c colones, el capital …nal es cX + b:
S. Cambronero 55
Ejemplo 80 Se lanza un dado dos veces y se de…ne X como el resultado del primer lanzamiento,
mientras Y es el resultado del segundo lanzamiento. La variable X + Y es la suma de los dos
resultados. La variables X Y es la resta del primer resultado menos el segundo. Por ejemplo
1 1
P [X Y = 4] = P (f(5; 1) ; (6; 2)g) = ; P [X + Y = 4] = P (f(1; 3) ; (3; 1) ; (2; 2)g) = :
18 12
La variable XY es el producto de las dos caras. En este caso por ejemplo
1
P [XY = 12] = P (f(3; 4) ; (4; 3) ; (6; 2) ; (2; 6)g) = :
9
La variable X 2 toma los valores 1; 4; 9; 16; 25; 36: Por ejemplo
4 2
P X 2 < 17 = P [X 4] = = :
6 3
Ejemplo 81 Se lanza un dado y se de…ne
X = 1f2;3g ; Y = 1f1;2;4g ; Z = 1f2g :
Entonces la variable U = X + Y + Z toma los valores 0; 1; 3. Además

1 1 1
P [U = 0] = ; P [U = 1] = ; P [U = 3] = :
3 2 6
Por ejemplo, para [U = 1] los casos favorables son las caras 1; 3; 4: La variabe V = XY coincide
con 1f2g : En efecto, para que XY sea 1 se requiere que tanto X como Y tomen el valor 1:
3.2.1 Variables Discretas

Una variable aleatoria X se llama discreta si toma solo un número contable de valores. El conjunto
de valores puede ser entonces …nito, digamos fx1 ; : : : ; xN g o in…nito numerable
fxn : n 2 Ng :
Si se denota An = [X = xn ] se obtiene
X
X= xn 1An :
n
En caso que X tome un número …nito de valores se obtiene

n
X
X= xk 1Ak :
k=1
Una variable de este tipo se llama variable simple. Nótese que si xi 6= xj se tiene Ai \ Aj 6= ;:
Como se irá aclarando con los ejemplos y la práctica individual, desde el punto de vista práctico
todo lo que interesa de una variable discreta se resume en los valores que toma y las probabilidades
(o pesos) con las que esos valores son tomados. Digamos que X toma los valores x 2 S: La función
que asigna a cada x 2 S su peso
(x) = P [X = x]
se llama la función de masa de probabilidad asociada a X:
S. Cambronero 56
Ejemplo 82 Considere el experimento de lanzar una moneda, con = fe; cg : Se de…ne X = 1 si

la moneda cae en escudo y X = 1 si cae en corona. La función de masa de probabilidad para X
es
1
: f 1; 1g ! R; ( 1) = (1) = :
2
Nótese que nada impide que usemos como espacio de probabilidad a = f 1; 1g : En este caso,
X se de…niría como X (!) = ! y la función de masa de probabilidad de…ne de manera directa la
medida de probabilidad en :
Ejemplo 83 Se tira un dado y se de…ne X como el valor observado. Entonces X es una variable
que toma los valores 1; 2; : : : ; 6; cada uno con probabilidad 61 : Si = f1; : : : ; 6g se tiene X (k) = k:
En resumen
X6
X= k1fkg :
i=1
1
La función de masa en este caso se de…ne como (k) = 6 para cada k 2 :
Ejemplo 84 Un juego consiste en tirar un dado. Si sale 3 o 5 perdemos 100 colones, en caso
contrario ganamos 50 colones. Tomamos = f1; : : : ; 6g : Si X representa la ganancia del juego se
tiene
X = 100 1f3;5g + 50 1f1;2;4;6g :
1
Nótese que P [X = 100] = 3 y P [X = 50] = 32 : La función de masa de probabilidad es
1 2
: f 100; 50g ! R; ( 100) = ; (50) = :
3 3
De acuerdo con la siguiente de…nición, la variable del ejemplo anterior es del tipo Bernoulli.
De…nición 7 Una variable X es de tipo Bernoulli si toma exactamente dos valores a y b. Si
p = P [X = a] se tiene 1 p = P [X = b] : Si A = [X = a] se puede expresar
X = a 1 A + b 1 Ac :
Ejemplo 85 Una caja contiene 3 bolas blancas y 4 negras. Realizamos 8 extracciones de una
bola, con reemplazo. Es decir, en cada extracción sacamos una bola, observamos su color y la
devolvemos a la caja. Digamos que cuando se extrae una bola negra se da un éxito, mientras que
una bola blanca representa un fracaso. Entonces en cada extracción, la probabilidad de éxito es 74 y
la probabilidad de fracaso es 1 47 = 73 : Se de…ne la variable S como el número de éxitos obtenidos
en este experimento. La variable S puede tomar los valores 0; 1; : : : ; 8: Además, el evento [S = k]
k 3 8 k
tiene k8 elementos, cada uno con probabilidad 74 7 (por independencia). Luego
k k 8 k
8 4 3
P [S = k] = ; k = 0; 1; : : : ; 8:
k 7 7
La variable S es de tipo binomial. Veamos la de…nición.
De…nición 8 Una variable aleatoria se llama binomial de parámetros n y p si toma los valores
0; 1; : : : ; n con probabilidades
n k n k
P [S = k] = p (1 p) ; k = 0; 1; : : : ; n:
k
S. Cambronero 57
Observando el ejemplo anterior, una variable binomial de parámetros n y p se puede utilizar

para modelar el número de éxitos en n realizaciones independientes de un experimento que tiene
probabilidad p de éxito y probabilidad 1 p de fracaso. Nótese además que
n
X n
X n k n k n
P [X = k] = p (1 p) = (p + 1 p) = 1:
k
k=0 k=0
Ejemplo 86 En el ejemplo 75, considere X : ! R de…nida por X (!) = !: Dado que = N,

X toma los valores 0; 1; 2; : : : con probabilidades
n
e
pn = P [X = n] = :
n!
La función de masa de probabilidad para X es
n
e
: N ! R; (n) = :
n!
Nótese que en este caso la función de masa de probabilidad de…ne directamente la medida de
probabilidad en :
La variable del ejemplo anterior es de tipo Poisson, de acuerdo con la siguiente de…nición.
De…nición 9 Se dice que una variable X es del tipo Poisson, o que tiene una distribución o ley
de Poisson, si toma los valores 0; 1; 2; : : : con probabilidades
n
e
pn = P [X = n] = :
n!
Ejemplo 87 Suponga que el número de veces que el tipo de cambio toca la banda inferior en un
mes, es una variable Poisson con parámetro = 3: Queremos calcular la probabilidad de que haya
al menos 3 caídas en un mes. Sea X la variable en cuestión. Se tiene
P [X 3] = 1 P [X < 3]
= 1 P [X = 0] P [X = 2] P [X = 3]
30 31 32
= 1 e 3 + + = 0:576 8
0! 1! 2!
Ejemplo 88 En el ejemplo anterior, calculemos la probabilidad de que haya al menos 3 caídas en

el mes, condicionado a que haya al menos una caída. Se tiene
P [X 3] 0:5768
P [X 3j X 1] = = = 0:607 :
P [X 1] 1 e 3
Ejemplo 89 En el ejemplo 76, sea X el número de veces que se tira la moneda. Es decir,
X ((a1 ; : : : ; an 1 ; 6)) = n: La variable X toma los valores 1; 2; 3; : : : con probabilidades
5n 1
pn = P [X = n] = 6n :
S. Cambronero 58
Un poco más generalmente, suponga que se realiza un experimento reiteradamente, con probabil-
idad de éxito p. Sea X el número de intentos que se requieren para obtener el primer éxito. La
variable X toma los valores 1; 2; 3; : : :. Para que X = n se requiere n 1 fracasos seguidos de un
éxito. Consecuentemente
n 1
pn = P [X = n] = (1 p) p:
Esta es la variable geomérica, de acuerdo con la siguiente de…nición. Para estar seguros de que
estos pesos cumplen la condición necesaria, es importante observar que
1
X 1
X 1
X
n 1 k p
pn = p (1 p) =p (1 p) = = 1:
n=1 n=1
1 (1 p)
k=0
De…nición 10 Una variable se llama geométrica si toma los valores 1; 2; 3; : : : con probabilidades
n 1
pn = P [X = n] = (1 p) p:
Ejemplo 90 Una caja contiene 4 bolas blancas y 5 negras. Realizamos reiteradamente extracciones
independientes de una bola, con reemplazo. Se de…ne X como el número de extracciones necesarias
para obtener 3 bolas blancas. Entonces X es una variable que toma los valores 3; 4; 5; : : : . Por
ejemplo, para que X = 7 se requiere que en las primeras 6 extracciones salgan 2 bolas blancas, y
en la sétima extracción salga una bola blanca. La probabilidad de que salgan 2 bolas blancas en las
primeras 6 extracciones es
2 4
6 4 5
:
2 9 9
Consecuentemente
2 4 3 4
6 4 5 4 6 4 5
P [X = 7] = = :
2 9 9 9 2 9 9
En general, para k 3 se tiene
2 k 3 3 k 3
k 1 4 5 4 k 1 4 5
P [X = k] = = :
2 9 9 9 2 9 9
De…nición 11 Una variable aleatoria se llama binomial negativa de parámetros n y p si toma los
valores n; n + 1; : : : con probabilidades
k 1 n k n
P [X = k] = p (1 p) ; k = n; n + 1; : : :
n 1
Una variable binomial negativa permite modelar el número de lanzamientos necesarios para obtener
n éxitos, cuando la probabilidad de éxito en p: Nótese en particular que
1
X k 1 n k n
p (1 p) = 1:
n 1
k=n
En efecto, esta serie se puede escribir como

1
X
pn k n
(k 1) : : : (k n + 1) (1 p)
(n 1)!
k=n
S. Cambronero 59
donde la sumatoria se obtiene derivando término a término n 1 veces la serie geométrica

1
X 1
xk 1
=
1 x
k=1
y luego evaluando en x = 1 p: Entonces dicha suma coincide con

(n 1)
1 n (n 1)!
= (n 1)! (1 x) =
1 x x=1 p pn
x=1 p
y …nalmente
1
X
pn k n pn (n 1)!
(k 1) : : : (k n + 1) (1 p) = = 1:
(n 1)! (n 1)! pn
k=n
El siguiente ejemplo se re…ere a variables de tipo hipergeométrico.
Ejemplo 91 Considere una caja con 5 bolas blancas y 4 bolas negras. Se extraen 3 bolas de la
caja (sin poner cuidado al orden) y de…nimos X como el número de bolas blancas que se obtienen
en la extracción. La variable X toma los valores 0; 1; 2:3: En gran medida la variable X se parece
a una binomial, pero para que fuera binomial se requiere que la elección de las bolas se haga en
forma secuencial y con reemplazo. En este caso, para tener X = k se deben escoger k bolas de las
5 blancas y 3 k de las negras. Consecuentemente el número de casos favorables es k5 3 4 k : Se
obtiene
5 4
k 3 k
P [X = k] = 9 :
3
Nótese que por ejemplo se tiene
5 4
2 1 10 4 10
p2 = 9 = = :
3
84 21
1 5 5
Similarmente se calculan p0 = 21 ; p1 = 14 ; p3 = 42 :
En general, suponga que la caja contiene m bolas blancas y n bolas negras. Se extrae una com-
binación de r bolas de la caja y se de…ne X como el número de bolas blancas extraídas. Se
tiene
m n
k r k
P [X = k] = m+n (3.2)
r
De…nición 12 Una variable X se llama hipergeométrica de parámetro m; n y r si su distribución

está dada (3.2). Es decir, toma los valores k = 0; 1; : : : ; r con los pesos
m n
k r k
pk = m+n :
r
Nota: En particular, dado que la suma de los pesos es 1 se obtiene la identidad

r
X m n m+n
= : (3.3)
k r k r
k=0
S. Cambronero 60
Ejemplo 92 Una cartera de crédito tiene 1700 clientes, de los cuales 223 son AAA. Si se escoge
al azar una muestra de 17 clientes para ofrecerles un nuevo producto, hallar la probabilidad de que
1. haya exactamente un cliente AAA en la muestra

2. haya al menos un cliente AAA en esa muestra.
Si X es el número de clientes AAA en la muestra de 17, entonces x es una hipergeométrica de

parámetros m = 223; n = 1477 y r = 17: En el primer caso se pide calcular
223 1477
1 16
P [X = 1] = 1700 = 0:234 78:
17
En el segundo caso se pide hallar P [X > 0] = 1 P [X = 0] : Se tiene

223 1477
0 17
P [X = 0] = 1700 = 0:090 48
17
y luego
P [X > 0] = 1 0:090 48 = 0:909 52:
3.2.2 Ejercicios
1. Se lanzan dos dados y se de…ne X como el producto de los dos números observados. Determine
la función de masa de probabilidad para X:
2. A 5 Bancos estatales y 5 privados se les aplica un ranking. Los criterios usados son desconoci-
dos para nosotros, así que asumimos que todos los posibles órdenes son igualmente probables.
Sea X la mejor posición obtenida por un Banco estatal. Por ejemplo, X = 2 signi…ca que el
Banco estatal mejor cali…cado está en l segunda posición. Determine la función de masa de
probabilidad para X:
3. Una caja contiene 3 bolas blancas, 4 negras y 2 rojas. Se extraen dos bolas de la caja. Suponga
que por cada bola blanca ganamos un colón, por cada bola negra ganamos 2 colones y por
cada bola roja perdemos un colón. Sea X es la ganancia de este juego.
(a) Determine la función de masa de probabilidad para X

(b) Calcule la probabilidad de obtener una ganancia positiva
(c) Calcule la probabilidad de obtener una ganancia i; condicionado a que la ganancia es
positiva.
4. Se lanza una moneda tres veces. Sea X la diferencia entre el número de escudos y el número
de coronas. Determine la función de masa de probabilidad para X:
5. Un dado se lanza dos veces. Determine la función de masa de probabilidad para...
(a) el máximo de los dos resultados

(b) el mínimo de los dos resultados
(c) el primer resultado menos el segundo
S. Cambronero 61
6. Se elige una combinación de tres bolas (sin reemplazo) de una urna que contiene 11 bolas
numeradas del 1 al 11: Digamos que ganamos el juego cuando alguna de las bolas extraídas
tiene el número 7 o mayor que 7: Sea X el mayor de los 3 números obtenidos.
(a) Calcule P [X = i] para i = 3; : : : ; 11

(b) Deduzca la probabilidad de ganar el juego
7. Repita el ejercicio anterior si la selección se hace con reemplazo.

8. Un portafolio consta de inversiones iguales en dos títulos. El primero genera un rendimiento
positivo con probabilidad 13 ; el segundo genera, independientemente, un rendimiento positivo
con probabilidad 23 : Para cualquiera de los dos títulos, cuando el rendimiento es positivo es
igualmente probable que sea del 5% o del 3%: Los títulos no generan pérdidas, es decir que el
rendimiento es nulo cuando no es positivo. Si X es el rendimiento del portafolio, determine
la función de masa de probabilidad para X:
9. Se realizan 5 lanzamientos independientes de una moneda. Sea X es el número de escudos
obtenido.
(a) Dibuje la función de masa de probabilidad de la variable X 3:

(b) Calcule P [X 2 f 1; 0; 2g] ; P [X 1] ; P [X < 0] :
(c) Calcule P [X 6= 0] ; P [ X > 1j X 0] :
10. Se lanza una moneda 2 veces. Modelemos este experimento con el espacio = f0; 1g f0; 1g ;
donde 0 signi…ca que sale corona y 1 que sale escudo. Exprese X como una combinación lineal
de variables indicadoras, cuando...
(a) X es el número de escudos

(b) X es el número de escudos menos el número de coronas
(c) X es la ganancia donde se ganan dos colones por cada escudo y se pierde un colón por
cada corona.
11. Un juego consiste en lanzar un dado. El jugador gana lo apostado multiplicado por lo que
indique el dado. Si un jugador juega dos veces, sean X1 y X2 los número mostrados por el
dado en ambos tiros. Si X es la ganancia total, exprese X en términos d X1 y X2 cuando
(a) Se apuesta un colón en cada tiro

(b) Se apuesta un colón en el primer tiro y dos colones en el segundo
(c) Se apuestan a colones en el primer tiro y b colones en el segundo
12. Se lanza un dado dos veces y se de…ne X como el resultado del primer lanzamiento, mientras
Y es el resultado del segundo lanzamiento. Determine la función de masa de probabilidad
de la variable jX Y j : Calcule la probabilidad de que los dos resultados estén a distancia
mayor que 2:
S. Cambronero 62
13. Se lanza un dado y se de…ne
X = 1f1;2;3g ; Y = 1f1;2;3;4g ; Z = 1f1;2;3;4;5g :
Determine la función de masa de probabilidad para las variables X + Y + Z; X + Y Z;

XY + Z; XY Z:
14. Un juego consiste en tirar un dado. Si sale 1 perdemos 90 colones, si sale 2 o 3 no ganamos
ni perdemos, si sale mayor que 3 ganamos 40 colones. Si X representa la ganancia del juego,
exprese X como una combinación de variables indicadoras. Determine la función de masa de
X:
15. Una caja contiene 3 bolas blancas y 4 negras. Realizamos 8 extracciones de una bola, con
reemplazo. Calcule la probabilidad de que salga
(a) al menos una bola negra

(b) al menos una bola blanca
(c) al menos una negra, dado que sale al menos una blanca.
16. Resuelva el ejercicio anterior pero ahora con n extracciones.

17. Suponga que el número de fraudes informáticos a la plataforma de un Banco, durante un mes,
es una variable Poisson con parámetro = 7: Calcule la probabilidad de que haya al menos
3 fraudes en un mes. Calcule la probabilidad de que haya al menos 3 fraudes, condicionado
a qu haya al menos dos fraudes en el mes.
18. Se lanza un dado un número in…nito de veces. Sea X es el número de lanzamiento en que se
obtiene el primer 4:
(a) Halle P [X 3] ; P [X > 3] :

(b) En general calcule P [X n] ; P [X > n] :
(c) Calcule P [ X > n + 1j X > n] :
19. Resuelva el ejejrcicio anterior en el caso general de un experimento con probabilidad de éxito
p; que se realiza in…nitas veces, siendo X el número de lanzamiento del primer éxito. Es
decir, X es una variable geométrica de parámetro p:
20. Una caja contiene 5 bolas blancas y 7 negras. Realizamos reiteradamente extracciones in-
dependientes de una bola, con reemplazo. Se de…ne X como el número de extracciones
necesarias para obtener 3 bolas blancas. Calcule P [X > 0] ; P [ X > 1j X > 0] :
21. Considere una caja con 7 bolas blancas y 8 bolas negras. Se extraen 5 bolas de la caja y
de…nimos X como el número de bolas blancas que se obtienen en la extracción. Calcule
P [X > 0] ; P [ X > 1j X > 0] :
22. Una cartera de crédito tiene 1700 clientes, de los cuales 223 son AAA. Si se escoge al azar
una muestra de 17 clientes para ofrecerles un nuevo producto, hallar la probabilidad de que...
(a) haya exactamente dos clientes AAA en la muestra

(b) haya menos de 3 clientes AAA en esa muestra
S. Cambronero 63
(c) haya menos de 3 clientes AAA dado que hay al menos dos de ese tipo.
23. Sea X binomial de parámetros n y p: Dado k; halle el valor de p que maximiza P [X = k] :

Más adelante reconocerá esta técnica en el método de máxima verosimilitud.
24. Sea X una variable Poisson de parámetro : Para k …jo, determine el valor de que maximiza
P [X = k] :
25. Considere una variable de Poisson X con parámetro . Veri…que la identidad
P [X = k]
= :
P [X = k 1] k
Deduzca que el peso pk = P [X = k] crece hasta [[ ]] (la parte entera de ) y luego decrece.
¿Cuál es entonces el mayor de los pesos de una variable tipo Poisson?
26. Sea X una variable Poisson de parámetro : Calcule
P [X es par] :
Sug. Use la serie de Taylor de e +e :

27. Si X es una binomial de parámetros n y 12 ; calcule la probabilidad de que el número de éxitos
n
sea par. Sug. Use la fórmula del binomio para ( 1 + 1) :
28. Para una variable aleatoria discreta, exprese P (X a) en términos de la función de masa
de X: Haga lo mismo con P [X < a] y P [X > a] :
3.3 Esperanza de una variable discreta

Considere el lanzamiento de un dado en forma reiterada. Suponga que en cada lanzamiento
ganamos 17 colones si el número obtenido es un 3; en caso contrario ganamos 11 colones. Si
lanzáramos el dado 600 veces, esperaríamos obtener aproximadamente 100 veces el número 3; así
que nuestras ganancias deberían ser aproximadamente
100 17 + 500 11
es decir en promedio una ganancia de

100 17 + 500 11 1 5
= 17 + 11 = 12
600 6 6
en cada lanzamiento. Podríamos decir que se espera ganar 12 colones por lanzamiento, o que la
ganancia esperada por lanzamiento es de 12: Si X es la ganancia en cada lanzamiento, su función
de masa es
1 5
(17) = P [X = 17] = ; (11) = P [X = 11] =
6 6
así que la ganancia esperada se puede escribir como
X
17 (17) + 11 (11) = x (x) :
S. Cambronero 64
En general, considere una variable aleatoria discreta y sean xn los valores que toma X: Si pn =
P [X = xn ] son los pesos respectivos, se de…ne1
X X
E (X) = EX = pn xn = x (x) :
n x
Esta suma puede ser …nita o numerable. En la primera suma, se supone que x toma los valores
xn ; para n en algún conjunto …nito (típicamente f1; 2; : : : ; N g) o numerable (típicamente todo N).
En la segunda suma, simplemente no se etiquetan los valores que toma X: Veremos ejemplos en
los que es mejor usar esta notación.
Ejemplo 93 Considere X el valor observado al lanzar un dado. La variable X toma los valores
k = 1; 2; : : : ; 6 con probabilidad P [X = k] = 16 . Entonces
6
X
1 167
EX = k 6 = 6 2 = 27 :
k=1
Si nos ofrecen entrar a un juego en el que se lanza un dado y se gana en millones la cantidad que
indica el dado, un pago justo por entrar al juego es 3:5 millones.
Ejemplo 94 Un bono cero cupón vence dentro de 18 meses y un día. Tenemos un modelo que nos
dice que para mañana la tasa de descuento a 18 meses será
1
1. 4.5% con probabilidad 6
1
2. 4.7% con probalilidad 3
1
3. 4.4% con probalilidad 2
Queremos conocer hoy el precio que se espera tenga el bono mañana. El precio de un bono es
la suma de los valores presentes de los ‡ujos futuros. En este caso se reduce a un único ‡ujo
recibido 18 meses a partir de mañana. El precio del bono se reporta con base en un principal de
100: Además, el estándar es usar interés compuesto con periodicidad 6 meses. Si X representa el
100 1 100
precio del bono se tiene X = 3 = 93: 543 con probabilidad 6 ; X = 3 = 93: 269 con
2 )
(1+ 0:045 2 )
(1+ 0:047
probabilidad 13 y X = 100 1
3 = 93: 68 con probabilidad 2 : Se obtiene
2 )
(1+ 0:044
1 1 1
EX = 93: 543 6 + 93: 269 3 + 93: 68 2 = 93: 52 :
Se espera que el precio del bono mañana sea 93:52: De esta forma, si quisiéramos vender o comprar
este bono en el mercado, el precio justo de acuerdo con nuestro modelo es 93:52:
Ejemplo 95 Un cliente de una cartera de crédito tiene una probabilidad de impago de 0:01: Es
decir, el cliente devuelve el monto prestado y los intereses (que supondremos de un 5% al …nal del
periodo) con probabilidad 0:99; y cae en impago (se pierde el total de la inversión) con probabilidad
0:01. Si Y denota la pérdida porcentual del Banco, asociada con esta inversión, se tiene
P [Y = 100] = 0:01; P [Y = 5] = 0:99
La pérdida esperada porcentual es EY = 0:01 100 + 0:99 ( 5) = 3: 95: Es decir, el Banco
espera ganarse un 3:95%, sin tomar en cuenta el cambio del valor del dinero en el tiempo.
1 Siempre que no haya ambiguedad, se puede usar la notación EX: En algunos casos como al calcular la esperanza
de una suma, es importante el uso del paréntesis.

S. Cambronero 65
Ejemplo 96 Un juego consiste en tirar un dado. Si sale 3 o 5 el jugador pierde 100 colones, en
caso contrario gana 50 colones. Si X representa la ganancia del jugador se tiene
1 2
EX = 100 + 50 = 0:
3 3
Podríamos decir que este es un juego justo.
Ejemplo 97 Considere una variable Bernoulli que toma los valores a y b: Entonces
X = a 1A + b 1Ac
donde A = [X = a] : Si p = P (A) se tiene
EX = pa + (1 p) b:
Ejemplo 98 Considere una variable tipo Poisson, es decir, X toma los valores 0; 1; 2; : : : con
n
e
probabilidades pn = P [X = n] = n! : En este caso se tiene
1
X n 1
X n 1 1
X k
e
EX = n= e = e = e e = :
n=0
n! n=1
(n 1)! k!
k=0
En el tercer paso se hizo el cambio k = n 1:
Ejemplo 99 En el ejemplo 89 se tiene

1 1
!
X X
5n 1 1 n 1
EX = 6n n = 6 nx :
n=1 n=1 x= 65
La serie del lado derecho, es la derivada de la serie geométrica evaluada en x = 56 : Consecuente-

mente
0
1 1 1 1 1 1
EX = 6 1 x = 6 (x 1)2
= 6 2 = 6:
x= 65 x= 56 ( 16 )
En general, si X es una variable geométrica de parámetro p se tiene

1 1
!
X n 1
X
n 1
EX = n (1 p) p=p nx :
n=1 n=1 x=1 p
Al igual que en el ejemplo anterior se obtiene

0 1
1 1 1
EX = p 1 x =p (x 1)2
=p p2 = :
x=1 p x=1 p p
Lema 2 Para una variable geométrica de parámetro p se tiene

1
EX = :
p
S. Cambronero 66
1
Ejemplo 100 Considere una variable binomial X de parámetros n = 4 y p = 3: Esta variable
toma los valores k = 0; : : : ; 4 con probabilidades
k 4 k
4 1 2
pk = :
k 3 3
La esperanza de X es
4
X 3 2 2 3 4
4 2 1 2 1 2 1 4
EX = kpk = + 12 + 12 +4 = :
3 3 3 3 3 3 3 3
k=0
En general, considere una variable binomial de parámetros n y p: La esperanza de X se puede

calcular en forma bastante sencilla una vez que se desarrollen algunas propiedades de la esperanza.
Por ahora se hará un cálculo directo pero algo elaborado. Se tiene
n
X n
X
n k n k n! n k
EX = k p (1 p) = pk (1 p) :
k (k 1)! (n k)!
k=0 k=1
La segunda sumatoria omite el término k = 0 debido a que es nulo. Factorizando n y p se obtiene

n
X n
X1
n 1 k 1 n k n 1 n 1 j
EX = np p (1 p) = np pj (1 p) :
k 1 j=0
j
k=1
En este último paso se hizo el cambio j = k 1: La última sumatoria es el desarrollo binomial para
n 1
(p + (1 p)) = 1: Esto demuestra el siguiente lema.
Lema 3 Para una variable binomial X de parámetros n y p se tiene EX = np:
Ejemplo 101 Suponga que cada día, independientemente de los demás días, la probabilidad de
que haya una subida en el tipo de cambio es 0:4: Hallar el número esperado de días en que se da
una subida durante un año.
El número de días en que se da una subida durante el año es una variable binomial de parámetros
n = 365 y p = 0:4: Consecuentemente EX = 365 0:4 = 146: Se espera que haya 146 días que
registren una subida en el tipo de cambio.
Considere ahora una variable X binomial negativa, de parámetros n y p: Entonces X toma los
valores n; n + 1; : : : con probabilidades
k 1 n k n
P [X = k] = p (1 p) ; k = n; n + 1; : : :
n 1
La esperanza de X se puede calcular de forma similar a como se calculó la de una geométrica. En
efecto, note que
1
X 1
X
k 1 n k n pn k n
EX = k p (1 p) = k (k 1) : : : (k n + 1) (1 p) :
n 1 (n 1)!
k=n k=n
Los términos de la última sumatoria se obtienen derivando n veces los términos de la serie ge-
ométrica. Consecuentemente
pn d 1 pn n 1 n
EX = n
= n! (1 x) = npn p n 1 = :
(n 1)! dx 1 x x=1 p (n 1)! x=1 p p
Escribimos como un lema lo que se ha demostrado.
S. Cambronero 67
Lema 4 Si X es una variable aleatoria binomial negativa de parámetros n y p; se tiene

n
EX = :
p
Ejemplo 102 Una caja contiene 3 bolas blancas y 7 bolas negras. Hallar el número esperado de
extracciones con reemplazo que se deben realizar para obtener la sexta bola blanca.
El número de extracciones hasta la sexta bola blanca es una variable X binomial negativa de
3
parámetros n = 6 y p = 10 : La esperanza de X es
6
EX = 3 = 20:
10
Se espera realizar 20 extracciones para obtener una sexta bola blanca.

Ejemplo 103 Considere una caja con 5 bolas blancas y 4 bolas negras. Si se extraen 3 bolas de la
caja, hallar el número esperado de bolas blancas en la extracción.
Si X es el número de bolas blancas que se obtienen en la extracción, X toma los valores 0; 1; 2; 3
1 5
con pesos p0 = 21 ; p1 = 14 ; p2 = 10 5
21 ; p3 = 42 : Luego
1 5 10 5 5
EX = 0 +1 +2 +3 = :
21 14 21 42 3
En general, suponga que la caja contiene m bolas blancas y n bolas negras. Queremos hallar el
número esperado de bolas blancas en una combinación de r bolas extraídas de las m + n bolas de
la caja. Dado que el número de bolas blancas en una hipergeométrica de parámetros m; n y r; se
tiene
r
X m n r
X
k r k m (m 1)! n
EX = k m+n = m+n
r r
(k 1)! (m k)! r k
k=0 k=1
r
X r 1
X
m m 1 n m m 1 n
= m+n = m+n :
r
k 1 r k r j=0
j r 1 j
k=1
En el último paso se hizo el cambio j = k 1: Esta última sumatoria es la misma de la identidad

(3.3), cambiando r por r 1 y m por m 1: Consecuentemente
m m 1+n mr
EX = m+n = :
r
r 1 m+n
Lema 5 La esperanza de una variable hipergeométrica de parámetros m; n y r está dada por
mr
EX = :
m+n
m
Es interesante observar que si se de…ne p = m+n entonces EX = rp: De tal forma que el número
esperado de bolas blancas en la extracción es el número de bolas extraídas multiplicado por la pro-
porción de bolas blancas que hay originalmente en la caja. Intuitivamente, la proporción esperada
de bolas blancas en la muestra de r bolas, es la proporción de bolas blancas en la caja.
Ejemplo 104 Una cartera de crédito consta de 700 clientes, 70 de los cuales son AAA. Si se eligen
al azar 20 clientes de la cartera, halle el número esperado de clientes AAA en dicha muestra.
Dado que el porcentaje de clientes AAA en la cartera es 10%, el porcentaje esperado de clientes
AAA en la muestra debe ser el 10%, es decir que se esperan 2 clientes AAA en la muestra.
S. Cambronero 68
3.3.1 Propiedades de la esperanza

Suponga que se lanza un dado y se gana la cantidad apostada multiplicada por el valor mostrado
por el dado. Si X es el número mostrado por el dado se tiene EX = 72 : Si se apuestan 3 colones,
la ganacia será 3X: En tal caso se obtiene una ganancia esperada de 3 72 ; es decir 3E (X) : En
general, si se apuestan a colones, la ganancia esperada es
E (aX) = aE (X) :
De la misma forma, si el jugador inicia con un capital b; su capital después de lanzar el dado es
aX + b. En tal caso, el capital esperado después de lanzar el dado es aEX + b: En general, si
una variable X toma un valor x; entonces la variable aX + b toma el valor ax + b con la misma
propabilidad. Luego, si es la función de masa de X se tiene
X X X
E (aX + b) = (ax + b) (x) = a x (x) + b (x) = aE (X) + b:
Lema 6 Si X es una variable aleatoria discreta y a; b son constants se tiene
E (aX + b) = aEX + b:
Ejemplo 105 Un juego consiste en tirar un dado. Para ingresar al juego se deben paga 11 colones
y, una vez lanzado el dado, el jugador recibe el triple del número mostrado. Determinar si el juego
es favorable, justo o desfavorable para el jugador.
Si X es el número mostrado por el dado se tiene EX = 27 : La ganancia del jugador es entoncves
3X 11: Tenemos
7 1
E (3X 11) = 3 11 = :
2 2
El juego es desfavorable para el jugador.
Para establecer la siguiente propiedad considere el siguiente ejemplo.
Ejemplo 106 Un juego consiste en tirar una moneda dos veces. El jugador gana un colón por
cada escudo, dos colones por cada corona y 5 colones extra en caso de obtener los dos resultados
iguales. Considere el espacio muestral
= fee; ec; ce; ccg :
La ganancia del juego es la suma de dos variables X e Y; donde X (cc) = 4; X (ce) = X (ec) = 3;
X (ee) = 2; mientras Y (cc) = Y (ee) = 5; Y (ce) = X (ec) = 0: Tenemos
4 3 2 0 5 5
EX = + + = 3; EY = + = :
4 2 4 2 2 2
Por otro lado
(X + Y ) (cc) = 9; (X + Y ) (ce) = (X + Y ) (ec) = 3; (X + Y ) (ee) = 7:
La esperanza de X + Y es
9 3 7 11
E (X + Y ) = + + = = EX + EY:
4 2 4 2
S. Cambronero 69
La igualdad del ejemplo anterior no es casualidad. En efecto, el cálculo se puede desarrollar de la

siguiente manera:
1 1 1
E (X + Y ) = (4 + 5)
+ (3 + 0) + (2 + 5)
4 2 4
4 3 2 0 5
= + + + +
4 2 4 2 2
= EX + EY:
Esta misma idea demuestra que en general, para dos variables X e Y se tiene
E (X + Y ) = EX + EY:
Para el lector interesado en una deducción más rigurosa, puede ensayar el siguiente esbozo: Si X
toma los valores xi y Y toma los valores yj , denotamos Ai = [X = xi ] ; Bj = [Y = yj ] : Entonces
X + Y toma el valor xi + yj en Ai \ Bj . Luego
XX
E (X + Y ) = (xi + yj ) P (Ai \ Bj )
i j
X X X X
= xi P (Ai \ Bj ) + yj P (Ai \ Bj )
i j j i
X X
= xi P (Ai ) + yj P (Bj )
i j
= EX + EY:
Un argumento inductivo permite deducir que la esperanza de una suma de n variables es la suma
de las esperanzas. Es decir, si X1 ; : : : Xn son variables aleatorias discretas se tiene
E (X1 + : : : + Xn ) = EX1 + : : : + EXn : (3.4)
En los siguientes ejemplos se utiliza esta propiedad para hacer un nuevo cálculo de la esperanza
de variables binomiales, binomiales negativas e hipergeométricas.
Ejemplo 107 Considere un experimento con probabilidad de éxito p; que se repite en forma in-
dependiente n veces. Sea Xi la variable indicadora de el evento "ocurre un éxito en el intento i".
Las variables X1 ; : : : ; Xn son de tipo Bernoulli con
P [Xi = 1] = p; P [Xi = 0] = 1 p:
Consecuentemente EXi = p para cada i: La variable
X = X1 + : : : + Xn
es el número de éxitos de las n corridas del experimento, así que es una Binomial de parámetros
n y p: De acuerdo con (3.4) se obtiene
EX = EX1 + : : : + EXn = np:
Obtenemos así una segunda deducción del resultado del lema 3.

S. Cambronero 70
Ejemplo 108 Siguiendo con el experimento, sea X el número de intentos necesarios para obtener
el n ésimo éxito. Entonces X es una binomial negativa de parámetros n y p. Esta variable
se puede escribir como X1 + : : : + Xn ; donde X1 es el número de intentos hasta el primer éxito
y Xk es el número de intentos posteriores al éxito k 1; que se requieren para un nuevo éxito.
Consecuentemente cada Xk es una geométrica y por lo tanto EXk = p1 : Luego
n
EX = EX1 + : : : + EXn = :
p
Se obtiene entonces una segunda deducción del resultado del lema 4.
Ejemplo 109 Ahora consideremos X una variable hipergeométrica de parámetros m; n; r. Esta

puede interpretarse como el número de bolas negras que se obtienen al extraer una combinación de
r bolas (sin reemplazo) de una caja que contiene m bolas negras y n bolas blancas. Una manera
de replantear el problema es numerando las bolas negras como b1 ; : : : ; bm y de…niendo Xk = 1 si la
bola bk es extraída, Xk = 0 en caso contrario. Claramente Xk es de tipo Bernoulli con
m+n 1
r 1 r
P [Xk = 1] = m+n = :
r
m+n
La variable X es la suma X1 + : : : + Xm y entonces

mr
EX = EX1 + : : : + EXn = :
m+n
Esta es una deducción alternativa del lema 5.
Ejemplo 110 Otro posible enfoque para deducir la esperanza de una hipergeométrica es el sigu-
iente: Imaginemos que las r bolas extraídas se colocan en r campos. De…nimos Yk = 1 si la bola
que colocamos en el campo k es negra, en caso contrario Yk = 0: La extracción puede realizarse
en el cualquier orden, así que podríamos comenzar extrayendo la bola que vamos a colocar en el
campo k: De esa forma, hay m casos favorables y consecuentemente
m
P [Yk = 1] = :
m+n
m
Luego EYk = m+n y …nalmente Y = Y1 + : : : + Yr es el número de bolas negras en la extracción,
así que
mr
EY = EY1 + : : : EYr = :
m+n
3.3.2 Funciones de variables aleatorias

La siguiente propiedad de la esperanza tiene que ver con variables construidas como composición
de una variable con una función. Considere g una función real de variable real y X una variale
aleatoria. Se puede formar una nueva variable Y = g (X) : La variable Y toma el valor g (x) cuando
X toma el valor x; de manera que
P [Y = g (x)] = P [X = x] = (x) :
S. Cambronero 71
Ejemplo 111 Considere la variable X que representa la ganancia de un juego en el que se lanza
un dado y se gana el número mostrado, pero habiendo pagado 3 colones para entrar al juego.
Entonces X toma los valores en S = f 2; 1; 0; 1; 2; 3g ; cada uno con probabilidad 61 . La variable
X 2 toma los valores 0; 1; 4; 9 con probabilidades respectivsas 16 ; 13 ; 13 y 61 : Luego
1 1 1 1 19
EX 2 = 0 +1 +4 +9 = :
6 3 3 6 6
Nótese que se puede escribir
1 1 2 1 1 2 1 1
EX 2 = 02 + 12 + ( 1) + 22 + ( 2) + 32
X 6 6 6 6 6 6
= x2 (x)
x2S
1
donde (x) = 6 para cada x:
En general, si X toma los valores x 2 S con probabilidades (x) se tiene

X
EX 2 = x2 (x)
x2S
y más generalmente.
Lema 7 Para una variable aleatoria X y una función g se tiene

X
Eg (X) = g (x) (x)
x2S
siempre que ambas esperanzas existan.
Ejemplo 112 Considere una variable tipo Poisson de parámetro : Calculemos EX 2 :

1
X n 1
X n 1
X k+1
e e e
EX 2 = n2 = n = (k + 1)
n=0
n! n=1
(n 1)! k!
k=0
X1 k X1 k
e e 2
= k + = + :
k! k!
k=0 k=0
Se ha usado el hecho que la primera suma representa la esperanza de X; que ya sabemos es ;

mientras que la segunda suma es la suma de los pesos y por lo tanto es 1:
Ejemplo 113 Considere una opción de compra que vence dentro de 3 días, para coprar un activo
a un precio de ejercicio (strike price) de 99: Supongamos que tenemos un modelo interno que nos
dice que el precio del activo subyacente dentro de 3 días va a ser 95 con probabilidad 52 ; 97 con
probabilidad 15 ; 100 con probabilidad 103 1
y 101 con probabilidad 10 : Llegada la fecha de ejercicio, si
el precio x del activo es mayor que 99; podemos ejecutar la opción, ganando x 99; mientras que
si el precio x es menor que 99; no ejecutams la opción y la ganancia es nula. Si se quiere calcular
la ganancia esperada, se debe calcular, Eg (X) ; donde X es el precio que tendrá el activo dentro
de 3 días y
x 99 para x > 99
g (x) =
0 para x 99:
S. Cambronero 72
+
En otras palabras, g (x) = max (x 99; 0) : Se suele denotar también g (x) = (x 99) : Nótese
que g (95) = g (97) = 0; g (100) = 1; g (101) = 2: Consecuentemente
2 1 3 1
Eg (X) = g (95) + g (97) + g (100) + g (101)
5 5 10 10
3 1 1
= 1 +2 = :
10 10 2
La ganancia esperada es de media unidad monetaria por cada unidad del activo pactada para la
compra.
3.3.3 Aproximación binomial de una Poisson

Una manera de obtener la distribución Poisson es como un límite de una distribución binomial de
parámetros n y p; donde n ! 1 y p ! 0 de manera que np se mantiene …jo. Dado > 0 y n un
entero mayor que ; podemos de…nir p = n : De esta forma 0 < p < 1 y np = : Consideramos una
variable binomial Xn de parámetros n y p = n : Para cada k = 0; 1; : : : se tiene, siempre que n > k
k n k
n (n 1) (n k + 1)
P [Xn = k] = 1
k! n n
k n k
n (n 1) (n k + 1)
= 1 1
k! nk n n
La expresión
n (n 1) (n k + 1)
nk
es un cociente de polinomios de grado k; así que tiende a 1: Por otro lado,
k
1 !0
n
dado que k está …jo, mientras que

n
1 !e :
n
Se obtiene
k
P [Xn = k] ! e :
k!
De esta manera, la distribución de Poisson se obtiene como un caso límite de una distribución bino-
mial. Pero mejor que eso, dado que la distribución de Poisson es mucho más manejable para …nes
computacionales, la aproximación anterior nos permite realizar cálculos aproximados de probabil-
idades relacionadas con distribuciones binomiales, siempre que el parámetro n sea su…cientemente
grande.
Ejemplo 114 En una cartera de crédito hay 700 clientes. Cada cliente cae en impago en cierto
periodo, en forma independiente, con probabilidad 0:015: El número de impagos es una variable
binomial X de parámetros n = 700 y p = 0:015: El número esperado de impagos es
E [X] = np = 10:5
S. Cambronero 73
Usando la aproximación de Poisson, vamos a estimar la probabilidad de que haya exactamente 7

impagos. En este caso = np = 10:5; la aproximación es
7
10:5 (10:5)
P [X = 7] e = 0:07 688
7!
El valor obtenido mediante el cálculo directo es
700
P [X = 7] = 0:0157 0:985693 0:076 58:
7
La aproximación de Poisson da tres decimales de precisión.
Ejemplo 115 Cada día el tipo de cambio tiene una caída con probabilidad 0:12 independiente-
mente de lo que ocurra los demás días. Aproximar la probabilidad de que en un año calendario, el
tipo de cambio caiga 40 veces.
Si X es el número de caídas del tipo de cambio en el año, entonces X es binomial de parámetros
n = 365 y p = 0:12: La probabilidad buscada es
365
P [X = 40] = 0:1240 0:88325 0:055
40
Si disponemos de una calculadora un poco limitada, este cálculo es prácticamente imposible. Sin
embargo, dado que n es bastante grande, podríamos aproximar esta probabilidad por P [Y = 40] ;
donde Y es una variable tipo Poisson de parámetro = np = 365 0:12 = 43: 8
40 40 43: 8
e (43: 8) e
P [Y = 40] = = 0:053
40! 40!
Nota: En ejemplos como este, es importante tener presente que no se sabe qué tan buena es
la aproximacioón obtenida. Además, tampoco es tan claro qué se entiende por n grande. Esto
dependerá en cierta medida del otro parámetro p.
3.3.4 Ejercicios
1. Se lanzan dos dados y se de…ne X como el producto de los dos números observados. Caclule
la esperanza de X:
2. A 5 Bancos estatales y 5 privados se les aplica un ranking. Se asumen todos los posibles
órdenes son igualmente probables. Sea X la mejor posición obtenida por un Banco estatal.
Calcule la esperanza de X:
3. Una caja contiene 3 bolas blancas, 4 negras y 2 rojas. Se extraen dos bolas de la caja. Por
cada bola blanca ganamos un colón, por cada bola negra ganamos 2 colones y por cada bola
roja perdemos un colón. Calcule la ganancia esperada en este juego.
de coronas. Calcule la esperanza de X:
5. Un dado se lanza dos veces. Determine el máximo esperado, el mínimo esperado y la diferencia
esperada entre los dos resultados.
S. Cambronero 74
6. Se eligen tres bolas (sin reemplazo) de una urna que contiene 11 bolas numeradas del 1 al
11: Calcule el máximo esperado entre los tres números obtenidos.
7. Repita el ejercicio anterior si la selección se hace con reemplazo.
positivo con probabilidad 13 ; el segundo genera un rendimiento positivo con probabilidad 23 :
Para cualquiera de los dos títulos, cuando el rendimiento es positivo es igualmente probable
que sea del 5% o del 3%: Los títulos no generan pérdidas. Determine el rendimiento esperado
del portfolio.
9. Se realizan 5 lanzamientos independientes de una moneda. Calcule el número esperado de
escudos.
10. Se lanza una moneda 5 veces. Calcule:
(a) La diferencia esperada, E (X Y ), entre el número de escudos X y el de coronas Y

(b) La distancia esperada, E jX Y j, entre el número de escudos X y el de coronas Y
(c) La ganancia esperada si se ganan dos colones por cada escudo y se pierde un colón por
cada corona.
11. Un juego consiste en lanzar un dado. El jugador gana lo apostado multiplicado por lo que
indique el dado. Si un jugador juega dos veces, calcule la ganancia esperada cuando...
(a) se apuesta un colón en cada tiro

(b) se apuesta un colón en el primer tiro y dos colones en el segundo
(c) se apuestan a colones en el primer tiro y b colones en el segundo.
12. Se lanza un dado dos veces y se de…ne X como el resultado del primer lanzamiento, mientras
2
Y es el resultado del segundo lanzamiento. Calcule E jX Y j ; E (X Y ) :
X = 1f1;2;3g ; Y = 1f1;2;3;4g ; Z = 1f1;2;3;4;5g :
Calcule E (X + Y + Z) ; E (X + Y Z) ; E (XY + Z) ; E (XY Z) :

ni perdemos, si sale mayor que 3 ganamos 40 colones. Calcule la ganancia esperada.
15. Una caja contiene 3 bolas blancas y 4 negras. Realizamos 8 extracciones de una bola, con
reemplazo.
(a) Calcule la diferencia esperada entre el número de bolas blancas y el número de bolas
negras.
(b) Calcule la distancia esperada entre el número de bolas blancas y el número de bolas
negras.
16. Suponga que el número de fraudes informáticos a la plataforma de un Banco es una variable
Poisson con parámetro = 7: Determine el número esperado de fraudes en un año.
S. Cambronero 75
17. Se lanza un dado un número in…nito de veces. Determine el número esperado de lanzamientos
que se requiere para que salga 2 o 4 por primera vez.
18. Una caja contiene 5 bolas blancas y 7 negras. Realizamos reiteradamente extracciones inde-
pendientes de una bola, con reemplazo. Calcule el número esperado de extracciones necesarias
para obtener 3 bolas blancas.
19. Considere una caja con 7 bolas blancas y 8 bolas negras. Si se extraen 5 bolas de la caja,
calcule el número esperado de bolas blancas extraídas.
una muestra de 17 clientes para ofrecerles un nuevo producto, halle el número esperado de
clientes AAA en la muestra.
21. Sea X es una variable aleatoria discreta tal que E [X] = 3 y E X 2 = 11: Calcule
2
E X 2 + 3X ; E (X + 2) :
22. Sea X es una variable aleatoria tal que E [X] = 3, E X 2 = 12 y E X 3 = 37: Calcule
3
E (X 1)
23. Una cartera de crédito consta de 3000 clientes, de los cuales 250 son AAA: Se elige una
muestra de 700 clientes para realizar una calibración del score de comportamiento. Halle el
número esperado de clientes AAA en la muestra.
24. Suponga que el número de reclamos al mes sobre una póliza del INS es una variable Poisson
con parámetro = 7: Desde el punto de vista de riesgo, se quiere estudiar el exceso de
reclamos sobre un umbral dado, digamos sobre 3 reclamos. Esto lleva a considerar la variable
+
Y = (X 3) : Calcule EY:
25. En una cartera de crédito hay 900 clientes. Cada cliente cae en impago, en forma indepen-
diente, con probabilidad 0:01: Usando la aproximación de Poisson, aproxime:
(a) la probabilidad de que haya exactamente 11 impagos.

(b) la probabilidad de que haya más de 7 pero menos de 10 impagos.
26. Suponga que X tiene función de masa de probabilidad pk = ck para k = 1; 2; : : : ; 7: Encuentre

la constante c y calcule E [X].
27. Sea X una variable aleatoria tal que
P [X = 1] = p; P [X = 1] = 1 p:
Encuente una constante c tal que E cX = 1:

28. Considere un juego que consiste en lanzar una moneda. Si sale escudo se gana un colón y en
caso contrario se pierde un colón. Considere la siguiente estrategia: Apostamos un colón. Si
ganamos en ese primer tiro entonces no jugamos más, en caso contrario hacemos dos apuestas
más. Si X es la ganancia …nal, calcule P [X > 0] : Calcule EX: Comente la conveniencia de
utilizar esta estrategia.
S. Cambronero 76
29. Resuelva el ejercicio anterior pero con el juego de la ruleta en vez de tirar la moneda, donde
9
cada vez hay probabilidad 19 de ganar.
30. Tres grupos de cálculo tienen 30, 32 y 34 estudiantes respectivamente. Si se elige un estudiante
al azar de la población total de 96 estudiantes, sea X el número de estudiantes del grupo al
cual pertenece ese estudiante. Si se elige uno de los tres grupos al azar, sea Y el número de
sus estudiantes. Calcule EX y EY .
31. Resuelva el ejercicio anterior si los tres grupos tienen 32 estudiantes.
32. Dos individuos A y B juegan reiteradamente un juego hasta que uno de ellos gane dos veces.
Si cada juego es ganado por A con probabilidad p; halle el número esperado de juegos. Halle
el valor de p que maximiza el número esperado de juegos.
33. Se dispone de un millón de colones para invertir en la compra de un activo que se cotiza a
2000 colones por unidad. Dentro de 3 días, el precio del activo va a ser de 4000 colones la
unidad o de 1000 colones la unidad, ambas posibilidades igualmente probables. Establezca
una estrategia para maximizar el capital esperado dentro de 3 días. Haga lo mismo si lo que
se desea es maximizar el número esperado de unidades del activo dentro de 3 días.
34. Una compañía de seguros emite una póliza que paga un monto M si ocurre cierto evento
E durante el año. Si se estima que el evento E ocurre con probabilidad p durante el año,
calcule la prima anual de la póliza para que la ganancia esperada de la compañía sea del 7%
de M:
35. Se eligen 3 bombillos al azar de una caja que contiene el 20% de bombillos defectuosos.
Calcule el número esperado de bombillos defectuosos seleccionados.
36. (Paradoja de San Petersburgo) Se lanza una moneda hasta que salga escudo. El jugador
gana 2n colones si el escudo sale por primera vez en el tiro n: Calcule la ganancia esperada.
¿Cuánto pagaría usted por jugar este juego una vez? ¿Cuánto pagaría cada vez si pudiera
jugar todas las veces que quiera?
37. Considere el siguiente modelo para el tipo de cambio. Cada día, independientemente de
lo que haya sucedido antes, el tipo de cambio sube dos colones con probabilidad 0:45; se
mantiene con probabilidad 0:3 y cae un colón con probabilidad 0:25: Calcule el incremento
esperado en el tipo de cambio, en un plazo de 3 días.
38. Una opción de compra vence dentro de dos días. El precio de ejercicio (strike price) es
K = 500 dólares y el precio actual del subyacente es S0 = 499 dólares. Cada día, el precio
del subyacente puede subir 2 dólares con probabilidad 43 ; o bajar 3 dólares con probabilidad
1
4 : Se desestima el cambio del valor del dinero en el tiempo. Calcule el retorno esperado de
esta opción. Si la opción se cotiza en 2 dólares, ¿usted la compraría?
39. Un bono de tasa ‡otante está indexado a la tasa básica y paga cupones semestralmente, con
un spread de 2%: La tasa a pagar al …nal de cada periodo se de…ne con el valor de la tasa
básica observado al inicio del mismo, más el spread. Así, si el bono paga cupones el 30 de
marzo y el 30 de setiembre, y la tasa básica el 30 de marzo era 5:75 entonces el cupón a pagar
el 30 de setiembre será 5:75+2
2 = 3: 875 por ciento del principal. Suponga que estamos 30 de
setiembre. El cupón de esa fecha ya se pagó así que no entra en los cálculos. El bono vence
dentro de un año exactamente. La tasa básica actual es 4:7 y nuestro modelo interno dice
S. Cambronero 77
que dentro de seis meses tomará uno de los valores 4:3; 4:5; 4:7; 4:9; 5:1 con probabilidad 15
cada uno. La curva de descuento actual está en 3:87% a 6 meses y en 4:121% a un año. Sea
X la suma de los valores presentes de los ‡ujos a recibir. Calcule:
(a) La función de masa de probabilidad de X

(b) El valor esperado de X
(c) Si el bono se cotiza en 102 y creemos …elmente en nuestro modelo interno, ¿compraríamos
este bono? Explique.
40. Una cartera de crédito tiene 1100 clientes, cada uno con una probabilidad de impago de 0:01:
Cuando un cliente cae en impago, se pierde el 60% del monto adeudado, es decir, la pérdida
dado impago (lgd por sus siglas en inglés) es del 60% (o también podríamos decir que tiene
magnitud 0:6 = 53 ). Sea Xi la variable indicadora del impago del cliente i; y sea Mi el monto
adeudado por ese cliente. Exprese la pérdida total X en términos de los montos Mi y las
variables Xi : Calcule la pérdida esperada de la cartera.
41. Resuelva el ejercicio anterior con una cartera de n clientes, una probabilidad de impago pi
para el cliente i; y una lgd de magnitud .
42. Considere una variable X tipo Poisson de parámetro : Calcule EX 3 :
43. Una caja contiene 3 bolas blancas, 4 negras y 5 rojas. Hallar el número esperado de extrac-
ciones con reemplazo que se deben realizar para obtener una bola que no sea blanca.
hallar el número esperado de bolas blancas en la extracción.
3.4 Varianza y desviación estándar

Desde el punto de vista geométrico, la esperanza (o media) de una variable X nos da un valor
alrededor del cual se localizan los valores que esta variable toma. Uno espera que los valores que
genera la variable X sean cercanos a X; aunque en la realidad esto puede no ser así. Para enfatizar
lo anterior considere los siguientes tres juegos. En los tres se lanza un dado.
Juego 1. Se obtiene como ganancia el número de colones que indique el dado. La ganancia X1
toma los valores 1; 2; : : : ; 6 con probabilidad 61 y la media es = 72 :
Juego 2. Se ganan 7 colones si sale un número par, mientras que si sale un impar, no hay ganacia.
En este caso la ganacia X2 toma los valores 0 y 7 con probabilidad 12 y también tenemos media
7
2 = 2:
Jyego 3. Si sale un 3 se obtiene una ganancia X = 126 colones, mientras que la ganancia es
X = 21 (una pérdida de 21 colones) en caso contrario. La ganancia X3 cumple
5 1 7
EX3 = 21 + 126 = :
6 6 2
En los tres juegos se obtiene la misma esperanza. Es decir, si se repite el juego un número grande
de veces, en promedio se obtiene una ganancia de de 3:5 colones por cada jugada. Sin embargo,
geométricamente los tres juegos presentan propiedades bastante disímiles. En el primero los valores
se distribuyen simétricamente alrededor de la media, en el segundo también, aunque un poco más
S. Cambronero 78
lejos. En el tercer juego, los valores no solo están bastante lejos de la media sino que no hay
simetría. Es el peso de cada valor el que hace que se obtenga 3:5 como valor medio.
Al jugar el juego 1 varias veces, posiblemente en pocas jugadas estaríamos con ganancia promedio
cercana a la media. Esto es un poco más lento con el juego 2; en el que por ejemplo dos éxitos
consecutivos nos llevarían a tener una ganancia parcial de 14 colones, duplicando lo esperado. En
el juego 3; la probabilidad de sufrir pérdidas importantes en las primeras jugadas es bastante alta,
aunque en el largo plazo nos recuperamos con probabilidad 1:
Todo esto pone de mani…esto que la esperanza = EX por sí sola está muy lejos de poder describir
de manera completa la distribución de los valores de X: Si al menos quisiéramos deteminar qué
tan lejos se ubican los valores de la media, podríamos tratar de promediar las distancias jX j;
es decir considerar la esperanza de la variable Y = jX j.
Ejemplo 116 En el juego 1 de arriba, la variable Y = X 72 toma los valores 5 3 1

2; 2; 2 con
probabilidad 13 : En efecto, por ejemplo P Y = 32 = P (f2; 5g) = 13 : Luego
1 5 3 1 3
EY = + + = :
3 2 2 2 2
Es decir, los valores se ubican en promedio a una distancia 23 de la media. En el juego 2; la variable
Y es constante e igual a 27 : En este caso los dos valores están ambos a una distancia 27 de la media.
En el juego 3; Y toma el valor 49 5 245 1
2 con probabilidad 6 ; y el valor 2 con probabilidad 6 : La media
de Y es
49 5 245 1 245
EY = + = 40: 83
2 6 2 6 6
Los valores se ubican en promedio a una distancia 40:83 de la media.
En el ejemplo anterior es importante resaltar dos cosas. En primer luegar, la esperanza de Y

complementa de manera importante la información aportada por la media. En segundo lugar,
dicha esperanza es el valor esperado de la distancia entre la media de X y los valores que toma X:
Por razones históricas y computacionales, en la práctica no se acostumbra calcular E jX j : En
vez de esto, se calcula q
2
E (X ) :
2
A este valor se le llama la desviación estándar de X: A la cantidad E (X ) se le llama la
varianza de X y se denota q
2
V (X) = E (X ) :
La desviación estándar de X es entonces
p
st (X) = V (X):
2
Ejemplo 117 En el juego 1 de arriba, la variable X1 27 toma los valores 25 9 1
4 ; 4; 4 con proba-
bilidad 31 : Luego
1 25 9 1 35
V (X1 ) = + + = 2: 92
3 4 4 4 12
y …nalmente p
st (X1 ) = V (X1 ) 1: 7
S. Cambronero 79
2
En el juego 2; la variable X2 72 es constante e igual a 49
4 : En este caso V (X2 ) = 49
4 y
st (X2 ) = 72 : En el juego 3 la varianza es
2 2
49 5 245 1 12 005
V (X3 ) = + =
2 6 2 6 4
y …nalmente r
12 005
st (X3 ) = 54: 78
4
Al comparar los resultados del ejemplo anterior con los del ejemplo 116, se observa que la desviación
estándar no siempre aproxima adecuadamente a la desviación esperada de los resultados desde la
media. Sin embargo, como se mencionó esta es la medida más utilizada en la práctica para medir
desviaciones desde la media. Es mejor interpretar la varianza como lo que es, un promedio de
desviaciones cuadráticas desde la media.
Ejemplo 118 Considere una variable tipo Bernoulli que toma los valores 1 y 0 con probabilidades
2 2
p y 1 p respectivamente. Tenemos EX = p. La variable (X p) toma los valores (1 p) y p2
con probabilidades p y 1 p respectivamente. Luego
2
V (X) = (1 p) p + p2 (1 p) = p (1 p) :
La propiedades de la esperanza nos permiten obtener una identidad muy útil para el cálculo de la
varianza. En efecto, dado que
2
(X ) = X2 2 X + 2
se tiene
2
E (X ) = E X2 2 E (X) + 2
:
Sustituyendo EX por se obtiene
V (X) = E X 2 2 2
+ 2
= E X2 2
o equivalentemente
2
V (X) = E X 2 (EX) : (3.5)
Ejemplo 119 Si X es una variable Poisson de parámetro : Previamente se calculó E X 2 =

2
+ : Se tiene entonces
2 2 2
V (X) = E X 2 (EX) = + = :
Es decir, la varianza de una Poisson coincide con su esperanza.
La identidad (3.5) permite calcular la esperanza de X 2 ; si se conocen la esperanza y la varianza

de X: En efecto, nótese que
2
EX 2 = V (X) + (EX) = 2
+ 2
2
donde es la esperanza y la varianza ( es la desviación estándar de X).
S. Cambronero 80
Ejemplo 120 Considere una variable X con esperanza 2 y varianza 3: En la fórmula anterior se
tendría = 2 y 2 = 3: Entonces
E X 2 = 3 + 22 = 7:
Considere X con esperanza , y sean a; b constantes, La esperanza de Y = aX + b es
EY = aEX + b = a + b:
Luego, dado que Y EY = a (X ) se obtiene

2 2
V (Y ) = E (a (X )) = a2 E (X ) = a2 V (X) :
Se obtiene el siguiente lema.

2
Lema 8 Si X es una variable de varianza V (X) = y a; b son constantes, entonces
V (aX + b) = a2 V (X) :
Una constante sumada a una variable no le agrega varianza, mientras que un factor a en X le
produce un factor a2 a V (X) :
Ejemplo 121 Considere una variable X con esperanza 2 y varianza 3: Vamos a calcular E (3X + 4) ;
2
E (X + 1) ; V (3X 5) : Tenemos
2
E (3X + 4) = 3EX + 4 = 10; E (X + 1) = E X 2 + 2X + 1 = 7 + 2 2 + 1 = 12
donde usamos el cálculo del ejemplo anterior. Finalmente
V (3X 5) = 32 V (X) = 9 3 = 27:
Ejemplo 122 Para calcular la varianza de una variable geométrica de parámetro p calculamos
primero
X1
n 2
E X2 EX = E X 2 X = p (1 p) n (n 1) (1 p) :
n=2
La serie de la derecha es la segunda derivada de la serie geométrica, evaluada en 1 p: En efecto

1
X 00
1 3
n (n 1) xn 2
= = 2 (1 x) :
n=2
1 x
Al evaluar en x = 1 p se obtiene
2 2
E X2 EX = 2p (1 p) p 3
= :
p2 p
Luego
1 2 1
E X 2 = EX + = 2 :
p p p
Ahora podemos calcular
2 2 1 1 1 p
V (X) = EX 2 (EX) = = :
p2 p p2 p2
S. Cambronero 81
3.4.1 Independencia de variables aleatorias

Básicamente, dos variables son independientes si la observación de una de ellas no afecta la distribu-
ción de la otra. Más explícitamente, los eventos [X = x] y [Y = y] son siempre independientes, para
cualesquiera valores de x e y: Si denotamos la intesección [X = x] \ [Y = y] como [X = x; Y = y],
la independencia de X e Y es equivalente a la identidad
P [X = x; Y = y] = P [X = x] P [Y = y]
para cualesquiera x; y:
Ejemplo 123 Considere el lanzamiento de un dado dos veces. Sea X1 el resultado del primer
intento y Y el resultado del segundo intento. En el moldeo clásico se tiene
jf(i; j)gj 1 1 1
P [X = i; Y = j] = = = = P [X = x] P [Y = y] :
36 36 6 6
Esto signi…ca que para modelar la independencia de los dos lanzamientos, en este caso, basta con
utilizar el modelo clásico.
Ejemplo 124 En el ejemplo anterior, sea X la suma de los dos resultados, Y la resta. Nótese
que
jf(1; 1)gj 1
P [X = 2; Y = 0] = = 2
36 6
mientras
1 1 1
P [X = 2] P [Y = 0] = = 3:
36 6 6
En este caso X e Y no son independientes (son dependientes).
La independencia de variables aleatorias permite, entre otras cosas, simpli…car algunos cálculos de
esperanzas que involucran productos de variables. El siguiente ejemplo nos da una primera idea al
respecto.
Ejemplo 125 Se lanza una moneda y un dado en forma independiente. Se de…ne X = 7 si la

moneda muestra un escudo, en caso contrario X = 11: Por otro lado se de…ne Y como el valor
mostrado por el dado. El espacio muestral se puede tomar como
= fe; cg f1; 2; 3; 4; 5; 6g
de modo que X (e; k) = 71 y X (c; k) = 11. Por su parte Y (e; k) = Y (c; k) = k; donde k 2
f1; 2; 3; 4; 5; 6g : Claramente X e Y son independientes y EX = 9; EY = 27 : Vamos a calcular
E (X Y ) ; es decir la esperanza de la variable Z = X Y: Nótese que Z toma los valores 7k y 11k
1
para k entre 1 y 6; cada uno con probabilidad 12 : Se tiene
6 6
!
1 X X 1 6 7 6 7 63 7
E (X Y ) = 7k + 11k = 7 + 11 = =9 = EX EY:
12 12 2 2 2 2
k=1 k=1
Para convencernos de que esta identidad no es casual, observemos que

6 6
! 6
1 X X 7 + 11 1X
E (X Y ) = 7 k + 11 k = k = EX EY:
12 2 6
k=1 k=1 k=1
S. Cambronero 82
En el caso general, el último argumento del ejemplo anterior permite concluir que
E (X Y ) = EX EY
siempre que X e Y sean independientes. Para el lector interesado, escribimos el detalle. Si
X X
X= xn 1An ; Y = y m 1B m
n m
donde An = [X = xn ] ; Bm = [Y = ym ] se tiene
X
X Y = xn ym 1An \Bm :
n;m
Luego
X X
E (X Y ) = xn ym P (An \ Bm ) = xn ym P (An ) P (Bm )
n;m n;m
X X
= xn P (An ) ym P (Bm ) = EX EY:
n m
Ejemplo 126 Se lanza un dado tres veces en forma independiente. Sean X1 ; X2 ; X3 los valores
obtenidos en cada lanzamiento. Por inndependencia se tiene
49
E (X1 X2 ) = E (X1 ) E (X2 ) = :
4
De la misma forma se tiene
73
E (X1 X2 X3 ) = E (X1 ) E (X2 ) E (X3 ) = :
43
En general, si X1 ; : : : ; Xn son independientes se tiene
E (X1 : : : Xn ) = EX1 : : : EXn :
Ejemplo 127 Sean X1 ; : : : ; Xn son independientes, con EX1 = 0: Entonces
E (X1 : : : Xn ) = 0 EX2 : : : EXn = 0:
En el siguiente ejemplo preparamos el camino para el cálculo de la varianza de una suma de
variables independientes.
Ejemplo 128 Considere dos variables X; Y independientes, con EX = 4; EY = 3, V (X) = 2
y V (Y ) = 5: Se tiene
2
EX 2 = 2 + 42 = 18; EY 2 = 5 + ( 3) = 14:
Luego
2
E (X + Y ) = E X 2 + 2XY + Y 2 = 18 + 2 4 ( 3) + 14 = 8
En el tercer paso se usó la independencia. Finalmente, dado que E (X + Y ) = 1 se tiene
2
V (X + Y ) = E (X + Y ) 12 = 8 1 = 7:
Nótese que V (X + Y ) = V (X) + V (Y ) :
S. Cambronero 83
Un poco más generalmente, considere dos variables X; Y independientes, con EX = ; EY = ,

V (X) = 2 y V (Y ) = 2 : Se tiene
2
EX 2 = 2
+ 2
; EY 2 = 2
+ :
Luego
2
E (X + Y ) = EX 2 + 2E (XY ) + EY 2 = 2
+2 + 2
debido a que E (XY ) = por independencia. Finalmente, dado que E (X + Y ) = + se tiene

2 2 2 2 2 2
V (X + Y ) = E (X + Y ) ( + ) = +2 + +2 +
2 2 2 2
= + = V (X) + V (Y ) :
Con un poco más de trabajo, esto se puede demostrar para una suma de n variables independientes.
Lema 9 Si X1 ; : : : ; Xn son variables independientes con varianzas respectivas V (Xi ) se tiene
V (X1 + : : : + Xn ) = V (X1 ) + : : : + V (Xn ) :
A continuación usamos esta propiedad para el cálculo de varianzas de variables binomiales, bino-
miales negativas e hipergeométricas.
Ejemplo 129 Considere una variable binomial X de parámetros n y p: Esta se puede ver como
X = X1 + : : : + Xn
donde Xi es la variable de Bernoulli que vale 1 si se da un éxito en el i ésimo intento, y vale

0 en caso contrario. Las variables X1 ; : : : ; Xn son independientes debido a que los n intentos se
realizan de manera independiente. De acuerdo con el ejemplo 118 se tiene
V (X) = V (X1 ) + : : : + V (Xn ) = np (1 p) :
Ejemplo 130 Ahora tomemos una variable X binomial negativa de parámetros n y p: Recordemos
que esta se puede escribir como una suma de variables geométricas independientes X1 ; : : : ; Xn ;
todas de parámetro p: Consecuentemente, de acuerdo con el ejemplo 122 se tiene
1 p
V (X) = n :
p2
3.4.2 Sumas de variables no independientes

Aunque X1 ; : : : ; Xn no sean independientes, la varianza de la suma X = X1 + : : : + Xn se puede
calcular siempre que conozcamos las varianza individuales y las esperanzas de los productos Xi Xj :
n
X X
2
X 2 = (X1 + : : : + Xn ) = Xi2 + 2 Xi Xj :
i=1 i<j
Por la linealidad de la esperanza se obtiene

n
X X
EX 2 = E Xi2 + 2 E (Xi Xj ) :
i=1 1 i<j m
S. Cambronero 84
Ejemplo 131 Ahora consideremos X una variable hipergeométrica de parámetros m; n; r. Esta

puede interpretarse como el número de bolas negras que se obtienen al extraer una combinación de
r bolas (sin reemplazo) de una caja que contiene m bolas negras y n bolas blancas. Numeramos las
bolas negras como b1 ; : : : ; bm y de…nios Xk = 1 si la bola bk es extraída, Xk = 0 en caso contrario.
Ya hemos visto que las variables Xk son de tipo Bernoulli, con
r
P [Xk = 1] = :
N
Como Xk2 = Xk se tiene
r
EXk2 = EXk =:
N
donde N = m + n: Por otro lado, la variable Xi Xj es una Bernoulli que toma el valor 1 cuando
tanto la bola i como la bola j son extraídas. Consecuentemente, por ser de tipo Bernoulli
N 2
r 2 r (r 1)
E (Xi Xj ) = P [Xi Xj = 1] = N
= :
r
N (N 1)
La variable X es la suma X1 + : : : + Xm y entonces

m
X X r m r (r 1)
E X2 = E Xi2 + 2 E (Xi Xj ) = m +2 :
i=1
N 2 N (N 1)
1 i<j m
Esto se puede simpli…car como
r (m 1) (r 1)
E X2 = m 1+ :
N N (N 1)
Finalmente
2 r (m 1) (r 1) mr
V (X) = EX 2 (EX) = m 1+ :
N N (N 1) N
3.4.3 Ejercicios
1. Sea X es una variable aleatoria tal que E [X] = 3 y Var(X) = 2: Calcule
p !
h i 3 5X
2
E (X + 2) ; V p :
2
2. Sea X es una variable aleatoria tal que E [X] = 3 y E X 2 = 14:5 y E X 3 = 63: Calcule
3
E (X 1) ; Var (X) y Var [177 2X] :
2
3. Suponga que X tiene esperanza y varianza : Determine la esperanza y la varianza de la
variable
X
Y = :
La variable Y se llama estandarización de la variable X:

S. Cambronero 85
4. Una caja contiene 3 bolas blancas, 4 negras y 2 rojas. Se extraen dos bolas de la caja sin
reemplazo. Por cada bola blanca ganamos un colón, por cada bola negra ganamos 2 colones
y por cada bola roja perdemos un colón. Si X es la ganancia en el juego, calcule la varianza
de X.
de coronas. Calcule V (X) :
positivo con probabilidad 13 ; el segundo genera un rendimiento positivo con probabilidad 23 :
Para cualquiera de los dos títulos, cuando el rendimiento es positivo es igualmente proba-
ble que sea del 5% o del 3%: Los títulos no generan pérdidas. Determine la varianza del
rendimiento del portafolio.
7. Se lanza un dado dos veces y se de…ne X como el resultado del primer lanzamiento menos el
resultado del segundo lanzamiento. Calcule E jX EXj y s:t (X) :
X = 1f1;2;3g ; Y = 1f1;2;3;4g :
Calcule V (X) ; V (Y ) ; V (X + Y ) :
ni perdemos, si sale mayor que 3 ganamos 40 colones. Calcule la varianza de la ganancia.
10. Suponga que el número de fraudes informáticos a la plataforma de un Banco es una variable
X de tipo Poisson con parámetro = 7: Determine la varianza de X:
calcule la varianza de número de bolas negras extrídas.
una muestra de 17 clientes para ofrecerles un nuevo producto, halle la varianza del núemero
de clientes AAA en la muestra.
13. Sea X es una variable aleatoria discreta tal que E [X] = 3 y V (X) = 4: Calcule
2
E X 2 + 3X ; E (X + 2) :
14. Considere el siguiente modelo para la tasa básica. Cada día, independientemente de lo que
haya sucedido antes, la tasa básica sube dos puntos base con probabilidad 0:45; se mantiene
con probabilidad 0:3 y cae un punto base con probabilidad 0:25: Calcule la varianza del
incremento en la tasa básica en un plazo de 3 días.
15. Una opción de compra vence dentro de dos días. El precio de ejercicio (strike price) es
K = 500 dólares y el precio actual del subyacente es S0 = 499 dólares. Cada día, el precio
del subyacente puede subir 2 dólares con probabilidad 43 ; o bajar 3 dólares con probabilidad
1
4 : Se desestima el cambio del valor del dinero en el tiempo. Calcule la varianza del retorno
de la opción.
S. Cambronero 86
16. Suponga que una variable discreta tiene varianza nula, es decir V (X) = 0: ¿Qué se puede
decir de la variable X ?
17. Suponga que una variable discreta X satisface P [X 0] = 0: ¿Qué se puede decir de EX ?
18. Suponga que dos variables discretas X; Y satisfacen P [X Y ] = 1: ¿Qué relación hay entre
EX y EY ?
Capítulo 4
Funciones de distribución
Para una variable discreta X que toma los valores x 2 S (donde S es un conjunto contable) la
función de masa de probabilidad
: S ! R; (x) = P [X = x]
es una buena herramiente para describir en gran medida a la variable X: Sin embargo, como
veremos existen variables para las que P [X = x] = 0 siempre. Tales variables se llaman continuas.
Para poder describir de manera adecuada la distribución de una variable en el caso general, es
decir aunque la variable no sea discreta, se puede pensar en describir, no la probabilidad individual
P [X = x] ; sino la probabilidad acumulada P [X x] para cada x 2 R. Esto nos lleva al concepto
de función acumulada de distribución o función de distribución.
4.1 El concepto de función de distribución

De…nición 13 La función de distribución (acumulada) de una variable X es la función FX :
R ! R de…nida por
FX (x) = P [X x] :
Ejemplo 132 Considere una variable X tipo Bernoulli que toma los valores a y b con probabili-
dades p y 1 p; donde a < b: En este caso la función de masa de probabilidad es : fa; bg ! R
de…nida por
(a) = p; (b) = 1 p:
Para x < a se tiene FX (x) = P [X x] = P (;) = 0: Para a x<b
FX (x) = P [X x] = P [X = a] = p:
Finalmente para x > b se tiene FX (x) = P [X b] = 1: En resumen, la función de distribución es

8
< 0 para x < a
FX (x) = p para a x < b
:
1 para x b
Esta función tiene un salto de magnitud p en x = a y un salto de magnitud 1 p en x = b:
87
S. Cambronero 88
2 2 1
Ejemplo 133 Considere X que toma los valores 2; 3; 4 con probabilidades 5; 5 y 5 respectiva-
mente. En este caso 8
>
> 20 para x < 2
<
5 para 2 x < 3
FX (x) = 4
>
> para 3 x < 4
: 5
1 para 4 x
En general, si X toma n valores x1 ; x2 ; : : : xn con probabilidades p1 ; p2 ; : : : pn y además x1 < x2 <

: : : xn entonces 8
>
> 0 para x < x1
>
>
>
> p 1 para x1 x < x2
>
< p 1 + p2 para x2 x < x3
FX (x) = .. ..
>
> . .
>
>
>
> p + : : : + p para x x < xn
>
: 1 n 1 n 1
1 para xn x
La grá…ca de FX es escalonada, con saltos de magnitud pi en cada xi :
Ejemplo 134 Considere una variable geométrica de parámetro p = 21 : Entonces X toma los val-
ores 1; 2; : : : con probabilidades pn = P [X = n] = 21n : La función de acumulada de distribución
es 8
>
> 0 para x < 1
>
> 1
para 1 x<2
>
> 2
>
> 3
para 2 x < 3
< 4
FX (x) = .. ..
>
> . .
>
> 1 1
>
> 2n para n x<n+1
>
> .. ..
:
. .
La grá…ca de FX en este caso es escalonada, pero con un número in…nito de gradas. La grada en
x = n tiene magnitud 21n :
4.1.1 Cálculos usando funciones de distribución

Esencialmente la importancia de las funciones de distribución, para …nes prácticos, radica en el
hecho que permite recuperar las probabilidades asociadas con la variable aleatoria respectiva. En
S. Cambronero 89
efecto, nótese por ejemplo que si X tiene función de distribución F entonces para a < b se tiene
P [a < X b] = P ([X b] [X a])

= P [X b] P [X a]
= F (b) F (a) :
En resumen
P [a < X b] = F (b) F (a) : (4.1)
Es decir, la probabilidad de que X caiga en un intervalo de la forma ]a; b] es obtenida de manera
sencilla usando F:
1 1 26 1 63
P [5 < X 11] = F (11) F (5) = 1 1 = = :
211 25 211 2048
1
Cuando a = b n en la fórmula (4.1) se tiene
1 1
P b <X b = F (b) F b :
n n
Cuando hacemos n ! 1 se obtiene, por la continuidad de las medidas de probabilidad

1
P [X = b] = F (b) lim F b n = F (b) F b :
n!1
Nótese en particular que F es continua en b si y solo si P [X = b] = 0:
Ejemplo 136 Suponga que X tiene función de distribución dada por

8
>
> 0 para x < 0
>
> 1
< 5 para 0 x < 7
1
F (x) = 2 para 7 x < 11
>
> 3
> 5
> para 11 x < 13
:
1 para 13 x
Entonces F es continua en todo punto, excepto en 0; 7; 11; 13: Además P [X = 0] = F (0) F (0 ) =

1
5 : Similarmente
1 1 3
P [X = 7] = F (7) F 7 = =
2 5 10
1
y un cálculo similar nos da P [X = 11] = 10 y P [X = 13] = 52 : Dado que estos pesos suman 1; la
variable es discreta y toma únicamente estos cuatro valores. La función de masa de X está dada
por
1 3 1 2
(0) = ; (7) = ; (11) = ; (13) = :
5 10 10 5
Otras probabilidades que se pueden calcular usando la función de distribución son las siguientes:
P [X > a] = 1 F (a) ; P [X < b] = F b :

S. Cambronero 90
En efecto, la primera de estas identidades se deduce de

c
P [X > a] = P [X a] = 1 P [X a] = 1 F (a)
mientras que para la segunda se debe aplicar la continuidad de las medidas de probabilidad:
1 1
P [X < b] = lim P X b = lim F b =F b :
n!1 n n!1 n
Ejemplo 137 Continuando con el ejemplo anterior se tiene
1 1
P [7 < X < 11] = F 11 F (7) = =0
2 2
y similarmente P [0 < X < 7] = P [11 < X < 13] = 0: Finalmente
P [X > 13] = 1 F (13) = 1 1 = 0:

1 1 26 1 63
P [5 < X < 12] = F 12 F (5) = 1 1 = = :
211 25 211 2048
Esto también se puede argumentar si recordamos que X solo toma valores enteros, que nos lleva a
63
P [5 < X < 12] = P [5 < X 11] = F (11) F (5) = :
2048
4.1.2 Propiedades de las funciones de distribución

En los ejemplos anteriores, las funciones de distribución son siempre crecientes y continuas por
la derecha. Además, tienen límite 0 en 1 y límite 1 en +1: Estas propiedades son comunes a
todas las funciones de distribución asociadas a variables aleatorias. En efecto, para una variable
aleatoria X cualquiera, cuando a < b se tiene [X a] [X b] : Consecuentemente
FX (a) = P [X a] P [X b] = FX (b) :
Esto demuestra que, efectivamente, FX es creciente. Por otro lado, nótese que
1
\
[X n] = ;:
n=1
Por la continuidad de las medidas de probabilidad se obtiene
lim FX ( n) = lim P [X n] = P (;) = 0:

n!1 n!1
Similarmente, dado que

1
[
[X n] =
n=1
la continuidad de las medidas de probabilidad implica
lim FX (n) = lim P [X n] = P ( ) = 1:

n!1 n!1
S. Cambronero 91
Abusando un poco de la notación, estos dos límites se resumen en
FX ( 1) = 0; FX (1) = 1: (4.2)
Finalmente, veamos la continuidad por la derecha. Dado a 2 R se tiene

1
\ 1
[X a] = X a+
n=1
n
1
y como la familia de los eventos X a+ n es decreciente, por la contiuidad de las medidas de
probabilidad de nuevo se deduce
1 1
lim F a+ = lim P X a+ = P [X a] = F (a) :
n!1 n n!1 n
Dado que F es creciente, esto es su…ciente para concluir que
F a+ = lim+ F (x) = F (a) :

x!a
Estas propiedades permiten dar una de…nición del concepto de función de distribución, sin usar
variables aleatorias.
De…nición 14 Una función F : R ! R se llama función de distribución si es creciente, continua

por la derecha y satisface (4.2).
Ejemplo 139 Considere la función F : R ! R de…nida por

8
>
> 0 para x < 1
< 1
4 para 1 x<1
F (x) = x
>
> para 1 x<2
: x4
x+1 para 2 x
Nótese que F es creciente, continua por la derecha y satisface (4.2). Consecuentemente es una
función de distribución. Note además que F es continua en todo punto, excepto en x = 1 y
x = 2: Si X es una variable cuya función de distribución es F; se tiene
1 2 1 1
P [X = 1] = ; P [X = 2] = F (2) F 2 = = :
4 3 2 6
S. Cambronero 92
Por otro lado
P [X < 1] = F 1 = 0; P [ 1 < X < 1] = F 1 F ( 1) = 0:
Finalmente
1 1
P [1 < X < 2] = F 2 F (1) = ; P [X > 2] = 1 F (2) = :
4 3
Ejemplo 140 La función de distribución acumulada de una variable aleatoria X está dada por
8
>
> 0 para x < 0
<
a para 0 x < 2
FX (x) = 2a+1
>
> para 2 x<5
: 2
1 para x 5
donde 0 < a < 1: La variables X toma los valores 0; 2; 5. La función de masa de probabilidad de
X es
1 1
(0) = a; (2) = ; (5) = a:
2 2
Ejemplo 141 En el ejemplo anterior, si se sabe que E [X] = 3; podemos calcular V (X). En
efecto
1 1 7
E [X] = 0 a + 2 +5 a = 5a:
2 2 2
Se tiene entonces
7 1
5a = 3 ) a = :
2 10
Luego
1 1 1
V (X) = E X 2 9=4 + 25 9 = 3:
2 2 10
Se puede demostrar que toda función de distribución tiene asociada una variable aleatoria. Es
decir, si F satisface la de…nición anterior entonces existe una variable aleatoria X cuya función de
distribución acumulada es F . Esencialmente, el truco es de…nir una medida de probabilidad en los
borelianos (la menor familia de eventos construida a partir de los intervalos), usando F: Esto se
logra comenzando con la de…nición
P (]a; b]) = F (b) F (a)
y luego extendiendo esta de…nición a los demás boreliandos vía la aditividad contable y la con-
tinuidad. Para tener una mejor idea del proceso utilizado en esta construcción, considere el siguiente
ejemplo.
Ejemplo 142 Considere el espacio
1
= (x; y) 2 R2 : 0 y
(1 + x2 )
y de…na la medida de A como P (A) = area (A) : Es intuitivamente claro que el área es aditiva
S. Cambronero 93
y no negativa. La aditividad contable se puede obtener si restringe adecuadamente la familia de

eventos. No entraremos en ese detalle. Es importante observar que
Z 1 1
dx 1 1
P( )= 2)
= arctan x = = 1:
1 (1 + x 1 2 2
Entonces P es una medida de probabilidad en : Considere la variable aleatoria X de…nida en

por X (x; y) = x: Nótese que la función de distribución acumulada de X es
FX (a) = area (f(x; y) 2 : x ag)

Z a
dx 1 1
= 2)
= + arctan x:
1 (1 + x 2
En el ejemplo anterior, básicamente se construyó un espacio de probabilidad en el cual se de…nió
una variable aleatoria cuya función de distribución es
1 1
F (x) = + arctan x:
2
La función utilizada para de…nir ; llámese
1
f (x) =
(1 + x2 )
no es otra que la derivada de F (x) : Esta será llamada la densidad de la variable X en la siguiente
sección.
4.1.3 Funciones de densidad

Una manera de construir funciones de distribución es a través de densidades. Una función de
densidad es una función f : R ! R que cumple
Z 1
f (x) 0; f (x) dx = 1:
1
En este curso tomaremos esta integral en el sentido de una integral impropia de Riemman, así que
f solo debe ser integrable en el sentido de Riemann en cada intervalo acotado y satisfacer
Z n
lim f (x) dx = 1:
n!1 n
S. Cambronero 94
Dada una función de densidad, podemos de…nir una función de distribución F mediante:
Z x
F (x) = f (t) dt:
1
Vamos a asumir que f satisface las condiciones necesarias para que F sea derivable y F 0 (x) = f (x)
(continuidad a trozos es más que su…ciente). Se obtiene entonces F 0 (x) = f (x) 0 y en particular
F es creciente. Además F satisface (4.2) como consecuencia de la de…nición de integral impropia.
Por ejemplo Z Z
x 1
lim F (x) = lim f (t) dt = f (t) dt = 1:
x!1 x!1 1 1
Una función de distribución construida de esta forma es continua, no solo por la derecha.
Ejemplo 143 Como vimos antes, la función f : R ! R de…nida por

1
f (x) = :
(x2 + 1)
es una función de densidad, dado que f (x) 0 para cada x 2 R y
Z 1
f (x) dx = 1:
1
La función de distribución respectiva es

Z x
dt 1 1
F (x) = = + arctan x:
1 (t2 + 1) 2
Si una variable aleatoria X tiene esta F como función de distribución, se tiene

1 1
P( 1<X 1) = F (1) F ( 1) = (arctan (1) arctan ( 1)) =
2
mientras que
1 1
P (X > 1) = 1 F (1) = 1 arctan (1) + = :
2 4
Ejemplo 144 La función
' = 1]3;5]
es nonegativa. Sin embargo Z Z
1 5
' (x) dx = dx = 2:
1 3
S. Cambronero 95
Entonces no es una función de densidad. Para convertirla en función de densidad la normalizamos

multiplicando por 21 : En efecto, la funcnión = 12 ' es una función de densidad. Note que
1
2 para 3 < x < 5
(x) =
0 en los demás casos
4.2 Variables aleatorias continuas

Una variable aleatoria se llama continua si su función de distribución tiene densidad. Más precisa-
mente, existe una función de densidad ' tal que
Z x
P [X x] = ' (t) dt
1
para cada x 2 R. En tal caso también se tiene

Z b
P [a < X b] = ' (x) dx
a
para a < b:
4.2.1 Variables uniformes

Ejemplo 145 Un cliente tiene una opción de compra americana que vence dentro de un año. Sea
X el instante en que el cliente decide ejecutar la opción, medido en años. La variable X toma
valores en el intervalo [0; 1] : Considere el modelo en el que la probabilidad de que X caiga en cierto
intervalo I es la longitud del intervalo. Dado que la longitud del intervalo [0; 1] es 1; este modelo
es consistente. Por ejemplo, la probabilidad de que el cliente tome la decisión durante el tercer
1
mes es 12 : Esa es la misma probabilidad de que la decisión sea tomada durante el sétimo mes, o
cualquier otro intervalo de tiempo que tenga un mes de longitud. La función de distribución de X
está dada por 8
< 0 para x < 0
FX (x) = P [X x] = x para 0 x < 1
:
1 para 1 x
Esta función de distribución tiene densidad dada por ' (x) = 1[0;1] ; es decir
0 para x 2
= ]0; 1[
' (x) =
1 para x 2 ]0; 1[ :
En la …gura, se han dibujado las funciones F (en azul) y ' (en puntos rojos).
S. Cambronero 96
De acuerdo con la siguient de…nición, la variable del ejemplo anterior tiene una distribución uni-
forme en el intervalo [0; 1] (uniforme 0; 1).
De…nición 15 Se dice que una variable aleatoria X está distribuida uniformemente en el intervalo
[a; b] si tiene densidad dada por
0 para x 2
= [a; b]
' (x) = 1
b a para x 2 [a; b] :
Nótese que en la de…nición anterior

Z 1 Z b
dx
' (x) dx = =1
1 a b a
así que ' efectivamente es una densidad.
4.2.2 Distribuciones exponenciales

La distribución exponencial es esencialmente útil describir variables temporales cuyas distribuciones
se reinician en cada instante. Esto se va a aclarar en detalle en los siguientes capítulos. Por ahora
solo se presentará esta distribución a través de su función de densidad. Comenzamos con un
ejemplo.
Ejemplo 146 Una variable aleatoria X tiene densidad

x
x e para x 0
' (x) = xe 1[0;1[ (x) =
0 para x < 0
Vamos a calcular P [X > 2] ; P [5 < X 8] ; P [X > 3jX > 1] :

La función de distribución de X está dada por F (x) = 0 para x < 0; mientras para x 0 se tiene
Z x
F (x) = e t dt = 1 e x :
0
S. Cambronero 97
Grá…ca de ' en rojo y de F en azul.

Ahora que conocemos la función de distribución de X; podemos realizar más fácilmente los cálculos
propuestos. En efecto
P [X > 2] = 1 F (2) = e 2 0:135 :
Por otro lado
5 8
P [5 < X 8] = F (8) F (5) = e e 0:0064:
y …nalmente
3
P [X > 3] e 2
P [X > 3jX > 1] = = 1
=e 0:135 :
P [X > 1] e
En el ejemplo anterior, se puede notar que si ya se sabe que el evento no ha ocurrido en tiempo
1; entonces la probabilidad de que ocurra después de tiempo 3; es la misma que la probabilidad
de que ocurra después de tiempo 2; pero empezando de nuevo en tiempo 1: Esta propiedad es
básicamente la que caracteriza a las distribuciones exponenciales.
De…nición 16 Se dice que una variable es exponencial, o que tiene una distribución exponencial
de parámetro si tiene densidad dada por
x
x e para x > 0
' (x) = e 1[0;1[ (x) =
0 para x < 0:
La función de distribución de una variable exponencial de parámetro es

Z x
F (x) = e t dt = 1 e x ; para x 0
0
mientras F (x) = 0 para x < 0: En las siguiente …guras se han dibujado las densidades y las
funciones de distribución de variables exponenciales para distintos valores de : Conforme el valor
de crece, los valores bajos tienen más probabilidad y los valores altos menos. Conforme decrece,
la probabilidad de los valores altos sube.
S. Cambronero 98
Densidad exponencial, distintos valores de : Distribución exponencial, distintos valores de :
4.2.3 Distribuciones normales

La distribución normal fue presentada por primera vez por Abraham de Moivre en el siglo XVIII,
como una manera de aproximar la distribución binomial para grandes valores de n. Este resultado
fue ampliado por Laplace en el siglo XIX, tomando el nombre actual de Teorema de De Moivre-
Laplace.
Laplace usó la distribución normal en el análisis de errores de medición en la realización de exper-
imentos. El método de mínimos cuadrados fue introducido por Legendre y justi…cado por Gauss a
inicios de ese siglo, asumiendo una distribución normal de los errores. El nombre de Gauss se asocia
a la distribución normal debido al amplio uso que le dio, especialmente en el análisis astronómicos.
Hacia …nales del siglo XIX, algunos autores comenzaron a referirse a la grá…ca de la densidad
normal con el término "campana". En esta misma época se inicia con la costumbre de usar el
término "distribución normal".
Para esbozar la idea original que dio origen a la distribución normal, considere una variable binomial
Xn de parámetros n y p: Pensamos en valores muy grandes de n, pero manteniendo constante la
esperanza de X: Es decir, hacemos n ! 1 y tomamos p = n ; de manera que
EXn = np = :
La variable
Xn np
Yn = p
np (1 p)
tiene media 0 y varianza 1. Es decir, Yn es la estandarización de Xn : El teorema de De Moivre-
Laplace establece que, cuando n ! 1, la función de distribución (discreta) de Yn converge a la
función Z x
1 t2
F (x) = p exp dt: (4.3)
2 1 2
Esta es la función de distribución normal estándar. Nótese que, de manera directa, esta función
de distribución viene de la densidad
1 x2
' (x) = p exp
2 2
S. Cambronero 99
La función ' es una función de densidad debido a que es no negativa y

Z 1 p
x2
exp dx = 2 :
1 2
Esto se puede veri…car utilizando un cambio de variable en integración doble. En efecto, denotemos
por I a esta integral. Usando integrales iteradas se tiene
ZZ
2 1 2 2
I = exp 2 x +y dxdy:
R2
Cambiando a coordenadas polares se tiene

Z 2 Z 1
1 2
2 2r
I = re drd = 2 :
0 0
En la …gura se observa en rojo la grá…ca de la función ' (campana de Gauss). La integral que
de…ne a F no es calculable en términos elementales, de modo que para su cálculo se deben utizar
calculadoras o programas informáticos. En la literatura es común denotar esta función como (x).
Su grá…ca se ha esbozado en azul en la siguiente …gura.
Es importante notar que la campana de Gauss es simétrica con respecto al eye y; debido a que
' ( x) = ' (x) : Dicho de otra forma, la campana de Gauss tiene al eje y como eje de simetría.
De…nición 17 Una variable X cuya densidad sea ' se llama variable normal estándar o gaussiana
estándar.
Nótese que en tal caso, la simetría de la campana de Gauss se resume en

1
P [X 0] = P [X 0] = :
2
De manera similar se tiene, para cada a > 0
( a) = P [X a] = P [X > a] = 1 P [X a] = 1 (a)
o escrito de otra forma

( a) + (a) = 1:
S. Cambronero 100
4.2.4 La distribución de g (X)

Dada una variable aleatoria X y una función g : R ! R se puede crear una nueva variable Y
mediante
Y = g (X) :
El estudio de la distribución de variables construidas de esta forma, permite generar nuevos tipos
de variables y de funciones de distribución que han sido usadas con éxito en diferentes aplicaciones.
Especí…camente, se pueden obtener distribuciones que cumplan con ciertos tipos de propiedades
especiales para su uso en el modelado de determinados fenómenos naturales, sociales, …nancieros,
etc.
Ejemplo 147 Considere una variable aleatoria X que se distribuye uniformemente en ]0; 1[ : La
variable Y = X 2 : Calculemos la función de distribución de Y: Dado que 0 Y 1; para y < 0 se
tiene
FY (y) = P [Y y] = 0
mientras para y 1 se tiene
FY (y) = P [Y y] = 1:
Para 0 y < 1 se tiene
p p
FY (y) = P [Y y] = P [X y] = y:
En resumen 8
< 0 para y < 0
p
FY (y) = y para 0 y < 1
:
1 para y 1
1
La densidad de Y es entonces fY (y) = 2 y 1]0;1[ :
p
Ejemplo 148 Considere una variable normal estándar y de…na Y = jXj : Claramente FY (y) = 0
para y < 0: Para y 0 se tiene
FY (y) = P [jXj y] = P [ y X y]
= (y) ( y) = 2 (y) 1:
Consecuentemente, la densidad de Y es
( 1 2
2' (y) para y > 0 p2 e 2y para y > 0
fY (y) = = 2
0 para y < 0 0 para y < 0
p
Ejemplo 149 Considere X exponencial de parámetro y de…na Y = X: La variable Y está
bien de…nida debido a que X nunca es negativa. Además Y 0, así que FY (y) = 0 para y < 0:
Para y 0 se tiene
2
FY (y) = P [Y y] = P X y 2 = 1 e y :
y2
Luego la densidad de Y es fY (y) = 2 ye para y > 0:
S. Cambronero 101
Ejemplo 150 Un poco más generalmente, considere X exponencial de parámetro y de…na Y =

X b donde b > 0: Para y > 0 se tiene
h 1
i 1
FY (y) = P X y b = 1 exp yb :
La función de densidad es nula para y < 0; mientras pafra y > 0 se triene

1 1
1
fY (y) = yb exp yb :
b
Esta es la llamada la distribución de Weibull. Es común encontrar esta distribución con parámetros
= b y k = 1b lo que la convierte en
k 1 k
f (y) = k ( y) exp ( y) :
Ejemplo 151 La distribución lognormal estándar es la distribución de la variable Y = eX ; donde

X es normal estándar. Para y > 0 se tiene
FY (y) = P eX y = P [X ln y] = (ln y) :
Consecuentemente, la densidad de Y para y > 0 es
0
(ln y) 1 1 2
fY (y) = = p exp 2 (ln y) :
y y 2
Para y < 0 se tiene fY (y) = 0:

En general, asumiendo que la función g es invertible, la variable Y = g (X) tiene función de
distribución dada por
1 1
FY (y) = P [g (X) y] = P X g (y) = FX g (y) :
Puesto de otra forma se tiene
FY (g (x)) = FX (x) :
Si X tiene densidad fX entonces Y tiene densidad fY y satisface
fY (g (x)) g 0 (x) = fX (x) ;
es decir
fX (x)
fY (y) = ; donde g (x) = y:
g 0 (x)
S. Cambronero 102
Ejemplo 152 Si X tiene densidad de Cauchy entonces Y = X 3 tiene densidad

fX (x) 1
fY (y) = =
3x2 3 x2 (1 + x2 )
p
evaluado en x = 3 y; es decir
1
fY (y) = 2 2
:
3 y 3 1 + y3
4.2.5 Esperanza de una variable continua

La esperanza de una variable aleatoria se puede de…nir en general, de manera que responda a
la idea intuitiva de un promedio ponderado, como en el caso de variables discretas. En forma
muy intuitiva e informal, la fórmula de la esperanza para variables discretas se adapta al caso de
variables continuas de la siguiente manera: En la expresión
X
EX = x X (x)
x
se reemplaza la sumatoria por una integral, que es la forma de "sumar" en el caso continuo,
mientras que la función de masa se reemplaza por la función de densidad. Se obtiene
Z 1
EX = xfX (x) dx: (4.4)
1
Para obtener una deducción un poco más rigurosa, pensemos en una variable que toma valores
en un intervalo [a; b] : Si P = fx0 ; x1 ; : : : ; xn g es una partición de [a; b] con xi+1 = xi + x; la
probabilidad de que la variable X caiga en [xi ; xi+1 ] es aproximadamente f (xi ) x: Aproximamos
la variable X por una variable discreta que toma el valor xi con probabilidad f (xi ) xi : La
esperanza de esa variable es entonces
n
X
xi f (xi ) x
i=1
que no es otra cosa que una suma de Riemann para la integral (4.4). Lo anterior justi…ca la
siguiente de…nición.
De…nición 18 Para una variable X con densidad fX se de…ne la esperanza como

Z 1
EX = xfX (x) dx
1
siempre que esta integral impropia converja. Si la integral diverge a +1 se dice que X tiene
esperanza +1: Similarmente con 1:
Ejemplo 153 Suponga que X es distribuida uniformemente en el intervalo ]a; b[ : La esperanza de

X es Z b
x b2 a2 a+b
EX = dx = = :
a b a 2 (b a) 2
Nótese que EX es el punto medio entre a y b; como era de esperarse.
S. Cambronero 103
Ejemplo 154 Para una variable exponencial de parámetro se tiene, integrando por partes
Z 1 Z 1 x 1
x x 1 x e 1
EX = xe dx = xe 0
+ e dx = = :
0 0 0
Si X representa el tiempo que transcurre entre dos eventos (dos accidentes, dos llamadas a una
central telefónica, la llegada de dos clientes a la frmacia, dos caídas en el tipo de cambio, etc.)
entonces el tiempo esperado entre dos eventos es 1 . Por ejemplo si = 3 y el tiempo se mide
en años, se espera una llamada cada cuatro meses (un tercio de año). Dicho de ptra manera, se
esperan tres eventos por año. Es decir, el parámetro representa la frecuencia con que ocurrem
los eventos.
Ejemplo 155 Para una variable normal estándar X se tiene
Z 1
x 1 2
EX = p e 2 x dx = 0:
1 2
En efecto, esto se puede intuir directamente del hecho que X se distribuye simétricamente alrededor
del origen. Otra forma de verlo es observandpo que el integrando en la expresión para EX es una
1 2
función impar. Una tercera forma es mediante el cálculo directo, dado que xe 2 x tiene como
1 2
primitiva a e 2 x :
4.2.6 La esperanza de g (X)

Veamos ejemplos del cálculo de la esperanza de una variable Y que se obtiene transformando otra
variable X previamente de…nida.
Ejemplo 156 Considere una variable aleatoria X que se distribuye uniformemente en ]0; 1[ : La
1
variable Y = X 2 tiene densidad fY (y) = 2p y 1]0;1[ : Consecuentemente
Z 1 Z 1 3 1
1 1 p y2 1
EY = y p dy = 2 ydy = = :
0 2 y 0 3 3
0
2
La integral también se puede calcular haciendo el cambio y = x
Z 1 Z 1 1
1 p 2 x3 1
2 ydy = x dx = = :
0 0 3 0 3
Ejemplo 157 Considere una variable normal estándar y de…na Y = jXj : La densidad de Y fue
calculada previamente, obteniendo
( 1 2
p2 e 2 y para y > 0
fY (y) = 2
0 para y < 0
Se tiene entonces Z 1
2 1 2 2
EY = p ye 2y dy = p :
2 0 2
Note que Z 1
1 1 2
EY = p jyj e 2y dy:
2 1
S. Cambronero 104
p
Ejemplo 158 Considere X exponencial de parámetro y de…na Y = X: Recordemos que la
2
densidad de Y es fY (y) = 2 ye y para y > 0: Luego
p Z 1
y2
E X= 2 y2 e dy:
0
y2
Haciendo u = y; dv = 2 ye se obtiene
p 1
Z 1 Z 1
y2 y2 y2
E X= ye + e dy = e dy
0 0 0
y2
p
debido a que ye ! 0 cuando y ! 1: Ahora hagamos u = 2 y en esta última integral. Se
obtiene Z Z 1 p r
p 1 1
y2 1 1 2 2 1
E X= e dy = p e 2 u du = 2p = :
0 2 0 2 2
Ejemplo 159 Considere X normal estándar, Y = eX : Ya vimos que la densidad de Y para y > 0
es
1 1 2
fY (y) = p exp 2 (ln y) :
y 2
mientras para y < 0 se tiene fY (y) = 0: Entonces
Z 1 Z 1
y 1 2 1 1 2
EY = p exp 2 (ln y) dy = p exp 2 (ln y) dy:
0 y 2 2 0
Haciendo el cambio y = ex se obtiene
Z 1
1 1 2
EY = p e 2 x ex dx:
2 1
En el ejemplo 164 se calculará esta integral. Por ahora nos interesa únicamente el cambio de
variable realizado, el cual se puede realizar en un conexto general, como se explica a continuación.
Los cálculos de los ejemplos anteriores se pueden realizar sin recurrir al cálculo previo de la densidad
de Y = g (X) : En efecto, asumiendo que la función g es invertible, recordemos que
fY (g (x)) g 0 (x) = fX (x) :
Entonces haciendo el cambio y = g (x) se obtiene

Z 1 Z 1 Z 1
g (x) fX (x) dx = g (x) fY (g (x)) g 0 (x) dx = yfY (y) dy = EY:
1 1 1
Escribamos esto como teorema para recordarlo mejor.
Teorema 3 Si X es una variable aleatoria continua y g una función se tiene

Z 1
Eg (X) = g (x) fX (x) dx
1
siempre que la integral exista.

S. Cambronero 105
Ejemplo 160 Si X es uniforme en el intervalo ]a; b[ se tiene

Z b b
2 dx x3 b3 a3 a2 + ab + b2
E X = x2 = = = :
a b a 3 (b a) a 3 (b a) 3
Ejemplo 161 Si X es exponencial de parámetro se tiene

Z 1
2
EX = x2 e x dx:
0
Con u = x2 y dv = e x
se obtiene
Z 1 Z 1
x 1 2 2
EX 2 = x2 e 0
+2 xe x
dx = xe x
dx = 2:
0 0
En el último paso se usó el hecho que la integral es la esperanza de X:
Ejemplo 162 Si X es normal estándar se tiene

Z 1
1 1 2
EX 2 = p x2 e 2x dx:
2 1
Intgrando por partes con u = x se obtiene

1 Z 1
1 1 2 1 1 2
EX 2 = p xe 2x +p e 2x dx = 1
2 1 2 1
1 2
dado que xe 2x ! 0 cuando x ! 1 y la última integral coincide con la integral de la densidad
de X:
Ejemplo 163 Si Y es lognormal estándar se tiene Y = eX ; donde X es normal estándar. Luego

Z 1
1 1 2
EY = E eX = p ex e 2 x dx:
2 1
La última integral se puede calcular completando el cuadrado
x2 2
x = 1
2 x2 2x = 1
2
1
2 x2 2x + 1 = 1
2
1
2 (x 1) ;
2
de donde Z 1 Z 1 Z 1
1 2 1 1
1)2 1 1 2
ex e 2x dx = e 2 e 2 (x dx = e 2 e 2z dz:
1 1 1
En el último paso se hizo el cambio z = x 1: Finalmente

Z 1 1 Z 1
1 1 2 e2 1 2 1
EY = p ex e 2x dx = p e 2z dz = e 2 :
2 1 2 1
S. Cambronero 106
Ejemplo 164 El cálculo del ejejmplo anterior se puede realizar de forma más general. En efecto,
si X es normal estándar y 2 R se tiene
Z 1
X 1 1 2
E e =p e x e 2 x dx:
2 1
Ahora la completación de cuadrados es ligeramente distinta
x2 2 2 2
x = 1
2 x2 2 x = 2
1
2 x2 2 x+ 2
= 2
1
2 (x ) :
2
Luego, haciendo el cambio z = x
2 Z 1
X e2 1
)2
2
E e =p e 2 (x dz = e 2 :
2 1
4.2.7 Varianza en el caso continuo

DAdo que la varianza se de…ne en términos de la esperanza, nada cambia en la de…nición con
respecto al caso discreto. Es decir, se de…ne
2
V (X) = E (X )
donde = EX: El mismo cálculo realizado en el caso discreto permite deducir que
2
V (X) = E X 2 2
= E X2 (EX) :
Ejemplo 165 Para una variable tipo U (a; b), es decir uniforme en el intervalo ]a; b[ se tiene
2 2
2 a2 + ab + b2 a+b (a b)
V (X) = E X 2 (EX) = = :
3 2 12
Ejemplo 166 Para X exponencial de parámetro se tiene
2
2 2 1 1
V (X) = E X 2 (EX) = 2 = 2:
Ejemplo 167 Para X normal estándar se tiene

2
V (X) = E X 2 (EX) = 1 0 = 1:
Se concluye que la normal estándar tiene media 0 y varianza 1: Es común usar la notación N (0; 1)
para denotar la distribución normal estándar.
Ejemplo 168 Para una variable X lognormal estándar se tiene X = E Z , con Z normal estándar.
De acuerdo con el ejemplo 164 se tiene
1 22
E (X) = E eZ = e 2 ; E X 2 = E e2Z = e 2 = e2 :
Luego
1 2 2
V (X) = e2 e2 =e e:
S. Cambronero 107
4.2.8 Variables gaussianas o normales

Considere una variable aleatoria Z normal estándar. Dadas 2Ry > 0; la variable
X= + Z
tiene esperanza
EX = + EZ =
y varianza
2 2
V (X) = V (Z) = :
Tratemos de calcular la función de distribución de X: Para esto tomemos x 2 R y calculemos
x x
FX (x) = P [X x] = P [ + Z x] = P Z =
donde = FZ es la función de distribución normal estándar dada por (4.3). Luego la densidad de
X es
!
2
0 0 x 1 1 1 x 1 1 2
' (x) = FX (x) = = p exp 2 =p exp 2
(x ) :
2 2 2 2
Esto se puede escribir también como

1 1 2
' (x) = p exp 2
(x ) : (4.5)
2 2 2
Esta es la distribución normal de parámetros y : Una variable se llama normal, o gaussiana,
de parámetros y 2 si tiene por densidad la función dada en (4.5). Es común usar la notación
X N ; 2 para decir que X es normal de parámetros y 2 :
Grá…camente, determina el eje de simetría de la densidad, mientras que ejerce un efecto de
escala. A mayor la grá…ca se concentra más en valores bajos, mientras que un pequeño provoca
una grá…ca más aplanada (colas más gruesas). A continuación se presentan unos casos particulares
para ayudar a la visualización del efecto de m y de sobre la grá…ca de la densidad normal.
Densidad y función de distribución normal estándar.
Densidad normal de media 1 y varianza 12 :

S. Cambronero 108
Densidad normal de media 1 y varianza 2:
Ejemplo 169 Si X es normal de parámetros = 3 y 2 = 4, calculemos P [X 7] ; P [jX 3j 2] :

Expresamos X = 3 + 2Z; donde Z es normal estándar. Entonces
7 3
P [X 7] = P [3 + 2Z 7] = P Z = (2) :
2
Usando una calculadora se obtiene P [X 7] = (2) 0:978: Para el segundo caso
X 3
P [jX 3j 2] = P 1 = P [jZj 1] = 2 2 (1) 0:317 :
2
Ejemplo 170 En el ejemplo anterior, calcular EX 2 ; E e5X : Se tiene

102
E X2 = 2
+ 2
= 13; E e5X = E e15+10Z = e15 E e10Z = e15 e 2 = e65 :
2
En general, se dice que X es lognormal de parámetros y si X = eY ; donde Y N ; 2
:
En tal caso, usando el ejemplo 164 se tiene
2
+ Z Z + 12
E (X) = E e =e E e =e
donde se usó una variable normal estándar Z: De manera similar

2
E X 2 = E e2 +2 Z
= e2 +2
:
Luego
2 2 2 2
V (X) = e2 +2
e2 +
= e2 +
e 1 :
4.3 Ejercicios
1. La función de distribución acumulada de una variable aleatoria X está dada por
8
>
> 0 para x < 1
<
c para 1 x<1
FX (x) =
>
> 2c para 1 x < 3
:
1 para x 3
donde 0 < c < 21 :
(a) Determine los valores que toma X:

(b) Determine la función de masa de probabilidad de X:
S. Cambronero 109
2. En el ejercicio anterior, suponga que E [X] = 5:
(a) Calcule Var(X) :

(b) Calcule P [X > 0] ; P [1 < X 3] :
3. Suponga que X tiene densidad
c 3x x2 para 0 < x < 3

fX (x) =
Calcule la constante c. Calcule E [X] y Var(X).

4. Suponga que X tiene densidad
c x2 4x para 2 < x < 4

fX (x) =
Calcule la constante c. Calcule E [X] y Var(X).

5. Será posible que una variable aleatoria tenga densidad de la forma
c 3x x2 para 2 < x < 4

fX (x) = ?
Explique.
6. Sea X una variable aleatoria normal con media 8 y varianza 9:
X 8
(a) Escriba explícitamente la función de densidad de Y = 3 :
(b) Calcule P [X 5] y P [jX 8j < 3] :
X X
(c) Calcule E e yV e :
7. En cada caso, determine en forma explícita la función de densidad de Y = 3X + 4:
(a) X es una normal estándar

(b) X es una N (4; 5)
(c) X es uniforme en ]5; 7[
(d) X es exponencial de parámetro = 2:
8. El tiempo en horas hasta el próximo cambio en el precio de un activo, es una variable

exponencial de parámetro = 31 : Son las 13:00 horas.
(a) Determine la hora en que se espera se de el próximo cambio en el precio.

(b) Encuentre la probabilidad de que el próximo cambio en el precio se de entre las 16:00 y
las 19:00 horas.
(c) Halle la probabilidad de que el próximo cambio se de después de las 19:00, dado que no
se da antes de las 16:00.
S. Cambronero 110

8
>
> 0 para x < 0
>
>
< x4 para 0 x < 2
FX (x) = x+1
>
> para 2 x < 5
> 6
>
:
1 para x 5
(a) Determine la función de densidad de X:

(b) Calcule E [X] y Var(X) :
8
>
> 0 para x < 0
>
>
< x5 para 0 x < 2
FX (x) = x+1
>
> 6 para 2 x < 5
>
>
:
1 para x 5
(a) Determine la función de densidad de X:

(b) Calcule E [X] y Var(X) :
8 x 1
< e para x < 1
FX (x) = bx + c para 1 x < 2
:
1 para x 2
Determine a; b; c de manera que X sea una variable continua. Haga una grá…ca de FX :
8
>
> 0 para x < 1
<
ax2 + b para 1 x < 3
FX (x) =
>
> bx + c para 3 x<4
:
1 para x 4
Determine a; b; c de manera que X sea una variable continua. Haga una grá…ca de FX :
13. Sea X una variable aleatoria normal con media 9 y varianza 16:
(a) Escriba explícitamente la función de densidad de X

(b) Calcule P [X > 1] y P [jX 8j < 3] :
h i
2
(c) Determine E (X 9) :
14. Suponga que X es una variable uniforme en ]0; 1[ : Calcule:
(a) la función de distribución y la densidad de Y = X + 2

S. Cambronero 111
(b) la función de distribución y la densidad de Y = 2X

(c) la función de distribución y la densidad de Y = 3X
4X
(d) la función de distribución y la densidad de Y = e
7X
(e) la función de distribución y la densidad de Y = e
15. Suponga que X es una variable uniforme en ]a; b[ : Calcule:
(a) la función de distribución y la densidad de Y = X + ; donde ; son constantes,

>0
(b) la función de distribución y la densidad de Y = X; donde ; son constantes, <0
X+
(c) la función de distribución y la densidad de Y = e ; donde ; son constantes, >0
X+
(d) la función de distribución y la densidad de Y = e ; donde ; son constantes, <0
16. Repita el ejercicio anterior para cuando X tiene función de distribución exponencial de
parámetro :
17. Repita el ejercicio anterior para X con función de distribución F y densidad f: Todo se
obtiene en términos de F y f:
2
18. Suponga que X tiene esperanza y varianza : Determine la esperanza y la varianza de la
variable
X
Y = :
19. Considere una variable X de tipo U (0; 1) : Calcule los momentos de X; es decir calcule
mk = E X k para k = 0; 1; : : :
20. Calcule los momentos de una variable uniforme en ]a; b[ :
21. Considere una variable X; distribuida exponencialmente de parámetro :
(a) Mediante integración por partes, veri…que la identidad

k
E Xk = E Xk 1
:
(b) Use lo anterior para calcular los momentos de orden 3; 4 (los de orden 0; 1; 2 ya son
conocidos).
(c) Trate de generalizar lo anterior para deducir una expresión para el momento de orden
k:
22. Considere una variable X normal estándar.
(a) Explique por qué los momentos de orden impar son todos nulos.
(b) Calcule los momentos de orden 4 y 6.
2
23. Calcule los momentos de orden 3 y 4 para una variable tipo N ; :
24. Para una variable aleatoria cualquiera, exprese P (X > a) en términos de la función de dis-
tribución de X:
Capítulo 5
Otras distribuciones continuas
5.1 La función gamma

La integral impropia Z 1
1
( )= t e t dt
0
de…ne la función gamma para cada > 0: En efecto, para estudiar la convergencia separamos
Z 1 Z 1 Z 1
t 1 e t dt = t 1 e t dt + t 1 e t dt
0 0 1
La segunda integral converge para cualquier por comparación con la integral

Z 1
t
e 2 dt
1
dado que cuando t ! 1 se tiene

1 t 1
t e t
t = t ! 0:
e 2 e2
1
La primera converge para > 0 por comparación t : En efecto
1 t
t e t
lim+ 1
= lim+ e = 1:
t!0 t t!0
1
Ejemplo 171 Calculemos (1) y 2 : Tenemos
Z 1
t 1
(1) = e t dt = e 0
=1
0
p
mientras, haciendo el cambio u = 2t se tiene
Z 1 Z 1
p
1 e t p 1 2 p 2 p
= p dt = 2 e 2u du = 2 = :
2 0 t 0 2
112
S. Cambronero 113
Note que, integrando por partes se tiene

Z 1 Z 1
t 1
( + 1) = t e t dt = ta e 0
+ t 1
e t dt:
0 0
t
La última integral es ( ) : Además t e ! 0 en in…nito y se anula en el origen. Se obtiene
( + 1) = ( )
para cada > 0:
Ejemplo 172 Aplicando la identidad anterior con = 1 se tiene (2) = (1) = 1: Luego con
= 2 se obtiene (3) = 2 (2) = 2: Similarmente (4) = 4 (3) = 3 2 = 3!: Siguiendo este
proceso (por inducción) se obtiene
(n) = (n 1)!
para cada entero positivo n:
El proceso del ejemplo anteiror se puede realizar comenzando con = 21 : Se obtiene
3 1 1 1p 5 3 3 3 1p
= = ; = =
2 2 2 2 2 2 2 2 2
y en general
1 (2n 1) (2n 3) : : : 3 1 p
+n = :
2 2n
Ahora note que
(2n)! (2n)!
(2n 1) (2n 3) : : : 3 1 = = n :
(2n) (2n 2) : : : 2 2 n!
Entonces se puede re-expresar

1 (2n)! p
+n = :
2 22n n!
Ejemplo 173 Aplicando la identidad anterior se tiene
11 1 10! p 945 p
= +5 = 10
= :
2 2 2 5! 32
5.2 La distribución gamma

Una densidad de la forma
1 x
( x) e
f (x) = 1(0;1) (x)
( )
se llama densidad de tipo gamma, con parámetros y : Nótese que, haciendo el cambio y = x
se tiene Z 1 Z 1
1
( x) e x dx = y 1
e y
dy = ( ):
0 0
S. Cambronero 114
Esto justi…ca el factor de corrección en el denominador de f (x) : Es decir

Z 1 Z 1
1 1
f (x) dx = ( x) e x dx = 1:
1 ( ) 0
Para = 1 se obtiene una exponencial de parámetro ; de manera que la familia de densidades

tipo gamma contiene a la familia de exponenciales. A continuación se dibujan algunas densidades
tipo gamma.
y
0.5
0.4
0.3
0.2
0.1
0.0
0 1 2 3 4 5 6 7 8
x
Como se verá más adelante, para el caso = n 2 N, la distribución gamma resulta de sumar
n variables independientes e idénticamente distribuidas de parámetro : Si la variable X tiene
densidad de tipo gamma, se tiene
Z 1 Z 1 1 x Z 1
x ( x) e ( + 1) ( x) e x
EX = xf (x) dx = dx = dx
0 0 ( ) ( ) 0 ( + 1)
Dado que en la última integral se tiene una densidad gamma de parámetros + 1 y , se obtiene
( + 1)
EX = = :
( )
De manera similar se tiene
Z 1 2 1 x Z 1 +1 x
2 x ( x) e ( + 2) ( x) e ( + 2) ( + 1)
EX = dx = 2 dx = 2 = 2 :
0 ( ) ( ) 0 ( + 2) ( )
Luego
2
2 ( + 1)
V (X) = E X 2 (EX) = 2 2 = 2:
El caso particular en que = n 2 N es interesante. En tal caso se tiene la densidad

n 1 x
( x) e
fn (x) =
(n 1)!
y la función de distribución es, para x 0

Z x n 1 t
( t) e
Fn (x) = dt:
0 (n 1)!
S. Cambronero 115
Integrando por partes se obtiene

n 1 x
( x) e
Fn (x) = Fn 1 (x) :
(n 1)!
Para n = 1 se tiene una distribución exponencial, así que

x
F1 (x) = 1 e ; x 0:
Luego
x
xe x
F2 (x) = F1 (x) =1 (1 + x) e :
1!
De la misma forma
!
2 x 2
( x) e ( x) x
F3 (x) = F2 (x) =1 1+ x+ e :
2! 2!
La siguiente fórmula general se deduce por inducción

!
n 1
( x) x
Fn (x) = 1 1 + x + ::: + e :
(n 1)!
5.3 La distribución beta

Para modelar un experimento en el que los valores se restringen a un intervalo acotado se suele
utilizar la distribución beta, de…nida por la densidad
b 1
f (x) = cxa 1
(1 x)
donde a; b > 0: La constante c se debe escoger para que f sea una densidad. Es decir
1
c=
B (a; b)
donde B es la función beta de…nida por

Z 1
b 1
B (a; b) = xa 1
(1 x) dx:
0
Más adelante mostraremos que

(a) (b)
B (a; b) = :
(a + b)
Diferentes valores de a y b dan diferentes características que dependen del tipo de fenómeno que
se quiera modelar. A continuación se dibujan algunos casos particulares. Para a > 2 y b > 2
se obtienen densidades como las de la primera …gura. Cuando a; b están entre 1 y 2, se obtienen
grá…cas como las de la segunda …gura. Cuando a < 1 y b < 1 las integrales se vuelven impropias
convergentes. Estas se dibujan en la tercera …gura.
S. Cambronero 116
Desde luego que los casos anteriores se pueden combinar. Por ejemplo se puede tener a < 1 y
b > 2; o alternativamente 1 < a 2 con b < 1; etc. A continuación se gra…can algunos de esos
casos.
Calculemos la esperanza de la distribución beta

Z 1
1 b 1 B (a + 1; b)
EX = xa (1 x) dx = :
B (a; b) 0 B (a; b)
Ahora note que
(a + 1) (b) a (a) (b) a
B (a + 1; b) = = = B (a; b) :
(a + b + 1) (a + b) (a + b) a+b
Entonces
a
EX = :
a+b
De manera similar
Z 1
1 b 1 B (a + 2; b) (a + 1) a
EX 2 = xa+1 (1 x) dx = =
B (a; b) 0 B (a; b) (a + b + 1) (a + b)
debido a que
(a + 1) a
B (a + 2; b) = B (a; b) :
(a + b + 1) (a + b)
Finalmente
2
2 (a + 1) a a
V (X) = E X2 (EX) =
(a + b + 1) (a + b) a+b
ab
= 2 :
(a + b) (a + b + 1)
S. Cambronero 117
Es importante tener presente el siguiente resultado, que le da cierta justi…cación a la existencia de

la distribución beta.
Lema 10 Si X; Y son variables independientes de distribución gamma(a; ) y gamma(b; ) respec-

tivamente, entonces
X
X +Y
tiene una distribución beta de parámetros a y b:
5.4 La distribución Weibull

Considere X exponencial de parámetro y de…na Y = X b ; donde b > 0: Calculemos la función de
distribución de Y: h i 1
1
FY (y) = P X b y = P X yb = 1 e yb :
b
Esta es una distribución Weibull. Típicamente se suele usar los parámetros = y k = 1b , con
lo que se obtiene
k
FY (y) = 1 e ( y) ; y 0:
La densidad es
k 1 ( y)k
f (y) = k ( y) e ; y > 0:
k
Para calcular la esperanza de Y; se hace el cambio z = ( y) y se obtiene
Z 1 Z 1 1
k 1 k zk z 1 1
EY = y k ( y) exp ( y) dy = e dz = +1 :
0 0 k
Similarmente
Z 1 Z 1 2
2 2 k 1 k zk z 1 2
EY = y k ( y) exp ( y) dy = 2
e dz = 2
+1 :
0 0 k
Finalmente, la varianza es
1 2 2 1
V (Y ) = 2
+1 +1
k k
5.5 Ejercicios
1. Si X es una variable con distribución gamma de parámetros = 2 y = 3; calcule
P fX 1g ; P fX < 2g : Calcule también P [ X 2j X 1] ; P [ 2 < X 3j X 1] :
2. Si X es una variable con distribución gamma de parámetros y : Calcule EX 3 : Induzca

una fórmula para calcular el momento de orden k; E X k : Veri…que su fórmula para k = 4:
3. Encuentre la moda de una variable gamma, es decir el punto x en el que la densidad alcanza
el máximo. Veri…que que solamente existe una moda en este caso, es decir, el máximo se
alcanza en un solo punto.
S. Cambronero 118
4. Si X es una variable con distribución gamma de parámetros y ; halle la densidad de la

variable 2X: En general, halle la densidad de cX; donde c es una constante.
5. Si X es una variable con distribución gamma de parámetros y ; halle la densidad de la
variable X 2 :
6. Si X es una variable con distribución gamma de parámetros y ; halle la densidad de X +b;

donde b es una constante.
1 1
7. Calcule B 2; 2 : Debe hacer un par de cambios de variable.
8. Veri…que las identidades
1 1
B (a; b) = B (b; a) ; B (a; 1) = ; B (a + 1; b) = B (a; b + 1) :
a b
9. Si X es beta(a; b) ; calcule la función de densidad de Y = 1 X y clasifíquela en términos de

las distribuciones que ya conoce.
10. Si X es beta(a; b) ; calcule el momento de orden 3: Induzca una fórmula general para el
momento de orden k:
11. Encuentre en forma explícita la función de distribución de una beta(a; 1) y de una beta(1; b) :
12. Si X es beta(a; b) ; con a > 1 y b > 1; encuentre la moda de X y veri…que que es única. R.
a 1
a+b 2 :
13. Si X es una Weibull, calcule el momento de orden 3: Induzca una fórmula general para el
momento de orden k:
14. Si X es una Weibull, encuentre la moda de X y veri…que que es única.
15. Si U es uniforme en (0; 1) ; calcule la distribución de la variable
1 1
Y = ( ln (1 U )) k :
Identifíquela dentro de las distribuciones estudiadas en este capítulo.

16. La distribución de Pareto de parámetros u y está dada por
u
F (x) = 1 ; x u
x
con F (0) = 0 para x < u:
(a) Calcule la función de densidad correspondiente a esta distribución

(b) Si X tiene una distribución de Pareto, calcule la esperanza y la varianza de X; cuando
son …nitas.
17. Considere una variable U uniforme en (0; 1) :

S. Cambronero 119
(a) Halle la distribución de la variable
Y = ln ( ln U ) :
Esta distribución es la llamada distribución Gumbel.

(b) Calcule la densidad de Y:
(c) Calcule la esperanza de Y en términos de ; y la constante de Euler
Z 1
= e u ln u du = 0:577 2 : : :
0
(d) Calcule la varianza de Y; usando la identidad

Z 1
2 1
e u (ln u) du = 2
+ 2
:
0 6
Capítulo 6
Distribuciones conjuntas
Considere dos variables aleatorias X; Y . El conocer las distribuciones individuales de X e Y no

es su…ciente para el cálculo de probabilidades de eventos como fX + Y > 0g ; fXY < 0g ; por
ejemplo, sin mencionar el análisis de otros conceptos como el de correlación. Se introduce entonces
el concepto de función de distribución conjunta, de…nida por
F (x; y) = P [X x; Y y] :
Al igual que en el caso de una variable, esta función es creciente en cada variable, continua por la
derecha en cada una de las variables y además
lim F (a; b) = FY (b) ; lim F (a; b) = FX (a) :

a!1 b!1
Por otro lado

lim F (a; b) = lim F (a; b) = 0:
a! 1 b! 1
Cuando existe, la función de densidad conjunta se de…ne por
@2
f (x; y) = F (x; y) :
@x@y
La función de distribución conjunta se recupera de la densidad conjunta mediante
Z b Z a
F (a; b) = f (x; y) dxdy:
1 1
Por el teorema de Fubini, el orden de integración no es importante. En general, para eventos de

la forma [(X; Y ) 2 A] ; con A R2 se tiene
ZZ
P [(X; Y ) 2 A] = f (x; y) dxdy:
A
Ejemplo 174 Suponga que X; Y son variables aleatorias que tienen densidad conjunta dada por
1 si 0 < x < 1; 0 < y < 1

f (x; y) = 1[0;1] [0;1] (x; y) =
0 en cualquier otro caso
120
S. Cambronero 121
Calculemos P [X + Y 1] ; es decir calculemos P [(X; Y ) 2 A] ; donde
A = f(x; y) : x + y 1g :
Dado que la densidad es nula fuera del cuadrado unitario, se tiene

Z 1 Z 1 x Z 1 1
x2 1
P [X + Y 1] = dydx = (1 x) dx = x = :
0 0 0 2 0 2
La distribución marginal de X es
Z a Z 1 Z a Z 1
P [X a] = f (x; y) dydx = dydx = a
1 1 0 0
para 0 a < 1; complementado con F (a) = 0 para a < 0 y F (a) = 1 para a 1: Entonces X
tiene distribución uniforme en (0; 1) : Similarmente, Y tiene distribución uniforme en (0; 1) :
En el caso discreto, el concepto a utilizar es el de función de masa conjunta
(x; y) = P fX = x; Y = yg :
Ejemplo 175 Considere dos lanzamientos de un dado. Sea X el resultado del primer lanzamiento,
Y el máximo de los dos resultados. Dado que X Y se tiene (i; j) = 0 para i > j: Por otro lado
1
(i; j) = ; para 1 i<j 6
36
j
mientras (j; j) = 36 : En efecto, si el primer lanzamiento en j y el máximo también, el segundo
lanzamiento tiene j posibilidades.
En el caso discreto nótese que la función de masa de X es

X
X (x) = (x; y)
y
y similarmente X
Y (x) = (x; y) :
x
Ejemplo 176 En el ejemplo anterior, la función de masa de Y es

j 1
X 1 j j 1 j 2j 1
Y (j) = + = + =
i=1
36 36 36 36 36
para j = 1; : : : ; 6:
De vuelta a variables continuas, es importante enfatizar las propiedades de la función de densidad.

Al igual que para densidades univariadas se tiene
ZZ
f (x; y) 0; f (x; y) dxdy = 1:
R2
S. Cambronero 122
Ejemplo 177 Hallar la constante c para que la función
f (x; y) = ce
1
2 (x2 +y2 )
sea una densidad conjunta. Claramente se tiene

ZZ Z 1 Z 1
1 2 1 2
f (x; y) dxdy = c e 2x dx e 2y dy = 2 c;
R2 1 1
1
así que c = 2 :
Ejemplo 178 Hallar c para que

x 2y
cxe para x > 0; y > 0
f (x; y) =
Evaluando ZZ Z 1 Z 1
x 2y c
f (x; y) dxdy = c xe dydx = :
R2 0 0 2
Entonces c = 2:
Si X; Y tienen densidad conjunta f (x; y), la función de distribución marginal de X es

Z a Z 1 Z a
FX (a) = P [X a] = f (x; y) dydx = g (x) dx
1 1 1
donde Z 1
g (x) = f (x; y) dy:
1
Consecuentemente, esta función g es la densidad (marginal) de X: Es decir

Z 1
fX (x) = f (x; y) dy:
1
Similarmente Z 1
fY (y) = f (x; y) dx:
1
Ejemplo 179 Suponga que X; Y tienen densidad conjunta

1 1
(x2 +y2 ) ;
f (x; y) = e 2 (x; y) 2 R2 :
2
La densidad marginal de X es
Z 1 Z 1 1 2
1 1
(x2 +y2 ) dy = 1 e 1 2 1 2 e 2x
fX (x) = e 2 2x e 2y dy = p :
1 2 2 1 2
Consecuentemente, X tiene una distribución normal estándar. Lo mismo ocurre con Y:
S. Cambronero 123
Ejemplo 180 Si X; Y tienen densidad conjunta

x 2y
2xe para x > 0; y > 0
f (x; y) =
se tiene Z 1
x 2y x
fX (x) = xe 2e dy = xe ; x 0
0
mientras f (x) = 0 para x < 0: Similarmente

Z 1
fY (y) = 2e 2y xe x
dx = 2e 2y
; y 0
0
y fY (y) = 0 para y < 0: Note que Y es ecponencial de parámetro = 2:
6.1 De nuevo independencia

Previamente trabajamos con independencia de variables discretas. En el caso general, dos variables
son independientes si todos los eventos de la forma [X 2 A] y [Y 2 B] son independientes. Es decir,
si
P [X 2 A; Y 2 B] = P [X 2 A] P [Y 2 B]
siempre que [X 2 A] y [Y 2 B] sean eventos. Cuando X; Y son independientes, la función de
distribución conjunta se obtiene en forma sencilla como
F (a; b) = P [X a; Y b] = P [X a] P [Y b] = FX (a) FY (b) :
Luego la función de densidad, cuando existe es
@2 @ @
f (x; y) = FX (x) FY (x) = FX (x) FY (x) = fX (x) fY (x) :
@x@y @x @y
Ejemplo 181 Si X; Y son exponenciales independientes de parámetro = 1 entonces la densidad
conjunta es
e x y para x > 0; y > 0
f (x; y) =
Ahora podemos calcular con bastante naturalidad probabilidades como P [X + Y > 2] : Veamos
Z 2 Z 1 Z 1 Z 1
x y x y
P [X + Y > 2] = e dydx + e dydx
0 2 x 2 0
Z 2 Z 1 Z 1
x x 2 x y
= e e dydx + e dx e dy
0 2 0
2 2 2
= 2e +e = 3e :
Para los límites de integración, se usa que cuando x < 2 entonces y debe ser mayor que 2 x:
Cuando x > 2 entonces no hay restricción en y:
S. Cambronero 124
Recíprocamente, si la densidad conjunta satisface
f (x; y) = fX (x) fY (y)
entonces X; Y son independientes. Lo que sigue no es del todo una demostración, pero básicamente
la idea es que al calcular las integrales iteradas
Z Z Z Z
P [X 2 A; Y 2 B] = fX (x) fY (y) dxdy = fX (x) dx fY (y) dy = P [X 2 A] P [X 2 B] :
A B A B
Ejemplo 182 Si X e Y tienen densidad conjunta

1 1
(x2 +y2 )
f (x; y) = e 2
2
ya observamos previamente que X e Y son normales estándar. Consecuentemente
1 2 1 2
e 2x e 2y
f (x; y) = p p = fX (x) fY (y) :
2 2
Entonces X; Y son independientes.
Ejemplo 183 Si X; Y tienen densidad conjunta

x 2y
2xe para x > 0; y > 0
f (x; y) =
vimos antes que

x 2y
fX (x) = xe 1fx>0g ; fY (y) = 2e 1fy>0g :
Luego
x 2y x 2y
f (x; y) = 2xe 1fx>0;y>0g = xe 1fx>0g 2e 1fy>0g = fX (x) fY (y)
y en particular X e Y son independientes.
Ejemplo 184 Considere X; Y con densidad conjunta dada por

y
xe para 0 < x < y
f (x; y) =
Dado que xe y es el producto de una función de x por otra función de y; pareciera que X e Y son
independientes. Sin embargo, la región sobre la que la densidad es no nula imprime dependencia
entre las variables. En efecto, calculando las densidades marginales se tiene
Z 1
fX (x) = xe y dy = xe x ; x 0
x
y fX (x) = 0 para x < 0: Por otro lado

Z y
y 1 2 y
fY (y) = xe dx = y e ; y>0
0 2
S. Cambronero 125
y además fY (y) = 0 para y < 0: Ahora note que

1 2 x y
fX (x) fY (y) = 2 xy e para x > 0; y > 0
así que
f (x; y) 6= fX (x) fY (y)
y las variables no son independientes.
A pesar de lo ocurrido en el ejemplo anterior, tenemos el siguiente resultado.
Lema 11 Si existen funciones g (x) 0 y h (y) 0 tales que la densidad conjunta de X; Y cumple
f (x; y) = g (x) h (y) (6.1)
entonces X e Y son independientes. En tal caso, existe una constante c > 0 tal que
1
fX (x) = cg (x) ; fY (y) = h (y) :
c
En particular, si g o h es una densidad, entonces g = fX y h = fY :
En efecto, si se cumple (6.1) entonces

Z 1 Z 1
fX (x) = g (x) h (y) dy = g (x) h (y) dy = cg (x) ;
1 1
donde Z 1
c= h (y) dy:
1
Por otro lado Z 1 Z 1

fY (y) = g (x) h (y) dx = h (y) g (x) dx = h (y)
1 1
donde Z 1
= g (x) dx:
1
Dado que Z Z
1 1
1= g (x) h (y) dxdy = c
1 1
se obtiene = 1c : Cuando g es una densidad se obtiene = 1 y consecuentemente c = 1; así que

fX = g, fY = h:
En el caso de variable discretas, la independencia es equivalente a la igualdad
(x; y) = X (x) Y (y) :
Al igual que en el caso continuo, basta que (x; y) se exprese como una función no negativa de x
por otra función no negativa de y; para que haya independencia. Además, si (x; y) = p (x) q (y) ;
donde p y q son funciones de masa, entonces p es la función de masa de X y q es la función de
masa de Y:
S. Cambronero 126
Ejemplo 185 Suponga que el número impagos de una cartera de crédito durante una año es una
variable Poisson de parámetro = 75: Cada vez que un cliente cae en impago, el Banco tiene una
probabilidad 35 de recuperar el dinero mediante la ejecución de la garantía, y 25 de no poder hacerlo.
Considere la variable X que representa el número de impagos del año en los que se recupera el
dinero, mientras que Y es el número de impagos en los que no se recupera el dinero.
Lo que sabemos es que X + Y es Poisson de parámetro = 75: Calculemos la función de masa
conjunta de X e Y:
(i; j) = P [X = i; Y = j]
= P [ X = i; Y = jj X + Y = i + j] P [X + Y = i + j]
dado que P [ X = i; Y = jj X + Y 6= i + j] = 0: Si n = i + j se tiene

i j
n 3 2
P [ X = i; Y = jj X + Y = n] =
i 5 5
(piense en recuperación del dinero como éxito). Entonces

i j
i+j 3 2 75i+j e 75
(i; j) =
i 5 5 (i + j)!
i 45 j 30
(45) e (30) e
= :
i! j!
Por la observación hecha arriba, se concluye que X; Y son variables independientes, la primera es
Poisson de parámetro 1 = 45 y la segunda es Poisson de parámetro 2 = 30:
6.2 Distribución de la suma de variables independientes

Ejemplo 186 Calcular la distribución de X + Y donde X; Y son independientes, ambas con dis-
tribución uniforme en (0; 1) :
La densidad conjunta de X; Y está dada por f = 1(0;1) (0;1) ; es decir
1 para 0 < x < 1; 0 < y < 1

f (x; y) =
La variable Z = X + Y toma valores entre 0 y 2: Su función de distribución está dada por
F (a) = P [X + Y a]
2
Para 0 < a < 1; esto es el área del triángulo de vértices en (0; 0) ; (a; 0) y (0; a) ; es decir F (a) = a2 :
Para 1 a < 2; 1 F (a) es el área del triángulo de vértices (1; 1) ; (1; a 1) y (a 1; 1) ; es decir
2
F (a) = 1 (2 2a) : En la …gura de la izquierda se ha dibujado la función de distribución, cambiando
de color en el punto corresponiente a x = 1: En la fugura de la derecha, se ha dibujado la densidad
de Z; esto es f (x) = x para 0 < x < 1, f (x) = 2 x para 1 < x < 2:
S. Cambronero 127
En general, cuando X; Y son independientes, la densidad de la suma se puede calcular usando el

hecho que la densidad conjunta es el producto de las densidades. En efecto
Z 1Z a x Z 1
P [X + Y a] = fX (x) fY (y) dydx = fX (x) FY (a x) dx:
1 1 1
Es decir Z 1 Z 1
FX+Y (a) = fX (x) FY (a x) dx = FX (a y) fY (y) dy
1 1
o equivalentemente la densidad es
Z 1 Z 1
fX+Y (a) = fX (x) fY (a x) dx = fX (a y) fY (y) dy:
1 1
En el caso discreto se obtiene

X X
X+Y (a) = X (x) Y (a x) = X (a y) Y (y) :
x x
Ejemplo 187 Sean X; Y de tipo Poisson, de parámetros 1 y 2 respectivamente. Gracias a la

independencia se tiene
P [ X + Y = nj X = k] = P [ Y = n kj X = k] = P [Y = n k] :
Luego
n
X
P [X + Y = n] = P [ X + Y = nj X = k] P [X = k]
k=1
Xn n
X k n k
1e e
1 2
2
= P [X = k] P [Y = n k] =
k! (n k)!
k=1 k=1
Xn n
e 1 2
n k n k e
= 1 2 =
n! j=1
k n!
donde = 1 + 2 : Es decir, la suma de variables aleatorias independientes tipo Poisson es de tipo

Poisson, donde el parámetros es la suma de los parámetros de los sumandos.
S. Cambronero 128
Ejemplo 188 Si X; Y son independientes, ambas exponenciales de parámetro se tiene

Z a
2
fX+Y (a) = e x e (a x) dx
0
2 a
= ae :
En general, un argumento inductivo demuestra que si X1 ; : : : Xn son exponenciales independientes

de parámetro ; entonces S = X1 + : : : + Xn tiene densidad
n n 1 x
x e
fS (x) = :
(n 1)!
Es decir, S es una gamma de parámetros n y :
Ejemplo 189 Se puede demostrar, con un poco más de cuidado que la suma de gammas independi-
entes con el mismo parámetro ; es otra gamma, donde el parámetro es la suma de los respectivos
parámetros de los sumandos. Es decir, si X1 ; : : : Xn son variables independientes, donde cada Xk
es gamma de parámetros k y , entonces S = X1 + : : : + Xn tiene densidad gamma de parámetros
= 1 + ::: + n y :
Ejemplo 190 Si X1 ; : : : Xn son variables independientes, donde cada Xk es normal de parámetros

2
k y k , entonces S = X1 + : : : + Xn tiene densidad normal de parámetros = 1 + ::: + n y
2
= 21 +: : :+ 2n : Esto se va a deducir posteriormente, usando la función generadora de momentos.
Ejemplo 191 Si Z es una variable normal estándar, calculemos la distribución de X = Z 2 : Para

x < 0 se tiene FX (x) = 0: Para x > 0 se tiene
p p p
FX (x) = P Z 2 x = P jZj x = x x :
Luego la densidad es
0 p p p p
( x) + 0 ( x) 0
( x) + 0 ( x) 1 1
fX (x) = p = p =p e 2x :
2 x 2 x 2 x
Note que se puede escribir
1
1 1 1 1
2 2x
2 2x e
fX (x) = 1 :
2
Es decir, Z 2 tiene distribución gamma de parámetros = 12 y = 12 : Esta es la distribución chi-

2
cuadrado ( ). Si se tiene X1 ; : : : ; Xn variables independientes con idéntica distribución normal
estándar, se sigue que
S = X12 + : : : + Xn2
1 n
tiene una distribución gamma de parámetros = 2 y = 2: Es decir
n
1 1 1 1
2 2x
2 2x e
fS (x) = n ; x > 0:
2
2
Esta es la distribución con n grados de libertad, de gran utilidad en estadística.
S. Cambronero 129
6.3 Esperanza de g (X; Y )

Al igual que en el caso de una variable, si X; Y tienen densidad conjunta f (x; y) y g : R2 ! R se
tiene Z
E [g (X; Y )] = g (x; y) f (x; y) dxdy:
Ejemplo 192 Considere X; Y con densidad conjunta

y
xe para 0 < x < y
f (x; y) =
X
Calculemos E Y :
Z 1 Z y
x
E [XY ] = xe y dxdy
0 0 y
Z 1 y Z y
e
= x2 dx dy
0 y 0
Z
1 1 2 y 2
= y e dy = :
3 0 3
La última integral se deduce del momento de orden 2 de una exponencial de parámetro = 1:
Alternativamente, se aplica integración por partes dos veces.
En el caso discreto, la expresión para la esperanza de g (X; Y ) es la siguiente

X
E [g (X; Y )] = g (x; y) (x; y) :
Ejemplo 193 Considere el lanzamiento de un dado dos veces. Vamos a calcular la esperanza del
producto de los dos resultados. En este caso podemos considerar X como el resultado del primer
1
lanzamiento, Y es el resultado del segundo. Claramente (i; j) = 36 para cada i; j 2 f1; 2; : : : ; 6g :
Entonces ! 0 1
X ij 6 6
1 X @X A 1 6 76 7 49
E (XY ) = = i j = = :
36 36 i=1 j=1
36 2 2 4
En este caso, dada la independencia de X e Y , también se pudo calcular como

7 7
E (XY ) = (EX) (EY ) = :
2 2
Ejemplo 194 En el ejemplo (175) calculemos E X1fX=Y g : Recuerde que
8
< 0 para i > j
i
(i; j) = para i = j
: 36
1
36 para i < j
Entonces
X X6
i2 1 6 7 13 91
E X1fX=Y g = i1fi=jg (i) (i; j) = = = :
i=1
36 36 6 36
Hemos usado una fórmula del capítulo de preliminares.
S. Cambronero 130
Ejemplo 195 Calcular E XYX+1 ; donde X e Y son independientes y distribuidas uniforme-

x
mente en (0; 1) : En este caso g (x; y) = xy+1 y la densidad conjunta de X e Y es f = 1(0;1) (0;1) :
Se tiene
Z 1Z 1 Z 1 Z 1
X x y=1
E = dxdy = ln (xy + 1)jy=0 dx = ln (x + 1) dx = 2 ln 2 1:
XY + 1 0 0 xy + 1 0 0
La última integral se obtuvo usando integración por partes.
Ejemplo 196 Considere X; Y variables independientes, ambas con distribución normal estándar.
Tenemos p ZZ p
1 2 2
x2 + y 2 e 2 (x +y ) dxdy:
1
2
E X +Y = 2
2 R 2
Usando coordenadas polares se obtiene

p Z 2 Z 1 Z 1
1 1 2 1 2 1p
E X2 + Y 2 = re 2r rdrd = r2 e 2r dr = 2
2 0 0 0 2
1 2
donde se ha usado integración por partes en la última integral, con u = r; dv = re 2r dr:
6.4 Ejercicios
1. Se lanzan dos dados y se de…ne X el valor observado en el primer lanzamiento, Y como la
suma de los dos valores observados. Calcule la función de masa conjunta de X e Y:
2. Se escogen tres bolas sin reemplazo de una caja que contiene 4 blancas y 7 negras. Sea
Xk = 1 si la k ésima bola es blanca, 0 en caso contrario. Determine la función de masa
conjnta de X1 ; X2 ; X3 :
3. A 5 Bancos estatales y 5 privados se les aplica un ranking. Los criterios usados son de-
sconocidos para nosotros, así que asumimos que todos los posibles órdenes son igualmente
probables. Sea X la mejor posición obtenida por un Banco estatal, Y la mejor posición de
un Banco privado. Determine la función de masa conjunta de X e Y:
4. Se lanza una moneda cinco veces. Sea X el número de escudos, Y el número de coronas.
Determine la función de masa conjunta. Caclule P [X > Y + 1] usando la función de masa
conjunta.
5. Un dado se lanza dos veces. Determine la función de masa conjunta para:
(a) el primer resultado y el segundo

(b) el máximo y el mínimo
(c) la suma y la resta
X = 1f1;2;3g ; Y = 1f1;2;3;4g ; Z = 1f1;2;3;4;5g :
Determine la función de masa conjunta de X; Y; Z:

S. Cambronero 131
7. Dos variables discretas X; Y tienen masa conjunta dada por (1; 1) = 81 ; (1; 2) = (2; 1) =
1
4; (2; 2) = 38 :
X
(a) Calcule P [XY > 2] ; P [X + Y < 2] ; P Y >1 :
2 3
(b) Calcule EX; EY; E (XY ), E X Y :
(c) Determine si las variables son independientes.
8. Suponga que el número impagos de una cartera de crédito durante una año es una variable
Poisson de parámetro : Cada vez que un cliente cae en impago, el Banco tiene una prob-
abilidad p de recuperar el dinero mediante la ejecución de la garantía, y 1 p de no poder
hacerlo. Considere la variable X que representa el número de impagos del año en los que
se recupera el dinero, mientras que Y es el número de impagos en los que no se recupera
el dinero. Veri…que que X e Y son variables independientes de tipo Poisson y determine el
parámetro de cada una de ellas.
9. El número de impagos de clientes hombres durante un mes, es una variable Poisson de
parámetro 1 = 11; mientras que el número de impagos de clientes mujeres es otra variable
Poisson, de parámetro 2 = 8; independiente de la primera. Halle el número esperado de
impagos total durante el mes. Halle la densidad del número total de impagos del mes.
10. Se escoge un número X aleatoriamente entre 1 y n: Luego se escoge un número Y aleatoria-
mente entre 1 y X: Halle la función de masa conjunta. Determine si X; Y son independientes.
11. Suponga que X; Y tienen densidad conjunta
cy (3 x) para 0 < y < x < 3

f (x; y) =
Calcule la constante c. Calcule EX; EY y E (XY ) : Calcule la densidad de X y la de Y:

c x2 y2 e x
para jyj < x
f (x; y) =
Calcule la constante c. Calcule EX; EY; fX ; fY :

c x2 + xy
2 para 0 < x < 1; 0 < y < 2
f (x; y) =
Calcule la constante c. Calcule EX; EY , P [X > Y ] : Calcue la densidad de Y .

14. Sean X; Y independientes, ambas con distribución exponencial de parámetro = 1: Calcule
P [X < Y ] ; P [X + Y > 3] : Calcule la densidad de X + Y:
15. El número de clientes que solicitan un préstamo en un banco durante un día es una Poisson
de parámetro = 9: Cada cliente que llega tiene probabilidad 32 de ser hombre. Si un día
llegan 5 mujeres, halle la probabilidad de que ese mismo día lleguen 7 hombres.
S. Cambronero 132
16. Sean X; Y; Z independientes y uniformemente distribuidas en (0; 1) :
(a) Halle P [X < Y < Z]

(b) Halle P [X > Y + Z]
(c) Halle la probabilidad de que la mayor de estas variables supere la suma de las otras dos.
17. Sean X; Y independientes, la primera distribuida uniformemente en (0; 1) ; la segunda uni-

forme en (0; 2) : Halle la densidad de X + Y:
forme en (1; 2) : Halle P jX Y j > 31 :
x 2y
2xe para x > 0; y > 0
f (x; y) =
Calcule fX ; fY : Determine si X; Y son independientes.

x
e para 0 < y < x
f (x; y) =
Calcule fX ; fY : Determine si X; Y son independientes.

cx2 y para x > 0; y > 0; 0 < x + y < 1
f (x; y) =
Calcule c: Calcule fX ; fY : Determine si X; Y son independientes.

c para 0 < x < y 2
f (x; y) =
Calcule c: Determine si X; Y son independientes.

23. Las ganancias de dos inversiones, X; Y son variables independientes, la primera es normal de
media 3 y varianza 1; la segunda es normal de media 4 y varianza 2. Se tienen 100 dólares
para invertir. ¿Cómmo se deben distribuir los 100 dólares entre las dos inversiones para...
(a) maximizar la ganancia esperada?

(b) minimizar la varianza de la ganancia?
24. Sean X; Y independientes, ambas exponenciales de parámetros 1 y 2 respectivamente.

Halle la densidad de Z = X
Y : Calcule P [X < Y ] :
25. Si X1 ; : : : ; Xn son exponenciales de parámetro ; independientes, halle la densidad de S =

max (X1 ; : : : ; Xn ) y de T = min (X1 ; : : : ; Xn ) :
Capítulo 7
Correlación y transformaciones
7.1 Transformaciones de variables

Considere X; Y con distribución conjunta f (x; y) y considere una función g : R2 ! R2 . Vamos a
estudiar la distribución conjunta de U; V de…nidas por
(U; V ) = g (X; Y ) :
Comencemos con un ejemplo.
Ejemplo 197 Considere X; Y con densidad conjunta dada por
1 2 2
e 2 (x +y )
1
f (x; y) =
2
y sea U = 2X; V = X + Y: La densidad conjunta de U y V se calcula como
h a i
FU;V (a; b) = P [U a; V b] = P X ;X + Y b
2
Z a2 Z b x
1 2 2
e 2 (x +y ) dydx:
1
=
1 1 2
Haciendo el cambio u = 2x; v = x + y se tiene

Z a2 Z b x Z a Z b
1 2 2 1 1
( u2 )
2
+(v u 2
)
e 2 (x +y ) dydx =
1 1
e 2 2
jJj dudv
1 1 2 1 1 2
donde J es el jacobiano
dudv 2 1
J = Jg (x; y) = = det = 2:
dxdy 0 1
Se concluye que
Z a Z b
1 1
( u2 )
2
+(v u 2
) dudv
FU;V (a; b) = e 2 2
1 1 4
y entonces la densidad conjunta de U y V es
1 1 u 2 u 2
fU;V (u; v) = exp + v :
4 2 2 2
133
S. Cambronero 134
En general, un argumento similar demuestra que la densidad conjunta de (U; V ) = g (X; Y ) es

1
fU;V (u; v) = f (x (u; v) ; y (u; v)) jJg (x (u; v) ; y (u; v))j :
1
Si h = g es la transformación inversa se tiene (X; Y ) = h (U; V ). Se puede escribir
fU;V (u; v) = f (h (u; v)) jJh (u; v)j :
Es importante recordar que

1
jJh (u; v)j = jJg (x; y)j :
Ejemplo 198 En el ejemplo anterior, se puede calcular la densidad invirtiendo la transformación

u u
x= ; y=v
2 2
es decir
u u
h (u; v) = ;v :
2 2
Se tiene
1 1 1
Jh (u; v) = det 2 2 = :
0 1 2
Luego, la densidad conjunta de U y V es
1 1 1 u 2 u 2
fU;V (u; v) = f (h (u; v)) = exp + v :
2 4 2 2 2
Ejemplo 199 Suponga que X; Y son uniformes en (0; 1) e independientes y considere
X
U = X + Y; V = :
Y
Entonces g (x; y) = (u; v) ; donde u = x + y; v = xy : La inversa se obtiene como
uv u
x= ; y= :
v+1 v+1
El jacobiano inverso es !
v 1
v+1 v+1 u
det u u = 2:
(v+1)2 (v+1)2 (v + 1)
La función de distribución conjunta de U y V se obtiene como
uv u u
fU;V (u; v) = f ; 2:
v+1 v+1 (v + 1)
Como f (x; y) = 1 para 0 < x < 1; 0 < y < 1 y es nula en los demás casos, entonces
uv u
f ; =1
v+1 v+1
S. Cambronero 135
Figure 7.1: Región donde fU;V es no nula.
uv u
cuando 0 < v+1 < 1; 0 < v+1 < 1: Esto ocurre cuando
1
0 < u < min 1 + ; 1 + v :
v
Consecuentemente, la densidad conjunta de U; V se resume en

u
(v+1)2
para 0 < u < min 1 + v1 ; 1 + v
fU;V (u; v) =
La región en la que fU;V (u; v) es no nula, se presenta en la …gura 7.1. Esta consiste de dos partes.
La primera corresponde a 0 < u < 1 + v para 0 < v < 1; la segunda corresponde a 0 < u < 1 + v1
para v 1: Para dibujar conviene observar que u = 1 + v es equivalente a v = u 1; mientras que
u = 1 + v1 es equivalente a v = u 1 1 :
Una transformación muy útil resulta de considerar g (x; y) = (x + y; x y) : En tal caso se tiene
jJg (x; y)j = 2

u+v u v
y la transformación inversa es x = 2 ; y= 2 : Entonces la densidad conjunta de
U = X + Y; V =X Y
está dada por

1 u+v u v
fU;V (u; v) = f ;
2 2 2
donde f (x; y) es la densidad conjunta de X e Y:
Ejemplo 200 Considere X; Y independientes, con distribución exponencial de parámetros 1 y

2 respectivamente. La densidad conjunta de X e Y es
1x 2y
f (x; y) = 1 2e ; para x > 0; y > 0:
S. Cambronero 136
Entonces U = X + Y; V = X Y tienen densidad conjunta
1 2 u+v u v
fU;V (u; v) = exp 1 2
2 2 2
1 1
= 1 2 exp ( 1 + 2) u exp ( 1 2) v
2 2
para u + v > 0; u v > 0: Esta condición se reduce a u > max (v; v) = jvj. En resumen
1 1
2 ( 1 + 2 )u 2( 1 2 )v
1 2e e para u > jvj
fU;V (u; v) =
Es importante observar que U y V no son independientes en este caso (¿por qué?).
Ejemplo 201 Ahora considere X; Y independientes, ambas con distribución normal estándar. La
densidad conjunta de X e Y es
1 2 2
e 2 (x +y ) :
1
f (x; y) =
2
En este caso U = X + Y; V = X Y tienen densidad conjunta
n o
1 1
( u+v
2 )
2
+( u 2 v )
2
1 1 2 1 2
fU;V (u; v) = e 2
= e 4u e 4v ; x; y 2 R:
4 4
Note que en este caso U y V sí son independientes. Además observe que
1 1 2 1 1 2
fU;V (u; v) = p e 4u p e 4v
4 4
así que U y V son variables normales independientes de media cero y varianza 2:
Ejemplo 202 Si X; Y son independientes y g; h son funciones de una variable, entonces las vari-
ables U = g (X) y V = h (Y ) son independientes. En efecto, los eventos
1 1
[U 2 A] = X 2 g (A) ; [V 2 B] = Y 2 h (B)
son siempre independientes. En particular
E [g (X) h (Y )] = E [g (X)] E [h (Y )] :
7.2 Covarianzas y correlaciones

La covarianza entre dos variables X; Y resume de alguna manera la forma en que interactúan
estas variables, de manera similar a como la esperanza o la varianza nos dan información sobre la
distribución (univariada) de una variable.
Se de…ne
Cov (X; Y ) = E [(X EX) (Y EY )]

= E [(X 1 ) (Y 2 )]
S. Cambronero 137
donde 1 = EX y 2 = EY: Observe que
Cov (X; Y ) = E [XY 1Y 2X + 1 2]

= E [XY ] 1 EY 2 EX + 1 2
= E [XY ] 1 2 = E [XY ] E [X] E [Y ] :
Cuando la covarianza entre X e Y es nula, es decir Cov (X; Y ) = 0; se dice que X e Y son no
correlacionadas.
Ejemplo 203 Si X es constante se tiene Cov (X; Y ) = 0: En efecto, si X = c entonces EX = c

y luego X EX es la variable nula. Intuitivamente, dado que una variable constante no varía,
entonces no puede "covariar" con otra variable.
Ejemplo 204 Si X; Y son independientes se tiene
Cov (X; Y ) = E [XY ] E [X] E [Y ] = 0:
Es decir, las variables independientes no covarían (independencia implica covarianza nula). Sin
embargo, la covarianza nula no implica independencia, como lo muestra el siguiente ejemplo.
Ejemplo 205 Considere = f(0; 0) ; (1; 0) ; (0; 1) ; (1; 1)g y sean X = 1f(1;1)g 1f(0;0)g ; Y =
1f(1;0);(0;1)g: Se tiene E [XY ] = E [X] = 0; así que
Cov (X; Y ) = 0:
Sin embargo, X e Y no son independientes. En efecto, observe que
P [X = 0jY = 1] = 1:
Ejemplo 206 Considere X; Y con densidad conjunta
2 para 0 < x < y < 1

f (x; y) =
0 en todos los demás casos
Se tiene Z Z Z Z
1 y 1 y
1 2
EX = 2xdxdy = ; EY = 2ydxdy =
0 0 3 0 0 3
mientras Z Z
1 y
1
E [XY ] = 2xydxdy = :
0 0 4
Entonces
1 1 2 1
Cov (X; Y ) = = :
4 3 3 36
Las siguientes propiedades se veri…can sin mucha di…cultad.
1. Simetría: Cov (X; Y ) = Cov (Y; X) :
2. Cov (X; X) = V (X)

S. Cambronero 138
3. Bilinealidad: Para a constante, X1 ; X2 ; Y variables se tiene
Cov (aX1 + X2 ; Y ) = a Cov (X1 ; Y ) + Cov (X2 ; Y ) :
En efecto
Cov (aX1 + X2 ; Y ) = E [(aX1 + X2 ) Y ] E [aX1 + X2 ] E [Y ]

= aE [X1 Y ] + E [X2 Y ] aE [X1 ] E [Y ] E [X2 ] E [Y ]
= a fE [X1 Y ] E [X1 ] E [Y ]g + E [X2 Y ] E [X2 ] E [Y ]
= a Cov (X1 ; Y ) + Cov (X2 ; Y ) :
Ejemplo 207 Si a y b son constantes, X; Y variables aleatorias se tiene
Cov (aX + b; Y ) = a Cov (X; Y ) :
Esto se obtiene de la propiedad 3, dado que Cov (b; Y ) = 0:
En general se tiene 0 1
n
X m
X n X
X m
Cov @ X1 ; Yj A = Cov (Xi ; Yj ) :
i=1 j=1 i=1 j=1
La bilinealidad y la simetría implican
Cov (X + Y; X + Y ) = Cov (X; X) + 2 Cov (X; Y ) + Cov (Y; Y )
es decir
V (X + Y ) = V (X) + 2 Cov (X; Y ) + V (Y ) :
La correlación, o cociente de correlación entre X e Y se de…ne como
2
Cov (X; Y ) X;Y
= (X; Y ) = p =
V (X) V (Y ) X Y
2
donde X;Y = Cov (X; Y ) :
Ejemplo 208 Si X; Y son independientes entonces (X; Y ) = 0; dado que Cov (X; Y ) = 0: En
palabras, independencia implica correlación nula.
Ejemplo 209 Si X es una variable cualquiera, a; b 2 R se tiene
Cov (X; aX + b) = aV (X) :
Si además a 6= 0 se tiene
aV (X) aV (X) a
(X; aX + b) = p =p = :
V (X) V (aX + b) 2
V (X) a V (X) jaj
Cuando a > 0 se obtiene (X; aX + b) = 1; mientras (X; aX + b) = 1 si a < 0:

S. Cambronero 139
Los valores obtenidos en el ejemplo anterior son extremos, como lo demuestra lo siguiente. Con-
sidere X; Y variables aleatorias. Dado que una varianza nunca es negativa, se tiene
X Y X X Y Y
0 V + =V + 2 Cov ; +V
X Y X X Y Y
Cov (X; Y )
= 1+2 + 1 = 2 + 2 (X; Y ) :
X Y
Se concluye que (X; Y ) 1: Un cálculo similar lleva a

X Y
0 V =2 2 (X; Y )
X Y
y esto implica (X; Y ) 1: En resumen, para cualesquiera variables X; Y se tiene

1 (X; Y ) 1:
En particular, la correlación máxima se obtiene cuando Y es múltiplo positivo de X; la mínima
cuando Y es múltiplo negativo de X:
7.3 Distribuciones condicionadas

Para este tema conviene comenzar con el caso discreto. Si X; Y tienen masa conjunta (x; y), se
puede calcular la masa de X condicionada a Y = y en forma directa. Esta se denota XjY (xjy) y
se de…ne como
(x; y)
XjY (xjy) = P [X = xjY = y] = :
Y (y)
Note que XjY (xjy) es una función de masa en el nuevo espacio de probabilidad [Y = y] :
Y el máximo de los dos resultados. En el ejemplo 175 se calculó la masa conjunta de X e Y: Además
se tiene
2j 1
Y (j) =
36
para j = 1; : : : ; 6: Entonces la función de masa de X condicionada a Y = j es
8
0 para i > j
(i; j) < 1
XjY (ijj) = = 2j 1 para i < j
Y (j) : j
2j 1 para i = j
Ejemplo 211 Considere dos variables de Poisson independientes X; Y; la primera de parámetro 1

y la segunda de parámetro 2 : Vamos a calcular la funciónde masa de X condicionado a X +Y = n:
Note que X no es independiente de X + Y: Cuando X + Y = n; la condición X = k es equivalente a
Y = n k: Recíprocamente, si X = k y Y = n k se sigue de inmediato que X + Y = n: Recuerde
además que X + Y es Poisson de parámetro = 1 + 2 : Usando estas observaciones se tiene
P [X = k; X + Y = n] P [X = k; Y = n k]
XjX+Y (k; n) = =
P [X + Y = n] P [X + Y = n]
P [X = k] P [Y = n k]
=
P [X + Y = n]
S. Cambronero 140
donde se ha usado la independencia de X e Y: Ahora es claro que

k n k
1e e
1 2
2
k n k k n k
k! (n k)! n 1 2 n 1 2
XjX+Y (k; n) = n = n = :
e k k
n!
Dado que 2 = 1 1
; esta es una distribución binomial. Es decir, condicionado a X + Y = n; X
es binomial de parámetros n y p = 1 :
En el caso continuo, se de…ne la densidad condicionada de X dado Y = y como

f (x; y)
fXjY (xjy) =
fY (y)
siempre que fY (y) 6= 0: Nótese que esto permite de…nir probabilidades condicionadas como
Z a Z a
f (x; y)
P [X ajY = y] = fXjY (xjy) dx = dx
1 1 fY (y)
que representa la función de distribución de X condicionado a Y = y: En general se puede de…nir

Z Z
f (x; y)
P [X 2 AjY = y] = fXjY (xjy) dx = dx:
A A fY (y)
En otras palabras, aunque el evento E = [Y = y] tiene probabilidad nula en el caso de variables

continuas, es posible darle sentido a la probabilidad condicionada a E:
Ejemplo 212 Considere dos variables aleatorias X; Y con densidad conjunta dada por
( " #)
2
1 2 2 y+1 1
f (x; y) = p exp (x 1) + (x 1) (y + 1) :
2 3 3 2 2
Calculemos primero la densidad marginal de Y: Para esto se completa el cuadrado en el exponente

Z 1 ( " #)
2
2 2 y+1 y+1
fY (y) = c (y) exp (x 1) 2 (x 1) + dx
1 3 4 4
Z 1 ( ) r
2
1 y+5 3
= c (y) exp 3 x dx = c (y) 2
1 2 4 4 4
donde
( " #)
2 2
1 2 y+1 y+1 1 1 2
c (y) = p exp = p exp (y + 1) :
2 3 3 2 4 2 3 8
Consecuentemente
q ( )
3
2 4 1 y+1
2
1 1 2
fY (y) = p exp = p exp (y + 1)
2 3 8 2 8 8
S. Cambronero 141
es decir que Y es una variable normal de media Y = 1 y varianza 2Y = 4: Ahora podemos

calcular la densidad condicional de X dado Y = y:
n h 2
io
2
exp 2
3 (x 1) + y+1 2
1
2 (x 1) (y + 1)
fXjY (xjy) dx = n o
2
p1 exp 1
(y + 1)
8 8
( " #)
2
1 2 2 y+1 1
= q exp (x 1) + (x 1) (y + 1)
2 34 3 4 2
( )
2
1 2 y+5
= q exp x :
2 3 3 4
4
y+5
Es decir, condicionado a Y = y; X es normal de media 4 y varianza 43 :
7.4 Esperanzas condicionadas

La función de masa de X condicionada a Y = y; no es más que una función de masa común y
corriente en un nuevo espacio [Y = y] : Tomando esto en cuenta, se puede de…nir la esperanza de
X; condicionada a Y = y como
X
E [XjY = y] = x XjY (xjy)
x
y similarmente en el caso continuo

Z
E [XjY = y] = xfXjY (xjy) dx:
También se puede de…nir

h i
2
V (XjY = y) = E (X E [XjY = y]) jY = y
2
= E X 2 jY = y (E [XjY = y]) :
Y el máximo de los dos resultados. De acuerdo con el ejemplo 210, la función de masa de X
condicionada a Y = j es
8
0 para i > j
(i; j) < 1
XjY (ijj) = = 2j 1 para i < j
Y (j) : j
2j 1 para i = j
Entonces
j 1
X i j2 j (3j 1)
E [XjY = j] = + = :
i=1
2j 1 2j 1 2 (2j 1)
S. Cambronero 142
Ejemplo 214 Considere dos variables de Poisson independientes X; Y; la primera de parámetro 1

y la segunda de parámetro 2 : De acuerdo con el ejemplo 211, la función de masa de X condicionada
a X + Y = n, es una binomial de parámetros n y p = 1 +1 2 : Consecuentemente
n 1
E [XjX + Y = n] = :
1 + 2
Ejemplo 215 Considere dos variables aleatorias X; Y con densidad conjunta dada en el ejemplo
212. Condicionada a Y = y; X es normal de media y+5 3
4 y varianza 4 : Entonces
y+5 3
E [XjY = y] = ; V (XjY = y) = :
4 4
Luego
2
3 y+5 y 2 + 10y + 37
E X 2 jY = y = + = :
4 4 16
Considere la función ' (y) = E [XjY = y] : A la variable aleatoria ' (Y ) se le llama esperanza de
X condicionada a Y: Se denota
E [XjY ] = ' (Y ) ; donde ' (y) = E [XjY = y] :
Retomemos los ejemplos anteriores.
Y el máximo de los dos resultados. Dado que
j (3j 1)
E [XjY = j] =
2 (2j 1)
se obtiene
Y (3Y 1)
E [XjY ] = :
2 (2Y 1)
Ejemplo 217 Considere dos variables de Poisson independientes X; Y; la primera de parámetro
1 y la segunda de parámetro 2 : Dado que
1n
E [XjX + Y = n] =
1 + 2
se obtiene
1 (X + Y )
E [XjX + Y ] = :
1+ 2
212. Recordemos que
y+5 3 y 2 + 10y + 37
E [XjY = y] = ; V (XjY ) = ; E X 2 jY = :
4 4 16
Entonces
Y +5 3 Y 2 + 10Y + 37
E [XjY ] = ; V (XjY ) = ; E X 2 jY = :
4 4 16
S. Cambronero 143
El siguiente resultado permite explotar el concepto de esperanza condicionada para el cálculo de

esperanzas.
Teorema 4 Si X; Y son variables aleatorias se tiene
E [E [XjY ]] = E [X] :
En efecto
Z 1
E [E [XjY ]] = E [' (Y )] = ' (y) fY (y) dy
1
Z 1 Z 1
= xfXjY (xjy) dx fY (y) dy
1 1
ZZ
= xf (x; y) dxdy = E [X] :
Note que este teorema se puede escribir como

Z 1
E [X] = E [XjY = y] fY (y) dy:
1
En el caso discreto se reduce a

X
E [X] = E [XjY = y] P [Y = y] : (7.1)
y
Retomemos de nuevo los ejemplos.

Y el máximo de los dos resultados. Teníamos
Y (3Y 1)
E [XjY ] = :
2 (2Y 1)
Por el teorema anterior se tiene
Y (3Y 1)
E [X] = E :
2 (2Y 1)
Claramente en este caso E [X] = 72 : Se obtiene entonces una interesante identidad
Y (3Y 1)
E = 7:
2Y 1
Ejemplo 220 Considere dos variables de Poisson independientes X; Y; la primera de parámetro
1 y la segunda de parámetro 2 : Habíamos llegado a
1 (X + Y )
E [XjX + Y ] = :
1+ 2
La identidad del teorema nos dice que

1
E [X] = E [X + Y ]
1 + 2
lo cual coincide con el hecho que E [X] = 1 y E [X + Y ] = 1 + 2:

S. Cambronero 144
212. Habíamos deducido que
Y +5 3 Y 2 + 10Y + 37
E [XjY ] = ; V (XjY ) = ; E X 2 jY = :
4 4 16
Aplicando el teorema se tiene
Y +5 1+5
E [X] = E = =1
4 4
mientras
Y 2 + 10Y + 37 5 10 + 37
E X 2 jY = E = = 2:
16 16
2
Luego V (X) = E X 2 (EX) = 1: Ahora, es claro inspeccionando la densidad conjunta de X
e Y que X debe ser normal. Lo que acabamos de obtener nos dice que X es N (1; 1) : Calculemos
ahora E [XY ].
ZZ Z 1 Z 1
E [XY ] = xyf (x; y) dxdy = xfXjY (xjy) dx yfY (y) dy
1 1
Z 1 Z 1
(y + 5) y
= E [XjY = y] yfY (y) dy = fY (y) dy:
1 1 4
La última integral representa
(Y + 5) Y 1 1
E = E Y 2 + 5Y = EY 2 + 5EY = 0
4 4 4
dado que EY = 1 y EY 2 = 5: Se sigue que
Cov (X; Y ) = E [XY ] E [X] E [Y ] = 0 1 ( 1) = 1
y …nalmente
Cov (X; Y ) 1 1
(X; Y ) = = = :
X Y 1 2 2
Con un poco más de trabajo se puede deducir que, en general, la densidad conjunta
1
f (x; y) = p
2 1 2
1 2
( " #)
2 2
1 x 1 2 y 2
exp 2)
(x 1 ) (y 2) +
2 (1 1 1 2 2
corresponde a dos variables normales X; Y; la primera con media 1 y varianza 21 ; la segunda con
media 2 y varianza 22 ; con correlación entre ellas. Cuando = 0 esta densidad se reduce al
caso de variables normales independientes. Para variables normales, independencia es sinónimo de
correlación nula.
S. Cambronero 145
7.5 Cálculos con esperanzas condicionadas

Los conceptos y propiedades de la sección anterior constituyen un método de cálculo e…ciente, es-
pecialmente cuando se de…nen variables en términos de otras variables. Veremos algunos ejemplos.
Ejemplo 222 El número de impagos al mes, de una cartera de crédito es una variable N tipo
Poisson, con parámetro : Las pérdidas dado impago de los cientes son variables aleatorias con
media ; independientes de N: La pérdida total de la cartera por incumplimientos es entonces
N
X
S= Xk
k=1
donde X1 ; X2 ; : : : son variables con media : Observe que

P [S xjN = n] = P [X1 + : : : + Xn xjN = n] = P [X1 + : : : + Xn x]
la última identidad debido a que las Xk son independientes de N: Esto muestra que la distribu-
ción de S condicionada a N = n es la de una suma de n variables de media : En particular
E [SjN = n] = n y consecuentemente
E [SjN ] = N:
Finalmente
ES = E fE [SjN ]g = E [ N ] = E [N ] = :
Ejemplo 223 Un instrumento …nanciero tiene tres escenarios de rendimiento mensual, igual-
mente probables. En el primer escenario rinde un 4%: En el segundo escenario rinde un 1% y
en el tercer escenario rinde un 2%: Un cliente decide invertir en este instrumento y mantener
la inversión hasta que se presente un rendimiento mensual positivo. Para simpli…car el análi-
sis, supongamos que las pérdidas/ganancias mensuales no se acumulan como principal, solo se
contabilizan y se pagan (o cobran) al …nal. Hallar la ganancia esperada del cliente.
Sea X la ganancia del cliente y asuma que la inversión es de 100 dólares. Sea Y el número de
escenario que se da el primer mes. De acuerdo con (7.1) se tiene
3
X 3
1X
E [X] = E [XjY = k] P [Y = k] = E [XjY = k] :
3
k=1 k=1
Calculemos los sumandos individuales de esta suma. Si el primer mes se da el escenario 1; el

cliente retira de una vez la inversión. Entonces
E [XjY = 1] = 4:
Si el primer mes se da el escenario 2; la ganancia esperada se ve disminuida en 1, es decir
E [XjY = 2] = E [X] 1:
Similarmente
E [XjY = 3] = E [X] 2:
Finalmente
1 2 1
E [X] = (4 + E [X] 1 + E [X] 2) = E [X] +
3 3 3
y se obtiene E [X] = 1: El cliente espera ganarse un dólar.
S. Cambronero 146
La densidad condicional se puede usar para calcular probabilidades condicionadas, de acuerdo con
la identidad Z
P [X 2 AjY = y] = fXjY (xjy) dx:
A
Ejemplo 224 Suponga que X es uniforme en (0; 1) y Y es otra variable tal que al condicionarla
a X = p, su distribución condicionada es binomial de parámetros n y p (n está …jo). Encontrar la
función de masa de Y:
Tenemos Z 1 Z 1
n n k
P [Y = k] = P [Y = kjX = p] dp = pk (1 p) dp:
0 k 0
La última integral es la función beta evaluada en a = k + 1 y b = n k + 1, así que
n n k! (n k)! 1
P [Y = k] = B (k + 1; n k + 1) = = :
k k (n + 1)! n+1
Ejemplo 225 Dadas dos variables X; Y independientes con densidades fX y fY . Vamos a calcular
Z +1 Z +1 Z +1
P [X Y ] = P [X yjY = y] fY (y) dy = P [X y] fY (y) dy = FX (y) fY (y) dy:
1 1 1
En particular, si X es exponencial de parámetro , mientras Y es normal estándar se tiene

Z +1 Z +1 1 2 Z +1
1 y 1 2 1 1 2 e2 1
)2
P [X Y] = p 1 e e 2y dy = p e 2y dy p e 2 (y+ dy
2 0 2 0 2 0
Z +1 1 2
1 1 2 e 2z 1 1 2
= e2 p dz = e2 (1 ( ))
2 2 2
7.6 Funciones generadoras

7.6.1 De probabilidad
La función generadora de probabilidad de una variable X se de…ne como
GX (t) = E tX
siempre que esta esperanza exista. Para variables que toman valores en N, la función GX toma
una forma bastante familiar
1
X 1
X
GX (t) = E tX = tn [X = n] = p n tn : (7.2)
n=0 n=0
Nótese que el lado derecho no es más que una serie de potencias centrada en t0 = 0: Además, para
jtj 1 se tiene
jpn tn j pn
y la serie de los pn converge (suma 1): Por el criterio de comparación se obtiene convergencia de la
serie en (7.2) para t 2 [ 1; 1] : En particular, el radio de convergencia de esta serie es al menos 1:
S. Cambronero 147
Ejemplo 226 Considere una variable X geométrica de parámetro p = 12 : Se tiene entonces pn =

1
2n para n 1 y p0 = 0: Luego
X1 t
tn 2 t
GX (t) = = t = :
n=1
2n 1 2
2 t
El radio de convergencia en este caso es R = 2:
Ejemplo 227 Más generalmente, para una variable geométrica de parámetro p se tiene
1
X 1
X
n 1 n 1 pt
GX (t) = (1 p) ptn = pt [t (1 p)] =
n=1 n=1
1 t (1 p)
1
con radio de convergencia R = 1 p:
Sin importar la variable X; GX satisface

1
X
GX (1) = pn = 1:
n=0
Por otro lado, dentro del intervalo de convergencia, que incluye al intervalo ( 1; 1) ; la serie se
puede derivar término a término. Haciendo esto y evaluando en t = 0 se obtiene sucesivamente
G00 (0)
G (0) = p0 ; G0 (0) = p1 ; = p2
2
y en general
G(n) (0)
:
pn =
n!
Este hecho justi…ca el nombre dado a GX (t). Además demuestra en particular que la función
generadora de probabilidad determina de forma única la función de masa de X: Resumimos.
Teorema 5 Si dos variables X; Y que toman valores en N tienen la misma función generadora de
probabilidad, entonces tienen la misma función de masa (son idénticamente distribuidas).
Ejemplo 228 Suponga que la variable X tiene función generadora de probabilidad dada por
t
GX (t) = :
3 2t
Se puede escribir
1 1 1
tX X 2n n+1 X 2k 1 k
n
t 1 2
GX (t) = = t = t = t :
3 1 23 t 3 n=0 3 n=0
3n+1 3k
k=1
En el último paso se hizo el cambio k = n 1: Se obtiene entonces

k 1
2k 1 2 1
pk = = para k 1:
3k 3 3
Consecuentemente, X es una geométrica de parámetro p = 31 :

S. Cambronero 148
La función generadora de probabilidad también sirve para generar los momentos, aunque en forma
no muy directa. En efecto, ya sabemos que para jtj < 1 se puede derivar término a término cuantas
veces se desee. De hecho se obtiene
1
X
G(k) (t) = n (n 1) : : : (n k + 1) pn tn k
:
n=k
Cuando el radio de convergencia es R = 1; no es tan claro que se pueda evaluar en t = 1: Sin

embargo, si la serie del lado derecho converge para t = 1 se obtiene, gracias al teorema de Abel
1
X
G(k) 1 = n (n 1) : : : (n k + 1) pn = E [X (X 1) : : : (X k + 1)]
n=k
donde el lado izquierdo es

G(k) 1 = lim G(k) (t) :
t!1
Esto permite el cálculo de los momentos en forma recursiva1 . En efecto, para empezar se tiene
G (1) = 1; G0 (1) = E [X] :
Luego
G00 (1) = E [X (X 1)] = E X 2 E [X]
y esto permite calcular
E X 2 = G00 (1) + G0 (1) :
Similarmente, la igualdad
G000 (1) = E [X (X 1) (X 2)] = E X 3 3X 2 + 2X
permite obtener
E X 3 = G000 (1) + 3E X 2 2E [X] = G000 (1) + 3G00 (1) + G0 (1)
y así sucesivamente.
1
Ejemplo 229 Para X geométrica con p = 2 se tiene
t 1
G (t) = = 1 + 2 (2 t) :
2 t
Entonces para n 1 se obtiene
n 1
G(n) (t) = 2 n! (2 t)
y consecuentemente G(n) (1) = 2 n!: Luego
E [X] = 2; E X 2 = 6; E X 3 = 12 + 3 4 + 2 = 26:
Veamos dos ejemplos más de funciones generadoras de probabilidad de las más conocidas.
1 En muchos casos la evaluación en t = 1 es posible en términos simples, es decir sin tener que tomar el límite.
S. Cambronero 149
Ejemplo 230 Para X de tipo Poisson de parámetro se tiene

1
X n X1 n
e tn ( t) t (t 1)
GX (t) = =e =e e =e
n=0
n! n=0
n!
y el radio de convergencia es in…nito. Al derivar k veces

k
G(k) (t) = e (t 1)
y evaluar en t = 1 tenemos
k
E [X (X 1) : : : (X k + 1)] = :
Por ejemplo
3 2
E X3 = +3 + : (7.3)
Se dejan los detalles como ejejrcio.
Ejemplo 231 Para X binomial de parámetros n y p se tiene

n
X n
X
n k n k k n k n k n
GX (t) = p (1 p) t = (tp) (1 p) = (tp + 1 p) :
k k
k=0 k=0
El siguiente teorema permite usar en forma e…ciente la función generadora de probabilidad para
deducir la distribución de una suma de variables independientes.
Teorema 6 Si X; Y son independientes se tiene
GX+Y (t) = GX (t) GY (t) :
En efecto, dado que X; Y son independientes se sigue que tX y tY son independientes para cada t:
Luego
GX+Y (t) = E tX+Y = E tX tY = E tX E tY = GX (t) GY (t) :
Al combinar este teorema con el teorema 5 se obtiene una poderosa herramienta.
Ejemplo 232 Si X; Y son variables independientes tipo Poisson, con parámetros 1 y 2 respec-
tivamente, se tiene
1 (1 t) 2 (1 t) (1 t)
GX+Y (t) = GX (t) GY (t) = e e =e
donde = 1 + 2 : Dado que GX+Y (t) coincide con la fgp de una Poisson de parámetro ; entonces
X + Y es una Poisson de parámetro : Esto ya se sabía, aunque es un poco más fácil deducirlo de
esta manera.
7.6.2 De momentos
Para una variable aleatoria X se de…ne la función generadora de momentos
MX (t) = E etX
siempre que la esperanza de la derecha exista.

S. Cambronero 150
Ejemplo 233 Si X es exponencial de parámetro se tiene

Z 1 Z 1
tx x ( t)x
MX (t) = e e dx = e dx = ; t< :
0 0 t
Ejemplo 234 Considere X normal estándar. Gracias al ejemplo 164 se tiene
1 2
MX (t) = E etX = e 2 t :
2
Si X es normal de media y varianza se tiene X = + Z; donde Z es normal estándar.
Luego
1 2 2 2 2
+ t2
MX (t) = E etX = E et +t Z
= et MZ (t ) = et e 2 t = et :
Dado que
tX = eX ln t
se tiene
GX (t) = E tX = E eX ln t = MX (ln t) :
Equivalentemente
MX (t) = GX et :
Ejemplo 235 Considere una variable X geométrica de parámetro p = 21 : Se tiene
et
MX (t) = GX et = :
2 et
para et < 2; es decir t < ln 2:
Ejemplo 236 Más generalmente, para una variable geométrica de parámetro p se tiene
pet
MX (t) = GX et =
1 et (1 p)
1
para et < (1 p) ; es decir t < ln (1 p) :
Ejemplo 237 Para X de tipo Poisson de parámetro se tiene

t
MX (t) = GX et = e (e 1)
para todo t 2 R.
Ejemplo 238 Para X binomial de parámetros n y p se tiene

n n
MX (t) = GX et = pet + 1 p = 1 + p et 1 :
Cuando MX (t) existe para jtj < r para algún r > 0; todos los momentos de X existen y se obtienen
como
(n)
E [X n ] = MX (0) : (7.4)
En efecto, sin preocuparse de los detalles técnicos se tiene
h 0
i
0
MX (t) = E etX = E XetX
S. Cambronero 151
y repitiendo el proceso h i
(n) (n)
MX (t) = E etX = E X n etX :
Al evaluar en t = 0 se obtiene (7.4). Además, desarrollando

1 n n
X
tX t X
e =
n!
k=0
se obtiene
1 n
X t E [X n ]
MX (t) = :
n!
k=0
1
Ejemplo 239 Si X es exponencial de parámetro , ya vimos que MX (t) = ( t) para t < :
Derivando n veces se obtiene
(n) (n+1)
MX (t) = n! ( t) :
Luego los momentos de X son
n!
E [X n ] = n:
Observe que
1
X 1 n
X
1 tn t n!
MX (t) = = t = n = n :
t 1 n!
k=0 k=0
Ejemplo 240 Considere X normal estándar. Sabemos que

1 2
MX (t) = e 2 t :
Nótese que
0 00 0 000 0 00
MX (t) = tMX (t) ; MX (t) = MX (t) + tMX (t) ; MX (t) = 2MX (t) + tMX (t)
y en general
(n+1) (n 1) (n)
MX (t) = nMX (t) + tMX (t) :
Al evaluar en t = 0 se obtiene
EX = 0; EX 2 = 1; EX 3 = 0; EX 4 = 3:
Siguiendo este proceso se puede deducir que
(2n)!
EX 2n+1 = 0; EX 2n = 1 3 5 : : : (2n 1) = :
2n n!
2
Ejemplo 241 Para X normal de media y varianza se tiene X = + Z; donde Z es normal
estándar. Luego
n
X X
n n n (2j)!
EX n = E [( + Z) ] = n k k
E Zk = n 2j 2j
:
k n 2j 2j j!
k=0 0 j 2
S. Cambronero 152
Por ejemplo, si X es normal de media 5 y varianza 3, el momento de orden 4 es

p 4 4 3 2 p 2 p 4
EX 4 = E 5+ 3Z = E 54 + 5 3 Z2 + 3 Z4
2
4 3 2 p 2 p 4
= 54 + 5 3 + 3 3 = 1102:
2
El ejemplo anterior se resume en
Z 1 p
1
5)2
x4 e 6 (x dx = 1102 6 :
1
Ejemplo 242 Si X es una gamma de parámetros y se tiene

Z 1 1 Z 1 1
etx ( x) e x
( t) (( t) x) e ( t)x
MX (t) = dx = dx:
0 ( ) t 0 ( )
La integral tiene como integrando la densidad de una gamma de parámetros y t: Se deduce
MX (t) = = ( t) :
t
Nótese el caso particular = 1; en que X es exponencial. Al derivar n veces se obtiene

(n) ( +n)
MX (t) = ( + 1) : : : ( + n 1) ( t)
y luego
n
E [X n ] = ( + 1) : : : ( + n 1) :
Cuando dos variables X; Y son independientes se tiene

h i
MX+Y (t) = E et(X+Y ) = E etX etY = E etX E etY = MX (t) MY (t) :
Inductivamente se deduce que si X1 ; : : : ; Xn son independientes entonces S = X1 + : : : + Xn tiene

función generadora de momentos
n
Y
MS (t) = MX1 (t) : : : MXn (t) = MXk (t) :
k=1
Ejemplo 243 Considere X1 ; : : : ; Xn variables independientes, donde Xk tiene distribución gamma

de parámetros k y (el mismo para todas las Xk ): Entonces S = X1 + : : : + Xn tiene función
generadora de momentos dada por
n
Y k 1 +:::+ n
MS (t) = = =
t t t
k=1
donde = 1 + ::: + n:
S. Cambronero 153
2
Ejemplo 244 Sean X1 ; : : : ; Xn independientes, donde Xk es normal de media k y varianza k:
Entonces S = X1 + : : : + Xn tiene función generadora de momentos dada por
n
Y t2 2 + t2
2 2
MS (t) = exp t k + k = et
2
k=1
2 2 2
donde = 1 + ::: + n y = 1 + ::: + n:
Es menos evidente que en el caso de la generadora de probabilidad, pero igualmente válido, que
la función generadora de momentos MX determina en forma unívoca la distribución de X 2 En lo
que sigue explotamos este resultado.
Ejemplo 245 Considere X1 ; : : : ; Xn variables independientes, donde Xk tiene distribución gamma

de parámetros k y . Gracias al ejemplo 243 se tiene que
1 +:::+ n
MX1 +:::+Xn (t) =

t
coincide con la función generadora de momentos de una gamma de parámetros = 1 + ::: + n
y : Entonces S = X1 + : : : + Xn tiene distribución gamma de parámetros = +:::+ n y :
1
Recuerde el ejemplo 189 en el que se había anticipado esta deducción.
2
Ejemplo 246 Dadas X1 ; : : : ; Xn independientes, donde Xk es normal de media k y varianza k:
Gracias al ejemplo 244 se tiene
2 2
+ t2
MX1 +:::+Xn (t) = et
donde = 1 + : : : + n y 2 = 21 + : : : + 2n : Consecuentemente, S = X1 + : : : + Xn es normal de

media y varianza 2 : Recuerde el ejemplo 190 en el que se había prometido deducir este resultado.
7.7 Interpretación de los momentos

La palabra momento es un término proveniente de la física. En general, la palabra momento se
re…ere a una medida del efecto de una cantidad física alrededor de un eje. Esta corresponde al
producto de la cantidad por la distancia al eje. Por ejemplo, en mecánica se habla de momento
de fuerza, momento de inercia o momento polar. Típicamente, el momento se re…ere a momento
de fuerza, que es una medida de la fuerza angular o de rotación. El momento de inercia es una
medida de la distribución de masa de un cuerpo alrededor de un eje. Se calcula como la suma de
los productos de masa por distancia al eje.
El término ha migrado a otros áreas como la estadística, en que cantidades como la esperanza de
una variable aleatoria tienen su expresión matemática idéntica a la de un momento de la física. Se
cree que la palabra momento degeneró de la palabra momentum del latín, que signi…ca cantidad de
movimiento. Para aclarar la relación con el término físico, pensemos en el ejemplo más simple de
una variable aleatoria no constante. Es decir, considere una variable aleatoria X que toma valores
a y b; con probabilidades p y 1 p respectivamente. Físicamente, esta corresponde a localizar una
masa p en el punto a y una masa 1 p en el punto b. En física, el momento de orden cero es
2 En realidad lo que hace sencillo el resultado en el caso de la fgp es que se re…ere a variables que toman valores
en N:
S. Cambronero 154
la masa total, en este caso 1: El momento de orden 1 es el centro de masa, que coincide con la
esperanza de la variable X en nuestra interpretación. Intuitivamente, si pensamos en la recta real
como una varilla uniforme de longitud in…nita, el momento de orden 1 es el punto en el que se
debe apoyar la varilla con las dos masas atadas, para que permanezca en equilibrio. La esperanza
de X puede interpretarse como el momento con respecto al origen, es decir la fuerza de rotación
ejercida por las masas sobre la varilla, cuando el punto de apoyo está en el origen. Pero a la vez es
el punto con respecto al cual el momento es nulo. Es decir, si trasladáramos el origen a ese punto,
el momento algular sería nulo.
7.7.1 Asimetría, variación y curtosis

El coe…ciente de variación con respecto a la media de una variable X se de…ne como la razón entre
la desviación estándar y la media, es decir : El coe…ciente de asimetría (en inglés, skewness) o
sesgo de una variable aleatoria X se de…ne como la razón del momento centrado de orden 3 al cubo
de su desviación estándar. Este se denota por 1 . Tenemos
3
3 E (X )
1 = 3
= 3
:
La curtosis o coe…ciente de planitud de X se de…ne como

4
4 E (X )
2 = 4
= 4
:
2
Ejemplo 247 Si X tiene distribución normal de media y varianza , entonces su coe…ciente
de asimetría es 1 = 0 y su curtosis es 2 = 3:
Ejemplo 248 Considere una variable de distribución gamma de parámetros a y . Previamente
observamos que
( + 1) ( + n 1)
EX n = n
para cada n 2 N. En particular

2
2 ( + 1)
X = EX 2 2
= 2 2 = 2:
Por otro lado

3 2 3
2
3 =E X = EX 3 3 EX 2 + 3 2 EX 3 = :
p3
Luego el coe…ciente de asimetría es
3 2
1 = 3
=p :
7.7.2 Colas de distribuciones

El objetivo es cómo asignar una de…nición de gruesa, o de cola más gruesa al comparar dos
distribuciones. Posiblemente la idea intuitiva es de conocimiento para el lector, se trata de qué
tan rápido decrece la densidad de la distribución cuando el argumento se aleja hacia in…nito. Otra
manera de verlo es qué tan probables son los valores altos de la variable. Estas ideas son, a todas
luces, un poco imprecisas. por lo que surge la necesidad de precisarlas un poco más.
S. Cambronero 155
Comparación por momentos

Las ideas del párrafo anterior se podrían precisar mejor si, por ejemplo, decimos que una distribu-
ción tiene colas gruesas si no todos lo momentos existen. O también que una distribución tiene
cola más gruea que otra si tiene menos momentos que esta. Los ejemplos aclararán esta idea.
Ejemplo 249 Recordemos que para una distribución gamma de parámetros y se tiene que
todos los momentos son …nitos.
Ejemplo 250 Para una distribución de Pareto de parámetros y se tiene

Z 1
0 xk
k = +1 dx
0 (x + )
donde el integrando es comparable con xk 1

: Consecuentemente, el momento de orden k es …nito
si y solo si k < . Esta distribución es entonces de colas gruesa bajo este criterio. Más aún, es
más gruesa cuanto más pequeño es :
Comparación por comportamiento asintótico

Este criterio es utilizado para comparar una distribución contra otra. Diremos que X1 tiene colas
más guesas que X2 si S2 (x) = o (S1 (x)) cuado x ! 1: Una condición que garantiza esto es
S1 (x)
lim = 1:
x!1 S2 (x)
Bajo la condición (aún más restrictiva) de que exista densidad, por la regla de L’Hopital esto es
euqivalente a
f1 (x)
lim = 1:
x!1 f2 (x)
Ejemplo 251 Retomando el ejemplo de las distribuciones de Pareto y la gamma se tiene

1 x
fp (x) (x + ) e
lim = cte lim > cte lim +k
= 1:
x!1 fg (x) x!1 xk 1 e x x!1 (x + )
Entonces bajo este criterio, cualquier distribución de Pareto es de colas más gruesas que cualquier
distribución gamma.
7.8 Ejercicios
1. En cada uno de los siguientes casos, determine la función de densidad de U = X + Y y
V = X Y:
(a) X; Y son independientes, la primera es exponencial de parámetro y la segunda es

normal estándar.
(b) X; Y tienen densidad conjunta dada por
ZZ 1
x4 y 4 x4 y4
f (x; y) = ce ; c= e dxdy :
S. Cambronero 156
(c) X; Y son independientes. La primera uniforme en (0; 1) ; la segunda es beta de parámet-

ros a = 1; b = 2:
(d) X; Y son independientes, ambas con densidad beta de parámetros a = b = 2:
2. Sean X; Y independientes e idénticamente distribuidas, ambas binomiales de parámetros n y

p: Calcule XjX+Y (kjm) y clasifíquela de acuerdo con los tipos de distribución discreta que
usted conoce. Deduzca una expresión para la esperanza de X condicionada a X + Y = m:
Deduzca que
1
E [XjX + Y ] = (X + Y ) :
2
cy (3 x) para 0 < y < x < 3

f (x; y) =
(a) Calcule la densidad de X condicionada a Y = y:

(b) Calcule E [XjY ] y úsela para calcular EX:
(c) Calcule la densidad conjunta de U = X; V = X + Y:
c x2 y2 e x
para jyj < x
f (x; y) =
(a) Calcule fXjY (xjy) y E [XjY = y] :

(b) Calcule EX:
(c) Clcule la densidad conjunta de U = XY; V = Y:
5. Deduzca la igualdad (7.3) para el momento de orden 3 de una Poisson.

6. Se escoge un número X aleatoriamente entre 1 y n: Luego se escoge un número Y aleatori-
amente entre 1 y X: Halle la función de masa conjunta. Calcule la función de masa condi-
cionada de Y dado X = k: Luego calcule E [Y jX] y deduzca el valor de E [Y ] :
c x2 + xy
2 para 0 < x < 1; 0 < y < 2
f (x; y) =
(a) Calcue la densidad de Y condicionada a X = x.

(b) Calcule E [Y jX] :
X
(c) Calcule la densidad conjunta de U = Y ; V = X:
8. El número de clientes de una tienda durante el día es una variable discreta que toma valores
0; 1; 2; : : : y tiene esperanza 47: Cada cliente que llega gasta un monto X; independiente de los
demás clientes y del número de clientes. Si EX = 30 000 colones, calcule la venta esperada
de la tienda durante el día.
S. Cambronero 157

forme en (0; 2) : Halle la densidad condicional de X dado X + Y = y: Halle E [XjX + Y ] :
x 2y
2xe para x > y > 0
f (x; y) =
Calcule fXjY (xjy) : Calcule E [XjY ] : Calcule fU para U = XY:

cx2 y para x > 0; y > 0; 0 < x + y < 1

f (x; y) =
Calcule fY jX (yjx) : Calcule E [XjY ] : Calcule fX+Y :

c para 0 < x < y 2

f (x; y) =
Calcule fY jX (yjx) : Calcule E [Y jX] : Calcule fX+Y :

13. El número de impagos al mes, de una cartera de crédito es una variable tipo Poisson, con
parámetro : Cada impago genera, independientemente de los demás y del número de impa-
gos, una pérdida X de distribución gamma de parámetros y : Sea S la pérdida total de la
catera durante el mes. Calcule la densidad condicional de S dado N = n: Calcule la pérdida
esperada de la cartera en el mes.
x
y
14. Considere f (x; y) = e y e para x > 0; y > 0 (nula en los demás casos). Calcule E [XjY ] ;
E X 2 jY y Var(XjY ) :
15. Una caja contiene b bolas blancas y n negras. Se extraen bolas de la caja, una a una sin
reemplazo, hasta obtener una bola blanca. Se X el número de bolas negras extraídas antes de
extraer la bola blanca. Por ejemplo, X = 0 signi…ca que la primera bola extraída es blanca.
Sea Y = 1 si la primera bola es blanca, en caso contrario Y = 0:
(a) Calcule E [XjY = 1]

(b) Si n = EX; deduzca que E [XjY = 0] = 1 + n 1:
(c) Concluya de lo anteiror que
n
n = 1+ n 1 :
n+b
(d) Observe que 0 = 0. Calcule usando lo anterior 1; 2; 3; 4: Deduzaca una fórmula

general para n:
16. El número de impagos al mes, de una cartera de crédito es una variable N tipo Poisson, con
parámetro : Suponga que la pérdida X asociada a cada cliente tiene distribución lognormal
estándar, independiente del número de impagos. Calcule la pérdida esperada de la cartera.
S. Cambronero 158
17. Se lanza una moneda n veces en forma independiente. En cada lanzamiento, la probabilidad
de que salga escudo es uniformemente distribuida en (0; 1) : Calcule la función de masa del
número de escudos.
18. Calcule la función generadora de momentos para una variable X de densidad
1 0 jxj
f (x) = e :
2
Utilícela para encontrar los momentos de X de orden 1; 2; 3; 4.
Capítulo 8
Convergencia
Como observamos en el capítulo anterior, lo momentos de una variables aleatoria dan mucha
información, incluso información completa cuando se conocen todos, sobre la distribución. Cuando
solo se dispone de uno o dos momentos, algo se puede decir sobre la dstribución de la variable,
al menos en forma de cotas para las probabilidades de ciertos eventos. Las desigualdades que
exponemos a continuación son una muestra de cómo los momentos pueden ser usados.
8.1 Algunas desigualdades

Para comenzar observe que si X es una variable que no toma valores negativos, entonces E [X] 0:
En efecto, si X es discreta se tiene
X
E [X] = x X (x) 0
x
dado que cada uno de los sumandos es 0: En el caso continuo, dado que P [X < 0] = 0 se obtiene
fX (x) = 0 para x < 0: Consecuentemente
Z 1
E [X] = xfX (x) dx 0
0
dado que el intgrando es 0:

Por la linealidad de la esperanza, si X; Y son variables aleatorias con esperanza …nita y X Y
se obtiene E [X] E [Y ] : En efecto, como Y X 0 se tiene E [Y ] E [X] = EY [Y X] 0.
Estas dos observaciones van a ser importantes para deducir la siguiente desigualdad.
Lema 12 (Desigualdad de Markov) Considere una variable aleatoria X 0: Si a > 0 se tiene
E [X]
P [X a] :
a
X
En efecto, en el evento [X a] se tiene 1 a; Consecuentemente
X X
1[X a] 1[X a]
a a
159
S. Cambronero 160
Por lo observado arriba se deduce que

X X
E 1[X a] E 1[X a] E :
a a
Esto es
E [X]
P [X a] :
a
Ejemplo 252 Considere una
p variable lognormal X: Entonces Z = log X es normal estándar y
E [X] = E eZ = MZ (1) = e: Luego
p
e 1
P [X e] = p = 0:606 53:::
e e
Esta cota sin embargo no es muy buena si se trata de obtener un valor cercano a la probabilidad
exacta. En este caso, el valor verdadero
P [X e] = P [Z 1] = 1 (1) = 0:07865:::
es mucho menor que la cota obtenida por la desigualdad de Markov.
Ejemplo 253 Considere X normal estándar, de modo que E X 2 = 1: Aplicando la desigualdad

de Markov a X 2 se tiene
E X2 1
P [jXj 2] = P X 2 4 = :
4 4
El valor exacto en este caso es
P [jXj 2] = 2 (1 (2)) = 0:004677:::
Aunque en la práctica las cotas obtenidas por la desigualdad de Markov no son muy e…cientes,
esto no le resta importancia como herramienta teórica, o para lograr estimados en casos en que el
conocimiento soble la distribución de la variable es muy limitado.
Ejemplo 254 Suponga que la pérdida esperada de una cartera de crédito es 4 millones de dólares.
Queremos estimar la probabilidad de obtener pérdidas mayores a 12 millones. Lo único que tenemos
es el valor esperado de la variables X que representa la pérdida de la cartera. Una carcterística
típica del riesgo de crédito es que no hay ganancias. Es decir, la pérdida por riesgo de crédito solo
contabiliza lo que se pierde debido a impagos. Las ganancias de la cartera debido al diferencial de
tasas, no se suman a la variable X; se contabilizan en otros rubros. Todo esto lo que signi…ca es
que la variable X nunca es negativa y podemos usar la desigualdad de Markov. Se obtiene
E [X] 4 1
P [X 12] = = :
12 12 3
Cuando el momento de orden p de X es …nito, se obtiene el siguiente corolario de la desigualdad
de Markov.
p
Lema 13 Si E jXj existe y a > 0 se tiene
p
E jXj
P [jXj a] :
ap
S. Cambronero 161
En efecto, observe que

p
P [jXj a] = P [jXj ap ] :
p
Basta entonces aplicar la desigualdad de Markov a la variable jXj ; la cual nunca es negativa. De
2
manera similar, aplicando Markov a la variable jX j se obtiene:
2
Ejemplo 255 (Desigualdad de Chebyshev) Si X tiene media y varianza se tiene
2
P [jX j a] :
a2
Ejemplo 256 En el ejemplo anterior, suponga que además se sabe que la varianza de X es 3:
Entonces
3
P [X 12] = P [X 4 8] P [jX 4j 8] = 0:04 687 :::
82
Esta cota es bastante mejor que la obtenida en el ejemplo anterior. Si se conociera que por ejemplo
el momento centrado de orden 4 es
4
E (X 4) = 7
se obtiene h i
4 7
P [X 12] P jX 4j 84 = 0:0017:::
84
Una interesante aplicación de la desigualdad de Chebyshev es la siguiente.
Ejemplo 257 Si X tiene varianza nula entonces X es constante. En efecto, si = E [X] se tiene
1
P jX j n2 V (x) = 0:
n
1
Es decir, si An = jX j n se tiene P (An ) = 0 para todo n 2 N. Dado que
1
[
A = [jX j > 0] = An
n=1
y los An forman una familia creciente, se tiene
P (A) = lim P (An ) = 0:
Consecuentemente P [X = ] = 1:
8.2 La ley débil de grandes números

Los teoremas sobre límites de variables aleatorias que veremos a continuación, se re…eren a prome-
dios de variables aleatorias i.i.d. Es decir, se consideran variables aleatorias
X1 ; X 2 ; : : :
que son independientes y con una misma función de distribución F: Consideramos la suma de las
primeras n variabls, digamos
Sn = X 1 + : : : + X n :
S. Cambronero 162
Si es la media común de las variables Xn se sigue que E [Sn ] = n : Luego

Sn
E = 0:
n
Intuitivamente, si repetimos el experimento n veces y promediamos los resultados, dicho promedio
empírico debe converger a cuando n ! 1: La versión teórica del promedio empírico (o media
empírica) es precisamente la variable aleatoria Snn : El primer resultado es una consecuencia directa
de la desigualdd de Chebyshev.
Teorema 7 (Ley débil de grandes números) Si X1 ; X2 ; : : : son i.i.d de media y varianza …nita,
para todo a > 0 se tiene
X1 + : : : + Xn
P a !0
n
y equivalentemente
X1 + : : : + Xn
P < a ! 1:
n
En efecto, por independencia se tiene
n
Sn 1 X 1 2
2
V = 2
V (Xk ) = 2 n = :
n n n n
k=1
Luego, por la desigualdad de Chebyshev se tiene

2
X1 + : : : + Xn
P a ! 0:
n na2
Ejemplo 258 Se lanza una moneda n veces. La probabilidad de que la proporción de escudos esté
entre 0:4 y 0:6 es tan cercana a 1 como se desee, para n su…cientemente grande. En efecto, sea
Xk = 1 cuando el k ésimo lanzamiento resulta escudo, y Xk = 0 en caso contrario. Entonces la
proporción de escudos es Snn y por la ley débil de grandes números se tiene
Sn 1 1
P ! 0:
n 2 10
Mejor aún, si aplicamos la desigualdad de Chebyshev directamente se obtiene
1
Sn 1 1 4 25
P = :
n 2 10 1 2 n
n 10
Si por ejemplo queremos que esta probabilidad sea menor que 0:05; basta que
25
n> = 500:
0:05
Consecuentemente
Sn Sn 1 1
P 0:4 < < 0:6 = P < 1 0:05 = 0:95
n n 2 10
para n > 500: En 50 lanzamientos, estamos 95% seguros de que la proporción de escudos estará
entre 0:4 y 0:6:
S. Cambronero 163
De…nición 19 Decimos que una sucesión de variables (Xn ) converge a una variable X en medida,
si para cada " > 0 se tiene
P [jXn Xj "] ! 0:
1
Ejemplo 259 Considere la sucesión de variables (Xn ) ; donde Xn = n (constante). Dado " > 0;
para n > 1" se tiene
1
P [jXn 0j "] = P >" =0!0
n
es decir Xn ! 0 en medida.
La ley débil de grandes números dice que Snn converge a la variable constante en medida, siempre
que X1 ; X2 ; : : : sea una sucesión de variables i.i.d.
8.3 El lema de Borel –Cantelli

Dada una sucesión de eventos A1 ; A2 ; : : : nos preguntamos por el evento
A = fAn in…nitas vecesg = focurren in…nitos A0n sg :
Un elemento muestral pertenece al conjunto A si pertenece a un número in…nito de eventos An :
Ejemplo 260 Suponga que se tira una moneda in…nitas veces. Se de…ne
An = fsale escudo en el lanzamiento ng :
Entonces
A = fsale escudo in…nitas vecesg :
Si por el contrario se tiene An = fsale escudo en los primeros n lanzamientosg entonces
A = fsale escudo todas las vecesg :
Se invita al lector a convencerse de la veracidad de estas a…rmaciones.
El siguiente resultado demuestra que si las probabilidades P (An ) decrecen muy rápido, entonces
hay probabilidad nula de que se de un número in…nito de estos eventos.
P
Lema 14 (Borel Cantelli) Suponga que para la sucesión de eventos (An ), la serie P (An ) con-
verge. Entonces el evento
A = fAn in…nitas vecesg
tiene probabilidad cero.
En efecto, denotemos
1
[
Bn = Ak = fse da al menos un evento Ak con k ng :
k=n
Gracias al teorema 2 se tiene

1
X
0 P (Bn ) P (Ak ) :
k=n
S. Cambronero 164
Como el lado derecho es la cola de una serie convergente, converge a 0 cuando n ! 1: Por la ley
del emparedado se obtiene
P (Bn ) ! 0:
Dado que (Bn ) es una sucesión decreciente de eventos cuya intersección es A se tiene, por la
continuidad de las medidas de probabilidad
P (A) = lim P (Bn ) = 0:

n!1
Ejemplo 261 Suponga que se lanza una moneda in…nitas veces. Se de…ne Xk = 1 si en el lan-
zamiento k se obtiene escudo, en caso constrario Xk = 1: Entonces EXk = 0 y V (Xk ) = 1: Se
de…ne Sn = X1 + : : : + Xn y h ni
An = jSn j > :
3
Por la desigualdad de Chebyshev se tiene
h ni 9
P (An ) = P jSn 0j >
3 n2
P
Por el critrio de comparación se tiene que la serie P (An ) converge, así que
h n i
P jSn j > i:v: = 0:
3
Entonces, con probabilidad 1 se tiene que
Sn 1
eventualmente.
n 3
8.4 Ley fuerte de grandes números

La idea del ejemplo anterior se puede depurar para obtener que, con probabilidad 1;
Sn
" eventualmente
n
donde " > 0 es arbitrario. Eso precisamente signi…ca que

Sn
!0
n
con probabilidad 1: La ley fuerte establece esto de una manera más general, para cuanquier dis-
tribución. Primero consideremos la siguiente de…nición.
De…nición 20 Decimos que Xn ! X casi siempre, o casi seguramente (c.s.) si P [Xn ! X] = 1:
La convergencia casi segura es más fuerte que la convergencia en medida. Es decir, si Xn ! X casi
siempre, entonces Xn ! X en medida. Sin embargo, existen sucesiones de variables que convergen
en medida pero no convergen c.s.
S. Cambronero 165
Ejemplo 262 Considere una variable U uniforme en (0; 1) : Considere la sucesión de variables
de…nidas por
Xk = 1( k n2n ; k+1n 2n ) (X) ; k = 2n ; : : : ; 2n+1 1:
2 2
Esta sucesión converge a 0 en medida pero no en forma casi segura. En efecto, nótese que para
">0
k 2n k + 1 2n 1
P [jXk j > "] P [jXk j > 0] = P n
<X< = n ! 0:
2 2n 2
Sin embargo, note que
P [Xk ! 0] = 0:
Teorema 8 (Ley fuerte de grandes números) Si X1 ; X2 ; : : : son variables i.i.d. con media se
tiene
X1 + : : : + Xn
lim = casi siempre.
n!1 n
Es decir
X1 + : : : + Xn X1 + : : : + Xn
P ! = P lim = = 1:
n n!1 n
Ejemplo 263 Tiramos la moneda n veces. Con probabilidad 1; para n su…cientemente grande la
media empírica está tan cerca como queramos de 21 :
Este resultado es de suma importancia para efectos de estimación. En efecto, suponga que se
realiza un experimento cuyo resultado es una variable aleatoria de la cual no conocemos la media.
Llamando a esta media ; la ley fuerte dice que con probabilidad 1 la media empírica converge a
: Basta entonces repetir el experimento un número grande de veces y observar el valor al cual
se acerca la media empírica.
Ejemplo 264 Suponga que cada día el tipo de cambio sufre una caída con probabilidad p; inde-
pendientemente de los demás días. De acuerdo con la ley fuerte de grandes números se tienen
que
X1 + : : : + Xn
! E [X1 ] = p
n
donde Xk = 1 si se presenta una caída en el día k y Xk = 0 en caso contrario.
Ejemplo 265 (sumas de Riemann aleatorias) Vamos a calcular una integral de Riemann usando
simulación. Para empezar, suponga que queremos calcular
Z 1
g (x) dx
0
donde g es una función bien portada. Consideramos una sucesión
U1 ; U2 ; : : :
de variables i.i.d. uniformes en (0; 1) : Entonces las variables
g (U1 ) ; g (U2 ) ; : : :
S. Cambronero 166
son también i.i.d, de media

Z 1 Z 1
= E [g (Un )] = g (x) fUn (x) dx = g (x) dx:
1 0
De acuerdo con la ley fuerte de grandes números se tiene

Z 1
g (U1 ) + : : : + g (Un )
! = g (x) dx:
n 0
Bastará entonces con generar una muestra grande de escalares u1 ; : : : ; un uniformemente distribui-
dos en (0; 1) y promediar los valores g (uk ). Es decir
Z n n
1
1X X
g (x) dx = lim g (uk ) = lim g (uk ) x:
0 n!1 n n!1
k=1 k=1
donde x = n1 : La última expresión fue escrita para observar que nuestra aproximación puede
interpretarse como una suma de Riemann, con la particularidad de que uk no se escoge en el
intervalo Ik = nk ; k+1
n ; sino que se genera en forma aleatoria.
8.5 Teorema del límite central

2
Como observamos arriba, si X1 ; X2 ; : : : son variables i.i.d. con media y varianza se tiene
2
E [Sn ] = n ; V (Sn ) = n:
Al dividir por n se produce, en el límite, una variable constante o degenerada en el punto : En

particular cuando = 0 se obtiene Snn ! 0 c.s. Si en vez de dividir por n estandarizamos la
variable Sn , es decir si consideramos
Sn n
p ;
n
nos preguntamos qué pasará con el límite. La respuesta es que esta variable estandarizada converge
a una normal estándar pero en el sentido de distribución. Es decir, la distribución de esta variable
se acerca a la de una normal conforme n crece a in…nito. Es importante enfatizar que no importa
la distribución común de las variables Xn ; solo se requiere que tenga media y varianza …nitas.
Teorema 9 (del límite central) Considere X1 ; X2 ; : : : sucesión de variables i.i.d. con media y
varianza 2 : Para la suma Sn = X1 + : : : + Xn se tiene
Sn n
p ! N (0; 1)
n
en distribución. Es decir, para cada x 2 R se tiene
Z x
Sn n 1 1 2
P p x ! (x) = p e 2u du:
n 2 1
Grá…camente, si repetimos un experimento en forma independiente n veces y dibujamos un his-

tograma con los resultados estandarizados, entonces conforme n crece este histograma se parece
cada vez más a la campana de Gauss.
S. Cambronero 167
Ejemplo 266 En una cartera de crédito hay 700 clientes. Cada cliente cae en impago en cierto
periodo, en forma independiente, con probabilidad 0:015: El número de impagos es una variable
binomial X de parámetros n = 700 y p = 0:015: El número esperado de impagos es
E [X] = np = 10:5
Nos interesa aproximar la probabilidad de que el número de impagos esté entre 8 y 14, es decir
P [8 S 14] ;
donde S es el número de impagos. Recordemos que S la podemos ver como una suma de variables
2
i.i.d. tipo Bernoulli, donde = 0:015 es la media común y 2 = 0:015 (0:015) = 0:01477 ::: es
la varianza común. Es decir
S = S700 = X1 + : : : + X700
y por el teorema del límite central, la variable
S 700 S 10:5
p =
700 3:2154
tiene una distribución aproximadamente normal. En principio se puede proceder así
8 10:5 S 10:5 14 10:5

P [8 S 14] P
3:2154 3:2154 3:2154
14 10:5 8 10:5
3:2154 3:2154
0:802 38
Dado que la distribución que queremos aproximar toma solo valores enteros, en la práctica se
acostumbra aproximar de la siguiente manera
8:5 10:5 S 10:5 14:5 10:5

P [8:5 < S 14:5] P
3:2154 3:2154 3:2154
14:1 10:5 8:1 10:5
3:2154 3:2154
0:771 21
8.6 Ejercicios
1. En una hoja de excel, genere 3000 escenarios de una variable uniforme en (0; 1) que le
permitan aproximar las siguientes integrales
Z 1 Z 1 Z 1 Z 1
dx x2 dx dx
4
; e dx; p ; 2+
p :
0 1 + x 0 0 1 + x 0 1 + x x
2. Cada día el tipo de cambio tiene una caída con probabilidad 0:12 independientemente de lo
que ocurra los demás días. Aproximar la probabilidad de que en un año calendario, el tipo
de cambio caiga entre 30 y 40 veces.
S. Cambronero 168
3. Sea X una variable aleatoria con distribución N ; 2 : Use la desigualdad de Chebyshev

para estimar el valor mínimo de k de tal modo que la probabilidad de que X tome un valor
entre k y + k sea, al menos, 0.95.
4. Escriba la cota que se obtiene para P [X a] al aplicar la desigualdad de Markov a una
variable X de distribución exponencial de parámentro : Escriba la cota correspondiente al
aplicar Chebyshev, para P X 1 a :
5. Repita el ejercicio anterior con una distribución de Poisson.
6. Lanzamos un dado n veces. Hallar el número de lanzamientos necesarios para que el promedio
de los resultados observados esté entre 3 y 4 con probabilidad 0:99:
7. Se recomienda resolver los ejercicios del libro de Ross, capítulo 8.

Apuntes Probabilidad Santiago

Hochgeladen von

Dokumentinformationen

Originalbeschreibung:

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Apuntes Probabilidad Santiago

Hochgeladen von

Copyright:

Verfügbare Formate

Contenidos

2 Espacios de probabilidad discretos 22

3 Teoría general de probabilidades 47

5 Otras distribuciones continuas 112

6 Distribuciones conjuntas 120

7 Correlación y transformaciones 133

1.2 Sumas …nitas

1.2.1 Ejemplos de sumatorias

Ejemplo 2 Para ak = c (una constante) se tiene

En efecto, nótese que

En general, este mismo argumento demuestra que

Ejemplo 4 Para calcular la suma 15 + 16 + : : : + 27 se puede escribir

1.2.2 Propiedades de las sumatorias

Esta propiedad es una generalización de la conmutatividad de la suma. En efecto, se puede

3. Si para cada k se tiene ak bk ; entonces

4. Dados a0 ; : : : ; an+1 2 R se tiene

Ejemplo 6 Para calcular la suma

Ejemplo 7 Para calcular la suma

1.2.3 Suma telescópica

donde todos los términos intermedios se cancelan. En genral se tiene

Dado que el lado izquierdo es una suma telescópica, se tiene:

donde se ha usado el ejemplo 6. Despejando se obtiene:

Procediendo como en el ejemplo anterior, se puede deducir que en general

Ejemplo 10 De acuerdo con la fórmula anterior se tiene

1.2.4 Suma geométrica

Observando que rk rk+1 = (1 r) rk ; la suma del lado izquiedo se puede escribir

siempre que r 6= 1: Esta es la suma geométrica de razón r:

xn+1 an+1 = (x a) xn + axn 1

En efecto, basta tomar x = 1; a = r. Rigurosamente hablando, nuestro argumento de arriba es en

Siguiendo este proceso, después de 96 meses la deuda se reduce a

8. Calcule las sumas:

(a) seis meses

(a) seis meses

1.3 Principios de combinatoria

Note que la respuesta del ejemplo anterior se puede escribir

Ejemplo 17 Se desea crear un portafolio con una inversión de 15 millones en un instrumento, 12

En general, si de n objetos se deben escoger k en forma ordenada, existen

maneras de hacerlo. En particular, el número de permutaciones de n objetos es n!.

maneras de escoger las tres personas.

Este ejemplo se puede resumir y generalizar de la siguiente manera:

maneras de hacerlo. Compare con el ejemplo 17 donde el orden sí importaba.

1.3.4 Ejemplos adicionales

1.3.5 Portafolios, bolas y cajas

Figure 1.1: Distribución de bolas idénticas en cajas.

En general, si se quiere distribuir n bolas idénticas en m cajas, el número de maneras de hacerlo

posibles portafolios. Note que en este último caso no se requiere m n:

Ejemplo 32 Se quiere formar un portafolio con 11 acciones compradas de un total de 5 tipos de

1.3.6 La fórmula del binomio

Además, si se usa la fórmula (1.3) se obtiene por ejemplo

El triángulo de Pascal es particularmente útil en el desarrollo binomial

(a) ...no hay restricciones?

(a) ...no hay restricciones.

8. Considere el experimento de lanzar dos dados distintos.

(a) ¿Cuántos resultados posibles hay?

9. Una cartera de inversión consta de:

Determine el número de posibles rendimientos de la cartera, y cuál es el óptimo.

(a) Se debe invertir al menos un millón en cada instrumento

17. De un total de 9 bancos, hay 3 en estado normal, 4 en estado inde…nido y 2 en estado

(a) No se escogen Bancos en estado inde…nido

(a) El peor resultado posible para el jugador

19. Se dispone de 12 millones de colones para invertir en 3 de 20 instrumentos disponibles. Halle

(a) Se debe invertir 4 millones en cada uno de los tres instrumentos

(a) No hay restricciones