Sie sind auf Seite 1von 29

VARIABLES ALEATORIAS.

MODELOS MÁS HABITUALES

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 1 / 29


Variables aleatorias

Una variable aleatoria es una función X : Ω → R que a cada


elemento del espacio muestral le asigna un número.

Representa el resultado de interés en un experimento aleatorio.


Una v.a. se denota mediante una letra mayúscula (X , Y , . . . ) y
su valor numérico observado mediante minúsculas (x, y , . . . ).

Ejemplo: un experimento consiste en seleccionar a una persona


aleatoriamente y preguntarle si ha seguido o no una dieta. Una
variable aleatoria que representa el resultado es:

1, si la respuesta es afirmativa;
X =
0, si la respuesta es negativa.

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 2 / 29


Si A ⊂ R, es decir, un subconjunto del conjunto de posibles valores
de la variable, definimos

P(A) = P(X ∈ A) = P({ω ∈ Ω : X (ω) ∈ A}).

La función de distribución de una variable aleatoria X , se


define como:

F (x) = P(−∞, x]) = P({ω ∈ Ω : X (w ) ≤ x}).

Propiedades:
a) lı́mx→−∞ F (x) = 0.
b) lı́mx→∞ F (x) = 1.
c) Si x < y , entonces F (x) ≤ F (y ).
d) F es continua por la derecha.
() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 3 / 29
Un parámetro es un número que describe alguna caracterı́stica
de interés de una población o variable aleatoria.

Algunos parámetros que nos van a interesar en este curso son:


• La media, µ, de una variable.
• La desviación tı́pica, σ, de una variable y la varianza
poblacional, σ 2 .

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 4 / 29


Variables aleatorias discretas

Una variable aleatoria es discreta si toma un número finito de


valores o una sucesión (numerable) de valores x1 , x2 , x3 , . . . .

La distribución de probabilidad de una v.a. discreta X queda


caracterizada por la función de masa de X :

P(x) = P(X = x),

siendo x cualquier posible valor de X .


• Si X es la v.a. del ejemplo anterior, su función de masa es . . .
• ¿Cuál es la función de masa de la v.a. que representa el resultado de
tirar un dado?

La función de distribución de una v.a. discreta X tiene forma de


escalera. Los escalones están situados en los posibles valores de
X y la altura del escalón en el punto x es igual a P(x).
() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 5 / 29
Media y varianza de una v.a. discreta

Sea X es una v.a. discreta, que toma valores x2 , x2 , x3 , . . . con


probabilidades P(xk ) = pk , k = 1, 2, . . .

Se define la media o esperanza de X como


X
µ = E (X ) = xk P(xk ).
k

La varianza de X se define como


X
σ 2 = Var (X ) = (xk − µ)2 P(xk ).
k
p
La desviación tı́pica de X es σ = Var (X ).

Se cumple que Var (X ) = E (X 2 ) − E (X )2 .

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 6 / 29


Ejemplos: calcula la media y la varianza de X
(a) X es la v.a. que representa el resultado de tirar un dado.
(b) X toma los valores 0 y 1 con probabilidades 0,25 y 0,75,
respectivamente.
(c) X toma los valores 0 y 1 con probabilidades 1 − p y p,
respectivamente.

Propiedad. Dados a, b ∈ R, E(a + bX ) = a + b E(X ), mientras


que V(a + bX ) = b 2 V(X ).

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 7 / 29


Variables aleatorias continuas
Una v.a. es continua si puede tomar cualquier valor en un
intervalo (finito o infinito).

La distribución de una v.a. continua X está determinada por


una función de densidad f (x), que cumple
a) fR(x) ≥ 0, para todo x.
b) R f (x) dx = 1.
R
Para cualquier suceso A se cumple P(X ∈ A) = A f (x) dx.
Rx
Por tanto, F (x) = −∞ f .

La función de distribución F de una v.a. continua X es una


función continua y, en los puntos x en que es derivable, cumple
que F 0 (x) = f (x).

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 8 / 29


Media y varianza de una v.a. continua
Se define su media como
Z
µ = E (X ) = x f (x) dx.
R

Se define su varianza como


Z
σ = (x − µ)2 f (x) dx.
2
R
p
La desviación tı́pica de X es σ = Var (X ).

Var (X ) = E (X 2 ) − E (X )2 .

Dados a, b ∈ R, E(a + bX ) = a + b E(X ), mientras que


V(a + bX ) = b 2 V(X ).

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 9 / 29


Ejemplo

La proporción X de un cierto aditivo en la gasolina es una v.a. con


función de densidad

2x, si 0 ≤ x < 1,
f (x) =
0, si x ∈ / [0, 1].

Dibuja la densidad y calcula las siguientes probabilidades:


a) P(0 < X < 0,5).
b)P(X > 3).
c) P(X < 0,75).

Calcula su esperanza y su varianza.

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 10 / 29


La distribución de Bernoulli

Una prueba de Bernoulli consiste en un experimento aleatorio con


dos posibles resultados: éxito y fracaso.

Una v.a. de Bernoulli con parámetro p ∈ (0, 1) (proporción) es


aquella que toma el valor 1 (éxito) con probabilidad p y el valor 0
(fracaso) con probabilidad 1 − p.

P(X = 0) = 1 − p, P(X = 1) = p.

Tiene media E(X ) = p y varianza V(X ) = p(1 − p).

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 11 / 29


La distribución binomial
Realizamos n pruebas de Bernoulli independientes en que la
probabilidad de éxito es p. Consideramos la v.a. X = “número de
éxitos obtenidos en las n pruebas”. Se dice que es una variable
aleatoria binomial de parámetros n y p, y se denota
X ∼ B(n, p).

Ejemplo:
• ¿Qué valores puede tomar una v.a. B(10, 0,2)?
• ¿Cuánto valen P(X = 10), P(X = 0) y P(X = 1)?

Su función de masa es
 
n k
P(X = k) = p (1 − p)n−k para k = 0, 1, . . . , n.
k

Media E(X ) = np, varianza V(X ) = np(1 − p).

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 12 / 29


Variable geométrica

Se repite una prueba de Bernoulli y se para cuando se obtiene el


primer éxito. La variable aleatoria geométrica tiene como valor el
número de repeticiones del experimento.

Toma valores 1, 2, 3, . . .

P(X = k) = p (1 − p)k−1 para k = 1, 2, . . .


Media E(X ) = 1/p, varianza V(X ) = (1 − p)/p 2 .

(Nota: hay quien define la variable geométrica contando el número de


fracasos antes del primer éxito. Toma los valores 0, 1, 2, . . . con
probabilidades P(X = k) = p (1 − p)k para k = 0, 1, 2, . . . ; en este caso,
la media es E(X ) = (1 − p)/p y la varianza es V(X ) = (1 − p)/p 2 ).

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 13 / 29


Variable de Poisson
Una variable aleatoria de Poisson de parámetro λ > 0, cumple
λk
P(X = k) = e −λ para k = 0, 1, 2, . . .
k!
Se denota X ∼ P(λ)

Media E(X ) = λ, varianza V(X ) = λ.

La distribución de Poisson se usa para modelizar muchos procesos


en los que ocurren determinados sucesos por unidad de tiempo o
espacio:
• El número de errores en la transmisión de un código.
• El número de plaquetas en un ml. de sangre.

Propiedad. Cuando n → ∞, p → ∞ y np → λ,
B(n, p) → P(λ).

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 14 / 29


La distribución de Poisson
Datos de la liga 2008-09
Media de goles por partido y equipo: 1,446
Goles 0 1 2 3 4 5 6 7
Frecuencias 192 258 163 96 35 10 5 1
Poisson 178.98 258.81 187.13 90.2 32.61 9.43 2.27 0.47

Frecuencias
Poisson
0.30
0.25
0.20
0.15
0.10
0.05
0.00

0 1 2 3 4 5 6 7

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 15 / 29


Variable uniforme en el intervalo [a, b]

X ∼ U(a, b). Parámetros: a, b ∈ R, con a < b.

1
(
b−a si x ∈ [a, b],
fX (x) =
0 en el resto de los casos.



 0 si x < a,
x−a
FX (x) = b−a si x ∈ [a, b],

 1 si x > b.

Media E(X ) = (a + b)/2, varianza V(X ) = (b − a)2 /12.

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 16 / 29


Variable exponencial

X ∼ exp(λ). Parámetro: λ > 0.


0 si x < 0,
fX (x) =
λ e −λx si x ≥ 0.

(
0 si x < 0,
FX (x) =
1 − e −λx si x ≥ 0.

Media E(X ) = 1/λ, varianza V(X ) = 1/λ2 .

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 17 / 29


La distribución de Poisson se utiliza, por ejemplo, para modelizar:
• El tiempo de supervivencia o duración de un sistema biológico o
mecánico.
• El número de llamadas telefónicas recibidas por una centralita en
una unidad de tiempo.
• El número de mutaciones en un fragmento de ADN después de
una cierta cantidad de radiación.
• El número de erratas por página en un libro.

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 18 / 29


Distribución exponencial

2
λ=1/2
λ=1
densidad de la exp(λ)
1.5 λ=2

0.5

0
0 1 2 3 4 5
x

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 19 / 29


Ejemplo

Se ha comprobado que el tiempo de vida de cierto tipo de


marcapasos sigue una distribución exponencial con media de 16
años.
a) ¿Cuál es la probabilidad de que a una persona a la que se le ha
implantado este marcapasos se le deba reimplantar otro antes de
20 años?
b) ¿Cuál es la probabilidad de que el marcapasos que le han
implantado le dure más de 10 años?
c) Determina el tiempo T tal que la probabilidad de que el
marcapasos dure más que T es igual a la probabilidad de que dure
menos que T.
d) Compara el valor obtenido en el apartado anterior con la
duración media.

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 20 / 29


Distribución normal
Muchos histogramas tienen la siguiente forma aproximada:

0.4
0.3
Densidad

0.2
0.1
0.0

−3 −2 −1 0 1 2 3

I Simétrica alrededor de un valor central µ.


I A medida que los valores se alejan del centro las frecuencias
disminuyen rápidamente.
I La dispersión viene dada por la desviación tı́pica poblacional σ.
Los puntos de inflexión se sitúan en los valores µ − σ y µ + σ.

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 21 / 29


Variable normal

X ∼ N (µ, σ). Parámetros: µ ∈ R, σ > 0.


(x−µ)2 x 2
1 1
Z
1 1 (y −µ)
fX (x) = √ e− 2 σ2 , FX (x) = √ e− 2 σ2 dy .
σ 2π σ 2π −∞

Media E(X ) = µ, varianza V(X ) = σ 2 .

Regla 68-95-99. En una población con distribución N(µ, σ) :


a) Aproximadamente el 68 % de los datos está entre µ − σ y µ + σ.
b) Aproximadamente el 95 % de los datos está entre µ − 2σ y µ + 3σ.
c) Más del 99 % de los datos está entre µ − 3σ y µ + 3σ.

Caso particular, con nombre y notación especiales: Z ∼ N(0, 1), se


denomina normal estándar.
Tiene media E(X ) = 0 y varianza V(X ) = 1.

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 22 / 29


8.3. Distribución normal
La curva de densidad normal según µ y σ
µ=-1 µ=0 µ=1

σ=0.5

σ=1

σ=2

12

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 23 / 29


Estandarización

Si una v.a. X tiene distribución N(µ, σ), entonces la variable


estandarizada (o tipificada)

X −µ
Z=
σ
tiene distribución N(0, 1) (normal estándar).

Ejemplo: Sea X la v.a. que representa la cantidad diaria de kcal que


toma una persona elegida al azar en una población. Se sabe que la
población es normal con media µ = 2500 kcal y desviación tı́pica
σ = 100 kcal.
a) Calcula la probabilidad de que X esté entre 2300 y 2700 kcal.
b) Calcula la probabilidad de que X sea mayor que 2700 kcal.
c) Calcula la probabilidad de que X sea mayor que 2500 kcal.
d) Calcula la probabilidad de que X sea mayor que 2300 kcal.

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 24 / 29


Propiedades

Producto de una normal por una constante. Si X ∼ N(µ, σ) y


a ∈ R, entonces,
aX ∼ N(aµ, |a|σ).

Suma de v.a. normales independientes. Si X1 ∼ N(µ1 , σ1 ) y


X2 ∼ N(µ2 , σ2 ) y X1 y X2 son independientes, entonces,
q
X1 + X2 ∼ N(µ1 + µ2 , σ12 + σ22 ).

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 25 / 29


Relación entre la distribución binomial y la normal

p
Para valores grandes de n, B(n, p) ≈ N(µ = np, σ = np(1 − p)).

La aproximación es mejor cuanto mayor es n y el valor de p es más


cercano a 1/2.

Ejemplos:
a) Al lanzar una moneda 500 veces, calcula la probabilidad
aproximada de obtener entre 250 y 265 caras.
b) La prevalencia de cierta infección en una poblaci’on es del 20 %. En
un estudio se analizan 200 individuos. ¿Con qué probabilidad se
obtendrán entre 30 y 40 individuos infectados en esta muestra?

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 26 / 29


Relación entre la distribución binomial y la normal
n=5 n=5 n=5

0.4

0.00 0.10 0.20 0.30


0.3
0.4

0.2
0.2

0.1
0.0

0.0
p = 0.1 p = 0.2 p = 0.4

n = 20 n = 20 n = 20

0.20

0.00 0.05 0.10 0.15


0.20

0.10
0.10
0.00

0.00

p = 0.1 p = 0.2 p = 0.4

n = 50 n = 50 n = 50
0.00 0.04 0.08 0.12
0.00 0.05 0.10 0.15

0.08
0.04
0.00
p = 0.1 p = 0.2 p = 0.4

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 27 / 29


Relación entre la distribución de Poisson y la normal

Para valores grandes de λ,



P(λ) ≈ N(λ, λ).

Cuanto mayor es el valor de λ, mejor es la aproximación.

Ejemplo: Supongamos que X es una v.a. con distribución de Poisson


de parámetro λ = 29. Determina el valor aproximado c tal que
P(29 − c < X < 29 + c) ≈ 0,95.

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 28 / 29


Relación entre la distribución de Poisson y la normal

0.10
0.15
0.30

0.08
0.06
0.10
0.20

0.04
0.05
0.10

0.02
0.00

0.00

0.00
λ=1 λ=5 λ = 15

0.12
0.25

0.08
0.10
0.20

0.06
0.08
0.15

0.06

0.04
0.10

0.04

0.02
0.05

0.02
0.00

0.00

0.00
λ=2 λ = 10 λ = 20

() VARIABLES ALEATORIAS. MODELOS MÁS HABITUALES 29 / 29

Das könnte Ihnen auch gefallen