Sie sind auf Seite 1von 84

DISTRIBUCIONES

DISCRETAS DE
PROBABILIDAD

1
CAPACIDADES
Al finalizar la Sesión 5, el participante será
capaz de:
1. Identificar las distribuciones de probabilidad
que más se utilizan en la toma de
decisiones.
2. Utilizar el concepto de valor esperado para
la toma de decisiones.
3. Mostrar cuál distribución de probabilidad
utilizar, y como encontrar sus valores.
4. Comprender las limitaciones de cada una
de las distribuciones que utilice.
©
JCó
rdo
2 va
5. Distribuciones discretas
-¿Qué tal van las clases,
Litman? Me pregunta mi
barbero.
-Bien... Dando probabilidad
y estadística... Respondo.
-¡Ah! Probabilidad... Yo
suelo jugar a la lotería...
Dice mientras me pasa la
cuchilla.
-Cuando compro un número, tal y como yo lo veo, hay dos
posibilidades: ganar o perder. De modo que tengo un 50% de
probabilidad de ganar y un 50% de perder.
-¡Muy bien, Ricardo! Respondo, mientras pienso que no es bueno
contradecir a nadie que tenga una navaja en mi cuello... 3
Distribución de Bernoulli
 Hay un cierto número de fenómenos aleatorios
conocidos como procesos de Bernoulli.
 Se denominan ensayos de Bernoulli, a aquellos
ensayos independientes que repetidos un número
fijo de veces tienen las siguientes características:
1) Hay sólo dos resultados posibles: éxito o fracaso:
2) La probabilidad de éxito es la misma en cada
ensayo. Independencia.
Ensayos de Bernoulli
 Tirar una moneda, suponiendo que la moneda
es perfecta, cada tirada se denomina un ensayo
y tiene dos posibles resultados: uno de ellos se
considera éxito. P[E] = p ; y P[F] = q
 Extraemos de una urna con 4 bolas rojas y 3
azules una bolilla; anotamos su color y la
devolvemos a la urna. P(roja)=4/7 y P(azul)=3/7.
 Proceso de fabricación de artículos
electrónicos: elección de una muestra,
defectuoso o no defectuoso.
Distribución de Bernoulli
Experimento de Bernoulli:
solo son posibles dos
resultados: éxito o fracaso.
Podemos definir una variable
aleatoria discreta X tal que:

éxito  1
fracaso  0

El espacio muestral para este tipo


de ensayo es : Ω = { E, F }

6
Distribución de Bernoulli
Experimento de Bernoulli:

Si la probabilidad de éxito es p y la de fracaso


[(1 – p) = q], podemos construir una función de
probabilidad:
1 x
f ( x)  p (1  p)
x
x  0,1
Un típico experimento de Bernoulli es el lanzamiento de
una moneda con probabilidad p para cara y (1-p) para
sello.

7
1 x
P( X  x)  f ( x)  p (1  p)
x
x  0, 1
x 0 1
f(x) q p

Función de distribución:

1  p, para x  0
F ( x)  
 1, para x  1
8
Ejercicio: Calcular la esperanza y la varianza
de la distribución de Bernoulli.
1
E[ X ]     x P ( X  x ) 
x 0

0 * f (0)  1 * f (1)  0  p  p

1
Var ( X )  E[ X ]  ( E[ X ])   x f ( x)  p
2 2 2 2

x 0

 [0 * f (0)  1 * f (1)]  p 
2 2 2

p  p  p (1  p )  p * q
2

9
Distribución binomial
La distribución binomial aparece cuando estamos
interesados en el número de veces que un suceso
A ocurre (éxitos) en n intentos independientes de
un experimento.
P. ej.: # de caras en n lanzamientos de una moneda.

Si A tiene probabilidad p (probabilidad de éxito)


en un intento, entonces 1-p es la probabilidad de
que A no ocurra (probabilidad de fracaso).

10
Experimento aleatorio: n = 3 lanzamientos de una moneda.
Probabilidad de éxito en cada lanzamiento (cara) = p.
Probabilidad de fracaso en cada lanzamiento (sello) = 1- p = q.

3 p 2 (1  p)

3 p(1  p) 2

11
Supongamos que el experimento consta de n
intentos y definamos la variable aleatoria:

X = Número de veces que ocurre A.


En nuestro ejemplo: X = Número de veces que sale cara.

Entonces X puede tomar los valores 0, 1, 2, ... n.

12
La función de probabilidad P(X = x) será
la distribución binomial:

n x n x n! n x
B(n, p)  p( x)    p (1  p)  p (1  p)
x

 x x!(n  x)!

Distribución binomial para n = 5 y


distintos valores de p, B(5, p)

13
14
Ejercicio 1:
¿Cuál es la probabilidad de que en una familia de 4
hijos exactamente 2 sean niñas?

n x
p(x)    p ( 1  p)n  x
 x
p  0.5; n  4; x  2
 4
 
p( 2 )    ( 0.5 ) ( 1-0.5 )
2 4- 2

 2

15
6-21

EJEMPLO 3
 La Secretaría del Trabajo del estado de
Alabama reporta que 20% de la fuerza de
trabajo en Mobile está desempleada. De
una muestra de 15 trabajadores, calcule las
siguientes probabilidades con la fórmula de
la distribución binomial (n=15, p = 0,20):
 tres están desempleados: P(x = 3)= f(3):
P(x=3)=
6-22

EJEMPLO 3 continuación

 Nota: éstos también son ejemplos de


distribuciones probabilísticas acumulativas:
tres o más están desempleados:
P(x  3)= .250 +.172 +.086 +.032
+.009 +.002=.551
al menos un trabajador está desempleado:
P(x  1) = 1 - P(x=0) =1 - .044 = .956
a lo más dos trabajadores están desempleados:
P(x  2)= 0,044 + 0,154 + 0,250
= 0,448
6-23

Media y variancia de la distribución


binomial
 La media está dada por:

  n
 La variancia está dada por:

  n  (1   )
2
6-24

EJEMPLO 4
 Del EJEMPLO 3, recuerde que  = 0.20 y n=
15.

 Así, la media = n  = 15(0.20) = 3

 La variancia = n  (1 -  ) = (15)(.2)(.8) =2.4.


6-21

EJEMPLO 5
 A la larga, el 20% de los gerentes que reciben
capacitación obtienen la calificación de
sobresaliente, el 50% de aceptable y el 30% la
de insatisfactorio. En una muestra de 20
gerentes seleccionados al azar, encuentre las
siguientes probabilidades:
Exactamente 4 gerentes son calificados con sobresaliente
Al menos 4 gerentes son calificados con sobresaliente
Exactamente 15 gerentes son calificados con sobresaliente o
aceptable
Al menos 15 gerentes son calificados con sobresaliente o
aceptable
6-21

EJEMPLO 5

Exactamente 4 gerentes son calificados con


sobresaliente 0,2182
Al menos 4 gerentes son calificados con
sobresaliente: 0,5886
Exactamente 15 gerentes son calificados con
sobresaliente o aceptable 0, 1789
Al menos 15 gerentes son calificados con
sobresaliente o aceptable 0,4163
Ejercicio:
Si una décima parte de personas tiene cierto grupo
sanguíneo, ¿cuál es la probabilidad de que entre 100
personas escogidas al azar exactamente 8 de ellas
pertenezcan a este grupo sanguíneo?

n x n x
 
p(x)    p ( 1  p)
 x
p  0.1; n  100; x  8
100 
p( 8 )    ( 0.1 )8( 1-0.1 )92
 8 

22
¿Y si la pregunta es 8 como máximo?

8
n x
p(x  8 )     p ( 1  p)n  x
x 0  x 

8
100 
   (0.1) x ( 0.9 )100 x
x 0  x 

23
Calcula la probabilidad de obtener al menos dos seises al
lanzar un dado cuatro veces.

 n  k nk
P(k )    p q (k  0,1,....n)
k 
p = 1/6, q = 5/6, n = 4

Al menos dos seises, implica que nos valen k = 2, 3, 4.


P(2) + P(3) + P (4)

 4  1   5   4  1   5   4  1 
2 2 3 4

               


 2  6   6   3  6   6   4  6 
1 171
 4 (6  25  4  5  1)   0.132
6 1296
24
Ejercicio:
Supongamos que la probabilidad de encontrar una estrella
de masa m* >10 M en un cúmulo estelar joven es del 4%.
¿Cuál es la probabilidad de que en una muestra escogida al
azar, entre 10 miembros del cúmulo encontremos 3 estrellas
con m* >10 M?
n x
p(x)    p ( 1  p)n  x
 x
p  0.04; n  10; x  3
10 
p( 3 )    ( 0.04 ) ( 1-0.04 )  0.043 0.967  0.006
3 10- 3

3

25
Chuck-a-luck: Elige un número entre 1 y 6. Lanzas 3 dados.
Si el número que has elegido sale en los 3 dados cobras
3 euros. Si sale en 2 cobras 2 euros. Si sale en un dado
cobras 1 euro. Y si no sale en ninguno, pagas 1 euro.
¿Es un juego justo?

 3  1   3  1 
3 0 2
5 5
        3      2
 3  6  6  2  6  6
 3  1   3  5 
1 2 3
5
      1      (1)  0.08
 1  6  6  0  6 

26
Características de la distribución
binomial
Media
= E(X) = n p P(X) n = 5 p = 0.1
.6
= 5 · 0.1 = 0.5 .4
.2
= 5 · 0.5 = 0.25 0 X
0 1 2 3 4 5

Desviación estándar
P(X) n = 5 p = 0.5
  np(1  p) .6
.4

  5  0.1 (1  0.1)  0.67 .2


0 X

  5  0.5  (1  0.5)  1.1 0 1 2 3 4 5


27
28
Número más probable de repeticiones de sucesos

El valor más probable x0 de X (moda), es aquel que


satisface una doble desigualdad:

n p - (q) ≤ xo ≤ np +p

29
3. De un lote de 24, se selecciona al azar 4 artículos, además se
conoce que el 20% de los artículos producidos resultan
defectuosos. Sea X la variable aleatoria que denota al número de
artículos defectuosos elegidos.

a. Construir la función de cuantía para la variable aleatoria X


b. Dibujar la Función de Distribución de probabilidades
acumuladas
c. Hallar el valor de x más probable y el esperado de X

30
Distribución multinomial
Cuando hay más de dos acontecimientos posibles (A1, A2,
A3 ...) con probabilidades p1 , p2 , p3 ... constantes y

 pi  1
tales que:

n! x1 x2 x3
p( x1 , x2 , x3 ...)  p1 . p2 . p3 ....
x1!x2 !x3!..

31
Un método de diagnóstico tiene 3 resultados posibles:
positivo (P), negativo (N) y dudoso (D). Se sabe que, en la
población, el 10% de los sujetos son positivos, el 70%
negativos y el resto dudosos. ¿Qué probabilidad hay de, en
una muestra de 5 individuos, obtener exactamente 1 positivo,
1 negativo y 3 dudosos ?

5!
p(1,3,1)  0.1  0.7  0.2  0.0112
1 1 3

1!.3!.1!

32
Distribución Geométrica
Consideremos el siguiente experimento:
Partimos de un experimento de Bernoulli donde la
probabilidad de que ocurra un suceso es p (éxito) y
la probabilidad de que no ocurra: q = (1- p) (fracaso).

Repetimos nuestro experimento hasta conseguir el primer


éxito. Definimos la variable aleatoria X, como el número
de ensayos hasta que se obtiene el primer éxito.
Entonces:

Rx = {1, 2, 3, ………..}
El espacio muestral tiene la siguiente forma:
Ω = {E, FE, FFE, FFFE, FFFFE, . . . . . .}

El número de ensayos no es fijo


33
Distribución Geométrica

Repetimos nuestro experimento hasta conseguir el primer


éxito. Definimos la variable aleatoria X, como el número
de ensayos hasta que se obtiene el primer éxito.
Entonces:

f ( x)  P( X  x)  p 1  p  ,
x 1

x  1, 2 , 3, . . .

34
p(x)
f ( x)  P( X  x)  p 1  p  ,
x 1

x  1, 2, ...

Función de distribución:

0 ; x<1
F(x) =
1–qx ; x ≥ 1

35
Esperanza y Varianza

1
E [ x]  µ   
 p

 q 
Var [ x]   2 
p 

36
Ejemplo
• Considere una sucesión de lanzamientos
independientes de dos dados. Si x
representa el número de lanzamientos
hasta encontrar suma 7, determinar el
número esperado de lanzamientos hasta
conseguir suma 7

37
38
Un acontecimiento ocurre, en la población, en el 10% de los
casos. ¿Qué tamaño de muestra debo tomar para tener una
probabilidad del 95% de obtener al menos un éxito ?

n
q 1
n
0.95   pq x 1
 p.
x 1 q 1

0.9n  1
0.95  0.1.  0.95  (0.9n  1)  0.95  0.9n  1
0.9  1
ln 0.05
 0.05  0.9  ln 0.05  n ln 0.9  n 
n
 28.4  29
ln 0.9

39
Distribución binomial negativa
(de Pascal o de Pólya)
Consideremos el siguiente experimento:
Partimos de un experimento de Bernoulli donde la probabilidad
de que ocurra un suceso es p (éxito) y la probabilidad de que
no ocurra q = 1- p (fracaso). Repetimos nuestro experimento
hasta conseguir el r-ésimo éxito. Definimos la variable
aleatoria X, como el número de fracasos x hasta que se
obtiene el r-ésimo éxito. Entonces:
El último tiene que ser un éxito.

 x  r  1 r
BN (r , p)  P( X  x)    p 1  p  ,
x

 x 
x  0,1, 2, ...
Se denomina binomial negativa porque los coeficiente provienen de
la serie binomial negativa: p -x  ( 1-q)-x 40
Distribución binomial negativa
(de Pascal o de Pólya)

La distribución binomial negativa también se puede definir


como el número de pruebas x hasta la aparición de r éxitos.
Como el número de pruebas x, en este caso, contabiliza
tanto los éxitos como los fracasos se tendría según ésta
definición que:

 x  1 r
BN (r , p)  P( X  x)    p 1  p  ,
xr

 r  1
x  r, r  1, r  2, ...

41
Disponemos de una moneda trucada con probabilidad de cara
igual a p=0.25. La lanzamos hasta que obtenemos 2 caras.
La distribución del número de lanzamientos x será:

 x  1
BN (r  2, p  0.25)  P( X  x)   0.25 1  0.25 ,
2 x2

 2  1
x  2,3, 4, ...

P(x)

x 42
Propiedades de la distribución
geométrica

• La distribución geométrica es decreciente


• La distribución geométrica, no tiene
memoria: P[X > (x + r) / X > r] = P[ X > x];
la distribución geométrica es la única
distribución discreta con esta propiedad.

43
Elegir al azar con reemplazo
Elegir al azar con reemplazo significa que escogemos al azar
un elemento de un conjunto y lo regresamos para elegir de nuevo
al azar. Esto garantiza la independencia de las elecciones y nos
lleva a una distribución binomial.

Si una caja contiene N bolas de las cuales A son rojas, entonces


la probabilidad de escoger al azar una bola roja es: p = A/N.

Si repetimos el experimento sacando n bolas con reemplazo la


probabilidad de que x sean rojas es:
n x
 n  A 
x
 A
P( x)     1   ( x  0,1,....n)
 x  N   N
(Una distribución binomial) 44
Elegir al azar sin reemplazo

Elegir al azar sin reemplazo significa que no devolvemos


el elemento elegido al azar al conjunto. De modo que las
probabilidades de la siguiente elección dependen de las
anteriores.
Si repetimos el experimento anterior sacando n bolas sin
reemplazo, ¿cuál será ahora la probabilidad de que x sean
rojas?
N
Casos posibles   
n
Para calcular los casos favorables observa que:
N = A + (N – A). De las A bolas rojas tomaremos x y de
las N – A bolas no rojas tomaremos n – x.
45
Distribución hipergeométrica
Fenómeno aleatorio: El fenómeno aleatorio que define el
modelo hipergeométrico, se caracteriza:

a. Por ser un e.a., que consiste en efectuar n pruebas no


independientes de Bernoulli. (La probabilidad de éxito no se
mantiene constante a través de los n intentos, se modifica en cada
prueba ejecutada).
b. Por ser un e.a., que consiste en extraer una m. a., de
tamaño n, una a una, sin reposición, de una población
finita de tamaño N, particionada en dos clases,
arbitrariamente llamadas la clase de los éxitos (con A
elementos) y la clase de los fracasos con N-A elementos.

46
Distribución hipergeométrica
 A
   diferentes formas de tomar x bolas rojas de A
 x
 N  A
   diferentes formas de tomar n  x bolas no rojas de N  A
 nx 
 A  N  A 
Casos favorables    
 x  n  x 

 A  N  A 
  
 x  n  x 
H (n, N , A)  P( x)  ( x  0,1, ..., n)
N
 
n
47
Motorcars tiene 50 empleados en el departamento de ensamble.
Cuarenta empleados pertenecen al sindicato y 10 no. Se eligen
al azar cinco empleados para formar un comité que hablará con
la empresa sobre los horarios de inicio de turno.
a. ¿Cuál es la probabilidad de que cuatro de los cinco
empleados elegidos para formar parte del comité
pertenezcan al sindicato?

48
Motorcars tiene 50 empleados en el departamento de ensamble.
Cuarenta empleados pertenecen al sindicato y 10 no. Se eligen
al azar cinco empleados para formar un comité que hablará con
la empresa sobre los horarios de inicio de turno.
a. ¿Cuál es la probabilidad de que cuatro de los cinco
empleados elegidos para formar parte del comité
pertenezcan al sindicato?
b. ¿Cómo cambia esta probabilidad cuando la elección es con
reposición?

49
Queremos seleccionar al azar dos bolas de una caja que contiene
10 bolas, tres de las cuales son rojas. Encuentra la función de
probabilidad de la variable aleatoria: X = Número de bolas rojas
en cada elección (con y sin reemplazo).
Tenemos N = 10, A = 3, N - A = 7, n = 2
Escogemos con reemplazo:
2 x
 2  3 
x
7
p( x)       , p(0)  0.49, p(1)  0.42, p(2)  0.09
 x  10   10 
Escogemos sin reemplazo:

 3  7 
  
 x  2  x  21 3
p( x)  p(0)  p(1)   0.47 , p(2)   0.07
10  45 45
 
2 50
Hipergeométrica Binomial
N = 24 n=5
X=8 p = 8/24 =1/3
n=5 Observa que si N,
x P(x) P(x) Error A, N-A son grandes
0 0.1028 0.1317 -0.0289 comparados con n
1 0.3426 0.3292 0.0133
2 0.3689 0.3292 0.0397
no hay gran
3 0.1581 0.1646 -0.0065 diferencia en qué
4 0.0264 0.0412 -0.0148
-0.0028
distribución
5 0.0013 0.0041
N = 240 n=5
empleemos.
X = 80 p = 80/240 =1/3 La distribución
n=5
binomial es una
x P(x) P(x) Error aproximación
0 0.1289 0.1317 -0.0028
1 0.3306 0.3292 0.0014
aceptable a la
2 0.3327 0.3292 0.0035 hipergeométrica
3 0.1642 0.1646 -0.0004 si n < 5% de N.
4 0.0398 0.0412 -0.0014
5 0.0038 0.0041 -0.0003 51
Distribución hipergeométrica

 La media y la varianza de la distribución


hipergeométrica son:
nA

N

 AN  A  N  n  N n
 n 
2
   n pq  
N N   N 1   N 1 

52
A) ¿Cuál es la probabilidad de que una mesera se rehúse a servir
bebidas alcohólicas únicamente a dos menores de edad si verifica
aleatoriamente solo 5 identificaciones de entre 9 estudiantes, de los
cuales 4 no tienen la edad suficiente?,
B) ¿Cúal es la probabilidad de que como máximo 2 de las
identificaciones pertenezcan a menores de edad?
Solución:
N=9 / A=4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = va que define n° identificaciones que pertenecen a menores
de edad

0.64286

53
Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada
una. Asuma que un inspector selecciona al azar tres de los 12 fusibles de
una caja para inspeccionarlos. Si la caja contiene exactamente cinco
fusibles defectuosos, ¿cuál es la probabilidad de que el inspector encuentre
que uno de los tres fusibles está defectuoso?
En esta aplicación n= 3 y N = 12. Si A = 5 fusibles defectuosos en la caja,
la probabilidad de hallar x = 1 defectuoso es:

Ahora suponga que desea conocer la probabilidad de hallar por lo menos


un fusible defectuoso.
La manera más sencilla de contestar es calcular primero la probabilidad de
que el inspector no encuentre ningún fusible defectuoso. La probabilidad de
x = 0 es
Si la probabilidad de cero fusibles defectuosos es f(0) = 0.1591, se
concluye que la probabilidad de hallar por lo menos un fusible defectuoso
debe ser
1- 0.1591 = 0.8409. Así, existe una probabilidad razonablemente alta de
que el inspector encuentre por lo menos un fusible defectuoso.

54
55
Distribución de Poisson
Cuando en una distribución binomial el número de intentos (n) es
grande y la probabilidad de éxito (p) es pequeña, la distribución binomial
converge a la distribución de Poisson, cuya función de cuantía es:

e   x
f ( x)  , x  0 ,1,2 , ...   0
x!

donde np = 
Observa que si p es pequeña, el éxito es un “suceso raro”.

Se tiene que cumplir que:


p < 0.10
p * n < 10

56
Distribución de Poisson
El fenómeno aleatorio que define el modelo Poisson
llamado también Proceso de Poisson, se caracteriza:

a) Por ser un fenómeno que se presenta aleatoria e


independientemente en el tiempo o en el espacio en el que
solo interesa la ocurrencia del fenómeno un número
contable de veces. En un proceso de Poisson se observan
resultados discretos en un intervalo de tiempo.

b) Por ser un caso especial de un Experimento Binómico en el


que la probabilidaad de éxito es bastante remota, en tanto
que el tamaño de la muestra es grande, tal que np = λ

57
Un proceso poissoniano es aquél compuesto de eventos discretos
que son independientes en el espacio y/o en el tiempo.
Por ejemplo:
• La frecuencia de terremoto que ocurren en el Perú en un intervalo de tiempo.
• La cantidad de imperfecciones encontradas en un metro de alambre producidos
por un proceso electrolítico contínuo
• Número de llamadas telefónicas recibidas en la central telefónica de la UNCP
entre las 12:00 y 13:00 horas.

58
 La llegada de un cliente al negocio durante una hora.

 Las llamadas telefónicas que se reciben en un día.

 Los defectos en manufactura de papel por cada metro


producido.

 Los envases llenados fuera de los límites por cada 100


galones de producto terminado.

La distribución de Poisson se emplea


para describir procesos con un elemento
en común, pueden ser descritos por una
variable aleatoria discreta.
Ejemplo:
Si un banco recibe en promedio 6 cheques sin
fondo por día, ¿cuál es la probabilidad de que
reciba,
a) Cinco cheques sin fondo en un día dado.
b) Diez cheques sin fondo en cualquiera de dos días
consecutivos.
e   x
f ( x) 
x!

60
Ejemplo:
En promedio, cada una de las 18 gallinas de un
gallinero pone un huevo al día. Si se recogen los
huevos cada hora.
a) ¿Cuál es el número medio de huevos que se recogen
en cada visita?
b) ¿Con qué probabilidad encontraremos x huevos para
x = 0,1,2,3?
c) ¿y la probabilidad de que x ≥ 4 ?
e   x
f ( x) 
x!

61
Ejercicio 1
La probabilidad de que haya un accidente en una compañía de
manufactura es de 0.02 por cada día de trabajo. Si se trabajan 300
días al año, ¿cuál es la probabilidad de tener 3 accidentes?
Como la probabilidad p es menor que 0.1, y el producto n * p es
menor que 10 (300 * 0.02 = 6), entonces, aplicamos el modelo de
distribución de Poisson:

Al realizar el cómputo tenemos que P(x = 3) = 0.0892


Por lo tanto, la probabilidad de tener 3 accidentes laborales en 300
días de trabajo es de 8.9%.
Ejercicio 2
La probabilidad de que un producto salga defectuoso es de
0.012. ¿Cuál es la probabilidad de que entre 800 productos ya
fabricados hayan 5 defectuosos?
En este ejemplo vemos nuevamente la probabilidad p menor
que 0.1, y el producto n * p menor que 10, por lo que
aplicamos el modelo de distribución de Poisson:

El resultado es P (x = 5) = 0.04602
Por lo tanto, la probabilidad de que haya 5 productos
defectuosos entre 800 recién producidos es de 4.6%.
Ejemplo poissoniano
El 0,005% de los que padecen cierta
enfermedad mueren y la cantidad de
personas atacadas por el mal son 50 000.
Si X representa el número de personas
que mueren, entonces;
 X ~ B(x; 50000; 0,00005).

 np = λ = 2,5

64
Bombas sobre Londres en la II Guerra Mundial (Feller)
Supón que vivías en uno de los 100 bloques que aparecen en la gráfica
inferior. La probabilidad de que una bomba cayera en tu bloque era 1/100.
Como cayeron 400 bombas, podemos entender el número de impactos en tu
bloque como el número de éxitos en un experimento de Bernoulli con n = 400
y p = 1/100. Podemos usar una Poisson con λ=400 1/100=4:
e 4 4 x
400 bombas p ( x) 
x! Observado

Predicho

10 x 10 65
Características de la distribución de
Poisson

Media P(X) = 0.5


  E (X )   .6
.4
.2
0 X
Desviación estándar 0 1 2 3 4 5

   P(X) = 6
.6
.4
Nota: el máximo de la distribución .2
se encuentra en x   0 X
0 2 4 6 8 10
66
La distribución de Poisson se obtiene como aproximación de
una distribución binomial con la misma media, para ‘n grande’
(n > 30) y ‘p pequeño’ (p < 0,1). Queda caracterizada por un
único parámetro μ (que es a su vez su media y varianza).

  n p = 

Distribución de Poisson para varios valores de .


67
Si la probabilidad de fabricar un televisor defectuoso es
p = 0.01, ¿cuál es la probabilidad de que en un lote de 100
televisores contenga más de 2 televisores defectuosos?
La distribución binomial nos daría el resultado exacto:
  99    99   1    99   1 
100 99 98 2
100 100 100
P( A )  
c
             
 0  100   1  100   100   2  100   100 
 0.9206  n  x n x
p( x)    p q ( x  0,1,....n)
 x

El suceso complementario Ac: No más de 2 televisores


defectuosos puede aproximarse con una distribución de
Poisson con λ = np = 1, sumando p(0) + p(1) + p(2).
1 e   x
P( A )  e (1  1  )  0.9197
c 1
2
p ( x)  , x  0,1,2,...   0
x!
68
La señal promedio recibida en un telescopio de una fuente
celeste es de 10 fotones por segundo. Calcular la probabilidad
de recibir 7 fotones en un segundo dado.

Una distribución de Poisson x


p ( x)  e  ( x  0,1,....)
con μ = 10. x!

P(7) = 107 e−10 / 7! = 0.09, es decir 9%


Parece muy baja. Comparemos con el valor de máxima
probabilidad que ocurrirá para x = 10:
λ = 10 P(10) = 1010 x e−10 / 10! = 0.125, es decir 12.5%
Las probabilidades poissonianas para un número de eventos
dado, son siempre pequeñas, incluso en el máximo de la
distribución de probabilidad.

69
Si en promedio, entran 2 coches por minuto en un garaje, ¿cuál
es la probabilidad de que durante un minuto entren 4 o más
coches?

Si asumimos que un minuto puede dividirse en muchos


intervalos cortos de tiempo independientes y que la probabilidad
de que un coche entre en uno de esos intervalos es p (que para un
intervalo pequeño será también pequeño) podemos aproximar la
distribución a una Poisson con λ = np = 2.

El suceso complementario “entran 3 coches o menos” tiene


probabilidad:
2 20
P( A )  p(0)  p(1)  p(2)  p(3)  e ( 
c
0!
21
1!  22
2!  )  0.857
23
3!

y la respuesta es 1 – 0.857 = 0.143


70
En una especie animal, la probabilidad de que
una cria tenga alguna enfermedad congénita es
0,60. si el número de crías de una camada sigue
una distribución de poisson con parámetro λ = 4,

a) Calcular la probabilidad de que en una


camada no haya crías sanas.

b) ¿cuál es el número esperado de crías sanas en


una camada?
a) 0,2019
b) 1,60

71
Ley de Benford

72
Primer dígito significativo

299.959 0,0174

x   , x  m 10 , 1  m  10
n

d ( x)  m

2,99959 ·105 1,74 ·10-2


[2,99959] = 2 [1,74] = 1
73
Las barras negras representan las frecuencias de
aparición como primer dígito significativo
(d = 1,2,3,...,9) en una lista de N = 201 constantes
físicas. 74
Leading digit Probability
1 30.1 %
2 17.6 %
3 12.5 %
4 9.7 %
5 7.9 %
6 6.7 %
7 5.8 %
8 5.1 %
9 4.6 %

En barras blancas aparecen las frecuencias de aparición


como primer dígito de los números 1 a 9 en el tamaño en
bytes de N = 1.295.777 ficheros. 75
Simon Newcomb
(1835-1909).

Note on the frequency of use of the


different digits in natural numbers.
Amer. J. Math. 4 (1881) 39-40.

 d 1
P (d )  log  
 d  76
Frank Benford Title 1 2 3 4 5 6 7 8 9 Sampls

Rivers, Area 31.0 16.4 10.7 11.3 7.2 8.6 5.5 4.2 5.1 335

Population 33.9 20.4 14.2 8.1 7.2 6.2 4.1 3.7 2.2 3259

Constants 41.3 14.4 4.8 8.6 10.6 5.8 1.0 2.9 10.6 104

Newspapers 30.0 18.0 12.0 10.0 8.0 6.0 6.0 5.0 5.0 100

Specific Heat 24.0 18.4 16.2 14.6 10.6 4.1 3.2 4.8 4.1 1389
Pressure 29.6 18.3 12.8 9.8 8.3 6.4 5.7 4.4 4.7 703

H.P. Lost 30.0 18.4 11.9 10.8 8.1 7.0 5.1 5.1 3.6 690

Mol. Wgt. 26.7 25.2 15.4 10.8 6.7 5.1 4.1 2.8 3.2 1800

Drainage 27.1 23.9 13.8 12.6 8.2 5.0 5.0 2.5 1.9 159

Atomic Wgt. 47.2 18.7 5.5 4.4 6.6 4.4 3.3 4.4 5.5 91

, 25.7 20.3 9.7 6.8 6.6 6.8 7.2 8.0 8.9 5000

Design 26.8 14.8 14.3 7.5 8.3 8.4 7.0 7.3 5.6 560

Reader's Digest 33.4 18.5 12.4 7.5 7.1 6.5 5.5 4.9 4.2 308

Cost Data 32.4 18.8 10.1 10.1 9.8 5.5 4.7 5.5 3.1 741

X-Ray Volts 27.9 17.5 14.4 9.0 8.1 7.4 5.1 5.8 4.8 707

Am. League 32.7 17.6 12.6 9.8 7.4 6.4 4.9 5.6 3.0 1458

Blackbody 31.0 17.3 14.1 8.7 6.6 7.0 5.2 4.7 5.4 1165

Addresses 28.9 19.2 12.6 8.8 8.5 6.4 5.6 5.0 5.0 342
The law of anomalous , 25.3 16.0 12.0 10.0 8.5 8.8 6.8 7.1 5.5 900
numbers. Death Rate 27.0 18.6 15.7 9.4 6.7 6.5 7.2 4.8 4.1 418
Proc. Am. Philos. Soc. Average 30.6 18.5 12.4 9.4 8.0 6.4 5.1 4.9 4.7 1011

78 (1938) 551-538. Probable Error 77


78
Las barras representan las frecuencias de aparición como primer dígito
de los números 10 a 99 en los N = 1.295.777 ficheros medidos. La línea
continua representa la ley de Benford generalizada para dos dígitos.
79
Invarianza de base y de escala
en la densidad de probabilidad
Theodore Hill

Invarianza de escala Invarianza de base

No toda lista de números que cumple la Ley de Benford proviene


de una distribución invariante de escala. Pero seguro que es
invariante de base.
80
Procesos multiplicativos

81
 = -1
5 décadas

5 décadas

82
Para una lista de números que siga una distribución de
probabilidad en forma de ley de potencias N-1, tendremos
que la probabilidad del primer dígito significativo es
independiente de la década y sigue la ley de Benford:


10k ( d 1)
k
10 d
   
N 1dN  Ln 10 k (d  1)  Ln 10 k d 
 10 k (d  1)   d 1
Ln    Ln 
 d 
k
 10 d 

Normalizando:

 d 1
P (d )  log  
 d  83
The demonstration of Benford’s Law (and also for the distribution of the second
digit) was done in 1996 by Professor Theodore Hill (School of
Mathematics, Center for Applied Probability, Georgia Institute of Technology) in his
article: “A Statistical Derivation of the Significant‐Digit law”.
Hill later showed there was a kind of central limit theorem that applied to a wide
variety of distributions--that combinations of distributions tend towards the 84
distribution predicted by Benford’s law even when the original distributions do not

Das könnte Ihnen auch gefallen