Beruflich Dokumente
Kultur Dokumente
1. INTRODUCCIÓN
Las distribuciones de probabilidad que se han determinado en un capítulo anterior, se conocen como funciones
empíricas. Las funciones teóricas de probabilidad corresponden a modelos que permiten expresar teorías sobre
el comportamiento ideal de una variable en la realidad.
Expresar lo que puede esperarse de un universo, cuando se comporta como deseamos que lo haga.
Como fuente de referencia, a fin de comparar con distribuciones observadas.
Cuando las distribuciones observadas son difíciles de formalizar, se la utiliza para resolver problemas y
efectuar operaciones.
Sirve para realizar inferencias y elaborar predicciones sobre el comportamiento de una variable cuando se
dispone de información limitada.
Binomial Uniforme
Hipergeométrica Geométrica
Poisson. Binomial negativa
Multinomial
La Normal.
t de Student
Chi-cuadrada
F de Fisher.
Existen otras funciones continuas de probabilidad, como la uniforme, exponencial, log-normal, gamma, Erlang y
Weibull, que tienen aplicación en la simulación.
En este capítulo se estudiarán todas las funciones teóricas discretas de probabilidad y las distribuciones
continuas normal, uniforme y exponencial.
2.1. Introducción
En general, la determinación de un modelo teórico discreto de probabilidades para aplicarlo a un caso observado,
se realiza tomando en cuenta las siguientes características:
Es una distribución de probabilidad discreta, pues los datos recopilados son resultado de conteos. Se la utiliza
como modelo cuando:
92
El número de pruebas o ensayos del experimento es fijo: “n”.
El resultado solo puede tomar una de dos formas, comúnmente denominadas como éxito y fracaso. Cada
resultado es mutuamente excluyente.
La probabilidad de éxito, “p”, permanece constante de un ensayo a otro y lo mismo sucede con la de fracaso,
“q”; tal que: p + q = 1.
Los ensayos son independientes, lo cual significa que el resultado de un ensayo no afecta al resultado de
algún otro. Esta condición puede asegurarse mediante un muestreo con reposición en poblaciones finitas o el
muestreo de poblaciones infinitas o muy grandes.
n
P(x) p x q n x
x
donde:
n, es el número de ensayos
x, es la variable aleatoria discreta del número de éxitos
p, es la probabilidad de éxito en cada ensayo
q, es la probabilidad de fracaso en cada ensayo, q = 1 - p
n n!
x
x!(n x)! es la combinatoria de ‘n’ en ‘x’
Nota: La binomial en una distribución sesgada, pero para valores de p cercanos a 0.5 y n>20, se vuelve
prácticamente simétrica.
Los valores de probabilidad de un modelo binomial están tabulados y se presentan en forma de una distribución
acumulada de probabilidades. Estos valores se designan con el signo B(n, p, x) dispuestas en tablas con el
siguiente formato (Ver anexo de tablas al final del texto):
P
n x 0.1 0.2 0.3 ... 0.5
3 0
1 Valores de probabilidad acumulada
2
Resolución
Primero se verifica si las condiciones del problema que muestran una distribución de probabilidad, se pueden
ajustar al modelo binomial:
El experimento, por características anteriores, se puede decir que sigue un modelo probabilístico binomial. Sus
probabilidades se resuelven usando la expresión del modelo binomial:
n=3
p (x) = 0.5
q (x) = 0.5
a) En este caso la variable "x" representa el número de niñas. Se desea resolver la probabilidad de que x=1.
Entonces:
1 3 1
3 1 1 1 1
P(x 1) 3 0.375
1 2 2 2 4
Respuesta: Hay una probabilidad de 37.5% de que en tres partos haya nacido una niña.
b) En este caso la variable "x" representa el número de niños. Probabilidad de nacer 2 o más niños:
P (x 2 ) = P (x = 2 ) + P (x = 3 )
2 3 2 3
3 1 1 3* 2 1
P(x 2) 0.375
2 2 2 1* 2 2
3 0 3
3 1 1 3* 2 *1 1
P(x 3) 0.125
3 2 2 1* 2*3 2
Luego:
P(x 2) 0.5
Respuesta: Hay una probabilidad del 50% de que en tres partos hayan nacido 2 o más niños.
Los resultados anteriores pueden determinarse directamente leyendo en una tabla B(x, n, p) (tabla binomial de
frecuencia acumulada), donde n es el número de pruebas y p, la probabilidad de elementos.
P
n x 0.1 0.2 0.3 ... 0.5
3 0 0.1250
1 0.5000
2 0.8750
3 1.0000
a)
P(x 1) P(x 1) P(x 0) 0.5000 0.1250 0.3750
b)
P(x 2) 1 P(x 1) 1 0.5000 0.5000
c) Se concluye que la tabla acumulada es muy útil en la resolución de problemas, porque simplifica los cálculos.
Por otro lado es útil para obtener la distribución de probabilidad (Ver tabla 6.2.1).
d) A partir de la distribución, se puede determinar el diagrama de barras de la distribución (ver gráfico 6.2.1).
94
Tabla 6.2.1
Distribución de probabilidad de mujeres nacidas en tres partos
Gráfico 6.2.1
Diagrama de barras de la probabilidad de mujeres nacidas en tres partos
0.4
0.3
0.2
P(x)
0.1
0
0 1 2 3
x
Fuente: Elaboración propia
Es una distribución de probabilidad discreta al igual que la binomial, se utiliza cuando el tamaño de la muestra es
superior al 5% de la población y tiene las siguientes características:
N1 N N1
x nx
P(x)
N
n
donde:
95
N, es el tamaño de la población
N1, es el número total de elementos de la categoría éxito en la población
n, es el número de ensayos o tamaño de la muestra
x, es el valor de la variable aleatoria discreta del número de éxitos
Ejemplo: En una canasta existen 7 cítricos: 4 naranjas y 3 limas. Un niño elige 3 cítricos.
Resolución
Por lo tanto, la distribución empírica del problema se puede ajustar a un modelo hipergeométrico.
a) Obtener 2 naranjas.
47 4 4*3
23 2 *3
108
P (x = 2 ) = = 1* 2 = = 0.51
7 7 * 6 * 5 210
3 1* 2 * 3
P (x 2 ) = P (x = 2 ) + P (x = 3 )
3 4 3 4 3* 2
*4
2 1 3 0 1*1 78
P(x 2) 1* 2 0.37
7 7 7 *6*5 7 *6*5 210
3 3 1* 2*3 1* 2*3
Respuesta: En el 37% de los casos es posible que el niño haya obtenido al menos 2 limas.
Gráfico 6.2.2
Diagrama de barras de la elección de naranjas
0.6
0.5
0.4
0.3
P(x)
0.2
0.1
0
0 1 2 3
x
Lo más probable es que el niño obtenga 2 naranjas si elige de entre 3 cítricos, de un conjunto de 7 cítricos, donde
se tienen 4 naranjas y 3 limas.
También denominada ley de eventos improbables. Se aplica a problemas que cumplen las características de una
distribución binomial con probabilidad de éxito, “p”, pequeña (p<0.05) y tamaño de muestra, “n”, grande (n>25).
Tiene muchas aplicaciones. Se utiliza como modelo para describir fenómenos como la distribución de errores en
captura de datos, número de imperfecciones en piezas recientemente pintadas, número de clientes que hacen
cola en un banco, número de llamadas telefónicas, etc.
x e
P(x, )
x!
97
donde:
es la media (esperanza matemática) del número de ocurrencias (éxitos) en un intervalo de tiempo dado. En
situaciones binomiales
np y
2 np , puesto que q 1.
x es la variable aleatoria discreta del número de éxitos.
e = 2.71828 (la base del logaritmo neperiano).
Ejemplo: Un estudiante de Administración de Empresas, cuando presenta sus informes de contabilidad, afirma
que comete por término medio 5 errores por página.
Resolución
Se pide:
P(x 4, 5)
Para resolver el problema afortunadamente existen tablas de probabilidad acumulada de Poisson (Ver anexo de
tablas al final del texto). Aquí se reproduce solamente una parte:
x 0 1 2 3 4 5 6 7 8 9
4.8 0.008 0.048 0.143 0.294 0.476 0.651 0.791 0.887 0.944 0.975
5.0 0.007 0.040 0.125 0.265 0.440 0.616 0.762 0.867 0.932 0.968
5.2 0.006 0.034 0.109 0.238 0.406 0.581 0.732 0.845 0.918 0.960
Tabla 6.2.3
Distribución de errores por página
Pac(x
x P(x) ) x P(x) Pac(x)
0 0.007 0.007 8 0.065 0.932
1 0.033 0.04 9 0.036 0.968
2 0.085 0.125 10 0.018 0.986
3 0.140 0.265 11 0.009 0.995
4 0.175 0.44 12 0.003 0.998
5 0.176 0.616 13 0.001 0.999
6 0.146 0.762 14 0.001 1
7 0.105 0.867 1
98
Fuente: Elaboración propia
Se puede observar que la distribución es bimodal. Lo más probable es que el estudiante cometa 4 o 5 errores por
página.
Gráfico 6.2.3
Diagrama de barras de la distribución de errores por página
0.20
0.18
0.16
0.14
0.12
0.10
P(x)
0.08
0.06
0.04
0.02
0.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
x
Fuente: Elaboración propia
Un experimento aleatorio se comporta como una distribución multinomial cuando observa las siguientes
características:
La probabilidad de éxito para cada categoría permanece constante en cada prueba y se expresa como:
P1 , P 2 , . . . . , P K
Las pruebas son independientes, es decir el resultado de una prueba no afecta ni es afectado por el resultado
de la prueba anterior o la siguiente, respectivamente.
La probabilidad del experimento con estas características se calcula mediante la siguiente expresión:
n!
f ( x1, x 2,..., x K ) = * P ( x1) x1 * P ( x 2) x 2 *...* P ( x K ) x K
x1!* x 2!*...* x K!
n! n
f ( x1, x 2,..., x K ) = n * P ( x i ) xi
x i! i=1
i=1
Ejemplo: En una bolsa de mercado existen 7 cítricos: 3 naranjas, 2 limas y 2 toronjas. Un niño elige 3 cítricos con
reposición. Determine la probabilidad de que sean 2 toronjas y una naranja.
Resolución
El problema proporciona la siguiente información, que indica que la distribución planteada sigue un modelo
multinomial:
99
El número de pruebas es 3 y es fijo.
Los resultados de la prueba se clasifican en 3 categorías:
C1 = toronjas
C2 = naranjas
C3 = limas
La probabilidad de cada categoría es constante en cada prueba y sus valores son:
P1 = 2/7
P2 = 3/7
P3 = 2/7
Las pruebas son independientes porque si en la prueba sale 1 toronja y 2 naranjas, esto no quiere decir que la
siguiente o la anterior prueba sea de la misma naturaleza.
2 1 0
3! 2 3 2
f ( x1 = 2 , x 2 = 1 , x 3 = 0 ) =
2!* 1!* 0! 7 7 7
3 * 2 *1 4 9 72
= = = 0.105
2 *1 49 49 680
Respuesta: Entonces esta combinación formada por 2 toronjas y 1 naranja, se dará en 10.5 de 100 casos.
La probabilidad de éxito para cada categoría es la misma. Como sólo existe una prueba, no es necesario
observar si la probabilidad se mantiene constante.
1
P1 , P 2 , . . . . , P K = k
Las categorías son mutuamente excluyentes. Como sólo existe una prueba, no es necesario clasificarla en
independientes o dependientes.
1
f (x , k )= para x=x 1 , x2 , …, x k
k
Otra forma de calcular la probabilidad es cuando se tienen los valores mínimo y máximo de la variable:
x=a , a+1, …, b . La variable entonces contiene (b-a+1) valores, cada uno con probabilidad:
1
f (x , b−a+1)= para x=a , …, b
b−a+ 1
Con cualquier formato, la media y la varianza esperada de una distribución uniforme discreta serán:
100
2
E( x )=
k +1 b−a+2 k 2 −1 (b−a+1 ) −1
= V ( x )= =
2 2 12 12
Ejemplo: El temario de un examen para un proceso selectivo contiene 50 temas, de los cuales se elegirá uno por
sorteo. Si una persona no ha estudiado los 15 últimos temas ¿Cuál es la probabilidad de que apruebe el examen?
Resolución
La variable que representa el número del tema seleccionado para el examen sigue una distribución uniforme con
parámetros a=1 y b=50. La persona aprueba el examen si le toca un tema del 1 al 35; por tanto, la probabilidad
que se pide es la cola a la izquierda de 35.
1
f ( x ,50 )= x=1 , 2, … . , 50
50
El diagrama de barras es el que se muestra en el gráfico 6.2.4.
Gráfico 6.2.4
Diagrama de barras de la probabilidad de aprobación de un examen
0.03
0.02
P(x)
0.01
0
1 4 7 1 0 1 3 16 19 2 2 25 28 31 34 37 4 0 43 46 4 9
x
35∗1
La probabilidad de que el alumno apruebe el examen será de: =0.7 .
50
E ( x )=
50+1 50 2−1
=25.5 V ( x )= =208.25
2 12
s ( x )=14.43 CV ( x )=56.59 %
2.7. Distribución geométrica
Suponga que en una sucesión de pruebas o ensayos, queremos saber el número del ensayo en que ocurre el
primer éxito, y que todas las suposiciones de la binomial, menos la primera se satisfacen; en otras palabras n no
es fija.
1 1− p
E( x)= V ( x )=
p p2
Ejemplo: Si la probabilidad de que un ladrón sea atrapado en un robo cualquiera es 0.20.
Resolución
a) Sustituyendo en la fórmula:
b) La distribución del número de robos hasta que el ladrón sea atrapado se muestra en la tabla 6.2.4.
1 V ( x )=
1−0 . 2
E( x )= =5 =20
0.2 0 .2 2
4 . 47
CV = ∗100=89 . 4 %
S ( x)=4 .47 5
Lo que se espera es que un ladrón sea atrapado por primera vez en su quinto robo con una dispersión de 89.4%.
Tabla 6.2.4
Distribución de probabilidad de que un ladrón sea atrapado en su cuarto robo
Observando el gráfico 6.2.5, existe mayor probabilidad de que el ladrón sea atrapado en el primer robo.
Gráfico 6.2.5
Distribución de probabilidad de ser atrapado en el cuarto robo
0.25
0.2
0.15
P(x)
0.1
0.05
0
1 3 5 7 9 11 13 15 17 19 21 23 25
x
Fuente: Elaboración propia
2.8. Distribución binomial negativa
La distribución binomial negativa es una generalización de la distribución geométrica, donde la variable aleatoria
es el número de ensayos necesarios para obtener c éxitos.
n -1 c n c n x n x
B (n, c, p ) = B (n, c, p ) = 1 - p q
* *
p q
c -1 x
*
B (n, c, p ) = 1 - B (x -1, n, p )
Ejemplo: Los productores de durazno en Cochabamba han detectado que el 10% de los duraznos están
afectados por la mosca. Supongamos que un grupo de estudiantes van a un huerto de duraznos con el permiso
del propietario y están deseosos de que, eligiendo al azar los duraznos, puedan comer 20 duraznos buenos.
Resolución
c = x = número de éxitos = 20
n = 25
p = 0.90 probabilidad de éxito.
b¿ (n=25, c=20, p=0. 9)= 25−1 (0 . 9)20 (0 . 1)25−20= 24 (0.9 )20 (0.1)5 =0. 0517
( ) ( )
20−1 19
Hay una probabilidad del 5.17% de que los estudiantes tengan que probar 25 duraznos para obtener 20 buenos.
104
c) La distribución de probabilidades se muestra en la tabla 6.2.5
Tabla 6.2.5
Distribución del número de pruebas para obtener 20 duraznos buenos
Observando el gráfico 6.2.6, se constata que hay mayor probabilidad de obtener 20 duraznos buenos probando
22 duraznos.
Gráfico 6.2.6
Número de pruebas para obtener 20 duraznos buenos
0.30
0.25
0.20
0.15
P(n)
0.10
0.05
0.00
20 21 22 23 24 25 26 27 28 29 30 31
n
3.1. Introducción
Un experimento aleatorio que presenta una variable continua, puede ser modelado mediante varias funciones
teóricas continuas de probabilidad. La más importante es la distribución normal.
105
El criterio que se sigue para decidir qué modelo se ajusta mejor a los datos generados por el experimento
aleatorio es la prueba de hipótesis de bondad de ajuste, la cual se desarrollará en un capítulo subsiguiente del
texto. Mientras tanto, simplemente se utilizará el criterio, la gráfica de la distribución y el conocimiento de la
situación para elegir el modelo adecuado.
a) Generalidades
Se dice que la función normal es la piedra fundamental de la Estadística. Su función de densidad está dada por la
siguiente expresión:
(x )2
1
y= e 2 2
x
2
1. La curva tiene perfil de campana, y presenta un solo pico en el centro exacto de la distribución. La media
(aritmética), la mediana y la moda de la distribución son iguales y están en el punto central, de esta
forma la mitad del área bajo la curva se encuentra a la izquierda y la otra mitad a la derecha de la media
(ver figura 6.3.1).
2. La distribución probabilística normal es simétrica con respecto a su media. Si se corta la curva normal
por la mitad verticalmente, las dos mitades serán como imágenes reflejadas en un espejo.
3. La curva normal decrece uniformemente en ambas direcciones a partir del valor central. Es asintótica.
4. A una distancia de la media aritmética correspondiente a la desviación estándar, se encuentran sus
puntos de inflexión.
50% 50%
Punto de inflexión
Punto de inflexión
- +
Me=Mo=
Fuente: Elaboración propia
a) Distribuciones que presentan la misma media pero distinta desviación (figura 6.3.2)
= 15
106
=8
= 25 x
Fuente: Elaboración propia
b) Distribuciones que presentan la misma desviación pero distinta media (Figura 6.3.3)
=8 =8
= 10 x = 25 x
Fuente: Elaboración propia
c) Distribuciones que presentan distinta media y distinta desviación (Figura 6.3.4).
=8 =4
=9 x = 25 x
Fuente: Elaboración propia
Resultaría imposible proporcionar una tabla de valores de probabilidad normal para cada distribución, por lo que
se recurre a una variable estandarizada o tipificada “z”:
X
z
donde : X es el valor de cualquier observación específica
es la media de la distribución
es la desviación estándar de la distribución
El valor de z mide la distancia entre un valor específico x y la media, en unidades de desviación estándar. La
media de la distribución normal estándar es 0 y su desviación estándar 1.
=8 107 33 25 41 25
z 1 z 2
8 8
9 17 25 33 41 17 25 9 25
x z 1 z 2
-2 -1 0 1 2 z
8 8
Fuente: Elaboración propia
Cada medición de x, tiene una medición estandarizada z correspondiente, obtenida con la fórmula de
transformación, de modo que la desviación estándar se convierte en la unidad de medida.
De esa manera se puede calcular que el 68.27% de los datos se hallan en el intervalo de más y menos una
desviación estándar, el 95.45% de los datos están contenidos en más y menos dos desviaciones estándar y el
99.73% en más y menos 3 desviaciones estándar. El área total bajo la curva normal es obviamente 100% (Ver
figura 6.3.6).
1 => 68.27%
2 => 95.45%
3 => 99.73%
=1
68% 95%
99%
-3 -2 -1 0 1 2 3 z
El cálculo de áreas bajo la curva normal se realiza mediante la tabla normal estándar (Ver anexo de tablas
estadísticas). Aquí se reproduce una parte de la tabla:
z 1
z 0 z z
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.49601 0.49202 0.48803 0.48405 0.48006 0.47608 0.47210 0.46812 0.46414
0.2 0.42074 0.41683 0.41294 0.40905 0.40517 0.40129 0.39743 0.39358 0.38974 0.38591
0.3 0.38209 0.37828 0.37448 0.37070 0.36693 0.36317 0.35942 0.35569 0.35197 0.34827
0.8 0.21186 0.20897 0.20611 0.20327 0.20045 0.19766 0.19489 0.19215 0.18943 0.18673
0.9 0.18406 0.18141 0.17879 0.17619 0.17361 0.17106 0.16853 0.16602 0.16354 0.16109
1.0 0.15866 0.15625 0.15386 0.15151 0.14917 0.14686 0.14457 0.14231 0.14007 0.13786
Esta tabla contiene las probabilidades de cola superior (áreas bajo la curva normal) para cada valor de z positivo.
Por ejemplo, para hallar el valor del área de más y menos un sigma, vemos el valor de z de 1 en la tabla:
108
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.8
0.9
1.0 0.15866
1.1
P( z=1)=0 .1586
=1
0.1586 0.1586
z1=-1 = 0 z2=1 x
Por lo tanto, el valor de más y menos una desviación estándar será:
Ejemplo: Se ha determinado que los jóvenes que asisten a la fiesta de San Juan, beben 25 tazas de ponche en
promedio, con una varianza de 64 tazas2. Si dicha variable se comporta como una normal:
Resolución
a) Se debe resolver:
P(x 19)
Gráficamente:
=8
19 = 25 x
Se estandariza la variable.
x 19 25
P( ) = P (z 0.75 )
8
Gráficamente:
=1
109
- 0.75 =0 z
Se lee el resultado en la tabla de distribución normal de cola superior (Ver anexo de tablas al final del texto):
b) Se trata de resolver:
P(x 41)
Gráficamente:
=8
= 25 41 x
Se estandariza la variable.
x 41 25
P( ) = P (z 2 )
8
Gráficamente:
=1
=0 2 z
c) Se trata de resolver:
P(19 x 31)
Gráficamente:
=8
19 = 25 31 x
Se estandariza la variable.
19 25 x 31 25
P( ) = P (0.75 z 0.75 )
8 8
Gráficamente:
=1
110
-0.75 =0 0.75 z
Se lee el resultado en tabla de distribución normal.
P(x1 x x 2 ) 0.80
d) Se quiere calcular los límites del 80% central:
Gráficamente:
80% =8
Se estandariza la variable. X1 = 25 X2 x
x1 25 x x 2 25
P( ) = 0.80
8 8
Gráficamente:
80%
=1
z1 =0 z2 z
25
1.28 = x1 x1 = 25 (1.28) (8) = 14.76
8
25
1.28 = x 2 x 2 = 25 + (1.28) (8) = 35.24
8
Respuesta: El 80% central de asistentes a la fiesta, tomarán entre 15 a 35 tazas de ponche.
Se utiliza cuando np y nq son mayores a 5. Esto quiere decir que el número de ensayos es mayor a 20 (y por lo
tanto ya no se puede usar la tabla de valores acumulados) y la probabilidad de éxito es cercana a 0.5. En estas
condiciones, la distribución binomial se acerca mucho a la forma de la distribución normal, y es mejor y más fácil
calcular las distintas probabilidades con esta aproximación.
El factor de corrección por continuidad es el valor 0.5 que se resta o se suma, dependiendo del problema, a un
valor seleccionado cuando una distribución probabilística binomial se está aproximando por medio de una
distribución de probabilidad continua.
La variable estandarizada, en este caso se encuentra por medio de la siguiente ecuación, en la que se usa la
media y la desviación estándar de la distribución binomial:
(x 0.5) np
Z
npq
Ejemplo: La gerencia de la cadena de pizzerías CAPRI reveló que el 70% de sus nuevos clientes vuelven en otra
ocasión. En una semana en la que 80 nuevos clientes (de primera vez) cenaron en uno de sus establecimientos,
¿cuál es la probabilidad que:
Resolución
Luego, para observar la conveniencia de utilizar la aproximación, se tratará de resolver el inciso a) del problema
con la fórmula binomial.
a) Se pide:
P(x 60)
Primera:
P(x 60) P(x 60) P(x 61) P(x 80)
P(x 60) 1 P(x 59) 1 P(x 59) P(x 58) P(x 0)
Segunda:
En cada caso, se debe resolver 20 ó 60 veces la fórmula binomial, para hallar el resultado. Se concluye que es
mejor realizar la aproximación.
Para realizar la aproximación, primero se debe verificar si se cumple con las dos condiciones: np y nq sean
mayores a 5.
np 80(0.7) 56 nq 80(0.3) 24
Luego se hallan los valores de la media y la desviación estándar:
a) Se pide:
P(x 60)
Gráficamente:
112 = 4.1
=56 60 x
Se estandariza la variable:
Gráficamente:
=1
=1 0.85 z
La probabilidad se determina mediante la tabla de normal estándar de cola superior del anexo.
b) Se pide:
P(x 40)
Estandarizando:
40 = 56 x
-3.78 =1 z
En este caso, para cubrir un poco más del área, se tuvo que sumar 40 + 0.5, para realizar la corrección por
continuidad.
Gráfico 6.3.1
Distribución uniforme continua
0.6
0.5
0.4
f(x) 0.3
0.2
0.1
0
0 2 4 6 8 10
x
Fuente: Elaboración propia
2
a+b (b−a )
E( x )= V ( x )=
2 12
Ejemplo: La función de densidad de probabilidad del peso neto en libras de un paquete de alimento balanceado
es f (x )=2 , para 49 . 75≤x≤50 . 25 libras.
Resolución
a) Se pide: P( x>50 )
50 . 25
P( x>50 )=∫50 2 dx=2 x|50. 25
50 =2(50 . 25−50)=0 . 5
b) Se pide:
x x
0. 9=∫49. 75 2 dx=2 x|49 .75=2( x−49 .75 )
0 . 9=2 x−99 . 5
x=50 .2
El 90% de los paquetes tienen un peso de 50.2 libras.
114
49 .75+50 . 25 (50 . 25−49. 75 )2
E( x )= =50 V ( x )= =0 . 021
2 12
S ( x)=0. 144 CV =0 . 3 %
Lo que se espera es que un paquete pese 50 libras con una dispersión de 0.3%.
x
F( x )=∫49 .75 2 dx=2( x−49 .75)=2 x−99.5
3.5. Distribución exponencial
Si la distribución de Poisson describe las probabilidades del número de fallas por unidad de longitud, la
exponencial da las probabilidades de la variable aleatoria que describe la distancia entre fallas.
Si la variable aleatoria x, es la distancia entre ocurrencias sucesivas de un proceso de Poisson con media λ ,
la función de densidad de probabilidad es:
− λx
f (x , λ )=λ e , para 0≤x≤∞
La media y varianza esperadas son:
1 V ( x )=
1
E( x )=
λ λ2
Ejemplo: El promedio de llegada de camiones a una bodega para ser descargados es de 3 por hora. Encuentre
las probabilidades de que el tiempo entre la llegada consecutiva de dos camiones sea: a) Menor de 5 minutos, b)
Al menos de 45 minutos
Resolución
1
a) Se pide, transformando a horas:
P( 0≤x ≤ 12 )
1 1 1
−
P(0≤x ≤ 121 )= 012 ∫ 3e −3 x
dx=−e −3 x 12
| =−e +1=0 .2212
0
4
La probabilidad de que el tiempo de llegada entre dos camiones sea menor a 5 minutos es del 22.12%.
3
b) Se pide:
P( 4 ≤x≤∞ )
9
∞ −
3 −3 x −3 x ∞
P( 4
≤x≤∞ )= 3 ∫ 3e dx=−e |3 =e =0 . 1064
4
4 4
La probabilidad de que el tiempo de llegada entre dos camiones sea al menos de 45 minutos es del 10.64%.
Se muestra en la figura 6.4.1, un árbol de decisión que ayuda a elegir a la hora de ajustar una distribución
empírica a un modelo discreto probabilístico.
115
116
FIGURA 6.4.1
ÁRBOL DE DECISIÓN PARA ELEGIR LA DISTRIBUCIÓN DISCRETA ADECUADA
n>25
p<0.05 Poisson x e
P(x, )
varios varios x!
Binomial
independiente n (x 0.5) np
P(x) p x q n x np>5 Aproximación Z
x nq>5 a la normal npq
dicotómico
dependiente N1 N N1
x nx
Hipergeométrica P(x)
varios varios N
fijo n
categoría
1
uno f ( x, k ) para x x1 , x 2 , , x k
independiente
uno Uniforme k
1
f ( x, b a 1) para x a, , b
variable b a 1
varios n! n
varios
Multinomial f ( x1, x 2,..., x K ) = n
* P ( x i ) xi
¿Naturaleza del número de dicotómico
ensayos?
x!
i=1
i
i=1
x 1
¿Resultados posibles?
independiente
varios
uno Geométrica g( x, p) p(1 p)
¿Naturaleza de las pruebas?
varios n 1 c n c
¿Número de ensayos? b* (n, c, p) p q para n c, c 1,
Binomial c 1
¿Número de éxitos? negativa
B* (n, c, p ) = 1 - B (x -1, n, p )
EJERCICIOS DE CLASE
Binomial
1. En un día veraniego muy caluroso, 10% de los trabajadores de producción de una empresa están ausentes
del trabajo. Se van a seleccionar al azar 10 obreros para un estudio especial a profundidad sobre el
ausentismo.
2. El departamento de mercadeo de una compañía planea realizar una encuesta nacional para determinar si los
consumidores de cereales en hojuelas pueden distinguir uno de sus productos favoritos, de los otros del
mismo tipo. Para probar el cuestionario y el procedimiento que se van a emplear, se pidió a ocho personas
que cooperaran en un experimento. Se colocan frente a la persona 5 tazones pequeños marcados A, B, C, D
y E con cereal y se le informó que solo uno tenía su producto favorito. Suponga que la persona no pudo
identificar el cereal y sólo conjeturó que estaba en el tazón C.
Hipergeométrica
3. En Alke se acaba de recibir un embarque de 10 aparatos de TV. Poco después de recibirlos, el fabricante
llamó para informar que por descuido habían enviado tres aparatos defectuosos. Se decidió probar dos de
éstos. ¿Cuál es la probabilidad de que ninguno de los dos esté defectuoso?.
Poisson
5. Un productor de semillas híbridas tiene problemas con gusanos barrenadores del maíz. Una verificación
aleatoria de 5.000 mazorcas reveló estos datos: muchas mazorcas no tenían gusanos. Algunas tenían uno,
otras tenían dos, etc. La distribución del número de barrenadores se aproximó a una Poisson. El productor
contó 3.500 gusanos en las 5.000 mazorcas. ¿Cuál es la probabilidad que una mazorca seleccionada al azar
no contenga gusanos?
6. Los automovilistas llegan a una salida de una carretera a razón de dos por minuto. La distribución de llegadas
se aproxima a una distribución de Poisson.
Multinomial
7. En una ciudad muy grande, la televisión nacional tiene el 40% de los televidentes el viernes por la noche, un
canal local tiene 20%, la televisión por cable tiene 30% y 10% ve videograbaciones. ¿Cuál es la probabilidad
de que entre siete televidentes seleccionados al azar en esa ciudad en una noche de viernes, dos estén
viendo la televisión nacional, uno esté viendo el canal local, tres estén viendo televisión por cable y uno esté
viendo una videograbación?
8. Si un dado se tira 5 veces. ¿Cuál es la probabilidad de que los resultados sean un 1, un 2, y otros tres
números?
Uniforme
9. Se mide la longitud de varias placas de vidrio, hasta la décima de milímetro más cercana. Las longitudes
están distribuidas de manera uniforme, con valores que están espaciados una décima de milímetro
comenzando en 290.0 y continuando hasta 590.9. Calcule la media y la varianza de las longitudes.
10. Un sombrero contiene 10 pedazos de papel numerados del 1 al 10. Se extrae un número. Sea x dicho
número. Hallar la distribución de probabilidad de x, el valor esperado de x y su varianza esperada.
Geométrica
11. Si 0.05 es la probabilidad de que cierto instrumento de medición sufra una desviación excesiva, ¿cuál es la
probabilidad de que el sexto de los instrumentos probados sea el primer en mostrar esa desviación?
12. Un tirador experto da en el blanco el 95% de las veces. ¿Cuál es la probabilidad de que falle por primera vez
en su décimo quinto disparo?
Binomial negativa
13. Un estudiante contesta oralmente un test de elección múltiple con cinco respuestas. Contesta preguntas
hasta que responde correctamente cinco. ¿Cuál es la probabilidad de que las responda en 25 preguntas o
menos, si responde a cada pregunta sin pensar?
14. Se estima que el 90% de un cosecha de papas es buena, estando podridas por dentro las restantes, pero no
puede descubrirse a menos que las papas se corten por la mitad.
Normal
15. A los empleados de una empresa les otorgan puntuaciones por eficiencia. La distribución de estas sigue
aproximadamente una distribución normal. La media es 400, y la desviación estándar, 50.
16. Supóngase que un fabricante de neumáticos desea fijar una garantía de millas recorridas para su nuevo
neumático MX100. Las pruebas de duración revelaron que la media de millas recorridas es de 47.900, y la
desviación estándar es de 2.050 millas. El fabricante desea fijar la garantía de manera que no tenga que
reemplazar más del 5% de los neumáticos.
17. Se estima que 0.5% de las llamadas telefónicas a la Boliviana de Seguros reciben señal de ocupado. ¿Cuál
es la probabilidad que de las 1.200 llamadas telefónicas del día de hoy, al menos 5 hayan recibido la señal
de ocupado?
18. Un estudio realizado por una compañía aseguradora reveló que los propietarios no recuperaron los bienes
robados en 80% de los robos informados a la aseguradora.
a) Durante un cierto período ocurrieron 200 robos. ¿Cuál es la probabilidad de que no se recuperen los
bienes en 170 o más de los asaltos?
b) ¿Cuál es la probabilidad de que ninguno de los bienes robados se recobre en 150 o más de los asaltos?
Uniforme
19. El espesor de la capa de sustancia fotoprotectora que se aplica a las obleas en el proceso de fabricación de
semiconductores en cierta área de oblea, tiene una distribución uniforme entre 0.2050 y 0.2150
micrómetros.
20. La función de densidad de probabilidad de la longitud de una varilla de metal es f (x )=2 para
2. 3≤x≤2. 8 metros. Si las especificaciones de la varilla en cuanto a la longitud es que debe tener
entre 2.25 y 2.75 metros, ¿cuál es la proporción de varillas que no cumplen con el requerimiento?
Exponencial
21. La función de densidad de probabilidad del tiempo de falla (en horas) de un componente electrónico de una
−x
1000
e
f (x )=
copiadora es 1000 para x > 0. Calcule la probabilidad de que:
22. El kilometraje (en miles de kilómetros) que los automovilistas logran con cierto tipo de neumático es una
−x
1
f (x )= e 20
variable aleatoria con densidad de probabilidad: 20 para x> 0 . Calcule las
probabilidades de que uno de los neumáticos dure:
a) ¿Cuál es la probabilidad de que la muestra del director contenga más de dos transmisiones con defectos
de fábrica?
b) ¿Cuál es la probabilidad de que ninguna de las transmisiones elegidas tenga defectos de fábrica?
2. Un supervisor de producción de una planta de una compañía, está preocupado por la habilidad de un
empleado ya mayor para mantener el menor ritmo de trabajo. Además de los descansos diarios obligatorios,
este empleado deja de trabajar durante períodos cortos un promedio de 4.1 veces por hora. El período de
descanso que se toma es de tres minutos cada vez. El supervisor ha decidido que si la probabilidad de que el
descanso adicional, 12 minutos o más por hora, del empleado (es decir, además del obligatorio), es mayor
que 0.5, entonces lo cambiará a una tarea diferente. ¿Deberá hacer esto?
3. Un ingeniero de control de calidad inspecciona una muestra aleatoria de 3 acumuladores de cada lote de 20
que están listos para ser embarcados. Si un lote contiene 6 acumuladores con pequeños defectos, ¿cuáles
son las probabilidades de que la muestra del inspector contenga
4. Las probabilidades de que conduciendo cierto sedán de dos puertas en la ciudad se obtenga un rendimiento
promedio de menos de 20 millas por galón de combustible, de 20 a 25 millas por galón o más de 25 millas por
galón con 0.3, 0.6 y 0.1, respectivamente. Obtenga la probabilidad de que entre 6 automóviles de ese tipo
sometidos a prueba, dos promedien como mínimo 20 millas por galón, tres promedien de 20 a 25 millas por
galón y uno promedie más de 25 millas por galón.
5. En una gran universidad se ha determinado que el 20% vive en residencias, el 30% en la universidad y el 50%
en casas particulares. Si se elige un comité de 5 estudiantes, eligiéndose cada uno independientemente de
los demás
a) ¿Cuál es la probabilidad de que el comité esté formado por un estudiante que viva en la universidad, por
uno que viva en una casa particular y por tres que vivan en residencias?
b) ¿Cuál es la probabilidad de que esté formado por tres o más estudiantes que vivan en residencias?
6. Un fabricante de proyectiles dirigidos sostiene que sus proyectiles son eficaces en un 90%. La fuerza aérea
comprueba las existencias realizando disparos, siendo necesarias 11 pruebas para obtener cuatro éxitos.
¿Cuál es la probabilidad de que se necesiten 11 o más pruebas si
p 0.9 . ¿Qué conclusión es razonable
sacar?
7. Una compañía ha recibido un gran pedido para producir motores eléctricos para una compañía
manufacturera. Con el fin de que ajuste en su soporte, el rotor del motor debe tener un diámetro de 5.1 0.05
(pulgadas). El encargado de compras de la compañía se da cuenta de que hay en existencia una gran
cantidad de varillas de acero con un diámetro medio de 5.07 plg., y con una desviación estándar de 0.07 pulg.
¿Cuál es la probabilidad de que una varilla de acero del inventario se ajuste en el soporte?
8. Ciertos bastoncillos de plástico moldeados por inyección son cortados automáticamente en longitudes
nominales de 6 pulgadas. Las longitudes reales están distribuidas normalmente alrededor de la media de 6
pulgadas y sus desviaciones estándar son 0.06 pulgadas.
a) ¿Qué proporción de los bastoncillos rebasan los límites de tolerancia, que son de 5.9 a 6.1 pulgadas?
b) ¿A qué valor es necesario reducir la desviación estándar si 99% de los bastoncillos debe estar dentro de
los límites de tolerancia?
9. La probabilidad de que un componente electrónico falle en menos de 1000 horas de uso continuo es 0.25.
Utilícese la aproximación normal para encontrar la probabilidad de que entre 200 de tales componentes
menos de 45 fallen en menos de 1000 horas de uso continuo.
10. Un embarque de 200 alarmas contra robo, contiene dos piezas defectuosas. Se seleccionan al azar 5
alarmas contra robo para enviarlas a un cliente.
a) Halle la probabilidad de que el cliente reciba exactamente una alarma contra robo defectuosa.
b) Halle la probabilidad de que el cliente reciba exactamente una alarma contra robo defectuosa, si se
supone que el embarque es lo suficientemente grande como para considerarla una población infinita.
11. Los expedientes de una compañía de albercas indican que la probabilidad de que una de sus nuevas
albercas requiera reparación en el plazo de un año es 0.20. ¿Cuál será la probabilidad de que la sexta
alberca construida en un año determinado sea la primera en requerir reparación en ese lapso?
12. Una máquina troqueladora produce tapas de latas cuyos diámetros tienen una desviación de 0.01 pulgadas.
¿En qué diámetro nominal promedio debe ajustarse la máquina, de tal manera que no más del 5% de las
tapas producidas tengan diámetros que excedan las 3 pulgadas?
13. En cierta ciudad, el consumo diario de energía eléctrica (millones de kw-hora) es una variable aleatoria con
−x
1 3
f (x )= x e
densidad de probabilidad: 9 para x>0 . Si la planta de energía de la ciudad tiene
una capacidad diaria de 12 millones de kw-hora, ¿cuál es la probabilidad de que el abastecimiento de
energía sea inadecuado en un día cualquiera?
14. La cantidad de tiempo que un reloj funciona sin necesidad de ser ajustado es una variable aleatoria que
−x
1
f (x )= e 50
tiene una distribución exponencial: 50 . Calcule las probabilidades de que tal reloj:
15. En una “prueba de resistencia” el interruptor de una lámpara es puesto en encendido y apagado hasta que
falla. Si la probabilidad de que falle en cualquier ocasión que es puesto en encendido o en apagado es de
0.001, ¿cuál será la probabilidad de que falle después de que fue puesto en encendido y apagado 1200
veces? (suponga que se satisfacen las condiciones de la distribución geométrica).