Sie sind auf Seite 1von 13

República Bolivariana de Venezuela

Ministerio del poder popular para la Educación

Universidad José Antonio Páez

TRABAJO No2 PROBABILIDADES

Sección: 306E1
Integrantes:
Amer Kamal 25.765.064

Distribución Multinomial

MARZO 2020
Este modelo se puede ver como una generalización del Binomial en el que, en lugar
de tener dos posibles resultados, tenemos r resultados posibles.

Supongamos que el resultado de una determinada experiencia puede ser r valores


distintos: A1, A2, ..., Ar cada uno de ellos con probabilidad p1, p2, ..., pr, respectivamente.
r
P ( A 1 )= p1 , P ( A 2 )= p2 … P ( A r ) =p r con ∑ P ( A i )=1
i=1

Si repetimos la experiencia n veces en condiciones independientes, podemos preguntarnos


la probabilidad de que el suceso A1 aparezca k1 veces, el suceso A2, k2 veces y así
sucesivamente:

P[ ( A1=k 1 ) ∩ ( A 2=k 2 ) ∩ ...∩ ( A r=k r ) ]

Al modelo estadístico que nos da dicha probabilidad se le denomina Multinomial, y su


función de densidad viene dada por:

n!
F ( k 1 , k 2 , … , k r )= p1 X … pk X
i k

X1 ! … Xk !

como se ve, el modelo Multinomial queda definido por los parámetros (n, p1, p2, ..., pr). La
fórmula anterior puede deducirse de forma análoga al caso Binomial. En realidad, si
tomamos r = 2 tenemos exactamente el modelo Binomial.

Se debe destacar que este modelo es un ejemplo de distribución multivariante, es decir, de


distribución conjunta de varias (r) variables aleatorias. En efecto, si definimos la variable
aleatoria X1 como número de veces que se produce el suceso A 1 de un total
de  n experiencias,  y así sucesivamente, tenemos un conjunto de r variables aleatorias
discretas cuya función de densidad conjunta (valorada a la vez) viene definida por la
anterior fórmula. Nótese que si consideramos cada una de estas variables Xi (i =
1, 2,  ..., r) por separado, su distribución es la Binomial de parámetros n y pi.

Media

E { X i }=n pi

Varianza

Var ( X i ) =n p i (1− pi )
Cor ( X i , X j ) =−n p i p j ( 1 ≠ p i )

MARZO 2020
Función generadora de momentos

k
n
( ∑ pi e t )
i

i=1

Ejemplo: Si se lanza seis veces un par de dados, ¿Cuál es la probabilidad de obtener un


total de 7 u 11 dos veces, un par igual una vez y cualquier otra combinación tres veces?

Solución: Listamos los siguientes eventos posibles.

E1 : Ocurre un total de 7 u 11 veces,


E2: Ocurre un par igual ,
E3: No ocurre ni un par ni un total de 7 u 11.

Las probabilidades correspondientes para una prueba dada son p1=2/9, p2=1/6, y p3= 11/18.
Estos valores permanecen constantes para todas las seis pruebas. Al usar la distribución
multinomial con x1=2, x2 y x3=3, encontramos que la probabilidad que se requiere es

2 1 3
2 1 11 6! 2 1 11
(
F 2,1,3 , , , ,6 =
9 6 18 )(
2 !∗1 !∗3 ! 9 )( ) ( ) ( )
6 18

2 1 11
( )
F 2,1,3 , , , ,6 =0,1127 11%
9 6 18

Siendo así 11% el porcentaje de probabilidad de obtener untotal de 7 u 11 dos veces, un par
igual una vez y cualquier otra combinación tres veces.

Distribución Normal

La distribución normal es la distribución de probabilidad más importante en


estadística, conocida por la cantidad de fenómenos que explica. En estadística y
probabilidad se llama distribución normal, distribución de Gauss, distribución gaussiana o
distribución de Laplace-Gauss, a una de las distribuciones de probabilidad de variable
continua que con más frecuencia aparece. La distribución normal es una distribución con
forma de campana donde las desviaciones estándar sucesivas con respecto a la media
establecen valores de referencia para estimar el porcentaje de observaciones de los datos.
Estos valores de referencia son la base de muchas pruebas de hipótesis.

Importancia de la distribución normal


Es el modelo continuo de mayor importancia en estadística debido a las siguientes razones:

MARZO 2020
 Su aplicación es directa y permite observar muchas variables de interés, que pueden
describirse fácilmente con este modelo.
 Sirve para acercarse a varias distribuciones de probabilidad discreta, entre estas la
distribución de Poisson y la distribución Binomial.
 Sus propiedades han permitido el desarrollo de muchas técnicas de inferencia
estadística. Proporcionando la base de la estadística inferencial clásica, por su
relación con el teorema de límite central.

Conceptos fundamentales en la distribución normal


Para entender y trabajar adecuadamente con distribución normal en estadística es necesario
conocer y tener claros ciertos conceptos sobre los cuales se basa este modelo.

Variable aleatoria continua


Es aquella que alcanza adjudicarse un número infinito de valores dentro de determinado
rango. Por ejemplo, el peso de una persona según la precisión de la báscula puede ser 80.5,
80.52, etc.

Distribución de probabilidad normal


Muchas variables aleatorias siguen una distribución normal o cerca de la misma. Pues su
característica más resaltante es que la gran mayoría de distribución de probabilidad bien sea
discreta o continua, pude ser aproximada con una probabilidad normal bajo ciertas
condiciones.

Las características tanto de la distribución de probabilidad normal y la curva que la


representa son:

 La curva tiene forma de campana con un pico en el centro de la distribución. Por lo


que la media aritmética, la moda y la mediana son iguales y se localizan en el pico.
 Es simétrica alrededor de su media. La mitad del área bajo la curva se encuentra a la
derecha de dicho punto central y la otra mitad está a la izquierda.
 La curva desciende mansamente en ambas direcciones a partir del valor central.
 Es asintótica, es decir, que la curva se acerca bastante al eje X pero no llega a
tocarlo.

2
1 x−μ
( )
2 σ
e
F ( x )=
σ √2 π

MARZO 2020
Función de densidad de probabilidad
Emplea cálculos laboriosos, puede demostrarse aplicando la fórmula es

Dicha función de densidad:

 Puede usar cualquier valor (- ∞ ,+ ∞ )


 Son más probables los valores cercanos al punto central (media).
 Conforme se aleja del valor µ, la probabilidad decrece de la misma forma a la
derecha e izquierda (simétrica).
 Conforme se aleje del valor µ, la probabilidad decrece de forma más o menos
rápida dependiendo de la desviación típica (parámetro s).

Uso de la distribución en la deducción estadística


Los conceptos de probabilidad y distribuciones de muestras se utilizan como
introducción al método de Inferencia Estadística, la cual se compone de:

 La estimación: Que busca evaluar los parámetros de la población basados en una


muestra.
 Las pruebas de Hipótesis: Proceso relacionado con aceptación o rechazo de
alguna afirmación sobre los parámetros de la población.

Al hacer mediciones de cualquier tipo y distribuir los resultados bajo algún criterio, es
muy común encontrar que los datos se agrupan de manera singular, en ocasiones dichas
distribuciones siguen una forma con un mayor número de observaciones para
determinado valor, disminuyendo las observaciones a ambos lados de esta más
frecuente.

El uso de esta distribución se encuentra en diversas ramas del conocimiento, se aplica a


una gran variedad de observaciones en la biología, la astronomía, la geografía y la
economía.

Muchos fenómenos de la naturaleza se pueden aproximar con una distribución normal.


En general se puede repasar como resultado de la interacción de muchos efectos
aleatorios en la variable que se estudia.

En este tipo de distribución, se puede calcular la posibilidad de que unos cuantos


eventos ocurran dentro de determinados intervalos o rangos, sin embargo, la
probabilidad exacta de un valor dentro de una distribución continua, como la
distribución normal, es igual a cero (0). Esta propiedad diferencia a las variables
continuas, las cuales son medidas, de las variables discretas, que son contadas.

Por ejemplo, el tiempo (en segundos, minutos u horas) se mide, no se cuenta. Por lo que
es una variable factible de determinar. La probabilidad de que el tiempo de instalación
de determinada utilidad para en un ordenador es entre 8 y 15 segundos o la probabilidad

MARZO 2020
puede ser de entre 8 y 9 segundos. Sin embargo, la probabilidad de que el tiempo de
instalación sea exactamente de 9 segundos es cero.

Ejemplo:

1)Una cierta maquina produce resistencias eléctricas que tienen un valor medio de 40 ohms
y una desviación estándar de 2 ohms. Suponiendo que los valores de las resistencias siguen
una distribución normal y que pueden medirse con cualquier grado de precisión. ¿Qué
porcentaje de resistencias tendrá un valor que exceda a 43 ohms?

2) En una empresa la edad de los trabajadores se distribuye normalmente con media de 50


años y desviación estándar de 5 años.

a)¿Qué porcentaje de los trabajadores tiene entre 50 y 52,5 años?


b)¿Cuál es la probabilidad de que un trabajador cualquiera no sea mayor de 45 años?
c)¿Cuál es la probabilidad que un trabajador tenga entre 41 y 58 años?
d)El 20% de los trabajadores están bajo cierta edad ¿Cuál es esa edad?

MARZO 2020
Aproximación Normal de la Binomial

En este caso se estarán calculando probabilidades de experimentos Binomiales de una


forma muy aproximada con la distribución Normal, esto puede llevarse a cabo si n¥® y p =
p(éxito) no es muy cercana a 0 y 1, o cuando n es pequeño y p tiene un valor muy cercano a
½ ; esto es,
 

MARZO 2020
 
Donde:
x = variable de tipo discreto; solo toma valores enteros
m = np = media de la distribución Binomial
s =   = desviación estándar de la distribución Binomial
 
Cuando ocurren las condiciones anteriores, la gráfica de la distribución Binomial, es
muy parecida a la distribución Normal, por lo que es adecuado calcular probabilidades
con la Normal en lugar de con la Binomial y de una forma más rápida.
En resumen, se utiliza la aproximación Normal para evaluar probabilidades Binomiales
siempre que p no esté cercano a 0 o 1. La aproximación es excelente cuando n es
grande y bastante buena para valores pequeños de n si p está razonablemente cercana a
½. Una posible guía para determinar cuándo puede utilizarse la aproximación Normal
es tener en cuenta el cálculo de np y nq. Sí ambos, np y nq son mayores o iguales a 5, la
aproximación será buena.
 
Antes de empezar a resolver problemas con la aproximación Normal, es bueno aclarar
que se están evaluando probabilidades asociadas a una variable discreta x, con una
distribución  que evalúa variables de tipo continuo como es la Normal,
Por lo que z sufre un pequeño cambio como se muestra a continuación:
 

 
¿Por qué vamos a sumar o a restar ½ a x?
Este es un factor de corrección debido a que se está evaluando una variable discreta con
una distribución continua, por lo que hay que delimitar claramente desde que punto se
va a evaluar la variable, dicho de otra forma, en que límite de la barra (inferior o
superior) nos debemos posicionar para determinar la probabilidad requerida, cada barra
de probabilidad a evaluar tiene como base la unidad, ese es el porqué del ± ½.
 
 
 
 
 
 
 
 
 
 
 
 
 

MARZO 2020
Ejemplos:

1.      La probabilidad de que un paciente se recupere de una rara enfermedad de la


sangre es de 0.4. Si se sabe que 100 personas han contraído esta enfermedad, ¿Cuál
es la probabilidad de que: a) al menos 30 sobrevivan?, b) más de 46 sobrevivan?, c)
menos de 50 no sobrevivan?
Solución:
 
a)
n = 100
p = p(paciente se recupere) = 0.40
q = p(paciente no se recupere) = 1 – p = 1 – 0.40 = 0.60
m = np = (100)(0.40) = 40 pacientes se recuperen
s =  =  pacientes que se recuperan
x = variable que nos define el número de pacientes que se recuperan
x = 0, 1, 2,....,100 pacientes que se recuperan
 
 
 
 
 
 
 
 
 
X = 29.5 m = 40
 
   
 
 

        
 
p(z=−2.14)=0.4838
 
p(x ³ 30)= p(z=−2.14)+ 0.5=0.4838+ 0.5=0.9838
 
 
a)       
 
 
 
 
 
 

MARZO 2020
 
 
 
 
 
 
 

        
 
p(z=1.33)=0.4082
 
p(x >46)=0.5 – p(z=1.33)=0.5 – 0.4082=0.0918
 
 
b)      n = 100

p = p(paciente no sobreviva) = 0.60


q = p(paciente sobreviva) = 1 – p = 0.40
pacientes que no se recuperan
pacientes que no se recuperan
x = variable que nos define el número de pacientes que no sobreviven
x = 0, 1, 2, ....,100
 
 

 
 
 

       
 
p(z=−2.14)=0.4838
 
MARZO 2020
p(x <50)=0.5 – p( z=−2.14)=0.5 – 0.4838=0.0162
 
 
2.      Una prueba de opción múltiple tiene 200 preguntas, cada una con  4
posibles      respuestas, de las cuáles solo una es la correcta ¿cuál es la probabilidad
de que al azar se den de 25 a 30 respuestas correctas para 80 de las 200
preguntas  acerca de los cuales el estudiante no tiene conocimientos?
 
Solución:
n = 80
p = p(dar una contestación correcta) = 0.25
q = p(dar una contestación incorrecta) = 1 – p = 0.75
preguntas contestadas correctamente
  preguntas contestadas correctamente
x = número de preguntas que son contestadas correctamente = 0, 1, 2,...,80
 
 
 
 

 
 
 
p(z 1=1.16)=0.377
      ,     
 
p(z 2=2.71)=0.4966
      ,   
 
          p(25 £ x ³ 30)= p( z 2) – p(z 1)=0.4966 – 0.377=0.1196
 
 
3.      Si 35% de los productos manufacturados en cierta línea de producción es
defectuoso, ¿cuál es la probabilidad de que entre los siguientes 1000 productos
manufacturados en esa línea a) menos de 354 productos sean defectuosos?, b) entre
342 y 364 productos sean defectuosos?, c) exactamente 354 productos sean
defectuosos?

MARZO 2020
Solución:
a)n = 1000
p = p(un producto sea defectuoso) = 0.35
q = p(un producto no sea defectuoso) = 1- p = 0.65
productos defectuosos
      15.0831 productos defectuosos
x = número de productos defectuosos que se manufacturan en la línea = 0, 1, 2,..., 1000
 
 

 
 
 

p(z=0.23)=0.091
      , 
 
       p(x <354)=0.5+ p (z=0.23)=0.5+ 0.091=0.5091
 
b)
 
 
 
 
 
 
 
 
 
 
 
 

MARZO 2020
p(z 1=−0.56)=0.2123
      ,              
 
p(z 2=0.96)=0.3315
     
 
p(342 £ x ³364 )= p( z 1)+ p(z 2)=0.2123+ 0.3315=0.5438
 
 
 
 
 
c)
 
 

p(z 1=0.23)=0.091
      @ 0.23,     
 
p(z 2=0.30)=0.117
           ,    9
 
           p(x=354 )= p( z 2)− p(z 1)=0.1179 – 0.091=0.0269 

MARZO 2020

Das könnte Ihnen auch gefallen