Sie sind auf Seite 1von 5

DISTRIBUCION HIPERGEOMTRICA

SEPTIEMBRE 2014

Para establecer las condiciones bsicas que llevan a otra distribucin discreta de probabilidad conocida
como hipergeomtrica, considere el siguiente problema: Sea N el nmero de representantes de un
estado que asisten a una convencin poltica nacional y sea k el nmero de los que apoyan al candidato
A. mientras que el resto N - k apoya al candidato B. Suponer que una organizacin informativa
selecciona aleatoriamente a n representante y les pregunta sus razones para apoyar a los candidatos. Si
X es una variable aleatoria que sustituye el nmero de representantes en la muestra que apoyan al
candidato A, cul es la funcin de probabilidad de X?
Esta situacin parece ser binomial porque entre N representantes de un estado existen dos grupos
distintos con probabilidad k/N y (N - k)/N. Sin embargo considrese con mas detalle el proceso de
seleccin para la muestra de n representantes. Es razonable suponer que se selecciona un representante,
se le preguntan sus razones y no vuelve a ser seleccionado. El resultado es que no existe independencia
entre la seleccin de un representante y el siguiente. Por ejemplo, supngase que el primer
representante seleccionado apoya al candidato A, entonces quedan N - 1 representantes de los cuales
k - 1 apoya a A. Por lo tanto la probabilidad condicional de que el siguiente candidato apoye tambin a
A es (k - 1)/(N - 1) y no k/N, y la probabilidad condicional de que el siguiente representante apoye a B
es (N - k)/(N - 1) y no (N - k)/N.
Para determinar la probabilidad de que, de maneras exacta, se seleccionen x representantes que apoyen
a A y n - x que apoyen a B, se proceder de la siguiente manera: el nmero de maneras distintas en que
N
puede seleccionarse una muestra de n representantes de un total de N es ; y cada muestra tiene una
n

N
probabilidad de seleccin de 1 . De manera similar, la seleccin de x personas que apoyen a A es
n
k
un evento que puede ocurrir de maneras distintas y la seleccin de (n - x ) representantes que
x
N k
apoyen a B es un evento que pude ocurrir de
maneras. El nmero total de maneras en que
n x
k N k
ambos eventos pueden darse es
. De esta manera la probabilidad de seleccionar x
x n x
representantes que apoyen al candidato A es

k N k
x n x
p(x) =
.
N
n

Miguel Reynaud G.

DISTRIBUCION HIPERGEOMTRICA

SEPTIEMBRE 2014

Definicin Sea N el nmero total de objetos en una poblacin finita, de manera tal que k de stos es de
un tipo y N - k de otros. Si se selecciona una muestra aleatoria *de la poblacin constituida por n
objetos de la probabilidad de que x sea de un tipo exactamente y n - x sea del otro, est dada por la
funcin de probabilidad hipergeomtrica:

k N k
x n x


, k = 0,1,2,...,n; x k, n x N k;
p(x; N,n, k) =
N
n

para cualquier otro valor


0

N,n, k, enteros positivos


(4.27)

Los parmetros de la distribucin hipergeomtrica son N, n, y k. stos definen una familia de


distribuciones con funcin de probabilidad determinada por (4.27 Canavos). En la figura siguiente se
muestran algunas grficas de (4.27) para distintas combinaciones de N, n, y k.

Grficas de la funcin de probabilidad hipergeomtrica


La funcin de probabilidad (4.27) de la distribucin hipergeomtrica y la funcin de distribucin
acumulativa, definida por:

k N k

x
i n i
P(X x) = F(x; N,n, k) =
N
i=0
n

(4.28)

El clculo de las probabilidades hipergeomtricas puede convertirse en tedios, especialmente cuando n


es grande, sin embargo puede simplificarse si se emplea la siguiente frmula de recursin

p(x + 1; N,n, k) =

Miguel Reynaud G.

(n x)(k x)
p(x; N,n, k)
(x + 1)(N k n + x + 1)

(4.29)

DISTRIBUCION HIPERGEOMTRICA

SEPTIEMBRE 2014

Ejemplo: 4.7 Supngase que se tienen 50 representante de cierto estado, a una convencin poltica
nacional, de los cuales 30 apoyan al candidato A y 20 al candidato B. Si se seleccionan al azar cinco
representantes, cul es la probabilidad de que entre estos cinco, por lo menos dos apoyen al candidato
A?
Sea X la variable aleatoria que representa el nmero de personas en la muestra que apoyan a A. Para
N = 50, n = 5 y k = 30, la funcin de probabilidad de X est dada por:

k N k
x n x
p(x; N,n, k) =
N
n
30 50 30
x 5 x
p(x;50,5, 30) =
,
50
5

x = 0,1,...,5

y la probabilidad de que X 2 es:

P(X 2) = 1 P(X 1) = 1 [ p(0;50,5, 30) + p(1;50,5, 30)].


Dado que:

30 20 20
0 5 0 5
p(0;50,5, 30) =
=
= 0.007317
50
50
5
5
y dado que de (4.29)

p(1;50,5, 30) =
se encuentra que

p(x + 1; N,n, k) =

(n x)(k x)
p(x; N,n, k)
(x + 1)(N k n + x + 1)

(4.29)

(5 0)(30 0)
p(0;50,5, 30) = 0.068597
(0 + 1)(50 30 5 + 0 + 1)
P(X 2) = 1 P(X 1) = 1 [ p(0;50,5, 30) + p(1;50,5, 30)].
P(X 2) = 1 [ 0.007317 + 0.068597 ] = 0.9241

Miguel Reynaud G.

DISTRIBUCION HIPERGEOMTRICA

SEPTIEMBRE 2014

PARA ENTENDER EL CONCEPTO DE MUESTRA ALEATORIA Canavos Cap. 7 p-215


La manera en que ocurren las cosas en relacin con X puede definirse por un modelo de probabilidad
que recibe el nombre de distribucin de probabilidad de la poblacin. Entonces una muestra de la
poblacin no es mas que una coleccin de datos que se obtiene al llevar a cabo repetidos ensayos de un
experimento para lograr una evidencia representativa acerca de la poblacin en relacin con la
caracterstica X. Si la forma de obtener la muestra es imparcial entonces la muestra contendr
informacin til y podremos hacer inferencias acerca de la poblacin, obviamente con el riesgo
contemplado.
Como la inferencia estadstica se formula en base en una muestra de objetos de la poblacin de inters,
el proceso mediante el cual se obtiene ser aquel que asegure la seleccin de una buena muestra.
Un aspecto crucial en el diseo de esta muestra es el concepto a cada objeto se le asigna la misma
probabilidad de ser elegido. Un procedimiento que contemple este hecho se conoce como muestra
aleatoria simple.
Un rea muy fructfera para la hipergeomtrica es el control estadstico de la calidad y la aceptacin
de muestreo.
Ejemplo: 4.8
Considrese un fabricante de automviles que compra los motores a una compaa donde se fabrican
bajo estrictas especificaciones. El fabricante recibe un lote de 40 motores. Su plan para aceptar el lote
consiste en seleccionar ocho motores al azar y someterlos a pruebas. Si se encuentra que ninguno de los
motores presentan serios defectos, el fabricante de autos acepta el lote; de otra manera lo rechaza. Si el
lote contiene dos motores con serios defectos, cul es la probabilidad de que sea aceptado?
Sea X el nmero de motores defectuosos en la muestra. Para N = 40, n = 8, y k =2, la probabilidad de
aceptacin es

2 38
0 8
p(0; 40,8,2) =
= 0.6359
40
8
De esta manera el lote de 40 tiene una probabilidad menor de 2/3 de ser aceptado si contiene dos
motores defectuosos. Se nota que la esencia del control estadstico de la calidad es la mejora de la
calidad.

Miguel Reynaud G.

DISTRIBUCION HIPERGEOMTRICA

SEPTIEMBRE 2014

Cuando se toma una muestra esta puede ser con reemplazo o sin reemplazo.
Como las vacunas en las muestras se inutilizan, no es posible muestrear con reemplazo. El supuesto
que se invalida es el de independencia entre ensayos al modificarse el contenido del lote con cada
extraccin y por ende la proporcin de vacunas malas en este caso se dice que X tiene una distribucin
de probabilidad hipergeomtrica.
Supuestos:
*La poblacin de inters contiene N elementos de los cuales D tiene una caracterstica y el resto N - D
no la tienen.
*Se extrae una muestra de tamao n sin reemplazo.
*La variable aleatoria X = nmero de elementos en la muestra que tiene la caracterstica.
*La distribucin de probabilidad est dada por
El valor esperado de la variable aleatoria X es: E(X) = np donde p es la proporcin con la
k
caracterstica deseada esto es p =
y la varianza est dada por
N

k N k
x n x
p(x; N,n, k) =
N
n

N n
V (X) = npq
q = 1 p
N 1

EJERCICIO
Una compaa acerera del puerto, seleccion seis Ingenieros Industriales recin egresados de la UV
para su departamento de Control de Procesos de Fabricacin de un grupo de 23 aspirantes.
Cul es la probabilidad de que los seis seleccionados incluyan a los dos mejores ingenieros del grupo
de los 23 aspirantes?
SOLUCION
Los parmetros del modelo probabilstico son N = 23, n = 6 x = 2. X es igual a la variable aleatoria
que es el nmero de los mejores ingenieros en la seleccin y nos piden la probabilidad de que ellos
sean seleccionados.
Es decir

2 23 2 2 21
2!
21!

2 6 2 2 4
2!(2 2)! 2!(21 4)!
p(2;23,6,2) =
=
=
= 0.05929
23!
23
23


6
6
6!(23 6)!

Miguel Reynaud G.

Das könnte Ihnen auch gefallen