Sie sind auf Seite 1von 10

Hipergeomtrica e Hipergeomtrica Multivariada

HIPERGEOMTRICA

Hasta ahora hemos analizado distribuciones


que proporcionansituaciones en las que se realizaban pruebas
que entraaban una dicotoma (proceso de Bernouilli) de
manera que en cada experiencia la probabilidad de obtener
cada uno de los dos posibles resultados se mantena constante.
Si el proceso consista en una serie de extracciones o
selecciones ello implicaba la reposicin de cada extraccin o
seleccin , o bien la consideracin de una poblacin muy
grande. Sin embargo si la poblacin es pequea y las
extracciones no se remplazan las probabilidades no se
mantendrn constantes . En ese caso las distribuciones
anteriores no nos servirn para la modelizar la situacin. La
distribucin hipergeomtrica viene a cubrir esta necesidad de
modelizar procesos de Bernouilli con probabilidades no
constantes (sin reemplazamiento) .

La distribucin hipergeomtrica es especialmente til en todos


aquellos casos en los que se extraigan muestras o se realizan
experiencias repetidas sin devolucin del elemento extrado o
sin retornar a la situacin experimental inicial.

Modeliza , de hecho, situaciones en las que se repite un


nmero determinado de veces una prueba dicotmica de
manera que con cada sucesivo resultado se ve alterada la
probabilidad de obtener en la siguiente prueba uno u otro
resultado. Es una distribucin .fundamental en el estudio de
muestras pequeas de poblaciones .pequeas y en el clculo
de probabilidades de, juegos de azar y tiene grandes
aplicaciones en el control de calidad en otros procesos
experimentales en los que no es posible retornar a la situacin
de partida.

La distribucin hipergeomtrica puede derivarse de un


proceso experimental puro o de Bernouilli con las siguientes
caractersticas:

El proceso consta de n pruebas , separadas o separables


de entre un conjunto de N pruebas posibles.
Cada una de las pruebas puede dar nicamente dos
resultados mutuamente excluyentes: A y no A.

En la primera prueba las probabilidades son : P(A)= p y


P(A)= q ; con p + q = l.

Las probabilidades de obtener un resultado A y de obtener un


resultado no A varan en las sucesivas pruebas, dependiendo
de los resultados anteriores.

Derivacin de la distribucin: Si estas circunstancias


aleatorizamos de forma que la variable aleatoria X sea el
nmero de resultados A obtenidos en n pruebas la
distribucin de X ser una Hipergeomtrica de parmetros
N, n, p as

X -> H (N, n, p)

Un tpico caso de aplicacin de este modelo es el


siguiente: Supongamos la extraccin aleatoria de n elementos
de un conjunto formado por N elementos totales, de los cuales Np son
del tipo A y Np son del tipo A(p + q = l). Si realizamos las extracciones sin
devolver los elementos extrados , y llamamos X. al nmero de elementos del
tipo A que extraemos en n extracciones X seguir una distribucin
hipergeomtrica de parmetros N , n , p.

FUNCIN DE CUANTA

La funcin de cuanta de una distribucin Hipergeomtrica har


corresponder a cada valor de la variable X (x = 0,1,2, . . . n) la
probabilidad del suceso "obtener x resultados del tipo A ", y (n-
x) resultados del tipo no A en las n pruebas realizadas de entre
las N posibles.

Veamos :

Hay un total de formas distintas de obtener x


resultados del tipo A y n-x del tipo A , si partimos de una
poblacin formada por Np elementos del tipo A y Nq elementos
del tipo A.
Por otro lado si realizamos n pruebas o extracciones hay un

total de posibles muestras ( grupos de n elementos)


aplicando la regla de Laplace tendramos:

Figura 4.2.1 Funcin de Cuanta

Que para valores de X comprendidos entre el conjunto de


enteros 0,1,. .n ser la expresin de la funcin de cuanta de
una distribucin , Hipergeomtrica de parmetros N, n, p.

MEDIA Y VARIANZA

Considerando que una variable hipergeomtrica de parmetros


N, n, p puede considerarse generada por la reiteracin de un
proceso dicotmico n veces en el que las n dicotomas NO son
independientes ; podemos considerar que una variable
hipergeomtrica es la suma de n variables dicotmicas NO
independientes.

Es bien sabido que la media de la suma de variables


aleatorias (sean stas independientes o no) es la suma de las
medias y por tanto la media de una distribucin hipergeomtrica
ser , como en el caso de la binomial :

En cambio si las variables sumando no son independientes


la varianza de la variable suma no ser la suma de las
varianzas.

Si se evala el valor de la varianza para nuestro caso se


obtiene que la varianza de una distribucin hipergeomtrica de
parmetros N, n, p es : si

X -> H (N, n, p)
Figura 4.2.2 Frmula de Varianza

Esta forma resulta ser la expresin de la varianza de una


binomial (n, p) afectada por un coeficiente corrector [N-n/N-1],
llamado coeficiente de exhaustividad o Factor Corrector de
Poblaciones Finitas (F.C.P.F.) y que da cuenta del efecto que
produce la no reposicin de los elementos extrados en el
muestreo.

Este coeficiente es tanto ms pequeo cuanto mayor es el


tamao muestral (nmero de pruebas de n ) y puede
comprobarse como tiende a aproximarse a 1 cuando el tamao
de la poblacin N es muy grande . Este ltimo hecho nos
confirma lo ya comentado sobre la irrelevancia de la reposicin
o no cuando se realizan extracciones sucesivas sobre una
poblacin muy grande. Con una poblacin muy grande se cual
fuere el tamao de n , el factor corrector sera uno lo que
convertira , en cierto modo a la hipergeomtrica en una binomial
(ver D. Binomial) . As

Lmite de la distribucin hipergeomtrica cuando N


tiende a infinito.

Hemos visto como la media de la distribucin hipergeomtrica


[ H ( N, n, p ) ], tomaba siempre el mismo valor que la media de
una distribucin binomial [ B ( n, p ) ] tambin hemos comentado
que si el valor del parmetro N creca hasta aproximarse a
infinito el coeficiente de exhaustividad tenda a ser 1, y, por lo
tanto, la varianza de la hipergeomtrica se aproximaba a la de
la binomial : puede probarse asimismo , cmo la funcin de
cuanta de una distribucin hipergeomtrica tiende a
aproximarse a la funcin de cuanta de una distribucin binomial
cuando

N->

Puede comprobarse en la representacin grfica de una


hipergeomtrica con N =100000 como sta ,es idntica a la de
una binomial con los mismos parmetros restantes n y p , que
utilizamos al hablar de la binomial.

Figura 4.2.3 Grfica de la distribucin hipergeomtrica

De manera anloga a como se obtena la moda en la


distribucin binomial es fcil obtener la expresin de sta para
la distribucin hipergeomtrica. De manera que su expresin
X0 sera la del valor o valores enteros que verificasen.

Figura 4.2.4 Moda de la distribucin hipergeomtrica

HIPERGEOMTRICA MULTIVARIADA

Justo como la distribucin hipergeomtrica toma el lugar de


distribucin binomial para el muestreo sin reemplazo, tambin existe
una distribucin multivariada anloga a la distribucin multinomial que
aplica al muestreo sin reemplazo. Para derivar esta formula,
consideremos un conjunto de N elementos, de los cuales M1, son
elementos de la primera clase, M2 son elementos de la segundo clase
. y Mk son elementos de la k-esima clase tales que.
Figura 4.2.5 Frmula Hipergeomtrica Multivariada

Como en relacin con la distribucin multinomial, estamos


interesados en la probabilidad de obtener X1 elementos (resultados) de
la primera clase, X2 elementos de la segunda clase . y Xk elementos
de la k-esima clase, pero ahora estamos escogiendo sin reemplazo, n de
los N elementos del conjunto.

Hay maneras de escoger X1 de los M1 elementos de la

primera clase maneras de escoger X2 elementos de los M2

elementos de la segunda clase, ..y manera de escoger Xk


elementos de los Mk elementos de la k-esima clase, y por

tanto, maneras de escoger

elementos requeridos. Puesto que hay maneras de


escoger n de los N elementos en el conjunto y suponemos que todas
son igualmente posibles (que es lo que queremos decir cuando
afirmamos que la seleccin es al azar), se sigue que la probabilidad

deseada esta dada por

Figura 4.2.6 Distribucin Hipergeomtrica Multivariada


As la distribucin conjunta de las variables aleatorias bajo
consideracin, esto es, la distribucin de los nmeros de
resultados de la diferentes clases, es una distribucin
hipergeomtrica multivariada con los parmetros n, M1, M2,
y Mk.

Estimacin Puntual y por Intervalos


Los problemas de diferencia estadstica se dividen en
estimacin y pruebas de hiptesis aunque en realidad son
dos problemas de decisin y por lo tanto no se pueden
manejar con un enfoque limitado.

La diferencia principal entre las dos clases de problemas


es que los problemas de estimacin debemos determinar el
valor de un parmetro o los valores de varios parmetros de
un continuo posible de alternativas mientras que en las
pruebas de hiptesis debemos de medir si aceptamos o
rechazamos un valor especifico o un conjunto de valores
especficos de un parmetro.

La estimacin de un parmetro involucra el uso de los


datos mustrales en conjuncin con alguna estadstica.
Existen dos formas de llevar a cabo la anterior
estimacin, puntual o por intervalo.

En la primera se busca que con base a los datos


mustrales de origen a una estimulacin evaluada del
parmetro y que recibe el nombre de estimador puntual. Para
la segunda se determina un intervalo en la que forma
probable se encuentre el valor de parmetro y recibe el
nombre de intervalo de confianza.

ESTIMACIN POR INTERVALOS

La estima de un parmetro poblacional dada por un nmero


se llama estima del punto del parmetro. La estima de un
parmetro poblacional dada por dos nmeros entre los
cuales se considera que se encuentra dicho parmetro se
llama estima de intervalo del parmetro.

EJEMPLO: Si se dice que una distancia viene dada por


5.28 pies, se est dando una estima de punto. Si, por otra
parte, se dice que la distancia es 5,28 +- 0.03 pies, es decir,
la distancia real se encuentra entre 5.25 y 5.31 pies, se est
dando una estima de intervalo,

La precisin o conocimiento del error de una estima se


conoce tambin como su seguridad.

Dos problemas de diferencia estadstica se dividen es


problemas de estimacin y pruebas de hiptesis aunque en
realidad son dos problemas de decisin y por lo tanto no se
pueden manejar con un enfoque limitado.

La diferencia principal entre las dos clases de problemas


es que los problemas de estimacin debemos determinar el
valor de un parmetro o los valores de varios parmetros de
un continuo posible de alternativas mientras que en las
pruebas de hiptesis debemos de medir si aceptamos o
rechazamos un valor especifico o un conjunto de valores
especficos de un parmetro.

La estimacin de un parmetro involucra el uso de los


datos mustrales en conjuncin con alguna estadstica.
Existen dos formas de llevar a cabo la anterior estimulacin
puntual o intervalo.

En la primera se busca que con base a los datos


mustrales de origen a una estimulacin evaluada del
parmetro y que recibe el nombre de estimador puntual. Para
la segunda se determina un intervalo en la que forma
probable se encuentre el valor de parmetro y recibe el
nombre de intervalo de confianza.

ESTIMACIN PUNTUAL

Aunque es una forma muy comn para expresar las


estimulaciones deja espacio para muchas otras preguntas,
por ejemplo, no nos dice de cuanta informacin se basa la
estimulacin, ni nos dice nada sobre el tamao de la
muestra y el tamao posible del error. As tal vez se tendra
que completar un estimulador punto A con el tamao de una
muestra y el valor de var () o con alguna otra informacin.

Muestral del estimulador puntual, una de las formas es:


p(^,<<^ )=1-

Donde Z, acento circunflejo son valores enfocados de teta de


acento circunflejo y lo cual es igual: 1-

Para una probabilidad especifica de un numero alfa nos


referimos a^,<2Confianza (1-) 100% para teta.

Tambin 1- se llama grado de confianza y los puntos


terminales del intervalo se llaman lmites de confianza
interior y superior.

Por ejemplo cuando =0.05 el grado de confianza es 0.95


por lo que tenemos un valor de confianza de 95%. Los
estimadores de intervalo de un parmetro dado no son
nicos.

P ( ^,<_2) = 1- =1- grado de confianza

= (1-) 100% intervalo de confianza

=0.05

Grado de confianza -0.95

Intervalo 95%

ESTIMACIN POR INTERVALOS

La estima de un parmetro poblacional dada por un nmero


se llama estima del punto del parmetro. La estima de un
parmetro poblacional dada por dos nmeros entre los
cuales se considera que se encuentra dicho parmetro se
llama estima de intervalo del parmetro.

EJEMPLO: Si se dice que una distancia viene dada por 5.28


pies, se est dando una estima de punto. Si, por otra parte,
se dice que la distancia es 5,28 +- 0.03 pies, es decir, la
distancia real se encuentra entre 5.25 y 5.31 pies, se est
dando una estima de intervalo,
La precisin o conocimiento del error de una estima se
conoce tambin como su seguridad.

Das könnte Ihnen auch gefallen