You are on page 1of 29

Distribuciones de Probabilidad Continuas

En el caso de variables aleatorias continuas, las funciones densidad de


probabilidad ms comunes y de uso ms frecuente en inferencia estadstica son:

1. Funcin de densidad de probabilidad Uniforme.


2. Funcin de densidad de probabilidad Normal.
3. Funcin de densidad de probabilidad Chi-cuadrado.
4. Funcin de densidad de probabilidad T de Student.
5. Funcin de densidad de probabilidad F de Snedecor.

En el caso de variables aleatorias continuas, determinar un tipo de experimento


que se pueda explicar con alguna de estas distribuciones ya no es tan sencillo.
Cuando se tiene un conjunto de datos, producto de unas mediciones, existen
formas aproximadas de determinar si ellos provienen de alguna distribucin
especfica.

Las cuatro distribuciones que se estudiaran a continuacin se pueden considerar


como las piedras angulares de lo que se denomina la teora de la inferencia
estadstica.

Para variables aleatorias continuas, la probabilidad de que esta se encuentre entre


dos valores a y b cualesquiera corresponde al rea debajo de la curva comprendida
entre estos dos valores

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Recordemos que para variables aleatorias continuas la probabilidad en un
punto siempre es igual a cero. Por esta razn la siguiente secuencia de
igualdades se satisface siempre que X sea una v.a. continua,

Funcin de distribucin acumulada para variables aleatorias continas

Retomando lo estudiando en el captulo de variables aleatorias continuas, la f.d.a


es til para determinar funciones de distribucin de probabilidad de variables
aleatorias continuas, as como para determinar el valor probabilstico que se tiene
cuando una variable aleatoria alcanza un valor fijo.

Definicin. La funcin de distribucin acumulada, la cual se denota por de


una variable aleatoria continua X, cuya funcin densidad de probabilidad es ,
se define como,

Esta funcin resulta ser continua en Si existe una funcin tal que
para todo x donde dicha derivada exista, entonces es llamada
Funcin de Densidad de Probabilidad o f.d.p (en ingls p.d.f).

Por el teorema fundamental del clculo se tiene que:

Esta expresin quiere decir que para hallar la probabilidad de que la variable
aleatoria X sea menor o igual a x se debe hallar la integral de la funcin densidad
de probabilidad en los lmites apropiados. Esta funcin tiene la propiedad de que
cuando y cuando .

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
1. Funcin de densidad de probabilidad Uniforme

Este es el modelo de distribucin de probabilidad ms simple.

Sea X una v.a continua definida en el intervalo , es proporcional a


la longitud de , en particular:

( ) .

Diremos que X tiene una f.d.p uniforme en y escribimos La f.d.p


de X est dada por:

Adems,

[ ] [ ]

La f.d.a para X est dada por:

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Distribucin Uniforme (a, b).

Ejemplo: La longitud de una bisagra para puertas es un v.a X, distribuida


uniformemente en el intervalo (74.6 , 75.4).

La f.d.p para la variable aleatoria X est dada por:

a. Calcule

b. Qu proporcin de bisagras miden ms de 75.0 mm?

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
c. Cul es la probabilidad de que la bisagra mida menos de 74.9 mm?

2. Funcin de densidad de probabilidad Normal

Esta distribucin juega un papel clave en el desarrollo de la inferencia estadstica,


pues muchas de las herramientas usadas en la toma de decisiones o en las pruebas
de hiptesis, tienen su fundamento en esta distribucin. Un gran nmero de
estudios pueden ser aproximados usando una distribucin normal. Algunas
variables fsicas, datos meteorolgicos (temperatura, precipitaciones, presin
atmosfrica, etc.), mediciones en organismos vivos, notas o puntajes en pruebas
de admisin o de aptitud, errores en instrumentacin, proporciones de errores en
diversos procesos, etc.

Esta distribucin es absolutamente simtrica alrededor de su media

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Densidad de probabilidad normal. Sea X una variable aleatoria continua. Se dice
que X se distribuye como una normal con parmetros y (estos parmetros
determinan el centro y la dispersin de la distribucin y la caracterizan
completamente), lo cual se escribe , si X tiene funcin densidad de
probabilidad dada por,

Por medio del clculo se puede probar que realmente esta funcin es funcin de
densidad de probabilidad. Adems, es simtrica alrededor de . Tiene forma
acampanada, el rea bajo la curva (considerando todo el dominio de la v.a)
siempre es igual a 1.

La distribucin normal cumple la siguiente regla:

El intervalo contiene aproximadamente el 68% de las mediciones.


El intervalo 2 contiene aproximadamente el 95% de las mediciones.
El intervalo 3 contiene algo ms del 99% de las mediciones.

Esta regla se conoce como la regla emprica de la normal. Grficamente,

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Si X es una v.a. normal con parmetros y , la probabilidad de que se
calcula as:

Para calcular probabilidades relacionadas con la normal se hace necesario utilizar


tablas estndar de normalidad. Esto es porque las integrales que surgen en este
tipo de problemas son extremadamente difciles de resolver. Afortunadamente,

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
cualquier variable aleatoria normal se puede transformar en una normal con
media = 0 y varianza = 1; esto se logra por medio de la siguiente transformacin.

Suponga que X es una variable aleatoria normal con parmetros y . La variable


aleatoria Z, se define como:

Pero Es equivalente la probabilidad original a la obtenida con esta


transformacin? La respuesta es afirmativa, ya que,

Una variable aleatoria X que se transforme de esta manera se dice que es una
variable aleatoria estandarizada. Una vez una variable este estandarizada ya no es
necesario resolver la integral ya que sus valores estn tabulados.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Propiedades de la distribucin de probabilidad Normal Estndar

Usando el hecho de que la distribucin normal estndar es simtrica con respecto


al cero, es posible hacer algunas afirmaciones que en un momento dado pueden
facilitar el uso de la tabla.
Suponga que la variable ; las siguientes afirmaciones se cumplen,

a.

b.

c.

d.

Ejemplo: La resistencia a la comprensin de una serie de muestras de cemento


puede modelarse por medio de una distribucin normal con una resistencia media
de 6000 kg y una desviacin estndar de 100 kg por centmetro cuadrado Cul es
la probabilidad de que la resistencia de una muestra sea inferior a 6200 kg por
centmetro cuadrado?

Solucin

Sea X: Resistencia a la compresin de una muestra de cemento. Por la informacin


del problema se sabe que . La probabilidad pedida es,

Entonces,

( )
De esta forma se estandariza.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Ejemplo: Una encuesta realizada entre 1000 estaciones de gasolina en los estados
unidos revel que el precio por galn tiene aproximadamente una distribucin
normal con media $1.90 y desviacin estndar $0.20. Cuntas de estas estaciones
cobran entre $1.50 y $2.30 por un galn de gasolina corriente?

Solucin

Observe que el precio de $1.50 por galn est a dos desviaciones estndar abajo
de la media y el precio de $2.30 est a dos desviaciones estndar arriba de la
media. Por la regla emprica, 95.4% de los datos se encuentra entre dos
desviaciones estndar de la media. Por lo tanto 0.954*1000=954 de las estaciones
cobran entre $1.50 y $2.30 por galn de gasolina corriente en los estados unidos

Ejemplo: Se observ durante un largo tiempo que la cantidad semanal gastada en


el mantenimiento y en las reparaciones de cierto taller tiene aproximadamente
una distribucin normal con media de $400000 y desviacin estndar de $20000.
Si el presupuesto para la prxima semana es de $450000, Cul es la probabilidad
de que los costos sean mayores que la cantidad presupuestada?

Solucin: Sea X=cantidad gastada en mantenimiento y reparacin

( )

Por lo tanto, es muy improbable que los costos reales superen la cantidad
presupuestada.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
con un promedio de onzas por vaso. Si la cantidad de onzas por vaso X se puede
Ejemplo: Se puede ajustar una mquina de caf de tal manera que llene los vasos

asumir que es una . Halle el valor de de tal manera que los vasos de
ocho onzas se derramen con una probabilidad de 0.01.

Solucin:


. Se debe hallar el valor de que
Sea X = cantidad de onzas por vasos. Se sabe que . Es claro que un
vaso de ocho onzas se derramar si
garantice la siguiente condicin:

Normalizando se tiene que,


( )


( )

Si se observa l atabla de la normal estndar, hay un valor abajo del cual el rea es
igual a 0.99 y tal valor es 2.33; por lo tanto el rea arriba de 2.33 ser 0.01;
entonces,

Despejando se obtiene que , es decir, la mquina de caf debe ajustarse


a un promedio de llenado de 7.301 para garantizar que los vasos de ocho onzas se
derramen con una probabilidad de 0.01

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Tabla de la Normal Estndar

Entendido el concepto de transformar cualquier normal a una normal estndar, el


problema se simplifica debido a que esta ltima se encuentra tabulada.

Tarea 020

1. Calcule las siguientes probabilidades utilizando las talas de la normal


estandarizada.
a.
b.
c.
d.
e.

2. Identifique como se puede evaluar el supuesto de normalidad para


cada uno de los siguientes casos:
a. Modo grfico (no aplica la generacin de histograma)
b. Mtodo analtico (Pruebas no paramtricas)
c. Por medio de R

3. Seleccione mnimo 50 datos de una variable de inters y utilice los


tres caminos propuestos en el punto anterior para revisar el
supuesto de normalidad y concluya si dicha variable cumple o no el
supuesto.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Ejemplo: Usando una tabla de la normal estndar calcule las siguientes
probabilidades:

a.
b.
c.
d.
e.

Solucin:

a.

b. =

c.

d.

e.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Evaluacin del supuesto de normalidad.

Cuando se est en presencia de una muestra aleatoria, es ciertamente importante


determinar si proviene o no de una poblacin la cual se distribuye normalmente.
Existen pruebas grficas y estadsticas para determinar si un conjunto de n datos
sobre una variable proviene o no de una distribucin normal.

Mtodo grfico: Q-Q Plot o grfico de normalidad. Este mtodo compara los
valores empricos (o muestrales) de los cuartiles con los valores reales (o tericos)
de los cuartiles de una normal. Si los datos provienen de una distribucin normal,
el grfico de los cuartiles empricos contra los reales lucir como una lnea recta. Si
los datos se distribuyen normalmente los puntos en el grfico caen de manera muy
aproximada sobre una lnea recta con intercepto y pendiente .

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Retomemos los datos de estudiantes de Quinto grado estudiando en los captulos
de estadstica descriptiva.

Quinto Grado Quinto Grado


Peso en Kg. Edad en aos.
20.6 21.4 23.5 24.5 25.3 26 27.3 28 28.6 29.6 9 10 9 10 9 9 10 10 9 9
30.4 33.1 34.6 34.6 35 35.1 35.4 36.2 36.6 36.9 10 9 8 10 9 10 11 9 10 11
37 38.7 38.7 39.9 40.6 41 42 42 44.5 45.3 9 10 9 9 9 8 10 10 8 10

En R es posible realizar el grfico Q-Q plot para cualquier variable cuantitativa. La


siguiente figura ilustra este grfico para la variable Peso.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
El siguiente es el cdigo en R

PESO <- c(33.1,35.4,36.6,45.3,37,38.7,23.5,34.6,44.5,41,35,


36.2,27.3,28.6,39.9,36.9,38.7,21.4,42,30.4,25.3,20.6,29.6,
42,26,24.5,35.1,40.6,28,34.6)
qqnorm(PESO); qqline(PESO, col = 2)

Esta grfica nos podra dar entender que la variable Peso podra poseer un
comportamiento normal debido a que muchos puntos se traslapan con la lnea a lo
largo de esta.

Las siguientes figuras fueron generadas en el paquete estadstico IBM SPSS


Statistic.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Esta grfica nos podra dar entender que la variable Edad posiblemente no tenga
un comportamiento normal debido a que muchos puntos son repetitivos sin
permitir que se traslapen con la lnea a lo largo de esta.

Prueba de Normalidad Shapiro-Wilk (No Paramtrica)

Para probar normalidad univariada este test es el que ms se recomienda. Es de


resaltar que este test no pertenece a la familia de tests de Kolmogorov. Si solo se
dispone de tablas para comparar este estadstico, se recomienda su uso cuando el
tamao maestral es menor o igual a 50 aunque los paquetes estadsticos actuales
estn en capacidad de calcularlo para muestras ms grandes. El alcance de este
curso no abordar el clculo analtico de esta prueba de normalidad, sin embargo,
en el texto de Conover de estadstica No Paramtrica se encuentra en detalle el
desarrollo analtico.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Las hiptesis de esta prueba son:

(Hiptesis nula): es una funcin de distribucin normal, con media y


varianza no especificadas.
(Hiptesis alternativa): no es normal.

Para la variable EDAD rechazo y para PESO no se puede rechazar

Desde R es posible calcular el estadstico y valor p dela prueba Shapiro Wilk.

> EDAD=c(9,10,9,10,9,9,10,10,9,9,10,9,8,10,9,10,11,
+ 9,10,11,9,10,9,9,9,8,10,10,8,10)
> shapiro.test(EDAD)
Shapiro-Wilk normality test
data: EDAD
W = 0.86, p-value = 0.001014
> PESO=c(33.1,35.4,36.6,45.3,37.0,38.7,23.5,34.6,44.5,
+ 41.0,35.0,36.2,27.3,28.6,39.9,36.9,38.7,21.4,42.0,30.4,25.3)
> shapiro.test(PESO)
Shapiro-Wilk normality test
data: PESO
W = 0.9582, p-value = 0.4811

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
ndice de Asimetra
La asimetra de una distribucin hace referencia al grado en que los datos se
reparten por encima (derecha) y por debajo (izquierda) de la tendencia central.

ndice de Curtosis
La Curtosis hace referencia al grado de apuntamiento de la distribucin.

Podramos mencionar que si el valor del ndice de Asimetra es 00.5, se habla de


una posible distribucin normal aunque es indispensable apoyarse en otras
verificaciones. Si el valor del ndice de Curtosis es 00.5, se dice que los datos
estn muy bien distribuidos.
Se pudiera pensar que si la media, mediana y moda de una variable presentaran
valores muy similares, se dice que los datos se distribuyen normalmente.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Descriptivos

Estadstico Error tp.

EDAD Media 9,43 ,141

Intervalo de confianza para Lmite inferior 9,14


la media al 95% Lmite superior 9,72

Media recortada al 5% 9,43

Mediana 9,00

Varianza ,599

Desv. tp. ,774

Mnimo 8

Mximo 11

Rango 3

Amplitud intercuartil 1

Asimetra -,001 ,427

Curtosis -,214 ,833


PESO Media 33,747 1,2645

Intervalo de confianza para Lmite inferior 31,160


la media al 95% Lmite superior 36,333

Media recortada al 5% 33,835

Mediana 35,050

Varianza 47,971

Desv. tp. 6,9261

Mnimo 20,6

Mximo 45,3

Rango 24,7

Amplitud intercuartil 11,2

Asimetra -,288 ,427

Curtosis -,895 ,833

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
3. Funcin de densidad de probabilidad Chi-cuadrado

Este tipo de distribucin se utiliza para modelar procesos que tienen que ver con
tiempos de llegada, por ejemplo el tiempo que tarda una persona en una sala de
espera de un hospital; observe que intuitivamente es razonable pensar que es ms
probable que transcurra un intervalo de tiempo entre minutos que un
intervalo de tiempo pequeo comprendido entre minutos; tambin tiempos
de espera grandes comprendidos entre son poco probables; grficamente
se puede visualizar lo anterior.

Fuente: Juan C. Salazar., 2010. Elementos de probabilidad y estadstica. Notas de clase. Universidad Nacional
de Colombia. Sede Medelln

Esta distribucin es sesgada a derecha (y por lo tanto no es simtrica) y puede


considerarse como uno de los pilares sobre los que reposa la teora de la inferencia
estadstica clsica ya que otras importantes distribuciones se pueden derivar a
partir de ella y ella misma sirve para probar hiptesis.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Definicin: Sea X una v.a continua. Se dice que X se distribuye como una chi-
cuadrado con r grados de libertad, lo cual se denota variable , si su f.d.p
est dada por:

es llamada la funcin gamma, la cual se define como

Para calcular probabilidades relacionadas con la distribucin chi-cuadrado se


cuenta con tablas que dependen de los grados de libertad y de paquetes
estadsticos como R.

Para entender intuitivamente el concepto de grado de libertad considere la


siguiente situacin: si se tienen tres casillas las cuales deben ser llenadas de
manera que su suma sea 10 y de antemano se fijan dos nmeros, solamente hay
una eleccin posible para el tercer nmero, por lo que se considera que para
completar la operacin se tiene un grado de libertad; por ejemplo, el problema es
llenar las tres casillas _+_+_=10, si se realiza 2+6+_=10 es claro que para la tercera
casilla la nica eleccin posible es el nmero 2; es decir, solo hay un grado de
libertad en nuestra eleccin.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Uso de la Tabla de la distribucin Chi-Cuadrado

Usualmente, los libros de probabilidad incluyen tablas de esta distribucin que


pueden ser de cola inferior o de cola superior. A continuacin se presenta la una
imagen de cola superior:

Ahora se vern algunos ejemplos para ilustrar su uso.

EJEMPLO. Usando la tabla de la chi-cuadrado calcule las siguientes probabilidades:

a.

b.

c.

Tarea 021

1. Investigue la relacin entre la distribucin Chi-Cuadrado y la


distribucin Normal.

2. Investigue la relacin entre la distribucin Normal y la distribucin


Chi-Cuadrado.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
4. Funcin de densidad de probabilidad T de Student

Esta funcin se relaciona estrechamente con la normal estndar y la chi-cuadrado.


Juega un papel importante en la teora de la inferencia estadstica. Para calcular
probabilidades relacionadas con la t se utilizan unas tablas que dependen de los
grados de libertad.

Esta distribucin de probabilidad surge del problema de estimar la media de una


poblacin normalmente distribuida cuando el tamao de la muestra es pequeo.

Definicin: Sea Z una variable aleatoria normal estndar y sea W una variable
aleatoria chi-cuadrado con r grados de libertad. Entonces si Z y W son
independientes, se dice que tiene una distribucin t de Student con r grados de
libertad. Un grfico de la distribucin t y de la normal estndar.

Observe que las colas de la distribucin t son mucho ms alargadas que en la


distribucin normal. Valores muy extremos para la normal que tienen
probabilidades muy pequeas son valores con probabilidades significativas para la

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
distribucin t. Tambin a medida que se incrementan los grados de libertad de la t
esta se parece mucho ms a la normal estndar.

Ejemplo: Usando la tabla de la t de Student calcule las siguientes probabilidades:


a.

b.

Ejemplo: Usando la tabla de la t de Student calcule los valores de x

a.

b. que implica que


y segn la tabla corresponde a un valor de

5. Funcin de distribucin de probabilidad F de Snedecor.

Esta funcin se relaciona estrechamente con la chi-cuadrado. Juega un papel


importante en la teora de la inferencia estadstica. Para calcular probabilidades
relacionadas con la F se utilizan unas tablas que dependen de los grados de
libertad.

Definicin: Sea una variable aleatoria chi-cuadrado con grados de libertad y


sea una variable aleatoria chi-cuadrado con grados de libertad. Entonces si
y son independientes,

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z
Se dice que tiene una distribucin F de Snedecor con grados de libertad en el
numerador y grados de libertad en el denominador.

Esta distribucin no es simtrica y por lo tanto la tabla de la F no puede usarse de


manera igual a la de la normal

La distribucin F aparece frecuentemente como la distribucin nula de una prueba


estadstica, especialmente en el anlisis de varianza, en modelos lineales (por
ejemplo los de regresin lineal) y los modelos lineales mixtos.

Ejemplo: Usando la tabla de la F calcule las siguientes probabilidades

a.

b.

Mdulo: Fu da e tos de I fere cia Estadstica Doce te: Gustavo Vale cia Z