Sie sind auf Seite 1von 31

Estadstica

UnidadAleatorias
III
Variables
y

distribuciones especiales

Variable aleatoria

El resultado de un experimento aleatorio puede ser


descrito en ocasiones como una cantidad numrica.

En estos casos aparece la nocin de variable aleatoria

Funcin que asigna a cada suceso un nmero.

Las variables aleatorias pueden ser discretas o


continuas
En las siguientes diapositivas vamos a recordar
conceptos de temas anteriores, junto con su nueva
designacin. Los nombres son nuevos. Los conceptos
no.

Funcin de probabilidad (V. Discretas)

Asigna a cada posible valor


de una variable discreta su
probabilidad.

Recuerda los conceptos de


frecuencia relativa y diagrama de
barras.

Ejemplo
Nmero

de caras al lanzar 3
monedas.

Funcin de densidad (V. Continuas)

Definicin

Es una funcin no negativa de integral 1.

Pinsalo como la generalizacin del


histograma con frecuencias relativas para
variables continuas.

Para qu lo voy a usar?


Nunca lo vas a usar directamente.
Sus valores no representan probabilidades.

Para qu sirve la f. densidad?

Muchos procesos aleatorios vienen descritos por variables de forma


que son conocidas las probabilidades en intervalos.

La integral definida de la funcin de densidad en dichos intervalos


coincide con la probabilidad de los mismos.

Es decir, identificamos la probabilidad de un intervalo con el rea bajo


la funcin de densidad.

Funcin de distribucin

Es la funcin que asocia a cada valor de una


variable, la probabilidad acumulada
de los valores inferiores o iguales.

Pinsalo como la generalizacin de las


frecuencias acumuladas. Diagrama integral.

A los valores extremadamente bajos les


corresponden valores de la funcin de
distribucin cercanos a cero.

A los valores extremadamente altos les


corresponden valores de la funcin de
distribucin cercanos a uno.

Para qu sirve la f. distribucin?

Contrastar lo anmalo de una observacin concreta.

S que una persona de altura 210cm es anmala porque la funcin de


distribucin en 210 es muy alta.
S que una persona adulta que mida menos de 140cm es anmala porque
la funcin de distribucin es muy baja para 140cm.
S que una persona que mida 170cm no posee una altura nada extraa pues
su funcin de distribucin es aproximadamente 0,5.

Relacinalo con la idea de cuantil.

En otro contexto (contrastes de hiptesis) podremos observar unos


resultados experimentales y contrastar lo anmalos que son en
conjunto con respecto a una hiptesis de terminada.

Intenta comprender la explicacin de clase si puedes. Si no, ignora esto


de momento. Revisita este punto cuando hayamos visto el tema de
contrastes de hiptesis.

Valor esperado y varianza de una v.a. X

Valor esperado
Se

representa mediante E[X]


Es el equivalente a la media

Varianza
Se

representa mediante VAR[X] o 2


Es el equivalente a la varianza
Se llama desviacin tpica a

Algunos modelos de variables aleatorias


discretas y continuas
Hay variables aleatorias que aparecen con frecuencia en las
distintas ciencias.

Experimentos dicotmicos.
Bernoulli

Contar xitos en experimentos dicotmicos repetidos:


Binomial
Poisson (sucesos raros)

Y en otras muchas ocasiones


Distribucin normal (gaussiana, campana,)

Modelo discreto: (1) Distribucin de Bernoulli

Tenemos un experimento de Bernoulli si al realizar un


experimentos slo son posibles dos resultados:
X=1 (xito, con probabilidad p)
X=0 (fracaso, con probabilidad q=1-p)
Lanzar una moneda y que salga cara.

Elegir una persona de la poblacin y que est enfermo.

p=1/1000 = prevalencia de la enfermedad

Aplicar un tratamiento a un enfermo y que ste se cure.

p=1/2

p=95%, probabilidad de que el individuo se cure

Como se aprecia, en experimentos donde el resultado


es dicotmico, la variable queda perfectamente
determinada conociendo el parmetro p.
10

Ejemplo de distribucin de Bernoulli.

Se ha observado estudiando 2000 accidentes de trfico


con impacto frontal y cuyos conductores no tenan
cinturn de seguridad, que 300 individuos quedaron con
secuelas. Describa el experimento usando conceptos de
v.a.

Solucin.

La nocin frecuentista de probabilidad nos permite aproximar la


probabilidad de tener secuelas mediante 300/2000=0,15=15%

X=tener secuelas tras accidente sin cinturn es variable de Bernoulli


X=1 tiene probabilidad p 0,15
X=0 tiene probabilidad q 0,85
11

Observacin

En el ejemplo anterior hemos visto cmo enunciar los resultados


de un experimento en forma de estimacin de parmetros en
distribuciones de Bernoulli.

Sin cinturn: p 15%


Con cinturn: p 0,5%

En realidad no sabemos en este punto si ambas cantidades son


muy diferentes o aproximadamente iguales, pues en otros estudios
sobre accidentes, las cantidades de individuos con secuelas
hubieran sido con seguridad diferentes.

Para decidir si entre ambas cantidades existen diferencias


estadsticamente significativas necesitamos introducir conceptos
de estadstica inferencial (extrapolar resultados de una muestra a
toda la poblacin).

Es muy pronto para resolver esta cuestin ahora. Esperemos a las


pruebas de X2.

12

(2) Modelo Discreto: Distribucin Binomial

Si se repite un nmero fijo de veces, n, un experimento


de Bernoulli con parmetro p, el nmero de xitos sigue
una distribucin binomial de parmetros (n, p).

Lanzar una moneda 10 veces y contar las caras.

Lanzar una moneda 100 veces y contar las caras.

Bin (n=10,p=1/2)

Bin (n=100,p=1/2)
Difcil hacer clculos con esas cantidades. El modelo normal ser ms
adecuado.

El nmero de personas que enfermar (en una


poblacin de 500.000 personas) de una enfermedad
que desarrolla una de cada 2000 personas.

Bin(n=500.000, p=1/2000)
Difcil hacer clculos con esas cantidades.

Distribucin binomial

Funcin de probabilidad
n x n x
P[ X x] p q , 0 x n
x

Problemas de clculo si n es grande y/o p cercano a 0 o 1.

Esperanza:
E[ X ] np

Varianza: Var [ X ] 2 npq

Modelo Discreto: (3) Distribucin de


Poisson

Se usa para modelar situaciones en las que hay


ocurrencias aleatorias de suceso por unidad de
tiempo y en donde se desea conocer la
probabilidad de un nmero especfico de xitos.
Su funcin de probabilidad est dada por:
x

P[ X x] e
;
x!

tal que

x 0,1,2,...

E[ X ] Var [ X ]
15

Observaciones

Tambin se denomina de sucesos raros.


Se obtiene como aproximacin de una distribucin
binomial con la misma media, para n grande (n>30)
y p pequeo (p<0,1).

16

Ejemplo:

La central de una compaa de pedidos por correos recibe un


promedio de 3,5 rdenes por hora. Estas ocurrencias se
producen al azar. No existe un patrn durante el da, o de un
da a otro. Cul es la probabilidad de que se produzcan
cuatro llamadas en una hora?Cul es la probabilidad que se
produzcan por lo menos 5 llamadas?
Sol.
4
3
,
5
P[ X 4] e 3,5
0,189
4!

P[ X 5] 1 P[ X 4] 1 0,7254 0,2746
17

Modelos Discretos: (4) Distribucin normal o de


Gauss
Aparece de manera natural:
Errores

de medida.
Distancia de frenado.
Altura, peso, propensin al crimen
Distribuciones binomiales con n grande (n>30) y p ni
pequeo (np>5) ni grande (nq>5).

Est caracterizada por dos parmetros: La media, ,


2
y la desviacin tpica, .
1 x

1
f ( x)
e 2
2
Su funcin de densidad es:

N(, ): Interpretacin
geomtrica

Puedes interpretar la
media como un factor
de traslacin.

Y la desviacin tpica
como un factor de
escala, grado de
dispersin,

N(, ): Interpretacin probabilista

Entre la media y una


desviacin tpica
tenemos siempre la
misma probabilidad:
aprox. 68%

Entre la media y dos


desviaciones tpicas
aprox. 95%

Algunas caractersticas

La funcin de densidad es simtrica, mesocrtica y unimodal.

Media, mediana y moda coinciden.

Los puntos de inflexin de la fun. de densidad estn a distancia de .

Si tomamos intervalos centrados en , y cuyos extremos estn

a distancia ,
a distancia 2 ,
a distancia 25

tenemos probabilidad 68%


tenemos probabilidad 95%
tenemos probabilidad 99%

No es posible calcular la probabilidad de un intervalo simplemente


usando la primitiva de la funcin de densidad, ya que no tiene primitiva
expresable en trminos de funciones comunes.

Todas las distribuciones normales N(, ), pueden ponerse mediante una


traslacin , y un cambio de escala , como N(0,1). Esta distribucin
especial se llama normal tipificada o normal estndar.

Justifica la tcnica de tipificacin, cuando intentamos comparar individuos


diferentes obtenidos de sendas poblaciones normales.

Tipificacin o Estandarizacin

Dada una variable de media y desviacin tpica , se denomina


valor tipificado,z, de una observacin x, a la distancia (con signo) con
respecto a la media, medido en desviaciones tpicas, es decir

x
z

En el caso de variable X normal, la interpretacin es clara: Asigna a


todo valor de N(, ), un valor de N(0,1) que deja exctamente la
misma probabilidad por debajo.

Nos permite as comparar entre dos valores de dos distribuciones


normales diferentes, para saber cul de los dos es ms extremo.

Tabla N(0,1)

Z es normal estndar
Calcular P[Z<1,85]

Solucin: 0,968 = 96,8%

Tabla N(0,1)

Z es normalestndar
Calcular P[Z<-0,54]

Solucin: 1-0,705 = 0,295

Tabla N(0,1)

Z es normal estndar
Calcular P[-0,54<Z<1,85]

Solucin: 0,968-0,295= 0,673

Ejemplo: Clculo con probabilidades normales

El colesterol en la poblacin tiene distribucin


normal, con media 200 y desviacin 10.

Qu porcentaje de individuos tiene


colesterol inferior a 210?

Qu valor del colesterol slo es superado por


el 10% de los individuos.

Todas las distribuciones normales son similares salvo traslacin y cambio de


escala: Tipifiquemos.

210 200

1
10

P[ Z 1,00] ( ver tabla) 0,841

El valor del colesterol que slo supera el 10% de los individuos es el percentil 90.
Calculemos el percentil 90 de la N(0,1) y deshacemos la tipificacin.

x 200
1,28
10
x 200 10 1,28 212,8

Ejemplo: Tipificacin

Se quiere dar una beca a uno de dos estudiantes de


sistemas educativos diferentes. Se asignar al que
tenga mejor expediente acadmico.
El estudiante A tiene una calificacin de 8 en un sistema
donde la calificacin de los alumnos se comporta como
N(6,1).
El estudiante B tiene una calificacin de 80 en un sistema
donde la calificacin de los alumnos se comporta como
N(70,10).

Solucin

No podemos comparar directamente 8 puntos de A frente a


los 80 de B, pero como ambas poblaciones se comportan
de modo normal, podemos tipificar y observar las
puntuaciones sobre una distribucin de referencia N(0,1)

xA A 8 6
zA

2
A
1
xB B 80 70
zB

1
B
10
Como ZA>ZB, podemos decir que el
porcentaje de compaeros del mismo
sistema de estudios que ha superado
en calificacin el estudiante A es
mayor que el que ha superado B.
Podramos pensar en principio que A
es mejor candidato para la beca.

Qu hemos visto?

En v.a. hay conceptos equivalentes a los de temas


anteriores
Funcin de probabilidad Frec. Relativa.
Funcin de densidad histograma
Funcin de distribucin diagr. Integral.
Valor esperado media,

Hay modelos de v.a. de especial importancia:


Bernoulli, Binomial y Poisson.
Normal

Propiedades geomtricas
Tipificacin
Aparece tanto en problemas con variables cualitativas
(dicotmicas, binomial) como numricas

Das könnte Ihnen auch gefallen