Sie sind auf Seite 1von 10

Captulo 6.

Variables Aleatorias
En el captulo 4, de estadstica descriptiva, se estudiaron las distribuciones de frecuencias de conjuntos
de datos y en el captulo 5 se trataron los fundamentos de la teora de probabilidades. Es posible
combinar estas ideas para obtener distribuciones de probabilidad que se parecen bastante a las
distribuciones de frecuencias relativas, la diferencia ms importante entre las distribuciones de
probabilidad y las de frecuencia relativa, es que las distribuciones de probabilidad son probabilidades
tericas (modelo), mientras que las distribuciones de frecuencias relativas son probabilidades empricas
(muestras).
En el captulo anterior vimos que los espacios muestrales no son necesiriamente numricos. Cuando por
ejemplo lanzamos una moneda tres veces, podemos registrar un resultado como ccs. En estadstica, sin
embargo nos interesan los resultados numricos, tal como el nmero de caras al lanzar una moneda tres
veces.
Se tiene el experimento aleatorio: Lanzar una moneda 3 veces
El espacio muestral que corresponde a este experimento es: S={ccc, ccs, css, csc, sss, ssc, scc, scs}
Sea X = nmero de caras, qu valores puede tomar la variable X?
Espacio Muestral
sss
css, ssc, scs
ccs, csc, scc
ccc

Variable aleatoria X
x1 = 0
x2 = 1
x3 = 2
x4 = 3

Sea Y = nmero de caras menos nmero de sellos, qu valores puede tomar Y?


Definicin:
Una variable aleatoria es un nmero que depende del resultado aleatorio de un experimento.
Una variable aleatoria es una regla que asigna un valor numrico (slo uno) a cada punto en el espacio
muestral de un experimento aleatorio.
Suponga que se aplicar una encuesta a los estudiantes de la UTal donde se preguntar por el nmero
de cursos inscritos este semestre. Identifique la variable aleatoria de inters y enumere sus valores
posibles.
Nota: normalmente se usan letras maysculas, y del final de abecedario, (X, Y, o Z) para denotar
variables aleatorias.
Ahora nos interesa aprender cmo asignar probabilidades a eventos y para eso vamos a distinguir dos
tipos de variables aleatorias:
Una variable aleatoria discreta puede tomar valores finitos o contables.
Una variable aleatoria continua puede tomar cualquier valor en un intervalo.

Funcin de distribucin
P(X=x)
Altura

Discreta

Variable
aleatoria
X

probabilidad
Funcin densidad
f(x)=P(a<X<b)

Continua

Area

densidad

6.1 Variables aleatorias discretas


Si la variable aleatoria es discreta la describimos segn su distribucin de probabilidades, que consiste
en una lista de valores posibles de la variable y la proporcin de veces que esperamos que ocurran:
x
P(x)

x1
p1

x2
p2

...
...

xk
pk

Volvamos al experimento aleatorio de lanzar una moneda 3 veces


Espacio muestral S={ccc, ccs, css, csc, sss, ssc, scc, scs}
Sea X = nmero de caras,
x = 0, 1, 2, 3
Escriba la distribucin de probabilidades de X:
x
P(x)

Modelo para el nmero de libros en mochilas de estudiantes


Sea X una variable aleatoria que representa el nmero de libros que llevan en la mochila los estudiantes
de esta universidad:
x
P(x)

0
0,5

1
0,2

2
0,2

3
0,1

a) Describa la forma de la distribucin


b) Qu proporcin de estudiantes llevan 3 o menos libros ( X 3)?
c) Qu proporcin de estudiantes llevan ms de 2 libros ( X 2 )?
d) Qu proporcin de estudiantes llevan entre 2,1 y 2,8 libros ( 2,1 X 2,8 )?
e) Qu proporcin de estudiantes llevan entre 1 y 2 libros ( 1 X 2 )?
La distribucin de probabilidades de una variable aleatoria discreta X es una funcin (tabla o regla),
denotada por p(x) o P[ X=x ], que asigna una probabilidad a cada valor posible de la variable aleatoria
X.
Propiedades de una funcin de distribucin:
2

1. Los valores de las probabilidades estn entre 0 y 1 ( 0 p( x) 1 ) para todo x


2. La suma de las probabilidades es 1 (

p( x) 1 )

Tamao familiar
Sea X el nmero de personas de hogares en el censo 2002 (http://www.ine.cl/cd2002/index.php)
x
p(x)

1
0,11

2
0,18

3
0,22

4
0,23

5
0,14

6
0,07

7 y ms

a) Cunto debe ser la probabilidad de que el tamao familiar sea de 7 y ms personas para que esta sea
una distribucin de probabilidades discreta legtima?
b) Muestre grficamente la distribucin de probabilidades.
c) Cul es la probabilidad de que un hogar elegido al azar tenga un tamao familiar de ms de 5
personas?
d) Cul es la probabilidad de que un hogar elegido al azar tenga un tamao familiar de no ms de 2
personas?
e) Cul es P (2 X 4) ?
No todas las tablas representan un modelo discreto
Un modelo discreto puede servir para describir la distribucin de una variable cualitativa, pero no
cualquier tabla representa una variable aleatoria. Considere por ejemplo la siguente tabla que contiene
informacin acerca del tipo de mascota que poseen en cierto barrio:
Mascota
Proporcin

Perro
0,70

Gato
0,40

Otras
0,20

Es esta una distribucin discreta legtima?

Si X es una variable aleatoria discreta que toma valores x1, x2, ... xk, con probabilidad p1, p2,... pk,
entonces la media o el valor esperado de X est dado por:
E ( X ) X x1 p1 x2 p2 xk p k
k

E ( X ) xi pi
i 1

la varianza de X est dada por:

Var ( X ) x2 E X

Var ( X ) xi2 pi 2

y la desviacin estndar de X est dada por:


x x2

En el caso del nmero de caras al lanzar 3 monedas, la distribucin de probabilidades de X es:


x
p(x
)

1
8

3
8

3
8

0
1/
8

La media de X es: E ( X ) X 0 1 2 3
E( X ) 0

2
3/
8

3
1/8

1
8

3 6 3 12

1,5 caras
8 8 8
8

Var ( X ) 0 2

1 23
3
1
2
1 2 2 32 1,5
8
8
8
8

Var ( X ) 0
Var ( X )

1
3/
8

3 12 9
2

1,5
8 8 8

24
2,25 0,75
8

y la desviacin estndar de X es : x

0,75 0,866 caras

Calcule las medias y desviaciones estndar en los dems ejercicios.

6.2 Variables aleatorias continuas


Definicin:
Una funcin de densidad es una funcin o curva que describe la forma de una distribucin.
El rea total bajo la curva es igual a uno y calculamos probabilidades como reas bajo la curva de
densidad.
Propiedades de una funcin densidad:
La funcin densidad de una variable aleatoria continua X es una funcin, denotada por f(x), que
satisface:
1. f ( x) 0 La densidad es siempre mayor o igual a cero.
2. El rea bajo la curva de densidad es uno
3. P(a X b) P(a X b) = es el rea o proporcin entre a y b
La distribucin Normal
Existe una distribucin de frecuencias terica llamada distribucin normal, que puede considerarse como
modelo adecuado para la distribucin de un gran nmero de variables en el campo biolgico.
Notacin: X ~ N ( , ) se lee: X es una variable aleatoria continua con distribucin Normal, con
media y desviacin estndar .
La funcin densidad de una variable aleatoria Normal est dada por:
f ( x)

2
1
e x
2

2 2

- , 0

- x ,

Punto de
inflexin

Caractersticas:
-

Su grfico semeja una campana simtrica, cuyas colas se extienden hacia el infinito tanto en direccin
negativa como en la positiva.
El promedio, la mediana y la moda de la distribucin tienen el mismo valor.
La distribucin queda completamente definida por el promedio y la desviacin estndar. El promedio
nos informa sobre la posicin o ubicacin de la distribucin en el eje horizontal y la desviacin estndar
refleja la dispersin de los valores con respecto al promedio.
Distribucin #3:
Normal con media 80
Desviacin estndar 5
Distribucin #1:
Normal con media 50
Desviacin estndar 10

20

30

40

Distribucin #2:
Normal con media 80
Desviacin estndar 10

50

60

70

80

90

100

Los puntajes del test de inteligencia para nios WISC (Weschler Intelligence Scale for Children)
siguen una distribucin Normal con media 100 y desviacin estndar de 15
(http://nicologic.free.fr/FAQ.htm). Nos interesa saber qu proporcin de nios tendrn un CI menor
que 130?

rea a la izquierda de 130?


70

85

100

115

130

Ptje CI

Clculo de reas de una Distribucin Normal:

Definicin:
Si X ~ N ( , ) , la variable normal estandarizada es: Z
media cero y varianza igual a uno: Z ~ N (0,1) .

X
y tiene distribucin Normal con

Z es el nmero de desviaciones estndar que x difiere de la media :


Si Z > 0 entonces x es mayor a la media .
Si Z < 0 entonces x es menor a la media .
Si Z = 0 entonces x es igual a la media .

68,3%

95,4%
99,7%
- 3

- 2

+ 2

+ 3

Para cualquier distribucin Normal N , se cumple que:

68,3% de las observaciones se encontrarn a una desviacin estndar de la media, es decir dentro
del intervalo:
( - , + )

95,4% de las observaciones se encontrarn a dos desviaciones estndar de la media, i.e. dentro del
intervalo:
( - 2 , + 2 )

99,7% de las observaciones se encontrarn a tres desviaciones estndar de la media, i.e. dentro del
intervalo:
( - 3 , + 3 )

Aunque tericamente la distribucin llega a - y a +, en la prctica es muy raro encontrar valores a ms


de 3 desviaciones estndar del promedio.

Tabla: reas de la distribucin


Normal estandar

a)
b)
c)
d)
e)

Clculo de reas
Encuentre el rea de la distribucin Normal estndar que se encuentra a la izquierda de z = 1,22
Encuentre el rea de la distribucin Normal estndar que se encuentra a la derecha de z = 1,22
Encuentre el rea de la distribucin Normal estndar que se encuentra entre z = 0 y z =1,22
Encuentre el rea de la distribucin Normal estndar que se encuentra a la izquierda de z = -2,55
Encuentre el rea de la distribucin Normal estndar que se encuentra entre z = -1,22 y z = 1,22

Puntajes de CI
Suponga que definimos a X como los puntajes de CI del test de inteligencia WISC, con distribucin
N 100, 15

a) Qu proporcin de nios tendr un CI menor a 85?


b) Qu proporcin de nios tendr un CI mayor a 85?
c) Qu proporcin de nios tendr un CI entre 85 y 115?
Continuando con el modelo N 100, 15 para el puntaje de CI para nios, considere la siguiente
pregunta: Qu puntaje de CI debe tener un nio para ubicarse entre el 1% con ms alto puntaje?
El tiempo que demoran los nadadores de 100 metros mariposa sigue una normal con media 55
segundos y desviacin estndar de 5 segundos.
a) Los organizadores de un campeonato deciden dar certificados a todos los nadadores que terminen
antes de 49 segundos. Si hay 50 nadadores en los 100 metros mariposa, cuntos certificados se
necesitarn?
b) Con qu tiempo debe terminar un nadador para estar entre el 2% ms rpido de la distribucin de
tiempos?
a)
b)
c)
d)

Sea X es N 3, 2 :
Muestre grficamente esta distribucin en particular
Encuentre el rango entre cuartiles de la distribucin
Encuentre P ( X 3)
Encuentre P ( X 3)

Se cree que la altura de los pinos en un bosque tiene distribucin Normal. Queremos docimar las
siguientes hiptesis:
H 0 : X ~ N (15, 3)

H 1 : X ~ N (10, 3)

Las alturas de los pinos son medidas en metros. Decidiremos rechazar la hiptesis nula si la altura de un
pino seleccionado al azar del bosque mide menos de 8 metros.
Calcule la probabilidad del Error Tipo I,
b) Calcule la probabilidad del Error Tipo II,
c) Calcule el valor p si la altura del pino seleccionado fue de 8,5 metros.
a)

10