Beruflich Dokumente
Kultur Dokumente
Tema 3
Curso 2006/07
Sucesos {x,x,x} {c,x,x} {x,c,x} {x,x,c} {c,c,x} {x,c,c} {c,x,c} {c,c,c} Opcional:
X4 0 1 1 1 2 2 2 3
Estadstica
Tema 3
Curso 2006/07
Definicin. Sea E el espacio muestral asociado a un experimento aleatorio y un lgebra de sucesos asociado a E. Llamaremos variable aleatoria a una funcin
X : E R,
tal que para cualquier intervalo B = (-, b] de la recta real, el suceso X
1
( B)
siendo
X 1 ( B ) = { E / X ( ) B} .
Ejemplos. 1) X1: Sensacin que provocan las asignaturas de matemticas
P ( X = a ) = P( X 1 (a )) =P(sucesos que X asocia con el valor a) o bien P ( X B) = P( X 1 ( B)) = P(sucesos que X asocia con un valor del intervalo B)
Ejemplo: X: Nmero de caras al lanzar 3 monedas
P ( X = 1) = P X 1 ({1} ) = P ({c, x, x} , { x, c, x} , { x, x, c} ) =
3 8
4 8
1 8
Discretas: el conjunto de posibles valores que toma la variable es discreto (es decir, finito o numerable). Continuas: el conjunto de posibles valores es uno o varios intervalos de la recta real. Ejemplos: Discretas: X: Nmero de caras al lanzar 3 monedas (puede tomar slo los valores 0,1,2,3) X1: Sensacin que provocan las asignaturas de matemticas (puede tomar slo los valores 1,0,1) 2
Estadstica
Tema 3
Curso 2006/07
X2: Nmero de llamadas diarias que se hacen por telfono mvil (puede tomar los valores 0,1,2,3, infinito numerable) Continuas: Y1: Estatura de una poblacin (en centmetros) (puede tomar cualquier valor en el intervalo [0,250] ) Y2: Error cometido al redondear una nota media a un decimal (puede tomar cualquier valor en el intervalo [0.05,0.05] ) Y3: Tiempo mximo que he estado hablando por telfono alguna vez (en minutos) (puede tomar cualquier valor en el intervalo [0,+) ) Para cada tipo definiremos a continuacin funciones reales de variable real para trabajar con sus probabilidades: Funcin de masa o distribucin de probabilidad para v.a. discretas. Funcin de densidad para v.a. continuas.
Y posteriormente definiremos la funcin de distribucin (concepto ms general) que nos permite trabajar con todas las v.a.
1 3 3 1 P ( X = 0) = ; P( X = 1) = ; P( X = 2) = ; P ( X = 3) = 8 8 8 8
Z: Nmero de tiradas con un dado hasta que nos sale el primer 5 (puede tomar los valores 1,2,3,.. hasta el infinito)
1 51 5 1 5 P ( X = 1) = ; P( X = 2) = ; P( X = 3) = ;...; P ( X = n) = 6 66 6 6 6
n-1
1 ;... 6
Lo denominaremos distribucin de probabilidad de X o funcin de masa de X. Para dar una definicin general, denotaremos por:
{ xi }
p
iI
=1.
Estadstica
Tema 3
Curso 2006/07
La funcin de masa de las variables aleatorias discretas pueden representarse grficamente mediante un diagrama donde, en el eje OX dibujaramos los distintos puntos de masa de la variable y en ordenadas las probabilidades correspondientes. Ejemplo: X: Nmero de caras al tirar 3 monedas
Histogram
40
0.04 0.03
Density Trace
percentage
density
30 20 10
0.02 0.01 0
0 49 59 69 79 89 99 109
52
62
72
82
92
102
Peso
PESO GM23
Histogram
50
0.06 0.05
Density Trace
percentage
density
0.04 0.03 0.02 0.01 0 160 165 170 175 180 185 190
Estatura
ESTATURA GM23
Estadstica
Tema 3
Curso 2006/07
f ( x ) 0, x
f ( t ) dt = 1 .
Toda funcin de densidad determina la distribucin de probabilidad de una v.a. continua de la siguiente forma: 1. 2.
P ( a < X < b ) = f ( t ) dt , a, b
b a
. .
3. Entonces P ( a < X < b ) = P ( a X < b ) = P ( a X b ) = P ( a < X b ) Observacin: Los valores exactos de las v.a. continuas tienen probabilidad 0. Slo hay probabilidad no nula en intervalos. Ejemplos. Y1: Estatura de una poblacin
P ( X = x ) = f ( t ) dt = 0, x
x x
Histogram
50
Density Trace
0.06 0.05
percentage
density
0.04 0.03 0.02 0.01 0 160 165 170 175 180 185 190
Estatura
ESTATURA GM23
Tema 3
Curso 2006/07
P(170<Y1<180) P(Y1<160)
Y3: Tiempo mximo que he estado hablando por telfono alguna vez
Histogram
40
(X 0.001) 12 10
Density Trace
percentage
density
Duracin llamadas
Duracin llamadas
6
Estadstica
Tema 3
Curso 2006/07
P(Y3>60)
P(30<Y3<60)
P(Y3<45)
Y2: error al redondear a un decimal. La variable puede tomar valores 0.05<x<0.05. Como la probabilidad es homognea en todo el intervalo y fuera de l no hay probabilidad, la densidad ser una funcin constante f(x)=k si 0.05<x<0.05, y ser nula en el resto. Para hallar el valor de k, utilizamos la propiedad de que
f ( t ) dt = 1 :
f (t ) dt = 1
+0.05
0.05
k dt = 1 k 0.01 = 1
k = 10
Por tanto: f ( x ) =
10 0
Estadstica
Tema 3
Curso 2006/07
P (Y 2 < 0) =
f (t ) dt =
0.05
0 dt +
+0.01 0.01
0.05
10 dt = 10 0.05 = 0.5
Xa
F ( x) = P ( X x)
Observacin: La funcin de distribucin de una v.a. viene a ser como la distribucin de frecuencias relativas acumuladas de una variable estadstica. Ejemplos: Nmero de llamadas diarias que se hacen por telfono mvil
Si consideramos la v.a. X2: Nmero de llamadas diarias que hacen por telfono mvil los estudiantes del GM23 (curso 200/05), podramos tomar como
Estadstica
Tema 3
Curso 2006/07
Distribucin de probabilidad P(X2 = 0)= 0.3077 P(X2 = 1)= 0.3590 P(X2 = 2)=0.1795 P(X2 = 3)=0.1026 P(X2 = 4)=0.0256 P(X2 = 5)=0.0256
Funcin de distribucin
P ( X 2 = n) = 1
n=0
0 si x < 0 si x < 0 si 0 x <1, P(X2 = 0) 0.3077 si 0 x <1 si 1 x < 2, P(X2 = 0) + P(X2 =1) 0.6667 si 1 x < 2 F(x) = P(X2 x) = si 2 x < 3, P(X2 = 0) +... + P(X2 = 2) = 0.8462 si 2 x < 3 si 3 x < 4, P(X2 = 0) +... + P(X2 = 3) 0.9487 si 3 x < 4 si 4 x < 5, P(X2 = 0) +... + P(X2 = 4) 0.9744 si 4 x < 5 si 5 x, P(X2 = 0) +... + P(X2 = 5) 1 si 5 x
100
percentage
80 60 40 20 0 -1 0 1 2 3 4 5 6
Llamadas diarias
Funcin de distribucin de una v.a. discreta. La funcin de distribucin de una v.a. discreta es una funcin escalonada con saltos en los puntos de masa.
Estadstica
Tema 3
Curso 2006/07
Clculo de probabilidades a partir de la funcin de distribucin de una v.a. discreta: Idea: hay probabilidad en aquellos puntos en los que hay salto, y la probabilidad es precisamente la magnitud del salto. Formalmente, si denotamos F xo siguientes igualdades: 1. 2. 3. 4.
( ) = lim F ( x ) = P ( X < x ) ,
x x0
P ( X = a ) = F (a ) F a .
P ( a < X b ) = F ( b ) F ( a ) , a, b
. . . .
( )
P ( a X b ) = F ( b ) F ( a ) , a, b P ( a < X < b ) = F ( b ) F ( a ) , a, b
5. P ( a X < b ) = F ( b ) F ( a ) , a, b
Ejemplo:
0 si x < 0 0.3 si 0 x < 1 0.7 si 1 x < 2.5 F ( x ) = 0.8 si 2.5 x < 3 , hallar su distribucin 0.95 si 3 x < 4 1 si 4 x
Hay probabilidad en los puntos donde hay salto: 0, 1, 2.5, 3 y 4. Sus probabilidades son la magnitud del salto: P(X=0)=0.30=0.3 P(X=1)=0.70.3=0.4 P(X=2.5)=0.80.7=0.1 P(X=3)=0.950.8=0.15 P(X=4)=10.95=0.05 Para hallar P(X<2), P(1X<4), lo ms sencillo es ver qu puntos con probabilidad cumplen la condicin dada: P(X<2)=P(X=0)+P(X=1)=0.3+0.4=0.7 P(1X<4)=P(X=1)+P(X=2.5)+P(X=3)=0.4+0.1+0.15=0.55
Funcin de distribucin de una v.a. continua. Ejemplo: Sea Y2: error al redondear a un decimal. La funcin de densidad es f ( x ) =
10 0
10
Estadstica
Tema 3
Curso 2006/07
Por definicin, su funcin de distribucin es F ( x ) = P ( X x ) . Al ser una v.a. continua, las probabilidades se calculan a partir de la funcin de densidad:
F ( x) = P ( X x) =
f (t )dt .
Como f(x) est definida a trozos, las probabilidades sern diferentes segn el intervalo en donde se encuentre x:
F ( x) =
si x 0.05 : x 0 dt 0.05 x 0 dt + 10 dt f ( t ) dt = si 0.05 < x < 0.05: 0.05 0.05 0.05 x si x 0.05: 0 dt + 0.0510 dt + 0.05 0 dt
si x 0.05, si 0.05 < x < 0.05 si x 0.05
0 F ( x ) = 10 ( x + 0.05) 1
Observamos que F(x) es una funcin continua, y que es una primitiva de la funcin de densidad, F ( x ) = f ( x ) (recurdese el Teorema Fundamental del Clculo). Estas propiedades son generalizables para cualquier v.a. continua. Si X es una v.a. continua con funcin de densidad f(x), y F(x) es la funcin de distribucin de X, se verifica:
F ( x) =
f ( t ) dt , x
Ejemplos:
Y3: tiempo mximo que he estado hablando por telfono La funcin de densidad es f ( x ) = (0.04) xe
2
x
0.04 x
si x 0 ; por tanto:
F ( x) =
Es una funcin continua, pues es continua en ambos tramos y stos coinciden en x=0. Adems, es fcil comprobar que F(x)=f(x).
11
Estadstica
Tema 3
Curso 2006/07
Funcin de distribucin
Histogram
100 80 60 40 20 0 0 40 80 120 160 200
percentage
Duracin llamadas
Para hallar probabilidades a partir de la funcin de distribucin: P(30<Y3<60) = F(60) F(30) = 0.3542 P(Y3<45) = F(45) F() = F(45) 0 = F(45) = 0.5372 P(Y360) = F(+) F(60) = 1 F(60) = 0.3084 Observacin: En las v.a. continuas no influye que sea > , pues en un punto aislado la probabilidad siempre es 0. Clculo de la funcin de densidad a partir de la funcin de distribucin. Las anteriores propiedades, en particular el que F(x)=f(x), nos permite calcular la funcin de densidad de una v.a. continua a partir de su funcin de distribucin. Por ejemplo, si F ( x ) =
0 2 x 1 e
si x < 0 si x 0 0 2 x 2e
de densidad es f ( x ) = F ( x ) =
si x < 0 . si x 0
F ( ) = 0 y F ( + ) = 1 .
2. F es montona no decreciente. 3. F es continua por la derecha. Teorema. Una funcin F: R R es funcin de distribucin de una variable aleatoria X si y solo si F cumple las tres propiedades anteriores. 12
Estadstica Ejemplo:
Tema 3
Curso 2006/07
De las funciones representadas grficamente a continuacin, la de la derecha no es funcin de distribucin pues no es montona (entre 2 y 3 es mayor que 1, y luego decrece para valer 1 del 3 en adelante). Las otras dos s son funciones de distribucin, la de la izquierda de una v.a. continua (pues continua) y la del centro de una v.a. discreta (escalonada).
P (Y = y ) = P ( X = g 1 ( y ) ) o bien P (Y B ) = P ( X g 1 ( B) ) .
si Y es discreta hallaremos su distribucin de probabilidad y si Y es continua conviene trabajar con la funcin de distribucin.
Ejemplos: Problemas 6 d) y 7.
13
Estadstica
Tema 3
Curso 2006/07
La formalizacin de esta idea para v.a. se escapa de las posibilidades de este curso. S se utilizar la propiedad de que, cuando hay independencia, la probabilidad de la interseccin es el producto de las probabilidades.
frecuencia relativa
X=
= E ( X ) = xi pi
iI
= E [ X ] = x f ( x)dx
E [ aX + b ] = aE[ X ] + b E [ a1 X 1 + + an X n ] = a1 E[ X 1 ] + + an E[ X n ].
P ( X < Me )
Mediana Es un valor tal que, ordenados en magnitud los datos, el 50% es menor que l y el 50% mayor.
Conocida la funcin de distribucin F, buscamos Me tal que: v.a. discretas v.a. continuas
1 1 y P ( X > Me ) 2 2
1 1 F ( Me ) y F ( Me ) 2 2
F ( Me ) =
1 , 2
P ( X < x ) y P ( X > x ) 1
Cuantiles de orden Es un valor tal que, ordenados en magnitud los datos, el 100% es menor que l y el resto mayor. Conocida la funcin de distribucin F, buscamos x tal que: v.a. discretas
F ( x ) y F ( x )
v.a. continuas
F ( x ) =
Ejemplos: Hallar media, mediana y los cuartiles de: Y2: error al redondear a un decimal. Recordamos que la funcin de densidad es f(x)=10 si 0.05<x<0.05, y su funcin de distribucin
0 F ( x ) = 10 ( x + 0.05) 1
14
Estadstica
0.05 0.05
Tema 3
Curso 2006/07
Me
f ( x)dx = 0.5
Me
0.05
Anlogamente se resolveran:
Q1
f ( x)dx = 0.25;
Q3
f ( x)dx = 0.75 .)
Distribucin de probabilidad P(X = 0) = 1/8 P(X = 1) = 3/8 P(X = 2) = 3/8 P(X = 3) = 1/8 Tenemos:
Funcin de distribucin
x <0
3 3 1 12 E ( X ) = 0 P( X = 0) + 1 P( X = 1) + 2 P( X = 2) + 3 P( X = 3) = 1 + 2 + 3 = = 1.5 8 8 8 8
En el caso discreto, para hallar la mediana buscamos Me tal que:
F ( Me )
1 1 y F ( Me ) 2 2
En este caso, como F(x)=0.5 si 1x<2, cualquier valor del intervalo [1,2) verifica la propiedad de la mediana. En estos casos, tomaremos como valor de la mediana el punto medio de dicho intervalo, Me=1.5. Q1=1: Si buscamos F(x)=0.25, coincide con el salto en x=1; esto es equivalente a verificar: F(1-)=0.125 0.25 y F(1)=0.5 0.25. Q3=2: Si buscamos F(x)=0.75, coincide con el salto en x=2 ; esto es equivalente a verificar: F(2-)=0.5 0.75 y F(2)=0.875 0.75.
15
Estadstica
Tema 3
Curso 2006/07
Interpretacin de las medidas de posicin de una v.a.: Y3: Tiempo mximo que he estado hablando por telfono Hacemos los siguientes clculos con DERIVE:
Si la media es 50, quiere decir que tiempo medio que, como mximo, ha estado un estudiante hablando por telfono es de 50 minutos. Para los cuantiles, la interpretacin se hace en trminos de probabilidad: si la mediana es 41.96, se puede decir que: o la probabilidad de que el tiempo mximo de una llamada sea menor que 41.96 minutos es del 50%; o la probabilidad de que el tiempo mximo de una llamada sea mayor que 41.96 minutos es del 50%; o (redondeando) la probabilidad de que la mxima duracin de una llamada sea mayor de 40 minutos es de ms del 50%. si el primer cuartil es 24.03, se puede decir que: o la probabilidad de que el tiempo mximo de una llamada sea menor que 24.03 minutos es del 25%; o la probabilidad de que el tiempo mximo de una llamada sea mayor que 24.03 minutos es del 75%; o (redondeando) que la probabilidad de que el tiempo mximo de una llamada sea menor de 25 minutos es mayor del 25%. si el tercer cuartil es 67.31, se puede decir que: o la probabilidad de que el tiempo mximo de una llamada sea menor que 67.31 minutos es del 75%; o la probabilidad de que el tiempo mximo de una llamada sea mayor que 67.31 minutos es del 25%; o (redondeando) que la probabilidad de que el tiempo mximo de una llamada sea mayor que 1 hora, es de ms del 25%.
Teorema Sea X una variable aleatoria cualquiera y sea Y = g(X) una transformacin de X tal que Y es una variable aleatoria. Entonces,
Estadstica Definiciones.
Tema 3
Curso 2006/07
k = E X k , k = 1, 2,... .
Dada una v.a. X con esperanza , llamamos momento respecto a la media de orden k a
k k = E ( X ) , k = 1, 2,...
La utilidad de los momentos de una variable aleatoria se ver ms adelante en el tema de estimacin puntual. Medidas de dispersin Medida de dispersin Variable estadstica V.a. discreta V.a. continua
Varianza
n V(X) = ( xi X ) 2 i n
2 V ( X ) = 2 = E ( X )
= ( x j )2 p j
j =1
= ( x ) 2 f ( x)dx
V ( X ) 0. V ( aX + b ) = a 2V ( X ) V ( X ) = E X 2 ( E [ X ])
2
Si X e Y son independientes: V ( X + Y ) = V ( X ) + V (Y )
dt = V ( X )
= V (X )
CV = V (X ) = E[X ]
CV =
dt X
Hallar varianza, desviacin tpica y coeficiente de variacin de: 1) X: nmero de caras al lanzar 3 monedas Recordamos su distribucin de probabilidad: P(X=0)=P(X=3)=1/8; P(X=1)=P(X=2)=3/8; y que la esperanza es E(X)=1.5.
V ( X ) = E ( X 2 ) E ( X ) 2 = ( 02 P( X = 0) + 12 P ( X = 1) + 22 P ( X = 2) + 32 P ( X = 3) ) (1.5 ) =
2
3 1 2 3 = 12 + 22 + 32 (1.5 ) = 0.75 8 8 8
17
Tema 3
Curso 2006/07
2) Y2: error al redondear a un decimal. Recordamos que la funcin de densidad es f(x)=10 si 0.05<x<0.05, y su funcin de distribucin
0 F ( x ) = 10 ( x + 0.05) 1
2 2
2 2 0.05 2
= V ( X ) =0.029 ;
En este caso, como E(Y2)=0, no tiene sentido hallar el coeficiente de variacin. 3) Y3: tiempo mximo que he estado hablando por telfono Teniendo que la densidad es f ( x ) = (0.04) xe
2
0.04 x
18
Estadstica
Tema 3
Curso 2006/07
Medidas de asimetra Medida de asimetra Coeficiente de asimetra de Pearson Coeficiente de asimetra de Fisher
Variable estadstica
Variable aleatoria
CAP =
3( X Me ) dt
P=
3 ( Me )
1 n ( xi X )3 n CAF = i =1 (dt )3
3 E ( X ) = 3 F= 3 3
Interpretacin
P > 0 F > 0:
asimtrica a la derecha
P < 0 F < 0:
asimtrica a la izquierda
P = 0 F = 0: simtrica
19
Estadstica
Tema 3
Curso 2006/07
Ejemplos: 1) X: nmero de caras al lanzar 3 monedas Grficamente se ve que la distribucin es simtrica. Tambin se comprueba con los coeficientes: CAP=0 pues E(X)=Me=1.5. Adems, tambin CAF=0, pues:
0.05
3) Y3: tiempo mximo que he estado hablando por telfono Observando la grfica de la funcin de densidad se observa una clara asimetra a la derecha. Esto se corrobora calculando los coeficientes, que en ambos casos tienen valores positivos. CAP= 3(50-41.95)/(35.35)= 0.68 > 0
Teniendo
que
la
densidad
es
f ( x ) = (0.04) 2 xe 0.04 x si x > 0 , el coeficiente de asimetra de Fisher, CAF, viene dado por:
20