Sie sind auf Seite 1von 13

UNED

UNED

Introduccin al anlisis de datos

TEMA 7

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL

TEMA 7

Los modelos probabilsticas que ahora estudiaremos son aquellos cuyas funciones de
densidad de probabilidad vienen definidos por ecuaciones o frmulas matemticas
concretas y nos permiten calcular la probabilidad de que una determinada variable
aleatoria continua tome unos valores determinados.

DISTRIBUCIONES CONTINUAS
DE PROBABILIDAD

Trabajamos ahora con variables aleatorias continuas (que pueden tomar infinitos
valores), en este caso no tiene sentido hablar de la probabilidad de que la
variable tome un valor concreto (que es cero) sino que dicha variable se
encuentre en un determinado intervalo.
Entre estos modelos de variables aleatorias continuas ms importantes se encuentran:

En este tema veremos en este tema los modelos de distribucin de una


variable aleatoria continua ms ampliamente utilizados en el rea de las
ciencias sociales y de la salud. Conviene distinguir entre aquellos modelos a
los que frecuentemente se ajustan las variables con las que trabajamos y,
aquellos modelos que tienen una gran aplicacin como instrumentos
estadsticos. Entre los primeros, se encuentran el modelo normal y, entre los
segundos, chi-cuadrado de Pearson, t de Student y F de Snedecor.

2010

Centro Asociado A Coru


Corua

Carmen Voces

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL

TEMA 7

z = (x )

Variable:
Funcin de
densidad de
probabilidad:
Parmetros
definitorios:

Z N(0,1)

1
2

Media: E(X) =
Varianza V(X) = 2
Desviacin tpica:

f (z ) = P ( Z = z ) =

1
2

1
z 2
e 2

Media: E(X) = = 0
Varianza: V(X) = 2 = 1
Desviacin tpica = 1

Existe una familia de distribuciones


normales que difieren en cuanto a
su posicin () y dispersin () y
que genricamente se simbolizan
por N(,)
2010

la distribucin F de Snedecor

Nos detendremos con especial detalle en la distribucin normal confiando en que ello pueda
facilitar la comprensin de los siguientes modelos de probabilidad que describiremos de forma
ms escueta. El objetivo ltimo es que se comprenda intuitivamente en qu consisten estas
distribuciones y que, con ayuda de las tablas del apndice, sepa calcular probabilidades
asociadas a estos modelos de probabilidad.
2010

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL
N (, )

X N(
N(,)
f (x ) = P( X = x ) =

la distribucin Chi-cuadrado (2)


la distribucin t de Student

TEMA 7

Representaci
Representacin gr
grfica de la funci
funcin de densidad de probabilidad: f(x):
f(x):

Distribucin normal tipificada o


estandarizada

la distribucin normal

Distribucin normal

1 x

e 2

f (x ) =

1
2

1 x

x1 =

x2 = +

Caractersticas de la distribucin normal:


SIMETRA:

La distribucin normal es simtrica en torno a la media . Al ser


simtrica, coinciden la media, la mediana y la moda. La curva normal
tiene dos puntos de inflexin. Estos dos puntos de inflexin estn
situados simtricamente a una desviacin tpica (1 ) de la media, es
decir, en los puntos: X1 = y X2 = + . Una perpendicular trazada
sobre la media divide a la curva en dos partes de igual rea.

AMPLITUD:

Tiene una amplitud infinita, la curva se extiende desde hasta +.


Por tanto, la curva nunca toca al eje horizontal. En trminos ms
precisos se dice que la curva es asinttica al eje de abscisas.

2010

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL

TEMA 7

UNED
Introducci
TEMA 7
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL TIPIFICADA: N(0,1) TABLA III

EJEMPLO: Si una variable se distribuye normalmente, cul es la probabilidad de


obtener valores menores o iguales que z = -0,25?

Z x = 0,25

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002

P(Z
P(Z-0,25)
-0,25)==0,4013
0,4013

...

...

...

...

...

...

...

...

...

...

...

-1 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

Z x = 0,25

P(Z -0,25) = 0,4013

...

...

...

...

...

...

...

...

...

...

...

-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859

P(Z
P(Z-0,25)
-0,25)
==0,4013
0,4013

-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,5364 0,4325 0,4286 0,4247
-0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
...

...

...

...

...

...

...

...

...

...

...

1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

z = -0,25

...

20109

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL

TEMA 7

2010

UNED
Introducci
TEMA 7
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL TIPIFICADA: N(0,1) TABLA III

EJEMPLO: Si una variable se distribuye normalmente, cul es la probabilidad de


obtener valores mayores que z = 0,50?

Z x = 0,50

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002

P(Z
P(Z0,50)
0,50)==0,6915
0,6915

...

...

...

...

...

...

...

...

...

...

...

-1 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

P(Z 0,5) = 0,6915

P(Z > 0,5) = 1 0,6915 = 0,3085

Z x = 0,50

...

...

...

...

...

...

...

...

...

...

...

-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859

P(Z
P(Z0,50)
0,50)
==0,6915
0,6915

-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,5364 0,4325 0,4286 0,4247
-0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

z = 0,50
2010

...

2010

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL

TEMA 7

EJEMPLO: Si una variable se distribuye normalmente, cul es la probabilidad de


obtener valores comprendidos entre z = -0,25 y z = 0,5?
Buscando en la Tabla III tenamos que:
P(Z 0,50) = 0,6915

P(Z -0,25) = 0,4013

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL

EJEMPLO: Imaginemos que las puntuaciones en una determinada asignatura, X, de un


grupo de 500 nios se distribuyen normalmente con media 6 y desviacin tpica 2,
cuntos nios no han alcanzado la puntuacin 5?
PLANTEAMIENTO: XN(6,2) P(X < 5)?
PASO 1: Transformar la distribucin normal de
puntuaciones directas, X, en la distribucin
normal estndar de puntuaciones tpicas, Z,
mediante la expresin:

P(Z 0,50) =0,6915


P(Z -0,25) =0,4013
0,2906

z=

P(X 5) = P(Z -0,5) = 0,3085

X X 56
=
= 0,5
2
Sx

PASO 2: Tabla III P(X 5) = P(Z -0,5) =


0,3085. Interpretacin: El 30,85% de los nios
se quedaron por debajo de la puntuacin 5.
z = -0,25

z = 0,50

2010

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL

2010

TEMA 7

UNED

EJEMPLO: Imaginemos que las puntuaciones en una determinada asignatura, X, de un


grupo de 500 nios se distribuyen normalmente con media 6 y desviacin tpica 2,
cul ser el percentil 75, P75, de la distribucin?
PLANTEAMIENTO: XN(6,2) P75 P(X x) = 0,75?

PASO 1: Tabla III P(Z z) = 0,7500


P(Z 0,67) = 0,7500, z = 0,67

z = -0,50

PASO 3: El nmero de nios que se ha


quedado por debajo de la puntuacin 5 ser:
0,3085 500 = 154,25 154 nios

Para obtener la probabilidad pedida, realizamos la operacin:


P(-0,25 X 0,50) = P(Z 0,50) P(Z -0,25) = 0,6915 0,4013 = 0,2902

UNED

TEMA 7

P(X 7,34) = P(Z 0,67) = 0,7500

10

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN NORMAL

TEMA 7

OTRAS PROPIEDADES DE INTER


INTERS:

Si X es una variable con distribucin normal, N(,), la variable Y funcin


lineal de X mediante la siguiente transformacin: Y = a bX, es tambin
normal con media a b y desviacin tpica: |b| (donde |b| es el valor
absoluto de b).

PASO 2: Transformar la puntuacin tpica en


directa:

z=

2010

XX
Sx

0,67 =

X 6
2

X = 7,34
z = 0,67

11

2010

12

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 FEBRERO (MODELO C)

2010 FEBRERO (MODELO C)

20. Las puntuaciones en una prueba de rendimiento en matemticas siguen la


distribucin normal con media 500 y desviacin tpica 100, qu proporcin de
sujetos obtienen una puntuacin superior a 650?

20. Las puntuaciones en una prueba de rendimiento en matemticas siguen la


distribucin normal con media 500 y desviacin tpica 100, qu proporcin de
sujetos obtienen una puntuacin superior a 650?

a) 0,9332
b) 0,3224
c) 0,0668

a) 0,9332
b) 0,3224
c) 0,0668

XN(500,100)
P(X>650)?

XN(500,100)
P(X650) = P(Z 1,5)
= 0,0668

P(X>650)?

PASO 1: Transformar la distribucin normal de


puntuaciones directas, X, en la distribucin normal
estndar de puntuaciones tpicas, Z, mediante la
expresin:

z=

X X 650 500
=
= 1,5
100
Sx

X = 500
Z=0

PASO 2: Tabla IV P(X 650) = P(Z 1,5) = 0,9332.


Interpretacin: El 93,32% de los sujetos obtienen una
puntuacin inferior o igual a 650.

X = 650
Z = 1,5

P(X650) = P(Z 1,5) = 1 0,9332 = 0,0668


2010

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

13

2010

TEMA 7

UNED

14

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 FEBRERO (MODELO A)

2010 FEBRERO (MODELO A)

20. Teniendo en cuenta los datos representados en la figura 2, cuntos alumnos


han obtenido, en selectividad, una puntuacin superior a 8?

20. Teniendo en cuenta los datos representados en la figura 2, cuntos alumnos


han obtenido, en selectividad, una puntuacin superior a 8?

a) 3085
b) 3830
c) 6915

XN(7,Sx)

a) 3085
b) 3830
c) 6915

P(X>8)?

XN(7,Sx) PASO 1: Transformar la puntuacin directa,


P(X>8)?

X, en tpica, Z, mediante la expresin:

z=

X X 87
=
Sx
Sx

Sabemos que 1.587 personas de las 10.000


participantes estn por debajo de la puntuacin
5, es decir:
P(X<5) = 0,1587

1587

1587

8413
5 X =7

Figura 2. Distribucin normal de las


puntuaciones en una prueba de
selectividad (X) de un grupo de 10.000
alumnos con X = 7
2010

8413
5 X =7

15

Figura 2. Distribucin normal de las


puntuaciones en una prueba de
selectividad (X) de un grupo de 10.000
alumnos con X = 7
2010

Podemos utilizar la Tabla III de la distribucin


normal para identificar la puntuacin tpica que
deba por debajo de si una proporcin idntica:
Tabla III P(Z < -1) = 0,1587
Finalmente, utilizamos la frmula para
transformar puntuaciones directas en tpicas
para hallar la desviacin tpica: S x = 2

z=

XX
57
1 =
S x = 5 7
Sx
Sx
16

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 FEBRERO (MODELO A)

2010 FEBRERO (MODELO D)

20. Teniendo en cuenta los datos representados en la figura 2, cuntos alumnos


han obtenido, en selectividad, una puntuacin superior a 8?

20. Las puntuaciones en una test de asertividad se distribuyen normalmente con


media 100 y varianza 36. Lus obtienen en este test una puntuacin de 110,02, qu
porcentaje de personas quedar por debajo de Lus en este test?

a) 3085
b) 3830
c) 6915

XN(7,2)
P(X>8)?

PASO 1: Transformar la distribucin normal de


puntuaciones directas, X, en la distribucin
normal estndar de puntuaciones tpicas, Z,
mediante la expresin:

z=

1587

XN(100,6)
P(X 110,02)?

X X 87
=
= 0,5
2
Sx

PASO 2: Tabla III P(X 5) = P(Z -0,5) =


0,3085.
Interpretacin: El 30,85% de los nios se
quedaron por debajo de la puntuacin 5.

8413
5 X =7

Figura 2. Distribucin normal de las


puntuaciones en una prueba de
selectividad (X) de un grupo de 10.000
alumnos con X = 7
2010

UNED

a) 4,75%
b) 10,02%
c) 95,25%

PASO 3: El nmero de nios que se ha quedado


por debajo de la puntuacin 5 ser: 0,3085 1000
= 3085 nios

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

17

2010

TEMA 7

UNED

18

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

2010 FEBRERO (MODELO D)

2010 SEPTIEMBRE (MODELO A)

20. Las puntuaciones en una test de asertividad se distribuyen normalmente con


media 100 y varianza 36. Lus obtienen en este test una puntuacin de 110,02, qu
porcentaje de personas quedar por debajo de Lus en este test?

20. Teniendo en cuenta la Tabla 3, el percentil 67 para la variable X vale:

a) 4,75%
b) 10,02%
c) 95,25%

XN(100,6)

XN(20,5)
P67 P(X x) = 0,67?

P(X 110,02)?

Variable Distribuci
Distribucin

PASO 1: Transformar la distribucin normal de


puntuaciones directas, X, en la distribucin
normal estndar de puntuaciones tpicas, Z,
mediante la expresin:

z=

a) 22,2
b) 67
c) 76,2

TEMA 7

X X 110,02 100
=
= 1,67
Sx
6

PASO 2: Tabla IV P(X 110,02) = P(Z 1,67)


= 0,9525

Normal con media 20 y


desviaci
desviacin t
tpica 5

N(20,5)

240

ChiChi-cuadrado con 40 grados de


libertad

F20,10

F con 20 grados de libertad en


el numerador y 10 grados de
libertad en el denominador

Tabla 3. Conjunto de variables y su tipo de


distribucin

Interpretacin: El 95,25% de los sujetos


obtienen una puntuacin inferior o igual a 110,02.
2010

19

2010

20

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 SEPTIEMBRE (MODELO A)

2010 SEPTIEMBRE (MODELO C)

20. Teniendo en cuenta la Tabla 3, el percentil 67 para la variable X vale:

18. Sabiendo que las puntuaciones en el test de analogas verbales de la Tabla 3 se


distribuyen normalmente, cul es la proporcin de sujetos con una puntuacin
entre 22 y 38?
XN(30,8)

a) 22,2
b) 67
c) 76,2

XN(20,5)

a) 0,84
b) 0,50
c) 0,68

P67 P(X x) = 0,67?

PASO 1: Tabla IV P(Z z) = 0,6700


P(Z 0,44) = 0,6700, z = 0,44
PASO 2: Transformar la puntuacin tpica
en directa:

XX
z=
Sx

P ( X ) 20
0,44 = 67
5

X = 22,2

21

TEMA 7

2010 SEPTIEMBRE (MODELO C)

18. Sabiendo que las puntuaciones en el test de analogas verbales de la Tabla 3 se


distribuyen normalmente, cul es la proporcin de sujetos con una puntuacin
entre 22 y 38?
XN(30,8)
a) 0,84
b) 0,50
c) 0,68

P(22 X 38) =
P(X 0,38) P(X 22)?

P(Z 1) =0,8413

z = -1

2010

X = 38 Z =(38 30)/8 = 1
P(X 38) = P(Z 1) = 0,8413

Media

30

15

Varianza

64

36
rXY=0,70

2010

22

UNED
Introducci
TEMA 7
Introduccin al an
anlisis de datos
APROXIMACI
APROXIMACIN DE LA DISTRIBUCI
DISTRIBUCIN BINOMIAL A LA NORMAL
Qu hacer cuando, para la distribucin binomial, tenemos un n (nmero de ensayos)
superior a 20? La opcin, para valores grandes de n es aproximar la distribucin
binomial a la normal.
Podemos transformar su funcin de probabilidad, que es discreta, a la normal de la
siguiente manera:

( x 05) x ( x + 05)
P( X = x) = P

X = 22 Z =(22 30)/8 = -1
P(X 22) = P(Z -1) = 0,1587
Para obtener la probabilidad
pedida, realizamos la operacin:
P(22 X 38) = P(X 38) P(X
22) = P(Z 1) P(Z -1) =
0,8413 0,1587 = 0,6823

0,6823

P(Z -1) =0,1587

Tabla 3. Un psiclogo utiliz un test de Analogas


Verbales (X) para predecir el rendimiento en Lengua de
4 de la ESO (Y). Obtuvo las puntuaciones de las dos
variables en una muestra aleatoria de 1000 estudiantes.
En la tabla se muestran las medias, las varianzas y la
correlacin entre ambas variables.

X = 20
Z=0
X = 22,2
Z = 0,44

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

Correlaci
Correlacin

2010

UNED

P(22 X 38)?

La distribucin normal es continua y, como para cualquier distribucin continua, la


probabilidad de que la variable X tome un valor concreto es cero: P(X = x) = 0. Para
aproximar la distribucin binomial a la normal estableceremos un intervalo entre 0,5
unidades a la izquierda y a la derecha de la puntuacin, es decir:
P(X = x) = P[(x 0,5) x (x + 0,5)]
Sumar y restar, en el caso anterior, el valor 0,5 se llama correccin por continuidad y nos va
a permitir tratar las puntuaciones discretas, X, como si fuesen continuas. Para ello,
interpretamos cada puntuacin X, como si fuese el punto medio de su intervalo. Con este
procedimiento podemos asegurar que el intervalo incluya los valores discretos de la binomial.
La aproximacin de la binomial a la normal mejora a medida que p (la probabilidad de
xito) se aproxima a 0,5 y n (nmero de ensayos) es grande.

z=1

23

2010

24

UNED
Introducci
TEMA 7
Introduccin al an
anlisis de datos
APROXIMACI
APROXIMACIN DE LA DISTRIBUCI
DISTRIBUCIN BINOMIAL A LA NORMAL
EJEMPLO: Supongamos que lanzamos una moneda al aire en 20 ocasiones cul es
la probabilidad de obtener 12 caras? , es decir, P(X = 12)?
Opcin A (Dist. binomial): Tabla I: x = 12; p = 0,5 y n = 20 P(X = 12) = 0,1201

= npq = 20 0,5 0,5 = 2,24

Transformar las puntuaciones directas x1 = 11,5 y x2 = 12,5 en puntuaciones


tpicas
11,5 10
z1 =
= 0,67
2,24
X
z=
12,5 10

z2 =
= 1,12
2,24

2010

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN CHICHI-CUADRADO: 2n

28

2010

Par
Parmetros definitorios de la distribuci
distribucin chichi-cuadrado:
a)

Media: E(X) = = n

b)

Varianza: V(X) = 2 = 2n

2010

TEMA 7

UNED

220

Caractersticas de la distribucin chi-cuadrado:

AMPLITUD:

Esta distribucin se usa fundamentalmente en pruebas de bondad de ajuste (para


contrastar si la distribucin de una variable se ajusta a una distribucin
determinada, por ejemplo, la normal).

25

Representaci
fica dede
la f(x)
de algunas
de las de
distribuciones
chi cuadrado,
Representacin
grfica
la ) f(x)
de algunas
las distribuciones
chi
Representacin gr
gr
f(x
para 4, 8 y 20 grados
de libertad:
cuadrado,
para 2, 4, 8 y 20 grados de libertad:

SIMETRA:

Sean X1, X2, ..., Xn un conjunto de n variables aleatorias independientes con


una distribucin N(0,1), entonces una nueva variable aleatoria X = X21 + X22 +
... + X2n sigue una distribucin 2n (chi-cuadrado con n grados de libertad) y
se representa as: X 2n.

La distribucin 2 consiste en un conjunto de distribuciones de probabilidad que


depende del nmero de grados de libertad, n. El nmero de grados de libertad se
representa habitualmente como subndice del smbolo chi-cuadrado, 2n.

Para obtener la probabilidad pedida, realizamos la operacin:


P(0,67 Z 1,12) = P(Z 1,12) P(Z 0,67) = 0,8686 0,7486 = 0,12

24

TEMA 7

[Una variable aleatoria Chi-cuadrado es la suma de los cuadrados de n variables


normales estandarizadas, N(0,1), e independientes]

Obtener el intervalo x 0,5 = 12 0,5 = {11,5 12,5}

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN CHICHI-CUADRADO: 2n

Variable aleatoria: 2 = z21 + z22 + z23 + + z2n

Opcin B (Dist. normal):

= np = 20 0,5 = 10

UNED

La distribucin 2 es asim
asimtrica positiva pero a medida que aumentan
sus grados de libertad se va aproximando a la distribucin normal. La
aproximacin es bastante buena a partir de 30 grados de libertad (n >
30) y las probabilidades asociadas a esta distribucin se pueden
obtener a partir de la normal N(n, 2n).
La variable 2 definida como suma de cuadrados de n variables
aleatorias independientes N(0,1) no puede tomar valores negativos,
pudiendo tomar cualquier valor positivo en el intervalo desde cero hasta
infinito (0
0 a ).
27

26

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN CHICHI-CUADRADO: 2n

TEMA 7

Clculo de probabilidades: Utilizaremos la distribucin Chi-cuadrado Tabla V


EJEMPLO: En una distribucin 2 con 10 grados de libertad calcular P(6,74218,31):

P(210 18,31) P(210 6,74)


Consultando la tabla V, buscamos los
valores 6,74 y 18,31 en la fila
correspondiente a 10 grados de libertad
y tomamos sus correspondientes
probabilidades en la parte superior de
sus respectivas columnas.

P(2 18,31) =0,95

P(2 6,74) =0,25

- P(210 6,74) = 0,25


- P(210 18,31) = 0,95
Por tanto:

210 = 6,74

210=18,31

P(21018,31) P(2106,74) = 0,95 0,25 = 0,70


A la puntuacin 6,74 le corresponde el percentil 25 y a 18,31 el percentil 95, entre
ambas puntuaciones se encontrar el 95 25 = 70% de los casos que es una
probabilidad de 0,70.
2010

28

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN CHICHI-CUADRADO: 2n

TEMA 7

0,001 0,005 0,010 0,025 0,050 0,100 0,250 0,500 0,750 0,900 0,950 0,975 0,990 0,995 0,999

1 0,0000 0,0000 0,0002 0,0010 0,0039 0,1580 0,102

0,455

1,32

2,71

3,84

5,02

6,63

7,78

1,83

2 0,0020 0,010

0,020

0,051

0,103

0,211

0,575

1,39

2,77

4,61

5,99

7,38

9,21

10,60

13,82

3 0,0243 0,072

0,115

0,261

0,352

0,584

1,21

2,37

4,11

6,25

7,81

9,35

11,34

12,84

16,27

4 0,0908 0,207

0,297

0,484

0,711

1,06

1,92

3,36

5,39

7,78

9,49

11,14

13,28

14,86

18,47

5 0,2112 0,412

0,554

0,831

1,15

1,61

2,67

4,35

6,63

9,24

11,07

12,83

15,09

16,75

20,51

6 0,381

0,676

0,872

1,24

1,64

2,20

3,45

5,35

7,84

10,64

12,59

14,45

16,81

18,55

22,46

...

...

...

...

...

...

...

...

...

...

...

...

...

...

10 1,48

2,16

2,56

3,25

3,94

4,87

6,74

9,34

12,25

15,99 18,31 20,48

23,21

25,19

29,59

11 1,83

2,60

3,05

3,82

4,57

5,58

7,58

10,34

13,70

17,28

19,68

21,92

24,73

26,76

31,26

...

...

...

...

...

...

...

...

...

...

...

...

...

...

20 5,92

7,43

8,26

9,59

10,85

12,44

15,45

19,34

23,83

28,41

31,41

34,17

37,57

40,00

45,31

21 6,45

8,03

8,90

10,28

11,59

13,24

16,34

20,34

24,93

29,62

32,67

35,48

38,93

41,40

46,80

22 6,98

8,74

9,54

10,98

12,34

14,04

17,24

21,34

26,04

30,81

33,92

36,78

40,29

42,80

48,27

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

2010

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 FEBRERO (MODELO A)

TABLA V
gl

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

21. En una distribucin Chi-cuadrado con 60 grados de libertad, el valor 79,0819


es:
a) el percentil 5
b) el percentil 90
c) el percentil 95

29

2010

TEMA 7

UNED

30

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 FEBRERO (MODELO A)

2010 FEBRERO (MODELO C)

21. En una distribucin Chi-cuadrado con 60 grados de libertad, el valor 79,0819


es:

22. Sea X una variable que sigue la distribucin chi-cuadrado con 8 grados de
libertad, cul es la desviacin tpica de esa variable?

a) el percentil 5
b) el percentil 90
c) el percentil 95

a) 4
b) 16
c) 8

Tabla V: Distribucin Chi-cuadrado


P(X 260)

95%

P(X 79,0819) = 0,950 95%


5%

260=79,0819

2010

31

2010

32

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 FEBRERO (MODELO C)

22. Sea X una variable que sigue la distribucin chi-cuadrado con 8 grados de
libertad, cul es la desviacin tpica de esa variable?
a) 4
b) 16
c) 8

Media: E(X) = = n

b)

Varianza: V(X) = 2 = 2n

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN t de STUDENT: tn

TEMA 7

Sean X e Y dos variables aleatorias independientes, donde X sigue una


distribucin N(0,1) e Y una distribucin 2n. Entonces, la variable aleatoria:
T=

X
Y
n

sigue una distribucin t con n grados de libertad y se expresa por: T tn

[Una variable aleatoria t es un cociente entre una variable normal estndar, Z


N(0,1), y la raz cuadrada de una variable chi-cuadrado, 2n, dividida por sus
grados de libertad] T = Z

Par
Parmetros definitorios de la distribuci
distribucin chichi-cuadrado:
a)

UNED

2
n

Esta distribucin se usa fundamentalmente en estadstica inferencial en las


pruebas de contrastes.
Par
Parmetros definitorios de la distribuci
distribucin t de Student:
Student:

= 2n = 2 8 = 4

a)
b)

Media: E(X) = = 0
Varianza: V(X) = 2 = n/(n2)

La distribucin t consiste en una familia de distribuciones de probabilidad cuya forma


depende del valor de n. [La variable aleatoria t tiene el mismo nmero de grados de libertad, n,
que la distribucin de 2 incluida en el denominador de su definicin algebraica, por lo que su
distribucin de probabilidad depende del nmero de grados de libertad de 2].

2010

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN t de STUDENT: tn

33

2010

TEMA 7

UNED

Representaci
fica dede
la f(x)
de algunas
de las de
distribuciones
t de Student,
Representacin
grfica
la ) f(x)
de algunas
las distribuciones
chi ,
Representacin gr
gr
f(x
Student
para 4, 8 y 20 grados
de libertad:
cuadrado,
para 2, 4, 8 y 20 grados de libertad:
t4

t8

t20

Caractersticas de la distribucin t de Student:


SIMETRA:

La distribucin t de Sutudent es sim


simtrica en torno a la media,
recordando a la distribucin normal (aunque menos apuntada) a la que
tiende a converger a medida que aumentan sus grados de libertad. La
aproximacin es bastante buena a partir de 100 grados de libertad (n >
100) y las probabilidades asociadas a esta distribucin se pueden
obtener a partir de la normal.

AMPLITUD:

El numerador de esta variable es otra variable con distribucin normal


estandarizada, que puede tomar cualquier valor del intervalo ( a );
el denominador es una variable chi-cuadrado, 2, que slo puede tomar
valores positivos, en consecuencia, la variable t puede tomar cualquier
valor, positivo o negativo, en el intervalo a ).

2010

35

34

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN t de STUDENT: tn

TEMA 7

Clculo de probabilidades: Utilizaremos la distribucin t de Student, Tabla VI


EJEMPLO: Sea X una variable que se distribuye segn t con 6 grados de libertad.
Calcular la probabilidad de obtener valores menores o iguales a 1,943. P(t6 1,943)?

Consultando la tabla VI. La primera columna


corresponde a los grados de libertad. En esta
columna tenemos que localizar el valor 6, los
valores incluidos en su fila correspondiente
son distintos valores t y la probabilidad de
encontrar valores menores o iguales a stos
se encuentra en la parte superior de la tabla.
Es decir:

P(T6 1,943) = 0,95

P(t 1,943) = 0,95


Por lo tanto, al valor 1,943 de la distribucin t
le corresponde el percentil 95.

2010

t6=1,943

36

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN t de STUDENT: tn

TEMA 7

0,550 0,600 0,650 0,700 0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995 0,9995

1 0,1584 0,3249 0,5095 0,7265 1,0000 1,3764 1,963

3,078

6,314 12,706 31,82

63,66 636,58

2 0,1421 0,2887 0,4447 0,6172 0,8165 1,0607 1,386

1,886

2,920 4,303

6,96

9,92

31,60

3 0,1366 0,2767 0,4242 0,5844 0,7649 0,9785 1,250

1,638

2,353 3,182

4,54

5,84

12,92

4 0,1338 0,2707 0,4142 0,5686 0,7407 0,9410 1,190

1,533

2,132 2,776

3,75

4,60

8,61

5 0,1322 0,2672 0,4082 0,5594 0,7267 0,9195 1,156

1,476

2,015 2,571

3,36

4,03

6,87

6 0,1311 0,2648 0,4043 0,5534 0,7176 0,9057 1,134

1,440

1,943 2,447

3,14

3,71

5,96

...

...

...

...

...

...

...

...

...

...

...

...

...

...

10 0,1289 0,2602 0,3966 0,5415 0,6998 0,8791 1,093

1,372

1,812 2,228

2,76

3,17

4,59

11 0,1286 0,2592 0,3956 0,5399 0,6974 0,8755 1,088

1,363

1,796 2,201

2,72

3,11

4,44

...

...

...

2,95

4,07

...

...

...

...

...

...

...

...

...

...

...

15 0,1278 0,2579 0,3928 0,5357 0,6912 0,8662 1,074

1,341

1,753 2,131

2,60

16 0,1277 0,2576 0,3923 0,5350 0,6901 0,8647 1,071

1,337

1,746 2,120

2,58

2,92

4,01

17 0,1276 0,2573 0,3919 0,5344 0,6892 0,8633 1,069

1,333

1,740 2,110

2,57

2,90

3,97

...

...

...

...

...

...

...

...

...

...

...

...

...

...

2010

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 FEBRERO (MODELO D)

TABLA VI
gl

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

22. Una variable aleatoria se distribuye segn la distribucin t de Student con 40


grados de libertad, cul es el percentil 90?
a) -1,303
b) 1,303
c) ninguno de los dos anteriores

37

2010

TEMA 7

UNED

38

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 FEBRERO (MODELO D)

2010 SEPTIEMBRE (MODELO C)

22. Una variable aleatoria se distribuye segn la distribucin t de Student con 40


grados de libertad, cul es el percentil 90?

20. Las puntuaciones de un grupo de sujetos en un test psicomotor se distribuyen


segn la t de Student con 40 grados de libertad. La probabilidad de obtener
puntuaciones mayores que 2,423 es de

a) -1,303
b) 1,303
c) ninguno de los dos anteriores

a) 0,010
b) 0,005
c) 0,990

Tabla VI: Distribucin t de Student


P(T t40)
P(T t40) = 0,90
T = 1,303

90%
10%
t40=1,303

2010

39

2010

40

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 SEPTIEMBRE (MODELO C)

20. Las puntuaciones de un grupo de sujetos en un test psicomotor se distribuyen


segn la t de Student con 40 grados de libertad. La probabilidad de obtener
puntuaciones mayores que 2,423 es de

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN F de SNEDECOR: Fn1,n2

TEMA 7

Si X1 y X2 son variables aleatorias independientes, con distribucin chicuadrado con n1 y n2 grados de libertad respectivamente, entonces una
X1
nueva variable F definida por
n1
F=

X2

2n

n2

a) 0,010
b) 0,005
c) 0,990

sigue una distribucin F con n1 y n2 grados de libertad (Fn1, n2).

P(T 2,423)?

P(T t40)
P(T 2,423) = 0,990

n1
n2

Par
Parmetros definitorios de la distribuci
distribucin F de Snedecor o F de Fisher:

99%
1%

P(T 2,423)=1 0,990 = 0,010

t40=2,423

2010

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN F de SNEDECOR: Fn1,n2

F8,10

a)

Media: E(X) = = n2/(n2-2) para n2 > 2

b)

Varianza: V(X) = 2 = [2n22(n1+n2-2)]/[n1(n2-4)(n2-2)2] para n2 > 4

La distribucin F comprende una familia de distribuciones que quedan


determinadas por el nmero de grados de libertad.

41

2010

TEMA 7

UNED

Representaci
fica dede
la f(x)
de algunas
de las de
distribuciones
F, para chi
Representacin
grfica
la ) f(x)
de algunas
las distribuciones
Representacin gr
gr
f(x
distintos grados
de libertad:
cuadrado,
para 2, 4, 8 y 20 grados de libertad:
F4,4

2n
2

Esta distribucin se usa fundamentalmente en el contraste de hiptesis (Anlisis


de Varianza...).

P(T 2,423) = ??

UNED

F=

[Una variable aleatoria F se define como el cociente dos variables chi-cuadrado, 2,


divididas cada una de ellas por sus respectivos grados de libertad (n1 y n2)]

Tabla VI: Distribucin t de Student

F20,40

Caractersticas de la distribucin F:
SIMETRA:

La distribucin F es asim
asimtrica positiva,
positiva, tiene forma acampanada muy
similar a la de la distribucin chi-cuadrado (2).

AMPLITUD:

Puesto que las dos variables chi-cuadrado, 2, estn definidas en el


intervalo 0 a , es decir, siempre toman valores positivos, la variable F
tambin estar definida en el mismo intervalo 0 a no pudiendo tomar

valores negativos..
Clculo de probabilidades: Utilizaremos la distribucin F de Snedecor, Tabla VII
2010

UNED

43

42

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN F de SNEDECOR: Fn1,n2

TEMA 7

EJEMPLO: Sea X una variable que se distribuye segn chi-cuadrado con 6 grados
de libertad e Y otra variable que se distribuye segn chi-cuadrado con 15 grados
de libertad. Si definimos la variable U = (X/6)/(Y/15), calcular P[(X/6)/(Y/15) > 2,21]
Por definicin sabemos que el cociente entre dos variable chi-cuadrado es una
variable F con los grados de libertad de las dos variables chi-cuadrado. Por tanto,
F6;15. Es decir, esta variable U se distribuye segn F con 6 y 15 grados de libertad.
En la pregunta nos piden P(F6,15 > 2,21)
Consultamos las tablas VII para encontrar la probabilidad pedida. Disponemos de
5 tablas cada una de ellas correspondientes a las probabilidades: 0,90; 0,95;
0,975; 0,990 y 0,995.
En la primera fila correspondiente a los grados de libertad del numerador,
localizamos el valor 6, y en la primera columna, correspondiente a los grados de
libertad del denominador localizamos el valor 15. La interseccin de la fila con la
columna nos proporciona el valor de la variable F que deja por debajo la
probabilidad que se indica en el encabezamiento de la tabla.

2010

44

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN F de SNEDECOR: Fn1,n2

TEMA 7

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 7

2010 FEBRERO (MODELO A)

EJEMPLO: P(F6,15 > 2,21)


P(F 2,21) = 0,90
P(F > 2,21) = 1 0,90 = 0,10
Sabemos que:

22. En una distribucin F con 40 y 20 grados de libertad en el numerador y en el


denominador, respectivamente cul es el percentil 95?
a) 1,708
b) 1,994
c) 2,287

Tabla VII(a): P(F6,15 2,21) = 0,900


Tabla VII(b): P(F6,15 2,79) = 0,950
Tabla VII(c): P(F6,15 3,41) = 0,975
Tabla VII(d): P(F6,15 4,32) = 0,990
Tabla VII(e): P(F6,15 5,07) = 0,995
F6,15 = 2,21

Para este ejercicio, tenemos que buscar en alguna de estas tablas, en el cruce de 6 y
15 grados de libertad el valor 2,21 o el ms prximo que es el que aparece en la tabla
VII(a). Por tanto, la probabilidad de obtener valores F con 6 y 15 grados de libertad
menores o iguales que 2,21 es 0,90: P(F6,15 2,21) = 0,90 y, en consecuencia:
P(F6,15 > 2,21) = 1 P(F6,15 2,21) = 1 0,90 = 0,10
2010

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

45

2010

46

TEMA 7

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN F de SNEDECOR: Fn1,n2

TEMA 7

2010 FEBRERO (MODELO A)

Otras propiedades de la distribuci


distribucin F:

22. En una distribucin F con 40 y 20 grados de libertad en el numerador y en el


denominador, respectivamente cul es el percentil 95?

Una importante propiedad de esta distribucin es la llamada propiedad rec


recproca y dice que
si X es una variable con distribucin F con n1 y n2 grados de libertad, entonces Y = 1/X es
tambin una distribucin F con n2 y n1 grados de libertad. Esta propiedad la podemos
expresar de la siguiente forma:

a) 1,708
b) 1,994
c) 2,287

P(F40,20 f) = 0,95

P(F40,20 1,994) = 0,95


P(F40,20 > 1,994) = 1 0,95 = 0,05

P(F40,20 1,994) = 0,95

1 p Fn1 n2

1
F
p n2 n1

donde p es la probabilidad asociada al valor de la variable. Segn esta propiedad, el valor de


una distribucin F con n1 y n2 grados de libertad que tiene una probabilidad acumulada igual
a p es igual al inverso del valor que en una distribucin F con los grados de libertad
permutados tiene una probabilidad acumulada complementaria (1 p). Esta propiedad es de
enorme importancia para obtener algunos percentiles o probabilidades que no aparecen en la
tabla.
Fn1,n2
Fn2,n1
F40,20 = 1,994

1p
0

2010

47

2010

1/x

p
0

x
48

UNED

Introducci
Introduccin al an
anlisis de datos
LA DISTRIBUCI
DISTRIBUCIN F de SNEDECOR: Fn1,n2

TEMA 7

EJEMPLO: Sea X una variable que se distribuye segn F22,10. Determinar el valor
del percentil 10 de X, es decir, 0,10F22,10. P(F22,10
22,10 fa) = 0,10?
Propiedad recproca de la distribucin F.

1 p Fn1 n2

0 ,10

F22 ,10 =

Tabla VII
0,10 F22;10

P(F 1,90) = 0,90


P(F > 1,90) = 1 0,90 = 0,10

1
p Fn2 n1

1
0 , 90 F10 , 22
0 ,90 F10 , 22

F10,22 = 1,90

P(F 0,526) = 0,10


P(F > 0,526) = 1 0,10 = 0,90

= 1,90

1
= 0,526
1,90
F22,10 = 0,526

2010

49

Das könnte Ihnen auch gefallen