Sie sind auf Seite 1von 12

UNED

UNED

Introduccin al anlisis de datos

Introducci
Introduccin al an
anlisis de datos
CONCEPTOS PREVIOS

TEMA 5

TEMA 5

1. Experimento aleatorio: el lanzamiento de un dado, constituye un experimento


aleatorio.
Todo experimento aleatorio presenta tres caractersticas:

NOCIONES BSICAS DE
PROBABILIDAD

Todos los resultados posibles son conocidos con anterioridad a su realizacin


No se puede predecir con certeza el resultado que vamos a obtener
El experimento puede repetirse, todas las veces que se desee, en idnticas
condiciones

En los temas estudiados, el anlisis estadstico se ha limitado a la descripcin


de un conjunto pequeo de datos denominado muestra. Sin embargo, en
cualquier investigacin es importante poder generalizar o inferir nuestros
resultados a un colectivo mucho ms amplio, al que hemos denominado
poblacin y al que no podemos acceder por diferentes motivos (tiempo,
economa, ...). En este caso, la extensin de nuestras conclusiones requiere
llevar a cabo una inferencia que siempre ser probabilstica o formular una
hiptesis que aceptaremos o rechazaremos con una determinada
probabilidad.
2010

Centro Asociado A Coru


Corua

Carmen Voces

UNED

Introducci
Introduccin al an
anlisis de datos
CONCEPTOS PREVIOS

TEMA 5

Un experimento aleatorio es un proceso, que se puede repetir indefinidamente en


las mismas condiciones, cuyo resultado no se puede predecir con certeza

2. Espacio muestral: conjunto de todos los resultados posibles de un experimento


aleatorio. Se representa, habitualmente, por la letra mayscula E.

E=

E=

2010

UNED

Introducci
Introduccin al an
anlisis de datos
CONCEPTOS PREVIOS

TEMA 5

OPERACIONES CON SUCESOS.


3. Sucesos: a los resultados de un experimento aleatorio, se les denomina sucesos y se
representan por letras maysculas: A, B, ...
Tipos de sucesos:
Suceso simple o elemental: consta de un solo resultado del espacio muestral, E

A=

B=

C=

1. UNIN: Llamaremos unin de dos sucesos A y B, y lo representaremos por A B, al


subconjunto de E formado por los sucesos elementales que pertenecen a A, a B o a
ambos a la vez:

AB=

Ejemplo: Suceso A = obtener un cuatro A =


Suceso compuesto: consta de dos o ms resultados del espacio muestral, E.
Ejemplo: Suceso B = obtener un n par B =

2. INTERSECCIN: Llamaremos interseccin de dos sucesos A y B, y lo


representaremos por A B, al subconjunto de E formado por los sucesos
elementales que pertenecen a A y a B.

AB=

Ejemplo: Suceso C = obtener un mltiplo de 3 C =


Suceso seguro: a todo el espacio muestral de un experimento se le denomina
suceso seguro porque siempre ocurre

Cuando la interseccin de dos sucesos no contiene ningn elemento se dice que son
sucesos incompatibles o excluyentes y, por tanto, no pueden verificarse
simultneamente, los sucesos A y C lo son.

AC=

Ejemplo: Suceso D =
Suceso imposible: suceso que no puede ocurrir nunca, se representa por
conjunto vaco. =
=

3. COMPLEMENTARIO: Llamaremos complementario de un suceso A, y lo


representaremos por A, al subconjunto de E formado por los sucesos elementales que
no pertenecen a A:

A=

2010

2010

UNED

Introducci
Introduccin al an
anlisis de datos
CONCEPTOS PREVIOS

TEMA 5

OPERACIONES CON SUCESOS / DIAGRAMAS DE VENN

AB=

UNED

Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD

TEMA 5

Expondremos tres definiciones diferentes de probabilidad (la definicin clsica, la


estadstica y la axiomtica) encaminadas a un mismo fin: calcular la posibilidad
de ocurrencia de un suceso.

AB=
E

1. DEFINICION CL
CLSICA
A

2. DEFINICI
DEFINICIN ESTAD
ESTADSTICA
3. DEFINICI
DEFINICIN AXIOM
AXIOMTICA
Veremos que con cualquiera de estas tres definiciones, la probabilidad se
cuantifica con un nmero comprendido entre 0 y 1. Cero para el suceso
imposible y uno para el suceso seguro. Cualquier otro suceso tendr asignado
un nmero entre 0 y 1 en funcin de la cuanta de su probabilidad de
ocurrencia.

A=
A=

E
A

B=
C=

2010

UNED

Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD

2010

TEMA 5

UNED

Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD

TEMA 5

1. DEFINICION CL
CLSICA (Laplace)

2. DEFINICION ESTAD
ESTADSTICA

La probabilidad de un suceso es igual al cociente entre el nmero de casos favorables de


que ocurra ese suceso y el nmero de casos posibles en el supuesto de que todos los casos
tengan la misma oportunidad de ocurrir (es decir, sean igualmente probables).

La definicin estadstica de probabilidad es el lmite al que tiende la frecuencia relativa de


aparicin de un suceso A cuando el nmero de ensayos, N, tiende a infinito.

nA
N N

P ( A) = lim

A esta probabilidad la representamos por P(A) y de acuerdo a esta definicin es:


Probabilid ad de un suceso =

Nmero de casos favorables


Nmero de casos posibles

P ( A) =

nA
N

Ejemplo: Lanzamos un dado una vez. Cul es la probabilidad de obtener un 4?. Cul es la
probabilidad de obtener un nmero par?

A=
Tenemos que calcular la probabilidad de obtener los sucesos:

B=
Ejemplo: imaginemos que el Instituto Nacional de Estadstica nos informa de que por cada
100.000 nacimientos que se producen en nuestro pas, 51.264 son varones. De acuerdo con
estos datos podemos decir que la probabilidad de nacer varn sera: 0,51264. Con la
definicin clsica habamos visto que esta probabilidad es 0,5 como resultado del conciente
entre casos favorables, 1: varn, y los casos posibles, 2: varn + mujer

El espacio muestral, conjunto de todos los resultados posibles, es:

E=

P ( A) =
2010

1
= 0,17
6

Si repetimos un experimento aleatorio muchas veces, y anotamos las frecuencias relativas de


un suceso, podemos observar que tienden a estabilizarse en un valor comprende entre 0 y 1.
Este valor se denomina probabilidad del suceso. Adoptando esta definicin, la probabilidad
se estima a partir de la experiencia y, aunque es correcta presenta un grave problema:
muchas veces no es posible repetir un experimento aleatorio un gran nmero de veces y, si
lo es, no es prctico.

P(B) =

3
= 0 ,5
6
7

2010

UNED

Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD

TEMA 5

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

3. DEFINICION AXIOM
AXIOMTICA

2010 FEBRERO (MODELO A)

La probabilidad es un nmero entre 0 y 1 asociado a un suceso y que posee varias propiedades


que se denominan axiomas, es decir, verdaderas o afirmaciones que se aceptan sin demostracin.
(Kolmogorov, 1933)

14. Con los datos de la tabla 3, podemos decir que la probabilidad de NO tener alergia
es:

Dado un espacio muestral E, llamamos probabilidad de un suceso A definido en el espacio


muestral E y que designaremos por P(A) a un nmero real que asignamos al suceso A, tal
que cumple los siguientes axiomas:

0 P(A) 1

P(E) = 1

P(A) = 1 - P(A)

a) La misma para ni
nios con y sin hermanos
b) Mayor para los ni
nios con hermanos
c) Mayor para los ni
nios sin hermanos

Nmero de hermanos

Alergias

Las dos primeras propiedades indican que la probabilidad es cuantificable numricamente con
un nmero positivo comprendido entre 0 y 1. Asignamos un cero a un suceso que no puede
ocurrir nunca y un uno al suceso que se produce con seguridad.

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

2010

TEMA 4

UNED

14. Con los datos de la tabla 3, podemos decir que la probabilidad de NO tener alergia
es:
a) La misma para ni
nios con y sin hermanos
b) Mayor para los ni
nios con hermanos
c) Mayor para los ni
nios sin hermanos

P ( A)Sin hermanos =

nA
25
=
= 0,25
N 100

40

35

150

No

25

150

175

350

100

190

210

500

Probabilidad de un suceso =

2010 FEBRERO (MODELO A)

75

2 o m
ms

Tabla 3. Prevalencia de las alergias de un grupo de nios segn el nmero de hermanos

La tercera indica que la probabilidad de un suceso A puede obtenerse tambin restando de


uno la probabilidad de su complementario, A, puesto que ambos son exhaustivos y
mutuamente excluyentes (si no ocurre A necesariamente lo har su complementario).
2010

0
S

Nmero de casos posibles


Nmero de casos favorables

10

Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD

TEMA 5

TEOREMA DE LA SUMA:
SUMA El Teorema de la Suma permite estimar la
probabilidad de que se produzca el suceso A el suceso B, traducida como la
unin de sucesos P(AB).
La probabilidad de la unin de dos sucesos compatibles es igual a la suma
de sus probabilidades menos la probabilidad de su interseccin.
P(AB) = P(A) + P(B) P(AB)

Nmero de hermanos
0
Alergias

Ejemplo, en el lanzamiento de un dado, se define el suceso A = {3} y el suceso B = {nmero


impar}, ambos sucesos son compatibles, es decir, pueden aparecer a la vez o
simultneamente. Si los sucesos son compatibles o simultneos entonces la interseccin
(tres e impar) no es el conjunto vaci AB .

2 o m
ms

75

40

35

150

No

25

150

175

350

100

190

210

500

Tabla 3. Prevalencia de las alergias de un grupo de nios segn el nmero de hermanos

P ( A)Con hermanos =
2010

n A 150 + 175 325


=
=
= 0,8125
N 190 + 210 400

AB=
11

2010

A=
P ( A) =

AB=

B=
1
6

P(B) =

P( A B) =

3
6

P( A B) =

1 3 1 3
+ = = 0 ,5
6 6 6 6
12

1
6

UNED

Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD

TEMA 5

Cuando los dos sucesos son incompatibles, es decir, no pueden ocurrir


simultneamente o la ocurrencia de uno implica la no ocurrencia del otro la
regla de la suma se simplifica:
P(AB) = P(A) + P(B)
Puesto que su interseccin es vaca: (AB) =
Ejemplo, en el lanzamiento de un dado, se define el suceso A = {2} y el suceso B = {nmero
impar}, ambos sucesos son incompatibles, no pueden aparecer a la vez. Si los sucesos son
incompatibles entonces la interseccin (dos e impar) es el conjunto vaci AB = .

A=
P ( A) =

AB=

B=
1
6

P(B) =
P( A B) =

AB=

3
6

P( A B) = 0

TEMA 4

9. Sabiendo que la P(A) = 0,40, que P(B) = 0,30 y que P(AB) = 0,15 entonces
P(AB) es:
a) 0,55
b) 0,85
c) 0,05

El Teorema de la Suma permite estimar la probabilidad de que se produzca el


suceso A el suceso B, traducida como la unin de sucesos P(AB).
a) La probabilidad de la unin de dos sucesos compatibles es igual a la suma de
sus probabilidades menos la probabilidad de su interseccin.
P(AB) = P(A) + P(B) P(AB)
b) Cuando los dos sucesos son incompatibles, es decir, no pueden ocurrir
simultneamente o la ocurrencia de uno implica la no ocurrencia del otro la
regla de la suma se simplifica, puesto que su interseccin es vaca: (AB) =
P(AB) = P(A) + P(B)

1 3 4
+ = = 0 ,67
6 6 6

2010

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

2002 SEPTIEMBRE (MODELO A)

TEOREMA DE LA SUMA

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

13

2010

TEMA 4

UNED

2002 SEPTIEMBRE (MODELO A)

9. Sabiendo que la P(A) = 0,40, que P(B) = 0,30 y que P(AB) = 0,15 entonces

P(AB) es:
a) 0,55
b) 0,85
c) 0,05

14

Introducci
Introduccin al an
anlisis de datos
PROBABILIDAD CONDICIONADA

TEMA 5

Dos
Dossucesos
sucesosAAyyBBson
sondependientes
dependientessi
sisu
suprobabilidad
probabilidadde
deocurrencia
ocurrenciase
seve
ve
afectada,
afectada, esta
esta condicionada
condicionada por
por la
la ocurrencia
ocurrencia (o
(o no
no ocurrencia)
ocurrencia) del
del otro.
otro.
Son
Son independientes
independientes en
en caso
caso contrario,
contrario, oo lo
lo que
que es
es lo
lo mismo,
mismo, si
si la
la
verificacin
o
no
verificacin
de
uno
no
altera,
no
condiciona,
verificacin o no verificacin de uno no altera, no condiciona, la
la
probabilidad
probabilidaddel
delotro.
otro.
Sucesos independientes:
Si realizamos el experimento aleatorio lanzar una moneda al aire y observar su cara
superior
superior dos veces consecutivas,
consecutivas, la probabilidad de obtener una cara en el
segundo lanzamiento es igual a , no dependiendo en absoluto de que en el primer
lanzamiento hubiese sucedido cara
cara o cruz
cruz. En otras palabras, la ocurrencia de cada
uno de los sucesos definidos no dependen para nada de los sucesos
sucesos obtenidos en
ensayos anteriores.
anteriores.

Teorema de la Suma para dos sucesos compatibles:


P(AB) = P(A) + P(B) P(AB)

P(AB) = P(A) + P(B) P(AB) = 0,40 + 0,30 0,15 = 0,55

Sucesos dependientes:
Sin embargo, existen experimentos que no disponen de esta propiedad
propiedad y la
probabilidad de ocurrencia de sus resultados se ve afectada o condicionada
condicionada por los
sucesos obtenidos en ensayos anteriores.
anteriores. A este tipo de sucesos se les denomina
dependientes.
2010

15

2010

16

UNED

Introducci
Introduccin al an
anlisis de datos
PROBABILIDAD CONDICIONADA

TEMA 5

UNED

TEMA 5

La probabilidad del suceso A condicionada al suceso B, o dependiente de la aparicin


de B, se escribe como P(A|B) donde B es la condicin requerida

Sucesos dependientes:
Por ejemplo, supongamos una urna con cinco bolas de las cuales tres son azules y dos son
rojas. Definimos los sucesos A = {bola azul} y R = {bola roja}.

Ejemplo: en una determinada universidad tenemos la siguiente distribucin de sus 5.000


alumnos
Medicina (Md) Enfermera (E) Psicologa (Ps)

En la primera extraccin, las probabilidades de cada


suceso son respectivamente: P(A) = 3/5 y P(R) = 2/5.

Si en la primera extraccin la bola es roja


(condicin), la urna contiene ahora tres bolas
azules y una roja (casos favorables) y en la
segunda extraccin las probabilidades valen:

Si en la primera extraccin la bola es azul


(condicin), la urna contiene ahora dos bolas
azules y dos rojas (casos favorables) y en la
segunda extraccin las probabilidades son:

P(A) = 3/4 y P(R) = 1/4

Introduccin al anlisis de datos


PROBABILIDAD CONDICIONADA

Ejemplo: en una determinada universidad tenemos la siguiente distribucin de sus


5.000 alumnos
Medicina (Md) Enfermera (E) Psicologa (Ps)
400

1200

2000

1100

1300

3000

1000

1500

2500

5000

3000

1000

1500

2500

5000

casos favorables 2000


=
= 0,40
5000
casos posibles

P ( Ps ) =

UNED

600

2000

1300

2. Cul es la probabilidad de que estudio


psicologa?

TEMA 5

400

1200

1100

P (V ) =

2010

Mujeres (M)

400

600

1. Cul es la probabilidad de que sea


varn?

17

Varones (V)

400

Mujeres (M)

3. Cul es la probabilidad de que estudio


psicologa y sea varn? Probabilidad de
la interseccin: P(AB)

P(A) = 2/4 y P(R) = 2/4

2010

Varones (V)

Si elegimos aleatoriamente a uno de ellos:

Repaso

Si no devolvemos la bola extrada a la urna y realizamos una segunda extraccin las


probabilidad P(A) y P(R) ahora cambian porque ya no tenemos cinco bolas sino 4 (casos
posibles), y cada una de las probabilidades P(A) y P(R) dependen de que la primera bola
fuera azul o roja.

UNED

Introduccin al anlisis de datos


PROBABILIDAD CONDICIONADA

casos favorables 2500


=
= 0,50
5000
casos posibles

P ( Ps V ) =

casos favorables 1200


=
= 0,24
5000
casos posibles

18

Introducci
Introduccin al an
anlisis de datos
PROBABILIDAD CONDICIONADA

TEMA 5

La
Laprobabilidad
probabilidadde
deun
unsuceso,
suceso,A,
A,dada
dadala
laverificacin
verificacinde
deotro
otrosuceso,
suceso,B,
B,se
se
llama
BB,yyes
llamaprobabilidad
probabilidadcondicional
condicionalde
deAAdado
dadoB,
esigual
igualaalalaprobabilidad
probabilidadde
de
su
n dividido
n. Es
intersecci
condici
suintersecci
interseccin
divididopor
porla
laprobabilidad
probabilidadde
delalacondici
condicin.
Esdecir:
decir:
P( A | B) =

P( A B)
P( B)

Clculo de la probabilidad condicional con sucesos dependientes e independientes:

Supongamos que hemos elegido al azar un alumno y ha resultado ser varn,


Cul es la probabilidad de que estudio psicologa?
Nos estamos preguntando por la probabilidad condicional: P(Ps|V), es decir,
supuesto varn (V) Cul es la probabilidad de que estudie psicologa?
casos favorables 1200
P( Ps | V ) =
=
= 0,60
casos posibles 2000

1200
P(Ps V) 5000 1200
P ( Ps | V ) =
=
=
= 0,60
2000 2000
P(V)
5000

Probabilidad de A condicionada a B o probabilidad de A suponiendo que ha sucedido B es:


P(A|B) = P(AB)/P(B)
Probabilidad de B condicionada a A o probabilidad de B suponiendo que ha sucedido A es:
P(B|A) = P(AB)/P(A)
Sucesos independientes
Probabilidad de A condicionada a B o probabilidad de A suponiendo que ha sucedido B es:
P(A|B) = P(A)
Probabilidad de B condicionada a A o probabilidad de B suponiendo que ha sucedido A es:
P(B|A) = P(B)

A partir de los resultados anteriores, podemos comprobar que


2010

Sucesos dependientes

19

2010

20

UNED

Introducci
Introduccin al an
anlisis de datos
PROBABILIDAD CONDICIONADA

TEMA 5

Tenemos dos grupos ficticios de 10 psic


psiclogos clasificados seg
segn su sexo y su experiencia.
experiencia.
TABLA A
Experiencia

TABLA B
Experiencia

UNED

Introducci
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO

TEMA 5

El Teorema del Producto permite estimar la probabilidad de que se produzcan


simultneamente dos sucesos y se traduce como la interseccin de sucesos:
P(AB)

Mujer

Varn

Mujer

Varn

Hasta 10 aos

Hasta 10 aos

45

15

60

Sucesos dependientes

Ms de 10 aos

Ms de 10 aos

15

20

10

60

20

80

La probabilidad de ocurrencia de A y B es igual a la probabilidad de ocurrencia de A por la


probabilidad de ocurrencia de B, dado que A ocurrido previamente:

Probabilidad de tener ms de 10 aos de experiencia:


Tabla A: P(+10) = 3/10 = 0,30

P(AB) = P(A) P(B|A)

Tabla B: P(+10) = 20/80 = 0,25

Probabilidad condicional de tener ms de 10 aos de experiencia dado que se ha extrado una


mujer:
Tabla A: P(+10|M) = 4/6 = 0,67

Tabla B: P(+10|M) = 15/60 = 0,25

En la Tabla B la probabilidad de +10 es igual a la probabilidad de +10 dado M: P(+10) =


P(+10|M) = 0,25. Eso significa que la probabilidad del suceso A no se ve alterada por el hecho
de que se produzca B. Cuando se cumple esta igualdad entre la probabilidad simple de un
suceso y la probabilidad condicional con respecto a otro suceso, P(A) = P(A|B), se dice que
los sucesos son independientes. Por el contrario, cuando no se cumple esta condicin se
dice que los sucesos son dependientes
2010

UNED

21

Introducci
TEMA 5
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO:
PRODUCTO: Sucesos dependientes

Sucesos independientes
La probabilidad de ocurrencia de A y B es igual a la probabilidad de ocurrencia de A por la
probabilidad de ocurrencia de B:
P(AB) = P(A) P(B)
La probabilidad de ocurrencia simultnea de dos sucesos independientes es igual al
producto de sus probabilidades simples.

2010

UNED

22

Introducci
TEMA 5
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO:
PRODUCTO: Sucesos dependientes

Ejemplo: Supongamos una urna con cinco bolas de las cuales tres son verdes y dos son
rojas. Introducimos la mano en la urna y extraemos una bola (primera extraccin). Sin
devolver la bola que hemos extrado a la urna, volvemos a introducir la mano y extraemos otra
bola (segunda extraccin )

Ejemplo: Supongamos una urna con cinco bolas de las cuales tres son verdes y dos son
rojas. Introducimos la mano en la urna y extraemos una bola (primera extraccin). Sin
devolver la bola que hemos extrado a la urna, volvemos a introducir la mano y extraemos otra
bola (segunda extraccin )

Cul es la probabilidad de que las dos bolas


extradas sean rojas?

Cul es la probabilidad de que las dos bolas


extradas sean verdes?

La probabilidad pedida ser igual a la probabilidad de que en la primera extraccin la bola sea
roja por la probabilidad de que en la segunda extraccin la bola sea roja supuesto que en la
primera tambin lo ha sido, es decir,

La probabilidad pedida ser igual a la probabilidad de que en la primera extraccin la bola sea
verde por la probabilidad de que en la segunda extraccin la bola sea verde supuesto que en
la primera tambin lo ha sido, es decir,

P(R1 R2) = P(R1) P(R2|R1) = 2/5 1/4 = 0,1

P(V1 V2) = P(V1) P(V2|V1) = 3/5 2/4 = 0,3

La probabilidad de que en la primera


extraccin la bola sea roja es:

P(R1) = 2/5

2010

Si en la primera extraccin la bola fue roja


(condicin), la urna contendr dos bolas
verdes y dos rojas :

La probabilidad de que en la primera


extraccin la bola sea verde es:

P(R2|R1) = 1/4

23

P(V1) = 3/5

2010

Si en la primera extraccin la bola fue verde


(condicin), la urna contendr dos bolas
verdes y dos rojas :

P(V2|V1) = 2/4

24

UNED

Introducci
TEMA 5
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO:
PRODUCTO: Sucesos dependientes

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

2010 FEBRERO (MODELO A)

Cul es la probabilidad de que las dos bolas


extradas sean de distinto color?

16. Con los datos de la tabla 3, si elegimos al azar a un nio, cul es la probabilidad de
que tenga alergia y no tenga hermanos?

La probabilidad pedida ser igual a la probabilidad de que una sea verde y la otra roja (V y R)
pero esto puede ocurrir de dos maneras: que la primera sea verde y la segunda roja (V1R2) o
que la primera sea roja y la segunda verde (R1V2), es decir,

a) 0,15
b) 0,50
c) 0,75

Nmero de hermanos

P(V1R2) + P(R1V2) = [P(V1) P(R2|V1)] + [P(R1) P(V2|R1)] =

= (3/5 2/4) + (2/5 3/4) = 0,60


P(V1R2) = P(V1) P(R2|V1). La probabilidad de que
en la primera extraccin la bola sea verde por la
probabilidad de que en la segunda extraccin la
bola sea roja dado que se ha obtenido una bola
verde en la primera

P(R1V2) = P(R1) P(V2|R1). La probabilidad de que


en la primera extraccin la bola sea roja por la
probabilidad de que en la segunda extraccin la
bola sea verde dado que se ha obtenido una bola
roja en la primera

Alergias

P(R2|V1) = 2/4

P(R1) = 2/5

75

40

35

150

No

25

150

175

350

100

190

210

500

P( A B)
P( B)

P( A B) = P(B) P( A | B)

P(V2|R1) = 3/4

2010

UNED

2 o m
ms

Tabla 3. Prevalencia de las alergias de un grupo de nios segn el nmero de hermanos

P( A | B) =
P(V1) = 3/5

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

25

2010

TEMA 4

UNED

26

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

2010 FEBRERO (MODELO A)

2010 FEBRERO (MODELO A)

16. Con los datos de la tabla 3, si elegimos al azar a un nio, cul es la probabilidad de
que tenga alergia y no tenga hermanos?

15. Con los datos de la tabla 3, hemos elegido al azar un nio que resulta tener 2
hermanos, cul es la probabilidad de que tenga alergias?

a) 0,15
b) 0,50
c) 0,75

a) 0,07
b) 0,17
c) 0,42

Nmero de hermanos

Alergias

Nmero de hermanos

2 o m
ms

75

40

35

150

No

25

150

175

350

100

190

210

500

Alergias

Tabla 3. Prevalencia de las alergias de un grupo de nios segn el nmero de hermanos

P ( A 0h) =

2010

75
= 0,15
500

75

40

2 o m
ms
35

150

No

25

150

175

350

100

190

210

500

Tabla 3. Prevalencia de las alergias de un grupo de nios segn el nmero de hermanos

P( A | B) =

27

0
S

2010

P( A B)
P( B)

28

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

2010 FEBRERO (MODELO A)

2010 FEBRERO (MODELO C)

15. Con los datos de la tabla 3, hemos elegido al azar un nio que resulta tener 2
hermanos, cul es la probabilidad de que tenga alergias?

15. Atendiendo a la Grfica 1, si seleccionamos al azar a un nio, cul es la


probabilidad de que estudio en un centro pblico y que realice deberes en casa?

a) 0,07
b) 0,17
c) 0,42

a) 0,64
b) 0,50
c) 0,30

Nmero de hermanos

Alergias

S
No

2 o m
ms

75

40

35

150

25

150

175

350

100

190

210

500

Tabla 3. Prevalencia de las alergias de un grupo de nios segn el nmero de hermanos

P( A | B) =

P( A B)
P( B)

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

S
No

Pblico

35
35
P( A 2h) 500
P ( A | 2h) =
=
=
= 0,17
210
P ( 2h)
210
500

Privado

Grfica 1. Diagramas de barras en el que se representan conjuntamente la titularidad del


centro de primaria en el que estudian los alumnos (X) y si realizan deberes o no en casa (Y)

2010

UNED

110
100
90
80
70
60
50
40
30
20
10
0

29

2010

TEMA 4

UNED

30

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

2010 FEBRERO (MODELO C)

2010 FEBRERO (MODELO C)

15. Atendiendo a la Grfica 1, si seleccionamos al azar a un nio, cul es la


probabilidad de que estudio en un centro pblico y que realice deberes en casa?

16. Con los datos de la Grfica 1, si se elige al azar un nio y ha resultado ser de un
centro privado, cul es la probabilidad de que no haga deberes en casa?

a) 0,64
b) 0,50
c) 0,30

a) 2/3
b) 1/3
c) 1/6

110
100
90
80
70
60
50
40
30
20
10
0

S
No

Pblico

Deberes

Pblico

Privado

90

50

140

No

60

100

160

150

150

300

S
No

Pblico

Privado

P ( Publico Deberes) =

2010

110
100
90
80
70
60
50
40
30
20
10
0

90
= 0,30
300

31

Privado

Grfica 1. Diagramas de barras en el que se representan conjuntamente la titularidad del


centro de primaria en el que estudian los alumnos (X) y si realizan deberes o no en casa (Y)

2010

32

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

2010 FEBRERO (MODELO C)

2010 SEPTIEMBRE (MODELO B)

16. Con los datos de la Grfica 1, si se elige al azar un nio y ha resultado ser de un
centro privado, cul es la probabilidad de que no haga deberes en casa?

16. Con los datos de la tabla 1, elegimos al azar, sucesivamente y sin reposicin, dos
parejas casadas en Madrid en el ao 200, cul es la probabilidad de que las dos estn
divorciadas?

a) 2/3
b) 1/3
c) 1/6

a) 0,3
b) 0,09
c) 0,6

110
100
90
80
70
60
50
40
30
20
10
0

Deberes

S
No

Pblico

Privado

90

50

140

No

60

100

160

150

150

300

P ( NoDeberes | Privado) =
Pblico

P ( NoDeberes | Privado) =

Privado

100
= 0,667
150

Nmero de hijos
0
Divorciados

2 o m
ms

No

20

40

10

10

10

10

Tabla 1. Se ha tomado una muestra aleatoria de 100 parejas, que se casaron en Madrid en el ao
200. Se ha tomado nota del nmero de hijos y de si las parejas se han divorciado o no

100 1
P ( NoDeberes Privado) 300 3 2
=
= =
150 1 3
P ( Privado)
300 2

2010

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

33

2010

TEMA 4

UNED

34

Introducci
TEMA 5
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO:
PRODUCTO: Sucesos independientes

2010 SEPTIEMBRE (MODELO B)

16. Con los datos de la tabla 1, elegimos al azar, sucesivamente y sin reposicin, dos
parejas casadas en Madrid en el ao 200, cul es la probabilidad de que las dos estn
divorciadas?
a) 0,3
b) 0,99
c) 0,6

P(C C) = P(C) P(C) = 0,5 0,5 = 0,25


Puesto que la probabilidad de obtener cara en el segundo lanzamiento no depende del
resultado obtenido en el primer lanzamiento (son ensayos independientes)

Nmero de hijos

Divorciados

Lanzamos al aire una moneda imparcial en dos ocasiones, cul es la probabilidad de


obtener dos caras?

2 o m
ms

No

20

40

10

10

10

10

30

30

50

20

100

70

Tabla 1. Se ha tomado una muestra aleatoria de 100 parejas, que se casaron en Madrid en el ao
200. Se ha tomado nota del nmero de hijos y de si las parejas se han divorciado o no

P ( Divorciado Divorciado ) =

2010

30 29

= 0,0878787 0,09
100 99
35

2010

36

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

2010 SEPTIEMBRE (MODELO A)

2010 SEPTIEMBRE (MODELO A)

15. Si colocamos una rata en dos ocasiones en un laberinto, como el recogido en la


Figura 1, y suponemos que no hay aprendizaje (los ensayos son independientes) cul
es la probabilidad de que escoja la misma salida en las dos ocasiones?

15. Si colocamos una rata en dos ocasiones en un laberinto, como el recogido en la


Figura 1, y suponemos que no hay aprendizaje (los ensayos son independientes) cul
es la probabilidad de que escoja la misma salida en las dos ocasiones?

a) 0,06
b) 0,25
c) 0,50

a) 0,06
b) 0,25
c) 0,50

B
P ( A A) = P ( A) P ( A) =

1 1 1
=
4 4 16

P( B B) = P( B) P( B) =

1 1 1
=
4 4 16

Figura 1. Rata situada en un laberinto con cuatro salidas (A, B, C y D) equiprobables

1 1 1
P (C C ) = P (C ) P (C ) = =
4 4 16
P( D D) = P( D) P( D) =

P ( A B ) = P ( A) P ( B )

P = 4

1
= 0,25
16

Figura 1. Rata situada en un


laberinto con cuatro salidas (A, B,
C y D) equiprobables

1 1 1
=
4 4 16

P ( A B ) = P ( A) P ( B )
2010

UNED

Introducci
Introduccin al an
anlisis de datos
TEOREMA DE BAYES

37

2010

TEMA 5

UNED

Ejemplo: En una planta psiquitrica hay 5 paciente de los cuales 1 padece psicosis, 2
neurosis y 2 esquizofrenia. Se sabe adems que la probabilidad de que un paciente
responda favorablemente al tratamiento es 0,6 si padece psicosis, 0,9 si padece
neurosis y 0,8 si padece esquizofrenia. Elegido aleatoriamente un paciente, hemos
observado que ha respondido favorablemente al tratamiento Cul es la probabilidad de
que ese sujeto padezca Neurosis?

Llamaremos P a ser psictico, N a ser neurtico y E a ser esquizofrnico. Llamaremos F


a responder favorablemente al tratamiento y F a no responder favorablemente. Los datos
de los que disponemos, son los siguientes:
Datos:

P(P) = 1/5 = 0,2

P(F|P)= 0,6

P(N) = 2/5 = 0,4

P(F|N) = 0,9

P(F|E) = 0,8

P(N) = 2/5 = 0,4

P(E) = 2/5 = 0,4

P(F|P)= 0,6

P(F|N) = 0,9

P(F|E) = 0,8

Debemos obtener la probabilidad de que el sujeto extrado padezca Neurosis,

sabiendo que, o dado que, ha respondido favorablemente al tratamiento


P(N|F)?
P(N|F)?:
P( N ) P(F | N )
P( N F )
P( N | F ) =
P( N | F ) =
P(F )
P(F )
Diagrama de rbol

0,2

P( N F )
P( N | F ) =
P(F )

0,6

0,4

0,4

0,9

0,1

0,8

0,2

0,4

39

TEMA 5

P(P) = 1/5 = 0,2

sabiendo que, o dado que, ha respondido favorablemente al tratamiento


P(N|F)?
P(N|F)?:

2010

Introducci
Introduccin al an
anlisis de datos
TEOREMA DE BAYES

P(E) = 2/5 = 0,4

Debemos obtener la probabilidad de que el sujeto extrado padezca Neurosis,

Definicin de
probabilidad
condicionada

Datos:

38

2010

Teorema del Producto

P( N F ) = P( N ) P(F | N )
P ( N F ) = 0,4 0,9 = 0,36
P(F ) = P( P F ) + P( N F ) + P( E F )
P ( P F ) = P ( P ) P ( F | P ) = 0,2 0,6 = 0,12
P ( N F ) = P ( N ) P ( F | N ) = 0,4 0,9 = 0,36
P ( E F ) = P ( E ) P ( F | E ) = 0,4 0,8 = 0,32
P ( F ) = 0,36 + 0,12 + 0,32 = 0,80
40

UNED

Introducci
Introduccin al an
anlisis de datos
TEOREMA DE BAYES

TEMA 5

Probabilidad de que el sujeto extrado padezca Neurosis, sabiendo que, o


dado que, ha respondido favorablemente al tratamiento P(N|F)?
P(N|F)?:

P( N | F ) =

P( N F )
P(F )

P( N | F ) =

Diagrama de rbol
0,6

0,4

0,9

0,1

0,8

0,2

P
0,2
0,4

0,4

0,36
= 0,45
0,80

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

14. En una determinada asignatura, el 70% de los alumnos dedican al menos 2 horas
diarias al estudio y aprueban el 90% mientras que el 30% dedican menos de 2 horas
diarias y slo aprueban el 20%. Cul es la probabilidad de que un alumno elegido al
azar apruebe la asignatura?
a) 0,63
b) 0,69
c) 0,94

Datos

P( N F ) = P( N ) P(F | N )
P ( N F ) = 0,4 0,9 = 0,36

P(2h)= 0,7

Diagrama de rbol

P(<2h)= 0,3

0,7

2 h.

P(Aprobar|2h) = 0,9

P(F ) = P( P F ) + P( N F ) + P( E F )
P ( P F ) = P ( P ) P ( F | P ) = 0,2 0,6 = 0,12
P ( N F ) = P ( N ) P ( F | N ) = 0,4 0,9 = 0,36
P ( E F ) = P ( E ) P ( F | E ) = 0,4 0,8 = 0,32
P ( F ) = 0,36 + 0,12 + 0,32 = 0,80

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

2010 FEBRERO (MODELO C)

Teorema del Producto

2010

UNED

UNED

P(Aprobar|<2h) = 0,2
P(Suspender|2h) = 0,1

0,3

2010

TEMA 4

UNED

Aprueban

0,1

Suspenden

0,2

Aprueban

0,8

Suspenden

< 2 h.

P(Suspender|<2h) = 0,8

41

0,9

42

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

2010 FEBRERO (MODELO C)

2010 FEBRERO (MODELO C)

14. En una determinada asignatura, el 70% de los alumnos dedican al menos 2 horas
diarias al estudio y aprueban el 90% mientras que el 30% dedican menos de 2 horas
diarias y slo aprueban el 20%. Cul es la probabilidad de que un alumno elegido al
azar apruebe la asignatura?

15. Con los datos de la pregunta anterior, elegido un alumno al azar resulta que ha
aprobado, cul es la probabilidad de que haya estudiado al menos dos horas diarias?

a) 0,63
b) 0,69
c) 0,94

a) 0,50
b) 0,70
c) 0,91

P ( Aprobar ) = P ( Aprobar 2h) + P ( Aprobar < 2h) =

Datos

Diagrama de rbol

P(2h)= 0,7

P ( Aprobar ) = P ( 2h) P ( Aprobar | 2h) + P (< 2h) P ( Aprobar |< 2h)

P(<2h)= 0,3

0,7

2 h.

P(Aprobar|2h) = 0,9
Diagrama de rbol

0,7

0,3

2010

2 h.

0,9

P(Suspender|2h) = 0,1
Aprueban

0,1

Suspenden

0,2

Aprueban

0,8

Suspenden

< 2 h.

P ( Aprobar ) = 0,7 0,9 + 0,3 0,2 = 0,69

P(Aprobar|<2h) = 0,2
0,3

0,9

Aprueban

0,1

Suspenden

0,2

Aprueban

0,8

Suspenden

< 2 h.

P(Suspender|<2h) = 0,8

TEOREMA DE BAYES

P( A | B) =
43

2010

P( A B)
P( B)

P( A | B) =

P ( A) P ( B | A)
P( B)
44

UNED

Introducci
Introduccin al an
anlisis de datos
EJEMPLOS

TEMA 4

2010 FEBRERO (MODELO C)

15. Con los datos de la pregunta anterior, elegido un alumno al azar resulta que ha
aprobado, cul es la probabilidad de que haya estudiado al menos dos horas diarias?
a) 0,50
b) 0,70
c) 0,91

P( A | B) =

Diagrama de rbol

0,7

0,3

2 h.

0,9

Aprueban

0,1

Suspenden

0,2

Aprueban

0,8

Suspenden

< 2 h.

P ( 2h | Aprobado ) =

2010

P ( A) P ( B | A)
P( B)

P ( 2h.)P ( Aprobado | 2h.)


P ( Aprobado )

0,7 0,9
0,63
=
= 0,9130
0,7 0,9 + 0,3 0,2 0,69

45

Das könnte Ihnen auch gefallen