Beruflich Dokumente
Kultur Dokumente
UNED
Introducci
Introduccin al an
anlisis de datos
CONCEPTOS PREVIOS
TEMA 5
TEMA 5
NOCIONES BSICAS DE
PROBABILIDAD
Carmen Voces
UNED
Introducci
Introduccin al an
anlisis de datos
CONCEPTOS PREVIOS
TEMA 5
E=
E=
2010
UNED
Introducci
Introduccin al an
anlisis de datos
CONCEPTOS PREVIOS
TEMA 5
A=
B=
C=
AB=
AB=
Cuando la interseccin de dos sucesos no contiene ningn elemento se dice que son
sucesos incompatibles o excluyentes y, por tanto, no pueden verificarse
simultneamente, los sucesos A y C lo son.
AC=
Ejemplo: Suceso D =
Suceso imposible: suceso que no puede ocurrir nunca, se representa por
conjunto vaco. =
=
A=
2010
2010
UNED
Introducci
Introduccin al an
anlisis de datos
CONCEPTOS PREVIOS
TEMA 5
AB=
UNED
Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD
TEMA 5
AB=
E
1. DEFINICION CL
CLSICA
A
2. DEFINICI
DEFINICIN ESTAD
ESTADSTICA
3. DEFINICI
DEFINICIN AXIOM
AXIOMTICA
Veremos que con cualquiera de estas tres definiciones, la probabilidad se
cuantifica con un nmero comprendido entre 0 y 1. Cero para el suceso
imposible y uno para el suceso seguro. Cualquier otro suceso tendr asignado
un nmero entre 0 y 1 en funcin de la cuanta de su probabilidad de
ocurrencia.
A=
A=
E
A
B=
C=
2010
UNED
Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD
2010
TEMA 5
UNED
Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD
TEMA 5
1. DEFINICION CL
CLSICA (Laplace)
2. DEFINICION ESTAD
ESTADSTICA
nA
N N
P ( A) = lim
P ( A) =
nA
N
Ejemplo: Lanzamos un dado una vez. Cul es la probabilidad de obtener un 4?. Cul es la
probabilidad de obtener un nmero par?
A=
Tenemos que calcular la probabilidad de obtener los sucesos:
B=
Ejemplo: imaginemos que el Instituto Nacional de Estadstica nos informa de que por cada
100.000 nacimientos que se producen en nuestro pas, 51.264 son varones. De acuerdo con
estos datos podemos decir que la probabilidad de nacer varn sera: 0,51264. Con la
definicin clsica habamos visto que esta probabilidad es 0,5 como resultado del conciente
entre casos favorables, 1: varn, y los casos posibles, 2: varn + mujer
E=
P ( A) =
2010
1
= 0,17
6
P(B) =
3
= 0 ,5
6
7
2010
UNED
Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD
TEMA 5
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
3. DEFINICION AXIOM
AXIOMTICA
14. Con los datos de la tabla 3, podemos decir que la probabilidad de NO tener alergia
es:
0 P(A) 1
P(E) = 1
P(A) = 1 - P(A)
a) La misma para ni
nios con y sin hermanos
b) Mayor para los ni
nios con hermanos
c) Mayor para los ni
nios sin hermanos
Nmero de hermanos
Alergias
Las dos primeras propiedades indican que la probabilidad es cuantificable numricamente con
un nmero positivo comprendido entre 0 y 1. Asignamos un cero a un suceso que no puede
ocurrir nunca y un uno al suceso que se produce con seguridad.
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
2010
TEMA 4
UNED
14. Con los datos de la tabla 3, podemos decir que la probabilidad de NO tener alergia
es:
a) La misma para ni
nios con y sin hermanos
b) Mayor para los ni
nios con hermanos
c) Mayor para los ni
nios sin hermanos
P ( A)Sin hermanos =
nA
25
=
= 0,25
N 100
40
35
150
No
25
150
175
350
100
190
210
500
Probabilidad de un suceso =
75
2 o m
ms
0
S
10
Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD
TEMA 5
TEOREMA DE LA SUMA:
SUMA El Teorema de la Suma permite estimar la
probabilidad de que se produzca el suceso A el suceso B, traducida como la
unin de sucesos P(AB).
La probabilidad de la unin de dos sucesos compatibles es igual a la suma
de sus probabilidades menos la probabilidad de su interseccin.
P(AB) = P(A) + P(B) P(AB)
Nmero de hermanos
0
Alergias
2 o m
ms
75
40
35
150
No
25
150
175
350
100
190
210
500
P ( A)Con hermanos =
2010
AB=
11
2010
A=
P ( A) =
AB=
B=
1
6
P(B) =
P( A B) =
3
6
P( A B) =
1 3 1 3
+ = = 0 ,5
6 6 6 6
12
1
6
UNED
Introducci
Introduccin al an
anlisis de datos
DEFINICI
DEFINICIN DE PROBABILIDAD
TEMA 5
A=
P ( A) =
AB=
B=
1
6
P(B) =
P( A B) =
AB=
3
6
P( A B) = 0
TEMA 4
9. Sabiendo que la P(A) = 0,40, que P(B) = 0,30 y que P(AB) = 0,15 entonces
P(AB) es:
a) 0,55
b) 0,85
c) 0,05
1 3 4
+ = = 0 ,67
6 6 6
2010
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEOREMA DE LA SUMA
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
13
2010
TEMA 4
UNED
9. Sabiendo que la P(A) = 0,40, que P(B) = 0,30 y que P(AB) = 0,15 entonces
P(AB) es:
a) 0,55
b) 0,85
c) 0,05
14
Introducci
Introduccin al an
anlisis de datos
PROBABILIDAD CONDICIONADA
TEMA 5
Dos
Dossucesos
sucesosAAyyBBson
sondependientes
dependientessi
sisu
suprobabilidad
probabilidadde
deocurrencia
ocurrenciase
seve
ve
afectada,
afectada, esta
esta condicionada
condicionada por
por la
la ocurrencia
ocurrencia (o
(o no
no ocurrencia)
ocurrencia) del
del otro.
otro.
Son
Son independientes
independientes en
en caso
caso contrario,
contrario, oo lo
lo que
que es
es lo
lo mismo,
mismo, si
si la
la
verificacin
o
no
verificacin
de
uno
no
altera,
no
condiciona,
verificacin o no verificacin de uno no altera, no condiciona, la
la
probabilidad
probabilidaddel
delotro.
otro.
Sucesos independientes:
Si realizamos el experimento aleatorio lanzar una moneda al aire y observar su cara
superior
superior dos veces consecutivas,
consecutivas, la probabilidad de obtener una cara en el
segundo lanzamiento es igual a , no dependiendo en absoluto de que en el primer
lanzamiento hubiese sucedido cara
cara o cruz
cruz. En otras palabras, la ocurrencia de cada
uno de los sucesos definidos no dependen para nada de los sucesos
sucesos obtenidos en
ensayos anteriores.
anteriores.
Sucesos dependientes:
Sin embargo, existen experimentos que no disponen de esta propiedad
propiedad y la
probabilidad de ocurrencia de sus resultados se ve afectada o condicionada
condicionada por los
sucesos obtenidos en ensayos anteriores.
anteriores. A este tipo de sucesos se les denomina
dependientes.
2010
15
2010
16
UNED
Introducci
Introduccin al an
anlisis de datos
PROBABILIDAD CONDICIONADA
TEMA 5
UNED
TEMA 5
Sucesos dependientes:
Por ejemplo, supongamos una urna con cinco bolas de las cuales tres son azules y dos son
rojas. Definimos los sucesos A = {bola azul} y R = {bola roja}.
1200
2000
1100
1300
3000
1000
1500
2500
5000
3000
1000
1500
2500
5000
P ( Ps ) =
UNED
600
2000
1300
TEMA 5
400
1200
1100
P (V ) =
2010
Mujeres (M)
400
600
17
Varones (V)
400
Mujeres (M)
2010
Varones (V)
Repaso
UNED
P ( Ps V ) =
18
Introducci
Introduccin al an
anlisis de datos
PROBABILIDAD CONDICIONADA
TEMA 5
La
Laprobabilidad
probabilidadde
deun
unsuceso,
suceso,A,
A,dada
dadala
laverificacin
verificacinde
deotro
otrosuceso,
suceso,B,
B,se
se
llama
BB,yyes
llamaprobabilidad
probabilidadcondicional
condicionalde
deAAdado
dadoB,
esigual
igualaalalaprobabilidad
probabilidadde
de
su
n dividido
n. Es
intersecci
condici
suintersecci
interseccin
divididopor
porla
laprobabilidad
probabilidadde
delalacondici
condicin.
Esdecir:
decir:
P( A | B) =
P( A B)
P( B)
1200
P(Ps V) 5000 1200
P ( Ps | V ) =
=
=
= 0,60
2000 2000
P(V)
5000
Sucesos dependientes
19
2010
20
UNED
Introducci
Introduccin al an
anlisis de datos
PROBABILIDAD CONDICIONADA
TEMA 5
TABLA B
Experiencia
UNED
Introducci
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO
TEMA 5
Mujer
Varn
Mujer
Varn
Hasta 10 aos
Hasta 10 aos
45
15
60
Sucesos dependientes
Ms de 10 aos
Ms de 10 aos
15
20
10
60
20
80
UNED
21
Introducci
TEMA 5
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO:
PRODUCTO: Sucesos dependientes
Sucesos independientes
La probabilidad de ocurrencia de A y B es igual a la probabilidad de ocurrencia de A por la
probabilidad de ocurrencia de B:
P(AB) = P(A) P(B)
La probabilidad de ocurrencia simultnea de dos sucesos independientes es igual al
producto de sus probabilidades simples.
2010
UNED
22
Introducci
TEMA 5
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO:
PRODUCTO: Sucesos dependientes
Ejemplo: Supongamos una urna con cinco bolas de las cuales tres son verdes y dos son
rojas. Introducimos la mano en la urna y extraemos una bola (primera extraccin). Sin
devolver la bola que hemos extrado a la urna, volvemos a introducir la mano y extraemos otra
bola (segunda extraccin )
Ejemplo: Supongamos una urna con cinco bolas de las cuales tres son verdes y dos son
rojas. Introducimos la mano en la urna y extraemos una bola (primera extraccin). Sin
devolver la bola que hemos extrado a la urna, volvemos a introducir la mano y extraemos otra
bola (segunda extraccin )
La probabilidad pedida ser igual a la probabilidad de que en la primera extraccin la bola sea
roja por la probabilidad de que en la segunda extraccin la bola sea roja supuesto que en la
primera tambin lo ha sido, es decir,
La probabilidad pedida ser igual a la probabilidad de que en la primera extraccin la bola sea
verde por la probabilidad de que en la segunda extraccin la bola sea verde supuesto que en
la primera tambin lo ha sido, es decir,
P(R1) = 2/5
2010
P(R2|R1) = 1/4
23
P(V1) = 3/5
2010
P(V2|V1) = 2/4
24
UNED
Introducci
TEMA 5
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO:
PRODUCTO: Sucesos dependientes
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
16. Con los datos de la tabla 3, si elegimos al azar a un nio, cul es la probabilidad de
que tenga alergia y no tenga hermanos?
La probabilidad pedida ser igual a la probabilidad de que una sea verde y la otra roja (V y R)
pero esto puede ocurrir de dos maneras: que la primera sea verde y la segunda roja (V1R2) o
que la primera sea roja y la segunda verde (R1V2), es decir,
a) 0,15
b) 0,50
c) 0,75
Nmero de hermanos
Alergias
P(R2|V1) = 2/4
P(R1) = 2/5
75
40
35
150
No
25
150
175
350
100
190
210
500
P( A B)
P( B)
P( A B) = P(B) P( A | B)
P(V2|R1) = 3/4
2010
UNED
2 o m
ms
P( A | B) =
P(V1) = 3/5
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
25
2010
TEMA 4
UNED
26
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
16. Con los datos de la tabla 3, si elegimos al azar a un nio, cul es la probabilidad de
que tenga alergia y no tenga hermanos?
15. Con los datos de la tabla 3, hemos elegido al azar un nio que resulta tener 2
hermanos, cul es la probabilidad de que tenga alergias?
a) 0,15
b) 0,50
c) 0,75
a) 0,07
b) 0,17
c) 0,42
Nmero de hermanos
Alergias
Nmero de hermanos
2 o m
ms
75
40
35
150
No
25
150
175
350
100
190
210
500
Alergias
P ( A 0h) =
2010
75
= 0,15
500
75
40
2 o m
ms
35
150
No
25
150
175
350
100
190
210
500
P( A | B) =
27
0
S
2010
P( A B)
P( B)
28
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
15. Con los datos de la tabla 3, hemos elegido al azar un nio que resulta tener 2
hermanos, cul es la probabilidad de que tenga alergias?
a) 0,07
b) 0,17
c) 0,42
a) 0,64
b) 0,50
c) 0,30
Nmero de hermanos
Alergias
S
No
2 o m
ms
75
40
35
150
25
150
175
350
100
190
210
500
P( A | B) =
P( A B)
P( B)
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
S
No
Pblico
35
35
P( A 2h) 500
P ( A | 2h) =
=
=
= 0,17
210
P ( 2h)
210
500
Privado
2010
UNED
110
100
90
80
70
60
50
40
30
20
10
0
29
2010
TEMA 4
UNED
30
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
16. Con los datos de la Grfica 1, si se elige al azar un nio y ha resultado ser de un
centro privado, cul es la probabilidad de que no haga deberes en casa?
a) 0,64
b) 0,50
c) 0,30
a) 2/3
b) 1/3
c) 1/6
110
100
90
80
70
60
50
40
30
20
10
0
S
No
Pblico
Deberes
Pblico
Privado
90
50
140
No
60
100
160
150
150
300
S
No
Pblico
Privado
P ( Publico Deberes) =
2010
110
100
90
80
70
60
50
40
30
20
10
0
90
= 0,30
300
31
Privado
2010
32
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
16. Con los datos de la Grfica 1, si se elige al azar un nio y ha resultado ser de un
centro privado, cul es la probabilidad de que no haga deberes en casa?
16. Con los datos de la tabla 1, elegimos al azar, sucesivamente y sin reposicin, dos
parejas casadas en Madrid en el ao 200, cul es la probabilidad de que las dos estn
divorciadas?
a) 2/3
b) 1/3
c) 1/6
a) 0,3
b) 0,09
c) 0,6
110
100
90
80
70
60
50
40
30
20
10
0
Deberes
S
No
Pblico
Privado
90
50
140
No
60
100
160
150
150
300
P ( NoDeberes | Privado) =
Pblico
P ( NoDeberes | Privado) =
Privado
100
= 0,667
150
Nmero de hijos
0
Divorciados
2 o m
ms
No
20
40
10
10
10
10
Tabla 1. Se ha tomado una muestra aleatoria de 100 parejas, que se casaron en Madrid en el ao
200. Se ha tomado nota del nmero de hijos y de si las parejas se han divorciado o no
100 1
P ( NoDeberes Privado) 300 3 2
=
= =
150 1 3
P ( Privado)
300 2
2010
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
33
2010
TEMA 4
UNED
34
Introducci
TEMA 5
Introduccin al an
anlisis de datos
TEOREMA DEL PRODUCTO:
PRODUCTO: Sucesos independientes
16. Con los datos de la tabla 1, elegimos al azar, sucesivamente y sin reposicin, dos
parejas casadas en Madrid en el ao 200, cul es la probabilidad de que las dos estn
divorciadas?
a) 0,3
b) 0,99
c) 0,6
Nmero de hijos
Divorciados
2 o m
ms
No
20
40
10
10
10
10
30
30
50
20
100
70
Tabla 1. Se ha tomado una muestra aleatoria de 100 parejas, que se casaron en Madrid en el ao
200. Se ha tomado nota del nmero de hijos y de si las parejas se han divorciado o no
P ( Divorciado Divorciado ) =
2010
30 29
= 0,0878787 0,09
100 99
35
2010
36
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
a) 0,06
b) 0,25
c) 0,50
a) 0,06
b) 0,25
c) 0,50
B
P ( A A) = P ( A) P ( A) =
1 1 1
=
4 4 16
P( B B) = P( B) P( B) =
1 1 1
=
4 4 16
1 1 1
P (C C ) = P (C ) P (C ) = =
4 4 16
P( D D) = P( D) P( D) =
P ( A B ) = P ( A) P ( B )
P = 4
1
= 0,25
16
1 1 1
=
4 4 16
P ( A B ) = P ( A) P ( B )
2010
UNED
Introducci
Introduccin al an
anlisis de datos
TEOREMA DE BAYES
37
2010
TEMA 5
UNED
Ejemplo: En una planta psiquitrica hay 5 paciente de los cuales 1 padece psicosis, 2
neurosis y 2 esquizofrenia. Se sabe adems que la probabilidad de que un paciente
responda favorablemente al tratamiento es 0,6 si padece psicosis, 0,9 si padece
neurosis y 0,8 si padece esquizofrenia. Elegido aleatoriamente un paciente, hemos
observado que ha respondido favorablemente al tratamiento Cul es la probabilidad de
que ese sujeto padezca Neurosis?
P(F|P)= 0,6
P(F|N) = 0,9
P(F|E) = 0,8
P(F|P)= 0,6
P(F|N) = 0,9
P(F|E) = 0,8
0,2
P( N F )
P( N | F ) =
P(F )
0,6
0,4
0,4
0,9
0,1
0,8
0,2
0,4
39
TEMA 5
2010
Introducci
Introduccin al an
anlisis de datos
TEOREMA DE BAYES
Definicin de
probabilidad
condicionada
Datos:
38
2010
P( N F ) = P( N ) P(F | N )
P ( N F ) = 0,4 0,9 = 0,36
P(F ) = P( P F ) + P( N F ) + P( E F )
P ( P F ) = P ( P ) P ( F | P ) = 0,2 0,6 = 0,12
P ( N F ) = P ( N ) P ( F | N ) = 0,4 0,9 = 0,36
P ( E F ) = P ( E ) P ( F | E ) = 0,4 0,8 = 0,32
P ( F ) = 0,36 + 0,12 + 0,32 = 0,80
40
UNED
Introducci
Introduccin al an
anlisis de datos
TEOREMA DE BAYES
TEMA 5
P( N | F ) =
P( N F )
P(F )
P( N | F ) =
Diagrama de rbol
0,6
0,4
0,9
0,1
0,8
0,2
P
0,2
0,4
0,4
0,36
= 0,45
0,80
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
14. En una determinada asignatura, el 70% de los alumnos dedican al menos 2 horas
diarias al estudio y aprueban el 90% mientras que el 30% dedican menos de 2 horas
diarias y slo aprueban el 20%. Cul es la probabilidad de que un alumno elegido al
azar apruebe la asignatura?
a) 0,63
b) 0,69
c) 0,94
Datos
P( N F ) = P( N ) P(F | N )
P ( N F ) = 0,4 0,9 = 0,36
P(2h)= 0,7
Diagrama de rbol
P(<2h)= 0,3
0,7
2 h.
P(Aprobar|2h) = 0,9
P(F ) = P( P F ) + P( N F ) + P( E F )
P ( P F ) = P ( P ) P ( F | P ) = 0,2 0,6 = 0,12
P ( N F ) = P ( N ) P ( F | N ) = 0,4 0,9 = 0,36
P ( E F ) = P ( E ) P ( F | E ) = 0,4 0,8 = 0,32
P ( F ) = 0,36 + 0,12 + 0,32 = 0,80
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
2010
UNED
UNED
P(Aprobar|<2h) = 0,2
P(Suspender|2h) = 0,1
0,3
2010
TEMA 4
UNED
Aprueban
0,1
Suspenden
0,2
Aprueban
0,8
Suspenden
< 2 h.
P(Suspender|<2h) = 0,8
41
0,9
42
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
14. En una determinada asignatura, el 70% de los alumnos dedican al menos 2 horas
diarias al estudio y aprueban el 90% mientras que el 30% dedican menos de 2 horas
diarias y slo aprueban el 20%. Cul es la probabilidad de que un alumno elegido al
azar apruebe la asignatura?
15. Con los datos de la pregunta anterior, elegido un alumno al azar resulta que ha
aprobado, cul es la probabilidad de que haya estudiado al menos dos horas diarias?
a) 0,63
b) 0,69
c) 0,94
a) 0,50
b) 0,70
c) 0,91
Datos
Diagrama de rbol
P(2h)= 0,7
P(<2h)= 0,3
0,7
2 h.
P(Aprobar|2h) = 0,9
Diagrama de rbol
0,7
0,3
2010
2 h.
0,9
P(Suspender|2h) = 0,1
Aprueban
0,1
Suspenden
0,2
Aprueban
0,8
Suspenden
< 2 h.
P(Aprobar|<2h) = 0,2
0,3
0,9
Aprueban
0,1
Suspenden
0,2
Aprueban
0,8
Suspenden
< 2 h.
P(Suspender|<2h) = 0,8
TEOREMA DE BAYES
P( A | B) =
43
2010
P( A B)
P( B)
P( A | B) =
P ( A) P ( B | A)
P( B)
44
UNED
Introducci
Introduccin al an
anlisis de datos
EJEMPLOS
TEMA 4
15. Con los datos de la pregunta anterior, elegido un alumno al azar resulta que ha
aprobado, cul es la probabilidad de que haya estudiado al menos dos horas diarias?
a) 0,50
b) 0,70
c) 0,91
P( A | B) =
Diagrama de rbol
0,7
0,3
2 h.
0,9
Aprueban
0,1
Suspenden
0,2
Aprueban
0,8
Suspenden
< 2 h.
P ( 2h | Aprobado ) =
2010
P ( A) P ( B | A)
P( B)
0,7 0,9
0,63
=
= 0,9130
0,7 0,9 + 0,3 0,2 0,69
45