Beruflich Dokumente
Kultur Dokumente
• Un soggetto chiede un finanziamento ad una banca • Dato uno spazio campionario S, un evento è un
Æ S = {concesso, rifiutato} sottoinsieme di S, quindi è costituito da uno o più punti
campionari (a parte il caso dell’evento impossibile, denotato
con il simbolo dell’insieme vuoto ∅)
• Estrazione di un numero al lotto
• Un evento E si verifica (si realizza) quando il risultato
Æ S = {1, 2, …, 90} (cardinalità finita)
dell’esperimento casuale è un qualsiasi punto campionario
di E; in caso contrario E non si verifica
• Numero di casi di influenza nel prossimo anno
• Esempio: lanciando un dado S = {1, 2, …,6}, alcuni dei
Æ S = {0, 1, 2, …} (cardinalità infinita numerabile) possibili eventi sono:
– A = {Numero pari} = {2,4,6}
• Tempo di attesa per essere serviti ad un sportello bancario – B = {Numero minore o uguale a 3} = {1,2,3}
Æ S = [0, +∞) (cardinalità infinita non numerabile) se ad es. esce il 4 Æ A si verifica, mentre B non si verifica
S S
E 1 3 5
B = {Numero minore o uguale a 3} 2 4 6
0 Impossibile
La probabilità di un evento E è definita come il grado di • Questo approccio si può usare sempre, in tutte le
fiducia che un individuo razionale attribuisce al verificarsi di situazioni, ma è davvero importante quando gli
un evento approcci classico e frequentista non sono utilizzabili
perché
– Lo spazio campione S non è costituito da un insieme
• La misura (soggettiva) di probabilità si deriva ponendo finito di punti equiprobabili Æ l’approccio classico è
l'individuo (razionale) di fronte ad un'operazione di inutilizzabile
scommessa chiedendo quanto è disposto a puntare per
– Non si dispone di osservazioni indipendenti e in
ricevere 1 nel caso in cui l'evento in questione si realizzi
identiche condizioni Æ l’approccio frequentista è
inutilizzabile
• Si considerano n oggetti
• Probabilità classica: casi favorevoli su casi possibili presi k alla volta AB BA AA
• Es. abbiamo le lettere A,
• Talvolta è difficile contare i casi perché sono molti e B e C e ne prendiamo 2 AC CA BB
non è pratico elencarli tutti, uno ad uno alla volta (quindi n=3 e
k=2) BC CB CC
• Soluzione: usare il calcolo combinatorio
Combinazioni C3,2 = 3
Disposizioni D3,2 = 6
n! ⎛n⎞ n!
Dn ,k = n(n − 1)(n − 2)K (n − k + 1) = Cn , k = ⎜ ⎟ =
(n − k )! k !(n − k )!
⎝k ⎠
n ! = n(n − 1)(n − 2)K 3 ⋅ 2 ⋅1 Binomio di Newton
• Dimostrazione:
0! = 1 (per definizione)
n!
Dn ,k (n − k )! n!
Cn , k = = =
Pkk k !(n − k )!
• Caso speciale k=n Æ permutazioni: Pn = Dn ,n = n ! k!
Esempio del compleanno: qual è la probabilità che in un insieme ⎛n⎞ n! ⎛ n ⎞ ⎛n⎞ ⎛n⎞
Oss: ⎜ ⎟ = =⎜ ⎟ in particolare, ⎜ ⎟ = ⎜ ⎟ = 1
di k persone almeno due compiano gli anni lo stesso giorno? ⎝ k ⎠ k !(n − k )! ⎝ n − k ⎠ ⎝0⎠ ⎝n⎠
Statistica 2010/2011 33 Statistica 2010/2011 34
si verifica B):
Probabilità congiunta
P( A ∩ B) P(A | B) ≠ P(A) Æ l’informazione che B si è verificato
P( A | B) = Probabilità marginale cambia la probabilità di A, in questo esempio diminuisce
P( B)
[la definizione richiede che P(B)>0]
Probabilità condizionata Statistica 2010/2011 37 Statistica 2010/2011 38
P(A | C) ≠ P(A) Æ l’informazione che C si è verificato P(A | D) = P(A) Æ l’informazione che D si è verificato non
cambia la probabilità di A, in questo esempio aumenta cambia la probabilità di A Æ A è indipendente da D
P( A ∩ B) P( A ∩ B) P( A | B ) = P( A)
P( A | B) = P( B | A) =
P( B) P( A)
Statistica 2010/2011 45 Mentre con la regola del prodotto si ottiene P(A) P(B) P(C) = 15/1000 = 0.015
Statistica 2010/2011 46
Dai dati alle probabilità • Probabilità = frequenza relativa associata a ciascuna modalità
(evento elementare) della variabile di interesse
• Seguendo l’approccio frequentista, una distribuzione Modalità di acquisto di un televisore Frequenza assoluta Frequenza relativa
di frequenza può fornire stime di probabilità di alcuni Grande magazzino (A) 183 0.61 = P(A)
eventi Internet (B) 87 0.29 = P(B)
Posta (C) 30 0.10 = P(C)
• Assunzione fondamentale: le probabilità devono essere Totale (S ) 300 1= P(S)
stabili nel tempo e nello spazio, per cui la stima fatta in
base a ciò che è accaduto ieri a alcuni soggetti (la
Gli eventi elementari (punti campione) costituiscono una
distribuzione di frequenza) è valida anche per ciò che
partizione: A∩B ∩ C=∅ e A∪B ∪C=S
accadrà domani ad altri soggetti
Domanda: 0.29 è una buona stima della probabilità che un consumatore
italiano acquisti oggi un televisore via internet?
Risposta: dipende da dove e quando sono stati rilevati i dati in tabella; siccome
si tratta di dati USA di qualche anno fa e il fenomeno degli acquisti via Internet
è in fase di rapida crescita e varia molto da paese a paese, l’applicazione ad un
caso italiano oggi appare azzardata.
Statistica 2010/2011 47 Statistica 2010/2011 48
• Considerando la distribuzione delle frequenze relative, si
• Nel caso in cui gli eventi di interesse siano relativi a due o ottengono le probabilità di interesse
più caratteristiche, la situazione è rappresentata da una
distribuzione multipla di frequenze (doppia, se le
caratteristiche sono solo due) Acquisto effettivo
Acquisto pianificato Sì (B) No (B’) Totale
Acquisto effettivo Sì (A) 0.20 = P(A∩B) 0.05 = P (A∩B’) 0.25 = P (A)
Acquisto pianificato Si No Totale No (A’) 0.10 = P (A’∩B) 0.65 = P (A’∩B’) 0.75 = P (A’)
Si 200 50 250 Totale 0.30 = P (B) 0.70= P (B’) 1 = P(S)
No 100 650 750
Totale 300 700 1000 probabilità marginale:
acquisto effettivo
probabilità marginale:
Frequenza congiunta assoluta Frequenza marginale assoluta probabilità congiunta: acquisto non pianificato
acquisto non pianificato e acquisto effettivo
(probabilità dell’intersezione A’∩B)
Statistica 2010/2011 49 Statistica 2010/2011 50
Acquisto effettivo
Acquisto pianificato Si No Totale
Acquisto effettivo Si 200 50 250
Acquisto pianificato Sì (B) No (B’) Totale No 100 650 750
Sì (A) 0.20 = P(A∩B) 0.05 = P (A∩B’) 0.25 = P (A) Totale 300 700 1000
No (A’) 0.10 = P (A’∩B) 0.65 = P (A’∩B’) 0.75 = P (A’)
Totale 0.30 = P (B) 0.70= P (B’) 1 = P(S)
Facendo riferimento alla prima riga della tabella (i 250
Due modi per calcolare P(C)= P(A∪B) consumatori che hanno pianificato l’acquisto) la riposta è
200/250 = 0.80
⎧ P( A ∩ B ) + P( A ∩ B ') + P( A '∩ B) = 0.20 + 0.05 + 0.10 = 0.35
P( A ∪ B) = ⎨
⎩ P( A) + P( B) − P( A ∩ B) = 0.25 + 0.30 − 0.20 = 0.35
Statistica 2010/2011 51 Statistica 2010/2011 52
Esempio: P(B|A) Esempio: P(A|B)
Partendo dalla tabella delle frequenze relative (viste come Un altra domanda è: qual è la probabilità che un cliente che
probabilità) la domanda può essere posta come: qual è la ha effettivamente acquistato avesse pianificato l’acquisto?
probabilità di B (acquisto effettivo) condizionatamente a A Ovvero: qual è la probabilità di A (acquisto pianificato)
(acquisto pianificato)? condizionatamente a B (acquisto effettivo)?
Acquisto effettivo Acquisto effettivo
Acquisto pianificato Sì (B) No (B’) Totale Acquisto pianificato Sì (B) No (B’) Totale
Sì (A) 0.20 = P(A∩B) 0.05 = P (A∩B’) 0.25 = P (A) Sì (A) 0.20 = P(A∩B) 0.05 = P (A∩B’) 0.25 = P (A)
No (A’) 0.10 = P (A’∩B) 0.65 = P (A’∩B’) 0.75 = P (A’) No (A’) 0.10 = P (A’∩B) 0.65 = P (A’∩B’) 0.75 = P (A’)
Totale 0.30 = P (B) 0.70= P (B’) 1 = P(S) Totale 0.30 = P (B) 0.70= P (B’) 1 = P(S)
P( A) = P( A ∩ B1 ) + P( A ∩ B2 ) + K + P( A ∩ Bk ) A = {acquisto pianificato}
• da ciò segue P(T | D’) = 0.02 (nel 2% dei soggetti sani il test
sbaglia perché segnala la malattia – falso positivo) I due tipi di errore sono ben diversi, sia
concettualmente che per le conseguenze!
Statistica 2010/2011 65 Statistica 2010/2011 66
P( D | T ) =
P(T | D ) P( D ) + P(T | D ') P( D ') Probabilità a priori
Probabilità
Probabilità congiunta
Probabilità
Evento Di condizionata aggiornata
P(Di) P(T|Di) P(Di)
(0.90)(0.03) P(T|Di) P(Di|T)
= D = soggetto malato 0.03 0.90 0.0270 0.582
(0.90)(0.03) + (0.02)(0.97) D’ = soggetto sano 0.97 0.02 0.0194 0.418
0.0270 0.0270
= = = 0.582
0.0270 + 0.0194 0.0464
P(D e T)= P(T |D) P(D)
=0.90×0.03=0.0270
…
P(D)=0.03
P(D e T’)= P(T’ |D) P(D)
che è molto più grande di P(D)=0.03 =0.10×0.03=0.0030
ma molto più piccolo di P(T | D) = 0.90 P(D’ e T)= P(T |D’) P(D’)
=0.02×0.97=0.0194
Talvolta i medici confondono P(D | T) con P(T | D), P(D’)=0.97
affermando che il paziente positivo al test ha una prob. 0.90 P(D’ e T’)= P(T’ |D’) P(D’)
=0.98×0.97=0.9506
di avere la malattia in questione
Statistica 2010/2011 67 Statistica 2010/2011 68
A chi è incuriosito dalla probabilità e vuole capire il suo ruolo nella
Esempio: test diagnostico /7 vita quotidiana, suggerisco due eccellenti libri divulgativi
(0.90)(0.003)
P( D | T ) = = 0.119
(0.90)(0.003) + (0.02)(0.997)