Beruflich Dokumente
Kultur Dokumente
Organizzazione dImpresa
Dipartimento di
Comunicazione ed Economia
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
Obiettivi formativi
Fornire gli strumenti quantitativi essenziali e
favorire la comprensione delle metodologie
statistiche di base nel contesto delle scienze
economiche, sociali aziendali e delle pubbliche
amministrazioni.
Favorire ladozione di approcci corretti nei
confronti delle indagini di tipo quantitativo,
nellinterpretazione dei risultati e nella relativa
esposizione e comunicazione.
Evidenziare, per mezzo di un profilo di
concretezza del corso, come limpiego di
opportuni metodi statistici consenta di risolvere
svariate tipologie di problemi.
Introduzione alla statistica per le scienze economiche e sociali
Febbraio 2015
Contenuti
Introduzione al ruolo e al linguaggio della statistica
Parte I: Statistica descrittiva
Classificazioni dei dati e rappresentazioni grafiche
Rapporti statistici e numeri indici
Misure di posizione, di variabilit, di concentrazione
Analisi bivariata: correlazione e regressione lineare
semplice
Parte II: Probabilit e statistica inferenziale
Nozioni elementari di probabilit
Distribuzioni di probabilit
Distribuzioni campionarie e intervalli di confidenza
Stime puntuali e stime per intervallo
Metodi di campionamento
Verifica delle ipotesi: i test statistici
Introduzione alla statistica per le scienze economiche e sociali
Febbraio 2015
Febbraio 2015
Il significato di statistica
Febbraio 2015
Febbraio 2015
Collettivit di osservazioni
Febbraio 2015
Febbraio 2015
Febbraio 2015
Febbraio 2015
10
Febbraio 2015
11
I fenomeni qualitativi
Presentano modalit espresse con parole (es.:
stato civile); sono chiamati anche mutabili. Si
suddividono in ordinai e nominali.
Fenomeni ordinali: fra le modalit si pu stabilire
un ordine logico (crescente o decrescente): per
esempio, livello di accordo con la depenalizzazione
del suicidio
Febbraio 2015
12
Febbraio 2015
13
Febbraio 2015
14
I fenomeni quantitativi
Presentano modalit espresse con numeri, che derivano
da un'operazione di misura o di conteggio; sono chiamati
anche variabili.
Fenomeni discreti: le modalit sono costituite da un
numero finito di valori, che possono variare tra loro
solo per un ammontare fisso (per esempio, il numero
di referenze su uno scaffale di un negozio; i dipendenti
di unazienda)
Fenomeni continui: la scala delle possibili modalit
continua: allinterno del campo di variazione, il numero
delle modalit teoricamente infinito (le modalit
possono differire tra loro per entit variabili). Per
esempio, la distanza tra il luogo di acquisto e la
residenza dellacquirente; la statura.
Febbraio 2015
15
Discreti e continui
Febbraio 2015
16
Febbraio 2015
17
Scale di intervallo
Una scala di intervallo ha il punto di origine
fissato convenzionalmente, come punto di
riferimento (per esempio, scala dei gradi
centigradi per la temperatura: il punto zero non
significa assenza di temperatura).
In queste scale, hanno significato le differenze,
ma non i rapporti: tra due temperature, possiamo
affermare che una inferiore allaltra, ma non
conosciamo il loro rapporto.
Febbraio 2015
18
Scale di rapporto
Febbraio 2015
19
I descrittori
Febbraio 2015
20
Le fonti statistiche
Febbraio 2015
21
Febbraio 2015
22
Febbraio 2015
23
Accessibilit
Attendibilit e metodologie utilizzate
Completezza
Livello di aggiornamento
Grado di dettaglio
Esistenza di interessi da parte della fonte
Febbraio 2015
24
Febbraio 2015
25
Febbraio 2015
26
Alcuni casi - 1
Poliomielite: gli studi sugli effetti del vaccino
Febbraio 2015
27
Alcuni casi - 2
Febbraio 2015
28
Alcuni casi - 3
Febbraio 2015
29
Alcuni casi - 4
Febbraio 2015
30
Alcuni casi - 6
Febbraio 2015
31
Indagini longitudinali
Febbraio 2015
32
Febbraio 2015
33
Febbraio 2015
34
Le distribuzioni di frequenza
Una distribuzione di frequenza registra ogni modalit
con cui il fenomeno si presenta e il corrispondente
numero di volte in cui la singola modalit si presenta
La frequenza il numero di volte con cui una modalit si
presenta: per la modalit i, indicata con fi
La frequenza cumulata la frequenza con cui si
presentano le modalit di ordine inferiore o uguale a una
certa modalit. Si indica con fi
La frequenza relativa di una modalit la frequenza di
questa modalit, rapportata al totale delle frequenze. Si
indica con rfi (pu essere su scala 1 o su scala 100, in
questo secondo caso si tratta di una frequenza relativa
percentuale)
Introduzione alla statistica per le scienze economiche e sociali
Febbraio 2015
35
Febbraio 2015
36
Febbraio 2015
37
Febbraio 2015
38
Febbraio 2015
39
Febbraio 2015
40
Num progr.
giorni di
ingresso
padiglioni
visitati
et
43
46
36
18
43
28
45
Febbraio 2015
41
Le rappresentazioni grafiche
Un grafico un modo
presentare le informazioni
immediato
per
Febbraio 2015
42
Febbraio 2015
43
Febbraio 2015
44
Febbraio 2015
45
luned
900
800
700
domenica
marted
600
500
400
300
200
100
sabato
mercoled
venerd
gioved
Febbraio 2015
46
Febbraio 2015
47
Febbraio 2015
48
Istogramma
Febbraio 2015
49
Febbraio 2015
50
Esempio
Altezze (centimetri)
p%k
155-160
160-165
10
165-170
15
170-175
25
175-180
20
180-185
15
185-190
10
TOTALE
100
Febbraio 2015
51
Febbraio 2015
52
Febbraio 2015
53
Pressione (millimetri di
mercurio - mmHg)
90-95
95-100
100-110
19
110-120
21
120-130
27
130-150
17
150-180
TOTALE
100
Febbraio 2015
54
Febbraio 2015
55
Febbraio 2015
56
Febbraio 2015
57
Rapporti statistici
Febbraio 2015
58
Febbraio 2015
59
Le principali categorie
In questi casi, meglio non utilizzare i valori
originari, bens i quozienti tra essi e una
opportuna grandezza, considerata come indice di
dimensione.
Tali quozienti vengono denominati rapporti
statistici.
Le principali categorie di rapporti statistici sono:
- i rapporti di composizione;
- i rapporti di densit;
- i rapporti di derivazione;
- i rapporti di coesistenza.
Febbraio 2015
60
I rapporti di composizione
Rappresentano una quota dell'ammontare
complessivo di un fenomeno.
Il rapporto di composizione infatti il quoziente tra
l'ammontare riferito a una modalit del fenomeno e
il totale del fenomeno stesso
oppure tra lammontare riferito a una singola
unit del collettivo e il totale del fenomeno.
Febbraio 2015
61
I rapporti di densit - 1
Febbraio 2015
62
I rapporti di densit - 2
A questo fine, occorre rapportare il numero degli
abitanti all'estensione del territorio. Si calcola cio
la densit della popolazione, che il quoziente tra
numero di abitanti e la superficie (espressa, di
norma, in km quadrati).
Si potrebbe rapportare la popolazione alla parte
abitabile del territorio (escludendo, per esempio, le
superfici occupate dai laghi).
Altri esempi di rapporti di densit sono la superficie
forestale per 100 abitanti, la quantit di nitrati per
1000 litri di acqua, la spesa per acquistare
carburante per abitante, ecc.
Introduzione alla statistica per le scienze economiche e sociali
Febbraio 2015
63
I rapporti di derivazione
Febbraio 2015
64
I rapporti di coesistenza
Febbraio 2015
65
Numeri indici
Febbraio 2015
66
Definizione
i numeri indici sono rapporti finalizzati a confrontare
le intensit di un fenomeno o pi fenomeni in tempi
diversi oppure in situazioni diverse (ad esempio, in
differenti regioni)
si hanno infatti numeri indici temporali e numeri
indici territoriali
Febbraio 2015
67
Febbraio 2015
68
Febbraio 2015
69
Febbraio 2015
70
Linterpretazione
Febbraio 2015
71
Cambio base
I numeri indici con una base fissa, ad esempio
con base x1, possono essere trasformati in
numeri indici con diversa base fissa, ad esempio
con base x2, dividendoli per 1I2
1I t
_____
1
Febbraio 2015
72
Febbraio 2015
73
_____
t-1
t-1
Febbraio 2015
74
= 1I2
2I3
...
t-1 I t
Febbraio 2015
75
Una avvertenza
Febbraio 2015
76
Febbraio 2015
77
Febbraio 2015
78
Le due formule
Indice di Laspeyres
[(1 I t ) g1]
1
composto
__________________________
g1
Indice di Paasche
[(1 I t ) gt]
1
I t composto =
__________________________
gt
Febbraio 2015
79
Goro
100,0
99,4
103,5
Adria
100,0
100,4
101,2
Goro
240
248
261
Adria
185
187
191
Febbraio 2015
80
09 I10
09I11
__________________________________
240 + 185
1,035 240 + 1,012 185
__________________________________
240 + 185
100
100
Febbraio 2015
81
I10 =
__________________________________
100
248 + 187
__________________________________
100
261 + 191
Febbraio 2015
82
Il calcolo dellinflazione
Febbraio 2015
83
Deflazionamento
Gli indici dell'inflazione sono uno strumento per
deflazionare i prezzi e per calcolare l'indice del
potere di acquisto della moneta
Febbraio 2015
84
Febbraio 2015
85
Misure di posizione
Febbraio 2015
86
Febbraio 2015
87
MEDIE
ANALITICHE
(su fenomeni quantitativi)
aritmetica
geometrica
quadratica
ecc.
DI POSIZIONE
mediana
(su fenomeni
quantitativi e
qualitativi ordinali)
moda
(su tutti i fenomeni)
Febbraio 2015
88
Le medie analitiche
Febbraio 2015
89
Febbraio 2015
90
La media aritmetica
__
Febbraio 2015
91
xi
=
__________
Febbraio 2015
92
Febbraio 2015
93
p1 + p2 +. + pi + + pn
(xi pi)
________________
pi
Febbraio 2015
94
Minuti (xi)
Acquirenti
(n)
1
2
3
4
5
6
7
71
77
98
88
95
49
22
Febbraio 2015
95
M=
1794
= 3,588
500
Febbraio 2015
96
Area
coinvolta
(000 kmq)
Estremo nord
221
17,7
Nord est
215
11,0
Ovest costiero
193
4,5
Ovest interno
160
9,9
Sud peninsulare
202
4,2
Sud insulare
204
7,8
Aree rilevate
Febbraio 2015
97
____________
= 202,70
55,1
Febbraio 2015
98
Febbraio 2015
99
Febbraio 2015
100
Febbraio 2015
101
Anni
1971
173
1972
83
1973
-16
1974
13
1975
-137
1976
-116
Febbraio 2015
102
__________
Febbraio 2015
103
x1 x2 ... xn
Febbraio 2015
104
2010:
2011:
2012:
2013:
-0,6%
-3,2%
+1,7%
+0,3%
Febbraio 2015
105
Febbraio 2015
106
La mediana
Febbraio 2015
107
La mediana: il calcolo
Febbraio 2015
108
Classificazione trofica
Salinit pH
Lido di Volano
Scadente
17,6
27,4
8,24
Porto
Garibaldi
Scadente
16,4
28,9
8,29
Casalborsetti
Mediocre
16,4
30,2
8,30
Marina di Rav.
Mediocre
16,5
31,9
8,27
Lido Adriano
Mediocre
16,4
31,6
8,28
Cesenatico
Mediocre
16,2
32,8
8,19
Rimini
Buona
16,6
33,4
8,27
Cattolica
Buona
16,5
34,0
8,24
Febbraio 2015
109
n. promozioni
ultimo mese
46
54
35
40
62
Entit delle
promozioni
Forte
Media
Ridotta
Ridotta
Fortissima
Febbraio 2015
110
unit
(frequenze)
fx
1
2
3
4
5
6
7
TOTALE
71
77
98
102
95
55
12
510
frequenze
cumulate
fx
71
148
246
348
443
498
510
px
0,139
0,290
0,482
0,682
0,869
0,976
1,000
Febbraio 2015
111
Febbraio 2015
112
Tipi di asimmetria
Asimmetria negativa: coda pronunciata verso sinistra,
quindi maggiore concentrazione verso le modalit
maggiori
Asimmetria positiva: coda pronunciata verso destra,
quindi maggiore concentrazione verso le modalit
minori
Lasimmetria si misura con lindice di asimmetria di
Fisher ( un indicatore di variabilit, che sar
affrontato in seguito):
(xi - )3 / n ]
________________
3
Introduzione alla statistica per le scienze economiche e sociali
Febbraio 2015
113
Febbraio 2015
114
I percentili
Cosa sono?
Il percentile di ordine p (100p) il valore xp
che divide in due parti la distribuzione
(ordinata), in modo che il p% dei valori sia
prima di xp
Esempio
Il primo percentile il valore in
corrispondenza del quale si raggiunge l1%
delle unit
Il decimo percentile il valore in
corrispondenza del quale si raggiunge il 10%
delle unit
Febbraio 2015
115
Febbraio 2015
116
3
10
25
50
75
95
99
mg (xp)
1,89
1,97
2,43
2,81
3,51
4,62
7,16
(mediana)
Come si interpretano?
Il 3% delle rilevazioni ha un valore < 1,89
Il 10% delle rilevazioni ha un valore < 1,97
Il 5% delle rilevazioni ha un valore > 4,62
Introduzione alla statistica per le scienze economiche e sociali
Febbraio 2015
117
100p
3
10
25
50
75
95
99
mg (xp)
1,89
1,97
2,43
2,81
3,51
4,62
7,16
Febbraio 2015
118
Box Plot
un grafico atto a rappresentare:
Una misura di posizione, solitamente la mediana (qui
nellesempio indicata con Q2)
Una misura di variabilit, ossia la differenza
interquartile, che in seguito approfondiremo
(differenza fra Q3 e Q1)
Il valore massimo e
quello minimo
Febbraio 2015
119
La moda (Mo)
la modalit alla quale corrisponde la massima frequenza
La moda interessante quando n piuttosto elevato e
quando una modalit ha frequenza molto pi elevata delle
altre
Programmazione delle aperture notturne delle grandi superfici
di vendita: livello di accordo
Livello di accordo
n. testimoni interpellati
Accordo incondizionato
19
Accordo parziale
98
N accordo, n disaccordo
35
Disaccordo parziale
55
Disaccordo incondizionato
16
Moda: accordo parziale
Introduzione alla statistica per le scienze economiche e sociali
Febbraio 2015
120
Misure di variabilit
Febbraio 2015
121
Il significato di variabilit
Febbraio 2015
122
Il campo di variazione
(range)
la differenza tra il valore massimo xmax e il valore
minimo xmin tra quelli osservati:
xmax - xmin
Ha il difetto di tenere conto soltanto dei valori
estremi, non essendo sensibile alle modificazioni nei
valori intermedi (che alterano comunque la
variabilit globale)
Febbraio 2015
123
Febbraio 2015
124
Simbologia
Febbraio 2015
125
SD: il calcolo
Febbraio 2015
126
Febbraio 2015
127
Caso 1
1, 3, 4, 5, 7
6, 8, 9, 10, 12
(y = x + 5)
media
SD
Febbraio 2015
128
Caso 2
1, 3, 4, 5, 7
3, 9, 12, 15, 21
(y = x 3)
media
12
SD
Febbraio 2015
129
Caso 3
5, - 4, 3, - 1, 7
- 5, 4, - 3, 1, - 7
(y = -x)
media
-2
SD
Febbraio 2015
130
La varianza
Febbraio 2015
131
Febbraio 2015
132
Febbraio 2015
133
_____
Febbraio 2015
134
Febbraio 2015
135
Febbraio 2015
136
Il procedimento
Febbraio 2015
137
Un problema
Febbraio 2015
138
5 LA CONCENTRAZIONE
Febbraio 2015
139
Il significato di concentrazione
Febbraio 2015
140
ni
Finlandia
57
Estonia
35
Norvegia
42
Danimarca
30
Svezia
48
TOTALE
212
Febbraio 2015
141
Il metodo - 1
Febbraio 2015
142
Il metodo - 2
Febbraio 2015
143
Totale
ni
xi
fi
qi
30
0,2
0,1415
0,2
0,1415
35
0,2
0,1651
0,4
0,3066
42
0,2
0,1981
0,6
0,5047
48
0,2
0,2264
0,8
0,7311
57
0,2
0,2689
212
Febbraio 2015
144
Equidistribuzione
f2 = q2
. . . . . . fn = qn
di conseguenza:
f'1 = q'1
Febbraio 2015
145
In termini grafici
Si disegna un diagramma con i punti individuati dalle
coppie (f'i, q'i)
Si pone convenzionalmente
f'0 = 0 e q'0 = 0
Febbraio 2015
146
Spezzata di concentrazione
B
q'4
q'3
q'2
q'1
0O
A
0
f'1
f'2
f'3
f'4
Febbraio 2015
147
La curva di Lorenz
Febbraio 2015
148
Curva di Lorenz
B
0,8
0,6
area di concentrazione
0,4
area residua
0,2
0
A
O
0,2
0,4
0,6
0,8
1
Febbraio 2015
149
R =
area di concentrazione
____________________________________________
Febbraio 2015
150
Linterpretazione
Febbraio 2015
151
Alcune propriet di R
Rimane invariato moltiplicando ciascun valore per
una costante > 0 (es: redditi prima in euro, poi
in dollari)
Sommando una costante c a ogni valore,
diminuisce se c > 0, aumenta se c < 0, con il
vincolo (xi + c) > 0
Infatti, se c > 0, l'aumento risulta in termini
relativi pi elevato per i valori piccoli (per
esempio, un aumento di stipendio di ammontare
identico per ogni occupato)
L'opposto si verifica se c < 0 (per esempio, una
tassa di ammontare uguale per tutti i redditi)
Febbraio 2015
152
Febbraio 2015
153
Correlazione
Febbraio 2015
154
Febbraio 2015
155
Dipendenza e interdipendenza
Febbraio 2015
156
Lanalisi di correlazione
Febbraio 2015
157
I primi passi
Rappresentazione grafica dei dati con un diagramma
di dispersione
Calcolo degli scostamenti di ogni valore dalla media:
se a scostamenti positivi di un fenomeno
corrispondono scostamenti positivi dell'altro,
allora esiste una relazione diretta
altrimenti, la relazione inversa (a scostamenti
positivi delluno corrispondono scostamenti
negativi dellaltro)
Febbraio 2015
158
Febbraio 2015
159
La covarianza
un primo indicatore in grado di fornire
informazioni sull'intensit e sulle caratteristiche
delle relazione esistente tra due fenomeni
quantitativi
COV (X,Y)
(x'i y'i)
______________
n
Introduzione alla statistica per le scienze economiche e sociali
Febbraio 2015
160
Febbraio 2015
161
[z (xi) z (yi)]
________________________
n
Cosa sono gli scostamenti standardizzati? sono
gli scostamenti dalla media rapportati alla
deviazione standard; ad es., per X:
z (xi) =
xi - M(X)
______________
SD (X)
Febbraio 2015
162
COV (X,Y)
r =
______________________
SD (X) SD (Y)
Febbraio 2015
163
Febbraio 2015
164
Febbraio 2015
165
Febbraio 2015
166
Febbraio 2015
167
Febbraio 2015
168
Febbraio 2015
169
Febbraio 2015
170
Febbraio 2015
171
Febbraio 2015
172
Febbraio 2015
173
Regressione lineare
Febbraio 2015
174
Febbraio 2015
175
Febbraio 2015
176
Febbraio 2015
177
Linterpolazione lineare
Febbraio 2015
178
Febbraio 2015
179
Interpolazione ed estrapolazione
Febbraio 2015
180
b =
___________________
a =
MY (b MX)
SD (X)
Febbraio 2015
181
y = 17,5 + 5,3 x
r = + 0,874
17,5 (%) la quota di frequentatori che ricordano
comunque la marca di quel prodotto nellipotesi di
assenza di questo prodotto dagli scaffali
5,3 (%) laumento dellla quota di frequentatori
che ricordano la marca di quel prodotto in
corrispondenza di un incremento del lineare di 1
metro
Febbraio 2015
182
Febbraio 2015
183
Febbraio 2015
184
Febbraio 2015
185
Febbraio 2015
186
Febbraio 2015
187
Febbraio 2015
188
Le finalit dellanalisi
Febbraio 2015
189
Febbraio 2015
190
Febbraio 2015
191
Febbraio 2015
192
La funzione
y = a + b
Febbraio 2015
193
Anni
2005
2006
2007
2008
2009
2010
2011
(x)
1
2
3
4
5
6
7
n. (y)
28
31
32
36
36
39
41
Febbraio 2015
194
r = 0,9877
pendenza pari a
2,107
intercetta pari a
26,286
y = 26,286 + 2,107 x
r2 = (0,9877)2 = 0,9756
Febbraio 2015
195
Febbraio 2015
196
r2 =
0,9877
Febbraio 2015
197
Febbraio 2015
198
La proiezione
Febbraio 2015
199
Febbraio 2015
200
Febbraio 2015
201
Definizione di probabilit
Febbraio 2015
202
Simboli
La probabilit che si verifichi levento E si indica
con P(E)
La probabilit che si verifichi levento contrario
(non E) si indica con P(non E)
P(E) = [1 - P(non E)]
levento impossibile ha probabilit pari a zero
Febbraio 2015
203
Febbraio 2015
204
Febbraio 2015
205
EVENTI INCOMPATIBILI
Febbraio 2015
206
EVENTI COMPATIBILI
Febbraio 2015
207
Febbraio 2015
208
Probabilit condizionata
Febbraio 2015
209
P (G | C) = 0,62
Febbraio 2015
210
Febbraio 2015
211
La propriet moltiplicativa
La probabilit che si
(entrambi) si indica con:
verifichino
due
eventi
P (E e F) oppure con P (E F)
(probabilit dellintersezione degli eventi E e F)
Febbraio 2015
212
P(E) P(F)
Febbraio 2015
213
Febbraio 2015
214
Febbraio 2015
215
= P (F E) / P (E)
= P (F)
Febbraio 2015
216
La propriet additiva
Febbraio 2015
217
Febbraio 2015
218
Febbraio 2015
219
Si tratta di eventi
indipendenti compatibili:
3/5
3/5
2/5
3/5
2/3 = 6/15
1/3 = 3/15
2/3 = 4/15
+ 2/3 6/15 = 13/15
Febbraio 2015
220
Diffusione
responsabilit
(D)
Confronto
vantaggioso (C)
Totale
Furto
(F)
60
120
60
240
Stupefacenti
(S)
120
20
20
160
Totale
180
140
80
400
Febbraio 2015
221
TOT.
60
120
60
240
120
20
20
160
TOT.
180
140
80
400
140/400
1 (240/400)
P(F) P(M|F) = (240/400) (60/240) (ev. dip)
0
P(D) + P(C) = (140/400) + (80/400) (ev. incomp)
P(S)+P(C)-[P(C)P(S|C)=160/400+80/400-(80/40020/80)
(ev. compatibili e dipendenti)
1 [P(F) + P(S)] = 1 (240/400 + 160/400)
120/140
120/160
159/399
P(1S) P(2S|1S) = 160/400 159/399 (ev dip)
Febbraio 2015
222
AeK
Q alla prima e alla
seconda
DIECI e NOVE
Febbraio 2015
223
Il teorema di Bayes - 1
Per calcolare la probabilit che un certo evento sia
frutto di una determinata causa, ci si basa sulla
teoria della probabilit condizionata e si utilizza un
metodo che va sotto il nome di teorema di Bayes.
Conviene partire da un esempio concreto:
In riferimento a un determinato reato, si costruisce
lipotesi di colpevolezza attraverso due fasi
investigative:
1. una serie di colloqui
2. analisi di laboratorio
Febbraio 2015
224
Il teorema di Bayes - 2
Da una lunga serie di casi relativi a reati dello
stesso tipo, si era dedotto che il 40% dei sospettati
risultava colpevole allanalisi di laboratorio; di
questi, l80% aveva avuto un parere di
colpevolezza gi alleffettuazione dei colloqui.
Il restante 60% dei sospettati non risultava
colpevole allanalisi di laboratorio; in questo caso, il
30% dei colloqui aveva fornito (erroneamente) un
giudizio di colpevolezza. Il rimanente 70% aveva
fornito un giudizio contrario (non colpevolezza)
Febbraio 2015
225
Il teorema di Bayes - 3
Febbraio 2015
226
Il teorema di Bayes - 4
P(CA|CC) =
P(CC|CA)
* P(CA)
________________________________________________
P(CC|CA)
P(CA) + P(CC|NCA)
P(NCA)
P(CA|CC) =
* 0,4
____________________________
0,8
0,4 + 0,3
= 0,64
0,6
Febbraio 2015
227
Un secondo esempio - 1
In una regione, la forza lavoro si divide nel seguente
modo:
Lavoro autonomo 32%
Lavoro dipendente 68%
Attualmente, nellambito del lavoro autonomo si
dichiarano disoccupati il 20% dei soggetti, contro
una quota del 15% relativa al lavoro dipendente.
Quale la probabilit che, estraendo un soggetto e
verificando che disoccupato, si tratti di un
appartenente al lavoro autonomo?
Indichiamo con LA il lavoro autonomo, con LD quello
dipendente. Indichiamo poi con D la condizione di
disoccuato.
Febbraio 2015
228
Un secondo esempio - 2
P(LA|D) =
P(D|LA)
* P(LA)
________________________________________________
P(D|LA)
P(LA) + P(D|LD)
P(LD)
P(CA|CC) =
* 0,32
________________________________
0,2
0,32 + 0,15
= 0,386
0,68
Febbraio 2015
229
Dipartimento di
Comunicazione ed Economia
8 DISTRIBUZIONI DI
PROBABILITA
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
230
La definizione
Febbraio 2015
231
In simboli
Febbraio 2015
232
Le principali distribuzioni
Tra le principali distribuzioni di probabilit, rientrano:
Distribuzione normale (Gaussiana), la pi importante per
lanalisi dellinferenza statistica
Distribuzione t (di Student), per i campioni piccoli provenienti
da una popolazione di cui si ignorano i parametri
Distribuzione di Bernoulli, associata a una variabile casuale
bernoulliana
Distribuzione binomiale, utili per studiare le probabilit
relative a un campione estratto da una popolazione di
Bernoulli
Distribuzione di Poisson, o legge degli eventi rari
Distribuzione Chi Quadrato (), associata per esempio
allanalisi della varianza campionaria o allanalisi dei dati
qualitativi
Febbraio 2015
233
Febbraio 2015
234
Febbraio 2015
235
Dipartimento di
Comunicazione ed Economia
La distribuzione normale
(Gaussiana)
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
236
Peculiarit
la distribuzione di probabilit pi importante
per linferenza statistica
Caratteristiche:
Perfettamente simmetrica
Sempre sopra lasse orizzontale
Il totale dellarea sottesa pari a 1
Febbraio 2015
237
Febbraio 2015
238
Febbraio 2015
239
Febbraio 2015
240
La standardizzazione
Febbraio 2015
241
Febbraio 2015
242
il valore riportato
in riferimento
allarea, in
corrispondenza di
ogni z, la quota
dellarea al di
sotto della curva
corrispondente al
tratto compreso
tra z e - z
Febbraio 2015
243
Febbraio 2015
244
T a vo la d e lla d is trib u z io n e n o rm a le s ta n d a rd iz z a ta
z
0 ,0
0 ,1
0 ,2
0 ,3
0 ,4
0 ,5
0 ,6
0 ,7
0 ,8
0 ,9
1 ,0
1 ,1
1 ,2
1 ,3
1 ,4
1 ,5
1 ,6
1 ,7
1 ,8
1 ,9
2 ,0
2 ,1
2 ,2
2 ,3
2 ,4
2 ,5
2 ,6
2 ,7
2 ,8
2 ,9
3 ,0
0 ,0 0
0 ,0 0 0 0
0 ,0 3 9 8
0 ,0 7 9 3
0 ,1 1 7 9
0 ,1 5 5 4
0 ,1 9 1 5
0 ,2 2 5 7
0 ,2 5 8 0
0 ,2 8 8 1
0 ,3 1 5 9
0 ,3 4 1 3
0 ,3 6 4 3
0 ,3 8 4 9
0 ,4 0 3 2
0 ,4 1 9 2
0 ,4 3 3 2
0 ,4 4 5 2
0 ,4 5 5 4
0 ,4 6 4 1
0 ,4 7 1 3
0 ,4 7 7 3
0 ,4 8 2 1
0 ,4 8 6 1
0 ,4 8 9 3
0 ,4 9 1 8
0 ,4 9 3 8
0 ,4 9 5 3
0 ,4 9 6 5
0 ,4 9 7 4
0 ,4 9 8 1
0 ,4 9 8 7
0 ,0 1
0 ,0 0 4 0
0 ,0 4 3 8
0 ,0 8 3 2
0 ,1 2 1 7
0 ,1 5 9 1
0 ,1 9 5 0
0 ,2 2 9 1
0 ,2 6 1 1
0 ,2 9 1 0
0 ,3 1 8 6
0 ,3 4 3 8
0 ,3 6 6 5
0 ,3 8 6 9
0 ,4 0 4 9
0 ,4 2 0 7
0 ,4 3 4 5
0 ,4 4 6 3
0 ,4 5 6 4
0 ,4 6 4 9
0 ,4 7 1 9
0 ,4 7 7 8
0 ,4 8 2 6
0 ,4 8 6 4
0 ,4 8 9 6
0 ,4 9 2 0
0 ,4 9 4 0
0 ,4 9 5 5
0 ,4 9 6 6
0 ,4 9 7 5
0 ,4 9 8 2
0 ,4 9 8 7
0 ,0 2
0 ,0 0 8 0
0 ,0 4 7 8
0 ,0 8 7 1
0 ,1 2 5 5
0 ,1 6 2 8
0 ,1 9 8 5
0 ,2 3 2 4
0 ,2 6 4 2
0 ,2 9 3 9
0 ,3 2 1 2
0 ,3 4 6 1
0 ,3 6 8 6
0 ,3 8 8 8
0 ,4 0 6 6
0 ,4 2 2 2
0 ,4 3 5 7
0 ,4 4 7 4
0 ,4 5 7 3
0 ,4 6 5 6
0 ,4 7 2 6
0 ,4 7 8 3
0 ,4 8 3 0
0 ,4 8 6 8
0 ,4 8 9 8
0 ,4 9 2 2
0 ,4 9 4 1
0 ,4 9 5 6
0 ,4 9 6 7
0 ,4 9 7 6
0 ,4 9 8 3
0 ,4 9 8 7
0 ,0 3
0 ,0 1 2 0
0 ,0 5 1 7
0 ,0 9 1 0
0 ,1 2 9 3
0 ,1 6 6 4
0 ,2 0 1 9
0 ,2 3 5 7
0 ,2 6 7 3
0 ,2 9 6 7
0 ,3 2 3 8
0 ,3 4 8 5
0 ,3 7 0 8
0 ,3 9 0 7
0 ,4 0 8 2
0 ,4 2 3 6
0 ,4 3 7 0
0 ,4 4 8 4
0 ,4 5 8 2
0 ,4 6 6 4
0 ,4 7 3 2
0 ,4 7 8 8
0 ,4 8 3 4
0 ,4 8 7 1
0 ,4 9 0 1
0 ,4 9 2 5
0 ,4 9 4 3
0 ,4 9 5 7
0 ,4 9 6 8
0 ,4 9 7 7
0 ,4 9 8 3
0 ,4 9 8 8
0 ,0 4
0 ,0 1 6 0
0 ,0 5 5 7
0 ,0 9 4 8
0 ,1 3 3 1
0 ,1 7 0 0
0 ,2 0 5 4
0 ,2 3 8 9
0 ,2 7 0 4
0 ,2 9 9 5
0 ,3 2 6 4
0 ,3 5 0 8
0 ,3 7 2 9
0 ,3 9 2 5
0 ,4 0 9 9
0 ,4 2 5 1
0 ,4 3 8 2
0 ,4 4 9 5
0 ,4 5 9 1
0 ,4 6 7 1
0 ,4 7 3 8
0 ,4 7 9 3
0 ,4 8 3 8
0 ,4 8 7 5
0 ,4 9 0 4
0 ,4 9 2 7
0 ,4 9 4 5
0 ,4 9 5 9
0 ,4 9 6 9
0 ,4 9 7 7
0 ,4 9 8 4
0 ,4 9 8 8
0 ,0 5
0 ,0 1 9 9
0 ,0 5 9 6
0 ,0 9 8 7
0 ,1 3 6 8
0 ,1 7 3 6
0 ,2 0 8 8
0 ,2 4 2 2
0 ,2 7 3 4
0 ,3 0 2 3
0 ,3 2 8 9
0 ,3 5 3 1
0 ,3 7 4 9
0 ,3 9 4 4
0 ,4 1 1 5
0 ,4 2 6 5
0 ,4 3 9 4
0 ,4 5 0 5
0 ,4 5 9 9
0 ,4 6 7 8
0 ,4 7 4 4
0 ,4 7 9 8
0 ,4 8 4 2
0 ,4 8 7 8
0 ,4 9 0 6
0 ,4 9 2 9
0 ,4 9 4 6
0 ,4 9 6 0
0 ,4 9 7 0
0 ,4 9 7 8
0 ,4 9 8 4
0 ,4 9 8 9
0 ,0 6
0 ,0 2 3 9
0 ,0 6 3 6
0 ,1 0 2 6
0 ,1 4 0 6
0 ,1 7 7 2
0 ,2 1 2 3
0 ,2 4 5 4
0 ,2 7 6 4
0 ,3 0 5 1
0 ,3 3 1 5
0 ,3 5 5 4
0 ,3 7 7 0
0 ,3 9 6 2
0 ,4 1 3 1
0 ,4 2 7 9
0 ,4 4 0 6
0 ,4 5 1 5
0 ,4 6 0 8
0 ,4 6 8 6
0 ,4 7 5 0
0 ,4 8 0 3
0 ,4 8 4 6
0 ,4 8 8 1
0 ,4 9 0 9
0 ,4 9 3 1
0 ,4 9 4 8
0 ,4 9 6 1
0 ,4 9 7 1
0 ,4 9 7 9
0 ,4 9 8 5
0 ,4 9 8 9
0 ,0 7
0 ,0 2 7 9
0 ,0 6 7 5
0 ,1 0 6 4
0 ,1 4 4 3
0 ,1 8 0 8
0 ,2 1 5 7
0 ,2 4 8 6
0 ,2 7 9 4
0 ,3 0 7 9
0 ,3 3 4 0
0 ,3 5 7 7
0 ,3 7 9 0
0 ,3 9 8 0
0 ,4 1 4 7
0 ,4 2 9 2
0 ,4 4 1 8
0 ,4 5 2 5
0 ,4 6 1 6
0 ,4 6 9 3
0 ,4 7 5 6
0 ,4 8 0 8
0 ,4 8 5 0
0 ,4 8 8 4
0 ,4 9 1 1
0 ,4 9 3 2
0 ,4 9 4 9
0 ,4 9 6 2
0 ,4 9 7 2
0 ,4 9 7 9
0 ,4 9 8 5
0 ,4 9 8 9
0 ,0 8
0 ,0 3 1 9
0 ,0 7 1 4
0 ,1 1 0 3
0 ,1 4 8 0
0 ,1 8 4 4
0 ,2 1 9 0
0 ,2 5 1 7
0 ,2 8 2 3
0 ,3 1 0 6
0 ,3 3 6 5
0 ,3 5 9 9
0 ,3 8 1 0
0 ,3 9 9 7
0 ,4 1 6 2
0 ,4 3 0 6
0 ,4 4 2 9
0 ,4 5 3 5
0 ,4 6 2 5
0 ,4 6 9 9
0 ,4 7 6 1
0 ,4 8 1 2
0 ,4 8 5 4
0 ,4 8 8 7
0 ,4 9 1 3
0 ,4 9 3 4
0 ,4 9 5 0
0 ,4 9 6 3
0 ,4 9 7 3
0 ,4 9 8 0
0 ,4 9 8 6
0 ,4 9 9 0
0 ,0 9
0 ,0 3 5 9
0 ,0 7 5 3
0 ,1 1 4 1
0 ,1 5 1 7
0 ,1 8 7 9
0 ,2 2 2 4
0 ,2 5 4 9
0 ,2 8 5 2
0 ,3 1 3 3
0 ,3 3 8 9
0 ,3 6 2 1
0 ,3 8 3 0
0 ,4 0 1 5
0 ,4 1 7 7
0 ,4 3 1 9
0 ,4 4 4 1
0 ,4 5 4 5
0 ,4 6 3 3
0 ,4 7 0 6
0 ,4 7 6 7
0 ,4 8 1 7
0 ,4 8 5 7
0 ,4 8 9 0
0 ,4 9 1 6
0 ,4 9 3 6
0 ,4 9 5 2
0 ,4 9 6 4
0 ,4 9 7 4
0 ,4 9 8 1
0 ,4 9 8 6
0 ,4 9 9 0
il valore riportato
in ogni casella la
quota dellarea al
di sotto della
curva corrispondente al
tratto compreso
tra z = o e il
valore di z dato
dalla somma della
prima colonna e
della prima riga
Febbraio 2015
245
T a vo la d e lla d is trib u z io n e n o rm a le s ta n d a rd iz z a ta
z
0 ,0
0 ,1
0 ,2
0 ,3
0 ,4
0 ,5
0 ,6
0 ,7
0 ,8
0 ,9
1 ,0
1 ,1
1 ,2
1 ,3
1 ,4
1 ,5
1 ,6
1 ,7
1 ,8
1 ,9
2 ,0
2 ,1
2 ,2
2 ,3
2 ,4
2 ,5
2 ,6
2 ,7
2 ,8
2 ,9
3 ,0
0 ,0 0
0 ,0 0 0 0
0 ,0 3 9 8
0 ,0 7 9 3
0 ,1 1 7 9
0 ,1 5 5 4
0 ,1 9 1 5
0 ,2 2 5 7
0 ,2 5 8 0
0 ,2 8 8 1
0 ,3 1 5 9
0 ,3 4 1 3
0 ,3 6 4 3
0 ,3 8 4 9
0 ,4 0 3 2
0 ,4 1 9 2
0 ,4 3 3 2
0 ,4 4 5 2
0 ,4 5 5 4
0 ,4 6 4 1
0 ,4 7 1 3
0 ,4 7 7 3
0 ,4 8 2 1
0 ,4 8 6 1
0 ,4 8 9 3
0 ,4 9 1 8
0 ,4 9 3 8
0 ,4 9 5 3
0 ,4 9 6 5
0 ,4 9 7 4
0 ,4 9 8 1
0 ,4 9 8 7
0 ,0 1
0 ,0 0 4 0
0 ,0 4 3 8
0 ,0 8 3 2
0 ,1 2 1 7
0 ,1 5 9 1
0 ,1 9 5 0
0 ,2 2 9 1
0 ,2 6 1 1
0 ,2 9 1 0
0 ,3 1 8 6
0 ,3 4 3 8
0 ,3 6 6 5
0 ,3 8 6 9
0 ,4 0 4 9
0 ,4 2 0 7
0 ,4 3 4 5
0 ,4 4 6 3
0 ,4 5 6 4
0 ,4 6 4 9
0 ,4 7 1 9
0 ,4 7 7 8
0 ,4 8 2 6
0 ,4 8 6 4
0 ,4 8 9 6
0 ,4 9 2 0
0 ,4 9 4 0
0 ,4 9 5 5
0 ,4 9 6 6
0 ,4 9 7 5
0 ,4 9 8 2
0 ,4 9 8 7
0 ,0 2
0 ,0 0 8 0
0 ,0 4 7 8
0 ,0 8 7 1
0 ,1 2 5 5
0 ,1 6 2 8
0 ,1 9 8 5
0 ,2 3 2 4
0 ,2 6 4 2
0 ,2 9 3 9
0 ,3 2 1 2
0 ,3 4 6 1
0 ,3 6 8 6
0 ,3 8 8 8
0 ,4 0 6 6
0 ,4 2 2 2
0 ,4 3 5 7
0 ,4 4 7 4
0 ,4 5 7 3
0 ,4 6 5 6
0 ,4 7 2 6
0 ,4 7 8 3
0 ,4 8 3 0
0 ,4 8 6 8
0 ,4 8 9 8
0 ,4 9 2 2
0 ,4 9 4 1
0 ,4 9 5 6
0 ,4 9 6 7
0 ,4 9 7 6
0 ,4 9 8 3
0 ,4 9 8 7
0 ,0 3
0 ,0 1 2 0
0 ,0 5 1 7
0 ,0 9 1 0
0 ,1 2 9 3
0 ,1 6 6 4
0 ,2 0 1 9
0 ,2 3 5 7
0 ,2 6 7 3
0 ,2 9 6 7
0 ,3 2 3 8
0 ,3 4 8 5
0 ,3 7 0 8
0 ,3 9 0 7
0 ,4 0 8 2
0 ,4 2 3 6
0 ,4 3 7 0
0 ,4 4 8 4
0 ,4 5 8 2
0 ,4 6 6 4
0 ,4 7 3 2
0 ,4 7 8 8
0 ,4 8 3 4
0 ,4 8 7 1
0 ,4 9 0 1
0 ,4 9 2 5
0 ,4 9 4 3
0 ,4 9 5 7
0 ,4 9 6 8
0 ,4 9 7 7
0 ,4 9 8 3
0 ,4 9 8 8
0 ,0 4
0 ,0 1 6 0
0 ,0 5 5 7
0 ,0 9 4 8
0 ,1 3 3 1
0 ,1 7 0 0
0 ,2 0 5 4
0 ,2 3 8 9
0 ,2 7 0 4
0 ,2 9 9 5
0 ,3 2 6 4
0 ,3 5 0 8
0 ,3 7 2 9
0 ,3 9 2 5
0 ,4 0 9 9
0 ,4 2 5 1
0 ,4 3 8 2
0 ,4 4 9 5
0 ,4 5 9 1
0 ,4 6 7 1
0 ,4 7 3 8
0 ,4 7 9 3
0 ,4 8 3 8
0 ,4 8 7 5
0 ,4 9 0 4
0 ,4 9 2 7
0 ,4 9 4 5
0 ,4 9 5 9
0 ,4 9 6 9
0 ,4 9 7 7
0 ,4 9 8 4
0 ,4 9 8 8
0 ,0 5
0 ,0 1 9 9
0 ,0 5 9 6
0 ,0 9 8 7
0 ,1 3 6 8
0 ,1 7 3 6
0 ,2 0 8 8
0 ,2 4 2 2
0 ,2 7 3 4
0 ,3 0 2 3
0 ,3 2 8 9
0 ,3 5 3 1
0 ,3 7 4 9
0 ,3 9 4 4
0 ,4 1 1 5
0 ,4 2 6 5
0 ,4 3 9 4
0 ,4 5 0 5
0 ,4 5 9 9
0 ,4 6 7 8
0 ,4 7 4 4
0 ,4 7 9 8
0 ,4 8 4 2
0 ,4 8 7 8
0 ,4 9 0 6
0 ,4 9 2 9
0 ,4 9 4 6
0 ,4 9 6 0
0 ,4 9 7 0
0 ,4 9 7 8
0 ,4 9 8 4
0 ,4 9 8 9
0 ,0 6
0 ,0 2 3 9
0 ,0 6 3 6
0 ,1 0 2 6
0 ,1 4 0 6
0 ,1 7 7 2
0 ,2 1 2 3
0 ,2 4 5 4
0 ,2 7 6 4
0 ,3 0 5 1
0 ,3 3 1 5
0 ,3 5 5 4
0 ,3 7 7 0
0 ,3 9 6 2
0 ,4 1 3 1
0 ,4 2 7 9
0 ,4 4 0 6
0 ,4 5 1 5
0 ,4 6 0 8
0 ,4 6 8 6
0 ,4 7 5 0
0 ,4 8 0 3
0 ,4 8 4 6
0 ,4 8 8 1
0 ,4 9 0 9
0 ,4 9 3 1
0 ,4 9 4 8
0 ,4 9 6 1
0 ,4 9 7 1
0 ,4 9 7 9
0 ,4 9 8 5
0 ,4 9 8 9
0 ,0 7
0 ,0 2 7 9
0 ,0 6 7 5
0 ,1 0 6 4
0 ,1 4 4 3
0 ,1 8 0 8
0 ,2 1 5 7
0 ,2 4 8 6
0 ,2 7 9 4
0 ,3 0 7 9
0 ,3 3 4 0
0 ,3 5 7 7
0 ,3 7 9 0
0 ,3 9 8 0
0 ,4 1 4 7
0 ,4 2 9 2
0 ,4 4 1 8
0 ,4 5 2 5
0 ,4 6 1 6
0 ,4 6 9 3
0 ,4 7 5 6
0 ,4 8 0 8
0 ,4 8 5 0
0 ,4 8 8 4
0 ,4 9 1 1
0 ,4 9 3 2
0 ,4 9 4 9
0 ,4 9 6 2
0 ,4 9 7 2
0 ,4 9 7 9
0 ,4 9 8 5
0 ,4 9 8 9
0 ,0 8
0 ,0 3 1 9
0 ,0 7 1 4
0 ,1 1 0 3
0 ,1 4 8 0
0 ,1 8 4 4
0 ,2 1 9 0
0 ,2 5 1 7
0 ,2 8 2 3
0 ,3 1 0 6
0 ,3 3 6 5
0 ,3 5 9 9
0 ,3 8 1 0
0 ,3 9 9 7
0 ,4 1 6 2
0 ,4 3 0 6
0 ,4 4 2 9
0 ,4 5 3 5
0 ,4 6 2 5
0 ,4 6 9 9
0 ,4 7 6 1
0 ,4 8 1 2
0 ,4 8 5 4
0 ,4 8 8 7
0 ,4 9 1 3
0 ,4 9 3 4
0 ,4 9 5 0
0 ,4 9 6 3
0 ,4 9 7 3
0 ,4 9 8 0
0 ,4 9 8 6
0 ,4 9 9 0
0 ,0 9
0 ,0 3 5 9
0 ,0 7 5 3
0 ,1 1 4 1
0 ,1 5 1 7
0 ,1 8 7 9
0 ,2 2 2 4
0 ,2 5 4 9
0 ,2 8 5 2
0 ,3 1 3 3
0 ,3 3 8 9
0 ,3 6 2 1
0 ,3 8 3 0
0 ,4 0 1 5
0 ,4 1 7 7
0 ,4 3 1 9
0 ,4 4 4 1
0 ,4 5 4 5
0 ,4 6 3 3
0 ,4 7 0 6
0 ,4 7 6 7
0 ,4 8 1 7
0 ,4 8 5 7
0 ,4 8 9 0
0 ,4 9 1 6
0 ,4 9 3 6
0 ,4 9 5 2
0 ,4 9 6 4
0 ,4 9 7 4
0 ,4 9 8 1
0 ,4 9 8 6
0 ,4 9 9 0
Per esempio, a
unarea
simmetrica del
95% corrisponde unarea
compresa tra
0 e z del
47,5%. Il
corrispondente valore di
z quindi 1,96
Febbraio 2015
246
z1 = - z2
z1 = 0
z2 > 0
z1 < 0
z2 > 0
z1 > 0
z2 > 0
z1 < 0
z2 = +
z1 > 0
z2 = +
Febbraio 2015
247
Primo esempio
Febbraio 2015
248
Z1 = (28 36) / 4 = - 2
Z2 = (40 36) / 4 = + 1
Febbraio 2015
249
Secondo esempio
Febbraio 2015
250
Febbraio 2015
251
Lindice di aridit
Lindice di aridit la sintesi di fenomeni fisici (precipitazioni,
evaporazioni) e biologici (traspirazione vegetale). il rapporto tra
precipitazioni ed evapotraspirazione.
In estate, un valore inferiore a 0,5 significa aree semiaride
oppure aride. Un valore superiore a 0,65 significa aree umide o
iperumide.
La distribuzione delle rilevazioni estive in una determinata zona,
compiute da diverse stazioni, di tipo normale, con media (per
gli ultimi 30 anni) pari a 0,45 e deviazione standard pari a 0,04.
Quale la percentuale di rilevazioni che hanno fornito un valore
compreso fra 0,40 e 0,50?
pari al 78,88%.
In unit standard, infatti:
(0,40 0,45) / 0,04 = - 1,25
(0,50 0,45) / 0,04 = + 1,25
Febbraio 2015
252
Il procedimento inverso
Febbraio 2015
253
Febbraio 2015
254
Dipartimento di
Comunicazione ed Economia
Lapplicazione della
Gaussiana alla stima di una
somma o di una media
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
255
Lobiettivo
Febbraio 2015
256
Febbraio 2015
257
Febbraio 2015
258
Il modello durna
Come si determina la probabilit che la somma
(o la media) delle estrazioni sia compresa in un
certo intervallo?
Febbraio 2015
259
La somma attesa
La somma effettiva delle estrazioni sar pari a:
somma attesa errore standard della somma (SEsomma)
Somma attesa: prodotto del numero di estrazioni per la media
dei valori contenuti nellurna
SEsomma: (radice quadrata del numero estrazioni) ( dei valori
dellurna)
Ci significa che allaumentare del numero di estrazioni, lerrore
aumenta in termini assoluti, ma diminuisce in termini relativi
Febbraio 2015
260
La media attesa
Febbraio 2015
261
Febbraio 2015
262
per L1:
per L2:
z1 = 0,404
z2 = +1,616
Febbraio 2015
263
21 [+1]
344 [0]
somma attesa = 21
SD = 0,233
SE = 0,233 radq (365) = 4,45
20, in unit standard, diventa 0,22
quindi la probabilit del 59%
Febbraio 2015
264
Febbraio 2015
265
Febbraio 2015
266
Le soluzioni
modello durna:
valori contenuti: 4 14 13
ci sono 40 valori 4, 25 valori 14
35 valori 13
estrazioni: 16
Febbraio 2015
267
Dipartimento di
Comunicazione ed Economia
La distribuzione binomiale
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
268
Condizioni di utilizzo
Questa distribuzione esprime la probabilit che si
verifichino k successi (indipendentemente
dall'ordine) che si alternano a n - k insuccessi, su
un totale di n osservazioni tra loro indipendenti,
estratte nellambito di variabili bernoulliane.
Una variabile bernoulliana una variabile
dicotomica, ossia con due soli possibili valori,
come 0 e 1.
Ci si trova in questa situazione, per esempio,
quando si compiono esperimenti che possono
avere solamente due risultati possibili (come
conforme non conforme).
Febbraio 2015
269
Il calcolo
Con questa distribuzione quindi possibile calcolare la
probabilit che un evento si verifichi un numero preciso (k)
di volte, in un certo numero (n) di ripetizioni tra loro
indipendenti:
n!
k! (n-k)!
(1-p)
n-k
Febbraio 2015
270
n fattoriale
Febbraio 2015
271
Febbraio 2015
272
Il coefficiente binomiale
La prima parte della formula il coefficiente
binomiale:
Febbraio 2015
273
Trattamento terapeutico
Un trattamento terapeutico porta a un 75% di casi di
successo e a un 25% di insuccessi.
Sui prossimi 15 trattamenti, quale la probabilit
che esattamente 12 portino a un risultato positivo?
15!
12! 3!
(0,75)
12
(0,25)
= 0,2252
Febbraio 2015
274
Inadempienze
Febbraio 2015
275
Eco-contributo
I produttori di apparecchiature elettriche ed
elettroniche iscritti al repertorio RAEE hanno la
possibilit di applicare in modo visibile al consumatore
il sovrapprezzo corrispondente alleco-contributo per il
finanziamento dei rifiuti elettronici.
Il 20% dei produttori sfrutta questa possibilit.
Quale la probabilit che, su 8 apparecchi acquistati,
meno di tre abbiano esposto lapplicazione del
sovrapprezzo in modo visibile?
Febbraio 2015
276
Soluzioni
8!
2! 6!
8!
1! 7!
8!
0! 8!
Febbraio 2015
277
Dipartimento di
Comunicazione ed Economia
La distribuzione di Poisson
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
278
Febbraio 2015
279
Febbraio 2015
280
(lambda)
Il valore atteso di questa distribuzione indicato
con
il numero di successi che ci si aspetta in un
dato intervallo. Per esempio, se un evento si
verifica con una cadenza media di 4 minuti e
vogliamo sapere quante volte questo evento si
potr verificare in 10 minuti, il valore di sar
10/4 = 2,5
Al crescere di , la distribuzione di Poisson si
approssima con una distribuzione normale
Febbraio 2015
281
Febbraio 2015
282
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
.9048
.8187
.7408
.6703
.6065
.5488
.4966
.4493
.4066
.3679
.0905
.1637
.2222
.2681
.3033
.3293
.3476
.3595
.3659
.3679
.0045
.0164
.0333
.0536
.0758
.0988
.1217
.1438
.1647
.1839
.0002
.0011
.0033
.0072
.0126
.0198
.0254
.0383
.0494
.0613
.0001
.0003
.0007
.0016
.0030
.0050
.0077
.0111
.0153
.0001
.0002
.0004
.0007
.0012
.0020
.0031
.0001
.0002
.0003
.0005
4
5
6
7
.0001
Febbraio 2015
283
1,2
.3012
.3614
.2169
.0867
.0260
.0062
.0012
.0002
1,4
.2466
.3452
.2417
.1128
.0395
.0111
.0026
.0005
.0001
1,6
.2019
.3230
.2584
.1378
.0551
.0176
.0047
.0011
.0002
1,8
.1653
.2975
.2678
.1607
.0723
.0260
.0078
.0020
.0005
.0001
2
.1353
.2707
.2707
.1804
.0902
.0361
.0120
.0034
.0009
.0002
2,2
.1108
.2438
.2681
.1966
.1082
.0476
.0174
.0055
.0015
.0004
.0001
2,4
.0907
.2177
.2613
.2090
.1254
.0602
.0241
.0083
.0025
.0007
.0002
2,6
.0743
.1931
.2510
.2176
.1414
.0735
.0319
.0118
.0038
.0011
.0003
.0001
2,8
.0608
.1703
.2384
.2225
.1557
.0872
.0407
.0163
.0057
.0018
.0005
.0001
Febbraio 2015
3
.0498
.1494
.2240
.2240
.1680
.1008
.0504
.0216
.0081
.0027
.0008
.0002
.0002
284
3,5
.0302
.1057
.1850
.2158
.1888
.1322
.0771
.0385
.0169
.0066
.0023
.0007
.0002
.0001
4
.0183
.0733
.1465
.1954
.1954
.1563
.1042
.0595
.0298
.0132
.0053
.0019
.0006
.0002
.0001
4,5
.0111
.0500
.1125
.1687
.1898
.1708
.1281
.0824
.0463
.0232
.0104
.0043
.0016
.0006
.0002
.0001
5
.0067
.0337
.0842
.1404
.1755
.1755
.1462
.1044
.0653
.0363
.0181
.0082
.0034
.0013
.0005
.0002
5,5
.0041
.0225
.0618
.1133
.1558
.1714
.1571
.1234
.0849
.0519
.0285
.0143
.0065
.0028
.0011
.0004
.0001
6
.0025
.0149
.0446
.0892
.1339
.1606
.1606
.1377
.1033
.0688
.0413
.0225
.0113
.0052
.0022
.0009
.0003
.0001
6,5
.0015
.0098
.0318
.0688
.1118
.1454
.1575
.1462
.1188
.0858
.0558
.0330
.0179
.0089
.0041
.0018
.0007
.0003
.0001
7
.0009
.0064
.0223
.0521
.0912
.1277
.1490
.1490
.1304
.1014
.0710
.0452
.0263
.0142
.0071
.0033
.0014
.0006
.0002
.0001
7,5
.0006
.0041
.0156
.0389
.0729
.1094
.1367
.1465
.1373
.1144
.0858
.0585
.0366
.0211
.0113
.0057
.0026
.0012
.0005
.0002
.0001
Febbraio 2015
8
.0003
.0027
.0107
.0286
.0573
.0916
.1221
.1396
.1396
.1241
.0993
.0722
.0481
.0296
.0169
.0090
.0045
.0021
.0009
.0004
.0002
.0001
285
Infrazioni stradali
Febbraio 2015
286
Difettosit
Ipotizziamo che in linea generale un prodotto ogni 20
presenti una difettosit
Quale la probabilit che sui prossimi 60 prodotti si
verifichino 2 casi di difettosit? R.: 0,2240
Quale la probabilit che di questi 60 prodotti si
verifichino pi di casi di difettosit? Conviene ricorrere
allevento complementare: 1-0,423 = 0,577
Febbraio 2015
287
k = 11
Febbraio 2015
288
Febbraio 2015
289
Dipartimento di
Comunicazione ed Economia
La distribuzione t di Student
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
290
Le situazioni di utilizzo
Unaltra importante legge o distribuzione di probabilit
quella di Student (pseudonimo di William Gosset)
Questa distribuzione riguarda il parametro t, ed
utilizzata in molti test statistici
In modo particolare, si deve ricorrere a questa
distribuzione quando il campione di dimensione limitata
(n inferiore o uguale a 30), e proviene da una popolazione
distribuita normalmente, di cui per si ignorano i
parametri
In questo caso, la distribuzione delle medie (o delle
proporzioni) campionarie non segue la legge della
distribuzione normale, ma quella della distribuzione t di
Student
Febbraio 2015
291
La forma
La distribuzione di Student ha una forma a campana,
come la normale, ma pi appiattita, quindi la sua
dispersione maggiore.
La forma della distribuzione di t cambia al mutare dei
gradi di libert (GL)
Allaumentare dei GL, la distribuzione di t tende a
coincidere con quella normale.
In altri termini, la deviazione standard in questo caso non
pari a 1, come per la distribuzione normale
standardizzata, ma varia in funzione dei gradi di libert.
Quando i gradi di libert sono pari a 30, la forma della
distribuzione di Student arriva praticamente a coincidere
con la forma della distribuzione normale.
Febbraio 2015
292
Febbraio 2015
293
Febbraio 2015
294
Febbraio 2015
295
P
1 P ()
Febbraio 2015
296
75%
80%
85%
90%
95%
97.5%
99%
99.5%
99.75%
99.9%
99.95%
1,000
1,376
1,963
3,078
6,314
12,71
31,82
63,66
127,30
318,30
636,60
0,816
1,061
1,386
1,886
2,920
4,303
6,965
9,925
14,09
22,33
31,60
0,765
0,978
1,250
1,638
2,353
3,182
4,541
5,841
7,453
10,21
12,92
0,741
0,941
1,190
1,533
2,132
2,776
3,747
4,604
5,598
7,173
8,610
0,727
0,920
1,156
1,476
2,015
2,571
3,365
4,032
4,773
5,893
6,869
0,718
0,906
1,134
1,440
1,943
2,447
3,143
3,707
4,317
5,208
5,959
0,711
0,896
1,119
1,415
1,895
2,365
2,998
3,499
4,029
4,785
5,408
0,706
0,889
1,108
1,397
1,860
2,306
2,896
3,355
3,833
4,501
5,041
0,703
0,883
1,100
1,383
1,833
2,262
2,821
3,250
3,690
4,297
4,781
10
0,700
0,879
1,093
1,372
1,812
2,228
2,764
3,169
3,581
4,144
4,587
11
0,697
0,876
1,088
1,363
1,796
2,201
2,718
3,106
3,497
4,025
4,437
12
0,695
0,873
1,083
1,356
1,782
2,179
2,681
3,055
3,428
3,930
4,318
13
0,694
0,870
1,079
1,350
1,771
2,160
2,650
3,012
3,372
3,852
4,221
14
0,692
0,868
1,076
1,345
1,761
2,145
2,624
2,977
3,326
3,787
4,140
Febbraio 2015
297
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
75%
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
80%
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
85%
1,074
1,071
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
90%
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
95%
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
97.5%
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
99%
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
99.5%
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
99.75%
3,286
3,252
3,222
3,197
3,174
3,153
3,135
3,119
3,104
3,091
3,078
3,067
3,057
3,047
3,038
3,030
99.9%
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
Febbraio 2015
99.95%
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,767
3,745
3,725
3,707
3,690
3,674
3,659
3,646
298
Febbraio 2015
299
Febbraio 2015
300
Febbraio 2015
301
Dipartimento di
Comunicazione ed Economia
9 I METODI DI
CAMPIONAMENTO
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
302
Febbraio 2015
303
Febbraio 2015
304
Lerrore di campionamento
Il campione caratterizzato da un particolare
rischio di errore: lerrore di campionamento
Si tratta del margine di approssimazione dovuto al
fatto di considerare una parte rispetto al tutto. E
fisiologico in ogni indagine su campione
Nonostante ci, non sempre la rilevazione sulla
popolazione fornisce risultati pi precisi: in
un'indagine ci sono tanti rischi di errore
(imprecisioni, omissioni, sbagli di ogni genere)
Febbraio 2015
305
Febbraio 2015
306
La popolazione e il campione
La popolazione
N elementi
Il Campione
n elementi
Febbraio 2015
307
Metodi di campionamento
Febbraio 2015
308
La casualit statistica
Febbraio 2015
309
Febbraio 2015
310
Febbraio 2015
311
CAMPIONE CASUALE
STRATIFICATO
POPOLAZIONE
POPOLAZIONE
C
A
M
P
I
O
N
E
CAMPIONE
STRATO A
STRATO B
STRATO C
STRATO D
Febbraio 2015
312
Il campionamento sistematico
Febbraio 2015
313
Il campionamento a stadi - 1
In molti casi, la scelta casuale delle unit da un
unico elenco pu essere complessa e comportare
costi elevati
A livello nazionale, per esempio, lestrazione da una
sola lista porterebbe alla costruzione di un campione
molto disperso territorialmente, con costi elevati in
termini di tempi e di spese
Per risolvere questi problemi, si pu ricorrere a un
campionamento a stadi (anch'esso probabilistico)
Febbraio 2015
314
Il campionamento a stadi - 2
Febbraio 2015
315
Il campionamento a stadi
Estrazione
di un
campione di
province
POPOLAZIONE
DELLE
PROVINC
E
ITALIANE
Estrazion
e di un
campione
di comuni
Estrazione di
un campione
di unit
statistiche
Provincia
A
Provincia
B
Provincia
C
Provincia
D
Provincia
E
Febbraio 2015
316
Febbraio 2015
317
Dipartimento di
Comunicazione ed Economia
10 DISTRIBUZIONI
CAMPIONARIE E INTERVALLI
DI CONFIDENZA
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
318
per stimare p
Febbraio 2015
319
Febbraio 2015
320
Febbraio 2015
321
Il procedimento da seguire
Febbraio 2015
322
Febbraio 2015
323
Febbraio 2015
324
L'errore di campionamento
Il valore rilevato con un'indagine campionaria non
corrisponde perfettamente al valore della
popolazione, ma caratterizzato da un errore (e),
per eccesso o per difetto
Questo intervallo noto come intervallo di
confidenza: lintervallo che (con una prefissata
probabilit) contiene il valore reale del parametro
Gli estremi dellintervallo di confidenza sono chiamati
limiti di confidenza
L'errore che si disposti ad accettare viene deciso in
fase di impostazione della ricerca
Febbraio 2015
325
Febbraio 2015
326
Febbraio 2015
327
Febbraio 2015
328
Febbraio 2015
329
Febbraio 2015
330
Febbraio 2015
331
Febbraio 2015
332
Febbraio 2015
333
Febbraio 2015
334
Febbraio 2015
335
Febbraio 2015
336
Febbraio 2015
337
N * z2 * p * (1 - p)
n = __________________________
(N - 1) * e2 + z2 * p * (1 - p)
Febbraio 2015
338
N * z2 * 2
n = ______________________
(N - 1) * e2 + z2 *
Febbraio 2015
339
Febbraio 2015
340
Febbraio 2015
341
Febbraio 2015
342
z
2,58
2,33
1,96
1,65
Febbraio 2015
343
Febbraio 2015
344
Dipartimento di
Comunicazione ed Economia
Introduzione
Nome
corso alla statistica per le scienze economiche e sociali
Febbraio 2015
345
Lo scopo
Si tratta di procedure che consentono di prendere
decisioni, basate su un certo grado di probabilit
Lo scopo quello di verificare ipotesi
Per esempio: due indagini portano a due diverse
percentuali (p1 e p2):
C una differenza statisticamente
significativa tra p1 e p2?
Oppure si tratta delleffetto di errori di
campionamento?
Febbraio 2015
346
Situazioni di utilizzo
Febbraio 2015
347
Febbraio 2015
348
Febbraio 2015
349
Febbraio 2015
350
Il livello di significativit
Febbraio 2015
351
Larea di rifiuto
Febbraio 2015
352
Bidirezionale o monodirezionale?
Larea di rifiuto pu essere ripartita su entrambe le
code (test a due code, bidirezionale)
Febbraio 2015
353
Regione di
accettazione
Regione di rifiuto
V.att. + 1,96 SE
Introduzione alla statistica per le scienze economiche e sociali
Febbraio 2015
354
Regione
di rifiuto
V.att. - 1,96
Regione
di rifiuto
*
SE
V.att. + 1,96
SE
Febbraio 2015
355
Febbraio 2015
356
Il p-value
Oltre al metodo accennato, basato sulla regione di
rifiuto, si pu adottare un metodo diverso, che
ovviamente conduce agli stessi risultati:
il metodo del p-value
Febbraio 2015
357
Tipi di errore
Si ribadisce lassenza di certezze assolute, per cui le
conclusioni di un test statistico sono soggette ad
errori, di primo o secondo tipo
Nella realt:
Si decide di
accettare H0
Si decide di rifiutare
H0
H0 vera
Decisione
corretta
Errore di secondo
tipo
Decisione corretta
H1 vera
Febbraio 2015
358
Febbraio 2015
359
PROPORZIONE
DIFFERENZA TRA
MEDIE
DIFFERENZA TRA
PROPORZIONI
Valore atteso
radq (n)
p * (1-p)
Radq []
n
21
22
Radq [ + ]
n1
n2
p1 * (1-p1)
p2 * (1-p2)
Radq [ + ]
n1
n2
Febbraio 2015
360
Febbraio 2015
361
H1 : M < 70
362
Regione di
accettazione
Regione di
rifiuto (2%)
V.atteso - z
SE
Febbraio 2015
363
z = - 2,05
3 = 63,85
Febbraio 2015
364
Febbraio 2015
365
Febbraio 2015
366
Febbraio 2015
367
Febbraio 2015
368
Febbraio 2015
369
Febbraio 2015
370
Regione di
accettazione
Regione di
rifiuto (2,5%)
V.att. - z
Regione di
rifiuto (2,5%)
SE
V.att. + z
SE
Febbraio 2015
371
V.att.: 0,25
z = - 1,96
z = + 1,96
0,0125 = 0,2255
*
0,0125 = 0,2745
Febbraio 2015
372
Febbraio 2015
373
Febbraio 2015
374
Febbraio 2015
375
Febbraio 2015
376
z = - 1,96
z = + 1,96
limiti di confidenza:
0 - 1,96 * 0,05 = - 0,098
0 + 1,96 * 0,05 = + 0,098
Ci sono solo 5 possibilit su 100 che due campioni con
queste caratteristiche forniscano una differenza tra i
valori medi esterni al range compreso tra 0,098 e +
0,098
Di conseguenza, H0 da rifiutare
Febbraio 2015
377
Febbraio 2015
378
Febbraio 2015
379
Febbraio 2015
380
Febbraio 2015
381
z = 1,88
*
0,0569 = 0,107
Febbraio 2015
382