Sie sind auf Seite 1von 58

STIMA PUNTUALE E PER INTERVALLO

Legacy Edition
Copyright 25 ottobre 2012
Luca La Rocca
luca.larocca@unimore.it

UNIVERSIT DEGLI STUDI DI MODENA E REGGIO EMILIA

Indice

Introduzione
Stima puntuale ed errore standard
Stima per intervallo

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Introduzione

Introduzione
Stima puntuale ed errore standard
Stima per intervallo

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Introduzione

Supponiamo di essere interessati alla media di un carattere


quantitativo X in una popolazione la cui numerosit N troppo grande
per effettuare unindagine totale: sulla base di un campione casuale
semplice, di numerosit n  N, cosa possiamo dire su ?
Prima di raccogliere i dati, i valori di X nel campione sono numeri
aleatori: X1 , . . . , Xn indipendenti e identicamente distribuiti con
E[X1 ] =
sd (X1 ) =
dove la deviazione standard di X nella popolazione di interesse. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Introduzione

. . . dopo avere raccolto i dati i valori di X nel campione sono quantit


note: le modalit osservate x1 , . . . , xn (distribuzione unitaria).
Un caso particolare, spesso di interesse, quello in cui il carattere X
dicotomico; in questo caso
I

denotiamo la media di popolazione con , per ricordarci che in


realt si tratta di una proporzione di popolazione;

la deviazione standard di popolazione funzione della media di


popolazione:
q

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

(1 )

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Introduzione

Per fissare le idee, consideriamo i seguenti esempi:


I

misure ripetute della lunghezza di un pezzo meccanico


(in questo caso pu essere una caratteristica nota dello
strumento di misura);

indagine sul reddito dei membri di una certa comunit;

indagine sullopinione dei cittadini (favorevole/contrario)


nei confronti di una data proposta di legge.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

Introduzione
Stima puntuale ed errore standard
Stima per intervallo

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

Sembra naturale, per analogia, stimare puntualmente la media di


popolazione con la media campionaria
x

x1 + + xn
n

Per esempio, se n = 4 misure della lunghezza (in micron) di un pezzo


meccanico danno come risultato
x1 = 50000.92 x2 = 49998.70
x3 = 49998.89 x4 = 50000.47,
la media campionaria x = 49999.74 sar la nostra stima puntuale
(per analogia) della vera lunghezza .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

A parte la giustificazione per analogia, x una buona stima di ?


Nellapproccio frequentista si risponde a questa domanda studiando la
distribuzione campionaria dello stimatore puntuale
X

X1 + + Xn
n

di cui x realizzazione per il campione selezionato: tale distribuzione


(la distribuzione di X come numero aleatorio prima di raccogliere i dati)
riflette la variabilit della stima da campione a campione.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

10

Circa la bont della media campionaria X come stimatore puntuale della


media di popolazione si pu dire che:
corretto, cio E[X ] = , quale che sia R
I X
(si dice anche che X non distorto);
P
X consistente, cio X , per n , quale che sia R
(in virt della legge dei grandi numeri);
dove P ed E sono relativi alla distribuzione campionaria di X .

Dunque ci aspettiamo che, tipicamente, il valore stimato x sia


prossimo al valore incognito . . . tanto pi prossimo quanto pi
elevata la numerosit campionaria. . . ma quanto prossimo per un
dato valore di n?

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

11

Possiamo misurare la variabilit di X mediante il suo errore standard


sd (X )

se

che ci dar un valore tipico del valore assoluto dellerrore di stima x


(il quale non avr un segno privilegiato in quanto X corretto).
Vediamo che se decresce al crescere di n (a conferma della consistenza)
e in particolare decresce come uno su radice di piccola enne; inoltre
se nota (es. = 2 micron) possiamo valutare numericamente
se

nellesempio della misura della lunghezza di un pezzo meccanico.


Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

12

La valutazione numerica di se fornisce una stima con errore standard


della vera lunghezza :

x se

50000 1

laddove con una sola osservazione (x1 = 50000.92) si troverebbe

x1

50001 2;

quadruplicando il numero di misure si dimezza lerrore standard.


E se invece non nota?

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

13

Possiamo stimare mediante il suo analogo campionario:


r
(x1 x )2 + + (xn x )2
sd x =
n
Sar sd x una buona stima di ? Possiamo dire che lo stimatore
r
(X1 X )2 + + (Xn X )2
sd X =
n
consistente, ma distorto: E[sd X ] 6= .
In particolare E[sd X ] < , ovvero stimiamo per difetto. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

14

. . . inoltre E[sd 2X ] < 2 , di modo che sd 2x sar una sottostima della


varianza di popolazione 2 .
Poich siamo in grado di calcolare E[sd 2X ] =
S =

(X1 X )2 ++(Xn X )2
n 1

n 1 2
n

ci conviene usare

n
n 1

sd X

come stimatore di (al posto di sd X ) in modo da avere E[S 2 ] = 2 .


Avremo ancora E[S ] < , ma avremo ridotto al meglio delle nostre
possiblit lammontare della distorsione. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

15

. . . pertanto la nostra stima della deviazione standard di popolazione


non sar la deviazione standard campionaria, ma quella che
chiameremo deviazione standard corretta:
q
q
(x1 x )2 ++(xn x )2
n
=
s =
n 1
n1 sd x .
Si noti che:
I

alla luce di quanto visto il quadrato di s a essere (il valore fornito


da uno stimatore) corretto, non s stessa;

ai fini pratici s ' sd x , se n non troppo piccolo (diciamo n 10).

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

16

Se per esempio, in unindagine sul reddito dei membri di una certa


comunit, si seleziona un campione casuale semplice di n = 9 membri
della comunit e si osservano i seguenti redditi (in migliaia di euro)
x1 = 25.5 x2 = 21.0 x3 = 40.2
x4 = 15.1 x5 = 22.2 x6 = 16.6
x7 = 18.8 x8 = 20.0 x9 = 19.3
allora stimeremo il reddito medio relativo allintera comunit mediante
il reddito medio osservato x = 22.08 e la deviazione standard di
popolazione mediante la deviazione standard corretta s = 7.44.
q
Si noti che sd x = 7.01 = 89 s di modo che s ssd x ' 6%.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

17

Stimare la deviazione standard di popolazione ci consente di calcolare


lerrore standard stimato
sbe

7.44

2.48

di modo che una stima con errore standard (stimato) del reddito medio
di popolazione data da

x sbe

22.1 2.5

migliaia di euro: anche in questo caso riusciamo a valutare lordine di


grandezza dellerrore di stima.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

18

Nel caso particolare in cui X sia un carattere dicotomico, per esempio



1 se li-esimo intervistato favorevole
Xi =
0 se li-esimo intervistato contrario
con riferimento a una data proposta di legge, la media di popolazione
(parametro di interesse) la proporzione di individui favorevoli

E[X1 ]

P{X1 = 1}

nellintera popolazione, mentre la media campionaria (stima puntuale


per analogia) la proporzione campionaria della modalit 1:
x

x1 + + xn
n

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

n1
n

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

19

La peculiarit di questo scenario, come gi visto, che la deviazione


standard di popolazione funzione del parametro di interesse:
q
(1 )
=
Pertanto lerrore standard di X varr
r
se

(1 )
n

e converr stimarlo sostituendo con x:


r
x (1 x )
sbe =
n
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

20

Per esempio, se la proporzione di intervistati favorevoli


x

48%

in un campione casuale semplice di n = 1600 cittadini (popolazione di


interesse) troveremo la seguente stima con errore standard (stimato):

x sbe

48% 1.25%

dal momento che


r
sbe

0.48 0.52
1600

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

0.0125

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

21

In generale, se stimiamo il parametro con lo stimatore T , in presenza


di un parametro di disturbo per il quale disponiamo dello stimatore U,
possiamo valutare lordine di grandezza dellerrore di stima t con la
radice quadrata dellerrore quadratico medio (mean square error)
MSE, (T ) = E, [(T )2 ],
avendo cura, in pratica, di rimpiazzare e con le loro stime t e u;
si avr un trade-off tra correttezza e variabilit, in quanto
MSE, (T ) = Bias , (T )2 + Var , (T ),
dove Bias , (T ) = E, [T ] la distorsione di T (nulla per T corretto)1
1 Nel

caso della media si ha Bias , (X ) 0 e Var , (X ) = 2 /n.


Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima puntuale ed errore standard

22

Diremo che T1 pi efficiente di T2 quando


MSE, (T1 ) MSE, (T2 )
per ogni coppia , e la disuguaglianza stretta per qualche coppia , ;
se si confrontano stimatori corretti, baster considerare le varianze2
Avremo che Tn consistente (in media quadratica) quando
lim MSE, (Tn ) = 0

per ogni coppia , ; questo implica la correttezza asintotica di Tn .


2 La media campionaria X
lo stimatore corretto a varianza minima della media
di X1 quando X1 abbia distribuzione normale.
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

23

Introduzione
Stima puntuale ed errore standard
Stima per intervallo
Stima di una media con deviazione standard nota
Stima di una media con deviazione standard incognita
Stima di una proporzione
Determinazione della numerosit campionaria
Stima di una deviazione standard

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

24

Il difetto principale degli stimatori puntuali che tipicamente danno il


valore vero del parametro con probabilit (praticamente) nulla; per es.
I se = 0.47 e n = 10, ben che vada x = 0.5 (o x = 0.4);
I

il teorema del limite centrale ci dice che, per n grande,


la distribuzione campionaria di X approssimativamente normale,
di modo che
P{X = } ' 0.

Per questo abbiamo voluto, sin da subito, corredare le nostre stime


puntuali con il loro errore standard (deviazione standard campionaria);
questo quantifica linaffidabilit di uno stimatore puntuale, senza per
darne una valutazione probabilistica. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

25

. . . se vogliamo giungere a una valutazione probabilistica del


procedimento di stima, ci converr sostituire la stima puntuale con una
stima per intervallo:
l (x1 , . . . , xn )

u (x1 , . . . , xn )

dove l (x1 , . . . , xn ) e u (x1 , . . . , xn ) sono opportune statistiche,


ovvero funzioni dei dati, tali da garantire
l (X1 , . . . , Xn )

u (X1 , . . . , Xn )

con buona probabilit (es. 95%) vale a dire per molti campioni.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

26

Per esempio, con riferimento alle misure ripetute della lunghezza di un


pezzo meccanico, si trova
X 2 se

X + 2 se

con probabilit 95% (la distribuzione campionaria di X normale perch


normale , con buona approssimazione, ogni singola misurazione).
Se osserviamo x ' 50000 e sappiamo (dalle specifiche dello strumento,
correggendo per n = 4) che se = 1, otteniamo la stima per intervallo
49998

50002

ovvero un intervallo di valori cui confidiamo appartenga quello vero


(perch ci accade nella quasi totalit dei possibili campioni).
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

27

La coppia di numeri aleatori


L = l (X1 , . . . , Xn ) = X 2 se
U = u (X1 , . . . , Xn ) = X + 2 se
si dice intervallo di confidenza per .
Si dice invece intervallo di confidenza stimato la coppia di numeri
l (x1 , . . . , xn ) = x 2 se = 49998
u (x1 , . . . , xn ) = x + 2 se = 50002
ovvero la nostra stima per intervallo.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

28

Il livello di confidenza 1 2 dellintervallo (L, U ) la probabilit


P{L U }

1 2

che esso contenga il valore vero del parametero , vale a dire


la proporzione di campioni in cui la stima per intervallo giusta
(es. 1 2 = 0.95, corrispondente ad = 0.025).
Infatti, per lintervallo di confidenza stimato, delle due luna:
I

l (x1 , . . . , xn ) u (x1 , . . . , xn ) nel qual caso la stima giusta;

< l (x1 , . . . , xn ) oppure u (x1 , . . . , xn ) < nel qual caso la stima


sbagliata. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

29

0.4

Confidence Intervals

0.3

0.2

Density

0.1

0.0

49996

49998

50000

50002

50004

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

30

In pratica non possiamo sapere se una data stima per intervallo giusta
o sbagliata (dovremmo conoscere il valore del parametro, nel qual caso
la stima non ci servirebbe).
Sappiamo tuttavia che il nostro stimatore per intervallo fornisce una
stima giusta nella quasi totalit dei campioni che avremmo potuto
selezionare e pertanto confidiamo (al livello di confidenza prescelto,
es. 95%, in generale 1 2) che la stima ottenuta sia giusta.
Se malauguratamente abbiamo selezionato un campione sfortunato,
ci ritroviamo con una stima sbagliata e la nostra confidenza in tale stima
mal riposta.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

31

Si noti che ci piacerebbe affermare


l (x1 , . . . , xn )

u (x1 , . . . , xn ),

es. (misure ripetute della lunghezza di un pezzo meccanico)


49998

50002,

con probabilit 95, ma non possiamo. . .


. . . infatti, per farlo, dovremmo considerare come un numero aleatorio
(invece che come una quantit deterministica, seppure incognita); in tal
modo entreremmo nel reame della statistica bayesiana.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

32

La determinazione di un intervallo di confidenza (stimato) per un


parametro di interesse (es. media di popolazione) dipende dalla
distribuzione campionaria della statistica usata come stimatore.
A tal fine, per quanto riguarda la stima della media di una popolazione,
converr distinguere i seguenti casi:
I caso non dicotomico (stima di )
I
I

nota
incognita

caso dicotomico (stima di )


I
I

campione grande
campione piccolo

Si noti come lesempio delle misure ripetute della lunghezza di un pezzo


meccanico rientri nel primo caso: stima di con nota.
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

33

Introduzione
Stima puntuale ed errore standard
Stima per intervallo
Stima di una media con deviazione standard nota
Stima di una media con deviazione standard incognita
Stima di una proporzione
Determinazione della numerosit campionaria
Stima di una deviazione standard

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

34

Vogliamo stimare e nota.


Se
per la distribuzione del carattere nella popolazione
(la distribuzione di X1 ) vale lapprossimazione normale,
oppure
il campione grande (diciamo n 30) cosicch vale il
teorema del limite centrale,

X
la distribuzione campionaria di se , dove se = / n noto,
la distribuzione normale standard.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

35

Pertanto
X z se

X + z se

con probabilit 1 2, se prendiamo z tale che


(z )

1 ,

dove la funzione di ripartizione normale standard; il valore z si dice


coefficiente di confidenza al livello 1 2.
Per esempio, se vogliamo un livello di confidenza pari al 95%,
prenderemo = (1 0.95)/2 = 0.025 e troveremo (con un computer
o usando una tavola) z = 1.96 ' 2. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

36

(u)

0.4

Standard Normal Tail

0.0

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

37

. . . questo quello che abbiamo fatto nellesempio delle misure ripetute


delle lunghezza di un pezzo meccanico.
Nello stesso esempio, se vogliamo un livello di confidenza pari al 90%,
prenderemo = (1 0.9)/2 = 0.05 e troveremo z = 1.64, cosicch
49999.74 1.64 1

49999.74 + 1.64 1

49998.10

50001.38

ovvero
a meno che non ci abbia detto male (accade inun campione su dieci);
si ricordi che = 2 e n = 4 forniscono se = / n = 1,
mentre x = 49999.74 (recuperando le due cifre decimali).

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

38

Si noti che:
I

poich n piccolo, la procedura descritta valida in quanto vale


lapprossimazione normale per X1 (singola osservazione);

se n fosse grande (diciamo n 30) la procedura descritta


sarebbe valida anche se non valesse lapprossimazione normale
per X1 (grazie al teorema del limite centrale);

se avessimo n piccolo, ma non valesse lapprossimazione


normale per la singola osservazione, saremmo nei guai. . .

. . . il che non sorprende, visto che avremmo pochi dati e nessun modello
per spiegarli (dovremmo cercare un modello alternativo a quello
normale).

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

39

Introduzione
Stima puntuale ed errore standard
Stima per intervallo
Stima di una media con deviazione standard nota
Stima di una media con deviazione standard incognita
Stima di una proporzione
Determinazione della numerosit campionaria
Stima di una deviazione standard

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

40

Vogliamo stimare e incognita.


Se
per la distribuzione del carattere nella popolazione
(la distribuzione di X1 ) vale lapprossimazione normale,
oppure
il campione grande (diciamo n 30) cosicch vale il
teorema del limite centrale,

X
la distribuzione campionaria di ScE , dove Sc
E = S/ n, la distribuzione
t di Student con n 1 gradi di libert.
Si noti che una t di Student con molti gradi di libert (diciamo n 101)
praticamente indistinguibile dalla normale standard.
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

41

Pertanto
X t Sc
E

X + t Sc
E

con probabilit 1 2, se prendiamo t tale che


P { T t }

1 ,

dove T un numero aleatorio che segue la distribuzione t di Student


con n 1 gradi di libert.
Anche in questo caso luso di un opportuno coefficiente di confidenza
(qui t ricavato per esempio da una tavola delle distribuzioni t
di Student) permette di trasformare la nostra stima con errore standard
in un intervallo di confidenza (al livello 1 2).

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

42

Per esempio, se abbiamo osservato i redditi di n = 9 individui di una


certa comunit, trovando
x

= 22.1 migliaia di euro


s = 7.44 migliaia di euro,

supponendo una distribuzione normale per il reddito nella comunit


(supposizione ardita perch le distribuzioni di reddito sono tipicamente
asimmetriche a destra) un intervallo di confidenza (stimato) al livello
99% per il reddito medio degli individui appartenenti alla comunit
in questione si ottiene come segue. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo


I
I
I

43

. . . si prende = 0.005 (di modo che 1 2 = 0.99);


si trova t = 3.36 (es. da una tavola delle distribuzioni t di Student,
selezionando il valore corrispondente a n 1 = 8 gradi di libert);
si calcola lerrore standard stimato
sbe =

=
I

s
n
sd x
n 1

=
=

7.44

9
7.01

= 2.48
= 2.48;

si conclude
x t sbe x + t sbe
22.1 3.36 2.48 22.1 + 3.36 2.48
13.77 30.43
al livello di confidenza 99%.
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

44

Si noti il ruolo giocato dalla distribuzione t di Student,


confrontando t = 3.36 con z = 2.56: lintervallo di confidenza
pi ampio di quanto non sarebbe se adoperassimo la distribuzione
normale standard.
Se il campione piccolo e non vale lapprossimazione normale,
siamo nel caso in cui occorre cercare un modello alternativo.
Se il campione molto grande (come nellesempio seguente)
conviene prendere direttamente t = z ; in pratica come se fosse
nota. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

45

. . . supponiamo che la spesa media settimanale per alimenti in un


campione casuale semplice di n = 101 famiglie, selezionate fra quelle
residenti in una certa area geografica, sia pari a
x

315

euro

con deviazione standard corretta


s

82

euro.

Un intervallo di confidenza (stimato) al livello 90% per la spesa media


settimanale delle famiglie residenti nellarea in esame si ottiene come
segue. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

46

. . . si prende = 0.05 (di modo che 1 2 = 0.9);

si trova t = z = 1.64 (es. da una tavola della normale standard);

si calcola lerrore standard stimato


sbe

82

101

8.16;

si conclude
315 1.64 8.16 315 + 1.64 8.16
301.6 328.4
al livello di confidenza 90%.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

47

Introduzione
Stima puntuale ed errore standard
Stima per intervallo
Stima di una media con deviazione standard nota
Stima di una media con deviazione standard incognita
Stima di una proporzione
Determinazione della numerosit campionaria
Stima di una deviazione standard

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

48

Vogliamo stimare .
X

Se il campione grande, la distribuzione campionaria di ScE ,


p
dove Sc
E = X (1 X )/n, la distribuzione normale standard
(teorema del limite centrale).
In questo caso campione grande vuol dire:
I
I

in teoria almeno n 5 e n(1 ) 5;


in pratica almeno n1 = nx 5 e n0 = n(1 x ) 5.

Se invece il campione piccolo (n1 < 5 o n0 < 5) la questione pi


delicata: si pu ricorrere alla distribuzione esatta di nX
(distribuzione binomiale) come descritto per esempio da
Borra & Di Ciaccio (2008, pag. 332).
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

49

Un intervallo di confidenza (stimato) per , basato su un grande


campione, si trova come
x z sbe

x + z sbe,

dove z si ricava da una tavola della distribuzione normale standard


(o mediante un software statistico) in modo da garantire il livello di
confidenza desiderato (1 2).
Se per esempio, con riferimento a una proposta di legge, si hanno
n1 = 768
n0 = 832




intervistati favorevoli

intervistati contrari

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

50

di modo che x = 48% e


r
r
x (1 x )
48 52
sbe =
=
% = 1.25%
n
1600
troveremo un intervallo di confidenza al livello 80% prendendo = 0.10
e quindi z = 1.28:
x z sbe x + z sbe
0.48 1.28 0.0125 0.48 + 1.28 0.0125
46.4% 49.6%
Quindi, al livello di confidenza 80%, escludiamo vi sia una maggioranza
di elettori favorevole alla proposta di legge.
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

51

Introduzione
Stima puntuale ed errore standard
Stima per intervallo
Stima di una media con deviazione standard nota
Stima di una media con deviazione standard incognita
Stima di una proporzione
Determinazione della numerosit campionaria
Stima di una deviazione standard

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

52

Supponiamo di volere stimare una media di popolazione e,


per semplicit, di conoscere la corrispondente deviazione standard
(una stima essendo in pratica ugualmente utile).
Per ridurre lerrore standard sotto una soglia possiamo scegliere n
in modo che si abbia


n
ovvero prendere n (/)2 . . . ovviamente intero!
Per esempio, con riferimento alle misure ripetute della lunghezza di un
pezzo meccanico, per ridurre lerrore standard a meno di mezzo micron
prenderemo n (2/0.5)2 = 16.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

53

Introduzione
Stima puntuale ed errore standard
Stima per intervallo
Stima di una media con deviazione standard nota
Stima di una media con deviazione standard incognita
Stima di una proporzione
Determinazione della numerosit campionaria
Stima di una deviazione standard

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

54

Vogliamo stimare e supponiamo senzaltro che non sia nota.


Se
per la distribuzione del carattere nella popolazione
(la distribuzione di X1 ) vale lapprossimazione normale,
oppure
il campione grande (diciamo n 30) cosicch vale il
teorema del limite centrale e la distribuzione di popolazione ha
code della stessa pesantezza della normale (tecnicamente se
E[(X1 )4 ] = 34 come per la distribuzione normale),
la distribuzione campionaria di
con n 1 gradi di libert.

(n 1)S 2
2

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

la distribuzione chi-quadrato

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo


Pertanto

55

(n 1)S 2
(n 1)S 2
2

2
21

con probabilit 1 2, se prendiamo 2 e 21 in modo che


P{X 2 21 } = 1
P{X 2 2 } =
dove X 2 un numero aleatorio che segue la distribuzione chi-quadrato
con n 1 gadi di libert.
Si noti che, poich le distribuzioni chi-quadrato non sono simmetriche,
servono due percentili (uno per ogni coda).
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

56

Nellesempio della spesa media settimanale per alimenti rilevata in un


campione casuale semplice di n = 101 famiglie avevamo registrato una
deviazione standard corretta
s

82

euro.

Troveremo un intervallo di confidenza (stimato) al livello 90% per la


deviazione standard di popolazione come
s
s
n1
n1
s
s
2
21
dove. . .

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Stima per intervallo

57

. . . = 0.05, in modo che 1 2 = 0.9,


21 = 77.9294
2 = 124.3421,
come indicato da un software statistico o da una tavola dei valori critici
delle distribuzioni chi-quadrato, e n 1 = 100; sar dunque
r
r
100
100
82
= 93
74 = 82
124
77.9
al livello di confidenza 90%.
In caso di code di pesantezza diversa dalla normale la distribuzione
di S 2 dipende da un parametro di disturbo (non approfondiamo).
Insegnamento di Introduzione alla Statistica
per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Bibliografia

58

B ORRA, S. & D I C IACCIO, A. (2008).


Statistica: Metodologie per le Scienze Economiche e Sociali
(Seconda Edizione).
McGraw-Hill, Milano.

Insegnamento di Introduzione alla Statistica


per le Scienze Economiche e Sociali (ISSES)

Corso di Laurea in Marketing


e Organizzazione dImpresa (MOI)

Das könnte Ihnen auch gefallen