Sie sind auf Seite 1von 10

Statistica descrittiva

indici
indici (o misure) di posizione
media campionaria di n osservazioni x1, x2, ..., xn
n
1
x = xi
n i=1
per k campioni x ripetuti ciascuno con frequenza fi
k

x =

1
x f
n i=1 i i

coefficiente di curtosi
curt =

n
xi x
1

n i=1

misura quanto la distribuzione appuntita

correlazioni
covarianza
di n osservazioni congiunte di 2 variabili {(x1,y1), (x2,y2), ..., (xn,yn)}:
n

1
x x yi y = 1n x i yi x y
n i=1 i
i=1
se xy 0 x e y sono direttamente correlate: a valori grandi (piccoli) di
xy =

propriet
Posto yi =a xi b : y=a x

mediana m di n osservazioni x1 x2 ... xn


se n dispari: m= x n1 /2
se n pari: m=

se vale zero indica che la distribuzione simmetrica rispetto alla media


se positivo denota una coda verso destra
se negativo denota una coda verso sinistra

x n / 2 x n/2 1
2

x corrispondo valori grandi (piccoli) di y;


se xy 0 x e y sono inversamente correlate: a valori grandi (piccoli)
di x corrispondo valori piccoli (grandi) di y;
se xy =0 x e y sono incorrelate;

coefficiente di correlazione

moda
punto di massimo della distribuzione di frequenza
una distribuzione con un solo punto di massimo detta unimodale
una distribuzione con pi punti di massimo detta plurimodale

xy =

xy
; 1 xy 1
x y

indici di dispersione

indice normalizzato, adimensionale ed invariante per trasformazioni


lineari delle variabili

varianza di n osservazioni x1, x2, ..., xn

regressione lineare

2 =

1
x x 2
n i =1 i

per k campioni x ripetuti ciascuno con frequenza fi


k

1
1
2 = xi x 2 f i = x 2i f i x 2
n i=1
n i= 1
propriet
2
2 2
posto yi =a xi b : y =a x

deviazione standard o scarto quadratico medio


=

retta y= a x b che meglio approssima la nuvola di punti xi , y i

a =

xy

2
x

y x xy
; b=
2
x

valori stimati
y i = a xi b
rappresentano i valori stimati di y a partire dalla retta di regressione
lineare

residui
r i = yi y i
differenza tra i valori reali e stimati

range di n osservazioni x1 x2 ... xn


differenza tra massima e minima osservazione

range= xn x1

valore previsto
y0= a x 0 b
x0 un valore diverso dai valori xi gi osservati

p-esimo quantile (o 100p-esimo percentile) di di


n osservazioni x1 x2 ... xn
p 0,1 , si considera il numero np
se np non intero: k l'intero successivo , Q p = x k
se np intero: k = np , Q p =

x k xk 1
2

cambiamento di scala
log y=a log xb
b

y=e x

devianza totale
n

DEV TOT = DEV REG DEV RES = yi y 2


i=1

quartili

Q1 primo quartile: quantile per p = 0.25


Q2 secondo quartile: quantile per p = 0.5 (= mediana)
Q3 terzo quartile: quantile per p = 0.75

differenza interquartile (IQR InterQuartile


Range)
IQR=Q 3 Q 1

indici di forma

DEV REG = y i y ; DEV RES = yi y i


2

i =1

i=1

coefficiente di determinazione
2

R2 =

DEV REG
DEV RES y
2
=1
=
;
DEV TOT
DEV TOT 2y 0 R 1

tanto pi esso si avvicina ad uno tanto pi la funzione di regressione


trovata buona.

coefficiente di asimmetria (skewness)


sk=

n
x x
1
i
n i=1

Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

propriet
P =1
P =0
P
A =1P A
P A B= P A P B P A B

Probabilit
definizioni
eventi elementari
tutti i possibili esiti di un esperimento aleatorio

P n=1 A n = P An , con Ai A j = se i j

evento
ogni sottoinsieme di uno spazio campionario discreto

n =1

probabilit classica

spazio campionario

la probabilit di un evento il rapporto dei casi favorevoli ed il numero


dei casi possibili
posto di N elementi k (k = 1, 2, .., N) e
P { k }= p , eventi elementari equiprobabili , A evento
qualunque

insieme di tutti gli eventi elementari; pu essere:

discreto
se gli elementi sono un numero finito o un'infinit numerabile

P { k }= pk

A A
P A= P { k }= pA= =
N
A
Ail numerodi elementi di A

continuo
se pi numeroso (ad esempio: tutti i numeri reali in un certo
intervallo)

linguaggio

permutazione di n oggetti

insiemi

eventi

ogni allineamento di n oggetti distinti in n caselle

P n= n!=n n1n232

, intero spazio campionario

evento certo

, insieme vuoto

evento impossibile

insieme

l'evento si verifica

insieme

A complementare di A

l'evento non si verifica

A B , (unione)

si verifica almeno uno dei due eventi

A B , (intersezione)

gli eventi si verificano simultaneamente

)
A B , ( sottrazione = A B

si verifica

AB= , eventi disgiunti

gli eventi sono incompatibili

B A ( B incluso in A )

e non si verifica

B implica A

propriet eventi A, B, C sottoinsiemi di


A A= A
A A= A
A B= B A
A B= B A
A BC= ACC
A BC = ACC
A BC= A B AC
A BC= A B AC
A= A
A=
A=
A= A
A A=
A A=
B= A B
A
B= A B
A
A =A

probabilit su
P : P [0,1]

propriet di n! (n fattoriale)
0!=1
n!
=n1!
n
n!
= nn1n 2m1 , con m n
m!

disposizione di n oggetti in k posti


ogni allineamento di k oggetti scelti tra n oggetti distinti in k posti

Dn , k = n n1n2nk 1 , con 1k n
Dn , n= P n= n!

disposizione con ripetizione di n oggetti in k


posti
ogni allineamento di k oggetti scelti tra n oggetti e ripetibili, in k posti

Dn , k = n , con k1

combinazione di n oggetti di classe k


ogni sottoinsieme di k elementi dell'insieme di n oggetti
(modi per scegliere k oggetti tra n)

D n , k n nn1n2 nk 1
=
=
,
Pk
k
k!
con n1 ; 0k n
coefficiente Binomiale
n = n =C
n = n =1
n =n
;
n ,k ;
k
n k
0
n
1
C n , k=

combinazione con ripetizione di k oggetti scelti


fra n
ogni gruppo formato di k oggetti scelti fra n, che possono essere ripetuti
(modi per disporre k oggetti uguali in n posti)

C n , k = n k1 = n k1
k
n1

permutazione con ripetizione di n oggetti uguali


fra loro a gruppi
(allineamento in n posti di n oggetti)

Pk

1,

k 2,. .. k r

n!
k 1!k 2!k r !

Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

probabilit condizionata
probabilit dell'evento A, condizionata a B
P A B
P AB=
P B
propriet
P A B= P BA= P AB PB= P B A P A
P B A P A
P AB=
P B
P
AB=1 P A B
probabilit totali
n

legge (o distribuzione) di una v.a.


applicazione che associa ad ogni intervallo I il numero:

P X I = P { : X I }

densit discreta di X
funzione che ad ogni valore assunto da X associa la probabilit che X
assuma quel valore

p X x k = P X =x k

propriet
probabilit dell'evento X I :

P X I = pX x k , purch la serie converga


x k I

P A= P A B j P B j ,

v.a. indipendenti

con

se scelti n intervalli I 1, I 2, , I n si ha
P X 1 I 1, X 2 I 2, , X n I n = P X 1 I 1 P X 2 I 2 P X n I n

j=1
n
j=1
j

B = , B i B j = per i j , P B j 0 per ogni j

caso notevole:

P A= P AB P B P A
B P
B ,
con {B ,
B } partizione di

formula di Bayes
P AB k P B k
P Bk A= n
, per ogni k
P AB j P B j
j=1

indipendenza di eventi
eventi A, B indipendenti
lo sono se soddisfano una delle seguenti condizioni

P A B= P AP B
P AB= P A
P B A= P B

famiglia di eventi indipendenti


n eventi A1, A2, ..., An costituiscono una famiglia di eventi indipendenti
se per ogni sottofamiglia di r eventi ( 2r n ), la probabilit di
intersezione di questi r eventi uguale al prodotto delle probabilit di
ciascuno di essi:

P Ai A j = P Ai P A j , per ogni coppia di indici i j


P Ai A j An = P Ai P A j P A n

data una famiglia di eventi indipendenti, anche sostituendo alcuni Ai


i , rimane una famiglia di eventi indipendenti.
con i complementari A

valore atteso, o media , o speranza matematica


X =EX = x k p X xk , per X discreta
k

X =EX = tf X t dt , per X continua

propriet
E aX b= a EX b , con a , b
E X 1 X 2 X n= EX 1 EX 2 EX n
E X 1X 2 X n = EX 1EX 2 EX n ,
con X 1, X 2, , X n v.a. indipendenti
Ef X = f x k p X x k , purch la serie converga
k

E aX 1 b= aEX 1b , per ogni a , b per v.a. continue


E g X 1 = g t f

X1

t dt , per g : per v.a. continue

varianza
X v.a. discreta:
2

X =VarX = E X EX = E X EX
X v.a. continua:

Affidabilit di un sistema

2X =VarX = E X 2 EX 2= t 2 f X t dt t f X t dt

componenti in serie

propriet
VarX 0
VarX = E X 2 EX 2
Var c=0 , per ogni costante c
2
Var aX b=a VarX , per ogni a ,b

il sistema funziona se e solo se funzionano tutti i componenti

affidabilit (probabilit che il sistema funzioni)


a =a 1a 2 an

componenti in parallelo
il sistema funziona se e solo se funziona almeno un componente

affidabilit (probabilit che il sistema funzioni)


a=11a1 1a2 1an

variabili aleatorie e modelli probabilistici


variabili aleatorie
variabile aleatoria (v.a.) discreta
una qualunque funzione:

X :
X I , con I un'abbreviazione di { : X I }

VarX = x k EX 2 p X x k = x 2k pX xk EX 2
k

Var X 1 X 2 X n =VarX 1VarX 2VarX n ,


con X i indipendenti

deviazione standard o scarto quadratico medio


X = X = VarX
2

covarianza
Cov X , Y =E X EX Y EY = E XY EXEY ,
con X , Y v.a. con varianza finita

Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

propriet
Cov X , X =VarX
Cov X , c=0 , per ogni costante c
Cov X ,Y =Cov Y , X
Cov X Y , Z =Cov X , Z Cov Y , Z
Cov Y , Y Z =Cov X ,Y Cov X , Z
Cov aX , Y =aCov X , Y
Cov X , aY =aCov X ,Y
Var X Y =VarX VarY 2Cov X , Y
Cov X ,Y VarXVarY dis.Cauchy Swartz

Binomiale di parametri n e p
X ~ B n , p

conta il numero complessivo di successi ottenuti in n prove (estrazione


con reimissione)

k
n k
p X k = n p 1 p , k=0,1,2,... , n
k
EX =np ; VarX = np1 p
12p
16p 1 p
sk X =
; curt X =3
np1 p
np1np

il numero di oggetti di tipo K che si trovano in un campione di n oggetti


estratti con reimmissione da un insieme di N oggetti che contiene K
oggetti di un tipo e (N-K) oggetti di un'altro :

correlazione
due v.a. con varianza finita si dicono incorrelate se:

Cov X , Y =0

X ~ B n ,

in tal caso:

Var X Y =Var X Var Y

processo di Bernoulli illimitato

coefficiente di correlazione di X, Y

sequenza infinita di prove

XY
Cov X ,Y
Binomiale negativa di parametri -n e p
XY

, dove1 XY 1
XY VarXVarY
X ~ B n , p
conta
il numero di insuccessi che si ottengono prima di ottenere n

se XY vicino a zero: X e Y sono quasi indipendenti


successi
se XY positivo: ad X grande corrisponder in genere una Y grande
nk1 pn 1 pk , k =0,1,2,. ..
se XY negativo: ad X grande corrisponder in genere una Y piccola p X k =
k
se XY =1 le v.a. sono una funzione lineare dell'altra: Y =aX b
1 p VarX = n 1 p
EX =n
;
standardizzata di X
p
p2

una v.a. ottenuta da una v.a. X con media e varianza finite:

X X
X

EX =0 ; Var X = 1

il numero Y di prove necessarie per ottenere n successi:

X =

disuguaglianza di Cebicev
2
sia X una v.a. di valore atteso X e varianza X finite, allora per
ogni 0 :

P X X X

1
, ovvero
2

P X X X = P X X X X X 1

1
2

sequenza di esperimenti di Bernoulli indipendenti di uguale parametro


p

esperimento bernulliano o prova di Bernoulli


un esperimento aleatorio che pu avere solo due esiti possibili:

successo : con probabilit p

insuccesso : con probabilit (1-p)


p il parametro della prova di Bernoulli

processo di Bernoulli limitato


il numero di prove finito

bernulliana di parametro p
X ~ B p

descrive l'esito di ogni prova di Bernoulli

p X 1= p ; p X 0 =1 p
EX = p ; VarX = p 1 p

la probabilit di ottenere, in n prove, una particolare sequenza di k


successi e (n-k) insuccessi :
k

nk

la probabilit di ottenere, in n prove, almeno un successo :


n

11 p

conta il numero di prove necessarie per ottenere il primo successo


k 1

processo di Bernoulli

p 1 p

n
kn
P Y = k = P X n= k= P X =k n= k 1 p 1 p ,
k n
per k =n , n1, n2,. ..
Geometrica di parametro p
X ~G p

p X k = p 1 p
, per k=1,2,3,...
1 VarX = 1 p
EX = ;
p
p2

Geometrica traslata di parametro p


X ~G ' p

conta il numero di insuccessi prima del primo successo


k

p X k = p 1 p , per k=0,1,2,. ..
1 p VarX = 1 p
EX =
;
p
p2

Ipergeometrica di parametri (N, K, n)


X ~G N , K , n , con N k ; N n

conta il numero di oggetti di tipo K che si trovano in un campione di n


oggetti estratti senza reimmissione da un insieme di N oggetti che
contiene K oggetti di un tipo e (N-K) oggetti di un altro.

K N K

k n k
p k =
, con 0k n ; k K ; nk N K
N
n
K
K N n
K
VarX =n 1
EX =n
N
N N 1
N
X

approssimazione Binomiale
per N (e quindi K) molto grandi (N > 10n) come se estraessimo con
reimissione:

X ~G N , K , n X ~ B n ,

Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

K
, per N
N
4

K
k
nk
p X k n p 1 p
, per N , p=
k
N
N n
EX =np ; VarX =np 1 p
N 1
N n

(fattore di correzione per la popolazione finita (< 1))


N 1

Poisson di parametro > 0


permette di descrivere quantitativamente situazioni in cui non abbiamo
accesso ai valori di N e p, ma possediamo un unica informazione
numerica: il parametro (numero medio di arrivi)
k

, per k = 0,1,2,
k!
EY = ; VarY =
1
1
sk X =
; curt X =3

1
=1/ arctan barctan a
2
1t

densit Normale Standard


f X t =

1 t / 2
e
2
2

P a X b =

1 t /2
e
dt
2
2

funzione di ripartizione di X (f.d.r.)


equivale alla densit discreta nel caso continuo

F X t: [0,1]
F X t= P X t , per ogni t
t

F X t= f X y dy , per X continua

F X t= p X xk , per X discreta
x kt

approssimazione della Binomiale


per N molto grande e p molto piccolo:

Y ~ P 0 Np , P X = k P Y = k

processo Poisson di intensit


permette di calcolare probabilit di eventi che accadono in un certo
intervallo di tempo diverso da quello su cui abbiamo informazioni di
partenza;
posto =t con numero medio di arrivi nell'unit di tempo, il
numero X t di arrivi nell'intervallo di tempo [ 0, t ] dato da

X t ~ P 0 t

propriet
se t1 t2 , X t 1 X t2 , P X t 1 P X t2 ,
F X t monotona crescente
F X t1 per t
F X t 0 per t
F X b F X a= P X b P X a= P a X b ,
con a , b , ab
la f.d.r. di una v.a. continua sempre una funzione continua
nei punti in cui la densit continua; in questi punti derivabile:
'

F X t= f X t

t
p X k =e t
, per k = 0,1,2,
k!
EX t = t ; VarX t = t

quantile -esimo (q)

P X q = , con q a , b , 0,1

variabili aleatorie continue

variabili aleatorie legate al processo di


Poisson

densit continua fx
determina la legge della v.a. continua X;
una densit di probabilit

legge Esponenziale di parametro


Y ~ Esp , con 0

P X I f x t dt , con I
I

f x : ; f x t 0 , per ogni t ;

propriet
se X i ~ P 0 i allora:
X 1 X 2 X n~ P 0 1 2 n
X ~B N , p

P a X b =

curva a campana di Gauss, o curva degli errori

Y ~ P 0 , con 0

pY k = e

densit di Cauchy
1
f X t =
1t 2

f x t dt =1

propriet
P X =t =0 , per ogni t (la probabilit che assuma un
valore fissato nulla (integrale di un punto))

P X a= P X a
P a X b= P a X b

esempi di densit continue


densit uniforme
1
f X t =
I
t , a ,b , ab
b a a , b
I a ,b t=1 , per ta , b
con
(funzione indicatrice)
I a ,b t=0 , per t a ,b
1
1
P X J =
I a , b t dt=
a , b J
ba
b
a
J

misura l'istante del primo arrivo in un processo di Poisson Xt di


intensit , o il tempo di attesa tra due arrivi successivi;
l'unico modello adeguato a rappresentare il tempo di vita di un
apparecchio non soggetto ad usura
t

F Y t=1e
, per t0
F Y t=0 , per t0
t
f Y t =e
, per t0
f Y t =0 , per t0
1
1
E Y = ; Var Y = 2

sk X =2 ; curt X =9
stimatore non distorto per legge Esponenziale
n1 n1
U =T
= n
n
Xi
i=1

Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

n1
n

Xi

n1 1
, stima di
n X n

i =1

legge Gamma di parametri n (intero positivo) e


(intero positivo)
Y ~ n ,

modello Normale
legge Normale standard
Z ~ N 0,1
t
y
1
2
F Z t=
e
dy t

2
t
1
f Z t =
e 2 t
2
E Z =0 ; Var Z =1
propriet
t =1 t , simmetria
2

misura l'istante dell'ennesimo arrivo in un processo di Poisson Xt di


intensit
n1

t
, per t 0
k!
k=0
F Y t=0 , per t0
n 1
t t
n1 t
f Y t =e
=C n , t e
, per t 0 ,
n1!
f Y t =0 , per t0
n

C n ,=
n1!
n
n
E Y = ; Var Y = 2

F Y t=1 e

legge Gamma di parametri r e (reali positivi)

calcoli con i quantili


posto z quantile -esimo della legge Normale standard:
z = z 1
P Z z =
P Z z 1=
P Z z 1/2 =
P Z z 1 /2=

legge Normale (o gaussiana) di media e


varianza 2
descrive il tempo di vita di un apparecchio la cui propensione al guasto
2
Y ~ r ,

cresce col tempo, fino al limite


r 1 t

f Y t =C r , t e
, per t0
f Y t =0 , per t0
r
r
E Y = ; Var Y = 2

assenza di memoria
P Y T tY T =P Y t
P Y T t = P Y tP Y T

X ~ N ,

rappresenta bene gli errori di approssimazione

F X t=

t
1
1
f X t =
=
e

EX = ; Var X = 2

t 2
22

sk X

=0 ; curt X =3
X
la v.a. Z =
ha legge Normale standard

istantaneous failure rate (propensione istantanea propriet


2
2
al guasto)
posto X 1~ N 1, 1 , X 2~N 2, 2 indipendenti:
2
2
f Y t
X 1 X 2 ~ N 1 2, 1 2
Z t =
1 F Y t
posto a ,b :
2 2
per la legge Esponenziale:
aX 1 b~ N a 1b , a 1
Z t = , per t 0
relazione tra legge Normale e legge Normale standard
2
per la legge Gamma:
Z ~ N 0,1 Z ~ N ,
n
n1
n1

t
t
X
2
Z t =C n n1
X ~ N ,
~ N 0,1
k =
n1
k
n1!

t
t
k!
k!
errori
k=0
k=0
Y =misura di una grandezza fisica
densit di Weibull
=valore vero
utile a rappresentare il tempo di vita di un apparecchio

X =errore di misura
posto Z t =c t si trova:
c t
=errore sistematico
F Y t=1e 1 , con 1
E c =errore casuale
2
c t

=inacuratezza della misura

f Y t =c t e 1
2
X ~ N , , X = E c
se 0 l'apparecchio invecchia
2
E c ~ N 0,
se 10 l'apparecchio migliora col tempo
E E c =0
se =0 si ritrova la legge Esponenziale
EY =
media campionaria
se una v.a. continua soddisfa questa propriet, allora ha legge
Esponenziale se continua e legge Geometrica traslata se discreta

se X i ~ N ,
Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

sono v.a. indipendenti ed identicamente


6

distribuite (i.i.d.):
2

Xn ~ N ,

sk X =

curt X =

Xn
S =
, n=1,2,3,
/ n

P S t t per n , t

grande:
2

ossia P Xnt
n
n

ossia P X i t
i=1


t n
n

approssimazione Normale di Gamma per n grande:

Y ~ n ,
n n
Y N , 2

2 =E
2

[ ]
X

, = EX , =Var X

campionamento e stime

approssimazione Normale
2
Date X i v.a.i.i.d. , EX i= , VarXi= con n abbastanza

i=1

[ ]

statistica inferenziale

teorema del limite centrale

=E

misura quanto la densit di X sia appuntita

media campionaria standardizzata

X i N n , n 2

3/2

coefficiente di curtosi di una v.a. X con '4 finito

E Xn = ; Var X n =
n

Xn N ,

definizioni
modello statistico
famiglia di leggi di v.a., dipendenti da uno o pi parametri incogniti:

{ pX x ; : I }
un vettore di parametri

campione casuale di ampiezza n


estratto da una popolazione di densit p X x ; una ennupla di v.a.
indipendenti e identicamente distribuite (i.i.d) X 1, X 2, , X n ,
ciascuna avente legge p X x ; .

stima di parametri e stimatori

F Y t=P Y t

stima puntuale dei parametri


tn
n

stimare il valore vero del parametro (o dei parametri) a partire dal


campione casuale

approssimazione Normale della Binomiale:


approssimazione utile in problemi di campionamento
NOTA: vale se: np5 ; n1 p5

Y ~ Bn , p
Y N np , np 1 p

tnp
, per v.a. continua
np 1 p
k 0.5np
F Y k= P Y k
,
np1 p
k=0,1,2,, n , per v.a. discreta

F Y t=P Y t

momenti ed indici di forma per v.a.


momento r-esimo di X

stima del parametro p della popolazione bernulliana


p = xn , con xi valori effettivamente osservati
statistica T
una qualsiasi v.a. T funzione del campione casuale X 1, X 2, , X n
di ampiezza n estratto da una popolazione di legge p X x , :
n
T = f X 1, X 2, , X n , con f :
stimatore del parametro
statistica che viene usata per stimare il valore del parametro
corretto (non distorto) se ET = altrimenti detto distorto

stima del parametro


f x1, x2, , x n , calcolato a campionamento eseguito
=

r = E X

stimatore consistente
var T n 0 per n , conT n stimatore corretto di

'r = xrk p X x k , per X discreta

valore atteso della media campionaria

= x f X x dx , per X continua

varianza della media campionaria

'

'
r

E X n=
2

momento r-esimo centrato di X


r

r = E X EX
r = x k r p X x k , con = EX , per X discreta

n
legge dei grandi numeri
P {X n} 0 , per n
Var Xn =

r = x f X xdx , per X continua


r

coefficiente di asimmetria (skewness) di una v.a.


X con '3 finito
misura l'assimetria di X rispetto al valore atteso

stime
stima di = h
2

S 2n

1
n 1

X X

=
i

varianza campionaria

a campionamento effettuato:

Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

s2n

1
1
n
xn 2
x x 2= n1
xi2 n1
n1 i=1 i n
i=1

stima popolazione Normale

= xn
2
2
= sn

se nota:

2 =

1
n

stima popolazione Gamma


2
x
x
= 2n ; r = n2
sn
sn

leggi
legge Chi quadro con n gradi di libert
Y ~X

n 1
2 2

n Y ~ ,

Xi sono v.a. indipendenti, ciascuna di legge N(0,1)


n

f Y t = c n t 2 e 2 , per t 0
f Y t = 0 , per t 0
EY = n ; Var Y =2n
propriet
2
2
posto Y 1 ~ X n1 , Y 2 ~ X n 2 indipendenti:
2
Y 1 Y 2 ~ X n1 n2
intervallo a cui una v.a. di legge Chi quadro appartiene con probabilit
:

P X 1 n Y X 1 n =
2

approssimazione Normale di Chi quadro per n grande


2
X n N n , 2n , per n grande
t n
P Y t
2n
2
X n z 2n n

approssimazioni
Sia X i , X 2, , X n un campione casuale estratto da una popolazione
2
di legge N , , allora:
n
X i
~ X 2 n

i =1
n
X X
i n ~ X 2 n1
i =1
2
n1 S n
~ X 2 n1
2
2
S n e Xn sono tra loro indipendenti

legge t di student a n gradi di libert


Z
2
T ~ t n ; con T =
, Z ~ N 0,1 , Y ~ X n
Y /n
n 1
t2 2
f T t = cn 1
, per t
n
ET = 0 , tranne per n =1 per cui nonesiste finito
per t la t di student tende alla Normale standard
approssimazioni
Sia X i , X 2, , X n un campione casuale estratto da una popolazione

di legge N ,

Xn

S /n
2
n

, allora:

~ t n 1

calcoli con i quantili


posto t n quantile -esimo della legge t(n):
P T t n=
P T t 1 n=
P Tt 1 / 2 n=
P T t 1 / 2 n=
t 1 n1 z 1 , approssimazione per n120
2

approssimazione di quantili tramite


interpolazione lineare
y= mxq ,
equazione della retta che passa per i punti {q 1, t q1 }, {q 2, t q 2 }

t x = t q 1

t q 2 t q 1
q2 q1

x q1 , con q1 x q 2

legge di fisher con m e n gradi di libert


X ~ F m , n ; con X =

U/m
, U ~ X 2m , V ~ X 2n
V /n

propriet
1
~ F n , m
X
P X F m , n =
1
1
P
=1
X F m , n
1
= F 1 n , m
F m , n
2
S1
= F m1,n 1
2
S2

intervallo di confidenza al livello del 100% per


h()
Sia X 1, X 2, , X n un campione casuale estratto da una
popolazione di densit f x ; ; siano T 1=t 1 X 1, X 2, , X n ,
T 2 =t 2 X 1, X 2, , X n due statistiche, e sia h una funzione
del parametro che si vuole stimare; fissato un numero 0,1 ,
l'intervallo aleatorio (T1, T2) si dice intervallo di confidenza al 100%
per h() se:

P T 1 h T 2 =

a campionamento eseguito l'intervallo (t1,t2) si dice calcolato al


campione;
h() appartiene all'intervallo (t1, t2) con una confidenza del 100%;
t1 e t2 sono detti limiti di confidenza

intervallo di confidenza per la media


(di una popolazione Normale o popolazione qualsiasi con n grande
n30 )

= Xn z 1 / 2

=
Xn t 1 n1
2

Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

= X n E , con varianza nota

Sn
, con varianzaincognita
n

stima dell'ampiezza per limitare l'errore E0

n =t 1 / 2 n 1
2

2
2

E0

H0

con varianza nota

intervallo di confidenza per la frequenza p


valido per una popolazione bernoulliana e per grandi campioni

n30

X n 1 X n
; se: n xn5 , n1 xn 5
n
stima dell'ampiezza per limitare l'errore E0
p= X n z 1/2

z 1/2
2E0

n=

H1

rifiutare H0 se

= 0

z z 1 / 2

z z 1

z z 1

test sulla media di una popolazione Normale di


varianza incognita
xn0
sn / n

t=

H0

H1

rifiutare H0 se

= 0

tt 1/ 2 n1

test di ipotesi

tt 1 n1

ipotesi statistica

t t1 n1

E 0 corrisponde a met dell'intervallo di confidenza.

un'asserzione sul valore vero di un parametro incognito;


si dice semplice se specifica completamente il valore del parametro,
altrimenti si dice composta

ipotesi nulla H0
H 0 : 0

test sulla frequenza p di una popolazione


bernoulliana
z=

ipotesi che si ritiene vera fino a prova contraria;


rifiuteremo H0 solo se i dati campionari forniranno una forte evidenza
statistica contro di essa

ipotesi alternativa H1
H 1 : 0
ipotesi vera solo se H0 falsa

errore di tipo I

H0

H1

p= p0

p p0

zz 1 /2

p p0

p p0

z z 1

p p0

p p0

z z 1

estraiamo due campioni n,m da due popolazioni normali indipendenti


con varianze note;
questo test non va usato quando una varianza almeno 4 volte l'altra

errore di tipo II
accettiamo H0 quando falsa

regione critica o regione di rifiuto


l'insieme R dei possibili risultati campionari che portano a rifiutare H0
data la regola di decisione: si rifiuti H 0 seT X 1, X 2, , X n I :

z=

R={ x1, x 2, , x n : T x1, x2, , x n I }

P T X 1, X 2, , X n I

ampiezza del test (o livello di significativit)

=sup P T X 1, X 2, , X n I
0

rappresenta la massima probabilit di rifiutare l'ipotesi nulla quando


questa vera;
va stabilito piccolo a priori prima di eseguire il campionamento
p-value
numero pari al minimo livello di significativit a cui i dati campionari
consentono di rifiutare l'ipotesi nulla;
se p-value = 0 siamo praticamente certi di non sbagliare

varianza campionaria pesata


media pesata delle varianze campionarie di due campioni n, m
n

X i Xn Y i Yn

n1 S 2X m1 S 2Y i=1
=
nm 2

i =1

n m 2

test sulla media di una popolazione Normale di


varianza nota
z=

xn 0
/n

X nYm

X Y

n
n

H0

la probabilit di rifiutare H0 prima del campionamento:

S 2=

rifiutare H0 se

test sulla differenza di due medie con varianze


note

rifiutiamo H0 quando vera;


questo considerato l'errore pi grave

xn p0
p0 1 p0/ n

H1

rifiutare H0 se

X =Y

X Y

z z 1 / 2

X Y

X Y

z z 1

X Y

X Y

z z 1

test sulla differenza di due medie con varianze


incognite
estraiamo due campioni n, m da due popolazioni normali indipendenti
con varianze incognite;
questo test non va usato quando una varianza almeno 4 volte l'altra

t=

X nYn
2

1 1 n1S X m1S Y

n m
nm2
H0

H1

rifiutare H0 se

X =Y

X Y

tt 1/2 nm2

X Y

X Y

tt 1 nm2

X Y

X Y

tt1 n m2

nel caso di campioni osservazioni accoppiate si considerano le


differenze delle medie

Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

test su due frequenze di due popolazioni


bernoulliane indipendenti
estraiamo due campioni n, m da due popolazioni bernoulliane
indipendenti X ~ B p 1 , Y ~ B p 2 ;
n

questa procedura valida se

xi 5

i=1

y i 5
i=1

xn ym
n xn m ym
z=
con p=
nm
1 1
p 1 p
n m

H0

H1

rifiutare H0 se

p1= p2

p1 p2

zz 1 /2

p1 p2

p1 p2

z z 1

p1 p2

p1 p2

z z 1

0
0

X X 1 /2 n1 o X X / 2 n1

X X 1 n1

X X n1

intervallo di confidenza

n 1 s2n
n1 s 2n
,
2
2
X 1 n 1
X 1 n 1
2

inferenze su due varianze

estraiamo due campioni n, m da due popolazioni normali indipendenti


con medie incognite;

F=

2
X
2
Y

s
s

H0

H1

rifiutare H0 se

verifica l'indipendenza o meno di due variabili;


si costruisce una tabella di contingenza di rs classi:
A2
A1
... A r Tot.
B1
n11
n 21
... nr1 n1
B2
n12
n 22
... nr1 n2
...
...
...
... ... ...
Bs
n 1s
n 2s
... nrs ns
n 1
n2
Tot.
... nr n
si costruisce una tabella di rs classi:
A2
Ar
A1
...

n1n1
n
n1n2
n

B1

n2n1
n
n2n2
n

...

...

...

n1ns
n

nrn1
n
nrn2
n

...

...

n2n s
n

...

nrns
n

F F 1 n1, m1

ciascuna delle frequenze attese deve essere:

F F 1 n1, m1

si calcola il chi-quadro:

X Y

X Y

Bs

sX
sX
1
1
,
F 1 n1, m1 s 2Y
F 1 n1, m1 s 2Y
2

test Chi quadro di indipendenza

...

intervallo di confidenza

k 1r

F F 1/ 2 n1, m1
F F / 2 n1, m1

X Y

2
Y

X Y

npi

2
X

2
Y

1
2

B2

2
X

np i N i

= P X Q , con X ~ X

rifiutare H0 se
2

Ak

fissato , si stabilisce la regola di decisione:


2
si rifiuti H 0 se Q X 1 k 1 r (si calcola tramite tabelle)
il p-value corrispondente al valore Q :

H1

=
i

...

Q X k1 per n , con pi assegnate a priori


2
Q X k1r per n , con pi calcolate dopo
aver stimato r parametri incogniti

n1 s n
X =
02
2

A2

i =1

Q=

=0

A1

p1
p2
pk
freq. rel. attese
...
1
np 1
np 2
np k
freq. ass. attese
...
n
freq. ass.
N1
N2
Nk
...
n
osservate
2
2
2
np 1 N 1
np 2 N 2
np k N k
scarti quad.
...
Q
pesati
np 1
np2
npk
le classi andranno accorpate in maniera tale che le frequenze assolute
attese siano tutte maggiori o uguali a 5;
Chi quadro calcolato dal campione:
k

inferenze su una varianza

H0

classi

test Chi quadro di adattamento

ha lo scopo di verificare se certi dati empirici si adattino bene ad una


distribuzione teorica assegnata;
si costruisce la seguente tabella:

Q=

= =
i

1 j

...

ni n j
5
n

ni n j

n
ni n j
n

nij

fissato , si stabilisce la regola di decisione:


2

si rifiuti H 0 se Q X 1 r1 s1
(si calcola tramite tabelle)
il p-value corrispondente al valore Q :
2

=P X Q , con X ~ X r1 s1

Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

10

Das könnte Ihnen auch gefallen