Beruflich Dokumente
Kultur Dokumente
panel del impuesto sobre la renta de las personas fsicas (IRPF) del
Instituto de Estudios Fiscales (IEF)
cesar.perez@ief.minhac.es, Instituto de Estudios Fiscales y Departamento de Estadstica e
Investigacin Operativa III, Universidad Complutense de Madrid
1. Introduccin
N
X st X h N h x h h xh feh xh
h 1 n h
h 1
h 1
h 1
L
Por lo tanto, para estimar cualquier total poblacional se suman los productos de los
factores de elevacin feh por los totales muestrales en cada estrato xh. El estimador de cualquier
media en muestreo estratificado aleatorio es la media ponderada de los estimadores de la media
en cada estrato, siendo los coeficientes de ponderacin Wh = Nh/N de suma unitaria (Nh es el
tamao poblacional del estrato y N es el tamao de la poblacin).
L
L
N 1
1 L N
1 L
xh h xh feh xh
X st xst Wh xh h
N nh
N h1 nh
N h1
h1
h1
Wh
Por lo tanto, para estimar cualquier media poblacional se suman los productos
de los factores de elevacin por los totales muestrales en cada estrato y se divide por el
tamao poblacional.
4. Tamao de muestra y error de muestreo
El tamao de muestra viene definido por un error relativo de muestreo menor del
1,5 por ciento, con un nivel de confianza adicional del 3 por mil (entre 300.000 y
400.000 individuos por ao). Para afijacin de mnima varianza, el tamao de muestra
para cometer un error relativo de muestreo dado er en el ao base viene dado por:
L
N h S h
h 1
400000
er N X N h S
2
h 1
2
h
1 L
V X st Nh Sh Nh Sh2
n h1
h1
1 L 1 L 2
Vxst Wh Sh Wh Sh
n h1
N h1
V x st
C v x st
x st
V ( X st )
C v X st
X st
G( y)
y
i 1 j 1
yj
2n 2 y
G( y)
n
1
(2i n 1) y i
n(n 1) y i 1
1 n
G ( y )
K
y
i i 2 K j K i N
Ny i 1
j 1
1 k
i
k i
k
1 k
E () E (i )
k i
1 k 1
V V i 2
k i
k
) kV i V i .
V
(
i i
k
k2
k
1 k 2
i k 2
k k 1 i
V G
1 k 2
2
Gi kG
k k 1 i
1 k
G G i
k i
V G
1 k 2
2
Gi kG 0,00000293063
k k 1 i
Este error absoluto lo relativizamos a partir del coeficiente de variacin, lo que nos lleva
al siguiente resultado:
V (G )
C V G
0,001295489
G
Podemos concluir por tanto que el error relativo para el estimador del ndice de Gini es
del 0,1295%, es decir, aproximadamente del uno por mil. Estamos ante un resultado ptimo
derivado del elevado tamao de las muestras, del elevado nmero de muestras y de la elevada
precisin de las propias muestras.
El mtodo de los grupos aleatorios
V ()
K
1
(r ) 2
K ( K 1) r 1
2
1 K
r r insesgado de V ()
K 1 r 1
V (G )
K
1
(G r G ) 2
K ( K 1) r 1
K
1
(G r G ) 2 0,00000297912
K ( K 1) r 1
Este error absoluto lo relativizamos a partir del coeficiente de variacin, lo que nos lleva
al siguiente resultado:
V (G )
C V G
0,001307335
G
Podemos concluir por tanto que el error relativo para el estimador del ndice de Gini es
del 0,13%, es decir, aproximadamente del uno por mil. Estamos ante un resultado equivalente al
del mtodo anterior.
Mtodos Bootstrap o de autogeneracin
M
*j
j 1
M 1
j 1
BOOT
*
j
BOOT 1000
j 1
M
*j
j 1
M 1
M
0,00052414
BOOT 5000
j 1
M
*j
j 1
M 1
M
0,00052414
7. Bibliografa
[10]. MUESTREO
[11].
CSAR PREZ