Sie sind auf Seite 1von 13

1.

TECNICAS

DE

MUESTREO
) . \ .

uo/162~.
WILLIAM G. COCHRAN
Professor of Statistics, Emeritus-Harvard University

......
......
......
......
..,..,...
._

COMP~IA EDITORIAL CONTINENTAL, S. A. MEXICO


DISTRIBUIDORES:

'

ESP~A-ARGENTINA - cmLE- VENEZUELA- COLOMBIA


Boli'fia -

Brasil -

Guatemala -

'

Costa Rica -

Bonc!uru -

Dominicana -

Ecuador -

El. Sal .. ador -

Nicansua - Panamf. - l'arasuay Puerto Rico - UTUgUaY

E1tado1 Unido~

Pen1 -

l'ortucal

12.

INDICE DI: MATUIAS

INDICE DE MATEIUAS

Pg.

Cap.

iruESTPI"'{) r ARA Pr~OPOP.,C_Ol'.JlmY PORCENTAJES

3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8

Caractersticas Cualitativas . . . . . . . . . . . . . . . . . .
Varianzas de las Estimaciones Muestrales . . . . . .
Fl Efecto de P en los Errores Estndar . . . . . . . .
La Distribucin Binomial . . . . . . . . . . . . . . . . . . .
La Distribucin Hpergeomtrca . . . . . . . . . . . . .
Limites de Confianza . . . . . . . . . . . . . . . . . . . . . .
Clasificacinen ms de dos Clases . . . . . . . . . . . .
Lmites de Confianza Cuando Existen ms de
dos Clases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.9 La Distribucin Condicional de p . . . . . . . . . . . .
3.10 Proporciones y Totales Sobre Subpoblaciones . .
3.11 Comparaciones Entre Dominios Diferentes . . . . .
3.12 Estimacin de Proporciones en el Muestreo por
Conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . .

5.5
5.6

79
80
83
84
85
87
90

5.7
5.8
5.9
5.10
5.11

91
92
93
94

5.12

4 1

Un Ejemplo Hipottico . . . . . . . . . . . . . . . . . . . . .
Anlisis del Problema . . . . . . . . . . . . . . . . . . . . . .
La Especificacin de la Precisin . . . . . . . . . . . . .
La Frmula para 11 al Hacer un Muestreo para
Determinar una Proporcin . . . . . . . . . . . . . . . . . .
Atributos Raros-Muestreo Inverso . . . . . . . . . . . . .
La Frmula para n con Datos Continuos . . . . . .
Estimaciones Anticipadas de Varianzas de Poblacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tamao de la Muestra con ms de una Caracterstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tamao de la Muestra Cuando las Estimaciones
se Quieren para Subdivisiones de la Poblacin . .
El Tamao de la Muestra en Problemas de Decisin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El Efecto del Diseo (Deff) . . . . . . . . . . . . . . . . .

103
105
106

5A.1

107
108
109

5A.3

110

5A.5

114

5A.6
SA. 7
SA.8
5A.9

4.10
4.11

Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

,.J'l:f T~ <.:O At..E T9RJO ESTRATlFICADO..........

5.1
5.2
5.3
5.4

Descripcin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Notacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Propiedades de las Estimaciones . . . . . . . ... . . . .
La Varianza Estimada y Limites de Confianza . . .

115
117
119
120
125

125
126
127
132

138
142
143
145
147

155

103

4.9

136

OTROS ASPECTOS DEL ~TREO ESTRATIFICADO


.

T-~t-~C OH DSL TA.MARO DE LA MUESTRA . .

SA

133

149
149

LA

4.8

.
Precisiones Relativas del Muestreo Aleatorio Estratificado y del Muestreo Aleatorio Simple
.
En qu Casos Produce la Estratificacin Considerables Ganancias de Precisin?
.
Asignacin que Requiere ms del 100% del
Muestreo
.
Estimacin del Tamao de la Muestra con Datos
Continuos
.
Muestreo Estratificado para Proporciones
.
Ganancias en Precisin en el Muestreo Estratificado para Proporciones
.
Estimacin del Tamao de Muestra con Proporciones
.
.

95
100

4.5
4.6
4.7

La Asignacin Optima

Ejercicios

Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.2
4.3
4.4

Pg.

Cap.

79

13

5A.2

5A.4

SA.10
5A. l l
5A.12
5A.13
5A.14

Efectos de las Desviaciones a Partir de la Asignacin Optima


.
Efectos de Errores en los Tamaos de los Estratos

El Problema de la Asignacin con ms de una


Caracterstica
.
Otros Mtodos de Asignacin con ms de un
Atributo
.
Estratificacin en dos Direcciones, con Muestras
Pequeas
.
Seleccin Controlada
.
La Construccin de los Estratos
.
Nmero de Estratos
.
Estratificacin Despus de la Seleccin de la
Muestra (Postestratificacin)
.
Muestreo por Cuota
.
Estimacin a Partir de una Muestra de la Ganancia Debida a la Estratificacin
.
Estimacin de la Varianza con una Unidad por
Estrato
.
Estratos como Dominios de Estudio
.
Estimacin de Totales y Medias Sobre Subpoblaciones
.

155
157
160
161
165
167
169
174
177
178
179
181
184
186

102

T:!CNICAS DE :MUUTllO

en el ltimo ao. Estimar la varianza de la proporcin de personas que vieron


a un dentista y comparar sta con la estimacin de la varianza binomial.
3.14. En el muestreo de una caracterstica no comn, un mtodo consiste
en seguir sacando una muestra aleatoria simple hasta que se encuentren m
unidades que poseen esta caracterstica no comn (Haldane, 1945) en donde
m se elige par adelantado. Si se ignora la cpf, probar que la probabilidad de
que la muestra total requerida sea de tamao n es
(11 -1)!

(m -1)!(11 -m)!

P'"Q"-'"

(n 2: m)

donde P es la frecuencia de la caracterstica rara. Encontrar el tamao promedio de la muesrra total y demostrar que si m > 1, p - (m - l )/(n - 1)
es una estimacin lnsesada de P. (Para una mayor discusin vase Flnney,
1949, y Sandellus, 1951, quienes consideran un plan en el cual el muestreo
contina hasta que se encuentren m individuos o el tamao total de la muestra alcance un lmite n@ predeterminado.) Vase tambin la sec. 4.5.

Nm. de
personas

s
6
3
3

2
3
3
3
4
4

3
2
7
4
3

Dentista visto
S

No

o
1
2

o
o
1
1

6
2

1
2
3
2
2
3
4

5
4
4
3
3
4
3

3
1
2

4
3
4

3
3

2
4

o
o

La Estimacin del Tamao


de la Muestra

Dentista visto
Nm. de
personas

2
2

CAPITULO 4

Si

No

o
3

3
3
3

o
o
1

o
o
o
1

o
o

2
1
2
4
2
3

2
4

4.1

UN EJEMPLO BIPOTETICO

Al planear una encuesta por muestreo, siempre se alcanza una


etapa en donde hay que tomar una decisin respecto al tamao
de la muestra. Esta decisin es importante. Una muestra demasiado grande implica un despilfarro de recursos y una muy pequea
disminuye la utilidad de los resultados. La decisin no siempre
puede tomarse satisfactoriamente; a menudo no disponemos de la
suficiente informacin para saber si el tamao de la muestra seleccionada, es el ptimo. La teora del muestreo proporciona un marco dentro del cual se puede pensar inteligentemente respecto a este problema.
A continuacin veremos un ejemplo hipottico en el que se
resaltan los pasos necesarios para llegar a una solucin. Un antroplogo est preparando un estudio sobre los habitantes de cierta
isla. Entre otras cosas, desea estimar el porcentaje de habitantes
que pertenecen al grupo sanguneo O. Le han asegurado la cooperacin necesaria para extraer una muestra aleatoria simple. Qu
tan grande debe ser la muestra?
Este asunto no se puede discutir sin antes contestar a otra pregunta. Qu tan exactamente desea el antroplogo conocer el porcentaje de personas del grupo sanguneo O? A lo anterior, nuestro
amigo contesta que estar satisfecho si el porcentaje no contiene
un error mayor del 5%, o sea que si la muestra indica que el 43%
de la poblacin es del grupo sanguneo O, el porcentaje para toda
la isla se encontrar con certeza entre el 38 y el 48%.

I'aru cvuur mnlcutendldos, s aconsejable aclarar al anrroplcgo


que 110 le pod ..mos asegurar una exactitud dentro de un 5C! , n
menos que se analice el tlpo sanguneo de todos los habitantes. Por

muy grande

CJUC

se tome n, existe la posibilidad de una muestra

desafoi tunada que presente un error mayor al 5% deseado. El an-

trop6Jogo contesta framente que lo sabe, que acepta el riesgo de


una posibilidad en veinte de obtener una muestra poco afortunada
y que todo lo que pide es un valor de n y no una clase de estadstica.
Ahora estamos en posicin de estimar en trminos generales
el valor de TI, Para simplificar las cosas se ignora la cpf y el por
centaje de muestra p se supone normalmente distribuido. Si estas
hiptesis son razonables, puede verificarse cuando se conoce el
valor TI inicial.
En trminos tcnicos, p debe encontrarse en el intervalo (P 5),
excepto para un caso en 20. Dado que p se supone normalmente
distribuida alrededor de P, se encentrar en el intervalo (P 20-,),
salvo para una posibilidad en 20. Adems,
<Tp=JPQ/n
De modo que podemos escribir

2JPQ/n=5

4PQ

n=--

25

En este momento aparece una dificultad comn a todos los problemas para la estimacin del tamao de la muestra. Se obtuvo
una frmula para n, pero n depende de una propiedad de la poblacin sujeta al muestreo. En este caso, la propiedad es la cantidad
P que desearamos medir. Por lo tanto, preguntamos al antroplogo
si nos puede dar una idea del valor que se espera de P. El contesta
que con base en datos obtenidos previamente con otros grupos tncos, y de acuerdo a sus especulaciones sobre la historia racial de
la isla, le sorprenderla que P estuviera fuera del intervalo del 30
al 60%.
Esta informacin ser suficiente para proporcionar una respuesta til. Para cualquier valor de P entre 30 y 60, el producto
PQ est entre 2 100 y un mximo de 2 500 con P - 50. El valor correspondiente de n est entre 336 y 400. Para no correr riesgos se
toma 400 como estimacin inicial de n.
Ahora pueden reexaminarse las hiptesis hechas en este anlisis.
Con n - 400 y p entre 30 y 60, la distribucin de p debera estar
cerca de la normal. Si se requiere o no la cpf, dependen del nmero de habitantes de la isla. Si la poblacin excede a 8 000, la frac
cin de muestreo es menor al 5% y no se necesita ajuste para la cpf.

en la Scc. 4.4.

4.2 ANALISIS DEL PROBLEMA


Los pasos prncpales involucrados en la eleccin del tamao
de la muestra son los siguientes:
1. Debe existir algn enunciado respecto a lo que se espera de
la muestra. Este puede darse en trminos de limites de error desea
dos, como en el ejemplo anteror, o bien en trminos de alguna decisin o accin que debe tomarse una vez que se conocen los resulta
dos de la muestra. La responsabilidad de este enunciado es pnmordalmente de las personas que van a usar los resultados de la en
cuesta, aunque con frecuencia, dichas personas necesitan de una
guia para expresar sus deseos en trminos numricos.
2. Se debe encontrar una ecuacin que relacione n con la precisin deseada de la muestra. La ecuacin variar segn el contendo del enunciado de precisin y el tipo de muestreo propuesto. Una
de las ventajas del muestreo probabilista es que permite la elaboracin de esta ecuacin.
3. Esta ecuacin tendr como parmetros ciertas propiedades
desconocidas de la poblacin, que deben estimarse para obtener
resultados especficos.
4. Con frecuencia sucede que los datos estipulan para ciertas
subdivisiones mayores de la poblacin y que los limites de error deseados se establecen para cada subdivisin. De ser as, se hace un
clculo separado para el valor n en cada subdivisin y el n total se
encuentra por adicin.
5. Generalmente se mide ms de un atributo o caracterstica en
una encuesta por muestreo: en ocasiones, el nmero de atributos
es grande. Si se estipula un grado de precisin para cada atributo,
los clculos conducirn a una serie de valores conflictivos de n uno
para cada atributo. Por lo tanto, debe encontrarse un mtodo para
reconciliar estos valores.
6. Finalmente, debe apreciarse el valor elegido de n, para que
sea consistente con los recursos de muestreo dsponbles. Esto exige
una estimacin del cosco, trabajo, tiempo y materales que se ne
cestan para obtener la muestra del tamao propuesto. En ocasiones es claro que n debe reducirse drsticamente, y entonces es
necesario tomar una decisin dificil, que es la de proceder con una
muestra mucho ms pequea, lo que reduce la precisin, o bien,
nhandonar los esfuerzos hasta contar con mayores recursos,

En secciones subsecuentes se examinarn en detalle estas dificultades.

4.3 LA ESPECIFICACION DE LA PRECISION


La precisin deseada se puede establecer, al definir la cantidad
de error tolerable en las estimaciones muestrales. Esta cantidad se
determina mejor a la luz de los usos a que se destinan los resultados de la muestra. En ocasiones, es difcil saber qu tanto error
debera tolerarse, particularmente cuando los resultados se destinan a varios fines. Supongamos que preguntamos al antroplogo
por qu desea que el porcentaje del conjunto de personas en el
grupo sanguneo O tenga una correccin de un 5% en lugar de 4
o 6% . Su respuesta podra ser que los datos sobre el grupo sanguneo se destinan principalmente a la clasificacin racial y sospecha
qu los isleos pertenecen a un grupo racial con un valor de P aproximado al 35% , o a un tipo racial con un valor de P cercano al 50% :
Un limite de error de 5% en la estimacin le parece lo suficientemente pequeo para permitir la clasificacin en uno de estos dos tipos.
Sin embargo, se opondra en forma violenta a lmites de error entre 4 o 6%.
De modo que el lmite de error de 5% que escogi el antroplogo,
es en cierta medida arbitrario. A este respecto, el ejemplo muestra
cmo se suelen decidir los lmites de error. De hecho el antroplo go, estaba ms seguro de lo que quera, en comparacin con
muchos cientficos y administradores. Cuando por primera vez se
pregunta a estas personas el grado de precisin deseado, a menudo
confiesan que nunca han considerado el asunto y no tienen idea de
la respuesta. Me be percatado, gracias a la experiencia, que despus de discutir el asunto, son capaces de indicar, al menos aproximadamente, el tamao del lmite de error que les parece razonable.
En muchas situaciones prcticas no podemos ir ms adelante.
Parte de la dificultad es que no se sabe lo suficiente sobre las consecuencias que produciran errores de diferentes magnitudes en las
decisiones prcticas que se toman con base en los resultados de la
encuesta. Aun cuando estas consecuencias se conozcan, los resultados de muchas encuestas importantes, los utilizan diferentes
personas con diversos propsitos, y algunos de ellos no se han previsto al planear la encuesta. Por lo tanto, es de esperarse que exista
un cierto elemento de adivinanza en la especificacin de la precisin
para un futuro ms o menos inmediato.
Si la muestra se toma con un propsito bien definido ( como sera
una decisin entre ..s" o "no", o bien, sobre la cantidad de dinero

que se va a gastar en alguna empresa), entonces, la precisin requerida se puede enunciar usualmente de una manera ms especfica, en trminos de las consecuencias de los errores de decisin.
Un enfoque general a los problemas de esta ndole se presenta en
la Sec. 4.10, que ofrece un punto de partida lgico para la solucin.

4.4 LA FORMULA PARA n AL HACER UN MUESTREO


PARA DETERMINAR UNA PROPORCION
Las unidades se clasifican en dos clases, C y C'. Se ha convenido en algn margen de error d de la proporcin estimada p de las
unidades en la clase C, y existe un pequeo riesgo a, que estamos
dispuestos a correr, de que el error real supere a d, es decir, queremos que
Pr (j p -

PI~ d) = a

Se supone un muestreo aleatorio simple y p se toma con distribucin normal. A partir del Teorema 3.2, Sec. 3.2,

= ::;,

(T
p

PQ
v~v-:

Por lo tanto, la frmula que relaciona n con el grado de precisin deseado es

fi0
tV::V-:

d=~

donde t es la abscisa de la curva normal que corta un rea de


las colas de la distribucin. Al resolver para n encontramos

en

,2PQ

(4.1)

Para fines prcticos, se sustituye una estimacin anticipada p


de P en esta frmula. Si N es grande, una primera aproximacin es
,2pq

no=7=

pq
V

donde
V - pq - varianza deseada de la proporcin de muestra
no

(4.2)

108

LA ESTIMACION DU. TA.MAO DE L4 NUEST.11.4

TECNICAS DE MUESTREO

En la prctica, primero calculamos 120, Si ~IN es despreciable,


una aproximacin satisfactoria a n de ( 4.1) ser no, De no ser
as, es claro, al comparar con 4.1 y 4.2 que n se obtiene como
n=
Ejemplo.

no
l+(no-1)/N

no
=. l+(no/N)

necesario de n, para un error relativo r especifico es 11 veces ms


grande cuando P - 1 % que cuando P - 10%. En esta situacin
( un valor pequeo de P pero no muy bien conocido de antemano), el
mtodo de Haldane ( 1945) del muestreo continuo hasta que m de los
atributos raros se hayan encontrado en la muestra, tiene una gran
ventaja. El mtodo suele llamarse muestreo inverso.
Si n es el tamao de la muestra en el que aparece el m-simo
atributo raro, (m > 1), una estimacin insesgada de P es p - ( rn
- .l)/(12 - 1). Para N muy grande, P pequea y m ~ 10, una buena aproximacin de V(p) es mP'Q/(m - 1):. Luego, cv(p) .;.
(mQ)1t1/(m - 1) < ....rr(m - 1 ), que ser un limite superior
bastante ceido si P es pequeo. De modo que al fijar m de
antemano, podemos controlar el valor de cv(p) sin conocer anticipadamente P. El valor m - 27 da cv(p) < 20%, pero el valor m 102 se necesita para cv(p) < 10%. El valor de 11 con este mtodo
es una variable aleatoria, pero ser grande si P es pequea.

(4.3)

En el ejemplo hipottico de los grupas sangufneos tenamos

d=0.05,

p a0.5,

a =0.05,

Luego

no

(4)(0.5)(0.S}
OO
(0.0025} 4

Supongamos que slo hay 3 2.00 isleos. La cpf ser necesaria y encontramos
n...

no
1+(n0-l}/N

400 356

l+H&J

La frmula para n., tambin se aplica si d, p y q se expresan como par


centajes en lugar de proporciones. Dado que el producto pq crece al tender
p a l/2 o 50%, una estimacin conservadora de n es la que se obtiene al
seleccionar como p el valor ms cercano a ~ en el intervalo en que se espera
est p. Si por ejemplo, p parece estar entre 5 y 9%, tomamos 9% para la
estimacin de n.

Algunas veces, particularmente al estimar el nmero total NP


de unidades en la clase C, deseamos controlar en NP el error relativo r en lugar del error absoluto, as, por ejemplo, podramos desear
estimar NP con un error no mayor al 10%, o sea, queremos que

Pr (INp;.PNPI :2!:r) = Pr (lp- PI 2:: rP) = a


Para esta especificacin, sustituimos rP por rp en vez de d en
-las Frmulas (4.1) y (4.2). A partir de (4.2) obtenemos
t2pq t2 q
no=-2-=,r p2 r p

La Frmula

{4.2)'

4.6 LA FORMULA PARA n CON DATOS CONTINUOS

Generalmente se desea controlar el error relativo r en la estimacin


del total o la media de la poblacin. Con una muestra aleatoria simple de media y, queremos que
Pr

(I~ 2::,)=Pr

(r ;pJ
9

2::,)=Pr(l9-Yl~rf)=a

donde a es una pequea probabilidad. Suponemos que y sigue una


distribucin normal: del Teorema 2.2. Corolario 1, sabemos que
el error estndar es

As que

( 4.3) permanece inalterada.

~s

,y= /Q'9 = ,Y-;;---N

4.5 ATRIBUTOS RAROS-MUESTREO INVERSO


Al estimar 12 a partir de las Frmulas (4.1), (4.2) y. (4.2)', el
muestreador introduce su mejor estimacin anticipada de la proporcin de poblacin P. Si se sabe que P est entre el 30 y el 70"'< ,
como en el ejemplo de la Sec. 4.1, una estimacin exacta de P no es
crucial. Pero con un atributo raro (por ejemplo, P ~ 10% ), el valor

109

Al resolver para

.;,

(4.4)

12

Obsrvese que la caracterstica de poblacin de la que depende


es su coeficiente de variacin S/Y. Esto a menudo es ms estable
y fcil de conjeturar de antemano que el valor mismo de S.

110

LA ESTIMACION

TECNICAS DE MUESTREO

Como primera aproximacin tomamos

no={~r = ~(ff

(4.5)

al susttur una estimacin anticipada de (S/Y). La cantidad C


es el ( cv) deseado de la estimacin muestral,
Si n0/N es apreciable, calculamos n como en ( 4.3)
no
n=---l+(no/N)

(4.3)

Si en lugar del error relativo r queremos controlar el error absoluto


y, tomamos n. - t2S2/d2 = S,/V, donde V es la varianza deseada de Y.
d en

Ejemplo. En vveres que producen arbolitos para venta es aconsejable


estimar, al final del invierno o al principio de la primavera, el nmero de
arbolitos en buen estado que probablemente se dispondrn puesto que con
base en esto se determina la demanda y aceptacin de las rdenes. Johnson
( 1943) llev a cabo un estudio de los mtodos de muestreo para la estmacin del nmero total de plntulas. La informacin que se indica a con
tnuacn se obtuvo de una almciga de arces plateados de un pie de ancho y 430 pies de largo. La unidad de mvestreo fue un pie de longitud de
la almciga., de tal manera. que N - 430. Mediante una enumeracin completa de la almciga se encontr que Y = 19, S: - 85.6, siendo stos los
verdaderos valores de la poblacin.
Con un muestreo aleatorio simple, cuntas unidades se deben tomar para
estimar Y dentro del 10% con probabilidades de 1 en 20? De la Ec. ( 4.5)
obtenemos
t2S2
(4)(85.6) 95
no= ri}h
(1.9)2

Puesto que nol'N no es despreciable, tomamos

95

nn---78
l+i%
Casi el 20% de la abnciga se debe contar para alcanzar la precisin
deseada.
Las frmula., para n dadas aqu se aplican sfo al muestreo aleatorio
smple en el que se usa la media muestra! como estimacin de Y. Las frmulas
apropiadas para otros mtodos de muestreo y estimacin se presentan al
discutir estas tcnicas.

4.7 ESTIMACIONES ANTICIPADAS DE


VARIANZAS DE POBLACION
El ejemplo del vivero no es tpico en cuanto a que la varianza
de poblacin S: se conoca. En la prctica, hay cuatro caminos para

DEL

TAMAO

DE LA MUESTRA

111

estimar las varianzas de poblacin en determinaciones de tamaos


de muestra: (1) Al tomar la muestra en dos pasos, siendo el primero una muestra aleatoria simple de tamao n, de donde se estima
s1= o p, de S2 o P y se obtiene el valor requerido de n; (2) por los
resultados de una encuesta piloto; ( 3) por muestreo previo de la
misma poblacin o una semejante; y ( 4) al conjeturar respecto a
la estructura de la poblacin y ayudarse con algunos resultados matemticos.
El mtodo 1 proporciona las estimaciones ms confiables de si
o P, pero no se usa frecuentemente porque retarda la consumacin
de la encuesta. Cuando el mtodo es factible, Cox ( 1952.) con base
en un trabajo de Stein ( 1945) muestra cmo calcular n a partir de
A1= o Pi de modo que la estimacin final de y o p tenga una varianza
preasignada V, un lmite de error preasignado d, o un coeficiente
de variacin preasgnado. La primera muestra se supone lo suficientemente grande para despreciar los trminos de orden l/n11 A
continuacin se mencionan algunos resultados.

Los resultados dados aqu suponen n, :S n, el tamao de la


muestra final. De no ser as, vase Cox (1952).

Estimacin de Y dado cv =.Je


Los resultados suponen una distribucin normal de y,. Si s12
es la varianza estimada a partir de la primera muestra, se toman
unidades adicionales para que el tamao de la muestra final sea
n=

es~\ (1 +se+
Y1

s~ 2

n1Y1

+1-)
n1

(4.6)

La media y de la muestra final est ligeramente sesgada. Tmese


Y=y(l-2C).

Estimacin de Y con Varianza V


Se toman unidades adicionales hasta que el tamao de la muestra total sea

s2( 1+n=..l..

2)

n1

{4.7)

Si S se conociera exactamente, el tamao requerido de la muestra


sera S2 /V. El efecto de no conocer S es incrementar el tamao promedio por un factor (1 + 2/n1).

112

TECNlC.t.S DE MUJlSTllEO

U.

Estimacin de P con Varianza V


Sea Pi la estimacin de P a partir de la primera muestra. El tamao combinado de las dos primeras muestras debera ser

n =p1q1+ 3-8p1q1+ 1-3p1q1


V

.":q1

Vn1

(4.8)

El primer trmino de la derecha es el tamao requerido si se sabe


que P es igual a P1 Con este mtodo, la estimacin binomial ordi
naria p hecha a partir de la muestra completa, de tamao n, es ligeramente sesgada. Para corregir el sesgo, tmese
..
V(l-2p)
P=p+---'-pq

Estimacin de P con cv
Tmese

= .Je

dado

Cp1

P1q1

Cp1n,

n=-+--+-La estimacin es
se ignora la cpf.

P=p-

(4.9)

Cp/q. En todos los resultados anteriores

Ejemplo. Un muestreador desea estimar P con un coeficiente de variacin de 0.1 (10%) y conjetura que P se encontrar entre 5 y 2.0%. Este intervalo es demasiado amplio para dar una buena estimacin inicial del n
requerido. Como el cv de P es .../ Q/nP, fcilmente se verifica que n
400
es adecuado para P - 20%, pero n - 1900 se requerir si P es slo 5%.
De acuerdo con esto, el muestreador toma una muestra :Inicial con n1 396 y encuentra p1 - 0.101. Dado que Je- 0.1, C 0.01. La Ec. 4.9 con
duce a

(0.899)
n = (0.01)(0.101)

+ (0.0908) + (0.01)(40) .. 926

La muestra combinada da np = 88; p - 881926 - 0.0950. La correccin por

sesgo, Cp/q, viene a ser 0.0011, lo que da una estimacin fnal de 0.094 o
9.4 ',;.

En el segundo mtodo, una pequea encuesta ploro sirve para


varios fines, especialmente si se duda de la posibilidad de la encuesta principal. Si la encuesta piloto es en s una encuesta aleatoria
simple, se aplican los mtodos precedentes. Pero con frecuencia,
el trabajo piloto se limita a una parte de la poblacin que se puede
manejar convenientemente, o que revelar la magnitud de ciertos
problemas. Se debe tener en cuenta la opcin selectiva de la encucs
ta piloto al usar sus resultados para estimar S2 o P. Por ejemplo,
es una prctica comn la de confinar el trabajo piloto a algunos

ESTIMAClON DEL TA.MA.O DE LA. MUa&l'BA.

113

conglomerados de unidades. As, el valor s2 calculado, mide principalmente la variacin dentro de un conglomerado y puede ser una
subestimacin del valor pertinente SS. La relacin entre las variaciones ntra e interconglomerados se discutir en el Cap. 9. El mismo problema surge en el muestreo por conglomerados para proporciones, en donde la frmula pq/n puede subestimar el efecto de
la variacin entre conglomerados. Cornfield ( 1951) ilustra adecuadamente la estimacin del tamao de la muestra en muestreo
por conglomerados para proporciones.
El tercer mtodo -uso de los resultados de encuestas previas -,
seala el valor que tiene el poner a disposicin, o al menos rnante
ner accesible, cualquier dato sobre la desviaciones estndar obtenidas en encuestas previas. Infortunadamente, el costo de computa
cin de las desviaciones estndar en encuestas complejas es elevado,
aun con mquinas electrnicas, y es frecuente que slo aquellas
desviaciones estndar requeridas para dar una vaga idea de la precisin de las estimaciones principales, se computen y registren. Si
se encuentran datos anteriores apropiados, el valor de 52 puede requerir un ajuste, para actualizarlo. Con datos asimtricos en los
que Y cambia con el tiempo, frecuentemente se encuentra que sz
varia de acuerdo a una razn comprendida entre kY y kY~ donde
k es una constante. Por lo tanto, si se cree que Y ha aumentado en
10% en el intervalo de tiempo transcurrido desde la encuesta previa, podramos incrementar nuestra estimacin inicial de si entre
un 10 y un 20% .
Por ltimo, en ocasiones es posible hacer una estimacin til de
s: a partir de una Jnformacin relativamente escasa respecto a la
naturaleza de la poblacin. En estudios previos sobre el nmero de
gusanos en suelos, se utiliz un instrumento para tomar una muestra de (9 X 9 X 5 plg) de la capa superficial. Para estimar n, el
muestreador necesitaba conocer la desviacin estndar del nmero
de gusanos encontrados en una extraccin con ayuda del instrumento. Si los gusanos se distribuyeran al azar en la capa superficial, el
nmero encontrado en un pequeo volumen se apegara a una distribucin de Poisson para la cual S: = Y. Como los gusanos pueden
tender a congregarse se decidi suponer S:: - 1.21, donde el factor
l 2 es un factor arbtraro de seguridad. Aunque se desconoca Y,
sus valores de importancia econmica respecto al dao en la cosecha se pudieron delinear. Estas dos informaciones hicieron posible
la determinacin de los tamaos de muestra que resultaron satisfactorios.

ticas simples son tiles en la estimacn de SS, a partir de cierto


conocimiento del intervalo donde se encuentre y de una idea general
de la fonna de la distribucin. S la distribucin es como una binomial, con una proporcin p de las observaciones en un extremo
del intervalo y una proporcin q en el otro, S: = pqh' donde h es la
longitud del intervalo cubierto por la distribucin. Cuando p - q =
1~ el valor de s - 0.25h es el mximo posible para una longitud 11
;~da. Otras relaciones tiles son S' .. 0.083h.' para una distribucin
rectangular, ~ =- 0.056h2 para una distribucin que tiene forma de
triangulo rectngulo y S1 = 0.042h' para un tringulo issceles.
Estas relaciones no son de mucha ayuda si h es grande o poco
conocida. Sin embargo, si h es grande, es conveniente estratificar
la poblacin ( Cap. 5) de -rnodo que dentro de un estrato, el intervalo se reduzca considerablemente. Es usual que dentro de un estrato, la forma tambin se simplifique (ms cercana a rectangular).
En consecuencia, estas relaciones son efectivas en la prediccin de
S:, y, por lo tanto de 11, dentro de estratos individuales.

caractersticas requerirn tipos diferentes de muestreo en comparacin con otras. Con poblaciones que se muestran repetidamente
es til reunir informacin respecto a las caractersticas que se pueden combinar econmicamente en una encuesta general y las que
requieren mtodos especiales. Como ejemplo, en la Tabla 4.1 presentamos una clasificacin de caractersticas en 4 tipos, sugerida
por la experiencia en encuestas agrcolas regionales. En esta clasificacin, una encuesta general quiere decir una en la cual las unidades estn ms o menos uniformemente distribuidas en alguna
regin, como sucede, por ejemplo con una muestra aleatoria simple.
TABLA 4.1.

Tipo

Descripcin de las Caractersticas

Bien distribuido a travs de la regin


y ocurriendo con frecuencia razonable
en todas partes.
2 Bien distribuida a travs de la regin
pero con baja frecuencia.
1

4.8 TAMAAO DE LA MUESTRA CON MAS


DE UNA CARACTERISTICA
En la mayora de las encuestas se recoge informacin sobre
ms de una caracterstica. Un mtodo para determinar el tamao de
la muestra es la especificacin de los mrgenes de error para las
caracteristicas que se consideran vitales en la encuesta. Una estimacin inicial del tamao requerido de la muestra se hace separadamente para cada una de estas caractersticas importantes.
Al completar la estrnacn de n para cada caracterstica, se
concreta la situacin. Puede ser que los n requeridos estn bastante
prximos. Si el valor ms grande de n est dentro de los lmites
del presupuesto, se' toma este valor. Pero con frecuencia, hay suficiente variacin entre los n y, por lo tanto, no se selecciona el
ms grande, ya sea por consideraciones presupuestales o porque
este valor dar una precisin global sustancialmente ms elevada
que la considerada en un principio. En este caso, el estndar ?e
precisin deseado puede relajarse un poco para algunas caractenstcas, lo que permite utilizar un valor ms pequeo de n.
Hay casos en que los n requeridos, para diferentes caractersticas,
son tan discordantes que algunos se deben abandonar en la in
vestigacin, con los recursos disponibles, la precisin esperada para estas caractersticas es totalmente inadecuada. La dificultad

UN EJEMPLO DE TlPOS DIFEJU:NTJ:S


ENCUESTAS REGIONALES

3 Ocurre con una frecuencia raz.onable


en la mayorla de las partes de la regin, pero con una distribucin ms
espordica, estando ausente en alunas
partes y altamente concentrada en
otras.
4 Distribucin muy espordica o concentrada en una pequea parte de la
regn.

DE

CARACTDSnCAS

:EN

Tipo de Muestreo Requerido


Una encuesta general con baja
razn de muestreo.
Una encuesta general, pero con
una razn de muestreo ms elevada.
Para obtener mejores resultados
se hace una muestra estratificada con diferentes intensidades. en partes diferentes de la
regin (Cap. 5). Puede a veces
incluirse en una encuesta general con muestreo suplementario.
No adecuada para una encuesta
general. Requiere una muestra
especialmente construida para
su distribucin.

4.9 TAMARO DE LA MUESTRA CUANDO LAS


ESTIMACIONES SE QUIEREN PARA SUBDIVISIONES
DE LA POBLACION
Se planea a menudo para presentar estimaciones no slo de la

poblacin como un todo, sino tambin para ciertas subdivisiones.


Si stas pueden identificarse por adelantado, como es el caso de las
regiones geogrficas se hace un clculo separado de n para cada
regin. Supngase que la media de cada subdivisin se debe est-

116

LA ESTIMACION DEL TAMAO DE LA MUESTRA 117

TECNICAS DE MO!:STR:&0

mar con una varianza especfica V. Para la i-sima subdivisin,


tenemos n, - S,2/V, por lo tanto, el tamao de la muestra total
n - f.S2/V. Las S,t individuales sern en promedio ms pequeas
que S2, la varianza de la poblacin, pero a menudo slo un poco
ms pequeas. De modo que si existen k subdivisiones, n == hS'-/V,
en tanto que si slo se desea obtener la estimacin para la poblacin corno un todo, se toma n = S2/V.
Por lo tanto, si queremos estimaciones con varianza V para cada una de las k subdivisiones, el tamao de la muestra puede aproximarse a k veces el n necesario para una estimacin global de la
misma precisin. Este aspecto tiende a ignorarse en los clculos
del tamao de la muestra, y le ocurre especialmente a las personas
sin experiencia en mtodos de encuesta.
Si las subdivisiones representan clasificaciones por variables tales
como la edad, el sexo, el ingreso, los aos de educacin, etc., la
subdivisin a la que una persona pertenece no se conoce sino hasta
despus de haber tomado la muestra. Incluso se pueden hacer estimaciones anticipadas del tamao de la muestra, si se conocen las
proporcones .,,.; de las unidades que pertenecen a las diferentes subdivisiones. Si se selecciona una muestra aleatoria simple de tamao n, el tamao esperado de la muestra a partir de la i-sirna subdivisin es nr.1 La varianza promedio de la media a partir de esta
subdivisin es
V(y,)

= E(s,2) = s,2
n,

ntr,

(4.10)

si n,r, es grande. Por lo tanto, requerimos n = S,'/,r,V para hacer


V (y,) = V. Si esto es vlido para cada subdivisin,

. , ( s.2)

n =max: -rr, V

(4.11)

Si las subdivisiones estn hechas en clases como la edad o el ingre-

so, s,:.,ri puede ser menor que S2 para las clases centrales, pero puede se.. grande para una clase extrema con ,., pequea. En este caso, tendremos que incrementar el valor de V en esta subdvsn, o
bien, encontrar alguna manera de identificar de antemano unidades
en esta subdivisin para que se puedan muestrear a una mayor tasa..
En ocasiones, el mtodo del muestreo doble (Cap. 12) es til para
este propsito.
Las exigencias en el tamao de la muestra son an mayores en
estudios analticos, donde las especificaciones son
V(j1-j1}sV

(412)

para cada par de subdiVisiones (dominios). En este caso

, 1 (S/
n =max-+1J
V 1r1

S/)
1r1

(4.13)

Si las s12 no son muy diferentes de s, n ser 2kS2/V 'cuando los


h dominios son del mismo tamao, y an mayores en el otro caso.
El efecto de los trminos de cpf, despreciados en esta dscusn,
es la reduccin en cierta medida de los n requeridos.

4.10 EL TAMARO DE LA MUESTRA EN


PROBLEMAS DE DECISION
En ocasiones, puede desarrollarse un enfoque ms lgico para
determinar el tamao de la muestra, cuando se va a tomar una de
cisin prctica, basada en los resultados de la muestra. Se puede
presuponer que la decisin estar ms slidamente fundamentada,
si la estimacin muestra! tiene un error, pequeo, en lugar de uno
elevado. Podemos calcular en trminos monetarios la prdida L( z )
que ocurrir al tornar una decisin que presente un error correspondiente de z en la estimacin. Aunque el valor real de z no se puede
predecir de antemano. la teora del muestreo nos permite encontrar
la distribucin de frecuencia f ( z, n) de z, que para un mtodo de
muestreo especifico, depender del tamao de la muestra n. Por lo
tanto, la prdida esperada para un tamao de muestra dado es
L(n)

= J /(z}f(z,

n) dz

(4.14)

El propsito de tomar la muestra es disminuir esta prdida. Si


C(n) es el costo de una muestra de tamao n es razonable elegir
n para minimizar.
C(n)+L(n)

(4.15)

puesto que ste es el oosto total involucrado al tomar la muestra y


las decisiones a partir de sus resultados. La eleccin de n determina tanto el tamao ptimo de la muestra, como el grado de pre
cisin ms ventajoso.
Alternativamente puede presentarse el mismo enfoque en trminos de la ganancia monetaria que ocurre al tener la informacin
muestra! en lugar de la prdida derivada de los errores en dicha
informacin. Si se usa la ganancia monetaria, construimos una ganancia esperada G( n) a partir de un tamao de muestra n, donde
G ( n) es cero si no se toma muestra alguna. Maximizamos
G(n)-C(n)

118

LA ESTIM.ACION DEL TAMA.O DE LA MUESTRA

'tECNICAS DE MUESTREO

En esta forma, el principio es equivalente a la regla de la economa


clsica de la maxmzacn de la utilidad.
La aplicacin ms simple se presenta cuando la funcin prdida
l(z), es Az:, donde >.. es una constante. Lo que da como resultado
que
L(n)

Por ejemplo, si

= AE(z2)

(4.16)

es la estimacin muestra! de
~

Y,

y z

= Y - Y,

AS2 AS2
n
N

(4.17)

L(n)=AV(Y)=---

si se usa muestreo aleatorio simple.


El tipo ms simple de funcin costo para la muestra es
C(n) = co+c1n

donde c. es el costo fijo. Al derivar, el valor de


ms prdida es

n =J>..S2/c,

119

como cuantitativos. Se puede ver una relacin bastante completa


del mtodo en el trabajo de Raiffa y Schlafer (1961 ). Aunque todava no es evidente la frecuencia con que podrn llevarse a una
solucin completa los problemas de decisin con ayuda de este mtodo, puede afirmarse que es valioso ya que estimula las reflexiones
respecto a los factores importantes de una buena decisin. Una rea
que parece adaptarse convenientemente a las aplicaciones es la del
muestreo de los lotes de artculos en un proceso de produccin en
masa, para decidir si se acepta o se rechaza el lote con base en su
calidad estimada. Sittig t 1951) considera la economa de la determinacin del tamao de muestra, al tomar en cuenta costos de
inspeccin y de aceptacin de articulas defectuosos, as como costos
ligados a la existencia de artculos reglamentarios en lotes rechazados.

(4.18)
11

que minimiza costo


(4.19)

Yates (1960) da una forma ms general de este resultado. El mi~mo anlisis se aplica a cualquier mtodo de muestreo y de esnrnacn en el que la varianza de la estimacin es inversamente
proporcional a 11 y et costo es una funcin lineal de n.
Blythe ( 1945) describe la aplicacin de este principio a la estimacin del volumen de madera en un lote con fines de venta (ver
Ejercicio 4.11). Nordin (1944) discute el tamao ptimo de la
muestra para estimar las ventas potenciales de un mercado al que
desea entrar un fabricante. Si las ventas pueden pronosticarse exactamente, la cantidad de equipo fijo y de produccin por unidad de
tiempo se podr asignar de tal manera que maximice la utilidad
esperada por el fabricante. Grundy y otros ( 1954-1956) consideran
el tamao ptimo de una segunda muestra, cuando se conocen los
resultados de una muestra inicial.
Este enfoque ha sido desarrollado sustanctalmente en trabajos
sobre la teora de decisin estadstica. Las generalizaciones incluyen la sustitucin de la utilidad por el valor monetario como una
escala en la que se miden costos o prdidas, el uso explcito de informacin anterior subjetiva respecto a parmetros desconocidos,
al expresar esta informacin como distribuciones de probabilidad a
priori de los parmetros desconocidos, y la investigacin de diferentes
tipos de funciones de costo y prdida, y de datos tanto cualitativos

4.11 EL EFECTO DEL DISMO (Deff)


Con los planes de muestreo ms complejos que se describen posteriormente, una cantidad til es el llamado efecto del diseo ( deff)
del plan de muestreo (Ksh, 1965). Este autor describe dicha cantidad como la razn de la varianza de la estimacin obtenida a partir
de la muestra ms compleja a la varianza de la estimacin obtenida a partir de una muestra aleatoria simple del mismo nmero de
undades, El efecto del diseo tiene dos usos primordiales -en la
estimacin del tamao de muestra y en la apreciacin de la eficiencia de planes ms complejos-. Por ejemplo, al estimar la proporcin de personas que presentan cierto atributo, a menudo es
conveniente usar la casa en vez de la persona, como unidad de muestreo. Como se not en el Cap. 3, la frmula PQ/n no se puede usar en
estos planes. Para estimar la proporcin de los que han visto a un
mdico (Sec. 3.12) una muestra aleatoria simple de casas, dio
v(p) - 0.00520 contra pq/n ... 0.00197 para una muestra aleatoria
simple del mismo tamao constituida por personas. Una estimacin
del deff para esta muestra por conglomerados y esta variable es
1Cuando
520/197 - 2.6.
las fracciones de muestreo son pequeas,
podemos, por lo tanto, estimar el tamao de la muestra al calcular el
TI (nmero de personas) requerido con una muestra aleatoria simple de personas y multiplicar por 2.6. Al observar las razones deff
de esta manera para las variantes importantes con un plan complejo, podemos usar las frmulas simples de este capitulo para estimar el

120

TU:NICAS D.E MU:t.sTREO

LA :ESTIMAClON DEL TAMAO DE LA MUESTllA

tamao de la muestra con el plan complejo y tambin juzgar si


dicho plan es ventajoso en eficiencia, en relacin a su costo y complejidad.
Para estimar el deff a partir de los resultados de una muestra
compleja, se requiere algo de lgebra. Necesitamos mostrar en qu
forma estos resultados proporcionan, de ser posible, estimaciones
nsesgadas de S1 o de PQ. Se dan ejemplos de estos clculos para
muestreo aleatorio estratificado en la Sec. SA.11 y para muestreo
por conglomerados en la Sec. 9.3, cuando los conglomerados son del
mismo tamao.

EJERCICIOS
4.1. En un distrito en donde hay 4 000 casas, el porcentaje de proplctarlos
va a ser estimado con una muestra no mayor al 2% y el porcentaje de propietarios de 2. autos con una de no mayor al 1 % . (Las cifras 2 y 1 % son los
valores absolutos, y no los cv.) El porcentaje verdadero de propietarios se
piensa que est entre 45 y 65% y el porcentaje de propietarios de dos autos
entre 5 y 10%. Qu tan grande debe ser una muestra para satisfacer las
dos finalidades?
4.2.. En la poblacin de 676 hojas de solicitud (Tabla 2..2. Pg. 53 ) qu
tan grande debe ser la muestra si se va a estimar el nmero total de firmas
con un margen de error de 1 000 con probabilidad de 95%? Suponra que el
valor de s t dado en la P. 53 es el valor de S't en la poblacin.
4.3. Se va a realizar una encuesta para determinar la existencia de en
fermedades comunes en una poblacin grande. Para cualquier enfermedad que
afecte cuando menos al 1 % de los individuos en la poblacin, se desea es
ti.mar el nmero total de casos, con un coeficiente de varladn de no ms
del 2.0%. (a) Qu tamao de muestra aleatoria simple es necesarlo al su
poner que la presencia de la enfermedad puede ser reconocida sin equivocacin? (b) Qu tamao de muestra se necesita si se desea obtener el nmero total de casos separadamente para hombres y mujeres, con la misma
precisin?
4.4. En un muestreo de insectos se va a estimar el nmero de gusanos
por acre con un limite de error del 30% al nivel de probabilidad del 95%,
en cualquier campo en donde la cantidad de gusanos exceda a 200 000 por
acre en la capa superior de 5 plg del suelo. La barrena para muestrear
mide 9 X 9 X 5 pl de alto. Suponiendo que el nmero de gusanos en une
muestra siue una cllstrlbucin ligeramente ms varlable que la de Poisson,
tomamos s: == 1.2.Y. Qu tamao de muestra aleatoria simple es necesaria?
(Un acre - 43 560 piest.)
4.5. Los siguientes coeficientes de variacin se obtuvieron en una en
cuesta de predios agrcolas en Iowa, la unidad fue un! rea de una milla cuadrada (informacin de. R. J. Jessen):

121

Coeficiente de
variacin estimado
( %)

Caracterstica
Acres en predios agrcolas
Acres de maz
Acres de avena
Nmero de trabajadores de la famllia
Nmero de trabajadores contratados
Nmero de desempleados

38
39
44
100
110
317

Se planea una encuesta para estimar caracterstcas de rea con un coeciente de variacin de 2.5% y nmero de trabajadores (excluyendo a los
desempleados) con un coeficiente de varacn del 5% . Con una muestra
aleatoria simple, cuntas unidades se necesitan? Qu~ tan bien se supone
que esta muestra estime el nmero de desempleados?
4.6. Por muestreo experimental, el valor medio de una variable aleatoria
se va a estimar con una varianza V == 0.0005. Los valores de la variable
aleatoria para las primeras 20 muestras se proporcionan a continuacin. Cuintas muestras adicionales se necesitan?
Ne. de
muestra
1
2
3
4

6
7
8
9
10

Valor de la varia
ble aleatoria

No. de
muestra

Valor de la varia
ble aleatorio.

0.0725

JI
12
13
14
IS
16
17
18
19
20

0.0712
0.0748
0.0878
0.0710
0.0754
O.Q712
0.0757
0.0737
0.0704
0.072)

0.07SS

0.0759
0.0739
0.0732
0.0843
0.0727
0.0769
0.0730
0.0727

4. 7. Se disea una encuesta familiar para estimar la proporcin de


familias que poseen ciertos atributos. Para las principales caractersticas de
Inters, el valor de P se espera que oscile entre el 30 y el 70% . Con un.a
muestra aleatoria simple, qu tan grande debe ser el valor de n para estimar los siguientes promedios con un error estndar que no exceda de 3%?
(a) la media P global. (b) las medias individuale, P1 para las clases de in
resos -menores de $5 000; $5 000 a $10 000; mayores a $10 000. (i - 1, 2.,
3)-. (e) las diferencias entre medias (P1 - P1) para cada una de las parejas de clases en (b). Dar una respuesta separada para (a), (b) y (e). Las es
tadisdcas de ingresos indican que las proporciones de familias con inresos
en las tres clases anteriores son 50, 38 y 12.%.

LA ESTIMACION DEL TAMAO DE LA MUESTRA

( b) Suponga que en (a) el cliente opina que las caractersticas estn positivamente correlacionadas, pero no conoce la correlacin, si se sugere
una muestra inicial de 200, con los siguientes resultados.

4.8. Los colegios con programas de estudio de cuatro aos, en los Estados Unidos se dividieron en clases de 4 tamaos dilerentes de acuerdo con
sus inscripciones de 195Z-1953. Las desviaciones estndar dentro de cada
clase se muestran a continuacin.

Clase
2
Nmero de estudiantes

s,

< 1000
236

1
3

1000-3000

3000-10000

625

2008

12.3

Caractersticas
2.

Si

Si
No
No

ms de 10 000
10023

Si
No
Sf
No

Nmero de unidades
72
44
14
70
'J.00

Si conoce los lmites de clase pe.ro no los valores de S1, qui tan bien
puede estimar los valores de los S1 usando cifras matemticas simples (Sec.
4.7)7 Ningn colegio tiene menos de 200 estudiantes y el m crande tiene
cerca de !50 000 estudiantes.
4.9. Con una funcin cuadrtica de prdida y una funcin lineal de costos como en la Sec. 4.10, Sf se reduce a si mediante un plan de muestreo
ms eficiente, c0, c1 y >.. permanecen sin cambio. Si n', v denotan un nuevo
tamao ptimo de muestra y V(Y), demostrar que n < n y que v < V.
4.10. Si la funcin de prdida debida a un error en y es >,. fy - YI y
si el costo C = c0 + c1n, demuestre que con un muestreo aleatorio simple,
ignorando la cpf, el valor ms econmico de n es

Qu tamao de muestra se recomienda para estimar (P1 - P,) con un


error estndar ~ 2.% 7
4.13. (a) Suponga que se est estimando la razn de sexos, que es cercana a la unidad, y que se pueden muestrear domicilios donde viven 4
personas, padre, madre y dos hijos. Al ignorar la pequea proporcin de famlias con gemelos idnticos, encontrar el factor deff para una muestra alea
torta simple de n casas contra una muestra de las 4n personas. (b) La6 fa
millas donde hubiese gemelos idnticos, elevaran o reducirlan el factor d.eff?

(~'l/3
CJw

4.11. (Adaptado de Blythe, 1945.) El precio de venta de un lote de


madera en ple es UW, en donde U es el precio por unidad de volumen y
W es el volumen de la madera. en el lote. Se cuenta el nmero N de troncos en el lote, y mediante una muestra. alea.torta simple de n troncos, se
estima el volumen promedio por tronco. Se hace una estimacin paada por
el vendedor Y sta es provsonalmente aceptada por el comprador. Despus., el
comprador determina el volumen exacto compradc, y el vendedor le reembolsa, en caso de que el comprador baya pagado ms de lo que le fue entregado.
Si el comprador ha pagado menos de lo recibido, no menciona el hecho.
Construya la funcin de prdida del vendedor, Al suponer que el costo
de la medicin de n troncos es en, encuentre el valor ptimo de n. La desviacin estndar del volumen por tronco se puede indicar por S y la cpf se
puede ignorar.
4.12.. (a) La peesenca o la ausencia de dos caractersticas se debe medir
en cada unidad de una muestra aleatoria simple de una poblacin grande.
Si P 1, Pi son los porcentajes de unidades de la poblacin que tienen las ca
ractersticas 1 y 2., un cliente desea estimar ( P 1 - Pi) con un error estndar
que no exceda dos puntos por ciento. Cul es el tamao de la muestra,
que debe sugerirse sl el cliente piensa que tanto PI como P: estn entre
el 40 y el 60%, y que las caractrstcas se distribuyen independientemente
en las unidades?

Das könnte Ihnen auch gefallen