Sie sind auf Seite 1von 27

425 - Teora de Muestras

ndice general

1 Muestreo (estadstica) 1
1.1 Tcnicas de muestreo estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Muestreo no probabilstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Vase tambin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Poblacin estadstica 5
2.1 Poblacin en epidemiologa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3 Muestra estadstica 6
3.1 Otras deniciones relacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.1 Espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.2 Parmetro o Estadstico muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.3 Estimacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.4 Nivel de conanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2 Ventajas de la eleccin de una muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.3 Descripcin matemtica de una muestra aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.4 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

4 Estimacin estadstica 9
4.1 Estimador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.2 Estimacin puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.3 Estimacin por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.1 Intervalo de conanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.2 Variabilidad del Parmetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.3 Error de la estimacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.4 Lmite de Conanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.5 Valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.3.6 Valor crtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.3.7 Otros usos del trmino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.4 Vase tambin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

i
ii NDICE GENERAL

4.5 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

5 Estimador 12
5.1 Propiedades de los estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.1.1 Sesgo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.1.2 Eciencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1.3 Consistencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1.4 Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1.5 Suciencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1.6 Invarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.2 Vase tambin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

6 Error cuadrtico medio 15


6.1 Denicin y propiedades bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
6.2 Demostracin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6.3 Regresin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6.4 Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6.4.1 Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6.4.2 Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.5 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

7 Tamao de la muestra 19
7.1 Objetivos de la determinacin del tamao adecuado de una muestra . . . . . . . . . . . . . . . . . 19
7.1.1 Estimacin de parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
7.1.2 Contraste de hiptesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
7.2 Notas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
7.3 Text and image sources, contributors, and licenses . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7.3.1 Text . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7.3.2 Images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
7.3.3 Content license . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Captulo 1

Muestreo (estadstica)

En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir de una poblacin.
Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a la poblacin. Este proceso
permite ahorrar recursos, y a la vez obtener resultados parecidos a los que se alcanzaran si se realizase un estudio de
toda la poblacin.
Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio adecuado (que consienta no solo
hacer estimaciones de la poblacin sino estimar tambin los mrgenes de error correspondientes a dichas estimacio-
nes), debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea una muestra
representativa, pero s podemos actuar de manera que esta condicin se alcance con una probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se puede extraer dos o
ms muestras de la misma poblacin. Al conjunto de muestras que se pueden obtener de la poblacin se denomina
espacio muestral. La variable que asocia a cada muestra su probabilidad de extraccin, sigue la llamada distribucin
muestral.

1.1 Tcnicas de muestreo estadstico


Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo
aleatorio (que incorpora el azar como recurso en el proceso de seleccin). Cuando este ltimo cumple con la condicin
de que todos los elementos de la poblacin tienen alguna oportunidad de ser escogidos en la muestra, si la probabilidad
correspondiente a cada sujeto de la poblacin es conocida de antemano, recibe el nombre de muestreo probabilstico.
Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la poblacin. Algunas
veces una muestra de juicio se usa como gua o muestra tentativa para decidir cmo tomar una muestra aleatoria ms
adelante.

1.1.1 Muestreo aleatorio simple

Forman parte de este tipo de muestreo todos aquellos mtodos para los que se puede calcular la probabilidad de
extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas de muestreo es el ms aconsejable,
aunque en ocasiones no es posible optar por l.

Tipos

Sin reposicin de los elementos : Cada elemento extrado se descarta para la subsiguiente extraccin. Por ejemplo,
si se extrae una muestra de una poblacin de bombillas para estimar la vida media de las bombillas que la integran,
no ser posible medir ms que una vez la bombilla seleccionada.
Con reposicin de los elementos: Las observaciones se realizan con remplazo de los individuos, de forma que la
poblacin es idntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extraccin
es tan pequea que el muestreo puede considerarse con reposicin aunque, realmente, no lo sea.

1
2 CAPTULO 1. MUESTREO (ESTADSTICA)

Con reposicin mltiple: En poblaciones muy grandes, la probabilidad de repetir una extraccin es tan pequea que
el muestreo puede considerarse con reposicin.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la extraccin de nmeros aleatorios
mediante ordenadores, calculadoras o tablas construidas al efecto.

Muestreo sistemtico

Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo. Primero hay que
identicar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que
se denomina coeciente de elevacin:
K= N/n
Donde N es el tamao del universo y n el tamao de la muestra.
Para determinar en qu fecha se producir la primera extraccin, hay que elegir al azar un nmero entre 1 y K;
de ah en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la
periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin (N) y queremos escoger de
esa poblacin un nmero ms pequeo el cual es la muestra (n), dividimos el nmero de la poblacin por el nmero
de la muestra que queremos tomar y el resultado de esta operacin ser el intervalo, entonces escogemos un nmero
al azar desde uno hasta el nmero del intervalo, y a partir de este nmero escogemos los dems siguiendo el orden.

Muestreo estraticado

Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos con respecto
a alguna caracterstica de las que se van a estudiar. A cada uno de estos estratos se le asignara una cuota que de-
terminara el nmero de miembros del mismo que compondrn la muestra. Dentro de cada estrato se suele usar la
tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas en la prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos tcnicas
de muestreo estraticado:

Asignacin proporcional: el tamao de la muestra dentro de cada estrato es proporcional al tamao del estrato
dentro de la poblacin.

Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad. Para
ello es necesario un conocimiento previo de la poblacin.

Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las opiniones de hombres y
mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. En la asignacin
proporcional, si la poblacin est compuesta de un 55% de mujeres y un 45 % de hombres, se tomara una muestra
que contenga tambin esos mismos porcentajes de hombres y mujeres. En la asignacin ptima, si todos los hombres
piensan igual, pero las mujeres son impredecibles, se tomara una muestra con ms del 55% de mujeres.
Para una descripcin general del muestreo estraticado y los mtodos de inferencia asociados con este procedimiento,
suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos conocidos N1 , N2 ,..., N tal
que las unidades en cada estrato sean homogneas respecto a la caracterstica en cuestin. La media y la varianza
desconocidas para el i-simo estrato son denotadas por mi y s2 , respectivamente.

Muestreo por etapas mltiples

Esta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin de referencia o bien cuando
por medio de la tcnica de muestreo simple o estraticado se obtiene una muestra con unidades distribuidas de tal
forma que resultan de difcil acceso. En el muestreo a estadios mltiples se subdivide la poblacin en varios niveles
ordenados que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla en
varias fases o extracciones sucesivas para cada nivel.
1.1. TCNICAS DE MUESTREO ESTADSTICO 3

Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un pas determinado, stos pueden
subdividirse en unidades primarias representadas por circunscripciones didcticas y unidades secundarias que seran
los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener
la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias
de cada una de las primarias seleccionadas en la primera extraccin.

Muestreo por conglomerados

Se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se supone que contienen
toda la variabilidad de la poblacin, es decir, la representan elmente respecto a la caracterstica a elegir, pueden
seleccionarse slo algunos de estos grupos o conglomerados para la realizacin del estudio.
Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo, las personas a encuestar, y
podra aplicrsele el instrumento de medicin a todas las unidades, es decir, los miembros del grupo, o slo se le
podra aplicar a algunos de ellos, seleccionados al azar. Este mtodo tiene la ventaja de simplicar la recogida de
informacin muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar la muestra, el diseo
se llama muestreo bietpico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer mtodo funciona mejor cuanto ms
homognea es la poblacin respecto del estrato, aunque ms diferentes son stos entre s. En el segundo, ocurre lo
contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre s.

Homogeneidad de las poblaciones o sus subgrupos

Homogneo signica, en el contexto de la estraticacin, que no hay mucha variabilidad. Los estratos funcionan mejor
cuanto ms homogneos son cada uno de ellos respecto a la caracterstica a medir. Por ejemplo, si se estudia la estatura
de una poblacin, es bueno distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya
menos variabilidad, es decir, sean menos heterogneos. Dicho de otro modo, no hay tantas diferencias entre unas
estaturas y otras dentro del estrato que en la poblacin total.
Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan las mismas diferencias dentro del
estrato que en toda la poblacin, no hay por qu usar este mtodo de muestreo. En los casos en los que existan
grupos que contengan toda la variabilidad de la poblacin, lo que se construyen son conglomerados, que ahorran
algo del trabajo que supondra analizar toda la poblacin. En resumen, los estratos y los conglomerados funcionan
bajo principios opuestos: los primeros son mejores cuanto ms homogneo es el grupo respecto a la caracterstica a
estudiar y los conglomerados, si representan elmente a la poblacin, esto es, contienen toda su variabilidad, o sea,
son heterogneos.

1.1.2 Muestreo no probabilstico

Es aqul para el que no se puede calcular la probabilidad de extraccin de una determinada muestra. Por tal motivo,
se busca seleccionar a individuos que tienen un conocimiento profundo del tema bajo estudio y se considera que la
informacin aportada por esas personas es vital para la toma de decisiones.

Muestreo por cuotas

Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin. En primer lugar es necesario
dividir la poblacin de referencia en varios estratos denidos por algunas variables de distribucin conocida (como
el gnero o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte proporcional
de poblacin que representan. Finalmente se multiplica cada peso por el tamao de n de la muestra para determinar
la cuota precisa en cada estrato. Se diferencia del muestreo estraticado en que una vez determinada la cuota, el
investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato.
4 CAPTULO 1. MUESTREO (ESTADSTICA)

Muestreo de bola de nieve

Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en contacto entre s. Consiste
en identicar sujetos que se incluirn en la muestra a partir de los propios entrevistados. Partiendo de una pequea
cantidad de individuos que cumplen los requisitos necesarios, servirn como localizadores de otros con caractersticas
anlogas.

Muestreo subjetivo por decisin razonada

En este caso las unidades de la muestra se eligen en funcin de algunas de sus caractersticas de manera racional y no
casual. Una variante de esta tcnica es el muestreo compensado o equilibrado, en el que se seleccionan las unidades
de tal forma que la media de la muestra para determinadas variables se acerque a la media de la poblacin. La cual
funciona en base a referencias o por recomendacin despus se reconoce por medio de la estadstica.

1.2 Vase tambin


error muestral

estrategias de muestreo
muestra estadstica

tamao de la muestra
Captulo 2

Poblacin estadstica

Poblacin estadstica, en estadstica, tambin llamada universo, es el conjunto de elementos de referencia sobre el
que se realizan las observaciones. Tambin es el conjunto sobre el que estamos interesados en obtener conclusiones
(inferir). Normalmente es demasiado grande para poder abarcarla, motivo por el cual se puede hacer necesaria la
extraccin de una muestra de sta.

2.1 Poblacin en epidemiologa


En epidemiologa una poblacin es un conjunto de sujetos o individuos con determinadas caractersticas demogrcas,
de la que se obtiene la muestra o participantes en un estudio epidemiolgico a la que se quiere extrapolar los resultados
de dicho estudio (inferencia estadstica). La estadstica es comnmente considerada como una coleccin de hechos
numricos expresados en trminos de una relacin sumisa, y que han sido recopilado a partir de otros datos numricos.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) denen la estadstica como un valor resumido,
calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como
una estimacin de parmetro de determinada poblacin; es decir, una funcin de valores de muestra.[1]

2.2 Referencias
[1] http://www.monografias.com/trabajos15/estadistica/estadistica.shtml#ixzz2JQRrbdXw Monografa sobre la estadistica

5
Captulo 3

Muestra estadstica

En estadstica, una muestra es un subconjunto de casos o individuos de una poblacin estadstica.


Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben
ser representativas de la misma. Para cumplir esta caracterstica la inclusin de sujetos en la muestra debe seguir una
tcnica de muestreo. En tales casos, puede obtenerse una informacin similar a la de un estudio exhaustivo con mayor
rapidez y menor coste (vanse las ventajas de la eleccin de una muestra, ms abajo).
Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda la poblacin porque el manejo
de un menor nmero de datos provoca tambin menos errores en su manipulacin. En cualquier caso, el conjunto de
individuos de la muestra son los sujetos realmente estudiados.
El nmero de sujetos que componen la muestra suele ser bastante inferior a la poblacin total, aunque suciente
grande como para que la estimacin de los parmetros determinados tenga un nivel de conanza adecuado. Para que
el tamao de la muestra sea idneo es preciso recurrir a su clculo.

3.1 Otras deniciones relacionadas

3.1.1 Espacio muestral


El espacio muestral del que se toma una muestra concreta est formado por el conjunto de todas las posibles muestras
que se pueden extraer de una poblacin mediante una determinada tcnica de muestreo.

3.1.2 Parmetro o Estadstico muestral


Un parmetro estadstico o simplemente un estadstico muestral es cualquier valor calculado a partir de la muestra,
como por ejemplo la media, varianza o una proporcin, que describe a una poblacin y puede ser estimado a partir
de una muestra. Un estadstico muestral es un tipo de variable aleatoria, y que como tal, tiene una distribucin de
probabilidad concreta, frecuentemente caracterizada por un conjunto nito de parmetros.

3.1.3 Estimacin
Una estimacin es cualquier tcnica para conocer un valor aproximado de un parmetro referido a la poblacin, a
partir de los estadsticos muestrales calculados a partir de los elementos de la muestra. Si se estima el suciente
nmero de parmetros puede aproximarse de manera razonable la distribucin de probabilidad de la poblacin para
ciertas variables aleatorias.

3.1.4 Nivel de conanza


El nivel de conanza de una aseveracin basada en la inferencia estadstica es una medida de la bondad de la estimacin
realizada a partir de estadsticos muestrales. Usualmente se usan niveles de conanza para intervalos de conanza o

6
3.2. VENTAJAS DE LA ELECCIN DE UNA MUESTRA 7

bien p-valores que miden la probabilidad de errores de tipo I (probabilidad de rechazar una cierta hiptesis siendo
que esta era correcta).

3.1.5 Ejemplo
Se tiene una poblacin de 222.222 habitantes y se quiere conocer cuantos de ellos son hombres y cuantos de ellos son
mujeres. Se conjetura que cerca del 50% son mujeres y el resto hombres, pero se quiere seleccionar una muestra para
determinar cuantos hombres y mujeres hay en la muestra y a partir de ah inferior el porcentaje exacto de hombres y
mujeres en la poblacin total. La descripcin de una muestra, y los resultados obtenidos sobre ella, puede ser del tipo
mostrado en el siguiente ejemplo:
La interpretacin de esos datos sera la siguiente:

1. La poblacin a investigar tiene 222.222 habitantes y queremos saber cuntos son hombres o mujeres.
2. Estimamos en un 50% para cada sexo y para el propsito del estudio es suciente un 90% de seguridad con un
nivel entre 90 - 5 y 90 + 5.
3. Generamos una tabla de 280 nmeros al azar entre 1 y 222.222 y en un censo numerado comprobamos el
gnero para los seleccionados.

3.2 Ventajas de la eleccin de una muestra


El estudio de muestras es preferible, en la mayora de los casos, por las siguientes razones:

1. Si la poblacin es muy grande (en ocasiones, innita, como ocurre en determinados experimentos aleatorios)
y, por tanto, imposible de analizar en su totalidad.
2. Las caractersticas de la poblacin varan si el estudio se prolonga demasiado tiempo.
3. Reduccin de costos: al estudiar una pequea parte de la poblacin, los gastos de recogida y tratamiento de
los datos sern menores que si los obtenemos del total de la poblacin.
4. Rapidez: al reducir el tiempo de recogida y tratamiento de los datos, se consigue mayor rapidez.
5. Viabilidad: la eleccin de una muestra permite la realizacin de estudios que seran imposible hacerlo sobre
el total de la poblacin.
6. La poblacin es sucientemente homognea respecto a la caracterstica medida, con lo cual resultara intil
malgastar recursos en un anlisis exhaustivo (por ejemplo, muestras sanguneas).
7. El proceso de estudio es destructivo o es necesario consumir un artculo para extraer la muestra (ejemplos: vida
media de una bombilla, carga soportada por una cuerda, precisin de un proyectil, etc.).

3.3 Descripcin matemtica de una muestra aleatoria


El uso de muestras para deducir ablemente caractersticas de la poblacin requiere que se trate con muestras
aleatorias. Si la muestra estadstica considerada no constituye una muestra aleatoria las conclusiones basadas en
dicha muestra no son ables y en general estarn sesgadas en algn aspecto.
En trminos matemticos, dada una variable aleatoria X con una distribucin de probabilidad F, una muestra aleatoria
de tamao N es un conjunto nito de N variables independientes, con la misma distribucin de probabilidad F.[1]
Otra forma ms intuitiva, de entender una muestra es considerar que una muestra es una sucesin de N experimentos
independientes de una misma cantidad. Es importante diferenciar una muestra de tamao N, o ms exactamente un
muestreo de tamao N, del resultado concreto de los N experimentos (que como conjunto de valores jos, en s mismo,
no es una muestra). El concepto de muestra incluye de alguna manera el procedimiento escogido para obtener los
datos (es decir, si las variables aleatorias consideradas son independientes entre s, y si tienen la misma distribucin).
En general, resulta muy fcil comprobar si una determinada muestra es o no aleatoria, cosa que slo puede hacerse
considerando otro tipo de muestreos aleatorios robustos que permitan decir si la primera muestra era aleatoria o no.
8 CAPTULO 3. MUESTRA ESTADSTICA

3.4 Referencias
[1] Samuel S. Wilks, Mathematical Statistics, John Wiley, 1962, Section 8.1
Captulo 4

Estimacin estadstica

En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar un valor aproximado de un
parmetro de una poblacin a partir de los datos proporcionados por una muestra. Por ejemplo, una estimacin de la
media de una determinada caracterstica de una poblacin de tamao N podra ser la media de esa misma caracterstica
para una muestra de tamao n.[1]
La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos mtodos que se usan en funcin
de las caractersticas y propsitos del estudio:

Estimacin puntual:[2]

Mtodo de los momentos;


Mtodo de la mxima verosimilitud;
Mtodo de los mnimos cuadrados;

Estimacin por intervalos.

Estimacin bayesiana.

4.1 Estimador
Un estimador es una regla que establece cmo calcular una estimacin basada en las mediciones contenidas en una
muestra estadistica.

4.2 Estimacin puntual


Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una frmula determinada. Por
ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra
y ofrecer como estimacin puntual la talla media de los individuos. Lo ms importante de un estimador, es que sea
un estimador eciente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o eciente (varianza
mnima) Estimacin puntual. Sea X una variable poblacional con distribucin F , siendo desconocido. El problema
de estimacin puntual consiste en, seleccionada una muestra X1, ..., Xn, encontrar el estadstico T(X1, ..., Xn) que
mejor estime el parmetro . Una vez observada o realizada la muestra, con valores x1, ..., xn, se obtiene la estimacin
puntual de , T(x1, ..., xn) = .
Vemos a continuacin dos mtodos para obtener la estimacin puntual de un parmetro: mtodo de los momentos y
mtodo de mxima verosimilitud. Mtodo de los momentos: consiste en igualar momentos poblacionales a momentos
muestrales. Deberemos tener tantas igualdades como parmetros a estimar. Momento poblacional de orden r r =
E(Xr) Momento muestral de orden r ar = Xn i=1 Xr i n
Mtodo de mxima verosimilitud: consiste en tomar como valor del parmetro aquel que maximice la probabilidad
de que ocurra la muestra observada. Si X1, ..., Xn es una muestra seleccionada de una poblacin con distribucin F

9
10 CAPTULO 4. ESTIMACIN ESTADSTICA

o densidad f(x), la probabilidad de que ocurra una realizacin x1, ..., xn viene dada por: L(x1, ..., xn) = Yn i=1
f(xi)
A L(x1, ..., xn) se le llama funcin de verosimilitud.(credibilidad de la muestra observada). Buscamos entonces el
valor de que maximice la funcin de verosimilud, y al valor obtenido se le llama estimacin por mxima verosi-
militud de . Nota: si la variable X es discreta, en lugar de f(xi ) consideramos la funcin masa de probabilidad
p(xi).
Ejemplo 7.1: Sea X N(, ), con desconocido. Seleccionada una m.a.s. X1, ..., Xn, con realizacin x1, ..., xn,
estimamos el parmetro por ambos mtodos. Segn el mtodo de los momentos: E(X) = Xn i=1 Xi n = X, y al
ser = E(X) se obtiene que = x. Por el mtodo de mxima verosimilitud: L(x1, ..., xn) = Yn i=1 f(xi ) = =
Yn i=1 1 2 e (xi) 2 2
Estimacin por Intervalos de conanza 109 y maximizamos en tal funcin; en este caso resulta ms fcil maximizar
su logaritmo: lnL(x1, ..., xn) = 1 2 2 Xn i=1 (xi ) 2 n ln( 2) lnL(x1, ..., xn) = 1 2 Xn i=1 (xi
) = n x n 2 = 0 =

4.3 Estimacin por intervalos


Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro estimado con una cierta proba-
bilidad. En la estimacin por intervalos se usan los siguientes conceptos:

4.3.1 Intervalo de conanza

El intervalo de conanza es una expresin del tipo [1 , 2 ] 1 2 , donde es el parmetro a estimar. Este
intervalo contiene al parmetro estimado con un determinado nivel de conanza. Pero a veces puede cambiar este
intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial.

4.3.2 Variabilidad del Parmetro

Si no se conoce, puede obtenerse una aproximacin en los datos aportados por la literatura cientca o en un estudio
piloto. Tambin hay mtodos para calcular el tamao de la muestra que prescinden de este aspecto. Habitualmente
se usa como medida de esta variabilidad la desviacin tpica poblacional y se denota .

4.3.3 Error de la estimacin

Es una medida de su precisin que se corresponde con la amplitud del intervalo de conanza. Cuanta ms precisin
se desee en la estimacin de un parmetro, ms estrecho deber ser el intervalo de conanza y, si se quiere mantener
o disminuir el error, ms observaciones debern incluirse en la muestra estudiada. En caso de no incluir nuevas
observaciones para la muestra, ms error se comete al aumentar la precisin. Se suele llamar E, segn la frmula E
= (2 - 1 )/2.

4.3.4 Lmite de Conanza

Es la probabilidad de que el verdadero valor del parmetro estimado en la poblacin se site en el intervalo de conanza
obtenido. El nivel de conanza se denota por (1-), aunque habitualmente suele expresarse con un porcentaje ((1-
)100%). Es habitual tomar como nivel de conanza un 95% o un 99%, que se corresponden con valores de 0,05
y 0,01 respectivamente.

4.3.5 Valor

Tambin llamado nivel de signicacin. Es la probabilidad (en tanto por uno) de fallar en nuestra estimacin, esto
es, la diferencia entre la certeza (1) y el nivel de conanza (1-). Por ejemplo, en una estimacin con un nivel de
conanza del 95%, el valor es (100-95)/100 = 0,05
4.4. VASE TAMBIN 11

4.3.6 Valor crtico


Se representa por Z/. Es el valor de la abscisa en una determinada distribucin que deja a su derecha un rea igual a
/2, siendo 1- el nivel de conanza. Normalmente los valores crticos estn tabulados o pueden calcularse en funcin
de la distribucin de la poblacin. Por ejemplo, para una distribucin normal, de media 0 y desviacin tpica 1, el
valor crtico para = 0,1 se calculara del siguiente modo: se busca en la tabla de la distribucin ese valor (o el ms
aproximado), bajo la columna "rea"; se observa que se corresponde con 1,28. Entonces Z/ = 1,64. Si la media
o desviacin tpica de la distribucin normal no coinciden con las de la tabla, se puede realizar el cambio de variable
t =(X-)/ para su clculo.
Con estas deniciones, si tras la extraccin de una muestra se dice que 3 es una estimacin de la media con un
margen de error de 0,6 y un nivel de conanza del 99%", podemos interpretar que el verdadero valor de la media
se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando,
respectivamente, la mitad del error, para obtener el intervalo de conanza segn las deniciones dadas.
Para un tamao jo de la muestra, los conceptos de error y nivel de conanza van relacionados. Si admitimos un error
mayor, esto es, aumentamos el tamao del intervalo de conanza, tenemos tambin una mayor probabilidad de xito
en nuestra estimacin, es decir, un mayor nivel de conanza.

4.3.7 Otros usos del trmino


El trmino estimacin tambin se utiliza en ciencias aplicadas para hacer referencia a un clculo aproximado, que
normalmente se apoya en la herramienta estadstica aunque puede no hacerlo. En este sentido, un ejemplo clsico son
los poco conocidos pero tiles en economa problemas de Fermi.

4.4 Vase tambin


Aproximacin

Intervalo de conanza.
Muestra estadstica.

Muestreo estadstico.
Tamao de la muestra.

Teorema del Lmite Central.


Estadstico muestral

4.5 Referencias
[1] Wackerly, Dennis D; Mendenhall, William; Scheaer, Richard L. (2002). 8. Estimacin. Estadstica matemtica con
aplicaciones (6 edicin). Cengage Learning Editores. p. 364. ISBN 9706861947.

[2] Caldern C., Bernardo A. Mtodos de estimacin. Estadstica Matemtica I. Universidad de Antioquia. Consultado el 21
de abril de 2009.

'Introduccin a la Estadstica Econmica y Empresarial. Teora y Prctica.' de Fco. Javier Martn-Pliego Lpez,
Editorial Thomson, 2007 (Madrid).

'Manual de Estadstica Empresarial con ejercicios resueltos de Eva Ropero, Mara Eleftheriou, Luana Gava y
Eva Romero. Editorial Delta Publicaciones. 2008 (Madrid).
Captulo 5

Estimador

En estadstica, un estimador es un estadstico (esto es, una funcin de la muestra) usado para estimar un parmetro
desconocido de la poblacin. Por ejemplo, si se desea conocer el precio medio de un artculo (el parmetro desco-
nocido) se recogern observaciones del precio de dicho artculo en diversos establecimientos (la muestra) y la media
aritmtica de las observaciones puede utilizarse como estimador del precio medio.
Para cada parmetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea
mejores propiedades que los restantes, como insesgadez, eciencia, convergencia y robustez (consistencia).
El valor de un estimador proporciona lo que se denomina en estadstica una estimacin puntual del valor del par-
metro en estudio. En general, se suele preferir realizar una estimacin mediante un intervalo, esto es, obtener un
intervalo [a,b] dentro del cual se espera est el valor real del parmetro con un cierto nivel de conanza. Utilizar un
intervalo resulta ms informativo, al proporcionar informacin sobre el posible error de estimacin, asociado con la
amplitud de dicho intervalo. El nivel de conanza es la probabilidad de que a priori el verdadero valor del parmetro
quede contenido en el intervalo.
En la prctica, los intervalos de estimadores con distribuciones simtricas suelen indicarse dando el valor del estimador
puntual utilizado como centro del intervalo y un valor que debe sumarse y restarse para obtener el lmite superior e
inferior; por ejemplo:

3, 5 2, 03 equivale a [3, 5 2, 03 ; 3, 5 + 2, 03] = [1, 47 ; 5, 53]

5.1 Propiedades de los estimadores

5.1.1 Sesgo
Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el verdadero
valor del parmetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea
nulo por ser su esperanza igual al parmetro que se desea estimar.
Por ejemplo, si se desea estimar la media de una poblacin, la media aritmtica de la muestra es un estimador insesgado
de la misma, ya que su esperanza (valor esperado) es igual a la media de la poblacin.
En efecto, si una muestra X=(X1 ,X2 ,...,Xn)t procede de una poblacin de media , quiere decir que:

E[Xi ] = para cualquier i=1...n

La media aritmtica o media presupuestal,


= 1 n Xi , con lo que, al aplicar las propiedades de linealidad de la esperanza matemtica se tiene que:
X n i=1

[ ]
= E 1 n Xi =
E[X] n i=1
n n
= n1 E [ i=1 Xi ] = n1 i=1 E [Xi ] =
n
= n1 i=1 = n1 n =

12
5.1. PROPIEDADES DE LOS ESTIMADORES 13

5.1.2 Eciencia

Diremos que un estimador es ms eciente o ms preciso que otro estimador, si la varianza del primero es menor que
la del segundo. Por ejemplo, si 1 y 2 son ambos estimadores de y

Var(1 ) < Var(2 )

diremos que 1 es ms eciente que 2 . Un estimador es ms eciente (ms preciso), por tanto, cuanto menor es su
varianza.
La eciencia de los estimadores est limitada por las caractersticas de la distribucin de probabilidad de la muestra de
la que proceden. El teorema de Cramr-Rao determina que la varianza de un estimador insesgado de un parmetro
es, como mnimo,

( )
var b [ 1
2
]
E [

log f (X;)]

donde f (X; ) es la funcin de densidad de probabilidad de la muestra X = (X1 , X2 , , Xn )t en funcin del


parmetro , (denominada funcin de verosimilitud). Si un estimador insesgado alcanza esta cota mnima, entonces
se dice que el estimador es de mnima varianza dentro de los estimadores insesgados, pudiendo existir estimadores
sesgados con varianza menor.

5.1.3 Consistencia

Si no es posible emplear estimadores de mnima varianza, el requisito mnimo deseable para un estimador es que a
medida que el tamao de la muestra crece, el valor del estimador tienda a ser el valor del parmetro, propiedad que se
denomina consistencia. Existen diversas deniciones de consistencia, ms o menos restrictivas, pero la ms utilizada
es la denominada consistencia en media cuadrtica que exige que:

cuando n
1. E[]
0 cuando n
2. V ar()

5.1.4 Robustez

El estimador ser un estimador robusto del parmetro si la violacin de los supuestos de partida en los que se basa
la estimacin (normalmente, atribuir a la poblacin un determinado tipo de funcin de distribucin que, en realidad,
no es la correcta), no altera de manera signicativa los resultados que ste proporciona.

5.1.5 Suciencia

Se dice que un estimador es suciente cuando resume toda la informacin relevante contenida en la muestra, de forma
que ningn otro estimador pueda proporcionar informacin adicional sobre el parmetro desconocido de la poblacin.
Por ejemplo, la media muestral sera un estimador suciente de la media poblacional, mientras que la moda no lo
sera.

5.1.6 Invarianza

Se dice que un estimador es invariante cuando el estimador de la funcin del parmetro coincide con la funcin del

estimador del parmetro, [f ()] = f ( ).
Ejemplo.- Si para estimar la varianza poblacional utilizamos la varianza muestral, entonces para estimar la desviacin
tpica poblacional ser razonable utilizar la desviacin tpica muestral.
14 CAPTULO 5. ESTIMADOR

5.2 Vase tambin

Portal:Matemtica. Contenido relacionado con Matemtica.

Sensibilidad y especicidad (estadstica)


Captulo 6

Error cuadrtico medio

En estadstica, el error cuadrtico medio (ECM) de un estimador mide el promedio de los errores al cuadrado, es
decir, la diferencia entre el estimador y lo que se estima. El ECM es una funcin de riesgo, correspondiente al valor
esperado de la prdida del error al cuadrado o prdida cuadrtica. La diferencia se produce debido a la aleatoriedad
o porque el estimador no tiene en cuenta la informacin que podra producir una estimacin ms precisa.[1]
El MSE es el segundo momento (sobre el origen) del error, y por lo tanto incorpora tanto la varianza del estimador as
como su sesgo. Para un estimador insesgado, el ECM es la varianza del estimador. Al igual que la varianza, el EMC
tiene las mismas unidades de medida que el cuadrado de la cantidad que se estima. En una analoga con la desviacin
estndar, tomando la raz cuadrada del EMC produce el error de la raz cuadrada de la media o la desviacin de la raz
cuadrada media (RMSE o RMSD), que tiene las mismas unidades que la cantidad que se estima; para un estimador
insesgado, el RMSE es la raz cuadrada de la varianza, conocida como la desviacin estndar.

6.1 Denicin y propiedades bsicas

Si Y es un vector de n predicciones y Y es el vector de los verdaderos valores, entonces el (estimado) ECM del
predictor es:
n
ECM = n1 i=1 (Yi Yi )2 .
Esta es una cantidad conocida, calculado dada una muestra particular (y por lo tanto es dependiente de la muestra).
El MSE de un estimador con respecto al parmetro desconocido se dene como

[ ]
= E ( )2 .
ECM()

Esta denicin depende del parmetro desconocido, y el MSE en este sentido es una propiedad de un estimador (de
un mtodo de obtencin de una estimacin).
El MSE es igual a la suma de la varianza y el cuadrado sesgo del estimador o de las predicciones. En el caso de la
MSE de un estimador, [2]

( )2
= Var()
ECM() + Bias(,
) .

As pues, el ECM evala la calidad de un estimador o conjunto de predicciones en cuanto a su variacin y el grado
de sesgo.
Desde MSE es una expectativa, no es tcnicamente una variable aleatoria, pero va a estar sujeto a error de estima-
cin cuando se calcula para un estimador particular de con valor verdadero desconocido. Por lo tanto, cualquier
estimacin de la MSE sobre la base de un parmetro estimado es de hecho una variable aleatoria.

15
16 CAPTULO 6. ERROR CUADRTICO MEDIO

6.2 Demostracin
[( )2 ]
E(( )2 ) = E
MSE() E()
+ E()

[( )2 ( ) ( )2 ]

= E E() + 2 ( E())(E() ) + E()
[( )2 ] [ ] [( )2 ]

= E E()
+ 2E ( E())(E() ) + E E()

=E()E(
)=0
[( )2 ] z }| { [( )2 ]

= E E()
+ 2(E() ) E( E()) +E E()
[( )2 ] [( )2 ]

= E E()
+ E E()

+ Bias(,
= Var() )2

6.3 Regresin
En el anlisis de regresin, el trmino de error cuadrtico medio se utiliza a veces para referirse a la estimacin
insesgada de la varianza del error: la suma residual de cuadrados, dividida por el nmero de grados de libertad. Esta
denicin para una cantidad calculada conocida, diere de la denicin anterior para el ECM calculado para un
predictor en que se utiliza un denominador diferente. El denominador es el tamao reducido de la muestra por el
nmero de parmetros del modelo estimado a partir de los mismos datos, (np) para p regresores o (np-1) si se utiliza
una intercepcin.[3] Para ms detalles, ver los errores y los residuos en las estadsticas. Tenga en cuenta que, aunque
el ECM no es un estimador insesgado de la varianza del error, es coherente, dada la consistencia del predictor.
Tambin en el anlisis de regresin, error cuadrtico medio, se reere a menudo al error medio de prediccin
cuadrado o fuera de la media muestral de error al cuadrado, puede referirse a la media de las desviaciones al
cuadrado de las predicciones de los verdaderos valores, a lo largo un espacio fuera de la muestra de ensayo, generado
por un modelo estimado durante un espacio de muestra particular. Esto tambin es una, cantidad calculada conocida,
y vara por muestra y por espacio de ensayo fuera de la muestra.

6.4 Ejemplos

6.4.1 Media

Supongamos que tenemos una muestra aleatoria de tamao n de una poblacin, X1 , . . . , Xn . Supongamos que las
unidades de muestra se eligieron con el reemplazo. Es decir, las n unidades se seleccionan uno a la vez, y las unidades
previamente seleccionadas siguen siendo elegibles para ser seleccionados para todo n empates. El estimador usual de
la media es el promedio de la muestra

1
n
X= Xi
n i=1

el cual tiene un valor esperado igual a la media real (por lo que es imparcial) y un error cuadrtico medio de

( )2
2
ECM(X) = E((X )2 ) = =
n n

donde 2 es la varianza de la poblacin.


Para una distribucin gaussiana este es el mejor estimador insesgado (es decir, que tiene el MSE ms bajo entre todos
los estimadores insesgados), pero no, por ejemplo, para una distribucin uniforme .
6.5. REFERENCIAS 17

6.4.2 Varianza
El estimador usual para la varianza es la corregida varianza de la muestra :

( )
1 ( )2
n n
1 2
2
Sn1 = Xi X = Xi2 nX .
n 1 i=1 n1 i=1

Esto es imparcial (su valor esperado es 2 ), Por lo tanto, tambin llamada la varianza de la muestra no sesgada, y su
ECM es [4]

( )
1 n3 4
2
ECM(Sn1 )= 4
n n1
( )
1 2n
= 2 + 4 ,
n n1

donde 4 es el cuarto momento central de la distribucin o de la poblacin y 2 = 4 / 4 3 es el exceso de curtosis.


Sin embargo, se puede utilizar otros estimadores de 2 que son proporcionales a Sn1
2
, Y una eleccin adecuada
siempre puede dar un error cuadrtico medio menor. Si denimos

n1 2
Sa2 = Sn1
a
1 ( )2
n
= Xi X
a i=1

a continuacin, el MSE es

(( )2 )
n1 2
MSE(Sa2 ) =E Sn1 2
a
n1 2(n 1) 4
= [(n 1)2 + n2 + n] 4 + 4
na2 a
Esto se minimiza cuando

(n 1)2 + n2 + n n1
a= =n+1+ 2 .
n n
Para una distribucin gaussiana, donde 2 = 0 . Esto signica que el MSE se minimiza cuando dividiendo la suma por
a = n + 1 . El exceso de curtosis es mnimo 2 = 2 , [a] que se consigue mediante una distribucin de Bernoulli
con p = 1/2 (un tirn de la moneda), y el MSE se reduce al mnimo para a = n 1 + 2/n . As que no importa lo
que la curtosis, obtenemos una estimacin mejor (en el sentido de tener un MSE inferior) reduciendo el tamao de
la perito imparcial un poco; este es un ejemplo sencillo de un estimador de la contraccin : uno encoge el estimador
hacia cero (escalas por el estimador no sesgado).
Adems, mientras que la varianza muestral corregida es el mejor estimador insesgado (error cuadrtico medio mnimo
entre los estimadores no sesgados) de la varianza para distribuciones gaussianas, si la distribucin no es gaussiana
2
entonces incluso entre estimadores no sesgados, el mejor estimador insesgado de la varianza puede no ser Sn1 .

6.5 Referencias
[1] Lehmann, E. L.; Casella, George (1998). Theory of Point Estimation (2nd edicin). New York: Springer. ISBN 0-387-
98502-6. MR 1639875.
18 CAPTULO 6. ERROR CUADRTICO MEDIO

[2] Wackerly, Dennis; Scheaer, William (2008). Mathematical Statistics with Applications (7 edicin). Belmont, CA, USA:
Thomson Higher Education. ISBN 0-495-38508-5.

[3] Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences.,
McGraw Hill, 1960, page 288.

[4] Mood, A.; Graybill, F.; Boes, D. (1974). Introduction to the Theory of Statistics (3rd edicin). McGraw-Hill. p. 229.
Captulo 7

Tamao de la muestra

En estadstica el tamao de la muestra es el nmero de sujetos que componen la muestra extrada de una poblacin,
necesarios para que los datos obtenidos sean representativos de la poblacin.

7.1 Objetivos de la determinacin del tamao adecuado de una muestra


1. Estimar un parmetro determinado con el nivel de conanza deseado.

2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio con un mnimo de garanta.

3. Reducir costes o aumentar la rapidez del estudio.

Por ejemplo, en un estudio de investigacin epidemiolgico la determinacin de un tamao adecuado de la muestra


tendra como objetivo su factibilidad. As:

1. Si el nmero de sujetos es insuciente habra que modicar los criterios de seleccin, solicitar la colaboracin
de otros centros o ampliar el perodo de reclutamiento. Los estudios con tamaos muestrales insucientes, no
son capaces de detectar diferencias entre grupos, llegando a la conclusin errnea de que no existe tal diferencia.

2. Si el nmero de sujetos es excesivo, el estudio se encarece desde el punto de vista econmico y humano. Adems
es poco tico al someter a ms individuos a una intervencin que puede ser menos ecaz o incluso perjudicial.

El tamao de una muestra es el nmero de individuos que contiene.


Una frmula muy extendida que orienta sobre el clculo del tamao de la muestra para datos globales es la siguiente:[1]

k 2 N pq
e2 (N 1) + k 2 pq

N: es el tamao de la poblacin o universo (nmero total de posibles encuestados).


k: es una constante que depende del nivel de conanza que asignemos. El nivel de conanza indica la probabilidad
de que los resultados de nuestra investigacin sean ciertos: un 95,5 % de conanza es lo mismo que decir que nos
podemos equivocar con una probabilidad del 4,5%. Los valores de k se obtienen de la tabla de la distribucin normal
estndar N(0,1).

Los valores de k ms utilizados y sus niveles de conanza son:

19
20 CAPTULO 7. TAMAO DE LA MUESTRA

(Por tanto si pretendemos obtener un nivel de conanza del 95% necesitamos poner en la frmula k=1,96)
e: es el error muestral deseado, en tanto por uno. El error muestral es la diferencia que puede haber entre el resultado
que obtenemos preguntando a una muestra de la poblacin y el que obtendramos si preguntramos al total de ella.
Ejemplos:

Ejemplo 1: si los resultados de una encuesta dicen que 100 personas compraran un producto y tenemos
un error muestral del 5% comprarn entre 95 y 105 personas.

Ejemplo 2: si hacemos una encuesta de satisfaccin a los empleados con un error muestral del 3% y el
60% de los encuestados se muestran satisfechos signica que entre el 57% y el 63% (60% +/- 3%) del
total de los empleados de la empresa lo estarn.

Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de
los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estar en el intervalo
52-58% (55% +/- 3%).

p: proporcin de individuos que poseen en la poblacin la caracterstica de estudio. Este dato es generalmente des-
conocido y se suele suponer que p=q=0.5 que es la opcin ms segura.
q: proporcin de individuos que no poseen esa caracterstica, es decir, es 1-p.
n: tamao de la muestra (nmero de encuestas que vamos a hacer).
Altos niveles de conanza y bajo margen de error no signican que la encuesta sea de mayor conanza o est ms
libre de error necesariamente; antes es preciso minimizar la principal fuente de error que tiene lugar en la recogida
de datos.
Otra frmula para calcular el tamao de la muestra es:
n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 )
Donde: n = el tamao de la muestra.
N = tamao de la poblacin.
= Desviacin estndar de la poblacin, que generalmente cuando no se tiene su valor, suele utilizarse un valor
constante de 0,5.
Z = Valor obtenido mediante niveles de conanza. Es un valor constante que, si no se tiene su valor, se lo toma en
relacin al 95% de conanza equivale a 1,96 (como ms usual) o en relacin al 99% de conanza equivale 2,58, valor
que queda a criterio del encuestador.
e = Lmite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que
vara entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.
La frmula anterior se obtiene de la frmula para calcular la estimacin del intervalo de conanza para la media:
X -Z /n ((N-n)/(N-1))X +Z /n ((N-n)/(N-1))
En donde el error es:
e=Z /n ((N-n)/(N-1))
Elevando al cuadrado el error se tiene: (e) ^2=(Z /n ((N-n)/(N-1)))^2 e^2=Z^2 ^2/n (N-n)/(N-1)
Multiplicando fracciones: e^2=( Z^2 ^2 (N-n))/n(N-1)
Eliminando denominadores: e^2 n(N-1)= Z^2 ^2 (N-n)
Eliminando parntesis: e^2 nN-e^2 n= Z^2 ^2 N- Z^2 ^2 n
Transponiendo n a la izquierda: e^2 nN-e^2 n+ Z^2 ^2 n= Z^2 ^2 N
Factor comn de n:
n(e^2 N-e^2+Z^2 ^2 )= Z^2 ^2 N
Despejando n:
n=( Z^2 ^2 N)/(e^2 N-e^2+Z^2 ^2 )
Ordenando se obtiene la frmula para calcular el tamao de la muestra:
7.1. OBJETIVOS DE LA DETERMINACIN DEL TAMAO ADECUADO DE UNA MUESTRA 21

n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 )


Ejemplo ilustrativo: Calcular el tamao de la muestra de una poblacin de 500 elementos con un nivel de conanza
del 99%
Solucin: Se tiene N=500, para el 99% de conanza Z = 2,58, y como no se tiene los dems valores se tomar =0,5,
y e = 0,05.
Reemplazando valores en la frmula se obtiene:
n=(N^2 Z^2)/((N-1) e^2+^2 Z^2 )
n=(500 0,5 ^2 2,58 ^2)/((500-1) (0,05) ^2+ 0,5 ^2 2,58 ^2 )=832,05/2,9116=285,77=286

7.1.1 Estimacin de parmetros

La estimacin de parmetros consiste en el clculo aproximado del valor de un parmetro en la poblacin, utilizando
la inferencia estadstica, a partir de los valores observados en la muestra estudiada. Para el clculo del tamao de
la muestra en una estimacin de parmetros son necesarios los conceptos de Intervalo de conanza, variabilidad del
parmetro, error, nivel de conanza, valor crtico y valor (vase estimacin por intervalos).

Estimacin de una proporcin

Los datos que tenemos que incluir en la frmula para calcular el nmero de sujetos necesarios de la muestra (N) son:

1. Z/: valor de Z correspondiente al riesgo jado. El riesgo jado suele ser 0,05 y Z/ de 1,96.

2. P: Valor de la proporcin que se supone existe en la poblacin.

3. i: Precisin con que se desea estimar el parmetro ( 2i es la amplitud del intervalo de conanza).

Estimacin de una media

Los datos que tenemos que incluir en la frmula para calcular el nmero de sujetos necesarios en la muestra (N) son:

1. Z/: valor de Z correspondiente al riesgo jado. El riesgo jado suele ser 0,05 y Z/ de 1,96.

2. s2 : Varianza de la distribucin de la variable cuantitativa que se supone que existe en la poblacin.

3. i : Precisin con que se desea estimar el parmetro ( 2i es la amplitud del intervalo de conanza).

7.1.2 Contraste de hiptesis

Para conocer el tamao de la muestra en un estudio de investigacin en el que queremos conocer las diferencias
existentes entre dos hiptesis, debemos conocer previamente:

error tipo I y tipo II: Hay que establecer el riesgo de cometer un error de tipo I que se est dispuesto a aceptar.
Normalmente de forma arbitraria se acepta un riesgo del 5%. Adems hay que establecer el riesgo que se acepta
de cometer un error tipo II, que suele ser entre el 5 y el 20%.

Si la hiptesis es unilateral o bilateral: El planteamiento de una hiptesis bilateral o de dos colas requiere
mayor tamao muestral.

Denir la Magnitud de la diferencia efecto o asociacin que se desea detectar: A mayores diferencias prees-
tablecidas en el planteamiento de la hiptesis, menor tamao muestral, y a menor diferencia, mayor espacio
muestral.

Conocer la variabilidad del criterio de evaluacin en la poblacin.


22 CAPTULO 7. TAMAO DE LA MUESTRA

Comparacin de dos proporciones

Para calcular el nmero de sujetos necesarios en cada una de las muestras (n), debemos prejar:

1,96 = Valor Z correspondiente al riesgo deseado

1,96 = Valor Z correspondiente al riesgo deseado, si es de dos colas.


0,13 = Valor de la proporcin en el grupo de referencia, placebo, control o tratamiento habitual.

0,44 = Valor de la proporcin en el grupo del nuevo tratamiento, intervencin o tcnica.


0,29 = Media de las dos proporciones p1 y p2 .

Coeciente de correlacin

La asociacin entre dos variables cuantitativas necesita normalmente la utilizacin del coeciente de correlacin r de
Pearson.

Equivalencia de dos intervenciones

Portal:Matemtica. Contenido relacionado con Matemtica.

7.2 Notas
[1] Tamao de una muestra para una investigacin de mercado Trabajo de dos profesoras de la Universidad Rafael Landvar.
7.3. TEXT AND IMAGE SOURCES, CONTRIBUTORS, AND LICENSES 23

7.3 Text and image sources, contributors, and licenses


7.3.1 Text
Muestreo (estadstica) Fuente: http://es.wikipedia.org/wiki/Muestreo%20(estad%C3%ADstica)?oldid=81244951 Colaboradores: Pino,
Joseaperez, Sabbut, Pabloes, JorgeGG, Tartaglia, Dodo, Tano4595, Niqueco, Magister Mathematicae, RobotQuistnix, Yrbot, BOTijo, Yu-
rikBot, Icvav, The Photographer, Fernando Surez, Sheket, Baneld, Maldoror, BOTpolicia, CEM-bot, Laura Fiorucci, Karshan, Rastrojo,
Antur, VARGUX, Isha, Hanjin, Dogor, Kved, Fargok, Segedano, Leptictidium, Iulius1973, Gsrdzl, TXiKiBoT, Esteban521, Humberto,
Netito777, Ale ashero, Ronald2308, Plux, VolkovBot, Snakeyes, Technopat, Queninosta, Matdrodes, Nuvem, Esperanza Larramendi,
Luis Carlos Silva, Rauleeddoo, BlackBeast, Muro Bot, Bucho, Racso, Mauricio Sadinle, SieBot, Mushii, Loveless, CASF, Marcelo, Man-
w, Ugly, Pascow, Correogsk, Greek, Tirithel, Jdateo, Eduardosalg, Leonpolanco, Petruss, Poco a poco, Juan Mayordomo, Aipni-Lovrij,
Camilo, UA31, AVBOT, Miltonpatio, David0811, Tenebra, J.delanoy, MastiBot, MarcoAurelio, Diegusjaimes, Davidgutierrezalvarez,
MelancholieBot, CarsracBot, Javu61, Andreasmperu, BOTrany, Miguel A. Ortiz Arjona, Nixn, ArthurBot, SuperBraulio13, ChristianH,
Jkbw, ChenzwBot, Botarel, DrVino, Dark Bane, Foundling, Axvolution, Alieito, AVIADOR, J. A. Glvez, Grillitus, Emiduronte, An-
tonorsi, LlamaAl, Helmy oved, Addbot, Balles2601, JacobRodrigues, IsraelMR, MrCharro, Mr verga, Anonimush y Annimos: 387
Poblacin estadstica Fuente: http://es.wikipedia.org/wiki/Poblaci%C3%B3n%20estad%C3%ADstica?oldid=82186608 Colaborado-
res: Suisui, JakobVoss~eswiki, Pabloes, JorgeGG, Sms, Julian Colina, Rembiapo pohyiete (bot), Chobot, Vitamine, YurikBot, Lobillo,
Baneld, BOTpolicia, CEM-bot, Rosarinagazo, Montgomery, Escarbot, IrwinSantos, Gngora, Pepelopex, Gsrdzl, TXiKiBoT, Netito777,
Rei-bot, VolkovBot, Matdrodes, Muro Bot, SieBot, Loveless, Manw, Greek, Jarisleif, Nicop, McMalamute, Eduardosalg, Leonpolanco,
Gallowolf, Juan Mayordomo, Raulshc, UA31, AVBOT, MastiBot, Diegusjaimes, DumZiBoT, Arjuno3, Roinpa, SuperBraulio13, Jkbw,
Marvinn, Ricardogpn, Torrente, Botarel, D'ohBot, Hprmedina, RedBot, Dark Bane, Jorge c2010, Miss Manzana, EmausBot, AVIADOR,
Sergio Andres Segovia, Rubpe19, Elas, UnRar, Any Rand, Lcampospousa, Antonorsi, MerlIwBot, Franco68, KLBot2, RollbackerBOT,
Carliitaeliza, Harpagornis, LlamaAl, Elvisor, Helmy oved, Akdkiller, Dofusyee, Syum90, Liro jou, Balles2601, Prolactino, MrCharro,
Pabloarcadio, JuanCalamidad, Volei3223 y Annimos: 176
Muestra estadstica Fuente: http://es.wikipedia.org/wiki/Muestra%20estad%C3%ADstica?oldid=82285944 Colaboradores: Joseape-
rez, Tartaglia, Julian Colina, Soulreaper, Airunp, Natrix, Magister Mathematicae, RobotQuistnix, Yrbot, YurikBot, Filipo, Javicivil,
BOTpolicia, CEM-bot, Marianov, Davius, Gafotas, FrancoGG, Resped, Thijs!bot, Srengel, Roberto Fiadone, Carlosgs83, Dogor, JAnD-
bot, VanKleinen, Kved, TXiKiBoT, Esteban521, Humberto, Plux, Technopat, Matdrodes, Edmenb, SieBot, Loveless, CASF, Mel 23,
Manw, Mafores, Xqno, Tirithel, Javierito92, DragonBot, Farisori, Eduardosalg, Leonpolanco, Petruss, Poco a poco, Juan Mayordo-
mo, Raulshc, Aipni-Lovrij, UA31, AVBOT, Dermot, LucienBOT, Diegusjaimes, Arjuno3, Spirit-Black-Wikipedista, Nallimbot, Vic
Fede, Rickynoram, SuperBraulio13, Xqbot, Jkbw, Dreitmen, Ricardogpn, Torrente, Botarel, MauritsBot, Panderine!, Hprmedina, Gon-
zalo.cruz.ruiz, Jorge c2010, Sergio Andres Segovia, ChuispastonBot, MadriCR, Waka Waka, MerlIwBot, Fredy2396, Gusama Romero,
Mega-buses, Helmy oved, Robert Laymont, Syum90, Liro jou, Jean70000, Addbot, Balles2601, Prolactino, MrCharro, Joyaso123, Andy
XD 1804 y Annimos: 191
Estimacin estadstica Fuente: http://es.wikipedia.org/wiki/Estimaci%C3%B3n%20estad%C3%ADstica?oldid=82196404 Colabora-
dores: 4lex, Tartaglia, Elwikipedista, Tano4595, Superzerocool, Chobot, .Sergio, Mortadelo2005, Er Komandante, Lmendo, CEM-bot,
F.A.A, Arcibel, Gusgus, Mmmarquez, Plux, VolkovBot, Technopat, Matdrodes, Galatei, Tirithel, StarBOT, Eduardosalg, Leonpolanco,
Juan Mayordomo, Camilo, AVBOT, Ellinik, David0811, LucienBOT, MarcoAurelio, Diegusjaimes, Arjuno3, Eva R M, Jkbw, Dreitmen,
EeX2, Botarel, Alph Bot, Chrisyagami, ZroBot, Grillitus, Jcaraballo, Acratta, Legobot, JacobRodrigues y Annimos: 93
Estimador Fuente: http://es.wikipedia.org/wiki/Estimador?oldid=76554267 Colaboradores: Julian Colina, Yrbot, Chlewbot, Fenicio,
Gcddcf, Cgb, TXiKiBoT, Ignacioerrico, Drever, Muro Bot, Galatei, Juan Mayordomo, Diegusjaimes, Luckas-bot, Hatorresmantilla,
Evaromero, ArthurBot, SuperBraulio13, Xqbot, Marsal20, PatruBOT, Angelito7, Humbefa, MerlIwBot, Addbot, Bullboy~eswiki y An-
nimos: 23
Error cuadrtico medio Fuente: http://es.wikipedia.org/wiki/Error%20cuadr%C3%A1tico%20medio?oldid=80653734 Colaboradores:
Ivanpares, Invadibot, VictorPines y Annimos: 1
Tamao de la muestra Fuente: http://es.wikipedia.org/wiki/Tama%C3%B1o%20de%20la%20muestra?oldid=79366448 Colaborado-
res: Zuirdj, Joseaperez, Sabbut, Pabloes, SpeedyGonzalez, ManuelGR, Tartaglia, Dianai, Niqueco, Richy, FAR, Airunp, CarlosHoyos,
Platonides, Yrbot, Amads, Vitamine, Aiax, Chlewbot, Gizmo II, CEM-bot, Laura Fiorucci, Pinar~eswiki, Abelgrc, FrancoGG, Gge-
nellina, Aeris17, Dianayopli, Idioma-bot, BL, Technopat, Muro Bot, Ctrl Z, Belb, Jarisleif, HUB, Antn Francho, Eduardosalg, Juan
Mayordomo, SilvonenBot, UA31, AVBOT, Diegusjaimes, Polo162, ArthurBot, Xqbot, Hspitia, RedBot, H4x0r, Humbefa, Africanus,
Ricardo M.M. vlc, Grillitus, Mgsmariosuarez, Xos Antonio, Johnbot, LlamaAl, Elvisor, Addbot, Ted00PSS, Jarould y Annimos: 104

7.3.2 Images
Archivo:Commons-emblem-issue.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/b/bc/Commons-emblem-issue.svg Li-
cencia: GPL Colaboradores: File:Gnome-emblem-important.svg Artista original: GNOME icon artists and User:ViperSnake151
Archivo:Commons-emblem-question_book_orange.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/1/1f/Commons-emblem-question_
book_orange.svg Licencia: CC BY-SA 3.0 Colaboradores: <a href='//commons.wikimedia.org/wiki/File:Commons-emblem-issue.svg'
class='image'><img alt='Commons-emblem-issue.svg' src='//upload.wikimedia.org/wikipedia/commons/thumb/b/bc/Commons-emblem-issue.
svg/25px-Commons-emblem-issue.svg.png' width='25' height='25' srcset='//upload.wikimedia.org/wikipedia/commons/thumb/b/bc/Commons-emblem-issue.
svg/38px-Commons-emblem-issue.svg.png 1.5x, //upload.wikimedia.org/wikipedia/commons/thumb/b/bc/Commons-emblem-issue.svg/
50px-Commons-emblem-issue.svg.png 2x' data-le-width='48' data-le-height='48' /></a> + <a href='//commons.wikimedia.org/wiki/
File:Question_book.svg' class='image'><img alt='Question book.svg' src='//upload.wikimedia.org/wikipedia/commons/thumb/9/97/Question_
book.svg/25px-Question_book.svg.png' width='25' height='20' srcset='//upload.wikimedia.org/wikipedia/commons/thumb/9/97/Question_
book.svg/38px-Question_book.svg.png 1.5x, //upload.wikimedia.org/wikipedia/commons/thumb/9/97/Question_book.svg/50px-Question_
book.svg.png 2x' data-le-width='252' data-le-height='199' /></a> Artista original: GNOME icon artists, Jorge 2701
Archivo:Commons-emblem-question_book_yellow.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/d/dd/Commons-emblem-question_
book_yellow.svg Licencia: CC BY-SA 3.0 Colaboradores: <a href='//commons.wikimedia.org/wiki/File:Commons-emblem-query.svg'
class='image'><img alt='Commons-emblem-query.svg' src='//upload.wikimedia.org/wikipedia/commons/thumb/c/c5/Commons-emblem-query.
24 CAPTULO 7. TAMAO DE LA MUESTRA

svg/25px-Commons-emblem-query.svg.png' width='25' height='25' srcset='//upload.wikimedia.org/wikipedia/commons/thumb/c/c5/Commons-emblem-query


svg/38px-Commons-emblem-query.svg.png 1.5x, //upload.wikimedia.org/wikipedia/commons/thumb/c/c5/Commons-emblem-query.
svg/50px-Commons-emblem-query.svg.png 2x' data-le-width='48' data-le-height='48' /></a> + <a href='//commons.wikimedia.org/
wiki/File:Question_book.svg' class='image'><img alt='Question book.svg' src='//upload.wikimedia.org/wikipedia/commons/thumb/9/97/
Question_book.svg/25px-Question_book.svg.png' width='25' height='20' srcset='//upload.wikimedia.org/wikipedia/commons/thumb/9/
97/Question_book.svg/38px-Question_book.svg.png 1.5x, //upload.wikimedia.org/wikipedia/commons/thumb/9/97/Question_book.svg/
50px-Question_book.svg.png 2x' data-le-width='252' data-le-height='199' /></a> Artista original: GNOME icon artists, Linfocito B
Archivo:Nuvola_apps_edu_mathematics-p.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/c/c2/Nuvola_apps_edu_mathematics-p.
svg Licencia: GPL Colaboradores: Derivative of Image:Nuvola apps edu mathematics.png created by self Artista original: David Vignoni
(original icon); Flamurai (SVG convertion)

7.3.3 Content license


Creative Commons Attribution-Share Alike 3.0