Sie sind auf Seite 1von 23

REPÚBLICA BOLIVARIANA DE VENZUELA

MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN UNIVERSITARIA


ESCUELA NACIONAL DE ADMINISTRACION Y HACIENDA PÚBLICA-IUT
UNIDAD CURRICULAR: ESTADÍSTICA II (INTENSIVO)
SECCIÓN «K»

PROFEROR: INTEGRANTES:
EDUARDO BOCARRUIDO NERIS LÓPEZ, C.I: 20.549.940
WINYERLIN PIÑANGO, C.I:
El muestreo es el proceso de seleccionar un conjunto de
individuos de una población con el fin de estudiarlos y poder
caracterizar el total de la población.

Imagina que queremos saber algo de un universo o población,


por ejemplo, qué porcentaje de los habitantes de México fuma
habitualmente. Una forma de obtener este dato sería contactar con
todos los habitantes de México (122 millones de personas) y
preguntarles si fuman. La otra forma sería seleccionar un subconjunto
de individuos (por ejemplo, 1.000 personas), preguntarles si fuman y
usar esta información como una aproximación de la información
buscada. Pues bien, este grupo de 1.000 personas que me permiten
conocer mejor cómo se comportan el total de mexicanos es una
muestra, y la forma en que los seleccionamos es el muestreo.
En la definición anterior hemos introducido dos términos
fundamentales a lo largo de esta serie de posts:

• Universo o población: Es el total de individuos que deseo estudiar o


caracterizar. En el ejemplo anterior es la población de México, pero
podemos pensar en todo tipo de universos, más generales y más
concretos. Por ejemplo, si quiero saber cuánto fuman de media los
fumadores de México, el universo en este caso serían "los fumadores
de México".

• Muestra: Es el conjunto de individuos del universo que selecciono


para estudiarlos, por ejemplo a través de una encuesta.
El muestreo es útil gracias a que podemos acompañarlo de un
proceso inverso, que llamamos generalización. Es decir, para conocer
un universo lo que hacemos es:

1) Extraer una muestra del mismo.


2) Medir un dato u opinión.
3) Proyectar en el universo el resultado observado en la muestra.

Esta proyección o extrapolación recibe el nombre de


generalización de resultados.
EJEMPLO

La generalización de resultados añade cierto error al mismo. Imagina


que tomamos una muestra al azar de 1.000 personas de México y les
preguntamos si fuman. Obtengo que el 25% de la muestra fuma. La simple
lógica nos dice que si de 1.000 mexicanos elegidos al azar el 25% fuma, este
dato debería ser indicativo de lo que obtendríamos si preguntásemos a los 122
millones de mexicanos. Ahora bien, el azar podría haber hecho que haya
escogido para mi muestra más fumadores de lo que correspondería a la
proporción exacta que hay en el universo o, por el contrario, que en mi muestra
los fumadores estén algo infra-representados. El azar podría hacer que el
porcentaje de fumadores en la población fuese algo diferente del 25% que
hemos observado en la muestra (tal vez un 25,2%, por ejemplo). Por lo tanto, la
generalización de resultados de un muestra a un universo conlleva aceptar que
cometemos cierto error, tal y como ilustra el siguiente esquema.
Afortunadamente, el error cometido al generalizar resultados
puede acotarse gracias a la estadística. Para ello se pueden usar dos
parámetros: el margen de error, que es la máxima diferencia que
esperamos que haya entre el dato observado en mi muestra y el dato real
en el universo, y el nivel de confianza, que es el nivel de certeza que tengo
de que realmente el dato real esté dentro del margen de error.

Por ejemplo, en nuestro caso de fumadores mexicanos, si


selecciono una muestra de 471 individuos y les pregunto si fuman, el
resultado que obtenga tendrá un margen de error máximo de +-5% con un
nivel de confianza del 97%. Esta forma de expresar los resultados es la
correcta cuando usamos muestreo.
✔ Ventajas:

• Necesitamos estudiar menos individuos, necesitamos menos recursos


(tiempo y dinero).

• La manipulación de datos es mucho más simple. Si con una muestra de


1.000 personas tengo suficiente, ¿para qué quiero analizar un fichero de
millones de registros?

✘ Inconvenientes:

• Introducimos error (controlado) en el resultado, debido a la propia


naturaleza del muestreo y a la necesidad de generalizar resultados.

• Tenemos el riesgo de introducir sesgos debido a una mala selección de


la muestra. Por ejemplo, si la forma en que seleccionamos individuos para
la muestra no es aleatoria, los resultados pueden verse seriamente
afectados.
Existen diferentes criterios de clasificación de los diferentes tipos
de muestreo, aunque en general pueden dividirse en dos grandes grupos:
métodos de muestreo probabilísticos y métodos de muestreo no
probabilísticos.

Los métodos de muestreo probabilísticos: son aquellos que se basan en el


principio de equiprobabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte
de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos
métodos de muestreo probabilísticos nos aseguran la representatividad de
la muestra extraída y son, por tanto, los más recomendables.
Dentro de los métodos de muestreo probabilísticos
encontramos los siguientes tipos:

1.- Muestreo aleatorio simple: El procedimiento empleado es el


siguiente:

1) se asigna un número a cada individuo de la población y

2) a través de algún medio mecánico (bolas dentro de una bolsa,


tablas de números aleatorios, números aleatorios generados con una
calculadora u ordenador, etc.) se eligen tantos sujetos como sea
necesario para completar el tamaño de muestra requerido. Este
procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
práctica cuando la población que estamos manejando es muy grande.
2.- Muestreo aleatorio sistemático: Este procedimiento exige, como el
anterior, numerar todos los elementos de la población, pero en lugar
de extraer n números aleatorios sólo se extrae uno. Se parte de ese
número aleatorio i, que es un número elegido al azar, y los elementos
que integran la muestra son los que ocupa los lugares i, i+k, i+2k,
i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k
el resultado de dividir el tamaño de la población entre el tamaño de la
muestra: k= N/n.

El número i que empleamos como punto de partida será un


número al azar entre 1 y k. El riesgo este tipo de muestreo está en los
casos en que se dan periodicidades en la población ya que al elegir a
los miembros de la muestra con una periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de
10 individuos en los que los 5 primeros son varones y los 5 últimos
mujeres, si empleamos un muestreo aleatorio sistemático con k=10
siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría
haber una representación de los dos sexos.
3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades
que presentan los anteriores ya que simplifican los procesos y suelen
reducir el error muestral para un tamaño dado de la muestra. Consiste
en considerar categorías típicas diferentes entre sí (estratos) que
poseen gran homogeneidad respecto a alguna característica (se puede
estratificar, por ejemplo, según la profesión, el municipio de
residencia, el sexo, el estado civil, etc.). Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de interés
estarán representados adecuadamente en la muestra. Cada estrato
funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formarán parte de la muestra. En ocasiones las
dificultades que plantean son demasiado grandes, pues exige un
conocimiento detallado de la población. (Tamaño geográfico, sexos,
edades,...).
La distribución de la muestra en función de los diferentes
estratos se denomina afijación, y puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de


elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso
(tamaño) de la población en cada estrato.
Afijación Óptima: Se tiene en cuenta la previsible dispersión de los
resultados, de modo que se considera la proporción y la desviación
típica. Tiene poca aplicación ya que no se suele conocer la desviación.

4.- Muestreo aleatorio por conglomerados: Los métodos presentados


hasta ahora están pensados para seleccionar directamente los
elementos de la población, es decir, que las unidades muéstrales son
los elementos de la población.
Los métodos de muestreo no probabilísticos: A veces, para estudios
exploratorios, el muestreo probabilístico resulta excesivamente
costoso y se acude a métodos no probabilísticos, aun siendo
conscientes de que no sirven para realizar generalizaciones
(estimaciones inferenciales sobre la población), pues no se tiene
certeza de que la muestra extraída sea representativa, ya que no todos
los sujetos de la población tienen la misma probabilidad de se
elegidos. En general se seleccionan a los sujetos siguiendo
determinados criterios procurando, en la medida de lo posible, que la
muestra sea representativa.

En algunas circunstancias los métodos estadísticos y


epidemiológicos permiten resolver los problemas de representatividad
aun en situaciones de muestreo no probabilístico, por ejemplo los
estudios de caso-control, donde los casos no son seleccionados
aleatoriamente de la población.
Entre los métodos de muestreo no probabilísticos más
utilizados en investigación encontramos:

1.- Muestreo por cuotas: También denominado en ocasiones


"accidental". Se asienta generalmente sobre la base de un buen
conocimiento de los estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la investigación.
Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél.

2.- Muestreo intencional o de conveniencia: Este tipo de muestreo se


caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusión en la muestra de grupos
supuestamente típicos.
3.- Bola de nieve: Se localiza a algunos individuos, los cuales
conducen a otros, y estos a otros, y así hasta conseguir una muestra
suficiente. Este tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.

4.- Muestreo Discrecional: A criterio del investigador los elementos


son elegidos sobre lo que él cree que pueden aportar al estudio.
El tamaño de la muestra

¿Qué tamaño de muestra necesito usar para estudiar cierto universo?


Depende del tamaño del universo y del nivel de error que esté dispuesto a aceptar,
Cuanta más precisión exija, mayor muestra necesito. Si quiero tener una certeza
absoluta en mi resultado, hasta el último decimal, mi muestra tendrá que ser tan
grande como mi universo.

Pero el tamaño de la muestra tiene una propiedad fundamental que explica


porqué el muestreo se usa tanto en tantos ámbitos del conocimiento. Esta propiedad
podría resumirse como sigue: a medida que estudio universos mayores, el tamaño de
muestra que necesito cada vez representa un porcentaje menor de dicho universo.

Supongamos que queremos hacer una encuesta para saber un porcentaje


(podría ser el de gente que fuma) con un nivel de error determinado, por ejemplo un
margen de error del 5% y una confianza del 95%. Si el universo a estudiar fuese de
tan sólo 100 personas, mi muestra tendría que ser de 79,5 individuos (es decir,
79,5% del universo, lo que representa un parte muy importante del total del
universo). Si el universo fuese de 1.000 personas, mi muestra debería ser de 277,7
personas (27,7% del universo). Y si mi universo fuese de 100.000 personas, la
muestra necesaria sería de 382,7 personas (3,83% del universo).
Por lo tanto, a medida que trabajo con universos más grandes, la
muestra que necesito debe ir creciendo pero de forma no proporcional, tiende a
estancarse y cada vez representa un porcentaje más pequeño del universo. De
hecho, a partir de cierto tamaño de universo (en torno a 100.000 individuos), el
tamaño de la muestra ya no necesita crecer más. La siguiente tabla nos muestra
algunos ejemplos:
Universo Muestra necesaria %
Tamaño de muestra
necesaria para tener un 10 10 100%

error del 5% con un nivel 100 80 80%

de confianza del 95% 1.000 278 27,8%

10.000 370 3,7%

100.000 383 0,38%

1.000.000 384 0,038%

10.000.000 385 0,004%

100.000.000 385 0,0004%


Los datos anteriores nos dicen que por grande que sea el
universo, con 385 personas puedo estudiar cualquier dato con el
mismo nivel de error (margen de 5%, confianza de 95%). Por esta razón
el muestreo es tan poderoso: nos permite hacer afirmaciones
altamente precisas de una gran cantidad de individuos a través de un
parte muy pequeña de los mismo.

Como contrapartida, el ejemplo anterior ilustra que el muestreo


no funciona bien en universos pequeños. Si tengo una clase de 10
alumnos, la opinión de cada uno de ellos es fundamental para conocer
la opinión global, no puedo prescindir de ninguno. Si no quiero
superar el error que nos hemos propuesto, en un universo de 10
individuos necesito encuestar a todos ellos.
¿Te preguntas cómo se calcula el tamaño de la muestra? Si deseas
hacer el cálculo por tu cuenta, usa la siguiente fórmula:

Tamaño de la muestra =

N = tamaño de la población
e = margen de error (porcentaje expresado con decimales)
z = puntuación z

La puntuación z es la cantidad de desviaciones estándar que


una proporción determinada se aleja de la media. Para encontrar la
puntuación z adecuada, consulta la tabla a continuación:
Ejemplo de cálculo:
NIVEL DE CONFIANZA DESEADO PUNTUACIÓN Z

80 % 1.28

85 % 1.44

90 % 1.65

95 % 1.96

99 % 2.58

Cosas que debes tener en cuenta a la hora de calcular el tamaño de tu muestra:

• Si deseas un margen de error más pequeño, debes tener un tamaño de muestra más
grande para la misma población.
• Cuanto más alto desees que sea el nivel de confianza, más grande tendrá que ser el
tamaño de la muestra.
A partir de la fórmula para el intervalo de confianza

Podemos determinar el tamaño muestral necesario con el fin de


que la precisión de la estimación sea la deseada con antelación. La
fórmula que resulta es

Donde d es el radio máximo deseado para el intervalo y zα/2


tiene el significado habitual. Nótese que no hemos tenido en cuenta el
último término de la primera expresión.
La aplicación efectiva de la fórmula obtenida requiere el
conocimiento de p y de q = (1 − p), valores que nos son desconocidos en
la práctica. Para solventar este problema tenemos dos alternativas:

• Considerar el caso más desfavorable posible, es decir, aquel que


verifique que p • q da el valor máximo posible. Es fácil verificar que esto
sucede si p = 0,5. En este caso el producto es p • q = 0,25.

• Utilizar un valor de referencia obtenido a partir de una muestra piloto o


a partir de datos bibliográficos y utilizar el valor compatible con la
información más cercano a p = 0,5.

A partir de la fórmula puede comprobarse que el tamaño muestral


requerido, una vez fijada p, crece al incrementarse la confianza del
intervalo y crece también al incrementarse la precisión (al disminuir el
radio).
Con el programa siguiente podemos calcular los tamaños
muéstrales necesarios para conseguir una precisión determinada bajo
diferentes supuestos.

Das könnte Ihnen auch gefallen