Beruflich Dokumente
Kultur Dokumente
1.
El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la
poblacin total.
2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin.
3. El nivel de variabilidad que se calcula para comprobar la hiptesis.
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para
generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a
decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica
estudiar a la totalidad de los casos de la poblacin.
Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser
prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de
confianza menor. Comnmente en las investigaciones sociales se busca un 95%.
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que
sea falsa como si fuera verdadera, o la inversa: rechazar a hiptesis verdadera por considerarla
falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y
considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que
conviene correr un cierto riesgo de equivocarse.
donde:
n es el tamao de la muestra;
Z es el nivel de confianza;
p es la variabilidad positiva;
q es la variabilidad negativa;
E es la precisin o error.
Hay que tomar nota de que debido a que la variabilidad y el error se pueden expresar por
medio de porcentajes, hay que convertir todos esos valores a proporciones en el caso
necesario.
donde
n es el tamao de la muestra;
Z es el nivel de confianza;
p es la variabilidad positiva;
q es la variabilidad negativa;
N es el tamao de la poblacin;
E es la precisin o el error.
La ventaja sobre la primera frmula es que al conocer exactamente el tamao de la poblacin,
el tamao de la muestra resulta con mayor precisin y se pueden incluso ahorrarse recursos y
tiempo para la aplicacin y desarrollo de una investigacin.
Por ejemplo: En el Colegio de Bachilleres, una institucin de nivel medio superior, se desea
realizar una investigacin sobre los alumnos inscritos en primer y segundo aos, para lo cual
se aplicar un cuestionario de manera aleatoria a una muestra, pues los recursos econmicos
y el tiempo para procesar la informacin resultara insuficiente en el caso de aplicrsele a la
poblacin estudiantil completa.
En primera instancia, suponiendo que no se conoce el tamao exacto de la poblacin, pero con
la seguridad de que sta se encuentra cerca a los diez millares, se aplicar la primera frmula.
Se considerar una confianza del 95%, un porcentaje de error del 5% y la mxima variabilidad
por no existir antecedentes en la institucin sobre la investigacin y porque no se puede aplicar
una prueba previa.
Primero habr que obtener el valor de Z de tal forma que la confianza sea del 95%, es decir,
buscar un valor de Z tal que P(-Z<z<Z)=0.95. Utilizando las tablas o las funciones de Excel se
pueden obtener, o viendo (en este caso) el ejemplo anterior, resulta que Z=1.96.
De esta manera se realiza la sustitucin y se obtiene:
Con lo que se tiene una cota mnima de 370 alumnos para la muestra y as poder realizar la
investigacin sin ms costo del necesario, pero con la seguridad de que las condiciones
aceptadas para la generalizacin (confiabilidad, variabilidad y error) se mantienen.
Muestra y Censo
Aparentemente puede parecer ms conveniente inspeccionar de manera
completa todos los elementos de una poblacin que estudiar una muestra.
En la prctica es lo contrario es ms conveniente el muestreo que un censo
por las siguientes razones:
1.
La poblacin puede ser infinita en cuyo caso sera imposible efectuar un censo.
2.
Una muestra puede ser ms oportuna que un censo. Esto dado en funcin del
tiempo de obtener los resultados.
3.
Pueden incluir ensayos destructivos.
4.
El costo de efectuar un censo puede ser alto.
5.
La exactitud de los resultados puede afectarse al realizar un censo.
6.
El tipo de informacin puede depender de si se utiliza una muestra o censo.
Hay algunas situaciones en las que resulta ms ventajoso realizar un censo:
1.
Que la poblacin sea pequea y el costo no sea alto.
2.
Si el tamao de la muestra es grande en relacin al tamao de la poblacin, el
esfuerzo al realizar un censo es pequeo.
3.
Si se requiere exactitud completa, solo con el censo se logra.
4.
Ocasionalmente se dispone de la informacin completa, por lo que no es
necesario muestrear.
Muestras y Poblaciones
Un censo comprende el examen de todos los elementos de un determinado
grupo, mientras que el muestreo comprende el anlisis de una pequea parte
de ellos.
El objetivo del muestreo es establecer generalizaciones con respecto a un
grupo total de elementos sin tener que examinarlos uno por uno.
La parte del grupo de elementos que se examinan recibe el nombre de muestra, y el grupo total
de la cual se obtuvo la muestra es la poblacin.
Los elementos de una poblacin pueden ser personas, ciudades o cualquier cosa que se
pueda medir, contar o jerarquizar.
El fin del muestreo es generalizar con respecto a la poblacin fundamental, es axiomtico que
la poblacin objetivo se deba establecer de manera que se puedan hacer generalizaciones
significativas.
Las poblaciones de tamao limitado se conocen como poblaciones finitas, sin embargo las de
tamao ilimitado se conocen como poblaciones infinitas.
Las poblaciones infinitas generalmente son de cierto tipo de proceso que produce elementos o
resultados como la tirada de monedas, en el cual el nmero de resultados (caras o cruces) que
se obtienen es ilimitado.
Muestreo
El diseo de muestra o diseo de encuesta especifica el mtodo de obtencin de la muestra.
El diseo no especifica la forma de recolectar o medir los datos reales. Especifica nicamente
el mtodo de recoleccin de los objetos que contienen la informacin requerida. Estos objetos
se llaman elementos.
Un elemento es un objeto del cual se toma una medicin.
Los elementos pueden ocurrir individualmente o en grupos en la poblacin. Un grupo de
elementos, como una familia o una caja de cerillos se llama unidad de muestreo.
Las unidades de muestreo son colecciones disjuntas de elementos de la poblacin. En algunos
casos una unidad muestral esta constituida por un solo elemento.
Para seleccionar una muestra aleatoria de unidades de elementos muestrales, es necesaria
una lista de todas las unidades muestrales contenidas en la poblacin. Esta lista se le
denomina marco muestral.
Un marco muestral es una lista de unidades mustrales.
Parmetro:
Son las medidas o datos que se obtienen sobre la distribucin de probabilidades de la
poblacin, tales como la media, la varianza, la proporcin, etc.
Un parmetro es
una medida usada para describir alguna caracterstica de una poblacin, tal como una media
aritmtica, una mediana o una desviacin estndar de una poblacin.
Cuando los dos nuevos trminos de arriba son usados, por ejemplo, el proceso de estimacin
en inferencia estadstica puede ser descrito como le proceso de estimar un parmetro a partir
del estadstico correspondiente, tal como usar una media muestral (un estadstico para estimar
la media de la poblacin (un parmetro).Los smbolos usados para representar los estadsticos
y los parmetros, en ste y los siguientes captulos, son resumidos en la tabla siguiente:
Tabla 1
Smbolos para estadsticos y parmetros correspondientes
Medida Smbolo para el estadstico Smbolo para el parmetro
(muestra) (Poblacin)
Media X
Desviacin estndar s
Nmero de elementos n N
Proporcin p P
Nivel de Confianza.
Probabilidad de que la estimacin efectuada se ajuste a la realidad. Cualquier informacin que
queremos recoger est distribuida segn una ley de probabilidad (Gauss o Student), as
llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un
estadstico capte el verdadero valor del parmetro.
Varianza Poblacional.
Cuando una poblacin es ms homognea la varianza es menor y el nmero de entrevistas
necesarias para construir un modelo reducido del universo, o de la poblacin, ser ms
Distribucin en el muestreo:
Cuando el tamao de la muestra (n) es ms pequeo que el tamao de la poblacin (N), dos o
ms muestras pueden ser extradas de la misma poblacin. Un cierto estadstico puede ser
calculado para cada una de las muestras posibles extradas de la poblacin. Una distribucin
del estadstico obtenida de las muestras es llamada la distribucin en el muestreo del
estadstico.
Por ejemplo, si la muestra es de tamao 2 y la poblacin de tamao 3 (elementos A, B, C), es
posible extraer 3 muestras (AB, BC Y AC) de la poblacin. Podemos calcular la media para
cada muestra. Por lo tanto, tenemos 3 medias mustrales para las 3 muestras. Las 3 medias
mustrales forman una distribucin. La distribucin de las medias es llamada la distribucin de
las medias mustrales, o la distribucin en el muestreo de la media. De la misma manera, la
distribucin de las proporciones (o porcentajes) obtenida de todas las muestras posibles del
mismo tamao, extradas de una poblacin, es llamada la distribucin en el muestreo de la
proporcin.
Error Estndar:
La desviacin estndar de una distribucin, en el muestreo de un estadstico, es
frecuentemente llamada el error estndar del estadstico. Por ejemplo, la desviacin estndar
de las medias de todas la muestras posibles del mismo tamao, extradas de una poblacin, es
llamada el error estndar de la media. De la misma manera, la desviacin estndar de las
proporciones de todas las muestras posibles del mismo tamao, extradas de una poblacin, es
llamada el error estndar de la proporcin. La diferencia entre los trminos "desviacin
estndar" y "error de estndar" es que la primera se refiere a los valores originales, mientras
que la ltima est relacionada con valores calculados. Un estadstico es un valor calculado,
obtenido con los elementos incluidos en una muestra.
Error Muestral, de estimacin o Standard.
Es la diferencia entre un estadstico y su parmetro correspondiente. Es una medida de la
variabilidad de las estimaciones de muestras repetidas en torno al valor de la poblacin, nos da
una nocin clara de hasta dnde y con qu probabilidad una estimacin basada en una
muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre
se comete un error, pero la naturaleza de la investigacin nos indicar hasta qu medida
podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que
varan muestra a muestra). Vara segn se calcule al principio o al final. Un estadstico ser
ms preciso en cuanto y tanto su error es ms pequeo. Podramos decir que es la desviacin
de la distribucin muestral de un estadstico y su fiabilidad.
La diferencia entre el resultado obtenido de una muestra (un estadstico) y el resultado el cual
deberamos haber obtenido de la poblacin (el parmetro correspondiente) se llama el error
muestral o error de muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a
cabo la encuesta completa de la poblacin, sino que se toma una muestra para estimar las
principales ventajas de una muestra de juicio son la facilidad de obtenerla y que el costo
usualmente es bajo.
Muestreo aleatorio
Consideremos una poblacin finita, de la que deseamos extraer una muestra. Cuando el
proceso de extraccin es tal que garantiza a cada uno de los elementos de la poblacin la
misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de
seleccin muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:
Con reposicin.
Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de (N-1)/N, la
probabilidad de que sea elegido en el segundo intento es de 1/(N-1)
1/(n-i).
Si consideramos una muestra de n<N elementos, donde el orden en la eleccin de los mismos
tiene importancia, la probabilidad de eleccin de una muestra cualquiera es
sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas, tantas
veces como permutaciones en el orden de sus elementos sea posible, es decir
es
es decir,
El muestreo aleatorio con reposicin es tambin denominado muestreo aleatorio simple, que
como hemos mencionado se caracteriza por que
La inferencia estadstica establece ciertos juicios despus de examinar solamente una parte o
muestra de ello. As se prueba un pedazo de pastel para saber si ya est fro, el cocinero
prueba la sopa para saber si necesita ms sazn. El muestreo estadstico es semejante a
cada uno de los anteriores, aunque sus mtodos son ms formales y precisos y generalmente
incluyen una proporcin de la probabilidad. El muestreo y la probabilidad estn unidos
estrechamente constituyendo la Teora de la Inferencia.
Es aquel en que cada elemento de la poblacin tiene la misma probabilidad de ser
seleccionado para integrar la muestra.
Una muestra simple aleatoria es aquella en que sus elementos son seleccionados mediante el
muestreo aleatorio simple.
En la prctica no nos interesa el individuo o elemento de la poblacin seleccionado en general,
sino solo una caracterstica que mediremos u observaremos en l y cuyo valor ser el valor de
una variable aleatoria que en cada individuo o elemento de la poblacin puede tomar un valor
que ser un elemento de cierto conjunto de valores. De modo que una muestra simple
aleatoria se
puede
interpretar
como
un
conjunto
de
valores
de variables
aleatorias independientes, cada una de las cuales tiene la misma distribucin que es llamada
distribucin poblacional.
Existen dos formas de extraer una muestra de una poblacin: con reposicin y sin reposicin.
Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del
mismo tamao tiene igual probabilidad de ser seleccionada de la poblacin.
Un mtodo simple para obtener una muestra aleatoria simple es primero escribir el nombre o
un nmero codificado de cada elemento en la poblacin sobre una tarjeta. Las tarjetas son
colocadas en una caja. Una muestra entonces extrada de la caja despus de que las tarjetas
han sido perfectamente mezcladas. Por conveniencia este mtodo puede ser reemplazado por
una tabla de nmeros aleatorios, tales como los que se muestran adelante.
La tabla se construye extrayendo cada uno de los dgitos del 0 al 9 sobre una base de
igualmente probables; es decir, cada uno de los 10 dgitos tienen la misma
probabilidad (1/10) de ser seleccionados.
Los 10 dgitos son escritos en tarjetas separadas y son mezclados en una caja. Una tarjeta es
extrada y se registra el dgito que aparece en la tarjeta. Una segunda tarjeta es extrada
despus de que la primera tarjeta ha sido regresada a la caja los10 dgitos en la caja son de
nuevo mezclados perfectamente. Cuando se han registrado 5 dgitos, el siguiente dgito se
registra en un grupo separado hasta que se obtiene un gran nmero de grupos.
Obtener una muestra aleatoria simple no es una tarea fcil o prctica bajo muchas
circunstancias. Puede ser una tarea tardada o costosa y algunas veces es tericamente
imposible.
Cuando la poblacin es infinita, es obvio que la tarea de numerar cada elemento de la
poblacin es imposible.
Llamamos muestreo aleatorio simple al que se utiliza con reemplazamiento, consistente en
seleccionar n elementos de entre N que componen la poblacin, de tal forma que todas las
muestras de tamao n que se puedan formar tengan la misma probabilidad de salir elegidas y
las mismas sean independientes, en el caso de que N sea grande no es preocupante que se
haga sin reemplazamiento, ya que por ejemplo 1/N no difiere mucho de 1/N-1. Esta
probabilidad es: p =n/N
En la prctica equivale a numerar la poblacin objeto de estudio, sacando al azar cada uno de
los nmeros que van a formar la muestra y aunque en la prctica, a pesar de ser el muestro
con reemplazamiento, si el elemento (caso de que sea un individuo para hacer un test u otro
caso similar) pueda volver a ser elegido este se desprecia ya que no tiene sentido entrevistar al
mismo en ms de una ocasin y es por este consenso que se tiende a confundir y expresar
que el muestreo aleatorio simple tiene como condicin que se hace sin reemplazamiento.
Para llevar a cabo esta labor varios procedimientos como el del bombo, consistente en
introducir tantas bolas como elementos tenga la poblacin en un bombo y elegir tantas bolas
como elementos tenga la muestra.
Este procedimiento adems de ser muy laborioso puede inducir a error debido a defectos de
las bolas, al bombo o a cualquier otro factor, por lo que es preciso sustituirlo por otro mucho
ms aleatorio.
El procedimiento ms utilizado es el de las tablas de nmeros aleatorios que consiste en
seleccionar en una tabla de nmeros en grupos de cuatro dgitos formando filas y columnas;
estas se encuentran en muchos libros de Estadstica sobre todo, los que tienen como captulo
La Teora del Muestreo.
Ejemplo 1.1: Dada la siguiente poblacin formada por la edad del hijo mayor de 200 ncleos
familiares de una cierta regin.
Seleccione una muestra aleatoria de tamao 10 (use la tabla de nmeros aleatorios, escoja la
tercera fila, tercera columna del segundo bloque de a 1000) numere la poblacin
horizontalmente.
48
49
50
51
50
46
47
56
47
38
53
50
47
46
48
47
48
46
46
50
42
51
51
49
47
51
48
47
42
49
46
48
50
47
48
47
51
56
45
49
45
54
61
46
48
46
46
47
50
34
46
46
51
39
53
55
52
49
47
46
33
40
52
46
44
52
44
54
41
33
48
49
52
42
42
49
47
47
38
48
44
43
44
40
44
45
49
44
43
42
49
49
48
41
51
51
52
42
40
47
37
48
45
46
50
45
47
53
43
47
44
40
46
46
45
48
47
42
47
46
52
53
47
49
46
47
49
42
43
42
43
38
52
50
44
52
44
53
43
45
41
57
47
48
52
53
40
49
40
50
45
42
44
53
57
46
62
47
50
47
45
51
43
45
39
39
41
44
35
41
54
48
51
53
54
42
48
51
37
38
42
37
52
50
45
55
51
46
38
43
53
43
42
39
46
52
53
39
51
40
Para extraer la muestra lo primero que hacemos es disponer tres columnas en las cuales la
primera se ubicaran los nmeros aleatorios, es decir los nmeros extrados de la tabla de
nmeros aleatorios; en la segunda columna pondremos
Los nmeros aleatorios rectificados que sern aquellos nmeros aleatorios menores que N
=200 y los restos de las divisiones de los nmeros aleatorios mayores que N =200 y menores
que el mayor mltiplo de N es decir 800 y en la tercera columna de encontrara los valores de la
muestra.
En la tabla de nmeros aleatorios la tercera fila, tercera columna del segundo bloque de a 1000
le corresponde al nmero 3 pero como tenemos que coger el nmero aleatorio de tres dgitos el
primer nmero aleatorio sera el 017, los dems serian, 984, 955, 130, 850, 374, 665, 910, 288,
753, 765, 691, 496, 001, hemos escogido 14 nmeros de la tabla de nmeros aleatorios debido
a que hay 4 que son mayores que 800. Veamos a continuacin como extraemos la muestra de
la poblacin:
Para el primer nmero aleatorio 017 se busca en la poblacin el valor que ocupa la posicin
017 leda la poblacin horizontalmente que seria la edad de 48 aos, el nmero aleatorio 984
no se contempla dentro del anlisis ya que es mayor que 800, al igual que el nmero 955, el
nmero 130, le corresponde la edad de 52 aos, al nmero 850 no se contempla dentro del
anlisis, el 374 como es mayor que 200 se divide por 200 y se obtiene reto 174 y este es el
nmero aleatorio rectificado correspondindole la edad de 53 aos, al nmero 665 se divide
por 200 y se obtiene resto 65 que es el nmero aleatorio rectificado correspondindole la edad
de 44 aos en la poblacin, a continuacin presentaremos la tabla de las tres columnas a la
cual nos referimos anteriormente como una va fcil y prctica para obtener la muestra
deseada.
Nmero aleatorio
Nmero aleatorio
rectificado
muestra
017
017
48
984
--
955
--
130
130
850
--
374
174
53
665
065
53
910
--
288
088
44
753
153
44
765
165
39
691
091
49
496
096
51
001
001
48
42
Nota: obsrvese que en la muestra existen edades que se repiten esto puede pasar si el
muestreo es con reemplazo si el muestreo es sin reemplazo debemos seguir buscando de la
misma manera en la tabla de nmeros aleatorios seguido del nmero 001, hasta lograr tener la
muestra con 10 valores de la poblacin no repetidos.
e.
Se selecciona el rango de salida que consiste en seleccionar una celda en la
hoja Excel que no est afectada por ninguna informacin ni hacia abajo ni a la derecha
de la misma.
Se selecciona aceptar en esta ventana y saldr el resultado deseado que sera las muestras
elegidas por el programa en la poblacin.
Muestreo con reemplazo: Es aquel en que un elemento puede ser seleccionado ms de
una vez en la muestra para ello se extrae un elemento de la poblacin se observa y se
devuelve a la poblacin, por lo que de esta forma se pueden hacer infinitas extracciones de la
poblacin aun siendo esta finita.
Muestreo sin reemplazo: No se devuelve los elementos extrados a la poblacin hasta que
no se hallan extrados todos los elementos de la poblacin que conforman la muestra.
Muestreo equiprobabilstico: Si se selecciona una muestra de tamao n de una poblacin N
unidades, cada elemento tiene una probabilidad de inclusin legal y conocida n/N.
EL
BIBLIOGRAFIA
1. http://www.hsa.es/id/investigacion/uai/uai_docs/muestreo/muestreo.htm
2. manual de la Universidad de Mlaga: Bioestadstica: Mtodos y Aplicaciones U.D.
Bioestadstica. Facultad de Medicina. Universidad de Mlaga.
3. http://academico.uno.mx/ravila/est_desc/muestra.htm
4. http://www.uaq.mx/matematicas/estadisticas/xu5.html
5. http://html.rincondelvago.com/conceptos-y-muestreo.html
6. Carrasco JL. El mtodo estadstico en la investigacin mdica. 5 ed. Madrid. Editorial
Ciencia.
7. Hulley SB, Cummings SR. Diseo de la investigacin clnica. Ed Doyma. Barcelona 1993.
8. Kelsey IL, Thompson WD, Evans A. Methods in observational epidemiology. New
York.Oxford University Press 1986.
9. Mira JJ, Gmez J, Aranaz J, Prez E. Auditoria de historias clnicas: Cul es el tamao
adecuado de la muestra? Todo Hospital 1997; octubre: 58-64.
10. STEVENSON Willian J. Estadstica para Administracin y Economa. Editorial Harla (Harper
& Row Latinoamrica) Mxico, DF. 1981.
11. SHAO stephen p. Estadstica para Economistas y Administradores de Empresas.Editorial
Herrero Hermanos Sucs.Mxico, DF. 1980.
12. Calero Vinelo, Arstides. Tcnicas de Muestreo / Arstides Calero Vinelo.- La Habana: Editorial.
Pueblo y Educacin, 1978.- 514p.
13. Metodologa de la Investigacin / M. En C. Roberto Hernndez Sampiere... et al.
Mxico:/5.n/, 1997.---505p
14. Snchez lvarez, Rafael. Estadstica Elemental 7 Rafael Snchez lvarez y Jos A. Torres
Delgado.- La Habana: Ed. Pueblo y Educacin, 1989.- 326p.
15. Taro, Yamane. Elementary Sampling Theory / Yamane Taro.- La Habana: Editorial Pueblo y
Educacin, 1989.- 405p.