Sie sind auf Seite 1von 22

MÓDULO II:

«TEORIA DEL MUESTREO Y


ESTIMACIONES»

1
ÍNDICE

MÓDULO II: TEORIA DEL MUESTREO Y ESTIMACIONES Pág.

I. TEORÍA DEL MUESTREO, TIPOS DE MUESTREO;


ESTRATIFICADO, SISTEMÁTICO Y CONGLOMERADO,
USOS Y APLICACIONES EN LOS DIVERSOS CAMPO
DEL CONOCIMIENTO ECONÓMICO Y SOCIAL. 2
II. TAMAÑO DE MUESTRA PARA SER APLICADO EN
ESTADÍSTICAS PARAMÉTRICAS Y NO
PARAMÉTRICAS 9
III. ESTIMACIÓN PUNTUAL Y POR INTERVALOS EN
VARIABLES CUANTITATIVAS. ESTIMACIÓN PARA LA
MEDIA POBLACIONAL. ESTIMACIÓN PARA LA
DIFERENCIA DE MEDIAS 11
IV. ESTIMACIÓN PUNTUAL Y POR INTERVALOS EN
VARIABLES CUALITATIVAS. ESTIMACIONES PARA
LA PROPORCIÓN DE LA POBLACIÓN. ESTIMACIONES
PARA LA DIFERENCIA DE PROPORCIONES 18

2
MÓDULO II
TEORIA DEL MUESTREO Y ESTIMACIONES

I. Teoría del Muestreo.


El muestreo es una herramienta de la investigación científica, cuya función básica es
determinar que parte de una población debe examinarse, con la finalidad de hacer
inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que se
reproduzca de la mejor manera los rasgos esenciales de dicha población que son
importantes para la investigación. Para que una muestra sea representativa, y por lo tanto
útil, debe de reflejar las similitudes y diferencias encontradas en la población, es decir
ejemplificar las características de ésta.

Los problemas más corrientes que se presentan en la práctica, cuando se procede a


investigar las características de una población estadística es la imposibilidad de estudiar
a cada uno de los individuos u objetos que la conforman; por ello debemos depender de
un subconjunto o parte de la población como base para llegar a hipótesis relacionadas a
varias características o parámetros de ella. Por lo tanto, en estos casos resulta más
conveniente por razones de economía, tiempo y eficiencia analizar una muestra que es
un número determinado de individuos u objetos de la población y suponer que se pueden
ver en ellos con cierto grado de confianza lo que se quiere conocer acerca del universo
de donde provienen.

El estudio de estos aspectos recae sobre la estadística inductiva o inferencial cuya


finalidad es obtener conocimientos sobre algún conjunto extenso de datos, a partir de
muestras de los mismos, que permitan la inferencia de los resultados estadísticos, los
cuales representan cálculos aritméticos realizados sobre los valores obtenidos de la
muestra de la población que ha sido seleccionada rigurosamente.

Para que estos datos estadísticos sean de utilidad tienen que presentar dos
características básicas:

 Deben ser pertinentes; es decir, deben guardar una relación con el tema a investigar.
 Deben ser in sesgado; es decir no deben tener deformaciones o errores provenientes
de los instrumentos empleados en la recolección de los datos.

3
Para que una muestra sea aceptable desde el punto de vista del análisis estadístico
deberá reunir las siguientes características:
 Deberá seleccionarse de manera que sea representativa de la población de la cual
se obtuvo.
 La muestra además de permitir obtener estimaciones de características de la
población (totales, promedios, porcentajes, entre otros) deberá proporcionar medidas de
la precisión de dichas estimaciones.
 La muestra debe ser bastante reducida para evitar gastos innecesarios y lo bastante
amplia para que el error de muestreo sea admisible y además debe reunir las exigencias
de eficiencia, representatividad, seguridad y flexibilidad.

A grandes rasgos la aplicación del muestreo es aconsejable principalmente en los


siguientes casos:
 Cuando la población sea infinita o tan grande que sea imposible la enumeración
completa de cada uno de los elementos o unidades.
 Cuando la población tenga las mismas características tal que una muestra sea una
imagen aceptable de la misma población.
Con respecto a la parte técnica operacional y administrativa tenemos:
o Economía de tiempo y dinero
o Ampliación del alcance de una investigación.
o Mejor formación y control del personal que interviene en la investigación.
o Mayor control, calidad, rapidez y eficiencia en el procesamiento y publicación de los
datos.
o Permite la verificación posterior a una investigación utilizando menor personal y otros
recursos.
o Mayor confiabilidad y precisión de los datos obtenidos.

Por otra parte, la aplicación del muestreo presenta algunas limitaciones comunes entre
las cuales tenemos:
 No permite hacer cálculos, proyecciones o tabulaciones con respecto a sectores
pequeños de una población o cuando se requiere información de cada elemento de la
población, ya que las dudas serían tan importantes que no es posible tener una
acertada predicción en base de la muestra.
 El cálculo de los resultados está sujeto a los errores del muestreo en sí y de errores
ajenos al muestreo.
 Las investigaciones completas ofrecen un margen más sólido y eficiente de exactitud
que los obtenidos en base a la muestra.

4
 En base a una muestra se dificulta la tabulación cruzada de algunas características
investigadas.
 Las probabilidades de error se multiplican en las diferentes operaciones y en las
complicaciones que surjan de su propio mecanismo.
 La preparación estadístico-matemática del muestrista para el diseño eficiente de la
muestra en todas sus etapas.

1.1 Tipos de muestreo


Existen dos tipos generales para seleccionar muestras a partir de las poblaciones; el
primero es el muestreo probabilístico: son aquellos en donde la operación del muestreo
es controlada objetivamente, es decir, son muestras escogidas al azar. Después,
tenemos los muestreos no probabilísticas: son aquellos en donde la operación del
muestreo es realizado en forma subjetiva, al menos parcialmente, lo que significa que los
resultados obtenidos de la muestra pudiesen no ser representativos de la población.

a. Muestreos Probabilísticos
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,
todas las posibles muestras de tamaño n tienen la misma probabilidad de ser
seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la
representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro
de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

A. Muestras Aleatorias Simples: En este tipo de muestreo cada uno de los


individuos de la población tiene la misma posibilidad de ser elegido. El cual
puede ser con reemplazo y sin reemplazo. En este caso, para dar la seguridad
de que la muestra aleatoria no sea viciada, debe emplearse para su constitución
una tabla aleatoria o procesos electrónicos aleatorios.

Este tipo de muestreo resulta más económico que otros procedimientos


aleatorios, además asegura la equiprobabilidad de la elección, sin embargo, su
limitante radica en que no provee suficientes casos de grupos minoritarios.

Para su aplicación es necesario los siguientes pasos:

• Realizar un listado de todos los integrantes de la población y enumerar a cada


uno de ellos.

5
• Para la selección de los sujetos de la muestra utilizar una tabla de números
aleatorios o un procedimiento similar utilizando medios electrónicos.
• Administrar los instrumentos de recopilación de datos a los sujetos
seleccionados. Aquellos sujetos que por alguna razón no sean sometidos a
observación integrarán la categoría mortalidad experimental

Por ejemplo; en la UE “Guillermo Tell” ubicado en Barrancas, Municipio Cruz


Paredes, el profesor de Física quiere conocer la comprensión por parte de los
alumnos de 9no grado sección A, del tema de transformaciones y despejes
desarrollado en clase, para ello, necesita una muestra de 5 alumnos de un total
de 36, los cuales se encuentran enumerados en la carpeta de la asistencia.

 El profesor procede a buscar números al azar usando la calculadora, de


donde obtiene los siguientes resultados: 18, 5, 1, 29 y 16.

B. Muestras por Conglomerados: Consiste en sustituir las unidades físicas,


elementales o últimas a las cuales se refiere el estudio, por unidades de
muestreo que comprendan un grupo de aquellas. Por lo que es un tipo de
muestreo más económico y rápido que el aleatorio simple ya que facilita el
trabajo de los investigadores de campo. Sin embargo pueden tener cierta pérdida
de aleatoriedad en el procedimiento y disminución de la precisión de sus
resultados, en el caso que el número de conglomerados sea menor de 30. Los
pasos a seguir son los mismos que el grupo anterior (muestreo aleatorio simple).

Por ejemplo, el Jefe de la Zona Educativa – Barinas, quiere analizar, el


rendimiento en el área de Física del 9no grado en el Municipio Barinas; para ello
necesita seleccionar 50 Unidades Educativas de un total de 200.

 Entonces, se realiza un listado de todas la Unidades Educativas, donde se


imparta 9no grado; luego se utiliza los pasos del ejemplo anterior.

C. Muestras Estratificadas: Consiste en dividir la población en subpoblaciones,


dentro de cada una de las cuales se hace una selección aleatoria simple como
en los casos anteriores. Este tipo de muestreo permite una muestra más
homogénea. En este caso, encontramos la muestra estratificada proporcional la
cual consiste en distribuir la muestra proporcionalmente al número de elementos
de cada estrato y la muestra estratificada uniforme la cual reparte por igual la
muestra entre todos los estratos.

6
D. Muestras Sistemáticas: Este tipo de muestreo consiste en escoger una
unidad al azar y luego selecciona cada unidad que se encuentre a m unidades
de aquella. Esta técnica suele ser más rápida y está menos expuesta a errores
que la del muestreo aleatorio simple. Generalmente, se emplea cuando se quiere
seleccionar elementos de un estrato, en un diseño estratificado. Por ejemplo, se
desea escoger una muestra probabilística de 16 hospitales, de una lista de 160
hospitales.

Una manera de obtener una muestra es: N/n = IM; 160/16=10

Procedemos a seleccionar un número entre 1 y 10, tomamos el 3, entonces a=3


1. a = 3
2. a + 10 = 13
3. a + 2(10) = 23
4. a + 3(10) = 33
5. a + 4(10) = 43; Continuamos de la misma forma para obtener los demás
resultados.
Se incluirán en la muestra los hospitales con los números: 3, 13, 23, 33, 43, 53,
63, 73, 83, 93, 103, 113, 123, 133, 143, 153.

b. Muestreos No Probabilísticos
A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilísticos, aun siendo
conscientes de que no sirven para realizar generalizaciones (estimaciones
inferenciales sobre la población), pues no se tiene certeza de que la muestra
extraída sea representativa, ya que no todos los sujetos de la población tienen
la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos
siguiendo determinados criterios procurando, en la medida de lo posible, que la
muestra sea representativa.
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la población.
Entre los métodos de muestreo no probabilísticos más utilizados en investigación
encontramos:

7
A. Muestras a Conveniencia: Es aquella muestra seleccionada de acuerdo a la
comodidad del investigador; los elementos de este tipo de muestra son
escogidos en forma simple porque se tiene acceso a ellos. Carecen de validez
externa y confiabilidad, además presentan sesgos de muestreo por criterios
arbitrarios de selección de los sujetos (aunque el investigador no los advierta).
Por ejemplo; se desea estudiar la disciplina del Colegio “Padre José María
Veláz”; para ello el profesor Carlos toma como muestra a la sección de 8vo A,
donde el cumple funciones como profesor guía.

B. Muestras Intencionadas o Racionales: Es aquella muestra seleccionada a


través del juicio de un experto en la materia de estudio. Mediante este enfoque
los especialistas escogen lo que creen es la muestra representativa. Es rápida y
de bajo costo. No requiere entrenamiento de entrevistadores. Es muy útil para
estudios exploratorios ya que permiten la optimización de instrumentos de
observación. Además, permiten la formulación de hipótesis. Su limitación está
en que carece de validez externa y confiabilidad al intentar generalizar hacia
grupos mayores. Por ejemplo; en la EB “María Montessori” ubicada en San
Cristóbal, Estado Táchira, la psicopedagoga desea estudiar el bajo rendimiento
académico, para ello toma como muestras aquellos alumnos que presentan
dificultades de aprendizaje.

C. Muestras por Cuotas: Entre los tipos de muestreo no probabilísticos es el


más empleado. Es similar al muestreo estratificado, ya que en ambos tipos el
universo que va a estudiarse se divide en grupos o estratos y se distribuye la
muestra total entre los grupos. Es rápido y eficiente, además puede servir para
un ensayo preliminar de dicha técnica, sin embargo, el sesgo del entrevistador
para elegir los sujetos es su defecto más evidente. Por ejemplo; en la
Universidad de Los Andes – Táchira se quiere estudiar las estudiantes solteras,
con hijos o embarazadas, o estudiantes varones de pelo largo y con aros.
Entonces, cada entrevistador selecciona por su cuenta y entrevista con ayuda
de una lista (entrevista dirigida).

8
1.3 Aplicaciones:
Imaginemos que hemos de recoger una muestra de 20 estudiantes entre los 600 de la
facultad de contabilidad de la USMP.
Muestreo aleatorio simple
Elegiríamos un alumno al azar (probabilidad de elegirlo 1 600. Lo devolvemos a la
población y se elige otro (probabilidad de elegirlo 1 600), y así hasta 20. Notemos
que si no devolviésemos al alumno, entonces, la probabilidad de escoger al 2º
alumno sería 1 599, y ya no todos tendrían la misma probabilidad de ser elegidos. El
problema es que entonces permitimos que se puedan repetir individuos.

Muestreo sistemático:
Como hemos de elegir 20 alumnos de 600, es decir, 1 de cada 30, se procede así:
Se ordenan los alumnos y se numeran, se elige uno al azar, por ejemplo el alumno
27, y luego los demás se eligen a partir de este a intervalos de 30 alumnos.
Escogeríamos por tanto a los alumnos:
27,57,87,117,147,177,207,237,267,297,327,357,387,417,447,477,507,537,567,597
y el alumno 627 ya es otra vez el 27.

Muestreo estratificado: Si queremos que la muestra sea representativa, lo mejor


sería conocer cuántos alumnos de cada curso hay, es decir, si hay 200 alumnos de
3º ciclo, 150 de 4º ciclo, 150 de 1º ciclo y 100 de 2º ciclo, procederíamos:
Como de 600 en total hemos de elegir a 20, de 200 de 3º ciclo hemos de elegir x:
20 / 600 = x / 200 → x = 4000 / 600 = 6,6 ≈ 7 alumnos de 3º ciclo.
De igual manera podemos calcular los alumnos correspondientes a los demás ciclos:
20/ 600 = y / 150 → y = 3000 /600 = 5 alumnos de 4º ciclo
20/ 600 = z /150 → z = 3000 /600 = 5 alumnos de 1º ciclo
20/ 600 = t / 100 → t = 2000 /600 = 3,3 alumnos de 2º ciclo
De modo que en nuestra muestra de 20; 7 alumnos son de 3º, 5 de 4º, 5 de 1º y 3
de 2º.
Para la elección de cada alumno dentro de cada ciclo, utilizamos el muestreo
aleatorio simple.

9
Muestreo por conglomerados: Supongamos que queremos extraer una muestra
aleatoria de los estudiantes universitarios del país. Necesitaríamos una lista con
todos ellos para poder realizar algún muestreo del tipo de los 3 anteriores, lo cual es
muy difícil de conseguir. Sin embargo, los estudiantes están clasificados por
Universidades, Facultades y Clases. Podemos seleccionar en una primera etapa
alguna Universidades, después algunas facultades al azar, dentro de las facultades
algunas clases y dentro de las clases, algunos estudiantes por muestreo aleatorio
simple. Los conglomerados en cada etapa serían las diferentes Universidades, las
diferentes facultades y las diferentes clases. Como vemos los conglomerados son
unidades amplias y heterogéneas.

II. Tamaño de nuestra para Estadísticas Paramétricas y no Paramétricas.


Para determinar el tamaño de muestra se tiene en cuenta el tipo de población, es decir:

a. Si la población es homogénea se requiere pocos elementos en la muestra y si la


población es heterogénea se requiere un mayor número de elementos.

Para establecer una fórmula del tamaño de muestra se requiere saber el tipo de
parámetro que se desea estimar, es decir, si el interés es estimar una media aritmética
se requiere una fórmula específica y si se quiere estimar una proporción se considera
otra fórmula.

Fórmula de tamaño de muestra para estimar una media aritmética

n = Z² ² N
E²(N-1)+Z²²

Er = E* X
100
Donde:
N: Tamaño de la población que es objeto de estudio.
E: Error absoluto o precisión de la estimación deseada de la media.
Er = Error relativo
Z: es una desviación normal cuyo valor corresponde al grado de confianza que se
establece.

10
Es decir:
N.C.: 90% 95% 99%
Z : 1.64 1.96 2.57
²: Varianza poblacional de la población que es objeto de estudio
En la práctica, el valor de la varianza se desconoce.
Para establecer el valor a la varianza, hay que tener en cuenta las siguientes
recomendaciones:
 Recurrir a estudios similares que se han realizado y obtener el valor de la varianza
respectiva.
 Realizar un estudio piloto para estimar ².

Ejemplo
Se tiene el interés de conocer el promedio con respecto a la preferencia por
determinado producto consumido por los estudiantes de la Facultad de Contabilidad
de la USMP. (Suponemos que la población es 1800 alumnos)
El estudio queremos realizarlo mediante una muestra, para ello necesitamos calcular el
tamaño de muestra n, considerando: un grado de confianza del 95%, y los resultados
de un estudio preliminar:
_
X = 210 y s = 30; error relativo del 6%
Solución
Por definición de error relativo. Er = E*100 / X. Por consiguiente, E= Er* X /100.
Como grado de confianza 95%, nos indica que Z=1.96
E= 6*210/ 100 = 12.6; s= 30.

Reemplazando valores en la formula se tiene: n = Z² ² N


E²(N-1)+Z²²

n= (1.96)²(30)²(1800)
(12.6)²(1799) + 1.96²(30²)

Por tanto, n = 22
(Para realizar el estudio se requiere como mínimo 22 estudiantes)

11
Determinación del tamaño de muestra para estimar una proporción

n = Z² P (1 – P) N
E²(N-1) + Z²P(1-P)

N: Tamaño de la población
Z: Desviación normal
P: Proporción de unidades que poseen el atributo de interés en la población
E: Error absoluto o precisión de la estimación de la proporción.
En la práctica, el valor de la proporción P se desconoce. Para determinar dicho valor se
recurre a las siguientes recomendaciones:
 Recurrir a estudios similares que se hayan realizado y extraer el valor de P.
 En caso de no haber antecedentes, se recurre a un estudio piloto para conocer P.
En caso contrario se recurre a la máxima varianza cuando P=0.5

Ejemplo
Interés: Conocer la proporción de estudiantes que fuman cigarrillos en la Facultad de
Economía de La USMP número de estudiantes N= 1700.

El estudio se realizará mediante una muestra. Calculamos el tamaño de muestra,


considerando: Grado de confianza del 99%, por consiguiente.

Solución
Z= 2.57. De un estudio preliminar se ha determinado que la proporción de alumnos que
fuman cigarrillos es de p=0.40. El error absoluto que se toma en cuenta es de E=0.05
Reemplazando la información en fórmula, se tiene:

n = Z² P (1 – P) N
E²(N-1) + Z²P(1-P)

n = (2.57)²(0.4)(0.6)(1700)
(0.05)²(1699) + (2.57)²(0.4)(0.6)

n = 462

12
Por lo menos se requiere para ejecutar el estudio por lo menos 462 estudiantes, con un
grado de confianza del 99% y precisión del 5%.

En caso de que se desconocer el tamaño de la población N, las fórmulas quedaran


reducidas como:

 Para estimar una media aritmética,


n = Z² ²

 Para estimar una proporción,


n = Z² P (1 – P)

III. Estimación puntual.

Una estimación puntual del valor de un parámetro poblacional desconocido (como


puede ser la media µ , o la desviación estándar σ ), es un número que se utiliza para
aproximar el verdadero valor de dicho parámetro poblacional. A fin de realizar tal
estimación, tomaremos una muestra de la población y calcularemos el parámetro
muestral asociado ( x para la media, s para la desviación estándar, etc.). El valor de
este parámetro muestral será la estimación puntual del parámetro poblacional.
Propiedades de un buen estimador:
Insesgado: Un estimador es insesgado cuando la media de su distribución muestral
asociada coincide con la media de la población. Esto ocurre, por ejemplo, con el
estimador x , ya que µ x = µ y con estimador p´ ya que p µ p′ = P
De varianza mínima: La variabilidad de un estimador viene determinada por el
cuadrado de su desviación estándar. En el caso del estimador x , su desviación
estándar es
También llamada error estándar de µ .

13
En el caso del error estándar de p´,

Observar que cuanto mayor sea el tamaño de la muestra n , menor será la


variabilidad del estimador x y de p´, por tanto, mejor serán nuestras estimaciones.

Eficiencia. Otra propiedad deseable de un buen estimador es que sea eficiente. La


eficiencia se refiere al tamaño del error estándar del estadístico. Si comparamos dos
estadísticos de una muestra del mismo tamaño y tratamos de decidir cuál de ellas
es un estimador más eficiente, escogeríamos la estadística que tuviera el menor error
estándar o la menor desviación estándar de la distribución muestral. Suponga que
escogemos una muestra de un tamaño determinado y debemos decidir si utilizamos
la media de la muestra o la mediana de la muestra para estimar la media de la
población. Si calculamos el error estándar de la media de la muestra y encontramos
que es 1.05, y luego calculamos el error estándar de la mediana de la muestra y
tenemos que éste es 1.6, diríamos que la media de la muestra es un estimador más
eficiente de la media poblacional ya que su error estándar es menor. Tiene sentido
pensar que un estimador con un error estándar menor (con menos variación) tendrá
mayor oportunidad de producir una estimación más cercana al parámetro poblacional
que se está considerando.

Consistencia. Una estadística es un estimador consistente de un parámetro de


población si al aumentar el tamaño de la muestra, se tiene casi la certeza de que el
valor de la estadística se aproxima bastante al valor del parámetro poblacional. Si un
estimador es consistente, se vuelve más confiable al tener tamaños de muestra más
grandes. Si usted se pregunta acerca de la posibilidad de aumentar el tamaño de la
muestra para obtener más información sobre un pará- metro poblacional, averigüe
primero si su estadístico es un estimador consistente o no. Si no lo es, desperdiciará
tiempo y dinero al tomar muestras más grandes.

14
Suficiencia. Un estimador es suficiente si utiliza tanta información de la muestra que
ningún otro estimador puede extraer información adicional acerca del parámetro de
población que se está estimando.
Por ejemplo, supongamos que la compañía Sonytron desea estimar la edad media
de los compradores de equipos de alta fidelidad. Seleccionan una muestra de 100
compradores y calculan la media de esta muestra, este valor será un estimador
puntual de la media de la población.

Estimación puntual de la media:


La media de la muestra x es el mejor estimador de la media de la población. Es
insesgada, consistente, el estimador más eficiente y, siempre y cuando la muestra
sea suficientemente grande, su distribución muestral puede ser aproximada por
medio de la distribución normal. Si conocemos la distribución muestral de x, podemos
obtener conclusiones respecto a cualquier estimación que podamos hacer a partir de
la información muestral.
Ejemplo: Considere el caso de una compañía de suministros clínicos que produce
jeringas desechables. Cada jeringa está cubierta por una envoltura estéril que a su
vez se empaca en grandes cajas de cartón corrugado. Debido al proceso de
empaque, las cajas de cartón contienen distintas cantidades de jeringas. Como las
jeringas se venden por pieza, la compañía necesita una estimación del número de
piezas que hay por caja, para propósitos de facturación. Tomamos una muestra
aleatoria de 35 cajas y registramos el número de jeringas contenidas en cada caja.
Ver tabla,

Podemos obtener la media de la muestra, x, sumando todos los resultados, x, y


dividiendo esta suma entre n, el número de cajas muestreadas:

15
Tenemos:

= 102 jeringas
Así, al usar la media de la muestra, x como estimador, la estimación puntual de la
media de la población, es 102 jeringas por caja. El precio de fabricación de cada
jeringa hipodérmica desechable es bastante bajo (alrededor de 25 centavos), de
modo que tanto el comprador como el vendedor aceptarían esta estimación puntual
como base para la facturación, y el fabricante puede ahorrarse el tiempo y el gasto
de contar las jeringas contenidas en las cajas.

Estimación puntual de la varianza y la desviación estándar de la población:


Suponga que la administración de la compañía de suministros clínicos desea estimar
la varianza y la desviación estándar de la distribución del número de jeringas
empacadas por caja.
El estimador más utilizado para estimar la desviación estándar de la población σ, es
la desviación estándar de la muestra, s. Podemos calcular la desviación estándar de
la muestra

= 6,01

3.1 Estimación por Intervalo.


La estimación por intervalo Consiste en determinar, mediante un estimador, 2 valores
numéricos llamados límite inferior (L1) y límite superior (L2). Con un cierto grado de
confianza, se espera que estos límites contengan el valor del parámetro que se
quiere hallar. Es decir, el valor del parámetro debería encontrarse entre el límite
inferior y límite superior obtenidos de la estimación. Cabe mencionar que no todos
los intervalos obtenidos de un estimador incluirán realmente al parámetro. Es por ello
que se aplica el concepto de nivel de confianza.
Intervalo de confianza para la media 
Los valores de los límites, inferior (L1) y superior (L2), se encuentran aplicando la
fórmula general:

16
Por consiguiente, los límites del intervalo se obtienen sumando o restando el error
estándar al valor de la media muestral. Específicamente, para hallar el límite inferior
(L1) se resta el error estándar y para hallar el límite superior (L2) se suma el error
estándar.

Para explicar el uso de esta forma de estimación se resolverán los ejemplos


planteados anteriormente y otros.

Ejemplo: Se tiene interés en estimar la altura media de los alumnos de la Facultad


de Medicina de la USMP. Se recurre a una muestra aleatoria de 36 alumnos y se
obtienen los siguientes resultados:

Solución
Si no se especifica el grado de confianza, se utiliza por lo general 95%, lo cual
corresponde a z = 1.96. Conociendo los datos. Se puede aplicar la fórmula:

Por lo tanto, la estatura promedio de los estudiantes de la facultad de medicina de la


USMP está comprendida entre 163.5 y 176.5 cm, con un grado de confianza del
95%.
I.C. 95% (163.5 ; 176.5 cm)

17
Estimación para la Diferencia de Medias
Para calcular el intervalo de confianza para la diferencia de dos medias se debe
saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de
que sean desconocidas, se debe probar si son igual es o diferentes. Cada uno de
estos tres casos se analizará por separado
Si las varianzas poblacionales son conocidas y diferentes, los pasos a seguir para
encontrar el intervalo de confianza son los siguientes:
a) El estadístico usado como estimador puntual de la diferencia de medias μ1 − μ 2,
será T = x 1 − x 2 , que es un estimador suficiente
b) La variable aleatoria asociada con el estimador será la variable normal estándar
dada por:
𝑥1− 𝑋2 −(𝜇1 − 𝜇2 )
𝑧=
𝜎12 𝜎22
√ +
𝑛1 𝑛2

c) Para calcular el intervalo de confianza se debe tener en cuenta el nivel de


confianza que se quiere considerar.

Si x1 − x2 son las medias de dos muestras aleatorias independientes de tamaño


n1 y n2 tomadas de poblaciones que tienen varianzas conocidas 𝜎12 y 𝜎22
respectivamente, entonces el intervalo de confianza para μ1 − μ 2 es:

𝜎12 𝜎22
X1 - X2 ± Z √ +
𝑛1 𝑛2

Ejemplo. Construya un intervalo de confianza del 94% para la diferencia real entre
las duraciones de dos marcas de focos, si una muestra de 40 focos tomada al azar
de la primera marca dio una duración media de 418 horas, y una muestra de 50 focos

18
de otra marca dieron una duración media de 402 horas. Las desviaciones estándares
de las dos poblaciones son 26 horas y 22 horas, respectivamente.

Solución. Tenemos que:


x1 = 418 , x2 = 402 ,
σ2 1= 26, σ22 = 22,
n 1 = 40, n2= 50,
Z = 1.88

El intervalo de confianza es, entonces:

𝜎12 𝜎22
IC = X1 - X2 ± Z √ +
𝑛1 𝑛2

26 22
IC= (418 402 ) ± 1.88 √ +
40 50

IC= ( 6.3 : 25,7 )

IV. Estimación puntual y por intervalos en variables cualitativas.


Estimación puntual de la proporción de la población.
La proporción de unidades de una población dada que tiene una característica
particular se denota por p. Si conocemos la proporción de unidades de una muestra
que tiene la misma característica (denotada por pˆ, podemos utilizar esta pˆ como
estimador de p. Se puede demostrar que pˆ tiene todas las características deseables
analizadas; es insesgado (no sesgado), consistente, eficiente y suficiente.
Ejemplo del fabricante de suministros médicos, intentaremos hacer una estimación
de la proporción de la población a partir de la proporción de la muestra. Suponga que
la administración de la empresa desea estimar el número de cajas que llegarán
dañadas a su destino por mal manejo en el traslado. Podemos verificar una muestra
de 50 cajas a partir del punto de embarque hasta su arribo al punto de destino, y

19
luego registrar la presencia o ausencia de daños. En este caso, si encontramos que
la proporción de cajas dañadas en la muestra es 0.08, diríamos que:
pˆ = 0.08 ← Proporción de la muestra dañada
Y, debido a que la proporción de la muestra pˆ es un estimador conveniente de la
proporción de la población p, podemos estimar que la proporción de cajas dañadas
de toda la población será también 0.08.

Estimaciones por Intervalo para la Proporción de la población.


Intervalo de confianza para la proporción P
Los valores de los límites, inferior (L1) y superior (L2), se encuentran aplicando la
fórmula general:

Por consiguiente, los límites del intervalo se obtienen sumando o restando el error
estándar al valor de la proporción muestral (p). Específicamente, para hallar el límite
inferior (L1) se resta el error estándar y para hallar el límite superior (L2) se suma el
error estándar.

Para explicar el uso de esta forma de estimación se resolverán los ejemplos


planteados anteriormente.

Ejemplo Supóngase que en una muestra de 2000 personas se encontró que 250 son
alcohólicos. Es decir, el porcentaje de alcohólicos en la muestra es:
p=250/2000x100=12.5%.
Calcular el intervalo de confianza al 95%.

20
Por lo tanto, con un nivel de confianza de 95%, se puede afirmar que el porcentaje
de alcoholismo en la población se encuentra entre 11.05% y 13.95%.

Estimaciones por intervalo para la Diferencia de Proporciones

Los límites para el intervalo de una diferencia de proporciones correspondientes a dos


muestras independientes son:

Donde el símbolo zα/2 es el mismo valor crítico utilizado anteriormente (Z > zα/2) =
α/2, y corresponde a un intervalo de confianza 1 − α %.

Este intervalo puede utilizarse de manera alternativa al contraste de hipótesis para


decidir (con nivel de significación α %) si hay igualdad de los dos grupos. Se
decidirá por la igualdad de los grupos si el valor 0 queda incluido en cualquier
posición en el intervalo.

Aunque se haga el contraste de dos proporciones, en primer lugar, es aconsejable


obtener el intervalo de confianza de la diferencia de medias, si éste ha resultado
significativo, puesto que ayudará a interpretar si existe significación aplicada
además de la estadística.

Si se dispone de alguna información previa y sólo quiere calcularse alguno de los


dos intervalos unilaterales, bastará sustituir zα/2 por zα y descartar el límite superior
o inferior del intervalo según el caso. Por ejemplo, el intervalo unilateral derecho
corresponde a:

21
22

Das könnte Ihnen auch gefallen