Sie sind auf Seite 1von 27

Estadística

• Capítulo: Muestreo y estimación


• Objetivo: Establecer conclusiones
en la población estimando
parámetros a partir de una muestra
representativa
Estadística
Agenda
Muestreo
• Tipos de muestreo, aleatorio simple, estratificado, sistemático,
conglomerado
• Calculo de n, conociendo y desconociendo N
La estimación de parámetros.
• Estimación puntual
• Estimación por intervalos
Estimación por intervalos bajo normalidad.
• Con una muestra
• Con dos muestras
Muestreo
Una muestra es representativa cuando se tienen en cuenta dos
aspecto, el tipo de muestreo y el número de elementos que
conformaran la muestra (n).
Tipos de muestreo
• Aleatorio simple,
• Estratificado,
• Sistemático,
• Conglomerado.
Muestreo aleatorio simple
Muestreo estratificado
Muestreo Sistemático
Se enumeran todas las unidades elementales,
El punto de partida se establece seleccionando un numero
aleatorio entre 1 y k
Conglomerado
Cuando es imposible o poco
práctico crear un marco de
muestreo de una población
objetivo debido a que está
muy dispersa
geográficamente y el costo de
la recopilación de datos es
relativamente alto.
Cálculo de n
• Cuando se desconoce el total de la población (N)

• Cuando se conoce el total de la población (N)

N = tamaño de la población
z = nivel de confianza
p = probabilidad de éxito, o proporción esperada
q = probabilidad de fracaso
e = precisión (Error máximo admisible en términos de proporción).
Ejercicios de aplicación
• ¿A cuántas familias tendríamos que estudiar para conocer la preferencia del
mercado en cuanto a las marcas de electrodomésticos, si se desconoce la
población total?
• ¿A cuántas familias tendríamos que estudiar para conocer la preferencia del
mercado en cuanto a las marcas de electrodomésticos, si se conoce que el
número de familias en el sector de interés es de 15.000?
Para ambos casos
Seguridad = 95%;
Precisión = 3%;

Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviese


ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza
el tamaño muestral.
Comandos en R
Cuando se desconoce N Cuando se conoce N

nmuestra=function(Confianza,p,e){ nmuestraN=function(Confianza,p,e,N){
alfa=(1-Confianza) alfa=(1-Confianza)
z=qnorm(Confianza+alfa/2) z=qnorm(Confianza+alfa/2)
q=1-p q=1-p
n0=z^2*p*q/e^2 n0=z^2*p*q/e^2
return(round(n0)) n1=n0/(1+(n0-1)/N)
} return(round(n1))
}
nmuestra(0.95,0.5,0.03) nmuestraN(0.95,0.5,0.03,10000)
nmuestra(0.95,0.5,0.05) nmuestraN(0.95,0.12,0.05,2500)
nmuestraN(0.99,0.5,0.09,500)
Estimación de parámetros
La inferencia estadística busca encontrar los valores que parametrizan a la
distribución desconocida de los datos.

El enfoque propuesto por Pearson, afirmaba que si era posible observa a la variable
de interés en todos y cada uno de los individuos de una población, entonces era
posible calcular los parámetros de la distribución de la variable de interés; por otro
lado, si solo se tenia acceso a una muestra representativa, entonces era posible
calcular una estimación de tales parámetros.

Fisher discrepó de tales argumentos, asumiendo que las observaciones están


sujetas a un error de medición y por lo tanto, así se tuviese acceso a
toda la población, es imposible calcular los parámetros de la distribución de la
variable de interés.
Estimación de parámetros
Consiste en calcular una estimación de uno mas parámetros desconocidos de
una o varias poblaciones por medio datos observados.

Aquí los parámetros se consideran cantidades fijas y constantes.


Tipos de Estimación La estimación puede ser:

a) Puntual: Considera un número.

b) Por intervalo: Considera un intervalo de valores en el que con un nivel de


confianza se encuentra el valor del parámetro.
Estimación puntual
• La estimación del parámetro ө es un número.
Algunos estadísticos que estiman parámetros:
Estimación por intervalos
Una estimación puntual no nos indica que tan próxima está la
estimación del parámetro que se estima, por tanto no es muy
significativa, sino se tiene alguna medida del error que se
comete en la estimación. Es conveniente tener cierto grado de
confianza de que la estimación puntual se halle dentro de cierta
variación.
Esto se logra mediante un intervalo de confianza.
Principales intervalos de confianza
• Para una media poblacional (μ).
• Para una variancia poblacional (σ2 ).
• Para una proporción poblacional (π).
• Para la razón de dos variancias poblacionales σ1 2 /σ2 2
• Para diferencia de medias poblacionales (μ1 - μ2 ).
• Para diferencia de proporciones poblacionales
(π1 - π2 ).
• Para muestras pareadas (μ𝑑 ).
Algunas consideraciones
Unilateral Superior Bilateral Unilateral Inferior
I= [-∞;T] I= [T1;T2] I= [T; ∞]
Ejemplo: T1: Es el límite inferior de Ejemplo:
confianza.
En un estudio de emisión de gas T2: Es el límite superior de Estudio de la vida útil de algún tipo
dióxido de carbono en un cierto confianza. de motor; entre más larga sea la
modelo de auto, estamos interesados vida útil, mejor es el motor. Por lo
en saber cuánto dióxido de carbono tanto, en un estudio de inferencia,
produce el auto puesto en estaríamos interesados en conocer
funcionamiento en un determinado cuál es la vida mínima del motor,
periodo de tiempo, y no es de interés más no la vida útil máxima y
saber cuál es el límite inferior , pues estaríamos interesados en hallar el
dadas las consideraciones ecológicas, límite inferior.
entre menos dióxido de carbono mejor.
Algunas consideraciones
Interpretación frecuencial
Si con los datos de una muestra aleatoria de tamaño n se construyó el intervalo a< ө <b
con grado de confianza, por ejemplo, 98% para el parámetro ө , entonces si se seleccionan
repetidamente 100 muestras de tamaño n, se tendrá 100 intervalos semejantes al intervalo
[a,b], y se confía que 98 de estos 100 intervalos contengan al parámetro ө.

Aspectos importantes en un intervalo


Los aspectos mas importantes que determinan la calidad de un intervalo son el nivel de
confianza y la longitud del intervalo (T1-T2 solo para el caso bilateral).
Se espera que la probabilidad de cobertura sea alta (entre 90% y 99%) y
que la longitud del intervalo no sea muy grande.
Cuando la longitud del intervalo es pequeña, el nivel de confianza es bajo y cuando el nivel
de confianza es alto, la longitud es grande.
𝟐
Para la media μ , σ
Para la proporción poblacional π
Ejemplos de aplicación
• Se ha obtenido una muestra de 25 alumnos de una Facultad para
estimar la calificación media de los expedientes de los alumnos en la
Facultad. Se sabe por otros cursos que la desviación típica de las
puntuaciones en dicha Facultad es de 2.01 puntos. La media de la
muestra fue de 4.9.
1. Intervalo de confianza al 90 %.
2. Intervalo de confianza al 99 %
R(4.24;5.56)
R(3.86;5.94)
Ejemplos de aplicación
Se ha obtenido una muestra de 15 vendedores de una Editorial para estimar
el valor medio de las ventas por trabajador en la Empresa.
La media y varianza de la muestra ( en miles de euros ) son 5 y 2,
respectivamente.
• Intervalo de confianza para la venta media por trabajador en la Editorial al
90%.
• Intervalo de confianza para la varianza de las ventas por trabajador en
la Editorial al 90%

R(4.334; 5.666)
R(1.27; 4.58)
Ejemplos de aplicación
Se ha obtenido una muestra al azar de 150 vendedores de una Editorial
para estimar la proporción de vendedores en la Editorial que no alcanza un
límite de ventas mínimo establecido por la dirección.
De entre los seleccionados, 50 no han conseguido llegar al límite de ventas
mínimo establecido.
• Intervalo de confianza para la proporción de trabajadores en la Editorial
que no alcanza el límite al 80 %.
• Intervalo de confianza para la proporción de trabajadores en la Editorial
que no alcanza el límite al 99 %.
• Interprete los intervalos obtenidos.
R(0.28; 0.38)
Comandos en R
IC

#inferencia
poblacion<-rnorm(1000,47,6)
n=97
x<-runif(1000)
indices<-sample(1:length(poblacion),size=n,replace=FALSE)
plot(1:length(poblacion),poblacion)
muestra<-poblacion[indices]
points(indices,muestra,col="blue")
hist(muestra)
hist(poblacion)
hist(poblacion, freq=FALSE)
curve(dnorm(x,47,6),add=TRUE)
abline(h = 0, v = mean(poblacion), col = "blue")
mean(poblacion)
mean(muestra)
#distribución t, grados de libertad n-1
t<-qt(0.975,n-1)
mx<-mean(muestra)
li<-mx-t*sd(muestra)/sqrt(length(muestra))
ls<-mx+t*sd(muestra)/sqrt(length(muestra))
c(li,ls)
mean(poblacion)
abline(h = 0, v = li, col = "red")
abline(h = 0, v = ls, col = "red")
Comandos en R
Comandos en R
μ π
int.conf <- function(x, ic = 95) { int.conf.p <- function(x, cat, ic = 95){
y <- na.omit(x) vcat <- na.omit(x)
Media <- mean(y) p <- mean(ifelse(vcat==cat, 1, 0))
Desv.Est <- sd(y) n <- length(vcat)
N <- length(y) error.est.p <- sqrt((p*(1-p))/n)
Error.Est <- Desv.Est/sqrt(N) beta <- 1-(((100-ic)/100)/2)
ci.y <- 1-(((100-ic)/100)/2) error <- error.est.p * qt(beta, df = n-1)
Error <- Error.Est * qt(ci.y, df = N-1) lim.inf.p <- p - error
Lim.Inf <- Media - Error lim.sup.p <- p + error
Lim.Sup <- Media + Error result.p <- data.frame(p, n, error.est.p, error,
result <- data.frame(Media, Desv.Est, N, lim.inf.p, lim.sup.p)
Error.Est, Error, Lim.Inf, Lim.Sup) return(result.p)
return(result) }
}
int.conf(genero$p19ar) int.conf.p(genero$P32, "Hago …")
int.conf(genero$p19ar, ic=99) int.conf.p(genero$P32, "Hago ..", ic=99
int.conf(genero$p19ar, ic=90) int.conf.p(genero$P32, "Hago..", ic=90
Gracias

Das könnte Ihnen auch gefallen