Sie sind auf Seite 1von 64

Estadística Aplicada a Los Negocios

Unidad:

Estimación de intervalos de confianza y tipos de


muestreo

Docente: Fredy Vivanco Huaytara


Logro
Al término de la unidad, el estudiante utiliza los diferentes tipos
de distribuciones, modelos de estimación de parámetro puntual
y por intervalos, y los tipos de muestreo para determinar el
tamaño de la muestra en un contexto de investigación
científica.

Importancia

Es importa describir las características generales de un universo


de estudio, pero sin la necesidad de realizar el registro de datos
a todos los elementos o unidades del conjunto o población, sino
solo a una parte de esta llamada muestra, lo que permite
economizar tiempo y dinero.
Contenido general
• Estimaciones de intervalos de confianza
• Muestreo y determinación del tamaño de la muestra
Estimaciones de intervalos de confianza
• Estadística inferencial
• Estimaciones de intervalos de confianza
Estadística Inferencial

Población (N)

𝜇𝜇 Muestra (n)

𝑿𝑿
𝜎𝜎 2 𝑺𝑺𝟐𝟐
𝜋𝜋 𝒑𝒑

Estadísticos

Parámetros

Estadística Inferencial
Estadística Inferencial
̂
Estimador (𝜃𝜃 = 𝜃𝜃)
Proceso de utilizar información de una muestra (Estadísticos)
para extraer conclusiones acerca de toda la población.

𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝜇𝜇)
𝜇𝜇� = 𝑋𝑋�

Insesgado
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝜎𝜎 2 )
Consistente
2 2
𝜎𝜎� = 𝑆𝑆
Eficiente
Suficiente
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝜋𝜋)

𝜋𝜋� = 𝑃𝑃
Estadística Inferencial
La inferencia estadística comprende
1. La estimación de parámetros (Estimación puntual y por intervalos)
2. Prueba de Hipótesis

Métodos de estimación:

Estimación puntual: Estimación de intervalo:


utilización de datos de la ofrece un intervalo de valores
muestra para calcular un razonables dentro del cual se
solo número para estimar el pretende que esté el parámetro
parámetro de interés. de interés: θ(𝜇𝜇, 𝜎𝜎, 𝜋𝜋)
Estadística Inferencial

Estimación Puntual:

𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝜇𝜇)
∑𝑛𝑛𝑖𝑖=1 𝑋𝑋𝑖𝑖
𝜇𝜇̂ = 𝑋𝑋� =
𝑛𝑛
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝜎𝜎 2 )
𝑛𝑛
�𝑖𝑖=1 𝑋𝑋𝑖𝑖 − 𝑋𝑋� 2
𝜎𝜎� 2 = 𝑆𝑆 2 =
𝑛𝑛 − 1
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝜋𝜋)

𝑋𝑋 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑑𝑑𝑑𝑑 é𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥


𝜋𝜋� = 𝑃𝑃 = =
𝑛𝑛 𝑛𝑛
Estadística Inferencial
Estimación Puntual: Ejercicio
De la población de tallas de los estudiantes en La UTP año 2017, se
extrae una muestra aleatoria de 8 alumnos, cuyos valores
observados son:
1.50 1.6 1.58 1.45 1.52 1.68 1.62 1.55 .
Halle un estimador puntual para la media, la varianza y la
desviación estándar poblacionales.
Solución:
∑𝑛𝑛𝑖𝑖=1 𝑋𝑋𝑖𝑖
Media: 𝜇𝜇̂ = 𝑋𝑋� =
𝑛𝑛
1.5 + 1.6 + 1.58 + 1.45 + 1.52 + 1.68 + 1.62 + 1.55
= = 1.56 𝑚𝑚𝑚𝑚
8
8
�1 𝑋𝑋𝑖𝑖 − 𝑋𝑋� 2
Varianza 𝜎𝜎� 2 = 𝑆𝑆 2 =
𝑛𝑛 − 1
2 + 1.6 − 1.58 2 + ⋯ + 1.55 − 1.58 2
1.5 − 1.56
𝑆𝑆 2 =
8−1
= 0.0053 𝑚𝑚𝑚𝑚 2
Estadística Inferencial

Estimación Puntual:
Varianza 𝜎𝜎 2 : 𝜎𝜎� 2 = 𝑆𝑆 2 = 0.0053 𝑚𝑚𝑚𝑚 2

D𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝜎𝜎: 𝑆𝑆 = 𝑆𝑆 2

𝑆𝑆 = 0.0053 𝑚𝑚𝑚𝑚 2 = 0.728


Estadística Inferencial
Estimación por intervalo de confianza

En lugar de indicar simplemente un único valor como


estimación del parámetro poblacional θ(𝜇𝜇, 𝜎𝜎, 𝜋𝜋), lo que se hace
es calcular un intervalo de valores en el que se tiene cierta
probabilidad (confianza) de que se encuentre el verdadero
valor de θ.

Coeficiente
o grado de
𝑃𝑃(𝜃𝜃̂ − 𝜀𝜀 < 𝜃𝜃 < 𝜃𝜃̂ + 𝜀𝜀) = 1 − 𝛼𝛼 confianza

Es decir, se puede garantizar con una probabilidad de 1-𝛼𝛼 que


la muestra elegida contendrá el valor verdadero(𝜇𝜇, 𝜎𝜎, 𝜋𝜋)

𝜀𝜀: (Error Estándar= EE)


𝑆𝑆 𝑃𝑃(1 − 𝑃𝑃)
� 𝐸𝐸𝐸𝐸 =
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴(𝑋𝑋): 𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷(𝒑𝒑): 𝐸𝐸𝐸𝐸 =
𝑛𝑛 𝑛𝑛
Estadística Inferencial
Estimación por intervalo de confianza

Distribucion Muestral Media.

𝑛𝑛1

𝑥𝑥1̅

Muestra1 𝑛𝑛1

Muestra2 𝑥𝑥1̅
𝜎𝜎
𝑛𝑛1 �
𝑋𝑋~𝑁𝑁 𝜇𝜇,
Muestra3 𝑛𝑛
𝑥𝑥1̅ n>30

Muestra 5
𝑛𝑛1 Teorema Límite Central
𝑥𝑥1̅

𝑋𝑋~𝑁𝑁(𝜇𝜇, 𝜎𝜎 2 )
Estadística Inferencial
Estimación por intervalo de confianza
Intervalo de confianza para una media población (𝝁𝝁)

µ 1 − 𝛼𝛼 = 95%, 90%, 99%


𝑆𝑆
� 𝐸𝐸𝐸𝐸 =
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴(𝑋𝑋):
𝑛𝑛
Interpretación

Al calcular un intervalo de confianza


al 95%, ello quiere decir que el 95%
de las veces que repitamos el � 𝐸𝐸𝐸𝐸 =
𝑆𝑆 𝑁𝑁 − 𝑛𝑛
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴(𝑋𝑋): �
proceso de muestreo (y calculemos 𝑛𝑛 𝑁𝑁 − 1
el estadístico), el verdadero valor del
parámetro poblacional θ (𝜇𝜇, 𝜎𝜎, 𝜋𝜋)
estará dentro de tal intervalo.
Estadística Inferencial
Estimación por intervalo de confianza
Intervalo de confianza para
una media población (𝝁𝝁)

𝛼𝛼� 1 − 𝛼𝛼 𝛼𝛼�
2 2

𝑍𝑍𝛼𝛼 𝑍𝑍1−𝛼𝛼
2 2

𝑥𝑥̅ − 𝜇𝜇 Coeficiente
𝑃𝑃 −𝑍𝑍1−𝛼𝛼 ≤ ≤ 𝑍𝑍1−𝛼𝛼 = 1 − 𝛼𝛼 o grado de
2 𝜎𝜎⁄ 𝑛𝑛 2 confianza

𝜎𝜎 𝜎𝜎
𝑃𝑃 𝑥𝑥̅ − 𝑍𝑍1−𝛼𝛼 � ≤ 𝜇𝜇 ≤ 𝑥𝑥̅ + 𝑍𝑍1−𝛼𝛼 � = 1 − 𝛼𝛼
2 𝑛𝑛 2 𝑛𝑛
Estadística Inferencial

Estimación Por intervalo


Intervalo de confianza para una media población (𝝁𝝁)

𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪 𝟏𝟏: Tamaño de la muestra 𝑛𝑛 ≥ 30

̂ 𝜎𝜎 ̂ 𝜎𝜎
𝑃𝑃(
� 𝜃𝜃 − 𝜀𝜀 < 𝜃𝜃
𝐼𝐼𝐼𝐼(𝜇𝜇) = 𝑿𝑿 − 𝑍𝑍 1−𝛼𝛼 ⋅ < 𝜃𝜃 + 𝜀𝜀)�= 1 − 𝛼𝛼
≤ 𝜇𝜇 ≤ 𝑿𝑿 + 𝑍𝑍 1−𝛼𝛼 ⋅
2 𝑛𝑛 2 𝑛𝑛
𝐿𝐿𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝐿𝐿𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆

Simplificado
𝜎𝜎
IC 𝜇𝜇 = 𝑋𝑋� ± 𝑍𝑍 1−
𝛼𝛼 ⋅
2 𝑛𝑛
ó
𝑆𝑆
IC 𝜇𝜇 = 𝑋𝑋� ± 𝑍𝑍 1−
𝛼𝛼 ⋅
2 𝑛𝑛
Estadística Inferencial
Estimación Por intervalo

Intervalo de confianza para una media población (𝝁𝝁)

𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪 2: Tamaño de la muestra 𝑛𝑛 < 30

𝑆𝑆 𝑆𝑆
IC 𝜇𝜇 = 𝑋𝑋� − 𝑇𝑇 𝛼𝛼
1− ,𝑛𝑛−1
⋅ ≤ 𝜇𝜇 ≤ 𝑋𝑋� + 𝑇𝑇 𝛼𝛼
1− ,𝑛𝑛−1

2 𝑛𝑛 2 𝑛𝑛

Simplificado
𝑆𝑆
IC 𝜇𝜇 = 𝑋𝑋� ± 𝑇𝑇 𝛼𝛼
1− ,𝑛𝑛−1

2 𝑛𝑛
Estadística Inferencial
Estimación Por intervalo

Intervalo de confianza para una media población (𝝁𝝁)

Paso 1: Leer detenidamente y encontrar la variable de interés


Paso 2: Identificar el tamaño de la muestra
� 𝜎𝜎 = 𝜎𝜎� = 𝑆𝑆) y el nivel de confianza
Paso 3: Encontrar los datos (𝑛𝑛, 𝑋𝑋,
Nivel confianza 𝒁𝒁𝟏𝟏−𝜶𝜶
𝟐𝟐
90% 1.645
95% 1.96
98% 2.33
99% 2.58

Población finita
Población Infinita
� 𝐸𝐸𝐸𝐸 =
𝑆𝑆 𝑆𝑆 𝑁𝑁 − 𝑛𝑛
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴(𝑋𝑋):
𝑛𝑛
� 𝐸𝐸𝐸𝐸 =
𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴(𝑋𝑋): �
𝑛𝑛 𝑁𝑁 − 1
Estadística Inferencial
Estimación Por intervalo para media (𝝁𝝁𝟏𝟏 ): Ejercicio n>30
Para un estudio ambiental, en una ciudad se toma una muestra aleatoria de 35 casas y se calcula que el peso medio
diario de basura producida es 3.160 kg. Por censos anteriores, se sabe que cada casa produce una cantidad de
basura que tiene una desviación estandar de 0.9 kg. halle un intervalo de confianza del 95% para el peso medio
total de basura producida por las casas de Lima. Asumir normalidad de la variable de interés.

Solución:
Datos población Datos Muestra
𝑋𝑋:Peso de basura diario
𝜎𝜎 𝜎𝜎 = 0.9 𝑛𝑛 = 35
IC 𝜇𝜇 = 𝑋𝑋� ± 𝑍𝑍 𝛼𝛼 ⋅
1−
2 𝑛𝑛 𝑋𝑋� = 3.160

Reemplazando
0.9 𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
IC µ = 3.160 ± 1.96 ⋅ 𝛼𝛼 = 0.05
35 𝑍𝑍 0.05
1−
2
IC µ = 2.862 𝑘𝑘𝑘𝑘 ; 3.458 𝑘𝑘𝑘𝑘 𝑍𝑍 0.975 =1.96

Se tiene un nivel de confianza del 95% que el peso total promedio de


basura Producida en una casa durante un día esta en el intervalo
2.862 𝑘𝑘𝑘𝑘 ; 3.458 𝑘𝑘𝑘𝑘
Estadística Inferencial
Estimación Por intervalo para media (𝝁𝝁𝟏𝟏 ): Ejercicio n<30
Se hizo una investigación sobre el peso de una rara clase de tortugas en peligro de extinción en la selva del Perú. Se toma una
muestra de 20 especies, elegidos aleatoriamente, y se calculó un peso medio de 9.8525 kg y una desviación estándar de 0.0965.
Calcular un intervalo de confianza con un 95% para el verdadero peso medio de las tortugas en peligro de extinción.

Solución:
Datos población Datos Muestra
𝑋𝑋:Peso de una tortuga
𝑆𝑆 𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑛𝑛 = 20
IC 𝜇𝜇 = 𝑋𝑋� ± 𝑇𝑇 𝛼𝛼
1− ,𝑛𝑛−1
⋅ 𝑋𝑋� = 9.8525
2 𝑛𝑛
𝑆𝑆 = 0.0965
Reemplazando 𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
0.0965 𝛼𝛼 = 0.05
IC µ = 9.8525 ± 2.093 ⋅
35 𝑇𝑇 0.05
1−
2 ,𝑛𝑛−1
IC µ = 9.82 𝑘𝑘𝑘𝑘 , 9.89 𝑘𝑘𝑘𝑘 𝑇𝑇 0.975,19 =2.093

Se tiene un nivel de confianza del 95% que el verdadero peso


promedio de las tortugas en peligro de extinción se encuentra en el
intervalo 9.82 𝑘𝑘𝑘𝑘 9.89 𝑘𝑘𝑘𝑘
Estadística Inferencial
Estimación Por intervalo

Intervalo de confianza para una media población (𝝁𝝁)

𝑇𝑇 0.05
1− , 𝑛𝑛−1
2
𝑇𝑇 0.975, 19 =2.093
Estadística Inferencial
Estimación Por intervalo

Intervalo de confianza para una media población (𝝁𝝁)

𝑍𝑍 0.05
1− =
2

𝑍𝑍 0.975 =1.96
Estadística Inferencial
Estimación Por intervalo para media (𝝁𝝁𝟏𝟏 ): Ejercicio n>30, población finita
Se desea estimar el peso medio de un lote de 10,000 muñecos navideños que un banco otorga a sus clientes. Para ello se
selecciona una muestra aleatoria de 41 muñecos, la cual da una media de 200 gramos. Calcule e interprete intervalos de
confianza del 95 % para el verdadero peso promedio. El proveedor de la totalidad de los muñecos estima que el peso medio tiene
una desviación estándar de 25 gramos

Solución:
Datos población Datos Muestra
𝑋𝑋:Peso de un muñeco navideño
𝑁𝑁 = 10000 𝑛𝑛 = 41
𝜎𝜎 𝑁𝑁 − 𝑛𝑛 𝜎𝜎 = 25 𝑋𝑋� = 200
IC 𝜇𝜇 = 𝑋𝑋� ± 𝑍𝑍 𝛼𝛼 ⋅
1−
2 𝑛𝑛 𝑁𝑁 − 1
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95
Reemplazando 𝛼𝛼 = 0.05

25 10000 − 41
IC µ = 200 ± 1.96 ⋅ 𝑍𝑍
41 10000 − 1 1−
0.05
2

IC µ = 192.36 𝑘𝑘𝑘𝑘 ; 267.64 𝑘𝑘𝑘𝑘 𝑍𝑍 0.975 =1.96

Se tiene un nivel de confianza del 95% que el verdadero peso


promedio de los muñecos esta en el intervalo 192.36 𝑘𝑘𝑘𝑘 ; 267.64 𝑘𝑘𝑘𝑘
Estadística Inferencial
Estimación Por intervalo

Intervalo de confianza para diferencia de medias poblacionales


(𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 )

caso 1: varianza poblacional Conocida: (muestras >30)

𝜎𝜎1 2 𝜎𝜎2 2
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = (𝑋𝑋�1 −𝑋𝑋�2 ) ± 𝑍𝑍 𝛼𝛼 +
1−
2 𝑛𝑛1 𝑛𝑛2

caso 2: varianza poblacional desconocida pero iguales σ1 2 = σ2 2

1 1
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = 𝑋𝑋�1 −𝑋𝑋�2 ±𝑇𝑇 𝛼𝛼 𝑆𝑆𝑃𝑃 2 +
1− ,𝐺𝐺𝐺𝐺
2 𝑛𝑛1 𝑛𝑛2

𝑛𝑛1 − 1 𝑆𝑆1 2 + (𝑛𝑛2 − 1)𝑆𝑆2 2


𝐺𝐺𝐺𝐺 = 𝑛𝑛1 + 𝑛𝑛2 − 2 𝑆𝑆𝑃𝑃 2 =
𝑛𝑛1 + 𝑛𝑛2 − 2
Estadística Inferencial
Estimación Por intervalo

Intervalo de confianza para diferencia de medias poblacionales


(𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 )

caso 3: varianza poblacional desconocida pero iguales 𝜎𝜎1 2 ≠ 𝜎𝜎2 2

𝑠𝑠1 2 𝑆𝑆2 2
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = (𝑋𝑋�1 −𝑋𝑋�2 ) ± 𝑇𝑇 𝛼𝛼 +
1− ,𝑔𝑔𝑔𝑔
2 𝑛𝑛1 𝑛𝑛2

2
𝑠𝑠1 2 𝑆𝑆2 2
𝑛𝑛1 + 𝑛𝑛2
gl = 2
2
2 2
𝑠𝑠1 𝑆𝑆2
𝑛𝑛1 𝑛𝑛2
𝑛𝑛1 − 1 + 𝑛𝑛2 − 1
Estadística Inferencial
Estimación Por intervalo para media(𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ): Ejercicio
En un estudio para determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma una muestra
al azar de 200 hogares de A arrojando un gasto medio de S/. 250 y una desviación estándar de 15. Una muestra
al azar de 180 hogares de la ciudad B da una gasto medio de 235 y una desviación estándar de 10.
a) Determine un intervalo de confianza del 99 % para la diferencia del gasto medio en las ciudades A y B.
b) ¿Es diferente el gasto medio mensual en arbitrios en las ciudades A y B?

Solución a: Datos población Datos Muestra



𝑋𝑋𝑋𝑋:Gasto medio mensual en arbitrios en las ciudades… No hay Datos A B
𝑛𝑛1 = 200 𝑛𝑛2 = 180
𝑆𝑆1 2 𝑆𝑆2 2 𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.99 𝑋𝑋�1 = 250 𝑋𝑋�2 = 235
� 𝟏𝟏 −𝑿𝑿
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = (𝑿𝑿 � 𝟐𝟐 ) ± 𝑍𝑍 𝛼𝛼 +
1−
2 𝑛𝑛1 𝑛𝑛2 𝛼𝛼 = 0.01 𝑆𝑆1 = 15 𝑆𝑆2 = 10

152 102
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = 𝟐𝟐𝟓𝟓𝟓𝟓 − 𝟐𝟐𝟐𝟐𝟐𝟐 ± 2.58 � +
200 180 𝑍𝑍 0.05
1−
2

11.66 ≤ 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ≤ 18.34 𝑍𝑍 0.995 =2.58

Con el 99% de confianza, la diferencia del gasto medio mensual


en arbitrios en las ciudades A y B se encuentra entre S/. 11.66 y 18.34.
Estadística Inferencial
Estimación Por intervalo

Solución b:

Responder a la pregunta ¿Es diferente el gasto medio mensual


en arbitrios en las ciudades A y B? implica responder si ¿ A ≠ B?
o también ¿A - B ≠ 0? Si apreciamos el intervalo de confianza
construido en
11.66 ≤ 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ≤ 18.34

𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 no puede ser cero, es decir, el gasto medio mensual


en arbitrios en ambas ciudades es diferente.

Si IC=(+,+), P(+ <µA - µB < +)=1-α µA > µB

Si IC=(-,-), P(- < µA - µB < - )=1-α µA < µB

Si IC=(-,+), P(- < µA - µB < +)=1-α µA = µB


Estadística Inferencial
Estimación Por intervalo para media(𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ): Ejercicio

Un alumno de la UTP en su tesis pretende comparar el


contenido de 𝐶𝐶𝐶𝐶2 que emanan 2 tipos de vehículos deportivos
nuevos (Speeddy, Correcaminos), para ello toma 10 muestras
en el primero y 8 en el segundo. En el primero encuentra un
contenido medio de 3.1 PPM y 2.7 PPM y una desviación
estandar de 0.5 y 0.7 respectivamente. Suponiendo que los
conjuntos de datos provienen de muestras tomadas al azar de
poblaciones normales con varianzas iguales, construya un
intervalo de confianza del 95% para la diferencia real de
contenido de 𝐶𝐶𝐶𝐶2 .
Estadística Inferencial
Solución a:
𝑋𝑋𝑋𝑋:contenido de 𝐶𝐶𝐶𝐶2 𝑞𝑞𝑞𝑞𝑞𝑞 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑙𝑙𝑙𝑙𝑙𝑙 2 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 Datos población Datos Muestra

𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 Speedy Correcaminos


1 1
� 𝟏𝟏 −𝑿𝑿
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = 𝑿𝑿 � 𝟐𝟐 ±𝑇𝑇 𝛼𝛼 𝑆𝑆𝑃𝑃 2 + 𝑛𝑛1 = 10 𝑛𝑛2 = 8
1− ,𝐺𝐺𝐺𝐺
2 𝑛𝑛1 𝑛𝑛2 𝑋𝑋�1 = 3.1 𝑋𝑋�2 = 2.7
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95 𝑆𝑆1 = 0.5 𝑆𝑆2 = 0.7
𝛼𝛼 = 0.05
1 1
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = 𝟑𝟑. 𝟏𝟏 − 𝟐𝟐. 𝟕𝟕 ± 2.12 � 0.355 +
10 8
𝑇𝑇 2 �10 − 1)0.52 + (8 − 1)0.72
0.05 𝑆𝑆𝑃𝑃 =
1−
2 ;𝑔𝑔𝑔𝑔 10 + 8 − 2
2
gl=10+8−2=16 𝑆𝑆𝑃𝑃 = 0.355
−0,199 ≤ 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ≤ 0.99
𝑇𝑇 0.975,16 =2.12

Con el 95% de confianza, la verdadera diferencia media del contenido de


CO2 que eman los 2 vehiculos. encuentra entre -0.199 y 0.99.
Estadística Inferencial

Estimación Por intervalo para media(𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ): Ejercicio

En un estudio para determinar si hay diferencia en el salario


semanal de los hombres y las mujeres de una gran empresa se
toma una muestra de 18 hombres encontrándose un promedio
de S/. 420 y una desviación estándar de S/. 50, mientras que en
una muestra de 15 mujeres se encontró un promedio de S/.
360 y una desviación estándar de S/. 90. Se pide encontrar el
intervalo de confianza del 95% para la diferencia de los
salarios medios de hombres y mujeres.
En dicho país se sabe que los sueldos medios semanales tienen
una variabilidad diferente.
Estadística Inferencial
Solución a:

𝑋𝑋𝑋𝑋:Salario semanal de Hombres y mujeres


Datos población Datos Muestra
𝑠𝑠1 2 𝑆𝑆2 2 𝜎𝜎1 2 ≠ 𝜎𝜎2 2 Hombres Mujeres
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = (𝑋𝑋�1 −𝑋𝑋�2 ) − 𝑇𝑇 𝛼𝛼 +
1− ,𝑔𝑔𝑔𝑔
2 𝑛𝑛1 𝑛𝑛2 𝑛𝑛1 = 18 𝑛𝑛2 = 15
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95 𝑋𝑋�1 = 420 𝑋𝑋�2 = 360
𝛼𝛼 = 0.05 𝑆𝑆1 = 50 𝑆𝑆2 = 90

502 902 𝑇𝑇 0.05


1−
IC 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 = 420 − 360 ± 2.08 � + 2 ;𝑔𝑔𝑔𝑔 2
18 15 502 902
𝑇𝑇 0.975,21 18 + 15
=2.08 gl = 2 2
502 902
18 15
5.804 ≤ 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐 ≤ 114.2 +
18 − 1 15 − 1
gl = 20.98 = 21

La diferencia entre los salarios medios semanales de hombres y mujeres se


encuentra comprendido entre S/. 5.804 y S/. 114.2 con el 95% de confianza.
Estadística Inferencial
Estimación Por intervalo

Intervalo de confianza para proporción (𝝅𝝅)

𝑃𝑃(1 − 𝑃𝑃)
IC 𝝅𝝅 = 𝑝𝑝 ± 𝑍𝑍 𝛼𝛼 ⋅
1−
2 𝑛𝑛

Población finita
𝑃𝑃(1 − 𝑃𝑃) 𝑁𝑁 − 𝑛𝑛
𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷𝑷 𝑃𝑃 : 𝐸𝐸𝐸𝐸 = �
𝑛𝑛 𝑁𝑁 − 1
Estadística Inferencial
Estimación Por intervalo para una proporción (𝜋𝜋): Ejercicio

En una muestra aleatoria de 600 compradores de un centro


comercial, se encontró que 360 están a favor de que se construya un
ascensor adicional.

Calcule e interprete un intervalo del 95% de confianza para la


proporción verdadera de compradores que quieren se construya un
ascensor adicional
Estadística Inferencial

Solución :
Datos población Datos Muestra
𝑋𝑋: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑎𝑎 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐: 𝑋𝑋=360
p = proporción muestral de compradores que están a favor.. 𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑛𝑛 = 600
𝑥𝑥 360
𝑝𝑝 = = = 0.6
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95 𝑛𝑛 600
𝑝𝑝(1 − 𝑝𝑝)
𝐼𝐼𝐼𝐼 𝝅𝝅 = 𝒑𝒑 ± 𝑍𝑍(1−𝛼𝛼) . 𝛼𝛼 = 0.05
2 𝑛𝑛

0,6(0,4)
𝐼𝐼𝐼𝐼 𝜋𝜋 = 𝟎𝟎, 𝟔𝟔 ± 1,96.
600

𝑍𝑍 0.05
1−
0,561 ≤ 𝜋𝜋 ≤ 0,639 2

𝑍𝑍 0.975 =1.96

con un 95% de confianza la verdadera proporción (porcentaje) de compradores que quieren que se
construya un segundo ascensor en el centro comercial, se encuentra entre 0.561 y 0.639 (56.1% y 63.9%).
Estadística Inferencial
Estimación Por intervalo para una proporción (𝜋𝜋): Ejercicio

De un área de la ciudad en la que habitan 500 familias se


extrae una muestra aleatoria de 50 familias, obteniéndose
los siguientes datos sobre el número de hijos por familia:

Hijos por 0 1 2 3 4 5
familia
familias 20 10 7 6 4 3

Calcule e interprete intervalos de confianza del 90 % para


estimar La proporción de familias con menos de 2 hijos en
el área.
Estadística Inferencial

Solución :
Datos población Datos Muestra
𝑋𝑋:familias con menos de 2 hijos , 𝑋𝑋=30
p = proporción muestral familias con menos 2 hijos 𝑛𝑛 = 50
𝑁𝑁 = 500
𝑥𝑥 30
𝑝𝑝 = = = 0.6
𝑝𝑝(1 − 𝑝𝑝) 𝑁𝑁 − 𝑛𝑛 𝑛𝑛 50
𝐼𝐼𝐼𝐼 𝜋𝜋 = 𝑝𝑝 ± 𝑍𝑍(1−𝛼𝛼) . 𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.90
2 𝑛𝑛 𝑁𝑁 − 1
𝛼𝛼 = 0.1

0,6(0,4) 500 − 50
𝐼𝐼𝐼𝐼 𝜋𝜋 = 0,6 ± 1,645.
600 499
𝑍𝑍 0.1
1−
2
0,551 ≤ 𝜋𝜋 ≤ 0,65
𝑍𝑍 0.95 =1.645

con un 90% de confianza la verdadera proporción (porcentaje) de familias con menos de 2 hijos se
encuentra entre 55,1% y 65%
Estadística Inferencial
Estimación Por intervalo

Intervalo de confianza para la diferencia de proporción (𝜋𝜋1 − 𝜋𝜋2 )

𝑃𝑃1 (1 − 𝑝𝑝1 ) 𝑃𝑃2 (1 − 𝑝𝑝2 )


IC 𝜋𝜋1 − 𝜋𝜋2 = 𝑃𝑃1 − 𝑃𝑃2 ± 𝑍𝑍 𝛼𝛼 ⋅ +
1−
2 𝑛𝑛1 𝑛𝑛2
Estadística Inferencial

Estimación Por intervalo para diferencia proporciones


(𝜋𝜋1 − 𝜋𝜋2 ): Ejercicio
Una empresa de estudios de mercado quiere estimar las
proporciones de hombres y mujeres que conocen un
producto promocionado a escala nacional. en una muestra
aleatoria de 100 hombres y 200 mujeres se determina que
20 hombres y 60 mujeres están familiarizados con el artículo
indicado.
a) Calcular el intervalo de confianza de 95 % para la
diferencia de proporciones de hombres y mujeres que
conocen el producto.
b) Son iguales las proporciones de hombres y mujeres que
conocen el producto?.
Estadística inferencial
Solución a :
𝑋𝑋𝑋𝑋: h𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑜𝑜 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
Datos población Datos Muestra
p = proporción de h𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑜𝑜 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 Hombres
𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 Mujeres
𝑐𝑐𝑐𝑐𝑐𝑐 𝑒𝑒𝑒𝑒 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
𝑛𝑛1 = 100 𝑛𝑛2 = 200
𝑃𝑃1 (1 − 𝑃𝑃1 ) 𝑃𝑃2 (1 − 𝑃𝑃2 ) 20 60
𝐼𝐼𝐼𝐼 𝜋𝜋1 − 𝜋𝜋2 = 𝑃𝑃1 − 𝑃𝑃2 ± 𝑍𝑍(1−𝛼𝛼) . + 𝑝𝑝1 = 𝑝𝑝2 =
2 𝑛𝑛1 𝑛𝑛2 𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95 100 200
𝛼𝛼 = 0.05 𝑝𝑝1 = 0,2 𝑝𝑝2 = 0,3

0,2 (0,8) 0,3 (0,7)


𝐼𝐼𝐼𝐼 𝜋𝜋1 − 𝜋𝜋2 = 0,2 − 0,3 ± 1,96. +
100 200 𝑍𝑍 0.05
1−
2
𝑍𝑍 0.975 =1.96
−0,2009 ≤ 𝜋𝜋1 − 𝜋𝜋2 ≤ 0,0009

Con el 95% de confianza, la diferencia de proporciones verdadera de hombres y de mujeres que conocen
el producto, está entre -0.2009 y 0.0009.

Solución b : Son iguales las proporciones de hombres y mujeres que conocen el producto?. Rpta: SI
Estadística inferencial

Estimación Por intervalo para diferencia proporciones


(𝜋𝜋1 − 𝜋𝜋2 ): Ejercicio

Se entrevistaron dos grupos de mujeres de una tienda muy


famosa respecto a su nivel de satisfacción por la nuevas
prendas de vestir importadas de China. El 20% de las mujeres
menores a 50 años , de una muestra aleatoria de 300,
estuvieron satisfechas, mientras que el 27% de las mujeres
mayores a 50 años, de una muestra de 200, estuvieron
satisfechas.

Calcule e interprete un intervalo del 99 % de confianza para la


diferencia entre las verdaderas proporciones de mujeres
menores de 50 años y las de 50 años a más que estuvieron
satisfechas por las prendas chinas.
Estadística Inferencial

Solución :
P= proporción de clientes satisfechas Datos población Datos Muestra

𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 Mujeres <50 Mujeres >50


𝑛𝑛1 = 300 𝑛𝑛2 = 200
𝑃𝑃1 (1 − 𝑃𝑃1 ) 𝑃𝑃2 (1 − 𝑃𝑃2 ) 𝑝𝑝1 = 0,2 𝑝𝑝2 = 0,27
𝐼𝐼𝐼𝐼 𝜋𝜋1 − 𝜋𝜋2 = 𝑃𝑃1 − 𝑃𝑃2 ± 𝑍𝑍(1−𝛼𝛼) . +
2 𝑛𝑛1 𝑛𝑛2
𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.99
𝛼𝛼 = 0.01
0,2 (0,8) 0,27 (0,73)
𝐼𝐼𝐼𝐼 𝜋𝜋1 − 𝜋𝜋2 = 0,2 − 0,27 ± 2,58. +
300 200
𝑍𝑍 0.01
1−
2

−0,17 ≤ 𝜋𝜋1 − 𝜋𝜋2 ≤ 0,03 𝑍𝑍 0.995 =2.58

Interpretación: la diferencia de proporciones de mujeres menores de 50 años y las de 50 años a más que mostraron
satisfacción por las prendas chinas, está entre -0.17 y 0.03 con el 99% de confianza.
Estadística Inferencial

Estimación Por intervalo

Intervalo de confianza para la varianza (𝝈𝝈𝟐𝟐 )

2
(𝑛𝑛 − 1)𝑆𝑆 2 2
(𝑛𝑛 − 1)𝑆𝑆 2
IC 𝜎𝜎 = 2 ≤ 𝜎𝜎 ≤ 2
𝑋𝑋 1−𝛼𝛼,𝑛𝑛−1 𝑋𝑋 𝛼𝛼,𝑛𝑛−1
2 2

Distribución Ji- Cuadrada


Estadística Inferencial
Estimación por intervalo para varianza 𝜎𝜎 2 : Ejercicio

En una muestra aleatoria de 25 estudiantes el promedio de tiempo de estudio para el examen final de un
determinado curso es 5.2 horas y una desviación estándar de 3.1 horas. Calcule e interprete un intervalo del 95%
para la desviación estándar del tiempo en horas de estudio para el examen final de dicho curso

Solución : Datos Muestra


Datos población
𝑋𝑋; 𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑒𝑒𝑒𝑒 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 Estudiantes
𝑁𝑁𝑁𝑁 ℎ𝑎𝑎𝑎𝑎 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑛𝑛 = 25
(𝑛𝑛 − 1)𝑆𝑆 2 (𝑛𝑛 − 1)𝑆𝑆 2
IC 𝜎𝜎 2 = 2 2
≤ 𝜎𝜎 ≤ 2 𝑋𝑋� = 5.2
𝑋𝑋 1−𝛼𝛼,𝑛𝑛−1 𝑋𝑋 𝛼𝛼,𝑛𝑛−1 𝑁𝑁𝑁𝑁 = 1 − 𝛼𝛼 = 0.95 𝑆𝑆 = 3.1
2 2
𝛼𝛼 = 0.05
(25 − 1)3.12 (25 − 1)3.12 𝑋𝑋 2 𝛼𝛼 = 𝑋𝑋 2
IC 𝜎𝜎 2 = 2
≤ 𝜎𝜎 ≤ 1− ,𝑛𝑛−1
2
0.975,24 =39.4
39.4 12.4
𝑋𝑋 2 𝛼𝛼 =𝑋𝑋 2 0.025,24 = 12.4
IC 𝜎𝜎 2
= 5.85 ≤ ≤ 18.6 𝜎𝜎 2 2
,𝑛𝑛−1

IC 𝜎𝜎 = 2.42 ≤ 𝜎𝜎 ≤ 4.31

con una confianza del 95% la desviación estándar del tiempo de estudio esta comprendido de 2.42 a 4.31 horas
Estadística Inferencial
Estimación por intervalo para varianza 𝜎𝜎 2 : Ejercicio

𝑋𝑋 2 𝛼𝛼
,𝑛𝑛−1
=𝑋𝑋 2 0.025,24 = 12.4
2

𝑋𝑋 2 𝛼𝛼
1− ,𝑛𝑛−1
= 𝑋𝑋 2 0.975,24 =39.4
2
Muestreo y determinación del tamaño de la
muestra
• Tamaño de la muestra
• Muestreo
Estadística Inferencial
Tamaño de muestra

Para la Proporción
Población Infinita

𝑍𝑍 2 � 𝑃𝑃(1 − 𝑃𝑃)
𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑑𝑑𝑑𝑑 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀: 𝑛𝑛 =
𝐸𝐸 2
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷: 𝐸𝐸 = 𝑝𝑝 − 𝜋𝜋
Población finita
𝑁𝑁𝑍𝑍 2 𝑃𝑃(1 − 𝑃𝑃)
𝑛𝑛 = 2
𝐸𝐸 𝑁𝑁 − 1 + 𝑍𝑍 2 𝑃𝑃(1 − 𝑃𝑃)

Donde:
n = el tamaño de la muestra, N = tamaño de la población.
𝑝𝑝 = Proporción poblacional o muestral. (P=0.5 ni no es conocido)
Z : NC=90% Z=1,645, NC=95% Z=1,96 , NC=99% Z=2.58
𝐸𝐸 = Límite aceptable de error muestral
Varia del 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador.
Estadística Inferencial
Tamaño de muestra

Para la Proporción

Ejercicio
El área de calidad de una embotelladora, quiere determinar
la proporción de reclamos sobre el sabor de sus bebidas,
para ello desea determinar la muestra de clientes
necesarios con una confianza del 99% si desea cometer un
error máximo del 5%. Por estudios pilotos se sabe que 4 de
cada 10 clientes presentan reclamos por el sabor.
Solución

Dato:
𝑍𝑍 2 � 𝑃𝑃(1 − 𝑃𝑃)
𝑛𝑛 =
N=Infinito 𝐸𝐸 2
𝑍𝑍 = 2.58
𝑝𝑝 = 0.4 2.582 � 0.4(0.6)
𝐸𝐸 = 0.05 n= = 369 clientes
0.052
Estadística Inferencial
Tamaño de muestra
Para la Proporción
Ejercicio
En un hotel, saben que el nivel de satisfacción de sus clientes
ronda el 90% y quieren realizar un estudio para ver si la
nueva gestión de limpiezas ha sido de su agrado. ¿Cuál sería
el tamaño necesario para la muestra, si el total de clientes
del hotel es de 10 000? Suponga un nivel de confianza para
los resultados del estudio del 95% y un error máximo
permitido del 5%.
Solución
Dato: 𝑁𝑁𝑍𝑍 2 𝑃𝑃(1 − 𝑃𝑃)
𝑛𝑛 = 2
𝐸𝐸 𝑁𝑁 − 1 + 𝑍𝑍 2 𝑃𝑃(1 − 𝑃𝑃)
N=10 000
𝑍𝑍 = 1,96
𝑝𝑝 = 0.9, q=0.1 10000 1.962 (0.9)(0.1)
𝐸𝐸 = 0.05 𝑛𝑛 =
0.052 (10000 − 1) +1.962 (0.9)(0.1)
𝑛𝑛 = 136.42, 𝑛𝑛 = 137 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
Estadística Inferencial
Tamaño de muestra

Para la media
Población Infinita

𝑍𝑍 2 � 𝜎𝜎 2
𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑑𝑑𝑑𝑑 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀: 𝑛𝑛 =
𝐸𝐸 2
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷: 𝐸𝐸 = 𝑋𝑋� − 𝜇𝜇
Población finita

𝑁𝑁𝜎𝜎 2 𝑍𝑍 2
𝑛𝑛 =
𝑁𝑁 − 1 𝐸𝐸 2 + 𝜎𝜎 2 𝑍𝑍 2

Donde:
n = el tamaño de la muestra, N = tamaño de la población.
𝜎𝜎 = Desviación estándar de la población o S muestra piloto.
Z : NC=90% Z=1,645, NC=95% Z=1,96 , NC=99% Z=2.58
𝐸𝐸 = Límite aceptable de error muestral
Estadística Inferencial
Tamaño de muestra
Para la media
Ejercicio
Se hace un estudio de mercado, Para estimar la venta
promedio mensual de una nueva marca de gaseosas en las
tiendas, ¿Qué tamaño de muestra debe tomarse, si se desea
que 𝑥𝑥̅ difiera de µ en menos de S/. 30, con el 95 % de
confianza?.
En una encuesta piloto previo a un conjunto de tiendas se
obtuvo una desviación estándar de 120 soles.
Solución
Dato:
𝑍𝑍 2 � 𝜎𝜎 2
𝑛𝑛 =
N = infinito 𝐸𝐸 2
𝑍𝑍 = 1.96
𝑆𝑆 = 120
𝐸𝐸 = 30 1.962 � 1202
n= = 61 tiendas
302
Estadística Inferencial
Tamaño de muestra

Para la media

Ejercicio
Calcular el tamaño de la muestra de una población de 500 piezas
de microchips, con la finalidad de conocer la longitud media de
estas, a razón de que el gerente de calidad sospecha que esta
longitud no cumple con las especificaciones. Use un nivel de
confianza del 95% y un error 0.05 cm y una desviación estándar
de 0.5
Solución
𝑁𝑁𝜎𝜎 2 𝑍𝑍 2
Dato: 𝑛𝑛 = 2
𝐸𝐸 𝑁𝑁 − 1 + 𝜎𝜎 2 𝑍𝑍 2
𝑁𝑁 = 500
𝑍𝑍 = 1.96 500 � 0,52 � 1,962
𝜎𝜎 2 = 0.5 𝑛𝑛 =
0,052 500 − 1 + 0,52 � 1,962
𝐸𝐸 = 0.05
500 � 0,52 � 1,962
𝑛𝑛 = = 217.49 = 218 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
0,052 500 − 1 + 0,52 � 1,962
Estadística Inferencial
Tipos de muestreo
Muestreo
Población (N)

Muestra (n)

Estadísticos

Parámetros

El muestreo es el proceso de seleccionar un conjunto de


individuos de una población con el fin de estudiarlos y
poder caracterizar el total de la población
Estadística Inferencial
Tipos de muestreo
Muestreo Probabilístico Muestreo no Probabilístico

Se basan en el principio de la  La muestra no es


equiprobabilidad, es decir representativa
todos los individuos tienen la
misma probabilidad de ser  No permite realizar
elegidos para formar parte inferencias para la
de una muestra. población bajo
investigación.
 Representatividad
 GeneralizaciónEstadísti
ca Inferencial

• Aleatorio simple. • De Conveniencia.


• Aleatorio sistemático. • Por Cuotas.
• Aleatorio estratificado. • Por Bola de nieve
• Por Conglomerados.
Estadística Inferencial
Tipos de muestreo

Muestreo Probabilístico

• Aleatorio simple.

Paso1: Definir Marco Muestral ( lista total de las unidades de


análisis N)
Paso2: Determinar el tamaño de la muestra(n)
Paso3: Generar números aleatorios a fin de elegir las unidades
de análisis
Ejemplo:
 Población N = 54 viviendas
 Muestra n = 18
 Fracción muestral p = n / N = 18 / 54 = 1/3
 Cada vivienda tiene probabilidad de selección 1/3
 Se seleccionan 18 números aleatorios entre 1 y 54
 Se seleccionan las viviendas correspondientes
Estadística Inferencial
Tipos de muestreo

Muestreo Probabilístico

• Aleatorio sistemático.

Paso1: Definir el marco muestral, listado poblacional de las


unidades de análisis
Paso2: Determinar el tamaño de la muestra(n)
Paso3: Definir el intervalo de salto; P=N/n
Paso4: Elegir un número aleatorio( de inicio) entre 1 y P
por ejemplo r
Seleccionar las unidades r, r+p, r+2p, r+3p
Estadística Inferencial
Tipos de muestreo

Muestreo Probabilístico

• Aleatorio sistemático.

Ejemplo:
Seleccionar muestra de n = 20 empresas de lista de N = 500
empresas

● Esto significa que 1 de cada 25 empresas de la población se


seleccionará ( intervalo de salto 500/20 =25)
● Utilizando # al azar seleccionamos un número entre 1 y 25.
● Suponga que el # seleccionado es 7.
● Entonces la 1ra empresa. Seleccionada es el # 7 lista.
● Las otras 19 empresas de la muestra se obtienen sumando al
7 el intervalo de selección 25.
● Es decir: 07, 32, 57 , ..........
Estadística Inferencial
Muestreo Probabilístico Aleatorio estratificado.

Poblacion Estratos
Estrato 1
(Empresas N1 n1
grandes)

Estrato 2
(Empresas N2 n2
medianas)

Estrato 3
(Empresas
N3 n3
pequeñas)

𝐿𝐿

𝑇𝑇𝑇𝑇𝑇𝑇 𝑞𝑞𝑞𝑞𝑞𝑞, 𝑁𝑁 = 𝑁𝑁1 + 𝑁𝑁2 + 𝑁𝑁3 ⇒ 𝑁𝑁 = � 𝑁𝑁ℎ


ℎ=1
𝐿𝐿

𝑛𝑛 = 𝑛𝑛1 + 𝑛𝑛2 + 𝑛𝑛3 ⇒ 𝑛𝑛 = � 𝑛𝑛ℎ


ℎ=1
Estadística Inferencial
Tipos de muestreo

Muestreo Probabilístico

• Por Conglomerados.

La población podría estar muy dispersa geográficamente o


aparecer en cúmulos naturales, como las escuelas, hospitales,
manzanas, familias.
El muestreo por conglomerados se utiliza en la práctica debido
a que es más barato y conveniente obtener muestras por
conglomerados que al azar entre la población.

Se entiende la población como jerarquía de unidades


• personas viven en viviendas
• viviendas constituyen manzanas
• muchas manzanas hacen una ciudad
Estadística Inferencial
Tipos de muestreo

Muestreo Probabilístico

• Por Conglomerados.

Número de niños por manzana


Las 3510 manzanas de una ciudad se localizan en 90
poblados (urbanizaciones, AAHH y conjuntos
habitacionales).
El número de manzanas en las diferentes urbanizaciones,
AA.HH., C.H. no es el mismo .
Se selecciona una muestra aleatoria simple de 15 poblados y
se determina el # de niños por manzana.
Estadística Inferencial
Tipos de Muestreo

Muestreo no Probabilístico

Por Cuotas.

Se asienta generalmente sobre la base de un buen


conocimiento de los estratos de la población y/o de los
individuos más "representativos" o "adecuados" para los fines
de la investigación.

En este tipo de muestreo se fijan unas "cuotas" que consisten


en un número de individuos que reúnen unas determinadas
condiciones, por ejemplo: 20 individuos de 25 a 40 años, de
sexo femenino y residentes en Gijón. Una vez determinada la
cuota se eligen los primeros que se encuentren que cumplan
esas características. Este método se utiliza mucho en las
encuestas de opinión.
Estadística Inferencial
Tipos de muestreo

Muestreo no Probabilístico

• Por Bola de nieve

Se localiza a algunos individuos, los cuales conducen a otros, y


estos a otros, y así hasta conseguir una muestra suficiente. Este
tipo se emplea muy frecuentemente cuando se hacen estudios
con poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.
Estadística Inferencial
Tipos de muestreo

Muestreo no Probabilístico

De Conveniencia.

Suele traducir en una gran facilidad operativa y en bajos costes


de muestreo,

Una muestra por conveniencia podría consistir en dirigirme a 3


universidades cercanas, simplemente porque están en la
población en la que reside el encuestador, y encuestar a unos
cuantos individuos que acepten participar al salir de las aulas
por la mañana.
Estadística Inferencial
Tipos de muestreo

Muestreo Probabilístico Muestreo no Probabilístico

Ventajas: Ventajas:
 Es menos costoso.
 Tiene fundamento estadístico  De selección más simple.
matemático.  No requiere conocimiento
 Es más representativo, previo del universo.
porque es más exacto.  No requiere tener identifi-
 El error con el que se trabaja cadas las unidades de
es menor y es posible decidir análisis.
con que error trabajar. Desventajas:
 Se trabaja con un error
Desventajas: desconocido.
 Es costoso.  No se puede calcular el
 Requiere el conocimiento error.
 Es menos representativo.
previo del universo.
Conclusiones
1. Estimaciones de intervalos de confianza

La estimación de un intervalo para la media se puede


encontrar a través de una distribución norma (n>30) y a través
de una distribución T(n<30)

La distribución normal se usa encontrar un intervalo de


confianza para la proporción

La distribución ji-cuadrado se usa encontrar un intervalo de


confianza para la varianza

2. Determinación del tamaño de la muestra y Muestreo

Los tipos de muestreo son los probabilísticos y los no


probabilísticos, y el calculo del tamaño de la muestra está en
función de una población finita o infinita.
Gracias
Docente: Fredy Vivanco Huaytara

Das könnte Ihnen auch gefallen