Sie sind auf Seite 1von 15

Unidad 2 / Escenario 4

Lectura fundamental

Intervalos de confianza en
dos muestras

Contenido

1 Diferencia de medias con varianzas poblacionales conocidas

2 Diferencia entre medias de dos poblaciones normales con varianzas poblacionales


desconocidas pero iguales y muestras pequeñas (n1< 30 y n2<30)

Diferencia entre medias de dos poblaciones normales con varianzas poblacionales


3 desconocidas pero diferentes

4 Intervalo para diferencia de proporciones

5 Diferencia de muestras pareadas

6 Intervalo para la razón entre varianzas

Palabras clave: diferencia de medias, diferencia de proporciones, nivel de confianza, distribución F.


En el Escenario 3, se trabajó la estimación de parámetros con los intervalos de confianza para
la media, la proporción y la varianza de una población. Como generalización en este Escenario,
estudiaremos los intervalos de confianza en dos poblaciones, tales como la diferencia de medias, la
diferencia de proporciones y la razón de varianzas. Estos intervalos proporcionan información sobre la
igualdad estadística de los parámetros correspondientes a las dos poblaciones de estudio.

1. Diferencia de medias con varianzas poblacionales conocidas


Se comparan dos procesos de fabricación; los dos procesos tienen distribución normal y con base
en registros pasados, se determina que las varianzas eran 41,16 y 28,59, respectivamente. Se toman
dos muestras, una de 36 artículos de la primera producción y otra de 64 de la segunda, obteniendo
medias de 75 y 60, respectivamente.

Encontrar el intervalo de confianza del 98% para la diferencia de las medias poblacionales.

Solución:

n1= 36 n2= 64 X̅ 1=75 X̅ 2=60 σ12=41,16 σ22=28,59

Se ubica el valor de la distribución normal con nivel del 98%, Z = 2,33

El intervalo queda en la forma:

(75 – 60) ± 2.33

15 ± 2,33(1,26)

15 + 2,94=17,94

15 - 2,94=12,06

POLITÉCNICO GRANCOLOMBIANO 2
Pues bien, la diferencia de medias está entre 12,06 y 17,94 con una confiabilidad del 98%. Es decir,
que en promedio el número de artículos producidos por el primer proceso es superior al del segundo
proceso. Esto porque el intervalo da diferencias positivas.

En síntesis...
El intervalo de confianza para la diferencia de medias en muestras grandes y
con varianzas poblacionales conocidas, se trabaja con la distribución normal.
Si las muestras son grandes y las varianzas poblacionales son desconocidas se
estiman con las varianzas muestrales.

2. Diferencia entre medias de dos poblaciones normales con varianzas


poblacionales desconocidas pero iguales y muestras pequeñas
(n1< 30 y n2<30)

En esta expresión, t tiene distribución t Student con (n1+n2-2) grados de libertad.

Y la desviación estándar Sp:

Ejemplo: el supervisor de producción S de dos poblaciones normales con varianzas poblacionales


desconocidas pero iguales y muestras pequeñas en la distribución de unidades defectuosas fabricadas
en el turno de la noche tomando una muestra de 6 unidades de la producción del turno de la mañana
y de 8 del turno de la noche, mostró la siguiente información.

POLITÉCNICO GRANCOLOMBIANO 3
Tabla 1. Producción turnos

Día 5 8 7 6 9 7

Noche 8 10 7 11 9 12 14 9

Fuente: elaboración propia

Con estos datos se obtienen los siguientes resultados:

• n1 = 6 x̅ 1 = 7 S1 = 1,4142

• n2 = 8 x̅ 2 = 10 S2 = 2,2678

= 1,9579

Para encontrar el valor t definimos

Grados de libertad: (n1+n2-2) = (6+8-2) = 12

Nivel de confianza (1-α) = 0,95

Valor t = 2,1788

Figura 1. Valor t con 12 g.l y (1 - α) = 0,95


Fuente: Tabla tomada de Montgomery y Runger (2012)

POLITÉCNICO GRANCOLOMBIANO 4
Ahora reemplazamos los valores en el intervalo:

(7-10) (2,1788) (1,9579)

-3 – 2,3038 =-5,3038

-3 + 2,3038 = -0,6961

Con una confianza del 95%, se puede decir que la diferencia de medias está entre -5,3038 y
-0,6961. Los dos límites del intervalo presentan valores negativos, lo que indica que el promedio de
unidades defectuosas es mayor para el turno de la noche.

En conclusión el intervalo de confianza para la diferencia de medias en muestras pequeñas con


varianzas poblacionales desconocidas pero iguales, se trabaja con la distribución t student con
(n1+n2-2) grados de libertad y varianza conjunta.

3. Diferencia entre medias de dos poblaciones normales con varianzas


poblacionales desconocidas pero diferentes
Cuando las varianzas de las poblaciones son desconocidas, se trabaja con las varianzas en la muestra
con la siguiente expresión:

En esta expresión t es el valor de la tabla t Student con grados de libertad v que se determinan con la
siguiente expresión:

Veamos como ejemplo el siguiente enunciado tomado de Montgomery y Runger (2012)

POLITÉCNICO GRANCOLOMBIANO 5
• Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercancía de un
depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudio se seleccionaron al
azar cinco choferes de un grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron
a la ruta B. Los datos obtenidos fueron:

Tabla 2. Asignación choferes por ruta

Ruta A 20 26 32 21 30

Ruta B 24 29 34 25 32

Fuente: elaboración propia

¿Con un intervalo de confianza del 95%, se podrá pensar que la ruta A es la mejor? Asuma varianzas
poblacionales desconocidas pero diferentes.

Tenemos que

Grados de libertad:

v = 7,68 que se aproxima a 8 grados de libertad

Valor t con nivel de significancia del 95% = 2,26

• n1 = 5 x̅ 1 = 25,8 S1 = 15,31

• n1 = 5 x̅ 2 = 28,8 S2 = 4,32

POLITÉCNICO GRANCOLOMBIANO 6
Límite inferior = -10,04

Límite superior = 4,04

Como el límite inferior es negativo y el superior es positivo, esto indica que la diferencia pasa por el
punto 0 y por lo tanto no se puede decir que existan diferencias en los tiempos de viaje en las dos rutas.

4. Intervalo para diferencia de proporciones


Cuando el interés es comparar las muestras de poblaciones en donde la característica de observación
es de carácter cualitativo, entonces se utiliza la siguiente expresión:

Veamos esto con un ejemplo.

El departamento de control de calidad de una gran industria quiere establecer, con un nivel de
confianza del 95%, si existe alguna diferencia entre el número de productos defectuosos que son
encontrados en la producción en dos turnos de trabajo. El departamento toma muestras de 1000
productos en cada turno, del turno A encuentra un 18% de productos defectuosos, mientras que del
turno B este porcentaje era del 14%.

Se definen los valores:

n1= 1000 n2= 1000 P1= 0,18 P2= 0,14 (1-α ) = 0,95

Para el nivel de confianza del 95% se ubica el valor Z en la tabla de la distribución normal

Nivel de
confiabilidad

1–α
α α
2 2
-3 -2 -1 0 1 2 3

Figura 2. Nivel de confiabilidad


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 7
Z = 1,96

0,04 + 0,032 = 0,0721

0,04 – 0,032 = 0,0079

Con un nivel de confianza del 95% se puede decir que la diferencia en la proporción de productos
defectuosos está entre 0,0079 y 0,0721. Este resultado indica que la proporción de productos
defectuosos es mayor en el turno A; por lo tanto, la conclusión se da porque los dos límites del
intervalo son positivos.

5. Diferencia de muestras pareadas


La diferencia de medias tratada anteriormente corresponde a muestras independientes. En este
caso, se trata de establecer la diferencia para muestras dependientes o relacionadas en situaciones
en donde se analiza el mismo sujeto o la misma unidad en dos momentos, como en los casos antes/
después o pre y pos.

Entonces, el intervalo toma la siguiente forma:

En donde d es la diferencia entre el valor antes y el valor después

d barra es la media de las diferencias

es la desviación estándar de las diferencias

t con (n-1) grados de libertad.

POLITÉCNICO GRANCOLOMBIANO 8
Ejemplo: el gerente de una empresa quiere determinar si una capacitación impartida a los trabajadores
tiene algún efecto. Para esto toma una muestra de 10 empleados y registra los puntajes de una prueba
antes y después de habérseles impartido la capacitación laboral. Se quiere establecer un intervalo de
confianza del 90% para la media de la diferencia entre los puntajes antes y después de la capacitación.

Los resultados que aparecen en la tabla muestran la solución.

Tabla 3. Resultados puntajes antes y después

Puntaje antes de Puntaje después de


Empleado la capacitación del la capacitación del di di²
empleado empleado

1 9.0 9.2 -0.2 0.04

2 7.3 8.2 -0.9 0.81

3 6.7 8.5 -1.8 3.24

4 5.3 4.9 0.4 0.16

5 8.7 8.9 -0.2 0.16

6 6.3 5.8 0.5 0.25

7 7.9 8.2 -0.3 0.09

8 7.3 7.8 -0.5 0.25

9 8.0 9.5 -1.5 2.25

10 8.5 8.0 -0.5 0.25

11 7.4 7.9 -4.0 7.38

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 9
La media de las diferencias es la siguiente:

= - 0.4 (estimador puntual insesgado de )

Se establece que la variable aleatoria es función del estimador y del parámetro cuya distribución
este definida.

con n - 1 grados de libertad

De acuerdo con el nivel de confianza del 90% se ubica el valor de la tabla t Student con (n-1) = (10 -
1) = 9 grados de libertad. El valor t= 1,833

0,90

0,05 0,05

Figura 3. Grados de libertad


Fuente: elaboración propia

Para el intervalo se calcula:

= -0.4

= 0,801387

Límite superior de confianza -0.4 + (1.833) = -0.3354

Límite inferior de confianza -0.4 + (1.833) = -0.4645

POLITÉCNICO GRANCOLOMBIANO 10
Los dos límites tienen un valor negativo indicando que los puntajes después de la capacitación son mayores.

Se puede decir, entonces, con una confianza del 90% que la diferencia de medias de los puntajes esta
entre -0,464 y -0,3354, por lo tanto, la capacitación si es efectiva.

6. Intervalo para la razón entre varianzas


La comparación de las varianzas de dos poblaciones tiene gran utilidad para comparar, por ejemplo,
la precisión de un instrumento de medición con respecto a otro, o la estabilidad de un proceso con
respecto a otro.

El intervalo queda de la forma:

En donde F1 y F2 son los valores correspondientes a la distribución F con grados de libertad v1= (n1-1)
en el numerador y v2= (n2-1) en el denominador.

La distribución F no es una distribución simétrica, la tabla se maneja con dos clases de grados de libertad:

Figura 4. Gráfica de la distribución F


Fuente: elaboración propia basada en Montgomery y Runger (2012)

POLITÉCNICO GRANCOLOMBIANO 11
Tabla 4. Valor F para (1 - α) = 0,95

Fuente: Montgomery y Runger (2012).

Preste atención al siguiente ejemplo tomado de Montgomery y Runger (2012)

Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercancía de un
depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudio se seleccionaron al azar
cinco choferes de un grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta
B. Los datos obtenidos fueron:

Tabla 5. Asignación rutas

Ruta A 20 26 32 21 30

Ruta B 24 29 34 25 32

Fuente: elaboración propia

Con un intervalo de confianza del 90%, ¿se podrá pensar que las varianzas son iguales?
A continuación, se presenta la solución.

POLITÉCNICO GRANCOLOMBIANO 12
Con los datos

Tabla 6. Varianzas

n1 = 5 x̅ 1 = 25,8 S1 = 5,31 S1² = 28,2

n1 = 5 x̅ 2 = 28,8 S2 = 4,32 S2² = 18,7

Fuente: elaboración propia

Los valores de la tabla para α= 0,05 y v1 = 4 grados de libertad del numerador y v2 = 4 grados de
libertad del denominador son F2 = 6,3882 y F1= 0,1565 = 1/ 6,3882

El intervalo:

El límite inferior es menor a 1 y el superior es mayor, indicando que el cociente de varianzas puede ser 1 y así

Se puede decir con un nivel de confianza del 90% que las varianzas no tienen diferencias significativas.

En conclusión, para comparar las varianzas de dos poblaciones, el intervalo de confianza se trabaja
como la razón de varianzas con distribución F.

Para recordar...
Una forma de hacer estadística inferencial es la estimación de parámetros
que trabajamos en una y dos muestras en los Escenarios 3 y 4. Otra forma
de hacer inferencia es mediante las pruebas de hipótesis, que es el tema
del siguiente Escenario.

POLITÉCNICO GRANCOLOMBIANO 13
Referencias

Montgomery, D. & Runger, G. (2012). Probabilidad y Estadística aplicadas a la Ingeniería. 2da. Ed.
México: Ed. Limusa Wiley.

POLITÉCNICO GRANCOLOMBIANO 14
INFORMACIÓN TÉCNICA

Módulo: Estadística Inferencial


Unidad 2: Estimación de parámetros
Escenario 4: Estimación de parámetros en dos muestras

Autor: Patricia Castillo Garzón

Asesor Pedagógico: Amparo Sastoque Romero


Diseñador Gráfico: Julieth Rodríguez
Asistente: Eveling peñaranda

Este material pertenece al Politécnico Grancolombiano.


Prohibida su reproducción total o parcial.

POLITÉCNICO GRANCOLOMBIANO 15

Das könnte Ihnen auch gefallen