Sie sind auf Seite 1von 26

Estadística Aplicada

Mtro. Jorge Rueda Medina


Unidad 5

Inferencia a partir de dos muestras

En la unidad anterior vimos las pruebas de hipótesis a partir de una


muestra, un parámetro de población y una prueba para contrastar las
hipótesis planteadas con su estadístico de prueba correspondiente.

Ahora preguntémonos lo siguiente:

1. ¿Qué pasa si queremos comparar muestras de dos poblaciones?


2. ¿Cómo podemos comparar dos productos de diferentes
proveedores?
3. ¿Se puede aplicar inferencia en la prueba de hipótesis para el
caso de proporciones?
4. ¿Cuáles son las diferencias que existen entre muestras
dependientes e independientes?
Inferencias acerca de dos proporciones

Efectuar una prueba de una hipótesis para diferenciar entre dos


proporciones de poblaciones es una de las pruebas que resuelven
problemas. En esas pruebas de hipótesis se pueden hacer
comparaciones de proporciones poblacionales diferentes, por
ejemplo, la proporción de errores de cobro de un equipo
comparados con otro equipo, la proporción de clientes que
compran en una sucursal en comparación con las mujeres, etc.
En este caso, la prueba para medir las diferencias de dos
proporciones se muestra a continuación y lo explica Webster (2000,
p. 251):
(𝑝1 −𝑝2 ) − (𝜋1 −𝜋2 )
𝑧=
𝜎𝑝1−𝑝2
Ejemplo de aplicación (p. 251):

Un minorista desea probar la hipótesis de que la proporción de


sus clientes masculinos, quienes compran a crédito, es igual a la
proporción de mujeres que utilizan el crédito. Selecciona a 100
clientes hombres y encuentra que 57 compraron a crédito mientras
que 52 de las 110 mujeres lo hicieron.

1. Planteamos el juego de hipótesis: H0: π1= π2; H1: π1≠ π2

2. Establecemos el nivel de significación que es del 1%, la prueba


es a dos vías por lo que Z0.01=2.58

Por lo que la regla de decisión es “No rechazar si -2.58 ≤ Z ≤ 2.58",


3. Calculamos el valor crítico sustituimos valores:

Realizando operaciones:

4. El valor de Z calculado se encuentra entre la región de


aceptación, por lo que el minorista no puede concluir a un nivel del
1% de significancia que las proporciones entre hombres y mujeres
que compran a crédito sean diferentes.
Inferencias acerca de dos medias: muestras independientes

El objetivo de este tema es el de realizar una prueba de hipótesis para la


diferencia entre dos medias poblacionales independientes.

Una distribución muestral de diferencias de medias se puede definir, de


acuerdo con Bonilla (1998, p. 132), como el conjunto de diferencias de
medias calculadas en todas las muestras posibles, de un determinado
tamaño, se pueden extraer de dos poblaciones de tamaños
con medias y varianzas

Distribución muestral. FUENTE: Instituto Tecnológico de Chihuahua,


imagen tomada con fines educativos de
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap03e.html
Como sabemos, la distribución muestral de medias tiene una
tendencia normal, por lo que con esto se puede decir que la
distribución de diferencias de medias también va a presentar una
tendencia normal, como podemos apreciar en la imagen, se
observan esos comportamientos en sus gráficas de la curva normal:

En estos casos, las relaciones entre las variables y sus diferencias


se definen en la siguiente expresión:
Y el error estándar o la desviación estándar de las diferencias se
calcula con la siguiente fórmula:

Según Lind, Marchal y Wathen (2008, p. 370), en la teoría estadística se


demuestra que cuando se tienen poblaciones independientes, como en
este caso, la distribución de las diferencias tiene una varianza (desviación
estándar elevada al cuadrado) igual a la suma de dos varianzas
individuales. Esto significa que se pueden sumar las varianzas de dos
distribuciones muestrales.
Las siguientes fórmulas propuestas por Bonilla (1998, pp. 133 y
134) permiten trabajar la inferencia de dos medias:

La distribución Z queda de la siguiente forma:

También:

Si una hipótesis es nula: H0: μ1= μ2, lo que quiere decir que ambas
medias provienen de la misma población nuestra distribución Z
queda de la siguiente forma:
Veamos un ejemplo:

La gerencia regional de un supermercado de prestigio internacional


elaboró una prueba en la que se muestra el nivel de capacitación de
los empleados de dos sucursales diferentes, con los resultados
siguientes:

Con esta información, ¿se puede decir que los trabajadores de la


sucursal 2 tienen una mejor capacitación en comparación con los de
la sucursal 1?

1. Planteamos el juego de hipótesis:


2. Establecemos el nivel de significación que es del 1%, por lo que

3. Calculamos el valor crítico:

4. Se rechaza la hipótesis nula con un nivel de significación del 1% ya que


el valor absoluto de Z calculada es mayor que el valor absoluto de Z de alfa.
Inferencias a partir de muestras dependientes

En el caso de tener muestras que se encuentran relacionadas de tal


forma que se hacen dependientes una de la otra, es necesario
realizar una prueba de hipótesis para la diferencia media entre
observaciones apareadas o dependientes, esto es para inferir
acerca del comportamiento de éstas y así poder generalizar.

Este método de inferencia nos sirve para realizar comparaciones


entre dos medias, o de un comportamiento antes y después,
determina si hay cambios con fines de evaluación. En el caso de las
muestras pareadas o dependientes su prueba de hipótesis
proporciona la misma ventaja que en el caso de la construcción de
intervalos de confianza, explica Webster (2000, p. 251).

Afirma este autor al respecto, que se experimenta menos error de


muestreo debido a la reducción en la variación entre observaciones
porque se hace la correspondencia tan cerca como sea posible.
El valor crítico para muestras dependientes (apareadas) se calcula con la
siguiente fórmula:

Donde “d” es la diferencia entre los valores observados de la muestra


pareada.

La desviación estándar se calcula con:


En el siguiente ejemplo, tomado de Lind, Marchal y Wathen (2008,
pp. 389-391), se muestra de forma completa desde la obtención de
diferencias de los valores registrados en la muestras, el cálculo de su
desviación estándar, hasta la prueba de contraste.

Nickel Savings and Loan desea comparar las dos compañías que
contrata para evaluar casas. Seleccionaron dos muestras de
propiedades y programan avalúos de las dos empresas.
Con base en los resultados (en miles de dólares), con un nivel de
significancia de 0.05, ¿se puede concluir que hay una diferencia en
los avalúos medios de las casas?
Evaluación de casas. FUENTE: Lind, Marchal y Wathen (2008, p. 390).

1. Formulamos el juego de hipótesis: H0: μd= 0; H1: μ1≠ 0


Lo que quiere decir que si la media de las diferencias de la
población es 0, se concluye que no hay diferencia en los avalúos.

2. El nivel de significancia es de 5%, y los grados de libertad son


gl= (n-1)= (10-1)=9 en la tabla de distribución t.
Es una prueba a dos vías por lo que t = 2.262.

3. Calculamos ahora el estadístico de prueba:


Para esto debemos tener:

Evaluación de casas. FUENTE: Lind, Marchal y Wathen (2008, p. 391).

Sustituimos estos valores obtenidos para calcular el estadístico de prueba:


Nos vamos a apoyar de la tabla de distribución t, para localizar el
estadístico de prueba y los intervalos correspondientes:

Evaluación de casas. FUENTE: Lind, Marchal y Wathen (2008, p. 391).

Hay 10 casas valuadas por las dos empresas, por lo que n = 10, y gl = ( n – 1) = (10 – 1) = 9. Se
tiene una prueba de dos colas, y el nivel de significancia es 0.05. Para determinar el valor crítico
consulte el apéndice B.2, y vea la fila con 9 grados de libertad hasta la columna de una prueba de
dos colas y el nivel de significancia 0.05. El valor en la intersección es 2.262. Este valor aparece
en el cuadro de la tabla 11-2. La regla de decisión es rechazar la hipótesis nula si el valor
calculado de t es menor que -2.262 o mayor que 2.262

Con lo que se observa que dado el valor calculado de t= 3.305 se encuentra en la región de
rechazo, por lo que no se acepta la hipótesis nula.
La distribución de las diferencias de la población no tiene una media de 0.

Entonces se concluye que hay una diferencia en los avalúos medios de las casas. La diferencia
mayor de $12,000 es para la casa 3. De acuerdo con la información sería un buen lugar para
iniciar una revisión más detallada.
Comparación de la variación en dos muestras

En las anteriores pruebas se tienen las varianzas poblacionales


iguales, pero cuando esta medida de variación tiene valores que no
son iguales, cuando se comparan las varianzas de dos poblaciones,
se toma una muestra de cada población. En esta clase de
comparaciones la varianza de la muestra aporta información
importante ya que se utiliza como estimador de la varianza
poblacional del que se trate. Por lo que una distribución “F” se forma
por la razón de las dos varianzas muestrales, con la siguiente
fórmula.

En donde:
Dada la naturaleza del resultado de la razón F (que siempre va a ser
mayor que 1), por lo que encontraremos sólo una zona de rechazo
en la cola derecha. Por lo que se toma sólo la mitad de la curva,
entonces es necesario dividir el nivel de significancia entre dos como
se observa en la siguiente imagen:

Curva de distribución F. FUENTE: Webster (2000, p. 254).


Webster (2000, p. 254) pone un ejemplo:

Un consultor gerencial desea probar una hipótesis respecto a dos


medias poblacionales; sin embargo, antes de hacerlo debe decidir
si hay alguna evidencia que sugiera que las varianzas poblacionales
son iguales. Los datos que obtiene el consultor son:

1. Se plantea el juego de hipótesis:

2. Encontramos el estadístico de prueba:


3. Si el nivel de significancia es al 5% entonces α=0.5 y recordemos
que se debe dividir entre 2, por lo que

4. Dado que el tamaño muestra es de 10, entonces los grados de


libertad gl= (10-1)= 9 por lo que son 9 grados de libertad.

5. Con esta información, buscamos en la tabla y vemos que:

• Se mueve hacia la fila superior para hallar 9 grados de libertad


para el numerador.

• Luego, se baja en la columna 9 grados de libertad para hallar el


denominador.1)= 9 por lo que son 9 grados de libertad.
Tabla de distribución F. FUENTE: Webster (2000, p. 610).
Una vez encontrado el valor, se toma la regla de decisión que es:

No rechazar F≤4.03

Rechazar si F>4.03

Distribución F para la igualdad de varianzas. FUENTE: Webster (2000, p. 255).

Entonces, como F=1.59<4.03, la H0 no se rechaza, lo que quiere decir


que el consultor puede proceder con la prueba de hipótesis respecto a
las medias poblacionales, bajo la suposición de que las varianzas son
iguales.

Das könnte Ihnen auch gefallen