Sie sind auf Seite 1von 9

MODELOS DE SIMULACIÓN ESTADÍSTICOS

PRUEBA DE BONDAD DE AJUSTE


PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO

PRUEBA DE BONDAD DE AJUSTE O PRUEBA CHI - CUADRADO

Hasta ahora se han mencionado formas de probar lo que se puede llamar hipótesis
paramétricas con relación a una variable aleatoria, o sea que se ha supuesto que se
conoce la ley de probabilidad y se vieron pruebas de hipótesis que declaran valores para
los parámetros. En algunos casos se necesita probar si una variable o unos datos siguen
determinada distribución de probabilidad, un método para hacer esta prueba es el de
bondad de ajuste o chi-cuadrado.

La información debe estar presentada en un cuadro de distribución de frecuencias. Sea m


el número de clases y nj el número de observaciones en cada clase (frecuencias
observadas). Se trata de comparar los valores o frecuencias observadas (nj) con las
frecuencias que habría en cada grupo o clase o sea el valor esperado (ej) si se cumple la
hipótesis nula (H0).

Las diferencias entre lo observado y lo esperado dan las discrepancias entre la teoría y la
realidad. Si no hay diferencias, la realidad coincidirá perfectamente con la teoría y por el
contrario, si las diferencias son grandes indica que la realidad y la teoría no se parecen.

Los pasos a seguir son:

Hipótesis
H0: La variable tiene distribución X con tales parámetros
H1: La variable no tiene la distribución X

Estadística de Trabajo

( )
∑ ∑

nj: frecuencia observada en la muestra


ej: frecuencia esperada según la distribución teórica
n: tamaño de la muestra.
MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO

Nota:

El número de observaciones esperadas en cada clase debe ser mayor o igual a 5, es


decir, ej 5. Si esto no ocurre se unen las clases adyacentes hasta cumplir el requisito. Al
unir las clases se disminuirán los grados de libertad de la chi-cuadrado.

Donde:
m: Número de clases
K: Número de estimadores obtenidos a partir de la muestra.
α: Nivel de significancia.

La regla de decisión se observa en la siguiente figura:

EJEMPLO 1
Se desea probar si la estatura de los empleados tiene distribución normal. Se toma una
muestra aleatoria de 200 empleados a quienes se les pregunta su estatura en pulgadas.
Los resultados obtenidos son:

ESTATURA 57,5 - 63,5 63,5 - 69,5 69,5 - 72,5 72,5 - 78,5

No. EMPLEADOS 29 75 68 28

Con base en ésta información, ¿se puede concluir que su distribución es normal?

Solución
H0: La estatura de los empleados tiene distribución normal
H1: La estatura de los empleados no tiene distribución normal
MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO

Para hallar la estadística de trabajo se utiliza la expresión planteada anteriormente. Para


calcular la frecuencia esperada es necesario obtener la probabilidad en cada intervalo y
para ésto se requiere el promedio aritmético y la desviación estándar, que se obtienen con
la información suministrada por la muestra, los que respectivamente son: 68,42 y 4,4451.

( )

ESTATURA nj pj ej =n pj
57,5 - 63,5 29 0,.1335 26,7
63,5 - 69,5 75 0,4613 92,26
69,5 - 72,5 68 0,2264 45,28
72,5 - 78,5 28 0,1788 35,76
TOTAL n = 200 1 200

La estadística de trabajo es:

( )

Con una confiabilidad del 95 por ciento, en una tabla de la distribución chi-cuadrado y un
grado de libertad (número de clases: m=4, número de estimadores obtenidos a partir de la
muestra: k=2, promedio y desviación estándar. Entonces m-k-1 = 1) se obtiene un valor
para de 3,8415. El valor de la estadística de trabajo está en la zona de rechazo de
la hipótesis nula (Figura 1), por lo tanto con una confiabilidad del 95 por ciento, se acepta
que la estatura de los empleados no tiene distribución normal.

Figura 1 Regla de decisión para una prueba de bondad de ajuste


MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO

Ejemplo 2

Se distribuyó el número de clientes que visitaron la oficina de un joven abogado durante


sus primeros 102 días de práctica, de la siguiente manera:

No. de CLIENTES 0 1 2 3 4 5

No. de DÍAS 40 36 16 7 2 1

Pruebe si el número de clientes por día sigue una distribución Poisson.

Solución
H0: El número de clientes por día tiene distribución Poisson
H1: El número de clientes por día no tiene distribución Poisson

Para calcular la frecuencia esperada en cada clase, se necesita conocer la probabilidad


en cada una de dichas clases, para esto se utiliza la función de probabilidad de la
distribución Poisson que es:

Donde: λ es el promedio de clientes por día.

Con la información disponible se obtiene un promedio aritmético de 1, por lo tanto λ =1.


Conocido el promedio se puede calcular la probabilidad en cada clase:

Para el cálculo de la estadística de trabajo se debe tener en cuenta que cada una de las
frecuencias esperadas debe ser mayor o igual a 5; para cumplir esta condición se deben
unir las tres últimas clases obteniéndose así una frecuencia esperada de 8,16 y una
frecuencia observada de 10.
MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO

Cálculo de las frecuencias esperadas

No. DE
No. DE DIAS pj ej
CLIENTES
0 40 0,368 37,536
1 36 0,368 37,536
2 16 0,184 18,768
3 7 0,061 6,222
4 2 0,015 1,53
5 1 0,004 0,408
TOTAL N=102 1

Por lo tanto la estadística de trabajo es:

( )

Asumiendo una confiabilidad del 99 por ciento, en una tabla de la distribución chi-
cuadrado y dos grados de libertad (número de clases: m=4, número de estimadores
obtenidos a partir de la muestra, la media, k=1. Entonces m-k-1 = 2) se obtiene un valor
para de 9,2104. El valor de la estadística de trabajo está en la zona de no rechazo
de la hipótesis nula (Figura 2), por lo tanto con una confiabilidad del 99 por ciento, se
concluye que el número de clientes que visitan al abogado tiene una distribución Poisson.

Figura 2 Regla de decisión: prueba bondad de ajuste

EJEMPLO 3
Si los autos llegan a un supermercado siguiendo un proceso de Poisson, el tiempo entre
llegadas sucesivas es una variable aleatoria con distribución exponencial. Se registraron
las horas de llegada para todos los automóviles durante 2 horas y los tiempos entre
llegadas (en minutos) se resumen a continuación:
MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO

TIEMPO ENTRE
≤1 1-2 2-3 ≥3
LLEGADAS
No. DE AUTOS 40 29 15 8

Pruebe si es cierto que el tiempo entre llegadas tiene distribución exponencial.

Solución
H0: El tiempo entre llegadas tiene distribución exponencial
H1: El tiempo entre llegadas no tiene distribución exponencial

Para calcular la probabilidad en cada clase, es necesario conocer la función de


distribución de la exponencial, que es:

Con la información disponible se obtiene un promedio o valor esperado de 1. 4, por lo


tanto λ = 0,71 autos por minuto. La probabilidad en cada clase es:

( )

( )

Cálculo de las frecuencias esperadas:

TIEMPO nj pj ej
1 40 0,5084 46,77
1-2 29 0,2499 22,99
2-3 15 0,1229 11,31
3 8 0,1188 10,93
TOTAL 92 1 92

La estadística de trabajo es:


MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO

( )

Asumiendo una confiabilidad del 95 por ciento, en una tabla de la distribución chi-
cuadrado y dos grado de libertad (número de clases: m=4, número de estimadores
obtenidos a partir de la muestra: k=1. Entonces m-k-1 = 2) se obtiene un valor para
de 5,9915. El valor de la estadística de trabajo está en la zona de no rechazo de la
hipótesis nula (Figura 3), por lo tanto con una confiabilidad del 95 por ciento, no se
rechaza que el tiempo entre llegadas de los autos tiene una distribución exponencial.

Figura 3 Regla de decisión: prueba bondad de ajuste


MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO

PROBLEMAS DE APLICACIÓN PARA PRUEBAS DE BONDAD DE AJUSTE

1. las estaturas de 200 empleados se distribuyen así:

Estatura en pulgadas Frecuencias observadas


57.5 – 60.5 9
60.5 – 63.5 20
63.5 – 66.5 45
66.5 – 69.5 55
69.5 – 72.5 43
72.5 – 75.5 17
75.5 – 78.5 11
Pruebe al nivel de significancia α = 0.05 según el cual los datos se extrajeron de una
población normal.

2. Una revisión de 100 informes que tienen diez datos cada uno presentado por los
vendedores de una gran compañía permitió determinar algún tipo de error en dichos
informes. Los resultados fueron como aparecen en la tabla que sigue:

Número de errores Número de


por cada 10 datos informes
0 8
1 25
2 32
3 24
4 10
5 o más 1

Pruebe al nivel de significancia α = 0.05, determine si estos datos provienen de una


población binomial con p = 0,20.

3. Louis Armstrong, vendedor de la compañía Dillard Paper, tiene que visitar cinco clientes
por día. Se sugiere que la variable, vendida por el señor Armstrong, puede ser descrita
mediante una distribución binomial, con una probabilidad de vender en cada visita de
p=0.4. Dada la siguiente distribución de frecuencia del número de ventas hechas por
Armstrong, ¿podemos concluir que los datos, de hecho, siguen la distribución sugerida?
Utilice un nivel de significancia del 0.05.

Número de ventas diarias 0 1 2 3 4 5


Frecuencia del número de ventas 10 41 60 20 6 3
MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO

4. A continuación presentamos una distribución de frecuencias observadas. Utilizando una


distribución normal con µ = 5 y σ = 1.5.

a) Encuentre la probabilidad de caer en cada clase


b) Del inciso a), calcule la frecuencia esperada de cada categoría
c) Calcule la estadística chi-cuadrada
d) A nivel de significancia de 0.10 ¿esta distribución de frecuencia parece estar bien
descrita por la distribución normal sugerida?

Valor observado de la variable < 2.6 2.6-3.79 3.8-4.99 5-6.19 6.2-7.39  7.4
Frecuencia observada 6 30 41 52 12 9

5. Una fábrica desea determinar si el número de partes defectuosas utilizadas en cierto


montaje se ciñe a una distribución de Poisson. Para ello, el ingeniero de control de calidad
inspecciona una muestra de 200 cajas, cada una con 100 partes terminadas. En este
ejercicio, la variable aleatoria X es el número de partes defectuosas encontradas en cada
caja y tiene el siguiente conjunto de valores posibles: { }
En cada una de las 200 cajas, el ingeniero halló 0, 1, 2, 3,.... partes defectuosas las
frecuencias que se observan en la columna de la tabla. A partir de estos datos se calcula
el valor para determinar si la variable aleatoria tiene distribución de Poisson. Utilice α =
0.05
No de partes Frecuencias
defectuosas observadas
0 21
1 62
2 50
3 40
4 22
5 0
6 5

Tomado de:

* http://www.itchihuahuaii.edu.mx/academico/CB/MEG/documentos/4.3.1.1.htm

* http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/docs_curso/contenido.html

Das könnte Ihnen auch gefallen