Beruflich Dokumente
Kultur Dokumente
Objetivo
Analizar, comparar e interpretar datos por medio de la distribucin chi cuadrado (x2),
solucionando con creatividad los problemas.
II.
Apoyo terico
En nuestro que hacer gerencial, muchas veces no conocemos los supuestos bsicos para realizar
una prueba estadstica, es decir, no podemos asumir si esta distribuida normalmente, que su
varianza se ajusta a ciertos parmetros o que la poblacin se comporta de tal o cual forma. En
estos casos, cuando no conocemos la distribucin, utilizamos pruebas no paramtricas.
En la prueba chi cuadrada (x2) existe una distribucin para cada grado de libertad1 y conforme
aumenta el nmero de grados de libertad se vuelve menos sesgada. Las aplicaciones ms comunes
de x2 son:
1. Pruebas de bondad de ajuste
2. Pruebas de independencia
Grados de libertad (g.l.), definidos como el nmero de observaciones que se pueden escoger
libremente (menos restricciones impuestas sobre tales observaciones).
1
2
i 1
(oi Ei ) 2
Ei
En donde:
Oi = Frecuencia de los eventos observados en la muestra
Ei = Frecuencia de los eventos esperados, si la hiptesis nula es correcta
K = Nmero de categoras o clases
En la prueba x2 los grados de libertad (g.l.) se tiene K-m-1, donde m es el nmero de parmetros a
estimar.
Tambin es comn poder utilizar pruebas de independencia o tablas de contingencia cuando
queremos comparar dos atributos para determinar si existe una relacin entre ellos, recordando
que estos son los que expresan cualidades o caractersticas de la poblacin (datos cualitativos).
III. Casos
El gerente de mercadeo de una importante importadora de vehculos de lujo (VIP) en la capital
guatemalteca debe estimar el inventario de vehculos para el nuevo trimestre, anteriormente lo ha
realizado con base a su criterio subjetivo y experiencia empirismo-. En realidad lo que ha hecho
es asumir que los cuatro modelos tienen la misma probabilidad de ser demandados, pero este
trimestre, ha decidido contratarlo a usted para estimar el stock.
Como primer paso, usted plantea sus hiptesis de trabajo, como buen analista no desprecia la
experiencia del gerente y decide probar la hiptesis de demanda con comportamiento uniforme,
las hiptesis son:
Ho=La demanda es uniforme para los cuatro modelos
HA=La demanda no es uniforme para los cuatro modelos
Como segundo paso, selecciona una muestra aleatoria de cuarenta y ocho autos vendidos durante
el ultimo trimestre (n=48), lo que esperamos comprobar es que se venden 12 autos de cada
modelo (48/12, es decir demanda uniforme).
Modelo
A
B
C
D
TOTAL
Sustituyendo valores en la frmula:
15
11
10
12
48
12
12
12
12
48
1.17
12
12
12
12
Un nivel de comprobacin del 5%, con grados de libertad (g.l) m-4-1=3 (como no hay parmetros
m es 0), resulta de la tabla de la distribucin x2, un valor de 7.815.
Como 1.17 es menor que 7.815 (valor crtico) queda dentro de la zona de no rechazo, por lo tanto
la hiptesis nula (Ho) sobre la demanda uniforme no se rechaza. Conclusin: pueden preverse los
cuatro modelos con el mismo nmero de unidades cada uno para este nuevo trimestre.
Zona de no rechazo
Zona de rechazo
1.17
7.815
Como buen analista, desea confrontar los resultados con otra hiptesis, segn sus estudios y
ponderaciones de mercado el comportamiento esperado ser:
Ho=La demanda mantiene un patrn de 42% para el modelo A, 33% para el modelo
D y 12.5% para cada modelo B y C respectivamente
HA=El patrn deseado no se mantiene
Esta es una prueba de ajuste a un patrn especfico, es decir se prueban las frecuencias contra un
patrn determinado donde no son todas iguales:
Modelo
9.08
20
6
6
16
Como 9.08 es mayor que 7.815 (valor crtico) queda dentro de la zona de rechazo, por lo tanto la
hiptesis nula (Ho) sobre la demanda con patrn establecido se rechaza. Conclusin: el patrn del
estudio de mercado se rechaz por medio del comportamiento histrico de la demanda uniforme
de los modelos.
Zona de no rechazo
Zona de rechazo
7.815
9.08
Por otro lado y como parte tambin de su contrato de asesora, le solicitan evaluar el
comportamiento del taller de servicio para la marca de lujo (VIP), el gerente financiero le ha
proporcionado el imperativo dato para cubrir costos y tener la rentabilidad deseada por la JDnecesitamos: un servicio promedio de $.600.00 y se acepta una desviacin estndar de $10.00.
Como primera tarea se decide verificar si lo que actualmente se esta generando tiene las
caractersticas de una distribucin normal o prueba de normalidad (si comprobamos este
supuesto, podremos hacer inferencias confiadamente), para esto tomamos al azar una muestra de
la base de datos de n=1,000 servicios del ltimo semestre y planteamos nuestras hiptesis como
sigue:
Ho=Los servicios estn distribuidos normalmente
HA= Los servicios no estn distribuidos normalmente
Servicios ($)
0 y por debajo de 580
580 y por debajo de 590
590 y por debajo de 600
600 y por debajo de 610
610 y por debajo de 620
30
1,000
Estas observaciones reales debemos compararlas con las que esperaramos encontrar si la
distribucin fuera normal. Para determinar las frecuencias esperadas debemos calcular las
probabilidades de que los datos tomados de la muestra aleatoriamente estn contenidos
dentro de los intervalos estimados. Es decir, la probabilidad de que un dato caiga en el primer
intervalo es P(0<X<580):
580 600
2 rea 0.4772
10
P(0<X<580)=0.50-0.4772=0.0228
Esto significa que existe 2,2% de probabilidad que ningn servicio prestado tenga una factura
menor a $580.00 dado que el monto promedio que se necesita es $600.00 y desviacin
estndar de $10.00. De la misma manera se calculan los intervalos siguientes, dando como
resultado la tabla siguiente, con su respectiva frecuencia esperada (n)*(p) :
Servicios ($)
0 y por debajo de 580
580 y por debajo de 590
590 y por debajo de 600
600 y por debajo de 610
610 y por debajo de 620
620 y por encima
Total
Frecuencia
real (Oi)
20
142
310
370
128
30
1,000
Probabilidades
(pi)
0.0228
0.1359
0.3413
0.3413
0.1359
0.0228
1.0
Frecuencias
esperadas (Ei)
22.8
135.9
341.3
341.3
135.9
22.9
1,000
...
8.63
22.8
135.9
22.8
Como 8.63 es menor que 11.07 (valor crtico) queda dentro de la zona de no rechazo, por lo tanto
la hiptesis nula (Ho) sobre la normalidad de la distribucin no se rechaza. La hiptesis se
comprueba con un nivel de 5% y existen grados de libertad (g.l) m-6-1=5 (como no hay parmetros
m es 0). Conclusin: Los servicios tienen un comportamiento de distribucin normal.
Zona de no rechazo
Zona de rechazo
8.63
11.07
Los 538 clientes de la muestra, los agrupamos en tres niveles de ingreso atributo B- y la
importancia al precio del servicio atributo A- en tres niveles de significancia, la tabla siguiente
corresponde a Frecuencia real (Oi):
Atributo A
Nivel de
importancia
Grande
Moderado
Poco
Total
Bajo
83
52
63
198
37
49
63
149
Total
182
172
184
538
Atributo A
Nivel de
importancia
Grande
Moderado
Poco
Total
Bajo
198*0.3383
66.98
198*0.3197
63.32
198*0.3420
67.72
198
149*0.3383
50.41
149*0.3197
47.64
149*0.3420
50.96
149
Total
182/538
33.83%
172/538
31.97%
184/538
34.20%
538
...
15.17
66.98
64.62
50.96
La hiptesis decidimos comprobarla con un nivel de 1% y existen grados de libertad (g.l) (filas1)(columnas-1) esto es (3-1)(3-1)= 4. Buscando en la tabla:
Como 15.17 es mayor que 13.28 (valor crtico) queda dentro de la zona de rechazo, por lo tanto la
hiptesis nula (Ho) sobre la independencia de los atributos se rechaza. Conclusin: Existe una
relacin entre el ingreso y la importancia que le da al precio del servicio de mantenimiento del
auto de lujo.
Zona de no rechazo
Zona de rechazo
13.28
15.17
Para tener la probabilidad en lugar del valor crtico, se procede a realizar el clculo con la
funcin DISTR.CHICUAD.CD donde X es el valor crtico que se busca y los grados de libertad son
K-m-1, se obtiene el resultado de 0.76 que en el caso del primer ejemplo significa que el valor
no se encuentra hasta 0.05 de la cola derecha (en la zona de rechazo), se encuentra 0.76 de la
cola derecha (por lo tanto en la zona de no rechazo):
Con la funcin podemos obtener el mismo dato del ejemplo anterior pero ingresando las dos
columnas de Valor Observado Oi y Valor Esperado Ei con la formula PRUEBA.CHICUAD, como
se presenta en la imagen:
V.
Ejercicios
1. El vicepresidente de operaciones del First National Bank argumenta que los tres tipos de
crdito crditos para autos, crditos a estudiantes y crditos para propsitos generalesse conceden a los clientes en las mismas proporciones. Para probar su hiptesis, usted
recolecta datos sobre 200 crditos recientes y se encuentra que 55 fueron crditos para
autos, 47 para estudiantes y el resto para propsitos generales. Al nivel del 5%, qu le
dira usted al vicepresidente?
2. Dados los resultados del ejercicio anterior, usted acredita que los prstamos otorgados a
los clientes se ajustan a un patrn tal que la mitad son para propsitos generales y el resto
se dividen de manera equitativa entre los dos tipos de crditos restantes. Utilizando la
muestra del problema anterior, qu concluye al nivel del 5%?
3. A los compradores del centro comercial local se les pide calificar un nuevo producto en
una escala continua que comienza en cero. Con base en los siguientes datos agrupados,
puede usted concluir al nivel del 5% que los datos estn distribuidos normalmente, con
una media de 100 y una desviacin estndar de 25?
Calificacin
Frecuencia
Menos de 50
50-70
70-90
90-110
110-130
130-150
150-170
Ms de 170
1
51
112
151
119
43
21
2
4. Los analistas de Federated Stores plantean la hiptesis de que los ingresos de sus clientes
estn distribuidos normalmente. Con base en los datos suministrados aqu, qu conclusin
saca al nivel del 1%?
Ingreso ($1,000)
Frecuencia
Menos de 35
35-40
40-45
45-50
50-55
55-60
60-65
65-70
Ms de 70
1
4
26
97
96
65
8
2
1
5. TransWorld Airways desea determinar si existe alguna relacin entre el nmero de vuelos
que las personas toman y su ingreso. A qu conclusin llega al nivel del 1% con base en
los datos para 100 viajeros en la tabla de contingencia?
Ingreso
Menos de US$30,000
US$30,000-50,000
US$50,000-70,000
Ms de US$70,000
Nunca
20
8
7
2
Frecuencia de vuelos
Rara
Con frecuencia
vez15
2
5
8
5
1
12
15
10
VI. Bibliografa
11