Sie sind auf Seite 1von 11

Folleto de apoyo para el curso de Mtodos Cuantitativos

DISTRIBUCIN CHI-CUADRADO (x2)


I.

Objetivo

Analizar, comparar e interpretar datos por medio de la distribucin chi cuadrado (x2),
solucionando con creatividad los problemas.

II.

Apoyo terico

En nuestro que hacer gerencial, muchas veces no conocemos los supuestos bsicos para realizar
una prueba estadstica, es decir, no podemos asumir si esta distribuida normalmente, que su
varianza se ajusta a ciertos parmetros o que la poblacin se comporta de tal o cual forma. En
estos casos, cuando no conocemos la distribucin, utilizamos pruebas no paramtricas.
En la prueba chi cuadrada (x2) existe una distribucin para cada grado de libertad1 y conforme
aumenta el nmero de grados de libertad se vuelve menos sesgada. Las aplicaciones ms comunes
de x2 son:
1. Pruebas de bondad de ajuste
2. Pruebas de independencia

Especficamente, utilizaremos la prueba de bondad de ajuste cuando deseamos comprobar que


los datos muestrales observados se ajustan a un tipo de distribucin poblacional conocida y
1

Grados de libertad (g.l.), definidos como el nmero de observaciones que se pueden escoger
libremente (menos restricciones impuestas sobre tales observaciones).
1

planteada en forma de hiptesis. Si se comprueba que se ajusta razonablemente al tipo de


distribucin planteado, se concluye que nuestra hiptesis es correcta.
Bsicamente x2 analiza las diferencias entre los resultados esperados en la distribucin planteada
como hiptesis (relativa a la poblacin) y los datos reales que nos proporciona la muestra, se
expresa como sigue:
K

2
i 1

(oi Ei ) 2
Ei

En donde:
Oi = Frecuencia de los eventos observados en la muestra
Ei = Frecuencia de los eventos esperados, si la hiptesis nula es correcta
K = Nmero de categoras o clases
En la prueba x2 los grados de libertad (g.l.) se tiene K-m-1, donde m es el nmero de parmetros a
estimar.
Tambin es comn poder utilizar pruebas de independencia o tablas de contingencia cuando
queremos comparar dos atributos para determinar si existe una relacin entre ellos, recordando
que estos son los que expresan cualidades o caractersticas de la poblacin (datos cualitativos).

III. Casos
El gerente de mercadeo de una importante importadora de vehculos de lujo (VIP) en la capital
guatemalteca debe estimar el inventario de vehculos para el nuevo trimestre, anteriormente lo ha
realizado con base a su criterio subjetivo y experiencia empirismo-. En realidad lo que ha hecho
es asumir que los cuatro modelos tienen la misma probabilidad de ser demandados, pero este
trimestre, ha decidido contratarlo a usted para estimar el stock.
Como primer paso, usted plantea sus hiptesis de trabajo, como buen analista no desprecia la
experiencia del gerente y decide probar la hiptesis de demanda con comportamiento uniforme,
las hiptesis son:
Ho=La demanda es uniforme para los cuatro modelos
HA=La demanda no es uniforme para los cuatro modelos
Como segundo paso, selecciona una muestra aleatoria de cuarenta y ocho autos vendidos durante
el ultimo trimestre (n=48), lo que esperamos comprobar es que se venden 12 autos de cada
modelo (48/12, es decir demanda uniforme).
Modelo

Ventas observadas (Oi)

Ventas esperadas (Ei)


2

A
B
C
D
TOTAL
Sustituyendo valores en la frmula:

15
11
10
12
48

12
12
12
12
48

(15 12) 2 (11 12) 2 (10 12) 2 (12 12) 2

1.17
12
12
12
12

Un nivel de comprobacin del 5%, con grados de libertad (g.l) m-4-1=3 (como no hay parmetros
m es 0), resulta de la tabla de la distribucin x2, un valor de 7.815.

Como 1.17 es menor que 7.815 (valor crtico) queda dentro de la zona de no rechazo, por lo tanto
la hiptesis nula (Ho) sobre la demanda uniforme no se rechaza. Conclusin: pueden preverse los
cuatro modelos con el mismo nmero de unidades cada uno para este nuevo trimestre.
Zona de no rechazo

Zona de rechazo

1.17

7.815

Como buen analista, desea confrontar los resultados con otra hiptesis, segn sus estudios y
ponderaciones de mercado el comportamiento esperado ser:
Ho=La demanda mantiene un patrn de 42% para el modelo A, 33% para el modelo
D y 12.5% para cada modelo B y C respectivamente
HA=El patrn deseado no se mantiene
Esta es una prueba de ajuste a un patrn especfico, es decir se prueban las frecuencias contra un
patrn determinado donde no son todas iguales:

Modelo

Frecuencias observadas (Oi)


A
15
B
11
C
10
D
12
TOTAL
48
Sustituyendo valores en la frmula:

Frecuencias esperadas (Ei)


(48)*(0.42)=20
(48)*(0.125)=6
(48)*(0.125)=6
(48)*(0.33)=16
48

(15 20) 2 (11 6) 2 (10 6) 2 (12 16) 2

9.08
20
6
6
16

Como 9.08 es mayor que 7.815 (valor crtico) queda dentro de la zona de rechazo, por lo tanto la
hiptesis nula (Ho) sobre la demanda con patrn establecido se rechaza. Conclusin: el patrn del
estudio de mercado se rechaz por medio del comportamiento histrico de la demanda uniforme
de los modelos.
Zona de no rechazo

Zona de rechazo

7.815

9.08

Por otro lado y como parte tambin de su contrato de asesora, le solicitan evaluar el
comportamiento del taller de servicio para la marca de lujo (VIP), el gerente financiero le ha
proporcionado el imperativo dato para cubrir costos y tener la rentabilidad deseada por la JDnecesitamos: un servicio promedio de $.600.00 y se acepta una desviacin estndar de $10.00.
Como primera tarea se decide verificar si lo que actualmente se esta generando tiene las
caractersticas de una distribucin normal o prueba de normalidad (si comprobamos este
supuesto, podremos hacer inferencias confiadamente), para esto tomamos al azar una muestra de
la base de datos de n=1,000 servicios del ltimo semestre y planteamos nuestras hiptesis como
sigue:
Ho=Los servicios estn distribuidos normalmente
HA= Los servicios no estn distribuidos normalmente
Servicios ($)
0 y por debajo de 580
580 y por debajo de 590
590 y por debajo de 600
600 y por debajo de 610
610 y por debajo de 620

Frecuencia real (Oi)


20
142
310
370
128
4

620 y por encima


Total

30
1,000

Estas observaciones reales debemos compararlas con las que esperaramos encontrar si la
distribucin fuera normal. Para determinar las frecuencias esperadas debemos calcular las
probabilidades de que los datos tomados de la muestra aleatoriamente estn contenidos
dentro de los intervalos estimados. Es decir, la probabilidad de que un dato caiga en el primer
intervalo es P(0<X<580):

580 600
2 rea 0.4772
10

P(0<X<580)=0.50-0.4772=0.0228
Esto significa que existe 2,2% de probabilidad que ningn servicio prestado tenga una factura
menor a $580.00 dado que el monto promedio que se necesita es $600.00 y desviacin
estndar de $10.00. De la misma manera se calculan los intervalos siguientes, dando como
resultado la tabla siguiente, con su respectiva frecuencia esperada (n)*(p) :
Servicios ($)
0 y por debajo de 580
580 y por debajo de 590
590 y por debajo de 600
600 y por debajo de 610
610 y por debajo de 620
620 y por encima
Total

Frecuencia
real (Oi)
20
142
310
370
128
30
1,000

Probabilidades
(pi)
0.0228
0.1359
0.3413
0.3413
0.1359
0.0228
1.0

Frecuencias
esperadas (Ei)
22.8
135.9
341.3
341.3
135.9
22.9
1,000

Sustituyendo valores en la frmula:

(20 22.8) 2 (142 135.9) 2


(30 22.8) 2

...
8.63
22.8
135.9
22.8

Como 8.63 es menor que 11.07 (valor crtico) queda dentro de la zona de no rechazo, por lo tanto
la hiptesis nula (Ho) sobre la normalidad de la distribucin no se rechaza. La hiptesis se
comprueba con un nivel de 5% y existen grados de libertad (g.l) m-6-1=5 (como no hay parmetros
m es 0). Conclusin: Los servicios tienen un comportamiento de distribucin normal.

Zona de no rechazo

Zona de rechazo

8.63

11.07

Nota importante: La m es 0 porque conocemos la media poblacional y su desviacin estndar,


pero si no fueran conocidas entonces m=2 y grados de libertad (g.l) 6-2-1=3. Tambin debemos de
considerar que la prueba de bondad de ajuste es confiable solamente si la Frecuencia Esperada Ei
5.
Como usted es muy proactivo siendo asesor de la distribuidora de autos de lujo (VIP), ha decidido
seguir comprobando sus suposiciones -hiptesis- y ahora desea determinar si existe relacin entre
el ingreso de los clientes y la importancia que le dan al precio del servicio de mantenimiento, esto
se realiza por medio de tablas de contingencia o prueba de independencia:
Ho=Ingresos e importancia del precio del servicio son independientes
HA= Ingresos e importancia del precio del servicio no son independientes

Los 538 clientes de la muestra, los agrupamos en tres niveles de ingreso atributo B- y la
importancia al precio del servicio atributo A- en tres niveles de significancia, la tabla siguiente
corresponde a Frecuencia real (Oi):

Atributo A
Nivel de
importancia
Grande
Moderado
Poco
Total

Bajo
83
52
63
198

Frecuencia real (Oi)


Atributo B: Ingreso
Medio
Alto
62
71
58
191

37
49
63
149

Total
182
172
184
538

Los datos para la Frecuencias esperadas (Ei) sern:

Atributo A
Nivel de
importancia
Grande
Moderado
Poco
Total

Bajo
198*0.3383
66.98
198*0.3197
63.32
198*0.3420
67.72
198

Frecuencia esperadas (Ei)


Atributo B: Ingreso
Medio
Alto
191*0.3383
64.62
191*0.3197
61.06
191*0.3420
65.32
191

149*0.3383
50.41
149*0.3197
47.64
149*0.3420
50.96
149

Total
182/538
33.83%
172/538
31.97%
184/538
34.20%
538

Sustituyendo valores en la frmula:

(83 66.98) 2 (62 64.62) 2


(63 50.96) 2

...
15.17
66.98
64.62
50.96

La hiptesis decidimos comprobarla con un nivel de 1% y existen grados de libertad (g.l) (filas1)(columnas-1) esto es (3-1)(3-1)= 4. Buscando en la tabla:

Como 15.17 es mayor que 13.28 (valor crtico) queda dentro de la zona de rechazo, por lo tanto la
hiptesis nula (Ho) sobre la independencia de los atributos se rechaza. Conclusin: Existe una
relacin entre el ingreso y la importancia que le da al precio del servicio de mantenimiento del
auto de lujo.
Zona de no rechazo

Zona de rechazo

13.28

15.17

IV. Caso con Excel


Se procede a realizar el clculo del valor crtico X2 con la funcin INV.CHICUAD.CD donde,
probabilidad es el grado de significancia (5%), los grados de libertad son K-m-1 y se obtiene el
resultado de 7.81del primer ejemplo:

Para tener la probabilidad en lugar del valor crtico, se procede a realizar el clculo con la
funcin DISTR.CHICUAD.CD donde X es el valor crtico que se busca y los grados de libertad son
K-m-1, se obtiene el resultado de 0.76 que en el caso del primer ejemplo significa que el valor

no se encuentra hasta 0.05 de la cola derecha (en la zona de rechazo), se encuentra 0.76 de la
cola derecha (por lo tanto en la zona de no rechazo):

Con la funcin podemos obtener el mismo dato del ejemplo anterior pero ingresando las dos
columnas de Valor Observado Oi y Valor Esperado Ei con la formula PRUEBA.CHICUAD, como
se presenta en la imagen:

V.

Ejercicios

1. El vicepresidente de operaciones del First National Bank argumenta que los tres tipos de
crdito crditos para autos, crditos a estudiantes y crditos para propsitos generalesse conceden a los clientes en las mismas proporciones. Para probar su hiptesis, usted
recolecta datos sobre 200 crditos recientes y se encuentra que 55 fueron crditos para
autos, 47 para estudiantes y el resto para propsitos generales. Al nivel del 5%, qu le
dira usted al vicepresidente?

2. Dados los resultados del ejercicio anterior, usted acredita que los prstamos otorgados a
los clientes se ajustan a un patrn tal que la mitad son para propsitos generales y el resto
se dividen de manera equitativa entre los dos tipos de crditos restantes. Utilizando la
muestra del problema anterior, qu concluye al nivel del 5%?
3. A los compradores del centro comercial local se les pide calificar un nuevo producto en
una escala continua que comienza en cero. Con base en los siguientes datos agrupados,
puede usted concluir al nivel del 5% que los datos estn distribuidos normalmente, con
una media de 100 y una desviacin estndar de 25?
Calificacin
Frecuencia
Menos de 50
50-70
70-90
90-110
110-130
130-150
150-170
Ms de 170

1
51
112
151
119
43
21
2

4. Los analistas de Federated Stores plantean la hiptesis de que los ingresos de sus clientes
estn distribuidos normalmente. Con base en los datos suministrados aqu, qu conclusin
saca al nivel del 1%?
Ingreso ($1,000)

Frecuencia

Menos de 35
35-40
40-45
45-50
50-55
55-60
60-65
65-70
Ms de 70

1
4
26
97
96
65
8
2
1

5. TransWorld Airways desea determinar si existe alguna relacin entre el nmero de vuelos
que las personas toman y su ingreso. A qu conclusin llega al nivel del 1% con base en
los datos para 100 viajeros en la tabla de contingencia?

Ingreso
Menos de US$30,000
US$30,000-50,000
US$50,000-70,000
Ms de US$70,000

Nunca
20
8
7
2

Frecuencia de vuelos
Rara
Con frecuencia
vez15
2
5
8
5

1
12
15
10

VI. Bibliografa

Webster Allen. Estadstica aplicada a los negocios y la economa. McGraw Hill.


Colombia
Anderson, Sweeney, William. Estadstica para Administracin y Economa. Octava
Edicin.
Levin & Rovin. Estadstica para administradores. Prentice Hall. Mxico. 1996.
Mendenhall / Reinmuth. Estadstica para administracin y economa. Grupo Editorial
Iberoamericana. 3. Edicin.
Spiegel, Murray. Estadstica. Editorial McGraw Hill. Serie Schaum. Segunda Edicin.
1994.
Prez Lpez, Csar. Estadstica aplicada a travs de Excel. 2. Ed. Prentice Hall. 2002.

Pginas de internet recomendadas:


http://nces.ed.gov/nceskids/graphing
http://www.statsoft.com/textbook/stathome.html

11

Das könnte Ihnen auch gefallen