Beruflich Dokumente
Kultur Dokumente
INGENIERA INDUSTRIAL
BONDAD DE AJUSTE........................................................................................2
o
ANALISIS JI-CUADRADA...............................................................................3
PRUEBA DE INDEPENDENCIA......................................................................4
TABLAS DE CONTINGENCIA.......................................................................13
PRUEBAS NO PARAMETRICAS.....................................................................17
o
ESCALA DE MEDICION................................................................................18
BONDAD DE AJUSTE
1
JOSUE DANIEL CASTILLO MOO
oi
f ei
i 1
f ei
fo i
fe i
Categoras o celdas.
2
JOSUE DANIEL CASTILLO MOO
2 t2; K m 1
Se rechaza H0 cuando
Frecuencia observada
Foi1
Foi2
.
.
Foik
Total
N
Donde para calcular la Frecuencia esperada se tiene:
2=
( foifei )2
fei
Frecuencia esperada
Fe1
Fe2
.
.
Fek
N
3
JOSUE DANIEL CASTILLO MOO
2=
i1
( foifei )2
fei
=0
>0
H0 se acepta
H0 se rechaza
o PRUEBA DE INDEPENDENCIA
La prueba de independencia trata de la comparacin de dos situaciones en las
cuales podemos esperar que sean dependientes o independientes, esto quiere
decir que, pueden o no estar relacionados sus datos debido a muchos factores
que pueden influir en ellos, o bien, un problema no tenga relacin con otro.
Su objetivo es determinar si alguna situacin es afectada por otra, basndose en
datos estadsticos y valores probabilstico obtenidos de la tabulacin de datos o de
pronsticos por medio de formulas y tablas, para esto se basa en un nivel de
significancia en un caso y en el otro a comparar, valindonos de tablas de
contingencia para obtener frecuencias esperadas y poder aplicarlas, para as
obtener datos comparativos que son determinantes en la decisin de
independencia.
Para todas las pruebas de independencia, las hiptesis son:
H0: las dos variables de clasificacin son independientes.
H1: las dos variables de clasificacin son dependientes.
Los mtodos para poner a prueba H 0 contra H1 son idnticos a los usados para
poner a prueba las diferencias entre proporciones poblacionales basados en la
prueba de 2. De nuevo compararemos las frecuencias observadas con las
4
JOSUE DANIEL CASTILLO MOO
siguiente frmula:
Grados de libertad
(Oiei)2
=
ei
i
2
v = (r-1)*(c-1)
5
JOSUE DANIEL CASTILLO MOO
Tabla de contingencia 2 x 3
Nivel de ingresos
Bajo
Medio
Alto
A favor
182
213
203
598
En contra
154
138
110
402
Total
336
351
313
1000
Reforma
Total
impositiva
6
JOSUE DANIEL CASTILLO MOO
P ( F )=
598
1000
336
1000
P ( A )=
P (M )=
351
1000
P (H )=
313
1000
402
1000
336
598
( 1000
)( 1000
)
336
402
( 1000
)( 1000
)
351
598
( 1000
)( 1000
)
351
402
( 1000
)( 1000
)
313
598
( 1000
)( 1000
)
313
402
( 1000
)( 1000
)
7
JOSUE DANIEL CASTILLO MOO
x 100 =
( 336 )( 598 )
1000
= 200.9
Medio
Alto
A favor
182(200.9)
213(209.9)
203(187.2)
598
En contra
154(135.1)
138(141.1)
110(125.8)
402
Total
336
351
313
1000
Reforma
Total
impositiva
8
JOSUE DANIEL CASTILLO MOO
2 >
(182200.9)2
200.9
(213209.9)2
209.9
(138141.1)
141.1
(203187.2)2
187.2
(154135.1)2
135.1
(110125.8)
125.8
= 7.85
P 0.02
0.05
= 5.991
9
JOSUE DANIEL CASTILLO MOO
2 (corregida)=
i
(|Oi ei|0.5)
ei
( OiEi )2
=
Ei
i=1
2
0
prueba es:
0 > , k p1 . En caso
contrario se acepta.
Donde t representa el valor proporcionado por las tablas, segn el nivel de
significacin elegido.
Cuanto ms se aproxima a cero el valor de ji-cuadrada, ms ajustadas estn
ambas distribuciones.
Un punto que cabe destacar en la aplicacin de este procedimiento de prueba se
refiere a la
20
no
P1
P ( ai1 X ai ) = f ( x ) dx
ai1
frecuencia observada
Oi
frecuencia observada
Ei
12
JOSUE DANIEL CASTILLO MOO
12
14
12
13
12
11
12
14
100
12.5
12.5
12.5
12.5
12.5
12.5
12.5
12.5
100
20=
i=1
( OiEi )2
Ei
>
0.05,5
= 11.07
( OiEi )2
=
Ei
i=1
2
0
(1212.5)2 (1412.5)2
(1412.5)2
+
+ +
=0.64
12.5
12.5
12.5
13
JOSUE DANIEL CASTILLO MOO
0 = 0.64 <
0.05,5
= 11.07 no puede
20
= 0.64 es P = 0.9861.
o TABLAS DE CONTINGENCIA
En muchas ocasiones, los n elementos de una muestra de una poblacin pueden
clasificarse con base en dos criterios diferentes. Entonces es de inters saber si
los dos mtodos de clasificacin son estadsticamente independientes.
Suponga que el primer mtodo de clasificacin tiene r niveles y que el segundo
tiene c niveles. Ser Oij la frecuencia observada del nivel i del primer mtodo de
clasificacin y el nivel j del segundo mtodo de clasificacin. Los datos
apareceran, en general, como en la siguiente tabla. A una tabla como esta se le
llama tabla de contingencia r x c.
Renglones
TABLA DE CONTINGENCIA r x c
Columnas
1
2
1
O11
O12
O1c
O21
O22
O2c
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Orl
Or2
Orc
1
1
u^ i= oij v^ j = o ij
n j=1
n i=1
1
Eij =n u^ i v^ j= oij o ij
n j=1 i=1
Entonces, para n grande, el estadstico
( OijEij )2
=
Eij
i=1 j=1
2
0
Tiene una distribucin ji-cuadrada aproximada con (r-1) (c-1) grados de libertad si
la hiptesis nula es verdadera. Por lo tanto, la hiptesis de independencia se
rechazara si el valor observado del estadstico de prueba
20
excediera
2 ,(r1)(c1) .
Para calcular grados de libertad se tiene la siguiente frmula:
gl= (r-)(c-1)
NOTA: El clculo de grados de libertad nos dar la pauta para calcular el valor
total de frecuencias.
Ejemplo:
Una compaa tiene que elegir entre tres planes de pensiones. La administracin
quiere saber si la preferencia por los planes es independiente de la clasificacin
laboral y desea usar = 0.05.
15
JOSUE DANIEL CASTILLO MOO
totales
Trabajadores asalariados
160
140
40
340
40
60
60
160
Totales
200
200
100
500
Clasificacin laboral
0.40 y
ecuacin
c
1
Eij =n u^ i v^ j= oij o ij
n j=1 i=1
Por ejemplo, el nmero esperado de trabajadores asalariados que prefieren el plan
de pensin 1 es
Eij =n u^ i v^ j=500 ( 0.68 ) ( 0.40 )=136
En la siguiente tabla se muestran las frecuencias esperadas.
Plan de pensin
Clasificacin laboral
Trabajadores asalariados
Trabajadores por hora
Totales
totales
136
136
68
340
64
64
32
160
200
200
100
500
16
JOSUE DANIEL CASTILLO MOO
20=
i=1 j=1
( OijEij )2
Eij
7. clculos
( OijEij )2
=
Eij
i=1 j=1
2
0
+
+
+
+
+
=49.63
136
136
68
64
64
32
20
= 49.63 >
20.05,2=5.99 , se rechazar la
17
JOSUE DANIEL CASTILLO MOO
PRUEBAS NO PARAMETRICAS
o ESCALA DE MEDICION
Definicin de escala
Cualquier recurso para determinar la magnitud o cantidad de un objeto o hecho de
cualquier clase; instrumento para asignar un nmero o guarismo que indicar
cunto hay de algo; un recurso de medicin que provee un conjunto de normas
(numeradas de acuerdo con ciertas reglas de trabajo) con las que se puede
comparar el objeto que ser medido, para asignarle un nmero o valor matemtico
que represente su magnitud. El trmino es de amplia aplicacin: una escala de
alguna clase est incluida en toda medicin o estimacin. Implcito en cada caso
hay un conjunto de reglas para asignar nmeros o valores: son estas reglas las
19
JOSUE DANIEL CASTILLO MOO
llegar
un
ndice
general.
propiedad
medida.
Con esto notamos que esta escala no puede ser usada en los fenmenos
psicolgicos, pues no se puede hablar de cero inteligencia o cero aprendizaje,
etc.
21
JOSUE DANIEL CASTILLO MOO
. El
son o
Suposiciones
1 Si
son independientes.
Mtodo
La hiptesis nula es
:
. Retrotrayendo dicha hiptesis a los valores
originales, sta vendra a decir que son en cierto sentido del mismo tamao.
Para verificar la hiptesis, en primer lugar, se ordenan los valores
absolutos
y se les asigna su rango
. Entonces, el estadstico de
la prueba de los signos de Wilcoxon,
, es
En ocasiones, esta prueba se usa para comparar las diferencias entre dos
muestras de datos tomados antes y despus del tratamiento, cuyo valor central se
espera que sea cero. Las diferencias iguales a cero son eliminadas y el valor
absoluto de las desviaciones con respecto al valor central son ordenadas de
menor a mayor. A los datos idnticos se les asigna el lugar medio en la serie. La
suma de los rangos se hace por separado para los signos positivos y los
negativos. S representa la menor de esas dos sumas. Comparamos S con el valor
22
JOSUE DANIEL CASTILLO MOO
23
JOSUE DANIEL CASTILLO MOO
De modo que esta ecuacin puede servir como una verificacin del
procedimiento de asignacin de rangos. La prueba de hiptesis nula puede ser de
dos extremos o de un extremo dependiendo de si estamos probando si las dos
medianas de poblacin son exclusivamente diferentes o si una de ellas es mayor
que la otra.
Cuando los tamaos de ambas muestras n1 y n2 son 10, se puede usar la tabla
para obtener los valores crticos de la estadstica de prueba T1 para pruebas de
uno y dos extremos, a varios niveles de significacin.
Para una prueba de dos extremos y para un nivel particular de significacin , si el
valor calculado de T1 es igual o mayor que el valor critico superior o si es menor o
igual que el valor critico inferior, la hiptesis nula pude ser rechazada.
Para pruebas de un extremo que tiene la hiptesis alternativa H1: M1 < M2, la
regla de decisin consiste en rechazar la hiptesis nula si el valor observado de
T1 es menor o igual que el valor critico inferior. Para la pruebas de un extremo
cuya hiptesis alternativa sea H1: M1 > M2, la regla de decisin consiste en
rechazar la hiptesis nula si el valor observado de T1 es igual o mayor que el valor
critico superior.
Utilizamos como estadstico de prueba:
Donde:
T1 = suma de rangos de la primera muestras.
N1 = nmero de observaciones de la primera muestra.
N2 = numero de observaciones de la segunda muestra.
Basndonos en el nivel de significacin seleccionado, la hiptesis nula puede
ser rechazada si el valor Z calculado cae en la regin de rechazo apropiada,
dependiendo de si se trata de una prueba de dos extremos o de uno solo.
24
JOSUE DANIEL CASTILLO MOO
en
datos
apareados
que
se
seleccionan
25
JOSUE DANIEL CASTILLO MOO
Criterios a considerar:
T= se elige a la ms pequea de las siguientes sumas:
La suma de los valores absolutos de los rangos negativos de las diferencias
d
La suma de los rangos positivos de las diferencias d
Si el tamao de la muestra es menor a 30, entones empleamos estadstico
T y se compara con T critico de tablas.
Si el valor de TOBT es menor o igual a TCRI rechazamos Ho
La suma de los rangos debe ser igual a T1 + T2 = n ( n + 1)/ 2
26
JOSUE DANIEL CASTILLO MOO
27
JOSUE DANIEL CASTILLO MOO
28
JOSUE DANIEL CASTILLO MOO
29
JOSUE DANIEL CASTILLO MOO
30
JOSUE DANIEL CASTILLO MOO
31
JOSUE DANIEL CASTILLO MOO
Llantas radiales
4.2
4.7
6.6
7.0
6.7
4.5
5.7
6.0
7.4
4.9
6.1
5.2
5.7
6.9
6.8
4.9
32
JOSUE DANIEL CASTILLO MOO
2= 0
H1: 1- 2 > 0
2.
3. = 0.05
Z= 10.5 7 = 1.87
14/2
Y entonces P= P(X 11) P ( Z>1.87)= 0.0307
6. DECISION: rechazar Ho y concluir que, en promedio, las llantas
radiales mejoran la economa de combustible.
33
JOSUE DANIEL CASTILLO MOO
H0
F0 (x )
F0 ( x )
es continua y la muestra
F0 ( x )
es continua, es la basad en
F0 (x ) , se rechaza.
H 0 : F (x) F 0( x) , en donde
F0 (x )
se
a las observaciones
34
JOSUE DANIEL CASTILLO MOO
y defnase la funcin de
de la muestra aleatoria,
menores a
x . Ya que
posible evaluar a
este ltimo
F0 ( x )
x , y entonces compara
S n ( x) . Si la hiptesis nula es
La estadstica
Dn
Dn
es una estadstica
Dn
dn
que se encuentran en la
35
JOSUE DANIEL CASTILLO MOO
de
mayores de 50.
Para un tamao
P Dn >
c
= .
n
Dn
H0
.
Como se hizo anteriormente, la estadstica de Kolmogorov Smirnov es, en
general, superior a la prueba de bondad de ajuste chi cuadrada cuando los datos
involucran una variable aleatoria continua, debido a que no es necesario agrupar
los datos. Adems, la prueba de Kolmogorov Smirnov tiene la atractiva
propiedad de ser aplicable a muestras de tamao pequeo. Por otro lado, la
estadstica se encuentra limitada, ya que el modelo propuesto bajo
H0
debe
36
JOSUE DANIEL CASTILLO MOO
(observar
que los datos se deben ordenar) vienen de una distribucin con funcin
acumulativa F
A2 = N S
Donde:
H0
37
JOSUE DANIEL CASTILLO MOO
Donde:
x ( i)
Donde:
Siendo m1,..., mn son los valores medios del estadstico ordenado, de variables
aleatorias
independientes
idnticamente
distribuidas,
muestreadas
de
BIBLIOGRAFIA BASICA
38
JOSUE DANIEL CASTILLO MOO
39
JOSUE DANIEL CASTILLO MOO