Beruflich Dokumente
Kultur Dokumente
1 Coeficiente de
correlacin
Correlacin
Definiciones
Regresin
Correlacin
Accidentes laborales
Propsito:
Propsito: Estudiar
Estudiar la
la posible
posiblerelacin
relacin
entre
entredos
dosvariables.
variables.
Correlacin
positiva,
posible
Coeficiente de correlacin (r )
20
20
15
15
10
Correlacin Positiva
Evidente
25
10
5
0
10
15
20
Sin Correlacin
0
25
0
0
10
25
R=1
15
20
25
R=-1
20
15
25
Correlacin
Positiva
Correlacin
Negativa
5
0
0
20
10
15
X
15
10
20
25
25
R=
0
20
15
Y
10
10
5
0
0
10
15
X
20
25
R=>1
0
0
10
15
X
20
25
R=>-1
Coeficiente de correlacin
Coeficiente de correlacin
Reglas empricas
Coeficiente de correlacin
0.8 < r < 1.0
0.3 < r < 0.8
-0.3 < r < 0.3
-0.8 < r < -0.3
-1.0 < r < -0.8
Relacin
Fuerte, positiva
Dbil, positiva
No existe
Dbil, negativa
Fuerte, negativa
Correlaciones (Pearson)
Tabla de Correlacin mnima
n
3
4
5
6
7
8
9
10
11
12
13
14
95%
99%
de confianza
de confianza
1.00
1.00
0.95
0.99
0.88
0.96
0.81
0.92
0.75
0.87
0.71
0.83
0.67
0.80
0.63
0.76
0.60
0.73
0.58
0.71
0.53
0.68
0.53
0.66
n
15
16
17
18
19
20
22
24
26
28
30
95%
de confianza
0.51
0.50
0.48
0.47
0.46
0.44
0.42
0.40
0.39
0.37
0.36
99%
de confianza
0.64
0.61
0.61
0.59
0.58
0.56
0.54
0.52
0.50
0.48
0.46
Correlacin
La correlacin puede usarse para informacin de atributos, variables
normales y variables no normales.
La correlacin puede usarse con un predictor o ms para una
respuesta dada.
La correlacin es una prueba fcil y rpida para eliminar factores que
no influyen en la prediccin, para una respuesta dada.
Coeficiente de Correlacin
Para determinar que tanto se acercan los datos predichos por el
modelo a los datos observados aplicando el coeficiente de
correlacin de Pearson (ver tabla anterior para identificar la
significancia)
S(yeyo)
r=
S(yeye) S(yoyo)
S(yeye) = yei 2
S(yoyo) = y 2
oi
yei)2
n
yoi)2
n
yei)yoi)
n
r = Coeficiente de correlacin
yo = Respuesta observada
ye = Respuesta esperada
10
R2(Adj) = 1 (1 r2)
(n-1)
(n-p)
Criterios
Donde :
R2(Adj) = Coeficiente de correlacin ajustado
r = Coeficiente de correlacin de Pearson
n = Nmero de datos
p = Nm. trminos en el modelo
(Incluyendo la constante)
en funcin a la R2(Adj)
Coeficiente de Determinacin
(R2)
El coeficiente de determinacin es la
proporcin de la variacin total explicada por
la regresin, R2 se encuentra en el rango de
valores de 0 a 1.
12
Correlacin vs causacin
13
VI.A.2 Regresin
14
Anlisis de Regresin
El
Elanlisis
anlisisde
deregresin
regresines
esun
unmtodo
mtodoestandarizado
estandarizadopara
paralocalizar
localizar
lalacorrelacin
correlacinentre
entredos
dosgrupos
gruposde
dedatos,
datos,y,y,quiz
quizms
msimportante,
importante,
crear
crearun
unmodelo
modelode
deprediccin.
prediccin.
Puede
Puedeser
serusado
usadopara
paraanalizar
analizarlas
lasrelaciones
relacionesentre:
entre:
Una
Unasola
solaX
Xpredictora
predictorayyuna
unasola
solaY
Y
Mltiples
Mltiplespredictores
predictoresX
Xyyuna
unasola
solaY
Y
Varios
Variospredictores
predictoresX
Xentre
entress
15
Supuestos de la regresin
lineal
Los principales supuestos que se hacen en el anlisis de
regresin lineal son los siguientes:
La relacin entre las variables Y y X es lineal, o al
menos bien aproximada por una lnea recta.
y 0 1 X
y 0 1 X
17
ei
xi
SSE =
ei
yi - yi
a y b son
Estimados de
0 y 1
Recta de regresin
Y=-.600.858+5738.89X
R2 = .895
Retencin
600
Regresin
500
95% Intervalo
de confianza
95% Intervalo
de prediccin
400
0.18
0.19
Altura del muelle
0.20
Errores residuales
22
Errores residuales
^
Checar normalidad.
Checar el efecto del tiempo si su orden es conocido en
los datos.
Checar la constancia de la varianza y la posible
necesidad de transformar los datos en Y.
Checar la curvatura de ms alto orden que ajusta en las
Xs.
di
MS E
,....1 1,2,....., n
1 (X X )
MSE 1 i
S XX
n
23
Errores residuales
24
Ejemplo
Considere el problema de predecir las ventas
mensuales en funcin del costo de publicidad.
Calcular el coeficiente de correlacin, el de
determinacin y la recta.
MES
Publicidad
1
2
3
4
5
6
7
8
9
1.2
0.8
1.0
1.3
0.7
0.8
1.0
0.6
0.9
101
92
110
120
90
82
93
75
91
Ventas
25
Clculo manual
Calcular columnas para Suma X, Suma Y, Xi2, XiYi y Yi2
Xi
Yi
MES Publicidad Ventas
Xi2 XiYi
Yi2
1
2
3
4
5
6
7
8
9
10
1.2
0.8
1.0
1.3
0.7
0.8
1.0
0.6
0.9
1.1
101
92
110
120
90
82
93
75
91
105
1.44
0.64
1.00
1.69
0.49
0.64
1.00
0.36
0.81
1.21
121.2 10201
73.6
8464
110.0 12100
156 14400
63.0
8100
65.6
6724
93.0
8649
45.0
5625
81.9
8281
115.5 11025
SUMA 9.4
959
9.28
924.8
93,569
26
Mtodo de mnimos
cuadrados
Donde:
Yest = Valor predicho de para un valor particular de x.
b0 = Estimador puntual de .(ordenada al origen)
b1= Estimador puntual de (pendiente)
Para el clculo de b0 y b1 se utilizamos las siguientes
frmulas:
27
Anlisis de varianza en la
regresin
SS E
S b1 S XY
S2
YY
n2
n2
SYY Yi 2
i 1
ei Yi Y i
__
Y
n
__
__
Yi Y i Yi Y (Y i Y ) (Y
X Y
i 1
S XY X iYi
i 1
__
i 1
Y ) 2 (Y i Y ) 2 (Yi Y i ) 2
28
i 1
1
t ( n 2,1 ). S
2
b1
__
(
X
X
i )2
Anlisis de varianza en la
regresin
se(b1 )
__ 2
1 X
se(b0 ) MSE
n S XX
X i2
1/ 2
__
n ( X i X )
MSE
S XX
S
S XX
1
b0 t (n 2,1 )
2
1/ 2
2
i
__
n ( X i X )
b1
t ( n 2,1
( X
1
). S
2
__
X )2
29
1
t ( n 2,1 ). S
2
b1
__
(
X
X
i )2
Anlisis de varianza en la
regresin
( n 2) MSE
( n 2) MSE
2
2 / 2 ,n 2
12 / 2,n 2
Intervalos de confianza para la Y estimada promedio
^
Y0 t a / 2 , n 2
__
2
1 (X0 X )
MSE
S XX
n
__
(
X
X
)2
1
0
MSE 1
Y0 Y0 t / 2 ,n 2
n
S XX
__
1 ( X 0 X )2
MSE 1
n
S XX
30
1
t ( n 2,1 ). S
2
b1
__
(
X
X
i )2
Anlisis de varianza en la
regresin
b1
MSE
S XX
31
1
t ( n 2,1 ). S
2
b1
__
(
X
X
i )2
Anlisis de varianza en la
regresin
Coeficiente de correlacin r:
S XY
S XX SYY
Coeficiente de determinacin: r2
R2 mide la proporcin de la variacin total respecto a la
media que es explicada por la regresin. Se expresa en
porcentaje.
^
( SS .de.la.regresin . por.b0 )
R2
__
(Y Y )
(Y Y )
__
1
2
32
SSE
SYY
1
t ( n 2,1 ). S
2
b1
__
(
X
X
i )2
Anlisis de varianza en la
regresin
r n2
1 r2
33
Riesgos de la regresin
34
Riesgos de la regresin
Ejemplo (cont..)
Clculo de S2 estimador de
S2 = SSE / (n - 2) = Syy - (Sxy)^2/Sxx
Syy = 93,569 - (959)^2 / 10 = 1600.9
SSE = Syy - b1*Sxy = 1600.9 - (52.567)(23.34) = 373.97
S2 = SSE / (n - 2) = 373.97 / 8 = 46.75
S = 6.84
El intervalo de confianza donde caern el 95% de los puntos
es el rango de 1.96S = 13.41 o sea a 13.41 de la lnea.
37
Ejemplo (cont..)
Inferencias respecto a la pendiente de la lnea b1:
Se usa el estadstico t = b1 / (S / Sxx)
El trmino del denominador es el error estndar de la
pendiente.
Para probar la hiptesis nula Ho: 1 = 0
En este caso tc = 52.57 / (6.84 / 0.444) = 5.12
El valor crtico tcrit. para alfa/2 = 0.025 con (n-2) = 8 grados
de libertad es 2.306.
Como tc > tcrtico se rechaza la hiptesis de que b1 = 0
existiendo la regresin.
38
Ejemplo (cont..)
Estableciendo un 95% de confianza para la pendiente de
la recta b1.
Usando la frmula b1 t0.025 (S / Sxx) se tiene:
52.57 2.306 * 6.84 / 0.444 = 52.57 23.67.
Por tanto una unidad de incremento en publicidad, har que
el volumen de ventas se encuentre entre $28.9 a $76.2.
39
Ejemplo (cont..)
Clculo del coeficiente de Correlacin:
________
r = Sxy / (SxxSyy)
____________
r = 23.34 / 0.444*1600.9 = 0.88
Como r es positivo, la pendiente de la recta apunta hacia
arriba y a la derecha.
El coeficiente de determinacin r^2 = 1 - SSE/Syy
r^2 = ( Syy - SSE ) / Syy = 0.774
40
Anlisis de Regresin
1. Teclear los datos para Xi y Yi
2. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o
ANALISIS DE DATOS, CORRELATION o CORRELACIN
3. Dar INPUT RANGE (rango de datos), OUTPUT RANGE
(para los resultados) y obtener los resultados
Column 1 Column 2
Column 1 1
0.875442
Column 2 0.875442 1
Resultados de Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.875442
R Square 0.766398
Adjusted R Square0.737198
Standard Error 6.83715
Observations 10
ANOVA
df SS MS F Significance F
Regression 1
1226.927 1226.927 26.24633 0.000904
Residual
8
373.973 46.74662
Total
9
1600.9
Confidence 95%
Standard Error t Stat
P-value Lower
Upper
Intercept 46.48649
9.884566
4.702936
Coefficients
28.90597 76.22916
100
80
60
40
20
0
0
20
40
60
80
Sample Percentile
44
100
Residuals
20
10
0
-10 0
0.5
1.5
X Variable 1
45
Ejercicio
Calcular la recta de prediccin con sus bandas de
confianza, la correlacin y la determinacin para la
respuesta de un Taxi, los datos se muestran a
continuacin:
Distancia Tiempo
0.8
200
2.2
1.0
0.6
1.0
1.4
2.2
0.6
400
160
120
360
280
560
320
46
Relaciones no Lineales
Qu pasa si existe una relacin causal, no lineal?
El siguiente es un conjunto de datos
experimentales codificados, sobre
resistencia a la compresin de una
aleacin especial:
Cmo describira
esta relacin?
Resistencia a
Concentracin la Compresin
x
y
10.0
25.2 27.3 28.7
15.0
29.8 31.1 27.8
20.0
31.2 32.6 29.7
25.0
31.7 30.1 32.3
30.0
29.4 30.8 32.8
(ref. Walpole & Myers, 1985)
47
DF
SS
MS
F
p
2 38.9371 19.4686 9.54490 3.31E-03
12 24.4762 2.0397
14 63.4133
FUENTE DF
Lineal
1
Cuadrtica 1
Seq SS F
p
28.0333 10.3005 6.84E-03
10.9038 5.34584 3.93E-02
48
Regresin cuadrtica
49
Regresin cuadrtica
50
Regresin cuadrtica
Los residuos
No son normales
Se deben transformar
Las variables
51
x = log x
Trasformacin de funciones
Ejemplo: seaY e 1 X
0
se transforma como
ln Y ln 0 1 X ln
54
55
56
Transformacin para
homoestacidad de la varianza
57
Transformacin para
homoestacidad de la varianza
58
Transformacin para
homoestacidad de la varianza
59
Transformacin para
homoestacidad de la varianza
60
Transformacin para
homoestacidad de la varianza
61
Transformacin para
homoestacidad de la varianza
62
Transformacin para
homoestacidad de la varianza
63
Transformacin para
homoestacidad de la varianza
64
65
Regresin mltiple
Yu 0 1 X u1 2 X u 2 ....... k X uk u
Se asume que los errores u tienen las caractersticas
siguientes:
Tienen media cero y varianza comn 2.
Son estadsticamente independientes.
Estn distribuidos en forma normal.
66
Regresin mltiple
Estimacin de los parmetros del modelo
Regresin mltiple
Estimacin de los parmetros del modelo:
b = (XX)-1 XY
El vector de valores ajustados
Y Xb
como:
se puede expresar
Y Xb X ( X ' X ) 1 X ' Y Hy
i 1
2
i
SSE (Y Xb)' (Y Xb) Y ' Y b' X ' Y Y ' Xb b' X ' Xb Y ' Y 2b' X ' Y b' X ' Xb
SSE
s MSE
N p68
2
Tamao de muestra
69
Ejemplo de regresin
mltiple
70
Ejemplo de regresin
mltiple
71
72
73
74
75
0.01438
275
275
76
77
78
79
Multicolinealidad
Multicolinealidad
Escalamiento de residuos
Y 5 X 1 1000 X 2
83
Escalamiento de residuos
Residuos estandarizados
di
ei
,
MSE
Escalamiento de residuos
Residuos estudentizados
H = X (XX)-1X es
ei la matriz sombrero o hat matriz.
ri
MSE (1 hii )
85
Escalamiento de residuos
e( i ) Yi Y( i )
ediccin
i 1
SYY 86
Grficas parciales de
regresin
Matriz sombrero
88
Matriz sombrero
Distancia de Mahalanobis
90
Influencia en coeficientes
individuales
Influencia en coeficientes
individuales
Ejemplo de regresin
mltiple
Solucin con Excel y Minitab
93
% Aceptacin
94
-1340.32 -185.659
-452.957
R Square 0.732691
Adjusted R Square
0.721069
Standard Error
4132.688
Observations 25
ANOVA
df
Regression
Residual
Total
SS
MS
F
1
1.08E+09
23 3.93E+08
24 1.47E+09
Significance F
1.08E+09
63.04264
17079107
4.88E-08
Con
Conslo
sloX1,
X1,elelModelo
Modelose
sesimplifica
simplificaenormemente
enormemente
2
poca
pocaimportancia
importanciaprctica
prcticase
sepierde
pierdeen
enRR2(ajustada)
(ajustada)
Reduccin
del Modelo
Vuelva
a correr la regresin usando la categora
US News, como el nico agente de prediccin (predictor)
Coef
Desv. Estndar T
79230 1704
46.50
-910.1 114.6
-7.94
S = 4133
R2 = 73.3%
p
0.000
0.000
R2 (ajustada) = 72.1%
Anlisis de Variancia
Fuente
Regresin
Error
Total
DF
1
23
24
SS
MS
F
1076712008
1076712008
392819470
17079107
1469531477
p
63.04
0.000
El
El Modelo
Modelo se
se simplifica
simplifica enormemente..poca
enormemente..poca
22
importancia
prctica
se
pierde
en
R
importancia prctica se pierde en R (ajustada)
(ajustada)
Corrida en Minitab
Insolation
East
South
North
271.8
783.35 33.53
40.55
16.66
264.0
748.45 36.50
36.19
16.46
238.8
684.45 34.66
37.31
17.66
230.7
827.80 33.13
32.52
17.50
251.6
860.45 35.75
33.71
16.40
257.9
875.15 34.46
34.14
16.28
98
Corrida en Minitab
Resultados de la regresin
lineal
The regression equation is
Score2 = 1.12 + 0.218 Score1
Predictor
Constant
Score1
Coef
SE Coef
1.1177
0.1093
10.23
0.000
0.21767
0.01740
12.51
0.000
S = 0.1274
R-Sq = 95.7%
R-Sq(adj) = 95.1%
Analysis of Variance
Source
Regression
DF
SS
MS
2.5419
2.5419
156.56
0.000
Residual Error
Total
0.1136
8
0.0162
2.6556
2.6414
Fit
SE Fit
0.0474
95.0% CI
(
2.5292,
New Obs
1
2.7536)
95.0% PI
(
2.3197,
2.9631)
Score1
7.00
100
Resultados de la regresin
lineal
Regression Plot
Score2 = 1.11771 + 0.217670 Score1
S = 0.127419
R-Sq = 95.7 %
R-Sq(adj) = 95.1 %
Score2
3.5
2.5
Regression
1.5
95% CI
95% PI
2
Score1
101
Resultados de la regresin
Mltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor
Coef
SE Coef
389.17
66.09
5.89
0.000
North
-24.132
1.869
-12.92
0.000
South
5.3185
0.9629
5.52
0.000
2.125
1.214
1.75
0.092
Constant
East
S = 8.598
R-Sq = 87.4%
R-Sq(adj) = 85.9%
Analysis of Variance
Source
Regression
DF
SS
MS
12833.9
4278.0
57.87
0.000
Residual Error
25
1848.1
Total
28
73.9
14681.9
Source
DF
Seq SS
North
10578.7
South
2028.9
East
226.3
102
Resumen de la Regresin
La regresin slo puede utilizarse con informacin de variables
continuas.
Los residuos deben distribuirse normalmente con media cero.
Importancia prctica: (R2). Importancia estadstica: (valores p)
La regresin puede usarse con un predictor X o ms,
para una respuesta dada
Reduzca el modelo de regresin cuando sea posible,
sin perder mucha importancia prctica
103
VI.A.4 Herramientas
multivariadas
104
Herramientas multivariadas
1. Introduccin
2. Anlisis de componentes principales
3. Anlisis factorial
4. Anlisis discriminante
5. MANOVA
105
Introduccin
Anlisis de componentes
principales
Anlisis de componentes
principales
Ejemplo: Alimentos en
Europa
109
Corrida en Minitab
2Stat > Multivariate > Principal components
3En Variables, X1, X2, X3, X4, X6, X7, X8, X9
4En Number of factors to extract, 3. Seleccionar
Correlation Matrix
5Click Graphs y seleccionar Scree Plot, Score plot
for first 2 components Loading plot for first 2
components
8 Click Storage e indicar las columnas donde se
guarden los coeficientes y los valores Z (scores) Coef1
Coef 2 y Z1 Z2
9. Click OK en cada uno de los cuadros de dilogo
110
Ejemplo: Alimentos en
Europa
111
Ejemplo: Alimentos en
Europa
112
Anlisis factorial
Anlisis factorial
114
Ejemplo
116
Ejemplo:
117
Anlisis discriminante
pases
119
120
121
Anlisis de conglomerados
122
Anlisis de conglomerados
123
Ejemplo
Variables V1
V2
124
Corrida en Minitab
125
Anlisis de correlacin
cannico
126
Anlisis de correlacin
cannico
MANOVA
(Anlisis de varianza mltiple)
MANOVA
(Anlisis de varianza mltiple)
129
130
Ejemplo:
Extrusin de pelcula plstica
Ejemplo:
Extrusin de pelcula plstica
132
Ejemplo:
Extrusin de pelcula plstica
1Abrir el archivo EXH_MVAR.MTW.
2Seleccionar Stat > ANOVA > Balanced
MANOVA.
3En Responses, poner Tear Gloss Opacity.
4En Model, poner Extrusion | Additive.
5Click Results. En Display of Results,
seleccionar Matrices (hypothesis, error,
partial correlations) y Eigen analysis.
6 Click OK en cada cuadro de dilogo.
133
Ejemplo
134
Ejemplo:
Extrusin de pelcula plstica
Las matrices SSCP evalan la contribucin a la
variabilidad de manera similar a la suma de
cuadrados en la ANOVA univariada.
Las correlaciones parciales entre Tear y Gloss son
pequeas. Como la estructura de las
correlaciones es dbil, se pueden realizar
anlisis univariados de ANOVA para cada una
de las respuestas.
135
136
Estudios Multivari
137
Estudios Multivari
Estudios Multivari
139
Estudios Multivari
Procedimiento de muestreo:
Estudios Multivari
Procedimiento de muestreo:
Cartas Multivari
Cartas Multivari
Posicional:
Cartas Multivari
1 2 3 4 5
27 28 29 30 31
55 56 57 58 59
Cartas Multivari
Ejemplo: (cont...)
1 2 3 4 5
27 28 29 30 31
55 56 57 58 59
145
Cartas Multivari
Ejemplo: (cont...)
1 2 3 4 5
27 28 29 30 31
55 56 57 58 59
146
Cartas Multivari
Cartas Multivari
Cartas Multivari
8 AM
9 AM
10 AM
11 AM
12 AM
0.25
10
0.2500
0.2490
Izquierda
Mximo
Derecha
Mnimo
149
Cartas Multivari
Cartas Multivari
Cartas Multivari
Tipo de
% var.
Causas de
Accin
% de variacin
Variacin
Total
Variacin
Correctiva
Reducida
Temporal
50
Bajo nivel de
Tiempo a tiempo
Dentro de
10
la flecha
Adicionar
Refrigerante
Casi 50
refrigerante
Ajuste no
Ajuste de la
no paralelo
herramienta de
Casi 10
corte
Dentro de
30
la flecha
Flecha a
Rodamiento
Nuevo
gastado
rodamiento
-???
Casi 30
flecha
152
Cartas Multivari
Resultados:
Cartas Multivari
Ejemplo: Bsqueda de fuentes de variacin con el diagrama sistemtico.
Dimetro de Flecha
(0.150" +/- .002)
Variacin
de
proceso
Pieza a
pieza
Lote a lote
Programa
Dentro de
la pieza
Mquina
Variacin de
sist. medicin
Mquina a
mquina
Accesorios
Turno a
turno
Tiempo a
tiempo
Operador a
operador
154
Cartas Multivari
Ejemplo (cont..):
Al realizar la prueba de homogeneidad de varianza F, se
encontr que haba una diferencia significante entre los
operadores.
Corrida en Minitab
Corrida en Minitab
Resultados
Multi-Vari Chart for Strength by SinterTime - MetalType
SinterTime
0.5
23.5
1.0
2.0
22.5
Strength
21.5
20.5
19.5
18.5
17.5
15
18
21
MetalType
158
159
(O
i
E
)
Bondad de ajuste
Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
de distribucin particular planteada como hiptesis
Si el ajuste es razonablemente cercano, puede concluirse que s exite la forma de distribucin
planteada como hiptesis
2
2iK
Por ejemplo:
160
Bondad de ajuste
Ejemplo:
Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperara que se vendieran
12 botes / mes. La cantidad real que se vendi fue:
Ventas (Oi) Ventas (Ei)
Tipo de bote observadas esperadas
A
15
12
B
11
12
C
10
12
D
12
12
DISTR.CHI
0.76020818
161
Ejemplo:
Distribucin de Poisson =5
0.0067
0.8576
0.0337
4.3136
10
0.0842
10.7776
12
0.1404
17.9712
18
0.1755
22.4640
22
0.1755
22.4640
22
0.1462
18.7136
16
0.1044
13.3662
12
0.0653
8.3584
0.0363
4.6464
0.0318
163 4.0704
10 o ms
Ejemplo:
Distribucin de Poisson =5
10
0.0067+0.0337
5.1712
10
0.0842
10.7776
12
0.1404
17.9712
18
0.1755
22.4640
22
0.1755
22.4640
22
0.1462
18.7136
16
0.1044
13.3662
12
0.0653
8.3584
9 o ms
0.0363+0.0318
8.7168
164
Estadstico y conclusin
Con los datos anteriores se calcula el estadstico Chi
cuadrada que se compara con Chi Cuadrada de alfa
para k-p-1 grados de libertad (K categoras: 9, p
parmetros a estimar: 1 media).
2
(
f
e
)
2 i i
ei
i 1
n
2 2
Ho se rechaza si
166
( f i ei ) 2
ei
i 1
n
167
66
61
65
54
93
60
86
70
70
73
73
55
63
56
62
76
54
82
79
76
68
53
58
85
80
56
61
61
64
65
62
90
69
76
79
77
54
64
74
65
65
61
56
63
80
56
71
79
84
168
Frecuencia
observada
(fi)
Frecuencia
esperada
(ei)
Menos de
55.10
55.10 a
59.68
59.68 a
63.01
63.01 a
65.82
65.82 a
68.42
68.42 a
71.02
71.02 a
Se registran las
frecuencias de
los datos
tomados de las
calificaciones
170
( f i ei ) 2
ei
i 1
2
171
172
( f i ei ) 2
ei
i 1
2
5. Regla de rechazo:
2
2
Si
no se puede rechazar la hiptesis nula
Proporcin
hipottica
Frecuencia
observada
Frecuencia
esperada
Empresa A
0.3
48
60
Empresa B
0.5
98
100
Empresa C
0.2
54
40
175
Prueba de Bondad
de ajuste en Minitab
La columna C1 Observadas contiene las frecuencias
observadas y la C2 esperadas las frecuencias
esperadas
Calc > Calculator > Store result in variable ChiCuadrada
Teclear en el cuadro de expresin sum((ObservadasEsperadas)**2/Esperadas)
Calc > Probability distributions > Chi Square
Seleccionar Cummulative probability
Degrees of freedom 2
Input column ChiCuadrada; Optional Storage CumProb
OK
Calc > Calculator > Store results in variable p
177
Prueba de Bondad
de ajuste en Minitab
100
54
40
CumProb
0.974524
178
p
0.0254765
Prueba de Bondad
de ajuste en Excel
180
Introduccin
181
Contenido
ANOVA de un factor
o direccin
183
Introduccin
Ho : 1 2 3 ......... a
Ha : A lg unas. ' s.son.diferentes
185
ANOVA - Condiciones
Peso porc.
de algodn
15
20
25
30
35
Respuesta
Resistencia de la tela
7
7
15
12
17
12
14
18
18
19
25
22
7
10
11
11
18
19
19
15
187
9
18
19
23
11
ANOVA Suma de
cuadrados total
Xij
Gran media
Xij
SCT
i 1
j 1
( Xij X )
188
Media Trat. 1
a renglones
Gran media
Media trat. 2
SCTr b( X i X )
i 1
189
X3j
X1j
Media X1.
Media X3.
Media X2.
Muestra 1
SCE
i 1
Muestra 2
(X
j 1
ij
Muestra 3
X i)
190
X3j
X1j
Media X1.
Media X3.
Media X2.
Muestra 1
Muestra 2
Muestra 3
gl.SCT n 1
gl.SCTr a 1
gl.SCE (n 1) (a 1) n a
192
MCT SCT /( n 1)
MCTr SCTr /( a 1)
MCE SCE /( n a )
193
MCTr
Fc
MCE
Fexcel FINVALFA, gl. SCTr , gl.SCE
194
SCTR
a-1
CMTR
SCE
n-a
CME
Variacin total
SCT
n-1
CMT
VALOR F
CMTR/CME
Regla: Rechazar Ho si la Fc de la muestra es mayor que la F de Excel para una cierta alfa
o si el valor p correspondiente a la Fc es menor al valor de alfa especificado
195
Fexcel
Alfa
Zona de rechazo
De Ho o aceptar Ha
Zona de no rechazo de Ho
O de no aceptar Ha
Fc
196
197
T q , a , n a
CME
b
198
D2 = X1 X3
D3 = X2 X3
etc.
199
2(CME ) F ,1,n a
DMS
b
Para diseos balanceados (los
tratamientos tienen igual no. De
columnas), se calcula un factor DMS
contra el que se comparan las
diferencias Xi Xi. Significativas
200si lo
DMS j ,k
1 1
(CME ) F ,a 1,n a
b j bk
Ejemplo:
Mquin
as
Datos
Su
m
a
Prom
.
202
Ejemplo:
Cuadrado
medio
Mquin
as
Ejemplo:
-2
-2
-3
0
204
Ejemplo:
One-way ANOVA: A, B, C
Source
DF
SS
MS
Factor
137.20
68.60
33.19
Error
12
24.80
2.07
Total
14
162.00
S = 1.438
R-Sq = 84.69%
0.000 Rechazo Ho
R-Sq(adj) = 82.14%
Mean
StDev
---------+---------+---------+---------+
6.200
0.837
(-----*----)
0.600
1.673
-0.800
1.643
(----*-----)
(-----*----)
---------+---------+---------+---------+
0.0
2.5
5.0
7.5
205
Corrida en Minitab
11.94
14.42
10.06
7.19
7.03
14.66
2
206
Corrida en Minitab
DF
Carpet
Resultados
SS
MS
111.6
37.2
2.60
0.101
Error
12
172.0
Total
15
14.3
283.6
Mean
14.483
3
4
StDev
4
4
---------+---------+---------+-------
3.157
9.735
12.808
17.005
3.566
(-------*-------)
(-------*--------)
1.506
(--------*-------)
5.691
(-------*-------)
---------+---------+---------+-------
Pooled StDev =
3.786
10.0
15.0
208
20.0
209
ANOVA de 2 vas
210
211
ANOVA 2 vas
Para el tratamiento en renglones
Ho : 1 2 3 ......... a
Ha : A lg unas. ' s.son.diferentes
Para el factor de bloqueo en columnas
Maquinas
Maq 1
Maq 2
Maq 3
214
ANOVA de 2 vas
b
SCBl a ( X j X )
j 1
gl.SCBl b 1
CMBl SCBl /(b 1)
215
ANOVA de 2 vas
ANOVA Estadstico Fc y
Fexcel
MCTr
Fc
MCE
Fexcel FINVALFA, gl.SCTr , gl.SCE
217
ANOVA Estadstico Fb
MCBl
Fc
MCE
Fexcel FINVALFA, gl.SCBl , gl.SCE
218
VALOR F
SCTR
a-1
CMTR
CMTR/CME
SCBl
b-1
CMBL
CMBL/CME
SCE
(a-1)(b-1)
CME
Variacin total
SCT
n-1
CMT
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
219
Fexcel
Alfa
Zona de rechazo
De Ho o aceptar Ha
Zona de no rechazo de Ho
O de no aceptar Ha
Fc
Tr o Bl
220
221
MSE
b
Rk r0.05, k , gl . MSE * s yi .
Y estimada
Error o residuo
Error estndar
Factor de comparacin
223
Corrida en Minitab
Suplemento
Lago
34
Rose
43
Rose
57
Dennison
40
Dennison
85
Rose
68
Rose
67
Dennison
53
Dennison
41
Rose
24
Rose
42
Dennison
52
Dennison
224
Corrida en Minitab
225
Pedir grfica residuales Normal Plot
y vs fits y
DF
SS
MS
1919
959
9.25
0.015
21
21
0.21
0.666
561
281
2.71
0.145
Suppleme
Resultados
Lake
Interaction
Error
6
Total
622
11
104
3123
Individual 95% CI
Suppleme
Mean
1
--+---------+---------+---------+--------43.5
(-------*-------)
68.3
3
39.8
(--------*-------)
(--------*-------)
--+---------+---------+---------+--------30.0
45.0
60.0
75.0
Individual 95% CI
Lake
Dennison
Rose
Mean
51.8
49.2
------+---------+---------+---------+----(----------------*----------------)
(----------------*----------------)
------+---------+---------+---------+----42.0
48.0
54.0
226
60.0
ANOVA 3 y 4 factores
Cuadrado Latino
Aos exp.
Empleado
1
Maana
B=15
Turno
Tarde
A=18
Noche
C=11
C=12
B=20
A=9
3
A=17
A, B, C = Mquinas 1, 2 y 3
C=19
B=10
229
SCTr a ( X Tr X )
j 1
gl.SCTr a 1 b 1
CMTr SCTr /(b 1)
230
231
MCTr
Fc
MCE
Fexcel FINVALFA, gl. SCTr , gl.SCE
232
MC Re ng
Fcreng
MCE
MCCols
Fcols
MCE
Fexcel FINVALFA, gl.SCBl , gl.SCE
233
VALOR F
Renglores
SCRen
a-1
CMRen
CMRen/CME
Columnas
SCCol
b-1
CMCol
CMCol/CME
Tratamiento
SCTr
a-1
CMTr
CMTr/CME
SCE
(a-2)(a-1)
CME
Variacin total
SCT
n-1
CMT
234
Aa=-1
Bc=-5
Ce=-6
Db=-1
Ed=-1
Bb=-8
Cd=-1
Da=5
Ec=2
Ae=11
Cc=-7
De=13
Eb=1
Ad=2
Ba=-4
Dd=1
Ea=6
Ac=1
Be=-2
Cb=-3
Ee=-3
Ab=5
Bd=-5
Ca=4
Dc=6
237
239
ANOVA Cuadrado
Grecolatino
b
SCG a ( X m X )
m 1
gl.SCG b 1
CMG SCG /( b 1)
240
241
MCG
Fc
MCE
Fexcel FINVALFA, gl.SCTr , gl.SCE
242
MCTr
Fc
MCE
Fexcel FINVALFA, gl.SCBl , gl.SCE
243
VALOR F
Renglores
SCRen
a-1
CMRen
CMRen/CME
Columnas
Letras griegas
Tratamiento
SCCol
SCG
SCTr
b-1
a-1
a-1
CMCol
CMG
CMTr
CMCol/CME
CMG/CME
CMTr/CME
SCE
(a-3)(a-1)
CME
Variacin total
SCT
n-1
CMT
244
245
246
Para qu se utiliza?
1. Para probar si una serie de datos observada, concuerda
con el modelo (serie esperada) de la informacin.
2. Para probar las diferencias entre las proporciones de
varios grupos (tabla de contingencia).
2
247
Esperada
)
(fo - fe)2
fe
( fo )
( fe )
Aguilas
63
50
3.38
Soles
37
50
3.38
2 = 3.38 + 3.38
2 = 6.76
Estadstico Chi Cuadrada
c=
2
j=1
(fo - fe)2
fe
249
251
.250
.100
.050
.025
.010
.005
.001
1
2
3
4
5
1.323
2.773
4.108
5.385
6.626
2.706
4.605
6.251
7.779
9.236
3.841
5.991
7.815
9.488
11.070
5.024
7.378
9.348
11.143
12.832
6.635
9.210
11.345
13.277
15.086
7.879
10.597
12.838
14.860
16.750
10.828
13.816
16.266
18.467
20.515
6
7
8
9
10
7.841
9.037
10.219
11.389
12.549
10.645
12.017
13.362
14.684
15.987
12.592
14.067
15.507
16.919
18.307
14.449
16.013
17.535
19.023
20.483
16.812
18.475
20.090
21.666
23.209
18.548
20.278
21.955
23.589
25.188
22.458
24.322
26.125
27.877
29.588
11
12
13
14
15
13.701
14.845
15.984
17.117
18.245
17.275
18.549
19.812
21.064
22.307
19.675
21.026
22.362
23.685
24.996
21.920
23.337
24.736
26.119
27.488
24.725
26.217
27.688
29.141
30.578
26.757
28.300
29.819
31.319
32.801
31.264
32.909
34.528
36.123
37.697
16
17
18
19
20
19.369
20.489
21.605
22.718
23.828
23.542
24.769
25.989
27.204
28.412
26.296
27.587
28.869
30.144
31.410
28.845
30.191
31.526
32.852
34.170
32.000
33.409
34.805
36.191
37.566
34.267
35.718
37.156
38.582
39.997
39.252
40.790
43.312
43.820
45.315
21
22
23
24
25
24.935
26.039
27.141
28.241
29.339
29.615
30.813
32.007
33.196
34.382
32.671
33.924
35.172
36.415
37.652
35.479
36.781
38.076
39.364
40.646
38.932
40.289
41.638
42.980
44.314
41.401
42.796
44.181
45.558
46.928
46.797
48.268
49.728
51.179
52.620
26
27
28
29
30
30.434
31.528
32.620
33.711
34.800
35.563
36.741
37.916
39.087
40.256
38.885
40.113
41.337
42.557
43.773
41.923
43.194
44.461
45.722
46.979
45.642
46.963
48.278
49.588
50.892
48.290
49.645
50.993
52.336
53.672
54.052
55.476
56.892
58.302
59.703
40
50
60
45.616
56.334
66.981
51.805
63.167
74.397
55.758
67.505
79.082
59.342
71.420
83.298
63.691
76.154
88.379
66.766
79.490
91.952
73.402
86.661
99.607
70
80
90
100
77.577
88.130
98.650
109.141
85.527
96.578
107.565
118.498
90.531
101.879
113.145
124.342
95.023
106.629
118.136
129.561
100.425
112.329
124.116
135.807
104.215
116.321
128.299
140.169
112.317
124.839
137.208
149.449
252
Tabla de contingencia
253
Tabla de contingencia
254
Tabla de contingencia
255
Partes defectuosas
mquina 1
fo = 517
fo = 17
Total = 534
mquina 2
fo = 234
fo = 11
Total = 245
Total
751
28
779
Partes defectuosas
mquina 1
fo = 751*534/779
fo = 28*534/779
Total = 534
mquina 2
fo = 751*245/779
fo = 28*245/779
Total = 245
779
Basados en este ndice, los valores esperados (fe) seran:
mquina 1
Partes
buenas
530.53
mquina 2
233.47
Partes defectuosas
3.47
1.53
257
232
233.47
764
3
1.53
5
235
769
258
Tabla de Chi2
Tabla de valores crticos seleccionados para Chi2
DF
.250
.100
.050
1
2
3
4
5
1.323
2.773
4.108
5.385
6.626
2.706
4.605
6.251
7.779
9.236
3.841
5.991
7.815
9.488
11.070
6
7
8
9
10
7.841
9.037
10.219
11.389
12.549
10.645
12.017
13.362
14.684
15.987
11
12
13
14
15
13.701
14.845
15.984
17.117
18.245
16
17
18
19
20
19.369
20.489
21.605
22.718
23.828
.025
.010
.005
5.024
7.378
9.348
11.143
12.832
6.635
9.210
11.345
13.277
15.086
7.879
10.597
12.838
14.860
16.750
10.828
13.816
16.266
18.467
20.515
12.592
14.067
15.507
16.919
18.307
14.449
16.013
17.535
19.023
20.483
16.812
18.475
20.090
21.666
23.209
18.548
20.278
21.955
23.589
25.188
22.458
24.322
26.125
27.877
29.588
17.275
18.549
19.812
21.064
22.307
19.675
21.026
22.362
23.685
24.996
21.920
23.337
24.736
26.119
27.488
24.725
26.217
27.688
29.141
30.578
26.757
28.300
29.819
31.319
32.801
31.264
32.909
34.528
36.123
37.697
23.542
24.769
25.989
27.204
28.412
26.296
27.587
28.869
30.144
31.410
28.845
30.191
31.526
32.852
34.170
32.000
33.409
34.805
36.191
37.566
34.267
35.718
37.156
38.582
39.997
39.252
40.790
43.312
43.820
45.315
259
.001
Problema: Fugas
Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
reduccin de tiempo de ciclo.
260
235
223.38
3
3
12.84
4
Total
18
17.66
286
4217
4228.62
253
243.16
4452
256
334
334.34
352
5414
5700
1
6.61
127
121.39
128
200
3836
4036
208.55
3827.45
54
202
256
13.23
242.77
5
699
704
36.38
667.62
128
12
116
6.61 121.39
Total
278
5102
5380
Chi2 = 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475
+ 4.386 + 0.239 = 171.132
DF= 5; valor P = 0.000
262
Coeficiente de
Contingencia
Chi2
x 100
N
N
CC
Mquina
8.734
5700
0.15
Operador
171.132
5380
3.18
Controlador Mayor
SI el tamao de la muestra (N), es similar para los grupos. Al dividir entre N,
probablemente, llevar a la misma ruta que hubiera alcanzado con slo ver la
estadstica Chi2.
Sin embargo, si N tiene una variacin considerable, dependiendo del grupo de
variacin que se investiga, el coeficiente de contingencia puede ser una herramienta
valiosa para determinar la prioridad sobre qu grupo debe investigarse primero.
263
54
202
256
13.23
242.77
5
699
704
36.38
667.62
12
116
6.61 121.39
128
265
Ejercicios
1. Se quiere evaluar la habilidad de tres inspectores de rayos
X en un aeropuerto para detectar artculos clave. Como
prueba se pusieron radios de transistores en 90 maletas,
cada inspector fue expuesto a 30 maletas conteniendo radios
mezcladas entre otras que nos los contenan. Los resultados
se resumen a continuacin:
Inspectores
1 2 3
Radios detectados
Radios no detectados
27 25 22
3 5 8
Ejercicios
1. Se quiere evaluar si hay preferencia por manejar en un
carril de una autopista dependiendo de la hora del da. Los
datos se resumen a continuacin:
Hora del da
Carril
1:00
3:00
Izquierdo 44 37 18
Central
28 50 72
Derecho
8 13 30
5:00
267
Coeficiente de Contingencia
C2
X2
X2 N
268
Coeficiente de Contingencia
C2
2
X2
66
.
22
2
0.38
2
2
X N
66.22 393
Max C
k 2
82
0.866
k
8
269
Correlacin de atributos
X
N (k 1)
270