Beruflich Dokumente
Kultur Dokumente
Curso: ESTADSTICA PARA LA TOMA DE DECISIONES SEMESTRE: 2013-0 CICLO: IV PROFESOR: Dr. EDGAR VICENTE ARMAS 11 de Enero al 02 de Marzo del 2013
Estudiaremos dos caractersticas de un mismo elemento de la poblacin (altura y peso, dos asignaturas, longitud y latitud). De forma general, si se estudian sobre una misma poblacin y se miden por las mismas unidades estadsticas una variable X y una variable Y, se obtienen series estadsticas de las variables X e Y. Considerando simultneamente las dos series, se suele decir que estamos ante una variable estadstica bidimensional.
Tabulacin de variables estadsticas bidimensionales. 2 tipos de tabulaciones: 1) Para variables cuantitativas, que reciben el nombre de tabla de correlacin. 2) Para variables cualitativas, que reciben el nombre de tabla de contingencia.
Tablas de correlacin. (Tabla doble Entrada) Sea una poblacin estudiada simultaneamente segn dos caracteres X e Y; que representaremos genricamente como (xi; yj ; nij), donde xi; yj, son dos valores cualesquiera y nij es la frecuencia absoluta conjunta del valor i-simo de X con el j-simo de Y. Una forma de disponer estos resultados es la conocida como tabla de doble entrada o tabla de correlacin, la cual podemos representar como sigue:
n individuos
X : x1 , , xi , , xk
Y : y1 , , yi , , yp
k modalidades distintas
p modalidades distintas
FRECUENCIAS RELATIVAS BIDIMENSIONALES Y1 X1 X2 . . . Xi . . Xp h11 h21 . . . hi1 . . hp1 Y2 h12 h22 . . . hi2 . . h.2 Y3 Y4 . . . . . . . . . . . . Yi . . . . . . . . . . . . Yp h1p h2p . . . hip . . hpp h.p TOTAL h1. h2. h3. . . hi. . . hp. 1
h1i . h2i . . . . . . . . . . .
hp2 hp3 hp4 hp5 hp6 hpi . h.3 h.4 h.5 h.6 h.i
TOTAL h.1
FRECUENCIAS ABSOLUTAS ACUMULADAS MENOR QUE BIDIMENSIONALES Y1 X1 X2 . . . Xi . . N11 N21 . . . Ni1 . . Y2 N12 N22 . . . Ni2 . . Y3 N13 N23 . . . Ni3 . . Y4 N14 N24 . . . Ni4 . . . . . . . . . . . . . . . . . . . . Yi N1i N2i . . . Nii . . . . . . . . . . . . . . . . . . . . Yp N1p N2p . . . Nip . .
Xp
Np1
Np2
Np3 Np4
Npi
[800-1000>
[600-800>
15
10
35
17
[1000-1200>
16
[1200-1400>
14
[1400-1600>
11
[1600-1800>
TOTAL
38
18
10
11
10
13
100
(1)
n n ij
k p i 1 j1 ij
nij
La Frecuencia relativa conjunta de (xi , yi) se define como la proporcin de individuos que presenta simultneamente X = xi Y = yj
f ij
n ij n
n i. =
n
j1
ij
n
i 1
ij
(3)
ni . n n . j
i 1 k
fi. p=1 j
ij
f
i 1
ij
Distribuciones Condicionales
Distribucin de X condicionada a Y = yj (X|y = yj) Propiedades
i 1 = frecuencia absoluta de xi condicionada a Y = yj = k (6) f i j j nmero de individuos1que presentan X = xi de las que tienen Y = yj i 1 k
j ij
n ij j n . j (5)
i ij
EJERCICIO Construir la Tabla Bidimensional, con la muestra de 20 familias donde estamos interesados en conocer nmero de hijos y el ingreso familiar mensual en miles de dlares siendo los datos los siguientes: (X:Hijos; Y:Ingreso familiar) (3;21), (5;45), (4;50),(2;35), (1;20), (2;53), (1;32), (2;44), (2;22), (1;32), (3;54), (3;28), (3;40), (2;34), (4;28), (1;33), (4;60), (2;25), (3;25), (3;53) Calcular frecuencia absoluta, relativa, porcentual, conjunta y marginal., frecuencias condicionales, existencia de idependencia, COVARIANZA
1 2
1 2
3 2 1 1
4 6
3 4
5
n.j
1 1
1 1
1
2 1
6 3
1
20
EJEMPLO: Los ejecutivos de una empresa consultora fueron clasificados segn el nmero de proyectos en funcionamiento (X) y las utilidades (Y) obtenidas por dichos proyectos en cientos de dlares. La tabla conjunta con esta informacin se presenta como sigue: a.- Calcular la utilidad promedio que generan los proyectos. b.- Calcular la varianza de la utilidad que generan los proyectos. c.- Calcular el nmero promedio de proyectos en funcionamiento de los proyectos que generan entre 2500 y 4500 dlares. d.- Calcular la varianza del nmero de proyectos en funcionamiento de los proyectos que generan entre 2500 y 4500 dlares.
NMERO DE PROYECTOS 2 0 3 0 4 0
5-15
15-25
25-45 45-75
10
5 2
2
8 7
10
25 20
2
10 8
nij N
Leves X Graves Y Averias
0 1 2 3 4 5 0 0,2308 0,1692 0,0769 0,0923 0,0615 0,0308 1 0,0385 0,0615 0,0385 0,0615 0,0308 0,0077 2 0,0077 0,0231 0,0154 0,0077 0,0000 0,0000 3 Marginal de leves 0,0000 0,2769 0,0077 0,2615 0,0154 0,1462 0,0154 0,1769 0,0077 0,1000 0,0000 0,0385
ni. N
n. j N
Si
nij ni . n. j N N N
ij Independencia
Var ( X )
( xi x )2 ni
i 1
2 SX
k
Varianza de X
Varianza de Y
Var (Y )
( y j y ) 2 n j
j 1
2 SY
Cov( X , Y )
( x x )( y
i 1 j 1 i
y )nij S XY
Covarianza entre X e Y
Mide si existe asociacin lineal entre X e Y. Positiva o negativa pero no la intensidad
1 COV xy ( xi x )( yi y ) n i
El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relacin entre las variables.
20
correlacin nula
LA REGRESION Y CORRELACION
Consiste en establecer una relacin cuantitativa entre dos o ms variables. Peso=f(talla), Consumo=f(Ingreso) Demanda=f(Precio) n: observaciones (x1,y1),..............(xn, yn) Yi: variable dependiente Xi: variable independiente.
FORMAS DE RELACION
DIAGRAMA DE DISPERSION Relacion Lineal Yi= a + bXi Relac.no Lineal Yi= a+bXi+cX2 Parablico Yi= aXb ,Potencial Yi= a.bx , Exponencial Yi= a / Xi Hiperbola Equilatera
160 55
165 58
168 58
170 61
171 67
175 62
175 66
180 74
180 79
182 83
y=
bo + b 1 x + e
x y -------------X1 X2
. .
E(y) =
bo + b 1 x
bo, b 1
y1 y2
. .
Parametros desconocidos
Xn
yn
bo, b 1
Proporcionan estimados de
^y=
bo
b 1x
bo, b 1
Estadsticos de la muestra
bo, b 1
MINIMOS CUADRADOS
MODELO LINEAL Para el clculo de los parmetros a y b Estimar Y* = a + bXi Suma Cuadrados de Errores Mnimo e = ( Yi - Y*)2 MEDIANTE DERIVADAS PARCIALES Se encuetran las Ecuaciones Normales
ECUACIONES NORMALES
Yi = na + b Xi XiYi= a Xi + b Xi2
CALCULO DE LOS PARAMETROS a y b a = Yi Xi2 - Xi XiYi/n Xi2- (Xi)2 b = n XiYi - Xi Yi / n Xi2- (Xi)2
160
55
8.800
25.600
3.025
165
168 170 171 175
58
58 61 67 62
9.570
9.744 10.370 11.457 10.850
27.225
28.224 28.900 29.241 30.625
3.364
3.364 3.721 4.489 3.844
175
180 180 182
66
74 79 83
11.550
13.320 14.220 15.106
30.625
32.400 32.400 33.124
4.356
5.476 6.241 6.889
1.726
663
114.987
298.364
44.769
Talla (cm) xi
Peso (kg.) yi
Y'
Y-Y'
(Y-Y')2
(Y-Ymedia)2
(Y'-Ymedia)2
160
55
51,0
4,0
15,8
127,7
233,2
165
168 170 171
58
58 61 67
57,1
60,7 63,1 64,4
0,9
-2,7 -2,1 2,6
0,8
7,4 4,6 7,0
68,9
68,9 28,1 0,5
84,9
31,1 9,9 3,8
175
175 180 180 182 1.726
62
66 74 79 83 663
69,2
69,2 75,3 75,3 77,7 663
-7,2
-3,2 -1,3 3,7 5,3 0
52,0
10,3 1,6 13,9 28,2 141,6
18,5
0,1 59,3 161,3 278,9 812,1
8,5
8,5 80,5 80,5 129,8 670,5
Syx = 4,2071
ANALISIS DE VARIANZA
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1 Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1. Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms. Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1. Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos. Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de correlacin (parablica, exponencial, etc.)
CORRELACION LINEAL
Ninguna
Correlacin negativa perfecta Correlacin
C.N. MODERADA
C.P. MODERADA
-1
-0.5
0.5
PRUEBA DE HIPOTESIS:
1 Paso H0 : = 0 H1 : 0 2 Paso: Determinar nivel de significacin , segn tamao de muestra utilizar la distribucin correspondiente 3 Paso: regla de decisin: Rechazar H0 si solo si t > tc t < -tc
r =
1- R2 /n-k
ANALISIS DE VARIANZAS Suma de Grados de Cuadrados F errores al libertad medios Cuadrado REGRESION SCR k-1 SCMR SCMR/SCME ERROR SCE n-k SCME TOTAL SCT n-1 Concepto
PRUEBA DE HIPOTESIS
1 Paso H0 : El modelo no es confiable H1 : El modelo si es confiable 2 Paso: Determinar nivel de significacin , utilizar la distribucin F(k-1 , n-k) 3 Paso: regla de decisin: Rechazar H0 si solo si F > Fc 4 Paso: Clculo del estadstico F = SCMR /SCME 5 Paso: Conclusiones, hay cofiabilidad del modelo por lo se puede realizar el pronstico
R= 1 6 d2/n(n2 1)
Mide la asociacin de dos variables cualitativas nominales con solo dos categoras excluyentes (Sexo:Hombre,Mujer; Trabaja: si, no)
TOTAL
Y 0a 1c a+c
0 b d b+d
Q=ad-bc ad+bc
Trab. SI NO TOTAL
Idioma
SI 11 4 15
NO 7 10 17
TOTAL 18 14 32
PREDICCIONES
Y`p= a + bXp
Ejemplo:
Talla 160 165 Peso 55 58 Y` 51,0 57,1 Y` -t(n-k)* Spyx 40,9 46,9 Y` + t(n-k) *Spyx 61,2 67,3
168
170 171 175 175 180 180 182 185 190 191 195 198 205 210
58
61 67 62 66 74 79 83
60,7
63,1 64,4 69,2 69,2 75,3 75,3 77,7 81,3 87,4 88,6 93,5 97,1 105,6 111,6
50,5
53,0 54,2 59,0 59,0 65,1 65,1 67,5 71,2 77,2 78,4 83,3 86,9 95,4 101,4
70,9
73,3 74,5 79,4 79,4 85,4 85,4 87,9 91,5 97,6 98,8 103,6 107,3 115,8 121,8
E. Normal E. Pesimista E. Optimista Lineal (E. Pesimista) Lineal (E. Normal) Lineal (E. Optimista)
90,0 80,0 70,0 60,0 50,0 40,0 160 170 180 190 200 210 Centimetros
90,0 80,0 70,0 60,0 50,0 40,0 160 165 168 170 171 175 175 180 180 182 185 190 191 195 198 205 210 Centmetros
EJERCICIO:
La Compaa VITACALCIO desea realizar sus pronsticos de ventas para los prximos 5 aos y a construido tres modelos lineales en base a los insumos utilizados y la produccin alcanzados en los ltimos aos. Confirme la correcta construccin del modelo y confiabilidad para realizar sus pronsticos si se cuenta con la siguiente informacin: