Sie sind auf Seite 1von 54

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS ADMINISTRATIVAS ESCUELA PROFESIONAL DE ADMINISTRACIN

Curso: ESTADSTICA PARA LA TOMA DE DECISIONES SEMESTRE: 2013-0 CICLO: IV PROFESOR: Dr. EDGAR VICENTE ARMAS 11 de Enero al 02 de Marzo del 2013

DISTRIBUCIONES DE DOS O MS VARIABLES

Estudiaremos dos caractersticas de un mismo elemento de la poblacin (altura y peso, dos asignaturas, longitud y latitud). De forma general, si se estudian sobre una misma poblacin y se miden por las mismas unidades estadsticas una variable X y una variable Y, se obtienen series estadsticas de las variables X e Y. Considerando simultneamente las dos series, se suele decir que estamos ante una variable estadstica bidimensional.

Tabulacin de variables estadsticas bidimensionales. 2 tipos de tabulaciones: 1) Para variables cuantitativas, que reciben el nombre de tabla de correlacin. 2) Para variables cualitativas, que reciben el nombre de tabla de contingencia.

Tablas de correlacin. (Tabla doble Entrada) Sea una poblacin estudiada simultaneamente segn dos caracteres X e Y; que representaremos genricamente como (xi; yj ; nij), donde xi; yj, son dos valores cualesquiera y nij es la frecuencia absoluta conjunta del valor i-simo de X con el j-simo de Y. Una forma de disponer estos resultados es la conocida como tabla de doble entrada o tabla de correlacin, la cual podemos representar como sigue:

TABLAS ESTADSTICAS DE DOBLE ENTRADA

n individuos

X : x1 , , xi , , xk
Y : y1 , , yi , , yp

k modalidades distintas
p modalidades distintas

FRECUENCIAS RELATIVAS BIDIMENSIONALES Y1 X1 X2 . . . Xi . . Xp h11 h21 . . . hi1 . . hp1 Y2 h12 h22 . . . hi2 . . h.2 Y3 Y4 . . . . . . . . . . . . Yi . . . . . . . . . . . . Yp h1p h2p . . . hip . . hpp h.p TOTAL h1. h2. h3. . . hi. . . hp. 1

h13 h14 h23 h24 . . . hi3 . . . . .

h1i . h2i . . . . . . . . . . .

hi4 hi5 hi6 hii . . . . . . . .

hp2 hp3 hp4 hp5 hp6 hpi . h.3 h.4 h.5 h.6 h.i

TOTAL h.1

FRECUENCIAS ABSOLUTAS ACUMULADAS MENOR QUE BIDIMENSIONALES Y1 X1 X2 . . . Xi . . N11 N21 . . . Ni1 . . Y2 N12 N22 . . . Ni2 . . Y3 N13 N23 . . . Ni3 . . Y4 N14 N24 . . . Ni4 . . . . . . . . . . . . . . . . . . . . Yi N1i N2i . . . Nii . . . . . . . . . . . . . . . . . . . . Yp N1p N2p . . . Nip . .

Xp

Np1

Np2

Np3 Np4

Npi

INGRESOS FAMILIAR MENSUAL (En soles)

[800-1000>

[1000_1200> [1200-1400> [1400-1600> [1600-1800> [1800-2000> TOTAL

[600-800>

15

10

35

[800-1000> Gasto familiar mensual

17

[1000-1200>

16

[1200-1400>

14

[1400-1600>

11

[1600-1800>

TOTAL

38

18

10

11

10

13

100

TABLAS ESTADSTICAS DE DOBLE ENTRADA

Frecuencia Absoluta Conjunta


La Frecuencia absoluta conjunta de X = xi , Y = yj ; se define como el nmero de individuos que presenta simultneamente X Propiedades p = x iy Y = y j k

(1)

n n ij
k p i 1 j1 ij

nij

(2) f 1 Frecuencia Relativa Conjunta


i 1 j1

La Frecuencia relativa conjunta de (xi , yi) se define como la proporcin de individuos que presenta simultneamente X = xi Y = yj

f ij

n ij n

TABLAS ESTADSTICAS DE DOBLE ENTRADA

Frecuencia Absoluta Marginal de X = xi


La Frecuencia absoluta marginal se define como el nmero de individuos que presentan la modalidad xi de X.

n i. =

n
j1

ij

Frecuencia Absoluta Marginal de Y = yj


La Frecuencia absoluta marginal se define como el nmero de individuos que presentan la modalidad yj de Y.
n. j =

n
i 1

ij

TABLAS ESTADSTICAS DE DOBLE ENTRADA

Frecuencia Relativa Marginal de X = xi


La Frecuencia relativa marginal se define como la proporcin de individuos que presentanPropiedades xi de X. la modalidad
p

(3)

ni . n n . j
i 1 k

(4) fi. 1 f . jj1


i 1 j1

fi. p=1 j

ij

Frecuencia Relativa Marginal de Y = yj


La Frecuencia relativa marginal se define como la proporcin de individuos que presentan la modalidad yj de Y.
f. j =

f
i 1

ij

TABLAS ESTADSTICAS DE DOBLE ENTRADA

Distribuciones Condicionales
Distribucin de X condicionada a Y = yj (X|y = yj) Propiedades
i 1 = frecuencia absoluta de xi condicionada a Y = yj = k (6) f i j j nmero de individuos1que presentan X = xi de las que tienen Y = yj i 1 k

j ij

n ij j n . j (5)

nij fi j = frecuencia relativa de xi condicionada a Y = yj = n. j


j

proporcin de individuos que presentan X = xi de las que tienen Y = yj

TABLAS ESTADSTICAS DE DOBLE ENTRADA

Distribucin de Y condicionada a X = xi (Y|x = xi)


Propiedades = frecuencia absoluta de yj condicionada a X = xi = p nmero de individuos n i . presentan Y = yj de las que n ii j que (5) tienen X = xi jp1 (6) f ij 1 nij f ii j = frecuenciaj relativa de xi condicionada a Y = yj = j1 ni . proporcin de individuos que presentan X = xi de las que tienen Y = yj

i ij

EJERCICIO Construir la Tabla Bidimensional, con la muestra de 20 familias donde estamos interesados en conocer nmero de hijos y el ingreso familiar mensual en miles de dlares siendo los datos los siguientes: (X:Hijos; Y:Ingreso familiar) (3;21), (5;45), (4;50),(2;35), (1;20), (2;53), (1;32), (2;44), (2;22), (1;32), (3;54), (3;28), (3;40), (2;34), (4;28), (1;33), (4;60), (2;25), (3;25), (3;53) Calcular frecuencia absoluta, relativa, porcentual, conjunta y marginal., frecuencias condicionales, existencia de idependencia, COVARIANZA

FRECUENCIA ABSOLUTA BIDIMENSIONAL N DE HIJOS Y INGRESO FAMILIAR MENSUAL


x Y [20 - 28> [ 28 - 36> [ 36 - 44> [ 44 - 52> [ 52 - 60] ni.

1 2

1 2

3 2 1 1

4 6

3 4
5
n.j

1 1

1 1
1

2 1

6 3
1

20

EJEMPLO: Los ejecutivos de una empresa consultora fueron clasificados segn el nmero de proyectos en funcionamiento (X) y las utilidades (Y) obtenidas por dichos proyectos en cientos de dlares. La tabla conjunta con esta informacin se presenta como sigue: a.- Calcular la utilidad promedio que generan los proyectos. b.- Calcular la varianza de la utilidad que generan los proyectos. c.- Calcular el nmero promedio de proyectos en funcionamiento de los proyectos que generan entre 2500 y 4500 dlares. d.- Calcular la varianza del nmero de proyectos en funcionamiento de los proyectos que generan entre 2500 y 4500 dlares.

Utilidades (cientos de dlares) 1 3

NMERO DE PROYECTOS 2 0 3 0 4 0

5-15

15-25
25-45 45-75

10
5 2

2
8 7

10
25 20

2
10 8

nij N
Leves X Graves Y Averias
0 1 2 3 4 5 0 0,2308 0,1692 0,0769 0,0923 0,0615 0,0308 1 0,0385 0,0615 0,0385 0,0615 0,0308 0,0077 2 0,0077 0,0231 0,0154 0,0077 0,0000 0,0000 3 Marginal de leves 0,0000 0,2769 0,0077 0,2615 0,0154 0,1462 0,0154 0,1769 0,0077 0,1000 0,0000 0,0385

ni. N

Marginal de Graves 0,6615 0,2385 0,0538 0,0462

n. j N

Si

nij ni . n. j N N N

ij Independencia

Var ( X )

( xi x )2 ni
i 1

2 SX
k

Varianza de X

Varianza de Y

Var (Y )

( y j y ) 2 n j
j 1

2 SY

Cov( X , Y )

( x x )( y
i 1 j 1 i

y )nij S XY

Covarianza entre X e Y
Mide si existe asociacin lineal entre X e Y. Positiva o negativa pero no la intensidad

Covarianza de dos variables X e Y


La covarianza entre dos variables,COVxy, nos indica si la posible relacin entre dos variables es directa o inversa.
Directa: COVxy >0 Inversa: COVxy <0 Incorreladas: COVxy =0

1 COV xy ( xi x )( yi y ) n i

El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relacin entre las variables.

20

correlacin nula

correlacin lineal positiva fuerte

correlacin lineal positiva dbil

correlacin lineal positiva funcional

correlacin lineal negativa fuerte

correlacin lineal negativa dbil

correlacin lineal negativa funcional

correlacin curvilnea positiva fuerte

correlacin curvilnea positiva dbil

correlacin curvilnea positiva funcional

correlacin curvilnea negativa fuerte

correlacin curvilnea negativa dbil

correlacin curvilnea negativa funcional

LA REGRESION Y CORRELACION
Consiste en establecer una relacin cuantitativa entre dos o ms variables. Peso=f(talla), Consumo=f(Ingreso) Demanda=f(Precio) n: observaciones (x1,y1),..............(xn, yn) Yi: variable dependiente Xi: variable independiente.

FORMAS DE RELACION
DIAGRAMA DE DISPERSION Relacion Lineal Yi= a + bXi Relac.no Lineal Yi= a+bXi+cX2 Parablico Yi= aXb ,Potencial Yi= a.bx , Exponencial Yi= a / Xi Hiperbola Equilatera

Diagramas de dispersin o nubes de puntos

TALLA (cm) PESO (kg)

160 55

165 58

168 58

170 61

171 67

175 62

175 66

180 74

180 79

182 83

Modelo de Regresin lineal Simple


Proceso de estimacin en la regresin lineal simple
Datos de la muestra Modelo de Regresin Lineal Simple

y=

bo + b 1 x + e

x y -------------X1 X2
. .

Ecuacin de Regresin Lineal Simple

E(y) =

bo + b 1 x
bo, b 1

y1 y2
. .

Parametros desconocidos

Xn

yn

Ecuacin estimada de Regresin Lineal Simple

bo, b 1
Proporcionan estimados de

^y=

bo

b 1x

bo, b 1

Estadsticos de la muestra

bo, b 1

MINIMOS CUADRADOS
MODELO LINEAL Para el clculo de los parmetros a y b Estimar Y* = a + bXi Suma Cuadrados de Errores Mnimo e = ( Yi - Y*)2 MEDIANTE DERIVADAS PARCIALES Se encuetran las Ecuaciones Normales

ECUACIONES NORMALES
Yi = na + b Xi XiYi= a Xi + b Xi2

CALCULO DE LOS PARAMETROS a y b a = Yi Xi2 - Xi XiYi/n Xi2- (Xi)2 b = n XiYi - Xi Yi / n Xi2- (Xi)2

SUMATORIAS PARA EL CALCULO DE LOS ESTIMADORES DE o ; 1


Talla (cm) xi Peso (kg.) yi XiYi X2i Y2i

160

55

8.800

25.600

3.025

165
168 170 171 175

58
58 61 67 62

9.570
9.744 10.370 11.457 10.850

27.225
28.224 28.900 29.241 30.625

3.364
3.364 3.721 4.489 3.844

175
180 180 182

66
74 79 83

11.550
13.320 14.220 15.106

30.625
32.400 32.400 33.124

4.356
5.476 6.241 6.889

1.726

663

114.987

298.364

44.769

Clculo del estimador de o

a = (Yi* Xi2 - Xi* XiYi) / (n Xi2 - (Xi)2)


a= (663*298364-1726*114987)/(10*298363-(1726)2) a= -142,907537 Clculo del estimador de 1 b = (n* XiYi - Xi*Yi) /( n Xi2 - (Xi)2) b=(10*114987-1726*663)/(10*298364-(1726)2) b= 1,21209465 significa que por cada incremento de la talla en un centmetro el peso se incrementa en 1,21 kilogramos. La recta de la Regresin Lineal es: Y = -142,9075 + 1,212Xi

SUMA CUADRADO DE ERRORES DE (SCT;SCR; SCE)


Y'=-142,907+1,212X

Talla (cm) xi

Peso (kg.) yi

Y'

Y-Y'

(Y-Y')2

(Y-Ymedia)2

(Y'-Ymedia)2

160

55

51,0

4,0

15,8

127,7

233,2

165
168 170 171

58
58 61 67

57,1
60,7 63,1 64,4

0,9
-2,7 -2,1 2,6

0,8
7,4 4,6 7,0

68,9
68,9 28,1 0,5

84,9
31,1 9,9 3,8

175
175 180 180 182 1.726

62
66 74 79 83 663

69,2
69,2 75,3 75,3 77,7 663

-7,2
-3,2 -1,3 3,7 5,3 0

52,0
10,3 1,6 13,9 28,2 141,6

18,5
0,1 59,3 161,3 278,9 812,1

8,5
8,5 80,5 80,5 129,8 670,5

EL ERROR ESTANDAR DE ESTIMACION O DESVIACION ESTANDAR DE LA REGRESION


VARIANZA DE LA REGRESION: S2yx =(Y-Y)2/n-k; S2yx= (Y2-aY-bXY)/n-k Donde: n= tamao de muestra y k n de parmetros estimados ERROR ESTANDAR DE ESTIMACION

Syx= (Y-Y)2/n-k; Syx=(Y2 -aY-bXY)/n-k


Syx= (141,6)/8 Syx = (44769-(-142,9075*663-1,2120945*114987)/8

Syx = 4,2071

ERROR NO EXPLICADO POR LA REGRESION TOTAL ERROR

ERROR EXPLICADO POR LA REGRESION.

COEFICIENTE DE CORRELACION LINEAL

ANALISIS DE VARIANZA

EL COEFICIENTE DE CORRELACION LINEAL

Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1 Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1. Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms. Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1. Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos. Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de correlacin (parablica, exponencial, etc.)

CORRELACION LINEAL
Ninguna
Correlacin negativa perfecta Correlacin

Correlacin Positiva perfecta

C.N. MODERADA

C.P. MODERADA

-1

-0.5

0.5

PRUEBA DE HIPOTESIS:
1 Paso H0 : = 0 H1 : 0 2 Paso: Determinar nivel de significacin , segn tamao de muestra utilizar la distribucin correspondiente 3 Paso: regla de decisin: Rechazar H0 si solo si t > tc t < -tc

4 Paso: Clculo del estadstico t = r- /r

r =

1- R2 /n-k

5 Paso: Conclusiones, existe linealidad

ANALISIS DE VARIANZAS Suma de Grados de Cuadrados F errores al libertad medios Cuadrado REGRESION SCR k-1 SCMR SCMR/SCME ERROR SCE n-k SCME TOTAL SCT n-1 Concepto

PRUEBA DE HIPOTESIS
1 Paso H0 : El modelo no es confiable H1 : El modelo si es confiable 2 Paso: Determinar nivel de significacin , utilizar la distribucin F(k-1 , n-k) 3 Paso: regla de decisin: Rechazar H0 si solo si F > Fc 4 Paso: Clculo del estadstico F = SCMR /SCME 5 Paso: Conclusiones, hay cofiabilidad del modelo por lo se puede realizar el pronstico

COEFICIENTE DE CORRELACION LINEAL PARA VARIABLES CUALITATIVAS

PROYECCIONES CON REGRESION LINEAL

COEFICIENTE DE CORRELACION DE SPEARMAN


Se utiliza cuando una o ambas variables son ordinales, es decir los elementos de una de las series o de ambos son posiciones de orden

R= 1 6 d2/n(n2 1)

Padre X(Pulg.) Hijo Y(Pulg) 65 68 63 66 67 68 64 65 68 69 62 66 71 68 76 75 68 71 67 67 69 68 70 70

RX 9 11 7,5 10 5,5 12 2 1 5,5 7,5 4 3

RY 6,5 10,5 6,5 12 4 10,5 6,5 1 2 9 6,5 3

di 2,5 0,5 1 -2 1,5 1,5 -4,5 0 3,5 -1,5 -2,5 0 TOTAL

d2i 6,25 0,25 1 4 2,25 2,25 20,25 0 12,25 2,25 6,25 0 57

COEFICIENTE DE CORRELACION DE YULE

Mide la asociacin de dos variables cualitativas nominales con solo dos categoras excluyentes (Sexo:Hombre,Mujer; Trabaja: si, no)

TOTAL

Y 0a 1c a+c

0 b d b+d

1 TOTAL a+b c+d

Q=ad-bc ad+bc

Trab. SI NO TOTAL

Idioma

SI 11 4 15

NO 7 10 17

TOTAL 18 14 32

PREDICCIONES

Y`p= a + bXp

Spy x =SSyxx* ( + (Xp - Xmedia) /(Xi - Xmedia) ) y *(1+1/n

Yp = Y`p +/- ta/2Spy x

Ejemplo:
Talla 160 165 Peso 55 58 Y` 51,0 57,1 Y` -t(n-k)* Spyx 40,9 46,9 Y` + t(n-k) *Spyx 61,2 67,3

168
170 171 175 175 180 180 182 185 190 191 195 198 205 210

58
61 67 62 66 74 79 83

60,7
63,1 64,4 69,2 69,2 75,3 75,3 77,7 81,3 87,4 88,6 93,5 97,1 105,6 111,6

50,5
53,0 54,2 59,0 59,0 65,1 65,1 67,5 71,2 77,2 78,4 83,3 86,9 95,4 101,4

70,9
73,3 74,5 79,4 79,4 85,4 85,4 87,9 91,5 97,6 98,8 103,6 107,3 115,8 121,8

ESCENARIO DE LA PROYECCION ENTRE TALLA Y EL PESO

120,0 110,0 100,0


Kilogramos

E. Normal E. Pesimista E. Optimista Lineal (E. Pesimista) Lineal (E. Normal) Lineal (E. Optimista)

90,0 80,0 70,0 60,0 50,0 40,0 160 170 180 190 200 210 Centimetros

PROYECCIONES ENTRE TALLA Y PESO

120,0 110,0 100,0


Kilogramos

90,0 80,0 70,0 60,0 50,0 40,0 160 165 168 170 171 175 175 180 180 182 185 190 191 195 198 205 210 Centmetros

Esenario Normal Esenario Pesimista Escenario Optimista Real

EJERCICIO:
La Compaa VITACALCIO desea realizar sus pronsticos de ventas para los prximos 5 aos y a construido tres modelos lineales en base a los insumos utilizados y la produccin alcanzados en los ltimos aos. Confirme la correcta construccin del modelo y confiabilidad para realizar sus pronsticos si se cuenta con la siguiente informacin:

Modelo 1 n Y estimado Syx Sb R2 0.056 0,9 100+0,96*X 74,5 10

Modelo 2 15 `-90+0,92*X 2,5 0,0086 0,85

Modelo 3 20 120+0,90*X 17,5 0,00956 0,75

Das könnte Ihnen auch gefallen