Sie sind auf Seite 1von 58

Regresin y Correlacin La regresin y la correlacin son dos tcnicas estrechamente relacionadas y comprenden una forma de estimacin.

En forma ms especifica el anlisis de correlacin y regresin comprende el anlisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una poblacin. El anlisis de correlacin produce un nmero que resume el grado de la correlacin entre dos variables; y el anlisis de regresin da lugar a una ecuacin matemtica que describe dicha relacin. El anlisis de correlacin generalmente resulta til para un trabajo de exploracin cuando un investigador o analista trata de determinar que variables son potenciales importantes, el inters radica bsicamente en la fuerza de la relacin. La correlacin mide la fuerza de una entre variables; la regresin da lugar a una ecuacin que describe dicha relacin en trminos matemticos Los datos necesarios para anlisis de regresin y correlacin provienen de observaciones de variables relacionadas. Regresin lineal La regresin lineal simple comprende el intento de desarrollar una lnea recta o ecuacin matemtica lineal que describe la reaccin entre dos variables. La regresin puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo. La finalidad de una ecuacin de regresin seria estimar los valores de una variable con base en los valores conocidos de la otra. Otra forma de emplear una ecuacin de regresin es para explicar los valores de una variable en trmino de otra. Es decir se puede intuir una relacin de causa y efecto entre dos variables. El anlisis de regresin nicamente indica qu relacin matemtica podra haber, de existir una. Ni con regresin ni con la correlacin se pude establecer si una variable tiene causa ciertos valores de otra variable. Ecuacin Lineal Dos caractersticas importantes de una ecuacin lineal la independencia de la recta la localizacin de la recta en algn punto. Una ecuacin lineal tiene la forma y = a + bx En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b seala su pendiente. La variable y es la que se habr de predecir, y x es la variable predictora. Determinacin de la ecuacin matemtica En la regresin, los valores de y son predichos a partir de valores de x dados o conocidos. La variable y 1

recibe le nombre variable dependiente y la variable x, el de variable independiente. Mtodos de mnimos cuadrados EL procedimiento mas utilizado por adaptar una recta aun conjunto de punto se le que conoce como mtodo de mnimos cuadrados. La recta resultante presenta 2 caracterstica importantes es nula la suma desviaciones verticales en los puntos a partir de la recta es mnima la suma de los cuadrados de dicha desviaciones

(yi yc)2 En el cual Yi = valor esperado de y Yc= valor calculado de y utilizando la ecuacin de mnimos cuadrados con el valor correspondientes x para yi Los valores de a y b para la recta es Yc = a + bx que minimiza la suma de los cuadrados de la desviacin ecuaciones normales y = na + (x) xy= a (x) +b (x2) En las que n es el numero de pares de observaciones. Evaluando las cantidades x, y, etc. Se puede resolver estas dos ecuaciones simultneamente para determinar a b. la ecuaciones puede despejarse. Se obtuvieron dos formulas aun para a y otra para b. n(xy) (x)(y) b= n(x2)(x)2 ybx a= n Inferencia en el anlisis de regresin Los supuestos para el anlisis de regresin son como: Existen datos de medicin para a x y z. la variable dependiente es una variable aleatoria. para cada valor de x, existe una distribucin condicional de la qu es de naturaleza normal la desviacin estndar de toda las distribuciones condicionales son iguales

EL error estndar de estimacin La determinante primaria de la exactitud es el grado de dispersin de la poblacin: cuanto mas dispersa este, menor ser la exactitud de la estimacin. El grado de dispersin en la poblacin se puede estimar a partir del grado de dispersin en las observaciones de la muestra con respecto a la lnea de regresin calculada, utilizando la formula. Se = " (yi yc) n2 en la cual: yi = cada valor de y yc = valor de lnea de regresin correspondiente a partir de la ecuacin de regresin. n = nmeros de observaciones. La formula anterior no se utiliza por lo general para clculos reales, es mas fcil trabajar con la formula simplificada Se "y2 a y b xy n2 Inferencia de acerca de la pendiente de una lnea de regresin Aun cuando es muy poca o nula relacin entre dos variables de aun poblacin, es posible obtener valores maestrales que hacen que parezca que la variables estn relacionadas, es importantes probar los resultados tales de caculo, a fin determinar si son significativos (es decir si los parmetros verdaderos no son cero), Si no existe ninguna relacin se esperara obtener aun pendiente cero, se pone a prueba la hiptesis nula contra la hiptesis alternativa. La significacin del coeficiente de regresin se puede probar comparndolo con su desviacin estndar t = valor de la muestra valor esperado Desviacin estndar Anlisis de regresin lineal mltiple La regresin mltiple comprende tres o ms variables. Existe solo una variable dependiente, pero hay dos o mas tipo independiente. Esta operacin al desarrollo de una ecuacin que se pede utilizar para predecir valore de y, respecto a valores dados de la diferencia variables independientes adicionales es incrementar la capacidad predicativa sobre la de la regresin lineal simple. Las tcnicas de los mnimos cuadrados se utilizan para obtener ecuaciones de regresin. Yc= a +b1x1+b2x2+bkxk a = ordenada en el origen 3

b1= pendiente k = numero de variables independientes Un anlisis de regresin simple de dos variable da lugar a la ecuacin de una recta, un problema de tres variables produce un plano, y un problema de k variables implica un hiperplano de a (k +1) dimensiones. Anlisis de Correlacin EL objetivo de un estudio de correlacin es determinar la consistencia de una relacin entre observaciones por partes. EL termino correlacin significa relacin mutua, ye que indica el grado en el que los valores de una variable se relacionan con los valores de otra. Se considera tres tcnicas de correlacin uno para datos de medicin, otro para datos jerarquizados y el ltimo para clasificaciones nominales. Datos Continuos: r de Pearson EL grado de relacin entre dos variables continuas se resume mediante un coeficiente de correlacin que se conoce como r de Pearson en honor del gran matemtico Kart Pearson, quien ideo este mtodo. Esta tcnica es valida mientras si es posible establecer ciertos supuestos bastante estrictos. Tales supuestos son los siguientes: Tanto x como y son variables continuas aleatorias. Es decir, a diferencia del anlisis de referencia de regresin, no es aceptable seleccionar ciertos valores de x, y despus medir y; tanto y como x deben de variar libremente. La distribucin conjunta de frecuencia es normal. Esto recibe el nombre de de distribucin normal divariada. Carcter de r El coeficiente de relacin presenta dos propiedades que establecen la naturaleza de una relacin entre dos variables. Una es su signo (+ o ) y la otra, es su magnitud. El signo es igual al de la pendiente de una recta que podra ajustarse a los datos si estos se graficaran en un diagrama de dispersin, y la magnitud de r indica cuan cerca esta de la recta tales puntos. Mtodo practicar para calcular r Dado que los clculos necesarios pueden requerir mucho tiempo especialmente cuando se resta las medias del grupo de cada observacin se elevan a cuadrado esas diferencias. Existe una versin, la cual simplifica los clculos: r= n ("xy)("x)("y) _ "n("x2)("x)2 "n("y2)("y)2 Existen 3 formas posibles para obtener el valor de r en el caso de datos de medicin: estandarizar cada conjunto y hallar el producto medio, calcular el coeficiente de determinacin r2 y obtener su raz cuadrada como utilizar la formula. Para un conjunto de datos los tres mtodos producirn el mismo valor para r no obstante cada mtodo agrega algo a la comprensin del significado del termino correlacin Inferencia acerca del coeficiente de correlacin

Intervalo de confianza para la correlacin de la poblacin El valor del coeficiente de correlacin de la muestra se puede utilizar como un estimado de la correlacin verdadera de poblacin existen varios mtodos para obtener un mtodo de confianza para pero quizs la forma mas directa es usar un diagrama. Si se examinan el diagrama se observara que el intervalo de los valores potenciales (no conocidos) se indica a lo largo de la escala vertical los posibles valores r de la muestra se indica en la escala inferior una serie de curvas representan tamao de muestras seleccionadas. Prueba de significacin de r Puede ser necesario evaluar una aseveracin con respecto al valor de . La forma mas sencilla es obtener un intervalo de confianza para r y observar si el valor propuesto esta incluido en el intervalo de ser as se rechaza a Ho y se acepta la alternativa. Datos jerarquizados de: r Spearman Es una tcnica no paramtrica que utiliza para medir la fuerza de una relacin por pares de 2 variables cuando los datos se encuentran en forma jerarquizados. El objeto de calcular un coeficiente de correlacin estos ejemplos es determinar el grado en el que dos conjuntos de jerarquizacin concuerdan o no. Esta tcnica tambin se puede extender a calificaciones u otro tipo de medicin si estas se convierten a rangos. Las medidas de l grado de concordancia son sol cuadrados de las diferencias entre los dos conjuntos de rangos: si la suma de stos es pequea, esto significa que hay acuerdo; si la suma es grande, esto indica lo contrario. EL calculo real de la correlacin comprende la formula. rsp = 1 6"d2 n(n2 1) En la cual n es el nmero de observaciones y "d2 es la suma de los cuadrados de la diferencia entre los rangos. El coeficiente de correlacin de jerarqua obtenido recibe el nombre de r Spearman. La suma de la diferencia es cero. Esto no sirve como una comprobacin til de los clculos aunque no es necesaria en la frmula. El procedimiento es como el siguiente: Obtener la diferencia en rango para cada par de observaciones Como comprobaciones, verificar que la diferencias se sumen a 0 elevar el cuadrado la diferencias sumar los cuadrados de la diferencia para obtener "d2 Calcular rsp Si el valor rsp es pequeo para situaciones en donde n es mayor que 10, la hiptesis nula de rsp = 0 puede ser probada utilizndola la frmula rsp 0 t= "(1 rsp 2) (n 2)

Datos nominales: el coeficiente de contingencia Cuando ambas variables se miden en escalas nominales ( es decir , categoras ) , el anlisis es fcilmente mediante el desarrollo de una tabla de contingencia semejante a la que se utilizo en el anlisis de k proporciones ( prueba de ji cuadrada ), el procedimiento en realidad de aun extensin del anlisis de una tabla r * k. Una medida de relacin es calcular el coeficiente de contingencia en C, donde x2 C= X2 + N Un aspecto interesante de una tabla ji cuadrada es que l tamao mximo posible de x2 es funcin de N, de las observaciones y del tamao de la tabla. En le caso de tabla con los valores cuadrado, esto lleva obtener un valor mximo de C de K1 C max = k En el cual k es el nmero de fila o columnas. La comprar C con C max se pude obtener una idea de la intensidad de la asociacin entre la variables. Esta es una relacin moderada, no muy intensa. Su interpretacin exacta en parte de la naturaleza de los datos y de los resultados comparables que se obtengan de otros estudios, por lo que es difcil establecer valores definitivos d intensidades. Se bebe observar que la formula no frmula no produce automticamente el signo del coeficiente de contingencia. DE ah que no siempre resulte evidente el existe aun relacin positiva o negativa. Ventajas: Nos e requiere de supuestos con respectos a la formula de poblacin Solamente se necesita una medicin nominal ( categoras) Limitaciones El limite superior de C es menor que 1.00 incluso Para un correlacin perfecta. El lmite superior depende del tamao de la tabla, por lo que no son comparables los coeficientes de contingencia de tablas de tamao diferente El coeficiente de contingencia no es directamente comprable con otras medidas de correlacin, como la r de Pearson y la r de Spearman, o incluso con otras tablas de contingencia de tamao diferente. Cada casilla deber tener una frecuencia esperada por lo menos 5. C max solamente se puede calcular a partir de tabla de valores al cuadrado EJERCICIOS PAG. 411 6

1. Cual es la ecuacin de una recta con las siguientes caractersticas? pendiente 10.2 y ordenada en el origen 5.0. Yc=5 + 10.2x. pendiente 55 y ordenada en el origen 0. Yc=55x. Pendiente 27 y ordenada en el origen 2. Yc=2 + 27x. Pendiente 13 y ordenada en el origen 200. Yc=200 13x. Pendiente 0 y ordenada en el origen 2.4. Yc=2.4 2. Calcule los valores de a y b en la ecuacin lineal yc =a+bx apartir de las grficas de la fig. 14.4. Yc= 6+(7.5/500)x Yc=1 +(12/4)x EJERCICIOS PAG. 416 1. Suponga que una cadena de supermercados financia un estudio sobre los gastos anuales en comestibles de familias de cuatro miembros. La investigacin se limit a familias con ingresos netos que van de $ 8,000 a $ 20,000 dlares. Se obtuvo la siguiente ecuacin: yc =200 + .10x y = gastos anuales estimados x = ingresos netos anuales Estime los gastos de una familia de cuatro miembros con un ingreso anual de $15,000. Como queremos estimar el gasto anual, se sustituye el valor de los ingresos(x) en la ecuacin y queda as: Yc = 200 + .10(15,000) Yc = 200 + 1500 Yc= 1300 Uno de los vicepresidentes se preocupa por el hecho de que aparentemente la ecuacin indica que una familia con ingreso de $2,000 no gastara nada en alimentos. Cul sera su respuesta?

La respuesta es que no tiene de que preocuparse ya que el gasto est estimado para familias con ingresos de 8000 a 20000 dlls. Explique porqu no se podra utilizar en los siguientes casos: 1) estimacin en los gastos de familias de cinco miembros. No es posible ya que la ecuacin est calculada para una familia de cuatro miembros. 2) estimacin en los gastos de familias cuyos ingresos netos van de $20,000 a $35,000. No se puede porque la formula se calculo para sueldos menores o iguales a 20,000. d. Grafique la ecuacin. 2. Un bufete de ingenieros consultores ha establecido la siguiente relacin con respecto al rendimiento por galn de automviles estadounidenses de 6 cilindros, cuyo peso vara de 1500 a 3000 libras: yc=30 0.002x y=rendimiento millas/galn x=peso del vehculo Represente esta relacin con una grfica y marque los ejes. Estime el consumo de gasolina X milla para un auto de peso: Sustituimos en la formula: 1)2000 lb yc=30 0.002(2000)=26 2)1500 lb yc=30 0.002(1500)=27 3)2500 lb yc=30 0.002(2500)=25 3. Emplee los siguientes valores de resumen para determinar las ecuaciones de regresin: a. "x=200, "y=300, "xy=6200, "x2=3600, n=20. b= 20(6200)(200)(300) 20(3600)(200)2 b= 2 a=300b(200) 20 a=5

Yc = 5 +2x b. "x=7.2, "y=37, "xy=3100, "x2=620, n=36. b= 36(3100)(7.2)(37) 36(620)(7.2)2 b= 5 a=37b(7.2) 36 a=.028 Yc = 5 +.028x c. "x=700, "y=250, "xy=1400, "x2=21000, n=30. b= 30(1400)(700)(250) 30(21000)(700)2 b= .95 a=250b(700) 30 a=30.5 Yc = 30.5 +.95x d. "x=33, "y=207, "xy=525, "x2=750, n=40. b= 40(525)(33)(207) 40(750)(33)2 b= .49 a=207b(33) 40 a=4.77 Yc = 4.77 +x 4. En el caso de cada conjunto represente estos en una grfica y si parece apropiada una ecuacin lineal, determine los coeficientes a y b a partir de los mismos. 9

a. Tamao x 20 22 25 30 40 45 50 55 60 63 70 Costo total y 3500 3000 2000 1600 1000 800 900 950 1100 1300 1500

Los datos siguen una tendencia polinomial. b. Ventas x 150 201 225 305 370 380 450 510 560 600 685 725 735 Ingresos y 15 17 20 21 19 23 21 22 25 24 27 30 27

"x=5896, "y=291, "xy=141502, "x2=3159126, n=13. Como parece apropiada una ecuacin lineal, se determinan los coeficientes a y b con la formula: b= 13(141502)(5896)(291) 13(3159126)(5896)2 b=.2

10

a=291b(5896) 13 a=13.48 Yc = 13.48+.2x 5. Determine una ecuacin que describa la relacin entre la frecuencia de accidentes y el nivel de educacin preventiva X 150 200 300 450 500 600 800 900 3900 n=8 Para encontrar la ecuacin se sustituyen los valores en la formula: b= 8(18720)(3900)(44.6) 8(18720)(3900)2 b=.006 a=44.6b(3900) 8 a=8.44 Yc = 8.44+.006x 6. Una compaa que tiene 15 tiendas ha recopilado datos en relacin con los metros cuadrados de area de ventas respecto a los ingresos mensuales. Trace una grfica de los datos, y si parece apropiado un modelo lineal determine la ecuacin de regresin. Tienda Metros 2 X a 55 o 80 j 85 Ingreso Y 45 60 75 Y 8.00 7.00 6.50 5.20 6.40 4.40 4.00 3.10 44.60 XY 1200 1400 1950 2340 3200 2640 3200 2790 18720 X2 22500 40000 90000 202500 250000 360000 640000 810000 2415000

XY 2475 4800 6375

X2 3025 6400 7225 11

e k d n g c l b i h f m 15

90 90 110 130 140 180 180 200 200 215 260 300 2315

75 80 95 95 110 120 105 115 130 140 170 200 1615

6750 7200 10450 12350 15400 21600 18900 23000 26000 30100 44200 60000 289600

8100 8100 12100 16900 19600 32400 32400 40000 40000 46225 67600 90000 430075

}Los datos seran: "x=2315, "y=1615, "xy=289600, "x2=430075, n=15. Y se sustituyen los valores en la formula: b= 15(289600)(2315)(1615) 15(430075)(2315)2 b=.5543 a=1615b(2315) 15 a=22.11 Yc = 22.11+.5543x Y la grafica sera: 7. Vuelva a resolver el ejercicio 5 utilizando accidentes como x y nivel horas instruccin. Como y compare la ecuacin obtenida con la anterior. Determine una ecuacin que describa la relacin entre la frecuencia de accidentes y el nivel de educacin preventiva Accidentes X 3.10 4.00 4.40 5.20 horas Y 900 800 600 450

XY 2790 3200 2640 2340

X2 9.61 16 19.36 27.04 12

6.40 6.50 7.00 8.00 44.60 n=8

500 300 200 150 3900.00

3200 1950 1400 1200 18720

40.96 42.25 49 64 268.22

Para encontrar la ecuacin se sustituyen los valores en la formula: b= 8(18720)(44.6)(3900) 8(268.22)(44.6)2 b=154.4 a=3900b(44.6) 8 a=1348 Yc = 1348154.4x 8. Teniendo: X 1 2 3 4 5 6 7 28 Y 2 4 5 6 7 7 9 40 Utilice los datos para: a. Calcular los coeficientes a y b de la ecuacin. X 1 2 3 4 5 6 7 28 Y 2 4 5 6 7 7 9 40 XY 2 8 15 24 35 42 63 189 X2 1 4 9 16 25 36 49 140

b= 7(189) (28)(40) 7(140)(28)2 b=1.036 13

a= 40b(28) 7 a=1.57 Yc = 1.57+1.036x b. Duplicar cada valor de x y volver a calcular los coeficientes. X 2 4 6 8 10 12 14 56 Y 2 4 5 6 7 7 9 40 XY 4 16 30 48 70 84 126 378 X2 4 16 36 64 100 144 196 560

b= 7(378)(56)(40) 7(560)(56)2 b=.52 a= 40b(56) 7 a=1.57 Yc = 1.57+.52x c. Duplicar el valor original de x,y para evaluar de nuevo los coeficientes. X 2 4 6 8 10 12 14 56 Y 4 8 10 12 14 14 18 80 XY 8 32 60 96 140 168 252 756 X2 4 16 36 64 100 144 196 560

b= 7(756)(56)(80)

14

7(560)(56)2 b=1.036 a= 80b(56) 7 a=3.14 Yc = 3.14+1.036x d. Utilizar el valor original de x, pero agregando 2 a cada valor original de y, y recalcular la ecuacin de regresin. X 1 2 3 4 5 6 7 28 Y 4 6 7 8 9 9 11 54 XY 4 12 21 32 45 54 77 245 X2 1 4 9 16 25 36 49 140

b= 7(245)(28)(54) 7(140)(28)2 b=1.036 a= 54b(28) 7 a=3.57 Yc = 1.57+1.036x 9. Determine una ecuacin predictiva para calcular el monto del seguro, en funcin del ingreso anual para los siguientes datos: Ingreso X 13 16 17 18 20 Prima Y 5 15 20 10 10

XY 65 240 340 180 200

X2 169 256 289 324 400 15

25 26 32 38 40 42 287

12 15 30 40 50 40 247

300 390 960 1520 2000 1680 7875

625 676 1024 1444 1600 1764 8571

b= 11(7875)(287)(247) 11(8571)(287)2 b=1.321 a= 247b(287) 11 a=12.01 Yc = 12.01+1.321x EJERCICIOS PAGINA 435 1. Determine qu pendientes para los siguientes datos son significativas al nivel 0.05. Utilice n2 grados de libertad. a) DATOS b= 4 Sb=1 n=12 Solucin: n2= 122= 10 tprueba= (b0)/ Sb = (40)/1= 4 .025 =.05/2= .025 10 Tt= 2.228 Usando: b tSb " B " b + tSb

16

4(2.228)(1) " 0 " 4+(2.228)(1) !! 1.772 " 0 " 6.228 :. Es significativo b) DATOS b= 0.15 Sb=0.10 n= 20 Solucin: n2= 202= 18 Tprueba= (.0150)/.10 = 1.5 .025 =.05/2= .025 2.101 Usando: b tSb " B " b + tSb 0.15(2.101)(.10) " 0 " 0.15+(2.101)(.10) !! 0.3601 " 0 " 0.06 :. Se Acepta Ho DATOS b= 1.2 Sb=0.6 n= 25 Solucin: n2= 252= 23

17

Tprueba= (1.20)/0.6 = 2 .025 =.05/2= .025 2.069 Usando: b tSb " B " b + tSb 1.2(2.069)(0.6) " 0 " 1.2+(2.069)(0.6) !! 0.027 " 0 " 2.427 :. Se Acepta Ho DATOS b= 0.6 Sb=0.2 n= 31 Solucin: n2= 312= 29 Tprueba= (0.60)/0.2 = 3 .025 =.05/2= .025 29 2.045 Usando: b tSb " B " b + tSb 0.6(2..045)(0.2) " 0 " 0.6+(2.045)(0.2) !! 0.191 " 0 " 1.009 :. Es significativo

18

e) DATOS b= 212 Sb=38 n= 50 Solucin: n>32 z Tprueba= (2120)/38 = 5.57 .06 = .5.025= .475 1.9 .475 Usando: b tSb " B " b + tSb 212(1.96)(38) " 0 " 212+(1.96)(38) !! 286.48 " 0 " 137.52 :. Es significativo f) DATOS b= .015 Sb=0.001 n= 100 Solucin: n>32 z Tprueba= (.0150)/0.001 = 15 0.06 =0.5.025= 0.195 1.9 .475

19

Usando: btSb " B " b+tSb 0.015(1.96)(.001) " 0 " 0.015+(1.96)(.001) !! 0.013 " 0 " 0.013 :. Se Acepta Ho 2. Determine intervalos de confianza de 99% para cada uno de estos coeficientes de regresin, e indique qu pendientes son significativas. DATOS b= 8.2 Sb= 4.1 n= 50 .495 .495 z=2.58 b tSb " B " b + tSb 8.2(2.58)(4.1) " 0 " 8.2+(2.58)(4.1) 2.37 a 18.77 :. No significativo DATOS b= .13 Sb= .04 .495 .495 n= 30 n2= 302=28 = 0.5.495=.005 .005 28 t= 2.763 b tSb 20

.13 (2.763)(.04) 0.02 a 0.2405 :. Significativo DATOS b= 5.213 Sb= 1.50 .495 .495 n= 20 n2= 202=18 2.87 b tSb 5.212 (2.87)(1.50) 0.908 a 9.518 :. Significativo DATOS b= 145 Sb= 40 .495 .495 n= 60 z= 2.58 b tSb 145 (2.58)(40) 41.8 a 248.2 :. Significativo DATOS b= 7.1 Sb= 3.0 .495 .495 n= 9

21

n2= 92= 7 .005 7 3.499 b tSb 7.1 (3.499)(3.0) 17.59 a 3.39 :. No Significativo 3. Utilizando los siguientes datos: a) Calcular la ecuacin de regresin b) Calcular Se y despus Sb. Determinar si b es significativo, utilizando un intervalo de confianza con =0.05. Calificaciones A B C D E F G H I J Totales y2=69,138 xy=71434 x2=73903 1. Prueba 80 95 88 98 94 74 81 86 90 69 855 2. Prueba 78 90 85 98 90 76 80 78 89 62 826

Ecuacin de Regresin: Yc= a + bx b= n(xy) (x)( y)= 10 (71,434) (855)(826) = 1.013 n(x2)( x)2 10(73903)(855)2 22

a= y bx= 826(1.013)(855)= 4.02 n 10 Yc= 4.02 + 1.013x b) Calculo de Se y Sb Se= y2 ay bxy = 69,138 (4.02)(826)( 1.013)( 71434) =3.330 n2 102 Sb= Se 1 _ =( 3.330) 1 _= 0.118 x2 [(x)2/n] 73903 [(855)2/10] =0.05 0.025 b t Sb 1.013 (2.262)(.118) 0.746 a 1.28 8 2.262 :. Significativo 4. Diga que ecuacin escribira los datos del ejercicio anterior, si la segunda calificacin del examen en cada caso es exactamente igual a la primera. b= n(xy) (x)( y)= 10 (73903) (855)(855) = 1 n(x2)( x)2 10(73903)(855)2 a= y bx= 855(1)(855)= 0 n 10 Yc= 1x 5. Calcule r2 utilizando los datos del ejercicio 8, pgina 418. x 1 2 3 4 5 6 7 y 2 4 5 6 7 7 9 23

28 y2= 260 xy= 189 x2= 140

40

b= n(xy) (x)( y)= 7 (189) (28)( 40) = 1.03 n(x2)( x)2 7(140)( 28)2 a= y bx= 40(1.03)( 28)= 1.57 n7 Se= 260 (1.57)(40)( 1.03)( 189) =0.309 5 Se2= 0.095 Sy2= n(y2)(y)2/n =7(260)(40)2/7= 318.28 n2 5 r2= 1 Se2 = 1 0.095= 0.999 Sy2 318.28 6. Explique por que el valor r2 nunca puede ser negativo Porque r2= 1 Se2 ; y Se2 siempre debe ser menor que Sy2 Sy2 7. Calcule r2 para cada uno de los siguientes casos: a 14400 28800 b 14400 57600 c 2025 2500 d 2025 2200 e 606 6060

Se2 Sy2

a. r2= 1 Se2 = 1 14400 = 0.5 Sy2 28800 b. r2= 1 Se2 = 1 14400= 0.75 Sy2 57600 c. r2= 1 Se2 = 1 2025 = 0.19 24

Sy2 2500 d. r2= 1 Se2 = 1 2025 = 0.079 Sy2 2200 e. r2= 1 Se2 = 1 606 = 0.9 Sy2 6060 11. Utilice la siguiente informacin para los clculos: Yc= 13 + 2x Se= 3 n=10 x= 40 x2=600 a) Estime un intervalo de confianza de 95% para el valor promedio (esperado) de y, si xg es: Yc t(Se (1/n)+( xgx)2 /{x2[(x)2/n]}) DATOS: 1.0 n2= 102 = 8 Yc= 13+2(1) =15 X= x/n= 40/10= 4.0 .025 8 t= 2.306 SUSTITUYENDO EN LA FORMULA 15 2.306 (3.0 (1/10)+( 1.04.0)2 /{600[(40)2/10]}) 2.306 (1.04) 12.60 a 17.40 DATOS : 4.0 Yc= 13+2(4) = 21 SUSTITUYENDO EN LA FORMULA 21 2.306 (3.0 (1/10)+( 4.04.0)2 /{600[(40)2/10]})

25

21 2.306 (0.948) 18.81 a 23.18 DATOS : 8.0 Yc= 13+2(8) = 29 SUSTITUYENDO EN LA FORMULA 29 2.306 (3.0 (1/10)+( 8.04.0)2 /{600[(40)2/10]}) 29 2.306 (1.1078) 26.44 a 31.55 b) Obtenga un intervalo de confianza de 95% para un valor individual de y cuando xg es: Yc t(Se 1+(1/n)+( xgx)2 /{x2[(x)2/n]}) DATOS : 1.0 Yc= 15 SUSTITUYENDO EN LA FORMULA: Yc t (Se 1+(1/n)+( xgx)2 /{x2[(x)2/n]}) 15 2.306 (3.175) 7.68 a 22.32 DATOS : 4.0 Yc= 21 SUSTITUYENDO EN LA FORMULA: Yc t (Se 1+(1/n)+( xgx)2 /{x2[(x)2/n]}) 21 2.306 (3.146) 13.74 a 28.2 DATOS :

26

8.0 Yc= 29 SUSTITUYENDO EN LA FORMULA: Yc t (Se 1+(1/n)+( xgx)2 /{x2[(x)2/n]}) 29 2.306 (3.19) 21.62 a 36.38 12. Cuando xg se hace igual a 0, el intervalo de confianza resultante para el valor promedio de y se convierte en el intervalo para la ordenada en el origen a. a) Determine un intervalo de confianza de 95% para a en el ejercicio 11. DATOS : Xg= 0 Yc= 13+2(0) = 13 SUSTITUYENDO EN LA FORMULA 13 2.306 (3.0 (1/10)+( 04.0)2 /{600[(40)2/10]}) 13 2.306 (1.107) 10.44 a 15.55 Obtenga un intervalo de confianza de 95% y uno de 99% para a, respecto al ejemplo de la pagina 413. DATOS: N.C=95% = .025 N.C=99% = .005 Xg=0 Yc= 2934 38.56 (0)= 2934 n2=142= 12 x=505 x2=21825 X= 505/14= 36.07 Se=324.55 27

.025 .005 12 2.179 12 3.055 SUSTITUYENDO EN LA FORMULA Para 95% 2934 2.179(324.55 (1/14)+( 036.07)2 /{21825[(505)2/14]}) 2934 464.78 3398.78 a 2469.21 Para 99% 2934 3.055(324.55 (1/14)+( 036.07)2 /{21825[(505)2/14]}) 2934 651.63 3585.632 a 2282.36 Pag 439 Dada la ecuacin de regresin mltiple Yc = 420 + 50X1 + 2.5X2 encuentre Yc para los siguientes casos: a) X1 = 15, X2 = 3000 Yc = 420 + 50X1 + 2.5X2 = 420 + 50(15) + 2.5(3000) = 7830 b) X1 = 10, X2 = 2000 Yc = 420 + 50X1 + 2.5X2 = 420 + 50(10) + 2.5(2000) = 5080 c) X1 = 20, X2 = 1000 Yc = 420 + 50X1 + 2.5X2 = 420 + 50(20) + 2.5(1000) = 3080 Dada la ecuacin de la regresin mltiple Yc =0.40+3X12X2X3, calcule Yc para los siguientes casos: X1 = 1, X2 = 0.5, X3 = 1.4 28

Yc = 0.40 + 3X1 2X2 X3 = 0.40 + 3(1) 2(0.5) (1.4) =1 X1 = 0.6,X2 = 0.4, X3 = 2 Yc = 0.40 + 3X1 2X2 X3 = 0.40 + 3(0.6) 2(0.4) (2) = 0.6 X1 = 0, X2 = 0, X3 = 0 Yc = 0.40 + 3X1 2X2 X3 = 0.40 + 3(0) 2(0) (0) = 0.40 Pag 448 Estandarice cada conjunto de cantidades y calcule el coeficiente de correlacin. a) X 34 30 40 34 39 35 42 45 43 _ X = 38 Sx = 5 Y 21 22 25 28 15 24 24 22 17 _ Y = 22 Sy = 4 29 XY

714 660 1000 952 585 840 1008 990 731 7480

X = 342 Y = 198 X2 = 13196 Y2 = 4484 XY = 7480 r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 9(7480) (342)(198) 9(13196) (342)2 9(4484) (198)2 = 396 = 0.275 (42.42) (33.94) b) X 3.9 4.6 6.0 2.8 3.1 3.4 4.2 4.0 _ X=4 Sx = 1 X = 32 Y = 368 X2 = 135.02 Y2 = 17040 XY = 1480.2 r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 30 Y 46 46 52 50 48 40 42 44 _ Y = 46 Sy = 4 XY

179.4 211.6 312 140 148.8 136 176.4 176 1480.2

= 8(1480.2) (32)(368) 8(135.02) (32)2 8(17040) (368)2 = 65.6 = 0.292 (7.49) (29.93) Vuelva a calcular r para el ejercicio 1, considerando a las x como y, a las y como x. Justifique su respuesta en trminos de la frmula de r. a) X 21 22 25 28 15 24 24 22 17 _ X = 22 Sx = 4 X = 198 Y = 342 X2 = 4484 Y2 = 13196 XY = 7480 r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 9(7480) (198)( 342) 9(4484) (198)2 9(13196) (342)2 Y 34 30 40 34 39 35 42 45 43 _ Y = 38 Sy = 5 XY

714 660 1000 952 585 840 1008 990 731 7480

31

= 396 = 0.275 (33.94) (42.42) b) X 46 46 52 50 48 40 42 44 _ X = 46 Sx = 4 X = 368 Y = 32 X2 = 17040 Y2 = 135.02 XY = 1480.2 r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 8(1480.2) (368)(32) 8(17040) (368)2 8(135.02) (32)2 = 65.6 = 0.292 (29.93) (7.49) El valor no se ve alterado. Con base en los datos del ejercicio 1. Duplique cada valor de x y vuelva a calcular la media y la desviacin estndar de las x. Y 3.9 4.6 6.0 2.8 3.1 3.4 4.2 4.0 _ Y=4 Sy = 1 XY

179.4 211.6 312 140 148.8 136 176.4 176 1480.2

32

X 68 60 80 68 78 70 84 90 86 _ X = 76

Y 21 22 25 28 15 24 24 22 17 _ Y = 22

XY

1428 1320 2000 1904 1170 1680 2016 1980 1462 14960

Sy = 4 Sx = 10 Estandarice los valores de x. X = 684 Y = 198 X2 = 52784 Y2 = 4484 XY = 14960 Compare estos valores estandarizados con cos obtenidos para las x en el ejercicio 1. El resultado es el doble Qu efecto tiene sobre r el duplicar las x? r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 9(14960) (684)(198) 9(52784) (684)2 9(4484) (198)2 = 792 = 0.275 (84.85) (33.94) Ninguno

33

Con base en los datos del ejercicio 1: Sume 12 a cada valor de x y reste 2 a cada valor de y. X 46 42 52 46 51 47 54 57

Y 19 20 23 26 13 22 22 20

15 55 Calcule la media y la desviacin estndar de cada conjunto, utilizando los valores que se obtuvieron en el a). __ X = 50 Y = 20 Sx = 5 Sy = 4 Estandarice los valores y comprelos con los valores estandarizados que se obtuvieron en el ejemplo 1. XY 874 840 1196 1196 663 1034 1188 1140 825 34

8956 Qu efecto tiene r el sumar o restar una constante para los valores de x o de y? Ninguno Determine el coeficiente de correlacin para los siguientes conjuntos de calificaciones. Alumno Primer examen 82 84 86 83 88 87 85 83 86 85 87 _ X = 85 X = 936 Y = 990 X2 = 79682 Y2 = 89140 XY = 84216 r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 11(84216) (936)(990) 11(79682) (936)2 11(89140) (990)2 = 264 = 0.625 (20.14) (20.97) Segundo examen 92 91 7644 2 3 4 5 6 7 8 9 10 11 90 7740 92 7636 87 7656 86 7482 89 7565 90 7470 92 7912 90 7560 91 7917 _ 84216 Y = 90 XY 7544 1

35

Dados los siguientes conjuntos, calcule el valor de r: n a) 25 b) 50 X 60 15 Y 52 20 25 XY 200 146 3.5 X2 400 204.5 5 Y2 592 400 12.5

c) 100 20 a) r = n (XY) (X)( Y)

n (X2) (X)2 n (Y2) (Y)2 = 25(200) (60)(52) 25(400) (60)2 25(592) (52)2 = 1880 = 0.214 (80) (109.98) b) r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 50(146) (15)(20) 50(204.5) (15)2 50(400) (20)2 = 7000 = 0.500 (100) (140) c) r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 100 (3.5) (20)(25) 100(5) (20)2 100(12.5) (25)2 = 150 = 0.60 (10) (25) A continuacin se dan las calificaciones de idioma y de matemticas de los exmenes de admisin de una universidad correspondientes a 7 alumnos. Alumno 1 2 Examen Oral 420 450 Examen de Matemticas 550 600

36

3 4 5 6

410 360 320 440

520 400 410 425 475

400 7 Divida cada calificacin entre 100 Alumno

Examen Oral Examen de Matemticas XY 23.1 5.5 4.2 1 27 6.0 4.5 2 21.32 5.2 4.1 3 14.4 4.0 3.6 4 13.12 4.1 3.2 5 18.7 4.25 4.4 6 19 4.75 4.0 7 136.64 X = 28 Y = 33.8 X2 = 113.26 Y2 = 166.725 XY = 136.64 Calcule el coeficiente de correlacin r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 7(136.64) (28)(33.8) 7(113.26) (28)2 7(166.725) (33.8)2 = 10.08 = 0.68 (2.96) (4.96) Determine el coeficiente de correlacin para los datos del siguiente ejercicio: Horashombre x mes de instruccin Accidentes x milln de XY horashombre

37

1400 200 500 450 800 900 150 300 600 X = 3900 Y = 44.6 X2 = 241500 Y2 = 268.22 XY = 18720 r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 8(18720) (3900)(44.6) 8(2415000) (3900)2 8(268.22) (44.6)2 = 24180 = 0.95 (2027.31) (12.51) Dados los siguientes datos sobre delitos por violencia y temperatura promedio entre 9 p.m. y 2 a.m. las tardes de los sbados en una gran comunidad, represente en una grfica los datos, y calcule el coeficiente de correlacin: Delitos/1000 residentes 5.0 2.2 4.1 5.4 2.8 3.0 Temperatura promedio (F) 87 50 75 90 55 54 XY 435 110 307.5 486 154 162 38 7.0 3200 6.4 2340 5.2 3200 4.0 2790 3.1 1200 8.0 1950 6.5 2640 4.4 18720

3.6 4.9 4.1 4.2 2.0 2.7 3.1

68 85 82 80 45 58 66

244.8 416.5 336.2 336 90 156.6 204.6 3439.2

X = 47.1 Y = 895 X2 = 184.97 Y2 = 64453 XY = 3439.2 r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 13(3439.2) (47.1)(184.97) 13(184.97) (47.1)2 13(64453) (895)2 = 35997.513 = 0.973 (13.64) (192) Determine el coeficiente de correlacin en lo referente al nmero de horas estudiadas por 11 alumnos de las calificaciones que obtienen en un examen. Horas de estudio 2 3 6 4 6 4 7 Calificacin 89 95 80 82 85 90 75 XY 222.5 285 480 328 510 405 525

39

10 5 5 8

70 91 93 74

700 500.5 465 629 5050

X = 62 Y = 924 X2 = 400 Y2 = 78326 XY = 5050 r = n (XY) (X)( Y) n (X2) (X)2 n (Y2) (Y)2 = 11(5050) (62)(924) 11(400) (62)2 11(78326) (924)2 = 1738 = 0.834 (23.57) (88.37) a) Se sorprendera si sus clculos para un conjunto dado de pares de observaciones produjeran r = +0.9 y b = 0.9. Por qu si o por qu no? R = Si, porque r y b siempre tienen el mismo signo b) Dados los siguientes datos, se sorprendera si ambos conjuntos tuvieran una correlacin positiva? R = No, porque en ambos casos los aumentos en X vienen acompaados por incrementos en Y. c) Se sorprendera si ambos produjeran r = +1.00? Explquelo. Conjunto 1 XY 10 58 Conjunto 2 XY 01 10 4

R = No, porque no se presenta dispersin alrededor de la lnea que tiene dos puntos. Para cada una de las siguientes situaciones, establezca si el anlisis de correlacin o el anlisis de regresin seran ms apropiados y por qu? Un equipo de investigadores quiere determinar si las calificaciones en la universidad son indicativas de xito en cierto campo. R = Correlacin, porque produce un nmero que resume el grado de relacin entre dos variables. 40

Estime el nmero de kilmetros que es de esperar que recorra un conjunto de llantas radales antes de que sea necesario sustituirlo. R = Regresin, porque da lugar a una ecuacin matemtica que describe dicha relacin. Prediga cunto demorar una persona en determinar un trabajo con base en el nmero de semanas de entrenamiento. R = Regresin, porque da lugar a una ecuacin matemtica que describe dicha relacin. Determine si el nmero de semanas que se pasaron en un curso de adiestramiento, es una variable importante en el tiempo que toma realizar un trabajo. R = Correlacin, el investigador o analista trata de determinar qu variables son potencialmente importantes, y el inters radica bsicamente en la fuerza de la relacin. El administrador de una tienda quiere estimar las ventas semanales, basndose en las ventas de lunes y martes. R = Regresin, porque da lugar a una ecuacin matemtica que describe dicha relacin. EJERCICIOS PAGINA 454 1. Para cada coeficiente de correlacin de una muestra, obtenga un intervalo de confianza de 95% utilizando la fig. 14.22 respecto del coeficiente de correlacin de la poblacin, y luego determine si la muestra r es significativamente diferente de cero. r r n a 0.80 15 b 0.10 15 c 0.30 25 d 0.30 50 e 0.30 100

0.48 a 0.92 Significativo 0.42 a 0.57 No significativo 0.62 a 0.10 No significativo 0.53 a 0.03 Significativo 0.42 a 0.11 Significativo 2. Obtenga intervalos de confianza de 95% para la correlacin verdadera de la poblacin para cada no de los siguientes casos, y despus diga cules valores r no son significativos al nivel 0.05. a 0.10 20 b 0.10 50 c 0.10 200 d 0.70 50 E 0.70 50 f 0.00 25

r n

Si el cero no est en el intervalo no es significativo: 0.35 a 0.51 No significativo 0.18 a 0.37 No significativo 0.04 a 0.23 Significativo 0.54 a 0.81 Significativo 0.81 a 0.54 Significativo 41

0.39 a 0.39 No significativo 3. Utilice la frmula: t= ( r0)/ (1r2)/(n2) Alumno 1 2 3 4 5 6 7 8 9 10 11 1er. examen 82 84 86 83 88 87 85 83 86 85 87 X= 85 2o. examen 92 91 90 92 87 86 89 90 92 90 91 Y= 90

y el nivel 0.01, y determine cules de los casos siguientes son significativos: a) xy=84216 x2= 79682 y2= 89140 n2= 112= 9 r= n(xy)( x)( y)_ _ = 11 (84216) ( 936) ( 990) _ = 0.6 n(x2)( x)2) * n(y2)( y)2 11(79682)( 79682)2 11(89140)( 990)2 .005 t= 2.821 t=(0.6)/ (1.36)/(112) = 2.25 No significativo b) x 5 2.2 4.1 y 87 50 75

42

5.4 2.8 3 3.6 4.9 4.1 4.2 2 2.7 3.1 47.1 xy= 3444.1 x2= 184.97 y2= 64624

90 55 54 68 85 82 80 45 58 66 895

r= 13(3444.1)( 47.1)( 896)_ =0.97 13(184.97)( 47.1)2) * 13(64624)( 896)2

n2= 132= 11 t= 0.97 = 14.32 Significativo (10.94)/(11) .005 11 3.106 c) Horas estudio 2.5 3 6 4 6 4.5 7 10 5.5 5 8.5 Calificacin 89 95 80 82 85 90 75 70 91 93 74 43

62 xy= 5050 x2= 400 y2= 78326

924

r= 11(5050)( 62)(924)_ =0.834 11(400)( 62)2) * 11(78326)( 924)2

n2=112= 9 .005 9 3.250 t= 0.834 = 4.53 Significativo (10.69)/(9)

4. Utilice un intervalo de confianza de 95%, obteniendo a partir de la figura 14.22, a fin de evaluar cada una de las siguientes afirmaciones: a) Ho: = 0.6, H1: " 0.6, cuando r= 0.4 y n= 50 0.14 a 0.61 Se acepta Ho b) Ho: = 0.9, H1: " 0.9, cuando r= 0.8 y n= 25 0.58 a 0.90 Se acepta Ho Ho: = 0.5 , H1: " 0.5, cuando r= 0.4 y n= 400 0.32 a 0.48 Se rechaza Ho 5. En un grupo de investigaciones se estableci una escala del grado de violencia en programas de TV, para lo cual se calific con 10 programas y recopilaron datos sobre el porcentaje del teleauditorio de cada uno de ellos. Programa 2 1 2 3 4 5 Grado violencia (x) 10 20 30 40 40 % de teleauditorio (y) 15 16 20 24 25 44

6 7 8 9 10

50 55 65 70 70 450

30 30 35 35 35 265

xy= 13355 x2= 24150 y2= 7557

a) Establezca una ecuacin predictiva en lo referente al teleauditorio potencial, en trminos del coeficiente de violencia. b= n(xy) (x)( y)= 10(13355) (450)( 265) = 0.37 n(x2)( x)2 7(24150)( 4502 a= y bx= 265(0.37)( 450)= 10 n8 Yc= 10 + 0.37x b) Determine el porcentaje de variacin explicada Se= y2 ay bxy = 7557 (10)( 265)( 0.37)( 13355) =1.127 n2 8 Se2 =1.27 Sy2= n(y2)(y)2/n =(10(7557)( 265)2)/10= 66.8 n2 8 r2= 1 Se2 = 1 1.27= 0.98 Sy2 66.8 c) Calcule o determine el coeficiente de correlacin: r= n(xy)( x)( y) _ = 10 (13355) (450) (265) _ = 0.99 n(x2)( x)2) * n(y2)( y)2 10(24150)( 450)2 10(7557)( 265)2 Qu supuestos fueron necesarios para el inciso a? 45

Los supuestos de regresin Para el inciso c? Los supuestos de correlacin Es b significativo? Lo es r? (Utilice 0.05) Sb= Se 1 _ =( 1.127) 1 _= 0.02 x2 [(x)2/n] 24150 [(450)2/10] .025 b t Sb 0.37 (2.306)( 0.02) 0.32388 a 0.41612 Significativo 8 2.306 t= 0.99 = 19.8 Significativo (10.98)/(8) f) Cul es el intervalo de confianza de 95% para el porcentaje del teleauditorio de un nuevo programa que presenta un coeficiente de violencia de 60? DATOS: .025 N.C=95% = .025 Xg=6 Yc= 10 +.37 (6)= 12.22 n2=102= 8 8 2.306 x=450 x2=24150 X= 450/10= 45 Se=1.127 Yc t(Se 1(1/n)+( xgx)2 /{x2[(x)2/n]}) 12.22 (2.306) (1.127)(1.05) 12.22 (2.7) 46

9.49 a 14.94 6. Utilice un intervalo de confianza para valorar esta afirmacin: Ho: = 0.45, H1: " 0.45, =0.05, r= 0.5 y n= 200 0.6 < p < 0.4 :. Se acepta Ho. Pag 459 Pruebe cada coeficiente de correlacin al nivel 0.05, para obtener la significacin utilizando: Ho : p = o Hl = p " 0 rsp = +0.60, n = 17 Ho : p = o Hl : p " 0 g.L. = n 2 = 17 2 = 15 Valor Terico 15 2.131 VT = 2.131 Valor Experimental t= = = 0.60 = 2.90 1 rsp2 1 (60)2 n 2 17 2 VExp = 2.90 Comparacin 2.90 " 2.131 Conclusin: Se rechaza Ho rsp = +0.45, n = 22 Ho : p = o Hl : p " 0 47

g.L. = n 2 = 22 2 = 20 Valor Terico 20 2.086 VT = 2.086 Valor Experimental t= = = 0.45 = 2.25 1 rsp2 1 (.45)2 n 2 22 2 VExp = 2.25 Comparacin 2.25 " 2.086 Conclusin: Se rechaza Ho rsp = +0.91, n = 11 Ho : p = o Hl : p " 0 g.L. = n 2 = 11 2 =9 Valor Terico 9 2.262 VT = 2.262 Valor Experimental t= = = 0.91 = 6.58 1 rsp2 1 (.91)2 n 2 11 2

48

VExp = 6.58 Comparacin 6.58 " 2.262 Conclusin: Se rechaza Ho rsp = +0.25, n = 32 Ho : p = o Hl : p " 0 g.L. = n 2 = 32 2 = 30 Valor Terico 30 2.042 VT = 2.042 Valor Experimental t= = = 0.25 = 1.41 1 rsp2 1 (.25)2 n 2 32 2 VExp = 1.41 Comparacin 1.41 " 2.042 Conclusin: Se acepta Ho a) Calcular rsp para el ejercicio de la pgina 448 y 449. Concuerdan los resultados con el valor que se obtuvo utilizando la r de Pearson? Por qu? Diferencia Alumno 1 2 3 4 Examen Oral 4.2 4.5 4.1 3.6 Examen de Matemticas 5.5 6.0 5.2 4.0 d +1.3 +1.5 +1.1 +.40 d2 1.69 2.25 1.21 0.16 49 Diferencia2

5 6 7

3.2 4.4 4.0

4.1 4.25 4.75

+.90 .15 +.75 d = 5.8

0.81 0.02 0.56 d2=6.7

rsp = 1 . 6 d2 . n(n2 1) = 1 . 6 (6.7) .= 1 40.23 7(72 1) 336 = 0.88 rsp = 0.88 (r de Pearson = +0.68), la jerarquizacin hace que se desperdicie informacin. b) Cul mtodo es la mejor tcnica de correlacin, el de Pearson o el de Spearman? Explquelo brevemente. Si los datos estn en rangos, o si los supuestos necesarios para la correlacin de Pearson no son satisfechos, es preferible emplear la de Spearman. Si los supuestos de Pearson son cumplidos, se debe usar sta, dado que desperdicia menos informacin. 3. Calcule el coeficiente de correlacin de rangos en el caso de los siguientes datos, pruebe la significacin al nivel 0.01: Rango 1 2 3 4 5 6 7 8 9 10 11 12 Nmero 1 3 2 4 1 9 5 6 10 8 11 7 14 Nmero 2 1 2 3 5 6 4 7 11 9 10 8 12 d 2 0 1 4 3 1 1 1 1 1 1 2 d2 4 0 1 16 9 1 1 1 1 1 1 4 50

13 14

12 13

13 14

1 1 d=0

1 1 d2=42

rsp = 1 . 6 d2 . n(n2 1) = 1 . 6 (42) .= 1 252 14(142 1) 2730 = 0.908 Ho : p = o Hl : p " 0 g.L. = n 2 = 14 2 = 12 Valor Terico 12 3.055 VT = 3.055 Valor Experimental t= = = 0.908 = 7.51 1 rsp2 1 (.908)2 n 2 14 2 VExp = 7.51 Comparacin 7.51 " 3.055 Conclusin: Se rechaza Ho Escriba en orden los rangos 1 6 y despus forme pares con los mismos en el orden opuesto. Calcule rsp. Determine este valor en el caso de que los 2 conjuntos de rangos (1 al 6) se encuentren en el mismo orden. Ahora intente reordenar los datos, de manera que rsp sea aproximadamente igual a cero. Rango Nmero 1 Nmero 2 51

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5 6

9 6 Rangos opuestos dan como resultado rsp = 1; Rangos iguales producen rsp = +1.

A dos gerentes se les pide que jerarquicen a 11 empleados jvenes, de acuerdo con su potencialidad directiva. Determine el grado en que los dos gerentes concuerdan o no, y determine si la relacin es significativa o no. Rango Empleado A Alfonso S. Eduardo B. Ana D. Ramn Z. Roberto K. Martn A. Alejandro J. Guillermo T. Nstor T. Juan H. Samuel P. rsp = 1 . 6 d2 . n(n2 1) = 1 . 6 (134) .= 1 804 11(112 1) 1320 52 6 7 5 4 9 1 8 2 3 11 10 B 9 3 10 3 8 3 7 2 11 0 1 2 6 0 2 1 4 8 3 5 5 d=0 d2=134 25 64 1 0 4 0 4 9 9 9 Rango d 3 d2 9

= 0.391 t= = = 0.391 = 1.27 1 rsp2 1 (.391)2 n 2 11 2 VExp = 1.27 Se aceptan en todos los niveles (no significativo) EJERCICIOS PAGINA 463 1. Para cada una de las condiciones siguientes, determine si existe una relacin significativa entre las dos variables, y si la hay, determine la intensidad. Tamao de tabla N a. 4 X 4 150 200 .02 C="(150/150+200)= .65 Cmax= "(3/4)=.86 Debido a que la dif. es poca y el tamao de la tabla es minimo, la intensidad es moderada b. 5 X 5 40 200 .05 C="(40/40+200)=.40 Cmax= "(4/5)=.89 Debido a que la dif. es considerable y el tamao de la tabla es poco mas grande, la intensidad es moderada c. 3 X 3 250 250 .01 C="(250/250+250)= .70 Cmax= "(2/3)=.816 Debido a que la dif. es muy poca y el tamao de la tabla es chico, la intensidad es alta d. 6 X 6 130 150 .05 C="(130/130+150)= .68 Cmax= "(5/6)=.91

53

Debido a que la dif. es considerable y el tamao de la tabla es grande, la intensidad es moderada e. 4 X 4 16 100 .05 No existe relacin significativa ya que el valor es muy pequeo. 2. Se reunieron las calificaciones de lectura y de matemticas de nios de quinto grado, obtenindose los siguientes resultados. Determine si existe alguna relacin entre las dos calificaciones para este grupo. Frecuencia observada Lectura A B C D Totales Frecuencia esperada A 15 20 40 25 B 30 40 80 50 C 30 40 80 50 Matemticas A B 20 40 30 60 50 50 0 50 100 200 D 15 20 40 25 C 30 20 80 70 200 D 0 10 60 30 100 Totales 90 120 240 150 600

Se calcula el valor de , bajo la formula de ="[(fofe)2]/fe 1.7 5 2.5 25 + 3.33 + 10.00 + 11.25 + 0.00 + 0.00 + 10.00 + 0.00 + 8.00 + 15.00 + 5.00 + 10.00 + 1.00 = 20.0 = 30.0 = 23.8 = 34.0 = 107.8

Despus se calcula el coeficiente de contingencia C, bajo la formula C= " /( +N) C="107.8/(107.8+600) C= .39 Se calcula el valor maximo de C, o sea Cmax con la formula: Cmax= "(k1)/k Cmax= "3/4= .86 Y como la diferencia entre C y Cmax es grande y la tabla es de valor medio, la intensidad de la relacin es moderada. 54

3. Explique la forma como la tabla de contingencias de y la prueba de ji cuadrda de la tabla de independencia difieren en lo que respecta al numero de K y como se marcan las filas y las columnas. Es fcil pensarlo ya que en una tabla de contingencias solo hay una muestra con resultados que se encuentran clasificados transversalmente en las casillas; en el caso de una tabla rXk, hay k muestras. Las escalas de una tabla de contingencias tienen direccin; en tanto que por lo regular no tienen direccin en una tabla rXk; 4. Una compaa est considerando la posibilidad de ofrecer a sus empleados un incentivo econmico para que dejen de fumar o reduzcan su consumo de tabaco, de existir una correlacin directa entre el fumar y el ausentismo. Analice los datos proporcionados por la compaa y determine si se deber o no ofrecer el incentivo. Frecuencia observada Inasistencias No fumador Ligero 02 10 10 34 5 50 56 10 70 7 ms 35 70 Totales 60 200

Moderado 55 30 10 5 100

Intenso 65 55 50 30 200

Totales 140 140 140 140 560

Se calcula el valor de , bajo la formula de ="[(fofe)2]/fe, calculamos la tabla de frecuencias esperadas. Frecuencia esperada 15 50 25 15 50 25 15 50 25 15 50 25 1.7 + 32.00 + 36.00 6.7 + 0.00 + 1.00 1.7 + 8.00 + 9.00 27 + 8.00 + 16.00

50 50 50 50 + 4.50 + 0.50 + 0.00 + 8.00

= 74.2 = 8.2 = 18.7 = 58.7 = 159.7

Despus se calcula el coeficiente de contingencia C, bajo la formula C= " /(+N) C="159.7/(159.7+560) C= .47 Se calcula el valor mximo de C, o sea Cmax con la formula: Cmax= " (k1)/k Cmax= "3/4= .86 Y como la diferencia entre C y Cmax es grande y la tabla es de valor medio, la intensidad de la relacin es moderada o considerable, por lo tanto no se debe ofrecer ningn incentivo. 55

X = 450 Y = 180 X2 = 22700 Y2 = 3728 XY = 8956 .025 rsp .025 rsp .025 rsp .025 rsp .005 rsp rsp

56

57

58

Das könnte Ihnen auch gefallen