You are on page 1of 9

TEMA: Regresin y Correlacin El mtodo estadstico que investiga y define la relacin funcional entre dos o ms variables se llama REGRESIN,

y la ecuacin de la funcin matemtica constituye la FUNCION DE REGRESION O MODELO DE REGRESION. El anlisis del grado de asociacin o modelo de regresin, constituye la CORRELACION. Cuando se relacionan dos variables, se tratar de una regresin simple y correlacin simple, en tanto, cuando se considera la relacin entre tres o ms variables se hablar de regresin mltiple y correlacin mltiple. Por su parte, si la funcin de regresin corresponde a una lnea recta se trata de regresin lineal, y si es curva (parbola, exponencial, etc.) se denomina regresin no lineal. REGRESION SIMPLE LINEAL Considerando la ecuacin de la recta: Y= a + bx Los parmetros a y b son determinados al aplicar el mtodo de los mnimos cuadrados con las siguientes frmulas:

a=

x 2 . y x. xy n x 2 ( x ) 2
n xy x. y n x 2 ( x ) 2

b=

CORRELACION LINEAL La correlacin lineal expresa el grado de asociacin o afinidad entre las variables consideradas. Se llamar CORRELACION SIMPLE cuando se trata de analizar la relacin entre dos variables. Se llamar CORRELACION RECTILINEA O LINEAL si la funcin es una recta, y de CORRELACION NO LINEAL cuando la funcin es una curva o una funcin de grado superior. COEFICIENTE DE CORRELACION RECTILINEA. El coeficiente de correlacin rectilnea, es el estadgrafo que expresa o mide el grado de asociacin o afinidad entre las variables relacionadas y se denota por r la cual se define como:

S 2 yx S2y

Donde:

yx =

y 2 a y b xy
n

y =

y2
n

y n

EJERCICIOS DE APLICACIN
1. Las ventas de lnea blanca varan segn el estado del mercado de casas nuevas: cuando las ventas de casas nuevas son buenas, tambin lo son las de lavaplatos, lavadoras de ropa, secadoras y refrigeradores. Una asociacin de comercio compil los siguientes datos histricos ( en miles de unidades) de las ventas de lnea blanca y la construccin de casas. Construccin de casas (miles) 2 2.5 3.2 3.6 3.3 4 4.2 4.6 4.8 5 Ventas de lnea blanca (en miles) 5 5.5 6 7 7.2 7.7 8.4 9 9.7 10

a) Desarrolle una ecuacin para la relacin entre las ventas de lnea blanca (en miles) y la construccin de casas (en miles). b) Grafique el diagrama de dispersin e indique si (r<0) (r>0) (r=0) c) La construccin de casas durante el ao prximo ser de hasta 8.0 mil casas. Calcule las ventas de lnea blanca para el prximo ao. d) Calcule e interprete el coeficiente de correlacin. 2. Suponga que la directora del Departamento de Salubridad de Chapel Hill est interesada en la relacin que existe entre la antigedad de un camin basura y los gastos anuales de reparacin que debe esperar. Con el fin de determinar esta relacin, la directora ha reunido informacin de cuatro de los camiones de la ciudad. Nmero del camin 101 102 103 104 Antigedad del camn en aos 5 3 3 1 Gastos de rep. Durante el ltimo ao en cientos de dlares 7 7 6 4

a. Determine la variable independiente y dependiente.

b. Obtenga la ecuacin de la recta de regresin.


c.Si

una ciudad tiene un camin de 4 aos de antigedad, Cmo podra la directora usar la ecuacin para predecir los gastos anuales de reparacin para este camin?

3. Una compaa de mquinas despachadoras automticas posee y controla un nmero muy grande de mquinas de cierto tipo. Las mquinas estn instaladas en diversos sitios y tienen diferentes antigedades. Los registros de la compaa muestran entre otras cosas, en relacin con cada mquina activa, la cantidad de dinero que se gasta en su mantenimiento en su ltimo ao (completo) de uso. De ese lote de mquinas tomamos una muestra al azar de n=10 mquinas y, anotando el costo de mantenimiento de cada una, y su ltimo ao de uso, se obtiene: Aos de uso 4 2 3 5 2 3 4 5 4 3 Costo de mantenimiento(dlares) 148 128 133 154 118 145 143 159 142 127 dependiente(Y) y la variable

a) Determine la variable independiente(X): Y= X=

b) Estime la ecuacin de regresin lineal: c) Realice un pronstico para el costo de mantenimiento de una de las mquinas vendedoras durante su segundo ao de uso. d) Grafique el diagrama de dispersin e indique si (r<0) (r>0) (r=0) e) Calcule e interprete el coeficiente de correlacin r

4. Se seleccion una muestra de 12 casas vendidas la semana pasada en una ciudad de EEUU. Puede concluirse que a medida que aumenta la extensin del inmueble (indicada en miles de pies cuadrados), el precio de venta (en miles de dlares) aumenta tambin? Extensin (miles de pies cuadrados) 1,4 1,3 1,2 1,1 1,4 1 Precio de venta (miles de dlares) 100 110 105 120 80 105 Extensin (miles de pies cuadrados) 1,3 0,8 1,2 0,9 1,1 1,1 Precio de venta (miles de dlares) 110 85 105 75 70 95

a) Determine la ecuacin de regresin e interprtela.


b)

Calcule el coeficiente de correlacin e interprtelo.

5. La National Highway Association estudia las relaciones entre el nmero de licitadores para un proyecto de carretera, y la propuesta ganadora (la de ms bajo costo) para el proyecto. De particular inters es si el nmero de postores aumenta o disminuye el importe de la licitacin ganadora. Proyecto Nmero de 1 2 3 4 5 6 7 8
a)

licitadores 9 9 3 10 5 10 7 11

Oferta ganadora (millones de $) 5,1 8 9,7 7,8 7,7 5,5 8,3 5,5

Proyecto Nmero de 9 10 11 12 13 14 15 licitadores 6 6 4 7 7 7 6

Oferta ganadora (millones de $) 10,3 8 8,8 9,4 8,6 8,1 7,8

Determine la ecuacin de regresin e interprtela. ms licitadores tienden a aumentar o disminuir el importe de la propuesta ganadora? Estime el monto de la oferta ganadora si hubiese once licitadores.

b)

6. En los siguientes datos aparece el precio al menudeo de 12 computadoras porttiles, seleccionados al azar, junto con sus velocidades de procesador correspondientes en gigahertz. Computadora Velocidad 1 2 2 1.6 3 1.6 4 1.8 5 2 6 1.2 7 2 8 1.6 9 2 10 1.6 11 1 12 1.4 Precio 2689 1229 1419 2589 2849 1349 2929 1849 2819 2669 1249 1159

a) Elabore una ecuacin lineal que sirva para describir cmo depende el precio de la velocidad del procesador. b) Con base en su ecuacin de regresin, hay alguna computadora que parezca tener, de manera particular un precio menor o mayor? c) Calcule e interprete el coeficiente de correlacin. 7. El ingreso anual disponible y los gastos de consumo de 12 familias, seleccionadas aleatoriamente, en una zona de nuestra ciudad ha sido en miles de soles, los siguientes: Gastos de consumo(miles) 7 12 18 30 20 24 8 11 8 6 Ingreso Anual (miles) 8 15 20 35 28 25 8 13 7 6

10 18 a) Determine la variable independiente(X): Y= X=

12 15 dependiente(Y)

la

variable

b) Estime la ecuacin de regresin lineal: c) Estimar el ingreso anual de una familia que tiene un gasto en consumo anual de 19 000 soles d) Grafique el diagrama de dispersin e indique si (r<0) (r>0) (r=0) e) Calcule e interprete el coeficiente de correlacin r
8.

Una compaa elctrica, estudia las relaciones entre los consumos de energa (en miles de kilo watts-hora, kw) y el nmero de habitaciones en una residencial privada unifamiliar. Una muestra aleatoria de 10 casas produjo los siguientes resultados: Nmero de habitaciones Consumo (miles de Kwh.) 12 9 9 7 14 10 6 5 10 8 8 6 10 8 10 10 5 4 7 7

a. Determine la variable dependiente (y) y la variable independiente (x) Y = X = b. Estime la ecuacin de regresin lineal: Y = a + b X Y = + X

c. Evale el consumo (en miles de kilo watts-hora, Kwh.), para una casa de 13 habitaciones.

9. El departamento de produccin de una fbrica desea explorar la relacin entre el nmero de obreros que arman n ensambles y la cantidad de estos producida. Como experimento se asignaron grupos de trabajadores para verificar su produccin y los resultados obtenidos fueron los siguientes: Nmero de ensambladores 2 4 1 5 3 Produccin en 1h (unidades) 15 25 10 40 30

a. Determine la variable dependiente (y) y la variable independiente(x) Y = X = b. Estime la ecuacin de regresin lineal: Y = a + b X Y = + X

c. Para 6 ensambladores Cul es la produccin horaria esperada? d. Calcule e interprete el valor del coeficiente de regresin lineal r 10. Un fabricante de pantalones de mezclilla sabe que un presupuesto considerable para anunciar en televisin su producto crear una demanda de ste entre los compradores de los almacenes. La tabla que sigue muestra las cantidades (en miles de dlares) que se gastan para anunciar la lnea de otoo de pantalones de mezclilla durante 8 aos y el nmero de pantalones (en miles) vendidas de cada lnea para el otoo. Cantidad gastada en la publicidad por televisin (en miles de dlares) 50 65 75 100 Nmero de pantalones vendidos (en miles) 45 60 80 95

125 140 170 195

120 150 145 190

a) Determine la variable dependiente(Y) y la variable independiente(X): Y= X= b) Estime la ecuacin de regresin lineal: c) Estimar el nmero de pantalones que se espera vender con un presupuesto de publicidad por televisin de un quinto de milln de dlares. d) Grafique el diagrama de dispersin e indique si (r<0) (r>0) (r=0) e) Calcule e interprete el coeficiente de correlacin r 11. Suponga que el seor Snchez observa el precio y el volumen de venta de leche durante 10 semanas seleccionadas al azar. Los datos que ha recabado se muestran en la siguiente tabla. Datos de galones de leche Semana Nivel semanal de Precio de venta ($) ventas, Y (miles X de gal) 10 6 5 12 10 15 5 12 17 1.30 2.00 1.70 1.50 1.60 1.20 1.60 1.40 1.00

1 2 3 4 5 6 7 8 9

10

20

1.10

El coeficiente de correlacin de la muestra de -0.86 indica una relacin bastante negativa entre Y y X, -mientras el precio del galn de leche aumenta, el nmero de galones vendidos disminuye La pregunta que podra surgir enseguida es: qu tanto desciende el volumen a medida que aumenta el precio? Esta pregunta sugiere dibujar una lnea recta a travs de los puntos de los datos expuestos en el diagrama de dispersin. 12. El procesamiento de carbn sin tratar implica el lavado, en donde se elimina la ceniza de carbn (no orgnico, material incombustible). El artculo Quantifying Sampling Precision for Coal Ash Using Gys Discrete Model of the Fundamental Error proporciona los datos relacionados con los porcentajes de ceniza con el volumen de una partcula de carbn. Se midieron los porcentajes promedio de ceniza para seis volmenes de partculas de carbn. Los datos son los siguientes: Volumen (cm3) 0.01 0.06 0.58 2.24 15.55 276.02 Porcentaje de ceniza 3.32 4.05 5.69 7.06 8.17 9.36 a) Determine la variable dependiente (Y) y la variable independiente(X): Y= X= b) Estime la ecuacin de regresin lineal: c) Grafique el diagrama de dispersin e indique si (r<0) (r>0) (r=0) d) Calcule e interprete el coeficiente de correlacin r