You are on page 1of 7

AREA:

Escuela de Ciencias Bsicas Tecnologa e


Ingeniera
ESTADSTICA
CIENCIAS BSICAS
UNIDAD: Medidas de Dispersin y estadsticas bivariantes
CAPTULO: IV
LECCIN: Regresin y Correlacin

NUMERO DE LA PRCTICA
2
NOMBRE DE LA PRCTICA
Regresin y correlacin
NOMBRE DEL SOFTWARE
Excel
Libre: ______x_____
Licenciado: _____________ (Marque con una X)
Aspectos Tericos:
REGRESIN Y CORRELACIN

En muchos casos se requiere conocer ms que el comportamiento de una sola


variable, se requiere conocer la relacin entre dos o ms variables como la
relacin entre produccin y consumo; salarios y horas de trabajo; oferta y
demanda; salarios y productividad; la altura de un rbol y el dimetro de su tronco;
el nivel socioeconmico de una persona y su grado de depresin; etc.
Muchos de estos comportamientos tienen una tendencia lineal, aunque hay
muchos otros que lo hacen de forma curva. Para determinar el grado de
correlacin entre las variables, no basta con calcular la varianza explicada, pues
existe el coeficiente de determinacin o coeficiente de correlacin; sin embargo,
frecuentemente se utiliza un coeficiente de correlacin rectilneo, r siendo este un
valor entre -1 y 1.
Para estas confrontaciones se utiliza el diagrama de dispersin que es plano
cartesiano en el que se marcan los puntos los puntos correspondientes a los pares
(x,y) de los valores de las variables.

El anlisis de Regresin tiene los siguientes usos: el primero es obtener los


estimadores de los parmetros, estimar la varianza del error, obtener los errores
estndares de los parmetros estimados, probar la hiptesis sobre los parmetros,
clculo de valores estimados basados en la ecuacin estimada, estimar el ajuste o
la falta de ajuste del modelo.
El modelo a utilizar es Y = a + bx, a es el intercepto, b es la pendiente de la
funcin, la que nos indica el cambio marginal de Y respecto a X.
Ejemplo
Una empresa de mensajera de entrega puerta a puerta, con el fin de mejorar la
prestacin del servicio desea establecer la relacin que puede existir entre el
tiempo empleado y la distancia recorrida para la entrega de un determinado
producto.

Distancia en
Kilmetros
825
(x)

215

1070

550

480

920

1350

325

670

1215

Tiempo de
entrega ( y)
(das)

1,0

4,0

2,0

1,0

3,0

4,5

1,5

3,0

5,0

3,5

a. Realice un diagrama de dispersin a partir de los datos obtenidos


b. Determine la mejor ecuacin que se ajusta a los datos.
Solucin:
El diagrama de dispersin se obtiene mediante el asistente de grficos.
Trasladamos los datos a una hoja en Excel, seleccionamos la tabla donde estn
los datos <<Insertar<<Dispersin. En estilo de diseo puede personalizar su
diagrama de barras.
Seleccionamos un diseo de grafico de la barra de herramientas y damos nombre
a los ejes y al Diagrama.

Para hallar la recta de Regresin y la ecuacin que mejor se ajusta a los datos, en
el diagrama de dispersin hacemos click derecho sobre uno de los puntos y
seleccionamos Agregar lnea de tendencia.

As obtenemos una ventana, la cual nos permite escoger la lnea de tendencia,


elegimos opcin de lnea de tendencia (Lineal) y seleccionamos:
Presentar ecuacin en el grafico.
Presentar el valor R cuadrado en el grafico.

De esta manera obtenemos nuestra recta de regresin, la ecuacin que ms se


ajusta a los datos y el coeficiente de determinacin el cual mide la relacin entre
las dos variables.

Anlisis:

Con los resultados obtenidos se puede asegurar que la ecuacin de la recta es


una muy buena estimacin de la relacin entre las dos variables. El R2 afirma
adems que el modelo explica el 90.05% de la informacin y el valor de r
coeficiente de correlacin lineal confirma adems el grado de relacin (94%)
entre las variables: Distancia y tiempo de entrega de un determinado producto.

EJERCICIOS:
1. Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A una
serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide
su tensin arterial un tiempo despus.
X (sal)

Y (Presin)

1,8

100

2,2

98

3,5

105

4,0

110

4,3

112

5,0

120

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las


variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables.
d. Si a un paciente se le administra una dosis de sal de 6,5. Cul es la tensin
arterial esperada?
2. En un nuevo proceso artesanal de fabricacin de cierto artculo que esta
implantado, se ha considerado que era importante ir anotando peridicamente el
tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el
nmero de das desde que empez dicho proceso de fabricacin. Con ello, se
pretende analizar como los operarios van adaptndose al nuevo proceso
mejorando paulatinamente su proceso de produccin.
Los siguientes datos representan dicha situacin:
X
Y

10
35

20
28

30
23

40
20

50
18

60
15

70
13

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las


variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables.
d. Que tiempo deber tardarse un empleado cuando se lleven 100 das?

3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemtico


que permita determinar la relacin entre el peso y la estatura de sus estudiantes.
Para ello selecciona 10 nios y realiza las mediciones respectivas.
A continuacin se presentan los resultados:
Estatura
(cm)
Peso (
kg)

121

123

108

118

111

109

114

103

110

115

25

22

19

24

19

18

20

15

20

21

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las


variables
b. Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
c. Determine el grado de relacin de las dos variables.
d. Cual es el peso que debera tener un estudiante que mida 130 cm?