Sie sind auf Seite 1von 23

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD

ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES


CURSO ESTADISTICA DESCRIPTIVA

REGRESIÒN Y DETERMINACION

NEIVIS YOJANNA CASTILLA BECERRA

CÓDIGO 49791740

GRUPO 204040_93

TUTOR:

ROBERTO MARIO DE LEON

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

ESCULA CIENCIA SOCIALES, ARTES Y HUMANIDADES

PROGRAMA PSICOLOGIA

2016
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

INTRODUCCIÓN

En este trabajo se abordaran temáticas de como relacionar variables independientes y


dependientes de forma lineal simple y múltiple. Se revisara mediante los resultados
obtenidos si el modelo matemático obtenido en la linealizacion tiene buen porcentaje de
correlación para decir si describe el comportamiento deseado.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

JUSTIFICACIÓN

Con la elaboración de este trabajo se pretende con el uso de la regresión lineal o


linealizacion hallar un modelo matemático que se ajuste a la dispersión de los datos
cuando se hace una relación simple y múltiple en variables, además de esto adquirir
destreza en herramientas que ofrece Excel para la regresión lineal y hallar el coeficiente
de correlación lineal.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

OBJETIVOS

Identificar el tipo de variable dependiente e independiente en un estudio estadístico para


usar los métodos de regresión y correlación lineal.

Usar las herramientas que ofrece Excel par la graficacion de un sistema simple de dos
variables para hallar el coeficiente de correlación lineal y el modelo matemático
ajustado a la relación entre las variables de estudio.

Aplicar las herramientas de Excel secundarias para obtener el modelo matemático para
una regresión lineal simple y que es muy útil también para una regresión lineal múltiple.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

1. Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas.

Las variables relacionadas cuantitativas son grado de alcoholemia conductor infractor y


número de muertos en accidente.

2. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


asociación entre las variables.

A continuación se muestra la tabla de datos de las dos variables, una identificada como
variable X y la otra identificada como variable Y.

TABLA DE DATOS VARIABLES A RELACIONAR PARA LA REGRESIÓN


LINEAL SIMPLE

GRADOS DE ALCOHOL DEL NUMERO DE


CONDUCTOR-variable x MUERTOS-variable y
0,0 1
0,3 1
0,0 1
0,2 1
0,6 1
0,4 2
0,2 1
0,6 2
0,7 2
0,5 2
1,4 2
0,8 2
0,6 2
1,0 1
0,7 2
0,4 2
0,6 2
0,0 2
0,2 2
0,7 2
0,8 2
0,9 2
0,7 2
0,6 2
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

0,8 2
0,9 2
1,0 2
0,9 2
1,2 2
1,1 2
0,8 2
1,2 3
1,4 3
0,8 3
0,9 3
1,2 3
1,1 3
1,0 3
1,2 3
1,0 3
1,4 3
1,6 3
1,5 3
1,4 3
1,9 3
1,8 3
1,6 3
1,8 3
1,5 3
1,6 3
2,0 3
1,8 3
1,7 3
1,6 4
1,2 4
1,8 4
1,7 4
1,6 4
1,4 4
1,8 4
1,7 4
1,4 4
1,5 4
1,9 5
2,0 5
1,9 5
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

1,8 5
2,1 5
2,2 5
2,0 5
2,1 5
2,3 5
2,4 6
2,2 6
2,4 6
2,1 6
1,9 7
2,3 7
2,2 7
2,0 7
2,3 7
2,4 7
2,2 7
2,3 7
2,4 7
2,5 7
2,5 8
2,4 8
2,3 8
2,6 8
3,0 9
2,8 9
3,4 8
3,1 8
3,3 8
3,3 8
2,9 10
3,0 9
3,2 9
3,0 9
3,2 10
3,2 9
3,5 11
3,2 11
3,0 11
3,2 12
3,3 12
3,4 12
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

3,4 12
3,5 12

De acuerdo a la tabla anterior el diagrama de dispersión es el siguiente.

Diagrama de Dispersion
14

12

10
f(x) = 3.04 x − 0.42
R² = 0.86
Numero de Muertos

0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
Grado de Alcoholemia conductor infractor

Como se observa la relación lineal es muy buena, el porcentaje de correlación está


alrededor del 86%. Entonces el modelo matemático de la gráfica da una información
muy buena de la relación de la variable independiente y la dependiente.

3. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

El modelo matemático lineal entre las dos variables es el siguiente:

y=3,0351 x−0,4235

El modelo es confiable por su porcentaje de correlación que es de 86.33%, lo que da


más confiabilidad y por supuesto esta entre los valores de -1 y 1.

4. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

El porcentaje de explicación es de 86.33% y el grado del coeficiente de correlación


lineal es de 0.8633, pero se debe usar el coeficiente de correlación ajustado, que es de
0,86212971.

Con los resultados obtenidos la relación entre dos variables siendo cual es dependiente o
independiente es importante pero la forma de estar más cerca para definir si el
fenómeno se puede relacionar de una manera lineal es decir directamente proporcional
es linealizando el fenómeno y ver si el coeficiente de correlación lineal esta entre -1 y 1,
si lo esta es parte para la definición del modelo matemático, pero otra cosa es si este
valor es alto si tiende a cero el fenómeno funciona no muy bien y el porcentaje de
explicación no es tan alto para decir si el modelo matemático es bueno, pero si este
valor es alto la relación establecida entre las variables es alto y el modelo matemático se
puede decir es excelente o bueno, como en el caso que se resolvió anteriormente con las
variables de grado de alcoholemia del conductor y número de muertos.

5. Identificar una variable cuantitativa dependiente y varias variables independientes del


estudio de investigación.

Para este caso de correlación múltiple la variable dependiente será número de muertos y
como variables independientes grado de alcoholemia y edad.

TABLA DE DATOS VARIABLES A RELACIONAR PARA LA REGRESIÓN


LINEAL MÚLTIPLE
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

NUMERO DE GRADOS DE ALCOHOL DEL EDAD-variable


MUERTOS-variable y CONDUCTOR-variable x1 x2
1 0,0 29
1 0,3 38
1 0,0 52
1 0,2 46
1 0,6 21
2 0,4 18
1 0,2 54
2 0,6 33
2 0,7 52
2 0,5 38
2 1,4 46
2 0,8 29
2 0,6 17
1 1,0 22
2 0,7 55
2 0,4 60
2 0,6 33
2 0,0 32
2 0,2 46
2 0,7 55
2 0,8 19
2 0,9 21
2 0,7 42
2 0,6 46
2 0,8 36
2 0,9 35
2 1,0 43
2 0,9 32
2 1,2 24
2 1,1 44
2 0,8 31
3 1,2 50
3 1,4 30
3 0,8 48
3 0,9 53
3 1,2 35
3 1,1 46
3 1,0 45
3 1,2 32
3 1,0 45
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

3 1,4 31
3 1,6 33
3 1,5 23
3 1,4 56
3 1,9 18
3 1,8 54
3 1,6 33
3 1,8 52
3 1,5 38
3 1,6 46
3 2,0 29
3 1,8 17
3 1,7 22
4 1,6 54
4 1,2 17
4 1,8 21
4 1,7 46
4 1,6 55
4 1,4 19
4 1,8 21
4 1,7 42
4 1,4 46
4 1,5 36
5 1,9 35
5 2,0 56
5 1,9 22
5 1,8 23
5 2,1 45
5 2,2 43
5 2,0 34
5 2,1 38
5 2,3 18
6 2,4 54
6 2,2 33
6 2,4 52
6 2,1 38
7 1,9 46
7 2,3 29
7 2,2 17
7 2,0 22
7 2,3 34
7 2,4 46
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

7 2,2 55
7 2,3 19
7 2,4 21
7 2,5 42
8 2,5 46
8 2,4 36
8 2,3 35
8 2,6 55
9 3,0 22
9 2,8 18
8 3,4 54
8 3,1 33
8 3,3 52
8 3,3 38
10 2,9 46
9 3,0 29
9 3,2 17
9 3,0 22
10 3,2 38
9 3,2 52
11 3,5 46
11 3,2 21
11 3,0 18
12 3,2 54
12 3,3 60
12 3,4 33
12 3,4 32
12 3,5 46

6. - Realizar el diagrama de dispersión de dichas variables.

Se obtienen gráficos de dispersión de cada una de las variables independientes con


respecto a la dependiente.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

grafico dispersion grado de alcoholemia vs numero de muertos


Pronóstico 1

14

12

10

8
numero de muertos

0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

-2

grados de alcoholemia conductores


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

grafico dispersion edad conductores vs numero de muertos


14

12

10
numero de muertos

6 Pronóstico 1

0
10 20 30 40 50 60 70

-2

edad condcutores

7. - calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

y=−07523+3.065 x1 +0.0071 x 2

Estadísticas de la regresión  
Coeficiente de correlación
múltiple 0,92965708
Coeficiente de determinación
R^2 0,864262286
R^2 ajustado 0,861701197
Error típico 1,144515077
Observaciones 109
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

Como se observa el coeficiente de correlación es muy bueno entonces se puede afirmar


que el modelo matemático encontrado es válido para el análisis por regresión es
coherente para su estudio.

El porcentaje de explicación es del 86%.

8. - Relacionar la información obtenida con el problema.

Como se observa los gráficos de dispersión muestran las relaciones entre las variables
analizando una por una, pero al relacionar el modelo matemático obtenido y con los
valores de coeficiente de correlación y el porcentaje de explicación demuestra que la
relación de las variables dependientes tomadas con respecto a la dependiente es buena.

ANÁLISIS DE LA INFORMACIÓN OBTENIDA

De acuerdo a los resultados obtenidos las variables cuantitativas tienen más variedad de
estudios estadísticos que las variables cualitativas, este tipo de variables son
susceptibles a calcular datos y obtener estudios más detallados acerca de la muestra o
población estudiada.

La dependencia o independencia de las variables a estudiar se puede abordar desde el


punto de vista en como una variable muestra más peso que las otras y como una de estas
causa las otras, de esta forma se puede analizar la dependencia e independencia de las
variables.

El sistema de regresión lineal es muy útil para obtener los modelos matemáticos para
ver como inciden unas variables en el estudio estadístico y su comportamiento frente a
otras, pero está claro que esto no es del todo infalible ya que dependiendo del
coeficiente de correlación en el estudio por dispersión si este valor es bajo o tiende a ser
menor al 70 por ciento o menor al 50 por ciento el modelo no es útil y hay que buscar
otro tipo de estudio de regresión para hallar el modelo matemático.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

CONCLUSIONES

El método de regresión y correlación lineal permite hallar el modelo matemático para


una relación simple y múltiple de variables que se relacionan de forma dependiente e
independiente a otras.

Mediante el diagrama de dispersión se pueden ver de forma espacial y pares ordenados


el comportamiento de dos variables entre sí, con la ayuda de este grafico se puede
obtener un modelo matemático para entender como las variables se comportan entre sí.

La herramienta análisis de datos de Excel permite hallar un análisis detallado de la


relación simple o múltiple que se quiere hallar par una regresión lineal entre variables
dependientes y la independiente.

El coeficiente de correlación lineal debe tender a 1 para decir que el modelo matemático
lineal encontrado es lo bastante acertado para describir el comportamiento de las
variables entre sí. Si este valor tiende a estar cerca de cero la regresión lineal no dará el
modelo matemático acertado para la relación de dependencia e independencia de las
variables de estudio.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

ANEXO LABORATORIO FASE 4 TRABAJO COLABORATIVO 3

1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que
existe entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo
(x) que está presente en el condensador principal en un proceso de destilación,
de acuerdo con los siguientes datos:

X Y
(% de Hidrocarburos) (Pureza)

0.99 90.01
1.02 89.05
1.15 91.43
1.29 93.74
1.46 96.73
1.36 94.45
0.87 87.59
1.23 91.77
1.55 99.42
1.4 93.65
1.19 93.54
1.15 92.52
0.98 90.56
1.01 89.54
1.11 89.85
1.2 90.39
1.26 93.25
1.32 93.41
1.43 94.88
0.95 87.33

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

Diagrama de dispersion
105

100

f(x) = 14.91 x + 74.32


95 R² = 0.88
Pureza

90

85

80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
Porcentaje de hidrocarburos

La asociación entre las variables es lineal y su grado de correlación está dentro


de los límites que demuestran una buena relación lineal.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?

y = 14,913x + 74,319

Este es el modelo matemático que relaciona las dos variables pureza y


porcentaje de hidrocarburos. Y si es confiable por su coeficiente de correlación
lineal.

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

Tiene un porcentaje del 87% y el grado de correlación es 0.8762.

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es


igual a 51,4?

De acuerdo al modelo matemático encontrado:


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

y = 14,913x + 74,319

En este caso se va a hallar el valor de x correspondiente a un valor de y.

y−74.319
x=
14.913

51.4−74.319
x=
14.913

x=−1.53

De acuerdo al valor obtenido se observa que a menor pureza del oxigeno el


porcentaje de hidrocarburo es pequeño y negativo. Es una relación
directamente proporcional.

2. El número de libras de vapor (y) consumidas mensualmente por una planta


química, se relaciona con la temperatura ambiental promedio (en o F). Para el
año
2015, se registraron los siguientes valores de temperatura y consumo anual.

MES TEMPERATURA CONSUMO DE VAPOR


Enero 21 185,79
Febrero 24 214,47
Marzo 32 288,03
Abril 37 424,84
Mayo 50 455
junio 59 539
Julio 68 621,55
Agosto 74 675,06
Septiembre 62 562,03
Octubre 50 452,93
Noviembre 41 369,95
Diciembre 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

Diagrama de dispersion
800
700
f(x) = 8.98 x + 11.88
600 R² = 0.97
Consumo de Vapor

500
400
300
200
100
0
10 20 30 40 50 60 70 80
Temperatura

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?

y = 8,9782x + 11,882, este es el modelo matemático que relaciona la linealidad


entre la temperatura y el consumo de vapor en los doce meses del año. En
este caso la variable independiente es la temperatura y la dependiente es el
consumo de vapor. El modelo matemático es confiable por su alto grado de
correlación lineal.

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

El porcentaje de explicación del modelo es del 97%, y el grado de relación esta


entre los limites. Su valor de r indica una correlación lineal excelente.

3. Los investigadores están estudiando la correlación entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de
reflexión nociceptiva (y) que es una medida de sensación de punzada.
Obsérvese que ambas, X e Y, son variables aleatorias

x y (umbral
(porcentaje de reflejo
de de flexión
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

sobrepeso) nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Diagrama de Dispersion
16

14
Umbral de reflejo de flexion

12

10 f(x) = − 0.06 x + 11.64


R² = 0.11
8

0
10 20 30 40 50 60 70 80 90 100
Porcentaje de Sobrepeso

Como se observa la linealidad cumple con los valores en el coeficiente de


correlación lineal entre -1 y 1, pero la aleatoriedad en los porcentajes de
sobrepeso no permite que los puntos más alejados de los valores más
cercanos entre si estén cerca del modelo matemático encontrado.

b. Ajuste un modelo matemático que permita predecir el efecto de una variable


sobre la otra. Es confiable?

y = -0,0629x + 11,642, este es el modelo matemático que relaciona mediante la


linealidad las dos variables de interés. El modelo es confiable por su valor de
grado de correlación lineal.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

c. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.

El porcentaje de explicación del modelo es del 11% y el grado de relación entre


las variables es de 0.111.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un


porcentaje de sobrepeso, de 50?

y=−0.0629∗x +11.642

y=−0.0629∗50+11.642

y=8.49

Este es el valor de reflejo de flexión nociceptiva, cuando el porcentaje de


sobrepeso es de 50.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
CURSO ESTADISTICA DESCRIPTIVA

Das könnte Ihnen auch gefallen