Sie sind auf Seite 1von 25

TRABAJO COLABORATIVO

Unidad 2: Paso 4. Descripción de la información

Estudiantes

Grupo del curso


Presentado a

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


13 de Mayo de 2018

1
INTRODUCCIÓN
El objetivo general del presente documento es el de mostrar el proceso
estadístico de análisis y correlación lineal entre dos variables cuantitativas, la
inferencia de conclusiones a partir de los datos obtenidos para solucionar
problemáticas reales y las herramientas tecnológicas a utilizar para llegar a tal
fin, como puede ser Excel o Infostat.
Este documento pretende contextualizar al lector acerca de todos los procesos
relacionados con el análisis y correlación lineal, para que este pueda usarlos
con el fin de resolver problemáticas de igual índole dentro de su entorno,
utilizando soluciones eficaces basadas en estadística descriptiva.

2
JUSTIFICACIÓN

Dentro del marco de la formación profesional de los estudiantes de la UNAD en


el curso de estadística descriptiva se pretende fomentar el desarrollo cognitivo y
autónomo a través de ejercicios que buscan solucionar problemáticas
cotidianas. En el contexto de este trabajo estos ejercicios están relacionados
con el análisis y correlación lineal de dos variables cuantitativas.

Con la realización de estos ejercicios el estudiante adquirirá experiencias y


prácticas que le permitirán solucionar problemáticas de igual índole en su
entorno, así como desarrollar su habilidad cognitiva y de investigación
autónoma en estadística descriptiva.

Para la realización del análisis planteado se utilizarán las herramientas


tecnológicas Excel y/o Infostat, cuyas funcionalidades permiten la consecución
de los ejercicios propuestos.

OBJETIVOS

 Realizar el diagrama de dispersión de datos entre dos variables


cuantitativas utilizando funcionalidades de Excel y/o Infostat.

 Mostrar el proceso inicial de análisis de correlación lineal entre dos

3
variables cuantitativas, utilizando funcionalidades de herramientas
tecnológicas tales como Excel y/o Infostat.

 Determinar el modelo matemático de las dos variables cuantitativas


utilizando funcionalidades de Excel y/o Infostat y a través del cálculo
manual con ecuaciones específicas.

 Determinar el coeficiente de correlación y el coeficiente de determinación


de las dos variables cuantitativas utilizando funcionalidades de Excel y/o
Infostat y a través del cálculo manual con ecuaciones específicas.

 Inferir conclusiones lógicas que permitan solucionar la problemática


planteada a partir de los datos obtenidos con anterioridad.

REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

Estudiante 1: Juan David Osorio Ipia

Variable Y: Tasa de empleo.


Variable X: Personas con empleo.

a) Diagrama de dispersión:

4
Empleo en Colombia
70.00

60.00

50.00 y = 1E-06x + 26.562


Tasa de empleo

R² = 0.8552
40.00

30.00

20.00

10.00

0.00
0 10000000 20000000 30000000 40000000
Personas con empleo

Análisis e interpretación de resultados (tipo de asociación entre las


variables):

Tiene un tipo de relación directa, ya que la magnitud en aumento de una


variable hace que la magnitud de la otra también suba (directamente
proporcional).

b) Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Resultado
Modelo matemático y = 1,4146 x + 26,5617617
R2 0,8552
%R2 85,52%
Análisis e interpretación de resultados:

El modelo matemático es confiable, ya que el coeficiente de determinación que


representa el nivel de confianza tiene un porcentaje alto.

c) Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Resultado

5
R 0,92477024173
%R 92,47%
Grado de relación Excelente.

Análisis e interpretación de resultados:

El porcentaje de explicación del modelo es el 85,52% encontrado.


Para calcular el coeficiente de correlación que nos ayudará a averiguar el grado
de relación de las dos variables sacamos la raíz al coeficiente de
determinación, que es 0,8552, lo cual nos da 0,92477024173.
Ahora comparamos el valor del coeficiente de correlación obtenido con la tabla
de grado de correlación lineal de Ciro Martínez Bencardino y concluimos que la
relación de las dos variables es una Correlación excelente.
d) Relacionar la información obtenida con el problema.
Podemos concluir a través de estos datos que el grado de correlación lineal
entre la tasa de empleo y el número de personas con empleo es excelente, que
la tasa de empleo si depende del número personas y que mientras el número
de personas con empleo aumente la tasa de empleo subirá, y esto a su vez
ocasionará que la tasa de desempleo baje en Colombia.

Estudiante 2: Raúl Eduardo Bolaños Muñoz

Variable Y: Tasa de desempleo.


Variable X: Personas sin empleo.

a) Diagrama de dispersión:

6
Análisis e interpretación de resultados (tipo de asociación entre las
variables):

El tipo de asociación es Directa, ya que la magnitud en aumento de una variable hace


que la magnitud de la otra suba.

b) Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?
Resultado

Modelo matemático y = 395524x+613723


R2 0,3969
%R2 39,69%

Análisis e interpretación de resultados:

El modelo no es confiable ya que el coeficiente de determinación tiene un porcentaje


bajo.

7
c) Determine el porcentaje de explicación del modelo y el grado de
relación de las dos variables.

Resultado

R 0.63%
%R 63%
Grado de relación Regular

● Análisis e interpretación de resultados:

Para averiguar el porcentaje de explicación del modelo encontrado comparándolo en la


tabla de grado de correlación lineal concluimos que la relación es Regular

d) Relacionar la información obtenida con el problema.


En el problema podemos decir que los datos del grado de correlación lineal entre la tasa
de desempleo y el número de personas sin empleo es regular, ya que la tasa de
desempleo depende del número de personas y si el número de personas sin empleo
aumenta la tasa de desempleo sube.
.

Estudiante 3: Kimberly Cataño

Variable Y: Personas con empleo


Variable X: Cantidad de empresas

a) Diagrama de dispersión:

8
Personas con Empleo
35,000,000

30,000,000
y = 95.596x + 1E+06
R² = 0.9646
25,000,000

20,000,000

15,000,000

10,000,000

5,000,000

-
- 50,000 100,000 150,000 200,000 250,000 300,000 350,000

Análisis e interpretación de resultados (tipo de asociación entre las


variables):
El tipo de asociación entre estas dos variables es directa ya que a mayor
cantidad de empresas mayor número de personas con empleo

b) Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Resultado
Modelo matemático y = 95,596x + 1E+06
R2 R² = 0,9646
%R2 %R² = 96,46

Análisis e interpretación de resultados:


El modelo matemático es confiable ya que su porcentaje es muy alto se acerca
a1

c) Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Resultado
R 0,98214055194
%R 98,21

9
Grado de relación Excelente

Análisis e interpretación de resultados:

Obteniendo estos resultados comparamos con la tabla de grado de correlación


lineal y concluimos que su relación es una Correlación excelente.

d) Relacionar la información obtenida con el problema.


Con este análisis concluimos que la variable personas con empleo depende de
la cantidad de empresas, ya que a medida que aumenten la cantidad de
empresas en el país esto genera mayor oportunidad de empleo y así
aumentaría la cantidad de personas con empleo.

Estudiante 4: Carlos Arturo Arias Ortiz

Variable Y: Producción Billones


Variable X: Población cantidad de personas

a) Diagrama de dispersión:

Producción de población en
Colombia
80,000,000
70,000,000
Producción Billones

60,000,000
50,000,000
40,000,000
30,000,000
20,000,000 y = 6.8457x - 3E+08
10,000,000 R² = 1
-
40,000,000 42,000,000 44,000,000 46,000,000 48,000,000 50,000,000
Población cantidad de personas

10
Análisis e interpretación de resultados (tipo de asociación entre las
variables): El grado de correlación es perfecto y el tipo de correlación es lineal
directa observamos esto mediante el modelo matemático y = 6,8457x – 3E+08
con un nivel de confianza del 100%.

b) Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Resultado
Modelo matemático y = 6,8457x – 3E+08
R2 1
%R2 1%

Análisis e interpretación de resultados: Existe una relación proporcionada


entre las variables desarrolladas, esto quiere decir que en la medida en que ha
crecido la población, también lo ha hecho la cantidad de dinero.

c) Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Resultado
R 1
%R 1%
Grado de relación Perfecto

Análisis e interpretación de resultados: Los datos calculados se puede


concluir que existe una correlación Perfecta que se explica mediante el modelo
matemático con un nivel de confianza del 100%.

d) Relacionar la información obtenida con el problema.


La variable población cantidad de personas depende de la cantidad de
producción billones, por lo que a medida que aumenten la cantidad de dinero
en Colombia esto genera más contratos de personas y en base a esto crecería
la cantidad de población con un empleo.

Estudiante 5:

Variable Y:

11
Variable X:

a) Diagrama de dispersión:

Análisis e interpretación de resultados (tipo de asociación entre las


variables):

b) Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Resultado
Modelo matemático
R2
%R2

Análisis e interpretación de resultados:

c) Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Resultado
R
%R
Grado de relación

12
Análisis e interpretación de resultados:

d) Relacionar la información obtenida con el problema.


Escribir los análisis de la relación entre las dos variables seleccionadas y su
asociación con la problemática objeto de estudio.

CONCLUSIONES

 Se ha evidenciado el proceso de creación del diagrama de dispersión


con todas sus características pertinentes para el análisis correlacional.
Este diagrama nos ayudará a analizar la relación entre las dos variables
propuestas para así realizar las conclusiones.
 Se ha mostrado el método para obtener el modelo matemático de las
dos variables cuantitativas de manera gráfica y con el cálculo por medio

13
de ecuaciones. Este modelo nos ayuda a obtener datos dependientes de
una variable con la otra.
 Se ha determinado el coeficiente de correlación de manera gráfica y por
medio de ecuaciones, el cual nos ayuda a determinar la relación entre
las dos variables, que puede variar entre perfecta y ninguna.
 Se ha determinado el coeficiente de determinación de manera gráfica y
por medio de ecuaciones, el cual nos ayuda a sacar el nivel de confianza
en el modelo matemático planteado.
 Se ha mostrado la inferencia de conclusiones con los datos obtenidos, lo
cual nos ayudó a solucionar la problemática planteada.

REFERENCIAS BIBLIOGRÁFICAS

 Rodríguez, F. & Pierdant, A. (2014). Estadística para administración.


Página 241 a 278. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=25
8&docID=11013767&tm=1470693471527
 Monroy, S. (2008). Estadística Descriptiva. Editorial: Instituto Técnico
Nacional. Página 178 a 222. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=18
3&docID=10436604&tm=1470693651415
 Rodríguez, F. & Pierdant, A. (2014). Estadística para administración.
Página 241 a 278 Recuperado de
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=25
8&docID=11013767&tm=1470693471527
 Gil, M., Gonzales, A. J Salagre, M. (2014). Ejercicios de estadística
teórica: Probabilidad e inferencia. Página 46 a 57. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=47

14
&docID=10995669&tm=1470693596054
 Monroy, S. (2008). Estadística Descriptiva. Editorial: Instituto Técnico
Nacional. Página 223 a 254 Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=19
4&docID=10436604&tm=1470693683773
 Rodríguez, F. & Pierdant, A. (2014). Estadística para administración.
Página 280 a 298. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=29
7&docID=11013767&tm=1470693984628
 Gil, M., Gonzales, A. J Salagre, M. (2014). Ejercicios de estadística
teórica: Probabilidad e inferencia. Página 58 a 77. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=59
&docID=10995669&tm=1470694057290
 Monroy, S. (2008). Estadística Descriptiva. Editorial: Instituto Técnico
Nacional. Recuperado de:
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?ppg=22
4&docID=3192101&tm=1512261758930
 Martínez, C. (2011). Estadística Básica Aplicada. Ecoe, 4a edición.
Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=23
9&docID=10560355&tm=1489690264128
 M. Pliego López, R. M. Pérez, Estadística I (2004) 2nd ed., pp. 27-94.
Madrid: Paraninfo. Recuperado de
http://bibliotecavirtual.unad.edu.co:2081/ps/i.do?id=GALE%7CCX405240
0006&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b039aa4c3b2b62b99f8
129c3bb3ab609
 Peña, D. (2014). Fundamentos de Estadística. Alianza Editorial S.A.
Edición electrónica. Disponible en la base de datos de la biblioteca de la
UNAD:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=12
1&docID=11028686&tm=1470689905871
 Sánchez, S. E. A., Inzunza, C. S., & Ávila, A. R. (2015). Probabilidad y
estadística 1. Distrito Federal, MÉXICO: Grupo Editorial Patria. Retrieved
from Recuperado de:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?docID=
11230886&p00=conceptos+generales+estad%C3%ADstica+descriptiva&
ppg=46

15
ANEXO
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL

2.1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que
existe entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo
(x) que está presente en el condensador principal en un proceso de destilación,
de acuerdo con los siguientes datos:

16
● Diagrama de dispersión:

17
RENDIMIENTO EN PROCESO
QUÍMICO
102
100
y = 14.947x + 74.283
98 R² = 0.8774
96
Pureza

94
92
90
88
86
0 0.5 1 1.5 2
% Hidrocarburos

● Análisis e interpretación de resultados (tipo de asociación entre las


variables):

Tiene un tipo de relación directa, ya que la magnitud en aumento de una


variable hace que la magnitud de la otra también suba (directamente
proporcional).

b) Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Resultado
Modelo matemático y = 14,947x + 74,283
R2 0,8774
%R2 87,4%

Análisis e interpretación de resultados:


El modelo matemático es confiable, ya que el porcentaje del coeficiente de
determinación es alto.

c) Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

18
Resultado
R 0,93669632218
%R 93,6%
Grado de relación Excelente

● Análisis e interpretación de resultados:

Para calcular el coeficiente de correlación que nos ayudará a averiguar el


grado de relación de las dos variables sacamos la raíz al coeficiente de
determinación, que es 0,8774, lo cual nos da 0.93669632218. Ahora
comparamos el valor del coeficiente de correlación obtenido con la tabla de
grado de correlación lineal de Ciro Martínez Bencardino y concluimos que la
relación de las dos variables es una Correlación excelente entre las dos
variables.

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es


igual a 91,3?

● Análisis e interpretación de resultados:

Recordemos que el modelo matemático es y = 14,947x + 74,283, donde Y es la


pureza del aire e x el porcentaje de hidrocarburo, así que simplemente
reemplazamos los datos para obtener el valor de x si y es igual a 91,3:

y = 14,947x + 74,283
91,3 = 14,947x + 74,283
91,3 - 74,283 = 14,947x
91,3 - 74,283 = 14,947x
17,017 = 14,947x
17,017/14,947 = x
x = 1.13848932896

Cuando la pureza del oxígeno es igual a 91,3 el porcentaje de hidrocarburos es


de 1.13848932896.

2.2 El número de libras de vapor (y) consumidas mensualmente por una


planta química, se relaciona con la temperatura ambiental promedio (en o

19
F). Para el año 2014, se registraron los siguientes valores de temperatura
y consumo anual:

Diagrama de dispersión:

REGISTROS DE TEMPERATURA Y
CONSUMOS DE VAPOR (2014)
800
700
Consumo de vapor (Lb)

y = 9.2087x - 6.3184
600 R² = 0.9999
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
Temperatura (oF)

● Análisis e interpretación de resultados (tipo de asociación entre las


variables):

20
Tiene un tipo de relación directa, ya que la magnitud en aumento de una
variable hace que la magnitud de la otra también suba (directamente
proporcional).

b) Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Resultado
Modelo matemático y = 9,2087x – 6,3184
R2 0,9999
%R2 99,99%

● Análisis e interpretación de resultados:

El modelo matemático es confiable, ya que el porcentaje del coeficiente de


determinación es alto.

c) Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Resultado
R 0,99994999875
%R 99,99%
Grado de relación Excelente

● Análisis e interpretación de resultados:

El porcentaje de explicación del modelo es el 99,99% encontrado.


Para calcular el coeficiente de correlación que nos ayudará a averiguar el
grado de relación de las dos variables sacamos la raíz al coeficiente de
determinación, que es 0,9999, lo cual nos da 0.99994999875.
Ahora comparamos el valor del coeficiente de correlación obtenido con la
tabla de grado de correlación lineal de Ciro Martínez Bencardino y
concluimos que la relación de las dos variables es una Correlación
excelente.

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?

21
● Análisis e interpretación de resultados:

Recordemos que el modelo matemático es Y = 9,2087x – 6,3184, donde Y


es el consumo de vapor e x la temperatura, así que simplemente
reemplazamos los datos para obtener el valor de Y si X es igual a 70:

Y = 9,2087X – 6,3184

Y = 9,2087(70) – 6,3184

Y = 644,609 – 6,3184

Y = 638,2906

Cuando la temperatura es igual a 70 el consumo de vapor es de 638,2906.

2.3 Los investigadores están estudiando la correlación entre la obesidad y


la respuesta individual al dolor. La obesidad se mide como porcentaje
sobre el peso ideal (x). La respuesta al dolor se mide utilizando el umbral
de reflejo de reflexión nociceptiva (y) que es una medida de sensación de
punzada. Obsérvese que ambas, X e Y, son variables aleatorias:

22
● Diagrama de dispersión:

DOLOR PROVOCADO POR


SOBREPESO
16 y = -0.0629x + 11.642
Umbral de reflejo de flexión nociceptiva

14 R² = 0.1115
12
10
8
6
4
2
0
0 20 40 60 80 100
Porcentaje de sobrepeso

● Análisis e interpretación de resultados (tipo de asociación entre las


variables):

23
Tiene un tipo de relación inversa, ya que la magnitud en aumento de una
variable hace que la magnitud de la otra baje.

b) Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. ¿Es confiable?

Resultado
Modelo matemático y = -0,0629x + 11,642
R2 0,1115
%R2 11,15%

● Análisis e interpretación de resultados:

El modelo matemático NO es confiable, ya que el porcentaje del coeficiente de


determinación es muy bajo.

c) Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Resultado
R 0,33391615714
%R 33,40%
Grado de relación Mínima

● Análisis e interpretación de resultados:

El porcentaje de explicación del modelo es el 11,15% encontrado.


Para calcular el coeficiente de correlación que nos ayudará a averiguar el
grado de relación de las dos variables sacamos la raíz al coeficiente de
determinación, que es 0,1115, lo cual nos da 0.33391615714.
Ahora comparamos el valor del coeficiente de correlación obtenido con la
tabla de grado de correlación lineal de Ciro Martínez Bencardino y
concluimos que la relación de las dos variables es una Correlación
mínima.

24
d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un
porcentaje de sobrepeso, de 40?

● Análisis e interpretación de resultados:

Recordemos que el modelo matemático es Y = -0,0629X + 11,642, donde Y


es el umbral de reflejo de flexión nociceptiva e x el porcentaje de
sobrepeso, así que simplemente reemplazamos los datos para obtener el
valor de Y si X es igual a 40:

Y = -0,0629X + 11,642

Y = -0,0629(40) + 11,642

Y = -2,516 + 11,642

Y = 9,126

Cuando el porcentaje de sobrepeso es igual a 40 el umbral de reflejo de


flexión nociceptiva es de 9,126

25

Das könnte Ihnen auch gefallen