Sie sind auf Seite 1von 16

ESTADISTICA

PASO 3 –ANALISIS DE LA INFORMACION

ACTIVIDAD INDIVIDUAL

GUSTAVO ADOLFO VERA HERNANDEZ

C.C 1.105.672.632

GRUPO: 202107095_24

TUTOR:
MILTON EDUARDO SALGADO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD


ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
PSICOLOGÍA
CEAD JAG
NOVIEMBRE 2020
• Introducción.
Por medio de las técnicas estadísticas bivariantes es posible analizar las características de
dos variables en una muestra o población con el objetivo de determinar las relaciones que
existen entre dichas variables, dependiendo de las características de las variables es
posible determinar cuál es la herramienta estadística más precisa para el análisis. En este
trabajo se presentará la conceptualización de las medidas estadísticas bivariantes y se
realizarán ejercicios prácticos para su aplicación.

• Justificación.
La importancia de las medidas estadísticas bivariantes radica en que su aplicación puede
ayudar a entender fenómenos de la vida cotidiana y la relación de diferentes variables que
se afectan en los contextos reales. Por ejemplo:
“El análisis de regresión lineal múltiple, a diferencia del simple, se aproxima más a
situaciones de análisis real puesto que los fenómenos, hechos y procesos sociales, por
definición, son complejos y, en consecuencia, deben ser explicados en la medida de lo
posible por la serie de variables que, directa e indirectamente, participan en su
concreción.” (Rodríguez Jaume, 2001)

• OBJETIVO:

OBJETIVO GENERAL

Conceptualizar y aplicar los conceptos de medidas estadísticas bivariantes.

OBJETIVOS ESPECIFICOS

- Realizar un mapa mental utilizando todos los conceptos estudiados en el tema de


medidas bivariantes.
- Definir todos los conceptos y manejarlos en ejercicios practicos.
- Desarrollar los ejercicios prácticos de la guía, aplicando todos los conceptos vistos.
• Mapa Mental

• Definición de conceptos
-Diagrama de dispersión.
es una herramienta utilizada cuando se desea realizar un análisis gráfico de datos
bivariados, es decir, los que se refieren a dos conjuntos de datos. ... El resultado del
análisis puede mostrar que existe una relación entre una variable y la otra.
-Correlación lineal simple.
son métodos estadísticos que estudian la relación lineal existente entre dos variables. A
nivel experimental, la correlación se suele emplear cuando ninguna de las variables se ha
controlado, simplemente se han medido ambas y se desea saber si están relacionadas.
-Coeficiente de determinación R2
Una vez elegido el modelo de función de regresión de tipo II y estimados los valores de sus
parámetros que hacen mínima SCE11 , la cuestión que se plantea es cómo medir el grado
de dependencia de Y respecto de X bajo la suposición de que se estima Y mediante dicha
función concreta de X. Tal grado de dependencia será denotado por R2Y/X, y se
denomina coeficiente de determinación de la regresión de Y sobre X (R2X/Y, cuando la
regresión sea de X sobre Y).
En consonancia con la definición de ηY/X, R2Y/X deberá ser definido como la reducción
proporcional en SCE que se consigue al estimar los valores de Y a través de los
de X mediante la función de regresión de tipo II elegida en vez de mediante

 
 
-Correlación positiva y correlación negativa
La correlación es una medida de la fuerza de la relación entre dos variables. El coeficiente
de correlación cuantifica el grado de cambio de una variable en función del cambio de la
otra variable. En estadística, la correlación está conectada con el concepto de
dependencia, que es la relación estadística entre dos variables.
• Cuando hay una correlación positiva (r> 0) entre dos variables aleatorias, una variable se
mueve proporcionalmente a la otra variable. Si una variable aumenta, la otra aumenta. Si
una variable disminuye, la otra también disminuye.
• Cuando hay una correlación negativa (r <0) entre las dos variables aleatorias, las
variables se mueven opuestas entre sí. Si una variable aumenta, la otra disminuye y
viceversa.
 
- ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?
 coeficiente de correlación lineal (de Pearson), es una medida de regresión que pretende
cuantificar el grado de variación conjunta entre dos variables, el número que mide el
grado de intensidad y el sentido de la relación entre dos variables. Es una medida de
regresión que pretende cuantificar el grado de variación conjunta entre dos variables.

• Ejercicio práctico

3.2 Edad – Masa Muscular. Una nutricionista desea estudiar la relación entre la edad y la
masa muscular de las personas, y para realizar el estudio seleccionó un grupo de mujeres
con características semejantes, con edades 5 diferentes y midió su masa muscular. La
nutricionista registró los datos de edad y masa muscular en las siguientes tablas:

1. EDAD 2. MASA
MUSCULAR
57 98
75 83
70 90
62 98
41 67
44 90
66 80
55 69
72 74
67 79
53 100
57 60
75 84
64 110

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Chart Title
120

100

80 f(x) = 0.14 x + 75.75


R² = 0.01

60

40

20

0
35 40 45 50 55 60 65 70 75 80
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Título
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
112,50
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
98,75
2. MASA MUSCULAR

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
85,00
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
71,25
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
57,50
Versión Estudiantil Versión Estudiantil
39,30 Versión Estudiantil
48,65 58,00Versión 67,35
Estudiantil 76,70
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil
1. EDAD Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Análisis de regresión lineal

Variable N R² R² Aj ECMP AIC BIC


2. MASA MUSCULAR 14 0,01 0,00 286,40 118,85 120,76

Coeficientes de regresión y estadísticos asociados

Coef Est. E.E. LI(95%) LS(95%) T p-valor CpMallows VIF


const 75,75 23,72 24,07 127,43 3,19 0,0077
1. EDAD 0,14 0,38 -0,69 0,97 0,37 0,7171 0,14 1,00

La grafica nos permite observar que la edad no es proporcional a la masa


b. Encuentre el coeficiente de determinación y correlación.
R² COEFECIENTE DE DETERMINACION
R² = 0, 0113
R= COEFICIENTE DE CORRELACION = RAIZ CUADRADA DEL COEFECIENTE DE
DETERMINACION
R² = 0, 0113
R= 0.1063
El coeficiente de correlación que tenemos como resultado, indica que existe una relación
positiva entre ambas variables

c. Determine el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?
El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente:
y = 0.1416x - 75.749

El modelo no es confiable porque el coeficiente de determinación R2

R CUADRADO= COEFICIENTE DE DETERMINACION = CONFIABILIDAD DEL MODELO

R² = 0, 0113 * 100 que es 1.31%. De confiabilidad del modelo

d. Determine el grado de relación de las dos variables.


Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Título
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
112,50
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
98,75
2. MASA MUSCULAR

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
85,00
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
71,25
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
57,50
Versión Estudiantil Versión Estudiantil
39,30 Versión Estudiantil
48,65 58,00Versión 67,35
Estudiantil 76,70
Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
1. EDAD
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

R² = 0, 0113
Podemos observar que la relación es nula, y No hay ningún tipo de relación entre las dos
variables que una no depende de la otra.

Actividad 4. Regresión y correlación Lineal Simple.


Descripción de la Actividad Individual: A partir de la base de datos suministrada: Anexo
1- Pruebas SABER 11 - 160 estudiantes 2020 (16-4), cada estudiante, deberá:
-Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas e identificar la variable dependiente e independiente.
Dependiente: número de personas en el hogar
Independiente: cuartos en el hogar

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación


entre las variables.

NUMERO
DE CUARTOS
PERSONA EN EL
S EN EL HOGAR
HOGAR
2 1
3 1
5 4
1 2
4 2
6 3
10 6
6 4
2 2
3 4
3 3
5 4
3 1
7 4
3 2
5 4
4 2
4 2
4 3
4 3
2 2
4 2
4 3
4 3
4 3
4 2
4 3
4 3
4 3
4 4
4 4
4 8
7 9
3 7
3 7
5 7
7 7
3 6
3 6
2 4
3 4
2 4
3 3
3 3
3 1
2 1
10 6
6 4
4 2
2 2
2 2
4 2
6 2
6 2
4 2
6 3
11 2
2 2
4 5
6 2
2 1
6 2
4 3
5 6
5 4
5 1
6 2
6 4
2 1
2 1
4 3
5 3
4 2
6 5
6 5
2 2
4 3
4 3
4 3
4 2
4 3
4 3
4 3
4 3
4 3
4 3
4 2
2 3
4 3
4 3
4 4
4 3
4 3
12 3
4 2
4 2
4 3
4 2
4 3
4 3
4 4
4 3
4 5
6 3
4 3
6 5
4 4
4 2
4 4
6 4
4 3
2 2
4 3
6 4
4 3
4 3
6 4
4 2
4 2
4 3
11 6
4 2
4 3
4 3
6 4
4 3
4 3
4 4
4 3
6 4
4 3
4 3
6 4
4 3
4 3
6 3
4 2
4 3
6 5
6 4
4 3
6 3
6 3
4 2
4 3
4 3
6 4
4 3
4 3
4 3
6 4
4 3
8 5
6 4
6 4
4 3
4 5
4 3
4 3
4 3

Chart Title
10
9
8
7
6
5 f(x) = 0.31 x + 1.86
R² = 0.15
4
3
2
1
0
0 2 4 6 8 10 12 14

Podemos observar que la relación es nula, y solo exite una pequeña relación lineal entre
las dos variables que una no depende de la otra.

_Determine al coeficiente de determinación y de correlación de las dos variables.


Interprete los resultados - Encuentre el modelo matemático que permite predecir el
efecto de una variable sobre la otra. ¿Es confiable?
R² COEFECIENTE DE DETERMINACION
R² = 0, 1465
R= COEFICIENTE DE CORRELACION = RAIZ CUADRADA DEL COEFECIENTE DE
DETERMINACION
R² = 0, 1465
R= 0.3827
El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente:
y = 0.3123x + 1,8574

El modelo no es confiable porque el coeficiente de determinación R2

R CUADRADO= COEFICIENTE DE DETERMINACION = CONFIABILIDAD DEL MODELO

R² = 0, 1465 * 100 que es 14.65%. De confiabilidad del modelo

- Determine el tipo de correlación de las dos variables.


R= 0.3827
Tenemos un correlación positiva, Algunos puntos están cerca de la línea, pero otros
puntos están lejos de ella, lo que indica que solo existe una relación lineal moderada entre
las variables.

- Relacionar la información obtenida con el problema.


Los resultados estadísticos obtenidos nos demuestran que np hay relación entre las
variables, esto lo obtenemos mediante el modelo matemático y = 0.3123x + 1,8574 lo cual
nos dio un a confiabilidad solo del 14,65% por consiguiente podemos afirmar que el
número de persona no depende de la cantidad de cuartos.
El coeficiente de determinación coincide con la conclusión del coeficiente de Pearson,
existe una relación positiva no tan fuerte. Cabe señalar que existe un dato atípico que
distorsiona el modelo, al removerlo podemos tener una correlación del 100%

Actividad 5. Regresión y correlación múltiple.

Descripción de la Actividad: A partir de la base de datos suministrada “Anexo 1- Pruebas


SABER 11 - 160 estudiantes 2020 (16-4)”, cada estudiante, deberá:
a. Identificar una variable cuantitativa dependiente y varias variables cuantitativas
independientes del estudio de investigación.
Dependiente: promedio general
Independiente: edad del estudiante, numero de libros de consulta

b. Realizar el diagrama de dispersión de dichas variables.

Chart Title
60

50

40

30

20
f(x) = 0.31 x − 6.77
10 R² = 0.15

0
20 30 40 50 60 70 80 90

N° DE LIBROS DE CONSULTA Linear (N° DE LIBROS DE CONSULTA)


EDAD DEL ESTUDIANTE

c. Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.
Análisis de regresión lineal

Variable N R² R² Aj ECMP AIC BIC


PROMEDIO GENERAL160 0,33 0,32 144,75 1249,42 1261,72

Coeficientes de regresión y estadísticos asociados

Coef Est. E.E. LI(95%) LS(95%) T p-valor


CpMallows VIF
const 133,13 12,29 108,85 157,40 10,83 <0,0001

N° DE LIBROS DE CONSULTA 0,26 0,09 0,08 0,43 2,93 0,0039 9,60


1,17
EDAD DEL ESTUDIANTE -4,68 0,72 -6,09 -3,26 -6,53 <0,0001 43,64
1,17

Cuadro de Análisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor
Modelo 10816,68 2 5408,34 38,70 <0,0001
N° DE LIBROS DE CONSULTA 1201,81 1 1201,81 8,60 0,0039
EDAD DEL ESTUDIANTE 5960,16 1 5960,16 42,64 <0,0001
Error 21942,71 157 139,76
Total 32759,39 159

d. Relacionar la información obtenida con el problema.


Hemos utilizado un modelo múltiple que explica con un alto grado de precisión la relación
entre las variables, este ejercicio nos permite determinar que la variable edad tiene más
relación con la variable dependiente, en comparación con número de libros consultados

• Conclusiones.
1. Regresión Lineal
A partir de los resultados podemos concluir que el método de regresión lineal simple sirve
para formular modelos que ayuden a explicar una variable a partir de la otra, es decir, que
a partir del valor de una variable podamos calcular el valor de otra. Lo anterior tendrá
validez en la medida en que el coeficiente de correlación sea lo suficientemente confiable,
es decir, tenga un valor cercano a 1.

2. Regresión Lineal Múltiple


A partir de los resultados del ejercicio, podemos concluir que el método de regresión
lineal múltiple es válido y útil en los casos en que una variable se relaciona con más de una
variable independiente, por lo que formularemos un modelo que nos permita, a partir de
los valores de las variables independientes, predecir el valor de la variable dependiente

• Referencias Bibliográficas.
Regresión y correlación lineal. (s. f.). Recuperado de.
http://www.unadzsurlab.com/ovas_ibague/regresion/pagina6.htm

Ucha, A. P. (2020, 13 febrero). Coeficiente de correlación lineal. Economipedia.


https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html

Rodríguez Jaume, M. J. (2001). Estadística Informática: casos y ejemplos con el SPSS.


Recuperado de: https://rua.ua.es/dspace/bitstream/10045/8143/1/Regresion
%20MUTIPLE.pdf

Das könnte Ihnen auch gefallen