Beruflich Dokumente
Kultur Dokumente
ID: 597071
ALEX CUDEMUS
ID:
PROBABILIDAD Y ESTADISTICA
NCR: 8731
TALLER - QUIZ
EJERCICIO 1
El Ministerio de Comercio, Industria y Turismo de Colombia realizó un estudio en diferentes ciudades
del país para determinar un modelo y analizar la posible relación que existe entre el número
de habitantes de una ciudad y el promedio de ingresos mensuales de los habitantes.
Los resultados obtenidos se muestran en la tabla.
ACTIVIDAD
1. Realice el diagrama de dispersión para las variables estudiadas.
2. Justifique el modelo de regresión a utilizar comparando los valores de R cuadrado en los diferentes
modelos (Exponencial, lineal, cuadrático º)
3. Determine el modelo de regresión lineal y la correlación de las variables del problema
4. Existe una relación entre las variables mencionadas, mencione que tipo de relación existe. Justifique.
5. Determine dos predicciones para la variable dependiente y dos para la variable independiente con e
l modelo de regresión determinado
6. Determine el promedio, varianza y desviación de cada una de las variables
SOLUCION
1)
Modelo cuadratico
1,400,000
1,200,000
1,000,000
800,000
600,000
400,000
y = -0.0145x2 + 104.71x + 755350
200,000 R² = 0.1107
0
0 1000 2000 3000 4000 5000 6000 7000 8000
Podemos observar que el R^2 del modelo cuadrático es el mayor y con esto se puede
evidenciar que es la que mejor explica los datos
1000000
200000
0
0 20 40 60 80 100
Correlacion 0,206728181
R^2 43
4) Existe una relación entre las variables mencionadas, mencione que tipo de relación existe.
Justifique.
Si existe una relación entre las dos variables y esta relación es que una de las variables depende
de los datos de la otra variable
5) Determine dos predicciones para la variable dependiente y dos para la variable independiente
con el modelo de regresión determinado
# de Habitantes Promedio
580 811198,5084
999 820892,675
1200 825543,0986
6) Determine el promedio, varianza y desviación de cada una de las variables
Ejercicio 2
La Secretaría de movilidad de Bogotá realizo una investigación que quería determinar si había alguna
relación entre el número de años de experiencia conduciendo La Secretaría de movilidad de Bogotá
realizo una investigación que quería determinar si había alguna relación entre el número de años
de experiencia conduciendo localidad de Suba y los resultados obtenidos fueron los siguientes:
80
Series1
60
40 Línea de tendencia de
PROMEDIO DE INGRESO
20 MENSUAL
R² = 0.0351
0
0 20 40 60 80
60
Línea de tendencia de
PROMEDIO DE INGRESO
40
MENSUAL
20 Poly. (Series1)
0
0 20 40 60 80
Modelo de regresión cuadrático
100
90
80
70
60
50 Series1
40 Expon. (Series1)
30
20
10
0
0 20 40 60 80
Podemos observar que el R^2 del modelo cuadrático es el mayor y con esto se puede evidenciar
que es la que mejor explica los datos
Correlacion 0,698659572
R^2 0,49
4) Existe una relación entre las variables mencionadas, mencione que tipo de relación existe.
Justifique.
Si existe una relación entre las dos variables y esta relación es que una de las variables depende
de los datos de la otra variable
5. Determine dos predicciones para la variable dependiente y dos para la variable independiente
con el modelo de regresión determinado
DEFORMACION DE LA
Año ESTRUCTURA (CM)
1 5,709483599
0,5 4,943275008
1,5 6,475692189
PROMEDIO DE
NÚMERO DE HABITANTES INGRESO
(MILES DE HABITANTES) MENSUAL
# de datos 70 70
suma datos 358 841,00
Promedio 5,114285714 12,01428571
variancia 40,2155102 193,4712245
Desviacion 6,341570011 13,90939339
EJERCICIO 3
Un grupo de ingenieros civiles prueba diferentes tipos de hormigón para determinar nuevos compuestos
que puedan usar en sus construcciones. La compañía que suministra información sobre un tipo de hormigón
experimental para que los ingenieros
evidencien el rendimiento que tiene el mismo. Para eso se observan los centímetros
de deformación que tiene el homigon al pasar diferentes lapsos de tiempo.
0.4
0.35
0.3 Series1
0.25
0.2
Línea de tendencia de
0.15 PROMEDIO DE INGRESO
MENSUAL
0.1
0.05
0
0 20 40 60 80 100
Modelo de regresión cuadrático
0.45
0.4
0.35
0.3
0.25
Series1
0.2 Expon. (Series1)
0.15
0.1
0.05
0
0 20 40 60 80 100
Podemos observar que el R^2 de el modelo cuadratico es el mayor y con esto se puede evidenciar
que es la que mejor explica los datos
0.4
0.3
Series1
0.2
Linear (Series1)
0.1 y = -0.001x + 0.1601
0
0 20 40 60 80 100
Correlacion -0,276199767
R^2 0,08
4. Existe una relación entre las variables mencionadas, mencione que tipo de relación existe. Justifique
Si existe una relación entre las dos variables y esta relación es que una de las variables depende de los
5. Determine dos predicciones para la variable dependiente y dos para la variable independiente con el
modelo de regresión determinado
DEFORMACION
DE LA
ESTRUCTURA
Año (CM)
1 0,163269992
0,5 0,179469559
1,5 0,147070424
DEFORMACION DE LA
AÑOS ESTRUCTURA (CM)
# de datos 80 80
suma datos 183,7 9,70
Promedio 2,29625 0,121272613
variancia 0,609360938 0,008384841
Desviacion 0,780615743 0,091568777
EJERCICIO 4
1)
Diagrama de dispersión para las variables
45
40
35
30
25 Series1
20 Linear (Series1)
15 Linear (Series1)
10
5
0
0 10 20 30 40 50 60 70 80
2)
40
35
30
Series1
25 R² = 2E-05
20 Línea de tendencia de
15 PROMEDIO DE INGRESO
MENSUAL
10
0
0 20 40 60 80
Modelo de regresión exponencial
45
40
35
30
Series1
25
20
Línea de tendencia de
15 PROMEDIO DE INGRESO
MENSUAL
10
0
0 20 40 60 80
Podemos observar que el R^2 de el modelo cuadratico es el mayor y con esto se puede evidenciar que es la
que mejor explica los datos
3)
Diagrama de dispersión para las
variables
45
40
35
30
25 y = -0.002x + 24.665 Series1
20
Linear (Series1)
15
10
5
0
0 20 40 60 80
Correlacion -0,056229897
R^2 0,003
4)
Si existe una relacion entre las dos variables y esta relacion es que una de las variables depende
de los datos de la otra variable
5)
6)
Temperatura
(Grados
VOLTAJE (Amperios) centigrados)
# de datos 72 72
suma datos 446,2 1.795,16
Promedio 6,197222222 24,93277778
variancia 10,10415895 82,17225062
Desviacion 3,178703973 9,064891098
EJERCICIO 5)
1)
35.00
30.00
25.00
20.00 Series1
Linear (Series1)
15.00
10.00
5.00
0.00
0 5 10 15 20 25 30 35
2)
35.00
30.00
25.00 Series1
20.00
R² = 0.1637 Línea de tendencia de
15.00 PROMEDIO DE
INGRESO MENSUAL
10.00
5.00
0.00
0 10 20 30 40
Modelo de regresión exponencial
40.00
35.00
30.00
25.00 Series1
20.00
Línea de tendencia de
15.00 PROMEDIO DE INGRESO
MENSUAL
10.00
5.00
0.00
0 10 20 30 40
35.00
30.00
25.00
20.00 Series1
Expon. (Series1)
15.00
10.00
5.00
0.00
0 5 10 15 20 25 30 35
Podemos observar que el R^2 de el modelo cuadratico es el mayor y con esto se puede evidenciar
que es la que mejor explica los datos
3.
Diagrama de dispersión para las
variables
40.00
30.00
20.00 Series1
y = 0.4352x + 4.8717
Linear (Series1)
10.00
0.00
0 10 20 30 40
Correlacion 0,947193592
R^2 0,897
4)
Si existe una relacion entre las dos variables y esta relacion es que una de las variables depende
de los datos de la otra variable
5.
Kilometros
recorrido Galones de gasolina
120 8,034559417
220 15,68873899
450 33,293352
6.
Prototipo 2
1)
15 Linear (Series1)
10
5
0
0 5 10 15 20 25 30
2)
35
30
25 Series1
20
R² = 0.1141 Línea de tendencia de
15 PROMEDIO DE INGRESO
MENSUAL
10
0
0 5 10 15 20 25 30
30 Series1
20
Línea de tendencia de
10 PROMEDIO DE INGRESO
MENSUAL
0
0 5 10 15 20 25 30
Modelo de regresión cuadrática
40
35
30
25 Series1
20
Línea de tendencia de
15 PROMEDIO DE INGRESO
MENSUAL
10
0
0 5 10 15 20 25 30
Podemos observar que el R^2 de el modelo cuadratico es el mayor y con esto se puede evidenciar
que es la que mejor explica los datos
3)
30
20 Series1
y = 0.3679x + 6.6444
Linear (Series1)
10
0
0 5 10 15 20 25 30
Correlacion 0,897913017
R^2 0,898
5
6
Galones de
Kilometros recorrido gasolina
# de datos 26 26
suma datos 4710 335,4
Promedio 181,1538462 12,9
variancia 11271,43787 71,44923077
Desviacion 106,1670282 8,452764682
Teniedo en cuenta los modelos de progresion de los dos prototipos podemos concluir que el
prototipo N-1 es el que mejor rendimiento tiene ya que su R^2 es mayor
EJERCICIO 6
1)
2)
Modelo de regresión lineal
18
16 R² = 0.0519
14
12 Series1
10
8
Línea de tendencia de
6 PROMEDIO DE
INGRESO MENSUAL
4
2
0
0 20 40 60 80
15 Series1
10
Línea de tendencia de
5 PROMEDIO DE INGRESO
MENSUAL
0
0 10 20 30 40 50 60 70
Modelo de regresión cuadrático
18
16
14
12
10
Series1
8
Expon. (Series1)
6
4
2
0
0 10 20 30 40 50 60 70
Podemos observar que el R^2 de el modelo cuadratico es =1 y pro consiguiente tiene un ajuste
perfecto
3)
14
12
10
Series1
8
Linear (Series1)
6
4
2
0
0 20 40 60 80
Correlacion 0,779616791
R^2 0,608
4)
Si existe una relacion entre las dos variables y esta relacion es que una de las variables depende
de los datos de la otra variable
5)
LONGITUD
(Pies) ALTURA (Pies)
1 15,03008402
2 15,07354391
3 15,1170038
6)