Sie sind auf Seite 1von 23

ANA CARO BARRERA

ID: 597071

ALEX CUDEMUS
ID:

PROBABILIDAD Y ESTADISTICA
NCR: 8731

TALLER - QUIZ

EJERCICIO 1
El Ministerio de Comercio, Industria y Turismo de Colombia realizó un estudio en diferentes ciudades
del país para determinar un modelo y analizar la posible relación que existe entre el número
de habitantes de una ciudad y el promedio de ingresos mensuales de los habitantes.
Los resultados obtenidos se muestran en la tabla.

ACTIVIDAD
1. Realice el diagrama de dispersión para las variables estudiadas.
2. Justifique el modelo de regresión a utilizar comparando los valores de R cuadrado en los diferentes
modelos (Exponencial, lineal, cuadrático º)
3. Determine el modelo de regresión lineal y la correlación de las variables del problema
4. Existe una relación entre las variables mencionadas, mencione que tipo de relación existe. Justifique.
5. Determine dos predicciones para la variable dependiente y dos para la variable independiente con e
l modelo de regresión determinado
6. Determine el promedio, varianza y desviación de cada una de las variables

SOLUCION
1)

Diagrama de dispersión para las variables


1400000
1200000
1000000
800000
Series1
600000
Linear (Series1)
400000
200000
0
0 20 40 60 80 100
2)

Modelo de regresión lineal


1400000
1200000
R² = 0.019
1000000 Series1
800000
600000
Línea de tendencia de
400000 PROMEDIO DE INGRESO
200000 MENSUAL
0
0 20 40 60 80 100

Modelo de regresión exponencial


1400000
1200000
1000000 Series1
800000
600000
Línea de tendencia de
400000 PROMEDIO DE INGRESO
200000 MENSUAL
0
0 20 40 60 80 100

Modelo cuadratico
1,400,000
1,200,000
1,000,000
800,000
600,000
400,000
y = -0.0145x2 + 104.71x + 755350
200,000 R² = 0.1107
0
0 1000 2000 3000 4000 5000 6000 7000 8000
Podemos observar que el R^2 del modelo cuadrático es el mayor y con esto se puede
evidenciar que es la que mejor explica los datos

3) Determine el modelo de regresión lineal y la correlación de las variables del problema

Diagrama de dispersión para las variables


1400000
y = 1111x + 754587
1200000

1000000

800000 y = 1111x + 754587 Series1

600000 Linear (Series1)


Linear (Series1)
400000

200000

0
0 20 40 60 80 100

Correlacion 0,206728181
R^2 43

4) Existe una relación entre las variables mencionadas, mencione que tipo de relación existe.
Justifique.

Si existe una relación entre las dos variables y esta relación es que una de las variables depende
de los datos de la otra variable

5) Determine dos predicciones para la variable dependiente y dos para la variable independiente
con el modelo de regresión determinado

# de Habitantes Promedio
580 811198,5084
999 820892,675
1200 825543,0986
6) Determine el promedio, varianza y desviación de cada una de las variables

NÚMERO DE HABITANTES (MILES PROMEDIO DE INGRESO


DE HABITANTES) MENSUAL
# de datos 80 80
suma datos 79297 65.657.000
Promedio 991,2125 820712,5
variancia 1663287,142 20833429844
Desviacion 1289,6849 144337,9016

Ejercicio 2

La Secretaría de movilidad de Bogotá realizo una investigación que quería determinar si había alguna
relación entre el número de años de experiencia conduciendo La Secretaría de movilidad de Bogotá
realizo una investigación que quería determinar si había alguna relación entre el número de años
de experiencia conduciendo localidad de Suba y los resultados obtenidos fueron los siguientes:

1) Realice el diagrama de dispersión para las variables estudiadas.

diagrama de dispersión para las variables


100
90
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25 30 35

2) Justifique el modelo de regresión a utilizar comparando los valores de R cuadrado en los


diferentes modelos (Exponencial, lineal, cuadrático
Modelo de regresión lineal
100

80
Series1
60

40 Línea de tendencia de
PROMEDIO DE INGRESO
20 MENSUAL
R² = 0.0351

0
0 20 40 60 80

Modelo de regresión exponencial


100
Series1
80

60
Línea de tendencia de
PROMEDIO DE INGRESO
40
MENSUAL
20 Poly. (Series1)

0
0 20 40 60 80
Modelo de regresión cuadrático
100
90
80
70
60
50 Series1
40 Expon. (Series1)
30
20
10
0
0 20 40 60 80

Podemos observar que el R^2 del modelo cuadrático es el mayor y con esto se puede evidenciar
que es la que mejor explica los datos

3) Determine el modelo de regresión lineal y la correlación de las variables del problema

Diagrama de dispersión para las variables


100
90
80
70
60
50 Series1
40 Linear (Series1)
30
20
y = 0.127x + 7.2744
10
0
0 20 40 60 80

Correlacion 0,698659572
R^2 0,49

4) Existe una relación entre las variables mencionadas, mencione que tipo de relación existe.
Justifique.
Si existe una relación entre las dos variables y esta relación es que una de las variables depende
de los datos de la otra variable

5. Determine dos predicciones para la variable dependiente y dos para la variable independiente
con el modelo de regresión determinado

DEFORMACION DE LA
Año ESTRUCTURA (CM)
1 5,709483599
0,5 4,943275008
1,5 6,475692189

5) Determine el promedio, varianza y desviación de cada una de las variables

PROMEDIO DE
NÚMERO DE HABITANTES INGRESO
(MILES DE HABITANTES) MENSUAL
# de datos 70 70
suma datos 358 841,00
Promedio 5,114285714 12,01428571
variancia 40,2155102 193,4712245
Desviacion 6,341570011 13,90939339

EJERCICIO 3
Un grupo de ingenieros civiles prueba diferentes tipos de hormigón para determinar nuevos compuestos
que puedan usar en sus construcciones. La compañía que suministra información sobre un tipo de hormigón
experimental para que los ingenieros
evidencien el rendimiento que tiene el mismo. Para eso se observan los centímetros
de deformación que tiene el homigon al pasar diferentes lapsos de tiempo.

1) Realice el diagrama de dispersión para las variables estudiadas.

Diagrama de dispersión para las variables


0.45
0.4
0.35
0.3
0.25
Series1
0.2
Linear (Series1)
0.15
0.1
0.05
0
0 20 40 60 80 100
2. Justifique el modelo de regresión a utilizar comparando los valores de R cuadrado en los
diferentes modelos (Exponencial, lineal, cuadratico)

Modelo de regresión lineal


0.45
0.4
0.35
0.3 Series1
0.25
0.2
Línea de tendencia de
0.15 PROMEDIO DE INGRESO
MENSUAL
0.1
R² = 0.0624
0.05
0
0 20 40 60 80 100

Modelo de regresión exponencial


0.45

0.4

0.35

0.3 Series1
0.25

0.2
Línea de tendencia de
0.15 PROMEDIO DE INGRESO
MENSUAL
0.1

0.05

0
0 20 40 60 80 100
Modelo de regresión cuadrático
0.45

0.4

0.35

0.3

0.25
Series1
0.2 Expon. (Series1)

0.15

0.1

0.05

0
0 20 40 60 80 100

Podemos observar que el R^2 de el modelo cuadratico es el mayor y con esto se puede evidenciar
que es la que mejor explica los datos

3. Determine el modelo de regresión lineal y la correlación de las variables del problema

Diagrama de dispersión para las variables


0.5

0.4

0.3
Series1
0.2
Linear (Series1)
0.1 y = -0.001x + 0.1601
0
0 20 40 60 80 100

Correlacion -0,276199767
R^2 0,08
4. Existe una relación entre las variables mencionadas, mencione que tipo de relación existe. Justifique

Si existe una relación entre las dos variables y esta relación es que una de las variables depende de los

datos de la otra variable

5. Determine dos predicciones para la variable dependiente y dos para la variable independiente con el
modelo de regresión determinado
DEFORMACION
DE LA
ESTRUCTURA
Año (CM)
1 0,163269992
0,5 0,179469559
1,5 0,147070424

6. Determine el promedio, varianza y desviación de cada una de las variables

DEFORMACION DE LA
AÑOS ESTRUCTURA (CM)
# de datos 80 80
suma datos 183,7 9,70
Promedio 2,29625 0,121272613
variancia 0,609360938 0,008384841
Desviacion 0,780615743 0,091568777

EJERCICIO 4

Un grupo de ingenieros experimantaban en el prototipo de una nueva maquina. Dicha experimentación


pretendía determinar los picos de rendimiento del prototipo y observar para que cantidades
voltaje se obtenian los mejores rendimientos en el funcionamiento de la maquina. Para ello contrastaban
la cantidad de voltaje y la temperatura que alcanzaba esta. Los ingenieros estiman que
entre mayor temperatura tenga la maquina mejor rendimiento tiene, por eso requieren de saber de un
modelo que les permita observar los voltajes que promueven el mejor rendimiento

1)
Diagrama de dispersión para las variables
45
40
35
30
25 Series1
20 Linear (Series1)
15 Linear (Series1)
10
5
0
0 10 20 30 40 50 60 70 80

2)

Modelo de regresión lineal


45

40

35

30
Series1
25 R² = 2E-05
20 Línea de tendencia de
15 PROMEDIO DE INGRESO
MENSUAL
10

0
0 20 40 60 80
Modelo de regresión exponencial
45

40

35

30
Series1
25

20
Línea de tendencia de
15 PROMEDIO DE INGRESO
MENSUAL
10

0
0 20 40 60 80

Modelo de regresión cuadrático


50
40
30
Series1
20
Expon. (Series1)
10
0
0 10 20 30 40 50 60 70 80

Podemos observar que el R^2 de el modelo cuadratico es el mayor y con esto se puede evidenciar que es la
que mejor explica los datos

3)
Diagrama de dispersión para las
variables
45
40
35
30
25 y = -0.002x + 24.665 Series1
20
Linear (Series1)
15
10
5
0
0 20 40 60 80

Correlacion -0,056229897
R^2 0,003

4)
Si existe una relacion entre las dos variables y esta relacion es que una de las variables depende
de los datos de la otra variable

5)

VOLTAJE Temperatura (Grados


(Amperios) centigrados)
1 25,76617314
2 25,60581914
3 25,44546514

6)

Temperatura
(Grados
VOLTAJE (Amperios) centigrados)
# de datos 72 72
suma datos 446,2 1.795,16
Promedio 6,197222222 24,93277778
variancia 10,10415895 82,17225062
Desviacion 3,178703973 9,064891098
EJERCICIO 5)

1)

Diagrama de dispersión para las variables


40.00

35.00

30.00

25.00

20.00 Series1
Linear (Series1)
15.00

10.00

5.00

0.00
0 5 10 15 20 25 30 35

2)

Modelo de regresión lineal


40.00

35.00

30.00

25.00 Series1

20.00
R² = 0.1637 Línea de tendencia de
15.00 PROMEDIO DE
INGRESO MENSUAL
10.00

5.00

0.00
0 10 20 30 40
Modelo de regresión exponencial
40.00

35.00

30.00

25.00 Series1

20.00
Línea de tendencia de
15.00 PROMEDIO DE INGRESO
MENSUAL
10.00

5.00

0.00
0 10 20 30 40

Modelo de regresión cuadrático


40.00

35.00

30.00

25.00

20.00 Series1
Expon. (Series1)
15.00

10.00

5.00

0.00
0 5 10 15 20 25 30 35

Podemos observar que el R^2 de el modelo cuadratico es el mayor y con esto se puede evidenciar
que es la que mejor explica los datos

3.
Diagrama de dispersión para las
variables
40.00

30.00

20.00 Series1
y = 0.4352x + 4.8717
Linear (Series1)
10.00

0.00
0 10 20 30 40

Correlacion 0,947193592
R^2 0,897

4)
Si existe una relacion entre las dos variables y esta relacion es que una de las variables depende
de los datos de la otra variable

5.

Kilometros
recorrido Galones de gasolina
120 8,034559417
220 15,68873899
450 33,293352

6.

Kilometros recorrido Galones de gasolina


# de datos 26 26
suma datos 4710 330,60
Promedio 181,1538462 12,71538462
variancia 11271,43787 73,60360947
Desviacion 106,1670282 8,579254599

Prototipo 2

PB Kilometros recorrido Galones de gasolina


1 100 7,9
2 83 6,2
3 250 13,5
4 70 5,9
5 210 12,1
6 360 30,4
7 170 9,5
8 95 6,9
9 82 7,1
10 230 12,8
11 114 9,6
12 310 28,1
13 52 3,9
14 69 5,5
15 280 14,5
16 160 10,1
17 230 13,4
18 95 7,8
19 122 8,9
20 345 28,4
21 109 8,7
22 312 23,7
23 200 10,2
24 450 34,9
25 115 7,9
26 97 7,5

1)

Diagrama de dispersión para las variables


40
35
30
25
20 Series1

15 Linear (Series1)

10
5
0
0 5 10 15 20 25 30
2)

Modelo de regresión lineal


40

35

30

25 Series1

20
R² = 0.1141 Línea de tendencia de
15 PROMEDIO DE INGRESO
MENSUAL

10

0
0 5 10 15 20 25 30

Modelo de regresión exponencial


40

30 Series1

20
Línea de tendencia de
10 PROMEDIO DE INGRESO
MENSUAL
0
0 5 10 15 20 25 30
Modelo de regresión cuadrática
40

35

30

25 Series1

20
Línea de tendencia de
15 PROMEDIO DE INGRESO
MENSUAL
10

0
0 5 10 15 20 25 30

Podemos observar que el R^2 de el modelo cuadratico es el mayor y con esto se puede evidenciar
que es la que mejor explica los datos

3)

Diagrama de dispersión para las


variables
40

30

20 Series1
y = 0.3679x + 6.6444
Linear (Series1)
10

0
0 5 10 15 20 25 30

Correlacion 0,897913017
R^2 0,898
5

Kilometros recorrido Galones de gasolina


120 8,286292813
220 15,83071966
450 33,18290141

6
Galones de
Kilometros recorrido gasolina
# de datos 26 26
suma datos 4710 335,4
Promedio 181,1538462 12,9
variancia 11271,43787 71,44923077
Desviacion 106,1670282 8,452764682

Teniedo en cuenta los modelos de progresion de los dos prototipos podemos concluir que el
prototipo N-1 es el que mejor rendimiento tiene ya que su R^2 es mayor

EJERCICIO 6
1)

Diagrama de dispersión para las


variables
18
16
14
12
10
Series1
8
Linear (Series1)
6
4
2
0
0 20 40 60 80

2)
Modelo de regresión lineal
18
16 R² = 0.0519

14
12 Series1
10
8
Línea de tendencia de
6 PROMEDIO DE
INGRESO MENSUAL
4
2
0
0 20 40 60 80

Modelo de regresión exponencial


20

15 Series1

10
Línea de tendencia de
5 PROMEDIO DE INGRESO
MENSUAL
0
0 10 20 30 40 50 60 70
Modelo de regresión cuadrático
18
16
14
12
10
Series1
8
Expon. (Series1)
6
4
2
0
0 10 20 30 40 50 60 70

Podemos observar que el R^2 de el modelo cuadratico es =1 y pro consiguiente tiene un ajuste
perfecto

3)

Diagrama de dispersión para las


variables
18
16 y = 0.0261x + 14.786

14
12
10
Series1
8
Linear (Series1)
6
4
2
0
0 20 40 60 80

Correlacion 0,779616791
R^2 0,608
4)
Si existe una relacion entre las dos variables y esta relacion es que una de las variables depende
de los datos de la otra variable
5)
LONGITUD
(Pies) ALTURA (Pies)
1 15,03008402
2 15,07354391
3 15,1170038

6)

LONGITUD (Pies) ALTURA (Pies)


# de datos 60 60
suma datos 1197,4 951,24
Promedio 19,95666667 15,85393867
variancia 1,845122222 0,005733767
Desviacion 1,358352761 0,07572164
7)

Das könnte Ihnen auch gefallen