Beruflich Dokumente
Kultur Dokumente
Por
RICARDO ANDRES MARTINEZ PEA
LINA MARA MARTNEZ MOLANO
JUAN CAMILO CELY
Presentado a
MARIA JOSE CHARFUELAN
Tutor
En base a un registro histrico de datos sobre la problemtica de las vctimas del conflicto se
actividad que apela a diversas tcnicas con el propsito de llegar a la esencia de la realidad.
La regresin lineal simple y la regresin lineal mltiple son tcnicas de anlisis de las
variables de una investigacin estadstica, en este caso desde la encuesta realizada. Si bien
es cierto estas tcnicas mencionadas se pueden utilizar para solucionar problemas comunes
mayor frecuencia en las ciencias econmicas, tambin es cierto que en muchos casos se
requiere conocer ms que el comportamiento de una sola variable para entender una
hace necesario que practiquemos estas tcnicas de regresin por medio de ejercicios salientes
los comportamientos que se dan en el plano cartesiano tanto en las variables, como los grados
y resultados que se manejan para los ejemplos que se plantean en el laboratorio propuesto,
herramienta de Excel.
JUSTIFICACIN
Partiendo de una base de datos sobre la problemtica de las vctimas del conflicto se presenta
las soluciones de las actividades planteadas dentro del periodo histrico comprendido entre
los aos 2006 a 2012. Para ello, en primer lugar aplicaremos el proceso de regresin lineal
simple para determinar tanto la naturaleza como la fuerza de una relacin entre dos variables
y segundo lugar la regresin lineal mltiple con la cual describiremos la relacin entre dos o
ms variables independientes y una variable dependiente utilizando la ecuacin de regresin
mltiple; estas ecuaciones de estimaciones nos permitir realizar una interpretacin de
correlacin de la investigacin realizada en estas instituciones educativas. El trabajo de
laboratorio constituye una de las mejores metodologas para la aplicacin de modelos
estadsticos a las variables de los hechos, es por eso que se trabaja en este sentido y no otro
para la prctica de la unidad 3 de regresin y determinacin
OBJETIVOS
Objetivos Generales
1. Potencializar en el estudiante habilidades y destrezas para caracterizar una situacin
mediante el anlisis de las medidas estadsticas bivariantes.
2. Calcular e interpretar adecuadamente las medidas estadsticas bivariantes, asociadas
a una situacin especfica.
3. Determinar la relacin entre dos o ms variables inscritas en una situacin especfica
a partir del anlisis de regresin lineal simple y mltiple.
Objetivos Especficos
1. Interpretar correctamente los datos de cada tabla propuestos en cada uno de los
ejercicios.
2. Realizar diagramas de dispersin en los ejercicios de laboratorio y actividades
colaborativas que permitan determinar el tipo de asociacin entre las variables
escogidas en cada ejercicio.
3. En los ejercicios propuestos de laboratorio y de regresin y correlacin lineal simple
crear modelos matemticos que permita predecir el efecto de una variable sobre la
otra para determinar su fiabilidad.
4. Determinar porcentajes que permitan una explicacin de modelo y grado de relacin
de dos variables de los ejercicios de laboratorio y de regresin y correlacin lineal
simple.
5. En la prctica de regresin y correlacin lineal mltiple identificar una variable
cuantitativa dependiente y varias variables independientes del estudio de
investigacin, diagramarlas y calcular la recta de regresin y el coeficiente de
correlacin para probar estadsticamente su relacin.
6. Relacionar o analizar la informacin obtenida en cada problema planteado en los
ejercicios de laboratorio y colaborativo.
ESTADISTICA DESCRIPTIVA 100105_97
LABORATORIO Y TRABAJO COLABORATIVO
PASO 4- DESCRIPCIN DE LA INFORMACIN: DETALLAR Y
RELACIONAR VARIABLES DE LA PROBLEMTICA UTILIZANDO
MEDIDAS BIVARIANTES.
LABORATORIO REGRESIN Y CORRELACIN LINEAL
Actividad individual
Aporte por: Ricardo Martnez CC 1052404207
Ejercicios
X (sal) Y (Tensin)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables
140
y = 4.3714x + 94.2
120 R = 0.9793
100
Tension
80
60 Y (Tensin)
Linear (Y (Tensin) )
40
20
0
0 2 4 6 8
Sal
Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre
la otra. Es confiable?
El modelo matemtico que permite predecir el efecto de una variable sobre la otra es:
y=4.371x + 94.2
R = 0.979
Se puede asegurar que la ecuacin de la recta es confiable porque el R est cercano a 1 y
tiene un grado alto de confiabilidad.
Para hallar el valor de la tensin arterial esperada para una dosis de sal de 6.5 debemos
reemplazar este valor en la formula hallada.
= (4.371*6.5)+94.2=122.61
Segn lo anterior para dicha dosis de sal la tensin arterial esperada es de 126.6
2. EN UN NUEVO PROCESO ARTESANAL DE FABRICACIN DE CIERTO
ARTCULO QUE EST IMPLANTADO, SE HA CONSIDERADO QUE ERA
IMPORTANTE IR ANOTANDO PERIDICAMENTE EL TIEMPO MEDIO
(MEDIDO EN MINUTOS) QUE SE UTILIZA PARA REALIZAR UNA PIEZA Y EL
NMERO DE DAS DESDE QUE EMPEZ DICHO PROCESO DE
FABRICACIN. CON ELLO, SE PRETENDE ANALIZAR COMO LOS
OPERARIOS VAN ADAPTNDOSE AL NUEVO PROCESO MEJORANDO
PAULATINAMENTE SU PROCESO DE PRODUCCIN.
X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20
Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre
la otra. Es confiable?
y = -0.356x + 42.56
R = 0.796
Se puede asegurar que la ecuacin de la recta tiene un grado de confianza mediana porque el
R est un poco alejado a 1, teniendo entonces un grado medio alto de confiabilidad.
Estatura (cm) 120 124 107 118 112 110 115 104 110 116
Peso (kg) 24 23 19 24 21 19 22 16 20 23
30
y = 0.386x - 22.751
25 R = 0.8329
20
Peso()kg)
15
Peso ( kg)
10 Linear (Peso ( kg))
0
100 105 110 115 120 125
Estatura(cm)
X (sal) Y (Tensin)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
Diagrama de dispersin
140
120
100
Tension
80
60
40
20
0
0 1 2 3 4 5 6 7
Sal
El modelo matemtico a utilizar es la regresin lineal simple ya que esta nos permite calcular
la tensin (Y) sabiendo el nivel sal consumido de la siguiente manera:
= + .
A= 88.12
B= 6.10
Ahora tomamos distintos valores de X para remplazar en la ecuacin y obtenemos los
siguientes resultados:
X= 1.6 valor tensin Y= 97.89
X= 3.3 valor tensin Y= 108.27
X=4.2 valor tensin Y= 113.77
X= 5.0 valor tensin Y= 118.65
Para saber si es confiable el mtodo hallamos un porcentaje de error teniendo en cuenta el
valor obtenido como terico y los valores suministrados como experimentales.
% = 100
Se obtienen los siguientes porcentajes de error:
X= 1.6 un porcentaje de error igual a 0.11%
X= 3.3 un porcentaje de error igual a 0.67%
X=4.2 un porcentaje de error igual a 0.68%
X= 5.0 un porcentaje de error igual a 1.14%
Ya que se obtiene un porcentaje de error muy bajo por mtodo matemtico se puede decir
que es confiable para predecir el efecto de una variable sobre otra.
c. Determine el grado de relacin de las dos variables.
Por medio de la regresin lineal obtuvimos r= 0.9934808689 por tal razn es una correlacin
excelente.
d. Si a un paciente se le administra una dosis de sal de 5,6. Cul es la tensin arterial
esperada?
Variable dependiente: Y
Variable independiente: X
Diagrama de dispersin.
50
45
40
35
30
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
El modelo matemtico a utilizar es la regresin potencial ya que esta nos permite calcular X
y Y.
=
A= 126.104
B= -0.4331
Ahora tomamos distintos valores de X para remplazar en la ecuacin y obtenemos los
siguientes resultados:
X= 12 Y= 42.98
X= 23 Y= 32.42
X= 35 Y= 27.03
X= 42 Y= 24.98
X= 53 Y= 22.58
X= 65 Y= 20.67
X= 70 Y= 20.02
Para saber si es confiable el mtodo hallamos un porcentaje de error teniendo en cuenta el
valor obtenido como terico y los valores suministrados como experimentales.
% = 100
X= 12 un porcentaje de error igual a 4.69%
X= 23 un porcentaje de error igual a 7.46%
X= 35 un porcentaje de error igual a 0.11%
X= 42 un porcentaje de error igual a 0.08%
X= 53 un porcentaje de error igual a 1.86%
X= 65 un porcentaje de error igual a 1.59%
X= 70 un porcentaje de error igual a 0.09%
Ya que solo es inconsistente en unos datos en el porcentaje de error por este mtodo
matemtico se puede decir que es confiable para predecir el efecto de una variable sobre otra.
c. Determine el grado de correlacin de las dos variables.
Por medio de la regresin potencial obtuvimos r= -0.990311 por tal razn es una correlacin
aceptable.
d. Que tiempo deber tardarse un empleado cuando lleven 90 das?
Variable dependiente: Y
Variable independiente: X
Diagrama de dispersin.
30
25
20
Peso (Kg)
15
10
0
100 105 110 115 120 125
Estatura (cm)
El modelo matemtico a utilizar es la regresin lineal simple ya que esta nos permite calcular
X y Y.
= + .
A= -22.75
B= 0.38
Ahora tomamos distintos valores de X para remplazar en la ecuacin y obtenemos los
siguientes resultados:
X= 120 Y= 23.57
X= 124 Y= 25.11
X= 107 Y= 18.55
X= 118 Y= 22.79
X= 112 Y= 20.48
X= 110 Y= 19.71
X= 115 Y= 21.64
X= 104 Y= 17.39
X= 110 Y= 19.71
X= 116 Y= 22.02
Para saber si es confiable el mtodo hallamos un porcentaje de error teniendo en cuenta el
valor obtenido como terico y los valores suministrados como experimentales.
% = 100
Se obtienen los siguientes porcentajes de error:
X= 120 un porcentaje de error igual a 1.82%
X= 124 un porcentaje de error igual a 8.4%
X= 107 un porcentaje de error igual a 2.42%
X= 118 un porcentaje de error igual a 5.30%
X= 112 un porcentaje de error igual a 2.53%
X= 110 un porcentaje de error igual a 3.60%
X= 115 un porcentaje de error igual a 1.66%
X= 104 un porcentaje de error igual a 7.99%
X= 110 un porcentaje de error igual a 3.60%
X= 116 un porcentaje de error igual a 4.45%
Debido a que el porcentaje de error no es tan alto se puede decir que es confiable para predecir
el efecto de una variable sobre otra.
c. Determine el grado de correlacin de las dos variables.
Por medio de la regresin lineal obtuvimos r= 0.91266241211 por tal razn es una correlacin
excelente.
d. Cul es el peso que debera tener un estudiante que mida 128 cm?
1. Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A una serie
de voluntarios que se les administra distintas dosis de sal en su dieta y se mide su
tensin arterial un tiempo despus.
X (Sal) Y (Tensin)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
100
80
60
40
20
0
0 1 2 3 4 5 6
Consumo de sal
El tipo de asociacin entre las variables es directo, ya que a medida que aumenta el
consumo de sal (X) tambin lo hace la tensin arterial (Y).
y = 6,1062x + 88,128
R = 0,987 coeficiente de determinacin
y = 6,1062x + 88,128
y = 6,1062(5,6) + 88,128
y = 34,19472+ 88,128
y = 122,32272
Variable Y (tiempo medio para realizar una pieza) dependiente de variable X (das
transcurridos desde que se aprendi el proceso de fabricacin).
40
30
20
10
0
0 10 20 30 40 50 60 70 80
DAS TRANSCURRIDOS
y = -0,3566x + 42,569
R = 0,7963 coeficiente de determinacin
y = -0,3566x + 42,569
y = -0,3566(90) + 42,569
y = -32,094 + 42,569
Estatura 120 124 107 118 112 110 115 104 110 116
(cm)
Peso 24 23 19 24 21 19 22 16 20 23
(kg)
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el
diagrama de dispersin y determine el tipo de asociacin entre las variables
Peso (kg)
30
25
20
Axis Title
15
10
0
100 105 110 115 120 125
Axis Title
y = 0,386x - 22,751
R = 0,8329. El modelo tiene una confiabilidad del 83,29%.
c. Determine el grado de correlacin de las dos variables.
d. Cul es el peso que debera tener un estudiante que mida 128 cm?
y = 0,386(128) - 22,751
y = 49,408 - 22,751
y = 26,657
El peso que debera tener un estudiante que mida 128cm ser de 26,657 kg.
TRABAJO COLABORATIVO
Aporte Ricardo Martnez CC 1052404207
R = 0.9943
35000
30000
25000
20000
15000
10000
5000
0
0 1000000000000 2000000000000 3000000000000
Gasto en defensa y seguridad en Colombia Per capita
Figura 4. Diagrama de distribucin entre las variables GASTO EN DEFENSA Y SEGURIDAD EN COLOMBIA PER CAPITA y
GASTO EN DEFENSA Y SEGURIDAD
El tipo de asociacin del diagrama de dispersin es LINEAL. Es una relacin lineal positiva
que indica que entre las variables existe una relacin directa es decir los valores menores de
GASTO EN DEFENSA Y SEGURIDAD COLOMBIA estn asociados a los valores
menores de GASTO EN DEFENSA SEGURIDAD COLOMBIA PERCPITA y viceversa.
y = 2E-08x + 3245,4
R = 0,9943
Se puede asegurar que la ecuacin de la recta es confiable porque el R est cercano
a 1 y tiene un grado alto de confiabilidad.
4. Determine el porcentaje de explicacin del modelo y el grado de relacin de las
dos variables. - Relacionar la informacin obtenida con el problema.
El R afirma adems que el modelo explica el 99.4% de la informacin y el valor de
r coeficiente de correlacin lineal es excelente porque el 0.994 est muy cercano al
extremo 1 positivo que es la correlacin perfecta positiva.
Mediante el anlisis del diagrama de dispersin se puede determinar que el gasto de
defensa total se encuentra directamente proporcional al mismo tipo de gasto per cpita
o por persona durante el periodo de tiempo comprendido entre 2006-2012 en la
problemtica de las vctimas del conflicto.
500000
Efectivos de fuerza publica disponibles
450000
400000
350000
en COlombia.
300000
250000 y = -3391.4x + 406877
200000 R = 0.1293
150000
100000
50000
0
0 2 4 6 8 10 12 14 16
Minas anti persona.
efectivos de
fuerza pblica
disponibles gasto en defensa y seguridad
Colombia Colombia per cpita
350488 21432
351129 21447
352171 21786
355681 22430
357113 22692
357213 23045
357606 25134
358033 26202
358363 27738
358414 28636
358458 28822
361013 28881
363119 22577
363589 23952
367869 24054
368141 24453
368374 25503
369661 25974
369719 26626
371549 28763
371654 30058
371766 30111
373732 30236
374032 30730
377984 32129
378771 32563
379339 33621
379430 33672
379674 33856
382802 33861
384498 34225
385640 34482
385904 34703
386634 34704
387000 35855
387226 36251
391414 34603
391986 35187
393097 35956
394267 36967
395717 37051
398293 37067
398351 37892
398665 38575
399493 38650
399502 40302
399516 40378
400562 41000
403632 33730
403925 34207
404898 34349
405837 34795
406771 35057
407217 35578
408833 37198
409567 38219
410815 38412
412550 39090
413073 39960
414072 40018
415242 35325
415455 35942
415997 36049
416181 36397
416664 36522
419366 37984
419523 38153
419621 38497
420432 39838
421819 40346
421864 40657
422600 40870
423810 35227
428796 36035
432890 36668
434453 38608
435939 39182
436745 39546
437154 40071
440608 40158
440647 40423
440997 40931
443239 41060
445565 41679
y = 0.1919x - 41955
40000 R = 0.7717
30000
percpita
20000
10000
0
0 50000 100000 150000 200000 250000 300000 350000 400000 450000 500000
efectivos de fuerza pblica disponibles Colombia
El tipo de asociacin entre las variables es Directo. Ya que a medida que una aumenta la
otra tambin lo hace.
- Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. Es confiable?
y = 0,1919x - 41955
R = 0,7717. El modelo tiene una confiabilidad del 77,17%. Aceptable.
- Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
variables.
R = 0,7717
R = 0,8784
El grado de correlacin entre las variables es aceptable ya que el valor de R est entre
0,80 y 0,90.
- Relacionar la informacin obtenida con el problema.
El gasto en defensa y seguridad en Colombia per cpita es un valor que cambia y se
relaciona con el nmero de efectivos de fuerza pblica disponibles, ya que para
mantener el nmero de efectivos que puedan garantizar la seguridad en el pas, se
utilizar parte del gasto per cpita en el sostenimiento de estos.
CONCLUSIONES
Se pudo evidenciar que para manejar cualquier tipo de variables se necesita realizar un
diagrama de dispersin y aplicar conceptos, frmulas de relacin y correlacin que
permita el despeje de las ecuaciones y datos para obtener un resultado.
Los ejemplos nos muestran que son acordes a un tipo de forma lineal y la correlacin es
confiable para los tipos de datos.