Sie sind auf Seite 1von 26

Cálculo de Varias Variables

MINIMIZACIÓN DEL ERROR


CUADRÁTICO

Grupo 9 – Paralelo 1

Andrea Holalla Yánez

Sergio Laprea Febré

Joselyne Menéndez Ventura

María José Peñarrieta Vera

Karen Silva Peñafiel

Profesora: Ingeniera Soraya Solís García

Guayaquil, 01 de octubre de 2019


ÍNDICE

Introducción ...................................................................................................................... 1

Problema ........................................................................................................................... 2

Marco teórico .................................................................................................................... 3

Método de los mínimos cuadrados ............................................................................... 3

Derivadas parciales ....................................................................................................... 3

Matriz jacobiana ........................................................................................................... 3

Derivadas de orden superior ......................................................................................... 4

Matriz Hessiana ............................................................................................................ 5

Teorema de extremos en funciones de dos variables ................................................... 6

Media aritmética ........................................................................................................... 6

Varianza ........................................................................................................................ 7

Solución ............................................................................................................................ 8

Planteamiento ............................................................................................................... 8

Resolución .................................................................................................................... 8

Ejemplo de aplicación .................................................................................................... 13

Conclusiones................................................................................................................... 19

Bibliografía ..................................................................................................................... 20

i
MINIMIZACIÓN DEL ERROR
CUADRÁTICO

INTRODUCCIÓN

La noción básica de la ingeniería es el planteamiento de problemas, donde el

estudiante debe buscar soluciones pragmáticas y como medio está el emplear modelos

matemáticos. Los cuales requieren un análisis previo de la situación, que como solución

general, plantean la aplicación de fórmulas matemáticas. En varios casos, estas se

presentan como resoluciones a problemas de optimización de varias variables.

Un problema común que se presenta en el modelo de varias variables es cuando

experimentalmente se obtiene indicios de un comportamiento aproximadamente

proporcional entre dos variables, es la búsqueda de una solución óptima que permita

evaluar la situación, y no simplemente presentar una totalidad de datos o una explicación

a medias; por lo que es necesario recurrir a una relación conocida, fácil de interpretar y

matemáticamente precisa como una recta que se ajuste de la mejor manera a los puntos

que los pares ordenados formados por los datos obtenidos generan en el plano ℝ2 .

1
PROBLEMA

Se dispone de una cantidad finita de puntos (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), … , (𝑥𝑛 , 𝑦𝑛 ). Se

requiere deducir un modelo óptimo que permita explicar de manera lineal los datos 𝑦𝑖 en

función de los 𝑥𝑖 ; es decir, obtener los parámetros 𝑚 y 𝑏 de la recta 𝑦 = 𝑚𝑥 + 𝑏 tal que

el error cuadrático (1) sea el menor posible.

𝑛
2
∑(𝑦𝑖 − (𝑚𝑥𝑖 + 𝑏)) (1)
𝑖=1

En este caso, se ha considerado como criterio de optimización la minimización

del cuadrado de la distancia ortogonal, paralela al eje y de los puntos a la recta.

2
MARCO TEÓRICO

MÉTODO DE LOS MÍNIMOS CUADRADOS

El método de los mínimos cuadrados es una aplicación de los extremos de las

funciones de dos variables, en el cual se requiere obtener un modelo de función lineal que

minimice la sumatoria de los errores cuadráticos, con respecto a los datos y a los valores

que genera la función 𝑓(𝑥) (Larson & Edwards, 2010, pág. 964).

Dicho método está dado por la ecuación:

𝑛
2
𝑆 = ∑(𝑦𝑖 − (𝑚𝑥𝑖 + 𝑏))
𝑖=1

Una función de varias variables tiene como dominio algún subconjunto del

espacio ℝ𝑛 y como rango, ℝ.

Las derivadas parciales de una función de varias variables resultan de la

derivación de cada función componente con respecto a cada una de las variables

involucradas. Todas estas derivadas se acomodan en la denominada Matriz derivada o

Jacobiana.

DERIVADAS PARCIALES

Las derivadas parciales de una función de varias variables resultan de la

derivación de cada función componente con respecto a cada una de las variables

involucradas. Todas estas derivadas se acomodan en la denominada Matriz Derivada o

Jacobiana. Solís (2017) plantea:

Sea una función 𝑓 de varias variables de ℝ𝑛 a ℝ, y sea un punto 𝑥𝑜

perteneciente al dominio abierto. Las derivadas parciales de una función de varias

3
variables se las pueden definir con respecto a la j-ésima variable en el punto

𝑥𝑜 como (pág. 32):

𝜕𝑓 𝑓(𝑥0 + 𝑡𝑒𝑗 )
(𝑥0 ) = lim
𝜕𝑥𝑗 𝑡→0 𝑡

Esta solución se da si y solo si hay la existencia del límite. También se las puede

considerar como derivación en una variable tomando a las restantes como constantes.

MATRIZ JACOBIANA

Sea una función 𝑓 de varias variables de ℝ𝑛 a ℝ𝑚 , y sea un punto 𝑥𝑜 perteneciente

al dominio abierto. Se define a la Matriz Jacobiana en dicho punto como la derivación de

cada función componente, con respecto a cada una de las variables involucradas, es decir,

se da de la formación de un arreglo matricial con las derivadas parciales (Solís García,

2017, pág. 33).

𝜕𝑓
( (𝑥 )) ; 1 ≤ 𝑖 ≤ 𝑚 ; 1 ≤ 𝑗 ≤ 𝑛
𝜕𝑥𝑗 0
𝑖𝑗

𝜕𝑓1 𝜕𝑓1

𝜕𝑥1 𝜕𝑥𝑛
𝐽𝑓 = ⋮ ⋱ ⋮
𝜕𝑓𝑚 𝜕𝑓𝑚

[ 𝜕𝑥1 𝜕𝑥𝑛 ]

Si y sólo si hay la existencia de cada componente.

DERIVADAS DE ORDEN SUPERIOR

Según Solís García (2017) “Para un campo escalar f en un dominio de ℝ𝑛 . Se

definen a las siguientes derivadas de orden superior 𝑘, con 𝑘 ≥ 2” (pág. 43)

𝜕𝑘𝑓 𝜕 𝜕𝑘−1 𝑓
Iteradas o Sucesivas con respecto a la variable: 𝜕𝑥𝑗𝑘 = 𝜕𝑥𝑗 (𝜕𝑥𝑗𝑘−1 )

4
𝜕𝑛 𝑓 𝜕 𝜕𝑛−1 𝑓
Mixtas o Cruzadas respecto a cada variable: 𝜕𝑥 = 𝜕𝑥 (𝜕𝑥 )
𝑛 …𝜕𝑥2 𝜕𝑥1 𝑛 𝑛−1 …𝜕𝑥2 𝜕𝑥1

MATRIZ HESSIANA

Sea 𝑓 una función de ℝ𝑛 a ℝ con un dominio abierto, se define matriz hessiana

como el arreglo matricial de las segundas derivadas parciales de una función escalar, tales

derivadas son iteradas con referencia a la misma variable, o cruzadas si se obtienen

derivando cada vez respecto a una variable distinta. La disposición en la matriz de las

derivadas es la siguiente:

𝜕 2𝑓 𝜕 2𝑓

𝜕𝑥1 2 𝜕𝑥1 𝜕𝑥𝑛
𝐻𝑓 = ⋮ ⋱ ⋮
2 2
𝜕 𝑓 𝜕 𝑓

[𝜕𝑥𝑛 𝜕𝑥1 𝜕𝑥𝑛 2 ]

En varios problemas matemáticos se usa la Matriz Hessiana para saber si los

valores obtenidos de las primeras derivadas son un máximo, mínimo o un punto de silla.

Los valores propios de una matriz son aquellos números que resuelven la ecuación

det(𝐴 − 𝜆𝐼) = 0, donde 𝐴 es una matriz cuadrada, 𝐼 es la matriz identidad de la misma

dimensión que 𝐴. En esta ecuación λ es la única variable, pero se observará que puede

tomar más de un valor ya que la ecuación es del mismo grado que la dimensión de 𝐴.

(Grossman & Flores, 2012)

5
TEOREMA DE EXTREMOS EN FUNCIONES DE DOS VARIABLES

De acuerdo a Villena (2010), una forma de establecer el tipo de punto crítico

estacionario de una función de dos variables que puede resultar menos engorrosa que el

criterio de los valores propios de la Matriz Hessiana, es la siguiente:

Sean:

 𝑓(𝑥, 𝑦) una función dos veces diferenciable en 𝑈 ⊆ ℝ2 .

 (𝑥0 , 𝑦0 ) ∈ 𝑈 un punto crítico estacionario de 𝑓.

 𝐻𝑓 , la matriz hessiana de la función 𝑓.

Entonces:

1. Si 𝑑𝑒𝑡(𝐻𝑓 ) > 0, 𝑓(𝑥0 , 𝑦0 ) es un extremo de la función 𝑓, en 𝑈:

𝜕2 𝑓
a. Si 𝜕𝑥 2 > 0, es un mínimo.

𝜕2 𝑓
b. Si 𝜕𝑥 2 < 0, es un máximo.

2. Si 𝑑𝑒𝑡(𝐻𝑓 ) < 0, entonces 𝑓(𝑥0 , 𝑦0 ) es un punto de silla de 𝑓 en 𝑈.

3. Si 𝑑𝑒𝑡(𝐻𝑓 ) = 0, este criterio no es conclusivo.

MEDIA ARITMÉTICA

Según los estadisticos Mendenhall & Beaver (2010) Definen a la media

aritmética o promedio de un conjunto de n mediciones como la suma de tales

mediciones dividida entre n, esto es:

𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1

6
VARIANZA

La varianza es una medida de dispersión de un conjunto de datos correspondiente

a la media aritmética de los residuos (diferencia de un valor y el valor medio) al cuadrado.

Si los datos proporcionados son muy variables, la varianza será relativamente grande.

(Mendenhall, Beaver, & Beaver, 2010)

La varianza se calcula de acuerdo con la siguiente expresión:

𝑛
2
1
𝜎𝑛 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑛
𝑖=1

Donde 𝑛 es la cantidad de datos, 𝜎𝑛 2 es la varianza de la muestra para esos 𝑛

valores; 𝑥̅ es la media aritmética de los mismos.

Por definición, la varianza toma siempre un valor positivo por tratarse de una

sumatoria de números elevados al cuadrado, con la única excepción de que todos los

valores sean iguales, con lo cual, al no haber variabilidad entre los datos, la varianza sería

igual a cero.

7
SOLUCIÓN

PLANTEAMIENTO

La función problema tiene dos variables correspondientes a los dos parámetros

que intervienen en una recta, teniendo en cuenta que los datos 𝑥𝑖 y 𝑦𝑖 son números reales.

𝑛
2
𝑆(𝑚, 𝑏) = ∑(𝑦𝑖 − (𝑚𝑥𝑖 + 𝑏)) (2)
𝑖=1

Lo que se quiere obtener es las expresiones para 𝑚 y 𝑏 a partir de tal información,

con la condición de que tanto 𝑚 como 𝑏 generen la recta de mejor ajuste, es decir, que

minimicen la sumatoria. De aquí se deduce que este es un problema de optimización de

dos variables, por lo que se procede a encontrar sus puntos críticos a través del cálculo de

las derivadas parciales.

RESOLUCIÓN

Se resuelve el cuadrado del binomio:

𝑆 = ∑(𝑦𝑖 2 − 2𝑦𝑖 (𝑚𝑥𝑖 + 𝑏) + 𝑚2 𝑥𝑖 2 + 2𝑚𝑥𝑖 𝑏 + 𝑏 2 ) (3)


𝑖=1

Luego, por propiedades de las sumatorias, las variables m y b pueden salir, porque,

para cada una de las sumatorias, se comportan como constantes.

𝑆=
𝑛 𝑛 𝑛 𝑛 𝑛
(4)
∑ 𝑦𝑖 2 − 2𝑚 ∑ 𝑥𝑖 𝑦𝑖 − 2𝑏 ∑ 𝑦𝑖 + 𝑚2 ∑ 𝑥𝑖 2 + 2𝑚𝑏 ∑ 𝑥𝑖 + 𝑛𝑏 2
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1

Se deriva cada término de (4) con respecto a m.

8
𝑛 𝑛 𝑛
𝜕𝑆
= −2 ∑ 𝑥𝑖 𝑦𝑖 + 2𝑚 ∑ 𝑥𝑖 2 + 2𝑏 ∑ 𝑥𝑖 (5)
𝜕𝑚
𝑖=1 𝑖=1 𝑖=1

Y luego, con respecto a b:

𝑛 𝑛
𝜕𝑆
= −2 ∑ 𝑦𝑖 + 2𝑚 ∑ 𝑥𝑖 + 2𝑏𝑛 (6)
𝜕𝑏
𝑖=1 𝑖=1

Como ambas derivadas existen, se puede construir la Matriz Jacobiana de la función S.

𝐽𝑆 =
𝑛 𝑛 𝑛 𝑛 𝑛
(7)
[−2 ∑ 𝑦𝑖 𝑥𝑖 + 2𝑚 ∑ 𝑥𝑖 2 + 2 ∑ 𝑥𝑖 𝑏 −2 ∑ 𝑦𝑖 + 2𝑚 ∑ 𝑥𝑖 + 2𝑏𝑛]
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1

Los puntos críticos de la función son aquellos en los cuales todas sus derivadas se

anulan, esto es equivalente a lo expresado en el sistema de ecuaciones:

𝑛 𝑛 𝑛
2
−2 ∑ 𝑦𝑖 𝑥𝑖 + 2𝑚 ∑ 𝑥𝑖 + 2 ∑ 𝑥𝑖 𝑏 = 0
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 (8)
−2 ∑ 𝑦𝑖 + 2𝑚 ∑ 𝑥𝑖 + 2𝑏𝑛 = 0
{ 𝑖=1 𝑖=1

El sistema se resuelve despejando b en ambas igualdades como se muestra en (9),

para luego igualar tales expresiones (10).

∑𝑛𝑖=1 𝑦𝑖 𝑥𝑖 − 𝑚 ∑𝑛𝑖=1 𝑥𝑖 2
𝑏=
∑𝑛𝑖=1 𝑥𝑖
(9)
∑𝑛𝑖=1 𝑦𝑖 − 𝑚 ∑𝑛𝑖=1 𝑥𝑖
𝑏=
{ 𝑛

∑𝑛𝑖=1 𝑦𝑖 𝑥𝑖 − 𝑚 ∑𝑛𝑖=1 𝑥𝑖 2 ∑𝑛𝑖=1 𝑦𝑖 − 𝑚 ∑𝑛𝑖=1 𝑥𝑖


= (10)
∑𝑛𝑖=1 𝑥𝑖 𝑛

9
A partir de aquí, se puede obtener la fórmula para m.

∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 𝑚 ∑𝑛𝑖=1 𝑥𝑖 2 ∑𝑛𝑖=1 𝑦𝑖 𝑚 ∑𝑛𝑖=1 𝑥𝑖


− = − (11)
∑𝑛𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑥𝑖 𝑛 𝑛

𝑚 ∑𝑛𝑖=1 𝑥𝑖 𝑚 ∑𝑛𝑖=1 𝑥𝑖 2 ∑𝑛𝑖=1 𝑦𝑖 ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖


− = − 𝑛 (12)
𝑛 ∑𝑛𝑖=1 𝑥𝑖 𝑛 ∑𝑖=1 𝑥𝑖

(∑𝑛𝑖=1 𝑥𝑖 )2 − 𝑛 ∑𝑛𝑖=1 𝑥𝑖 2 ∑𝑛𝑖=1 𝑦𝑖 ∑𝑛𝑖=1 𝑥𝑖 − 𝑛 ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖


𝑚( ) = (13)
𝑛 ∑𝑛𝑖=1 𝑥𝑖 𝑛 ∑𝑛𝑖=1 𝑥𝑖

∑𝑛𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑦𝑖 − 𝑛 ∑𝑛𝑖=1 𝑦𝑖 𝑥𝑖


𝑚= (14)
(∑𝑛𝑖=1 𝑥𝑖 )2 − 𝑛 ∑𝑛𝑖=1 𝑥𝑖 2

Existe un único punto crítico: aquel donde los valores de b y m corresponden a los

valores de las expresiones (9) y (14), respectivamente. Resulta imperioso, ahora,

determinar si este punto es el mínimo o máximo de la función, para aquello se calculará

las segundas derivadas, volviendo a derivar, para cada variable, las expresiones (5) y (6).

𝑛
𝜕 2𝑆
= 2 ∑ 𝑥𝑖 2 (15)
𝜕𝑚2
𝑖=1
𝑛
2
𝜕 𝑆
= 2 ∑ 𝑥𝑖 (16)
𝜕𝑏𝜕𝑚
𝑖=1
𝜕 2𝑆
= 2𝑛 (17)
𝜕𝑏 2 𝑛
𝜕 2𝑆
= 2 ∑ 𝑥𝑖 (18)
𝜕𝑚𝜕𝑏
𝑖=1

Con esta información se puede construir la Matriz Hessiana que permitirá conocer,

a través de sus valores propios, la naturaleza del punto crítico.

10
𝑛 𝑛
2 2
𝜕 𝑆 𝜕 𝑆 2 ∑ 𝑥𝑖 2
2 ∑ 𝑥𝑖
2
𝐻𝑆 = 𝜕𝑚2
𝜕𝑚𝜕𝑏 = 𝑖=1
𝑛
𝑖=1
(19)
𝜕 𝑆 𝜕 2𝑆
[𝜕𝑏𝜕𝑚 𝜕𝑏 2 ] 2 ∑ 𝑥𝑖 2𝑛
[ 𝑖=1 ]

El criterio que se utilizará para determinar el tipo de punto crítico estacionario

obtenido es el observado en el teorema de extremos de funciones de dos variables, para

lo cual, primero se analiza el valor de la determinante de la Matriz Hessiana establecida

en (19).

𝑛 𝑛

2 ∑ 𝑥𝑖 2 2 ∑ 𝑥𝑖 𝑛 𝑛 2
𝑖=1 𝑖=1
det 𝑛 = 4𝑛 ∑ 𝑥𝑖 2 − 4 (∑ 𝑥𝑖 ) (20)
𝑖=1 𝑖=1
2 ∑ 𝑥𝑖 2𝑛
( 𝑖=1 )
Como n es un valor diferente a cero, se puede dividir la expresión para 4𝑛2 .

𝑛 𝑛
1 2
(∑𝑛𝑖=1 𝑥𝑖 )2 1
= (∑ 𝑥𝑖 − 2
) = (∑ 𝑥𝑖 2 − 𝑥̅ 2 ) (21)
𝑛 𝑛 𝑛
𝑖=1 𝑖=1

La expresión final de (21) corresponde a la definición de varianza, la cual, toma

siempre valores positivos, excepto en el caso de menos interés en el que todos sean

iguales. Como 1/n también es positivo, el producto de ambos números será mayor a cero,

por lo que, de acuerdo al teorema, se ha obtenido un extremo.

Lo siguiente es comprobar que:

𝑛
𝜕 2𝑆
= 2 ∑ 𝑥𝑖 2 > 0 (22)
𝜕𝑚2
𝑖=1

11
La desigualdad (22) es verdadera debido a que la sumatoria en cuestión es de

cuadrados, por lo que su resultado será siempre mayor (o igual) a cero. De esta manera

se comprueba que el punto crítico se trata del mínimo absoluto de la función S, razón por

la cual, las fórmulas que determinan los parámetros de la recta buscada son los hallados

anteriormente.

12
EJEMPLO DE APLICACIÓN

El método de mínimos cuadrados es aplicado en diferentes ramas de estudio,

específicamente para informes o proyectos que conlleven información estadística, en los

cuales se debe presentar la cantidad suficientes de datos para poder llevar a cabo la

utilización de este proceso.

La

Edad (𝒙𝒊 ) Tensión (𝒚𝒊 )


21 120
21 138
25 125
29 130
33 140
36 124
39 144
41 158
45 135
48 157
50 144
53 158
56 150
59 140
59 170
62 172
64 162
66 176
68 172
69 175

Tabla 1 contiene 20 datos aleatorios obtenidos en el estudio denominado

“Estadísticas en Ciencias de la Salud” (Valdearcos, 2012) el cual está basado en una

encuesta realizada a un total de 69 personas a las cuales se les midió la tensión sistólica y

13
se les pregunto la edad, con la finalidad de establecer una relación entre estas dos

variables. Esta muestra comprende un total de 20 datos; es decir que para este ejercicio

𝑛 = 20.

Edad (𝒙𝒊 ) Tensión (𝒚𝒊 )


21 120
21 138
25 125
29 130
33 140
36 124
39 144
41 158
45 135
48 157
50 144
53 158
56 150
59 140
59 170
62 172
64 162
66 176
68 172
69 175

Tabla 1 Resultados de las mediciones de tensión arterial

La Gráfica 1 es un diagrama de dispersión que representa las coordenadas

presentadas en la

Edad (𝒙𝒊 ) Tensión (𝒚𝒊 )


21 120
21 138

14
25 125
29 130
33 140
36 124
39 144
41 158
45 135
48 157
50 144
53 158
56 150
59 140
59 170
62 172
64 162
66 176
68 172
69 175

Tabla 1, determinando como variable dependiente a la tensión sistólica y variable

independiente a la edad de las personas.

15
Gráfica 1 Diagrama de dispersión de los datos de edad vs tensión arteriral sistólica

Y
200

180

160

140
Tension sístolica

120

100

80

60

40

20

0
0 10 20 30 40 50 60 70 80 X
Edad

Tension

A continuación, se procede a realizar los cálculos pertinentes para hallar los parámetros

m y b que designan la pendiente y el intercepto respectivamente, aplicando el método de

los mínimos cuadrados demostrado anteriormente determinando el menor error

cuadrático posible, para ello primero se calcula los valores de 𝑥𝑦; 𝑥 2 para cada punto 𝑖.

𝒊 Edad (𝒙𝒊 ) Tensión (𝒚𝒊 ) 𝒙 𝒊 𝒚𝒊 𝒙𝒊 𝟐


1 21 120 2520 441
2 21 138 2898 441
3 25 125 3125 625
4 29 130 3770 841
5 33 140 4620 1089
6 36 124 4464 1296
7 39 144 5616 1521

16
8 41 158 6478 1681
9 45 135 6075 2025
10 48 157 7536 2304
11 50 144 7200 2500
12 53 158 8374 2809
13 56 150 8400 3136
14 59 140 8260 3481
15 59 170 10030 3481
16 62 172 10664 3844
17 64 162 10368 4096
18 66 176 11616 4356
19 68 172 11696 4624
20 69 175 12075 4761
Σ 944 2990 145785 49352

Tabla 2 Asignación de variables y cálculos previos de xy, x2 y sumatorias

Aplicando las formulas halladas mediante la demostración se hace uso de los datos

totales de la

𝒊 Edad (𝒙𝒊 ) Tensión (𝒚𝒊 ) 𝒙 𝒊 𝒚𝒊 𝒙𝒊 𝟐


1 21 120 2520 441
2 21 138 2898 441
3 25 125 3125 625
4 29 130 3770 841
5 33 140 4620 1089
6 36 124 4464 1296
7 39 144 5616 1521
8 41 158 6478 1681
9 45 135 6075 2025
10 48 157 7536 2304
11 50 144 7200 2500
12 53 158 8374 2809
13 56 150 8400 3136
14 59 140 8260 3481

17
15 59 170 10030 3481
16 62 172 10664 3844
17 64 162 10368 4096
18 66 176 11616 4356
19 68 172 11696 4624
20 69 175 12075 4761
Σ 944 2990 145785 49352

Tabla 2 para determinar los valores m y b pertenecientes a la recta que se busca.

∑𝑛𝑖=1 𝑦𝑖 ∑𝑛𝑖=1 𝑥𝑖 − 𝑛 ∑𝑛𝑖=1 𝑦𝑖 𝑥𝑖


𝑚=
(∑𝑛𝑖=1 𝑥𝑖 )2 − 𝑛 ∑𝑛𝑖=1 𝑥𝑖 2

(2990)(944) − 20(145785)
𝑚=
(944)2 − 20(49352)

𝑚 = 0.971179512846

Una vez obtenido m, se puede calcular b.

∑𝑛𝑖=1 𝑦𝑖 − 𝑚 ∑𝑛𝑖=1 𝑥𝑖
𝑏=
𝑛

2990 − 0.971179512846(944)
𝑏=
20

𝑏 = 103.660326994

Con estos parámetros, se puede expresar la recta solución:

𝑦 = 0.971179512846𝑥 + 103.660326994

Una vez hallados m y b se procede a formar la ecuación de la recta, la cual es

posible graficar y observar su relación con los puntos determinados originalmente en el

plano.

18
Y
200

180

160

140
Tension sístolica

120

100

80

60

40

20

0
0 10 20 30 40 50 60 70 80 90 X
Edad

Gráfica 2 Recta solución sobrepuesta a los puntos de los datos del problema
Haciendo un ejercicio, para comprobar que el modelo sirva para determinar

nuevos resultados, si una persona tiene 30 años.

𝑦 = 103.660326994 + 0.971179512846(30)

𝑦 = 132.79

Siendo el valor de su tensión arterial sistólica, un número que probablemente se

encuentre alrededor de 132.79

19
Para expresar la cercanía de los datos reales en general con la recta de mejor ajuste

se suele utilizar el valor de R2, que corresponde a una proporción de "explicado" varianza

de la varianza "total" de la variable dependiente y.

20
CONCLUSIONES

El método de regresión lineal por mínimos cuadrados es una manera precisa de

interpretar el comportamiento de un conjunto de datos dados como pares ordenados,

puesto que lo que se obtiene es una recta que pasa lo más cerca posible de tales puntos,

es decir, mantiene la mínima distancia.

Con la ecuación de la recta solución obtenida, es posible predecir, con cierto nivel

de fiabilidad resultados de una variable con respecto a la otra. En el ejemplo visto, se

podría predecir el valor aproximado de la tensión arterial de una persona con solo tomar

su edad como referencia.

21
BIBLIOGRAFÍA

Grossman, S., & Flores, J. (2012). Álgebra lineal (Séptima ed.). México: McGraw-Hill.

Larson, R., & Edwards, B. (2010). Cálculo. McGraw Hill.

Mendenhall, W., Beaver, R., & Beaver, B. (2010). Introducción a la probabilidad y

estadística (Decimotercera ed.). México: Cengage Learning.

Solís García, S. (2017). Apuntes de Clases de Cálculo de Varias Variables. Guayaquil:

Escuela Superior Politécnica del Litoral.

Valdearcos, S. (2012). Análisis de variables cuantitativas: Regresión lineal simple. En

Estadística en ciencias de la salud.

Villena, M. (2010). Cálculo de varias variables. Guayaquil.

22