Metodo de Minimos Cuadrados

UNIVERSIDAD PRIVADA
DE TACNA
FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE INGENIERÍA CIVIL
TRABAJO ENCARGADO
1. REGRESIÓN LINEAL SIMPLE – MÉTODO DE
MÍNIMOS CUADRADOS.
2. ANÁLISIS DE FRECUENCIAS DE PRECIPITACIONES,
UTILIZANDO LA ECUACIÓN DE WEIBULL. (CUADRO
Y GRAFICO)
CURSO: ABASTECIMIENTO DE AGUA Y ALCANTARILLADO
DOCENTE: Ing. FERMIN GARNICA TELLO
ESTUDIANTES:
 Apaza Vizcarra, Jaqueline Magaly
 Huayta Huaman, Daymer Roussel
 Tumbalobos Pillman, Yon Evert
 Zabalaga Cari, Jean Eddú
TACNA – PERU
2018
UNIVERSIDAD PRIVADA DE TACNA
RECURSOS HÍDRICOS
FACULTAD DE INGENIERIA
2018-I
ESCUELA PROFESIONAL DE INGENIERIA
CIVIL
INTRODUCCIÓN
En el presente trabajo de investigación se presenta de modo que se estudie y predigan

variables meteorológicas mediante el método de regresión lineal simple, el cual nos ayuda
a tener relaciones entre dos variables, la varíale dependiente y la variable independiente.
Ya que es esencial conocer el efecto que una o varias variables pueden causar sobre
otra, e incluso predecir en mayor o menor grado valores en una variable a partir de
otra
RECURSOS HÍDRICOS
2018-I
CIVIL
MARCO TEORICO
REGRESIÓ LINEAL
El análisis de regresión, es una técnica estadística para modelar e investigar la

relación entre dos o más variables. Puede usarse un análisis de regresión, para
construir un modelo que sea óptimo y permita hacer predicciones.
El científico inglés Sir Francis Galton (1822-1911), fue quien desarrolló el análisis de
regresión, sus primeros experimentos con regresión comenzaron con un intento de
analizar los patrones de crecimiento hereditarios de los guisantes. Animado por los
resultados Sir Francis Galton extendió para incluir los patrones hereditarios de la
estatura de las personas adultas. Descubrió que los niños que tienen padres altos o
bajos tendían a regresar a la estatura promedio de la población adulta.
En la regresión lineal simple se establece que Y es una función de solo una variable
independiente, con frecuencia se denomina regresión bivariada porque solo hay dos
variables una dependiente y una independiente.
Y   0  1 x   , es conocido como modelo de regresión lineal simple,

porque solo tiene una variable independiente, regresor o predictor x, y una variable
dependiente o variable respuesta Y.
Las estimaciones de  0 y 1 deberán dar como resultado una recta que es “el
mejor ajuste para los datos. El científico alemán Karl Gauss propuso estimar los
parámetros  0 y 1 a fin de minimizar la suma de los cuadrados de las desviaciones

verticales, utilizando el método de mínimos cuadrados.
RECURSOS HÍDRICOS
2018-I
CIVIL
DETERMINACIÓN DEL MODELO DE REGRESIÓN LINEAL SIMPLE
Dadas n observaciones de la muestra, se pueden expresar como:
 
Yi =  0   1 x i   i , i  1,2,3...n
Por lo tanto si tenemos que la ecuación
 
Yi =  0   1 xi predice el i-ésimo valor de y (Cuando x=xi), la desviación del valor
 
observado de Y a partir de la recta Y , conocido también como error es (yi - y i), la suma
de los cuadrados de las desviaciones que deben minimizar es la siguiente:

n
2
SCE= i
i 1

n

 ( y i  yi ) 2
i 1

n  
 ( yi  (  0  1 xi )) 2
i 1
 
donde SCE también es llamado la suma de los cuadrados de los errores. Por tanto,  0 y 1
son los valores que minimizan SCE, así, se debe resolver el problema de programación no
lineal sin restricciones.
Para resolver esto se deriva parcialmente y luego se iguala a cero.
 n  
2

SCE

 i 1
 
y 
 
 i   0   1 xi  





 
 0 
0
SCE

n

 2 { y i  (  0   1 xi )}
 0 i 1
RECURSOS HÍDRICOS
2018-I
CIVIL
 

SCE  n 
2y 
n

  2  n  0  1 xi 
 0  
i
 i 1 i 1

 
Igualando a cero obtenemos el siguiente resultado.
 (x
n
i  x) ( y i  y )
i 1
1 
 (x
n
i  x) 2
i 1
Realizamos el mismo procedimiento para encontrar el valor de 1
SCE  

n
 
 2  y i    0   1 xi  xi
 0 i 1   
 

SCE  n 
x y x   
n n

  2  0 xi2 
 0  
i i i 1
 i 1 i 1 i 1

 
Igualando a cero esta ecuación obtenemos el siguiente resultado de 0.
 0  y  1 x
RECURSOS HÍDRICOS
2018-I
CIVIL
2.1 MÉTODO DE MÍNIMOS CUADRADOS
El diagrama de dispersión o nube de puntos nos permitía visualizar la relación entre dos
variables X e Y. Al representar el diagrama de dispersión podemos encontrar las siguientes
situaciones:
 Distribuciones estadísticas para las que la nube de puntos se dispone de tal forma que
existe una función matemática cuyos puntos son una parte de su representación gráfica.
 Sin coincidir exactamente sus puntos con las de una gráfica de una función matemática,
se aproximan a ella con mayor o menor intensidad.
 La nube de puntos presenta un aspecto tal que no existe concentración de puntos hacia
ninguna gráfica matemática, distribuyéndose de una forma uniforme en una región del
plano.
En el primer caso se dice que existe una dependencia funcional o exacta entre las variables
X e Y, es decir existe una función matemática tal que Y = f(X). En el segundo caso se dice
que existe una dependencia estadística o aproximada entre las dos variables, Y aprox f(X).
Y en el último caso diríamos que las variables son independientes.
Es el segundo caso del que se ocupa la teoría de la regresión.
Las técnicas de regresión tienen por objeto modelizar, es decir, encontrar una función que
aproxime lo máximo posible la relación de dependencia estadística entre variables y predecir
los valores de una de ellas: Y (Variable dependiente o explicada) a partir de los de la otra (o
las otras): X (variables(s) independiente(s) ó explicativa(s)).
Llamaremos regresión de Y sobre X a la función que explica la variable Y (dependiente) para

cada valor de la X (independiente).
Y  f(X)
Llamaremos regresión de X sobre Y a la función que explica la variable X (dependiente) para

cada valor de la Y (independiente).
X  f(y)
La regresión es lineal cuando el modelo función de regresión seleccionado es una recta. En

cualquier otro caso se dice regresión no lineal. La regresión será simple cuando sólo
RECURSOS HÍDRICOS
2018-I
CIVIL
tengamos una variable independiente. Cuando tengamos dos o más variables

independientes, la regresión será múltiple (no se verá).
El procedimiento será:
 Elegir un tipo de función o curva que creamos que mejor relaciona las dos variables;
esto lo podemos hacer observando la nube de puntos.
 Obtener la ecuación de la curva, de entre las infinitas de dicho tipo que hay en el
plano, que mejor se adapte al conjunto de puntos. El objetivo de obtener esa ecuación
será predecir el valor de la variable Y dado un valor x0 de la variable X.
 Obtener una medida del grado de esta asociación o correlación. Esto me dará la
fiabilidad de las predicciones que haga con esta ecuación.
2.1.1 MÉTODO DE MÍNIMOS CUADRADOS
Dados los puntos (x1,y1), (x2,y2),...,(xn,yn), supongamos que hemos elegido una
función y=f(x|a1,...,ar) que queremos ajustar a ese conjunto de puntos y en la que
intervienen r parámetros (a1,...,ar). Consideramos la nube de puntos correspondiente:
Para cada valor de X, (xi ) tenemos dos valores de Y:
 El valor observado en la muestra (o en la nube de puntos ) yi.

 Otro que denominamos teórico, yi*, que se obtendría al sustituir x=xi en la función.
Como se puede observar, para cada xi tenemos una diferencia entre los dos valores de
Y, que llamaremos residuo: ei = yi - yi*.
El método de los mínimos cuadrados consiste en determinar los parámetros (a1,...,ar) de

tal forma que los residuos sean mínimos. Es decir, buscaremos minimizar la expresión:
RECURSOS HÍDRICOS
2018-I
CIVIL
 y   y  f x i a1,...,a r 
n n n
 e
i1
2
i 
i1
i  y * 2
i 
i1
i
Es decir, minimizamos la suma de las distancias verticales de los puntos a la curva.
La condición necesaria para obtener el mínimo es que las primeras derivadas

parciales respecto a cada uno de los parámetros se anulen, es decir,
 
 0
a 1

 
 0
a 2

. 
. 

. 
 
 0
a r 
resolviendo este sistema, denominado sistema de ecuaciones normales, quedan

determinados (a1,...,ar), así como la correspondiente función.
2.1.2 MODELO DE REGRESIÓN LINEAL SIMPLE.
 RECTA DE REGRESIÓN En el modelo de regresión lineal simple la función

elegida para aproximar la relación entre las variables es una recta, es decir
y=a+bx, donde a,b son los parámetros.
A esta recta la llamaremos RECTA DE REGRESIÓN DE Y SOBRE X.
Vamos a deducir su ecuación usando el método de los mínimos cuadrados.

Dado un valor de X, xi, tenemos los dos valores de Y, el observado, yi , y el
teórico, yi* = a + bxi. Así pues, hemos de minimizar:
 y  a  bx 
n n
 y  a  bxi 
2
 i i
2
 i
i 1 i 1
- Que derivando respecto a a y a b e igualando a cero:

RECURSOS HÍDRICOS
2018-I
CIVIL
 
  2  y i  a  bx i   0 
a i 


  2  y i  a  bx i x i  0
b i 
- Que nos dará un sistema de dos ecuaciones normales y dos incógnitas

(a,b). Resolviendo el sistema:
yi
i   a  b x
i

 i
i
2
i xi y i  ai xi  bi xi 

na    y i  b x i  a  y  bx
i i
x y i i   y  bx x i  b x i2
i i i
y i
x y
i
i i  i
n
x i
i  bxnx  b x i2
i
 
x y
i
i i  ynx  b  x i2  nx 2 
 i 
S xy
S xy  bS 2x  b
S 2x
Y obtenemos que la recta de regresión de Y sobre X es y = a + bx con los valores

a y b anteriormente calculados, o bien la siguiente expresión:
S xy
y y   x  x
S 2x
Que sería la misma recta pero expresada en punto pendiente. A la pendiente b de la

recta de regresión de Y sobre X se le denomina coeficiente de regresión de Y sobre
X.
 RECTA DE REGRESIÓN DE X SOBRE Y Aplicando el mismo razonamiento

llegaríamos a la expresión de la recta de regresión de X sobre Y x = a’ + b’y con
RECURSOS HÍDRICOS
2018-I
CIVIL
S xy
b'  y a'  x  b ' y
S 2y
o bien:
S xy
x x  y  y
S 2y
Igualmente a la pendiente b’ de la recta de regresión de X sobre Y se le denomina

coeficiente de regresión de X sobre Y.
NOTA: Hay que tener en cuenta que la recta de regresión de X sobre Y no se obtiene
despejando X de la recta de regresión de Y sobre X.
2.1.3 MEDIDAS DE BONDAD DE AJUSTE: CORRELACIÓN
 VARIANZA RESIDUAL
Para cada valor xi de X, obteníamos una diferencia (el residuo) entre el valor
observado de Y en la nube de puntos y el correspondiente valor teórico obtenido
en la función. Si todos los puntos de la nube están en la función, la dependencia
será funcional; el grado de dependencia será el máximo posible. Cuanto más se
alejen los puntos observados de la función (mayores sean los residuos) iremos
perdiendo intensidad en la dependencia.
Se define la VARIANZA RESIDUAL como la media de todos los residuos elevados

al cuadrado:
 y   y  a  bx i 
2 2
i  y i* i
S 2e  i
 i
n n
 Si la varianza residual es grande los residuos serán grandes y la dependencia

será pequeña, el ajuste será malo.
 Si la varianza residual es pequeña (cerca de cero), la dependencia será grande,
el ajuste será bueno.
Es fácil demostrar que la media de los residuos en la regresión lineal de Y sobre X

es cero, es decir, e = 0. Por tanto la varianza residual recibe este nombre por ser la
varianza de los residuos.
RECURSOS HÍDRICOS
2018-I
CIVIL
 VARIANZA DEBIDA A LA REGRESIÓN Nos sirve para ver en qué medida mejora
la descripción de una variable a través de la otra. Llamaremos VARIANZA
DEBIDA A LA REGRESIÓN a la varianza de los valores teóricos, es decir de los
yi*. Se demuestra que y* = y , y así pues la varianza debida a la regresión será:
 y 
2
*
i  y
S 2y *  i
Se demuestra que Sy2 = Se2 + Sy*2
Es decir, la varianza total de la variable Y es la suma de dos varianzas: la varianza

de Y*, que representaría la parte de la dispersión o variabilidad de la variable Y
explicada por la regresión, o sea, por la relación lineal con la variable X y la varianza
residual que representaría la parte de la variabilidad no explicada por la regresión.
Así pues, cuando aumenta la varianza debida a la regresión, disminuye la varianza

residual y el ajuste es bueno y al contrario.
2.1.4 COEFICIENTE DE DETERMINACIÓN
El problema de la varianza residual es que vienen afectada por las unidades de

medida y esto imposibilita la comparación de la dependencia entre grupos de
variable. Teniendo en cuenta la relación entre los diferentes tipos de varianzas,
podemos obtener una medida relativa (es decir, que no dependa de las unidades y
esté entre cero y uno) de la bondad de ajuste dividiendo la varianza debida a la
regresión entre la varianza total de Y.
Se define el COEFICIENTE DE DETERMINACIÓN COMO:
S2y * S2e
R 
2
o bien R2  1 
S2y S2y
RECURSOS HÍDRICOS
2018-I
CIVIL
el coeficiente de determinación (multiplicado por cien) representa el porcentaje de la

variabilidad de Y explicada por la recta de regresión, es decir por su relación con la
variable X.
 0  R2  1
 Si R2 = 1 todos los residuos valen cero y el ajuste es perfecto; si R2 = 0 el ajuste es
inadecuado.
2.1.5 PREDICCIÓN
El objetivo último de la regresión es la predicción de una variable para un valor

determinado de la otra. La predicción de Y para X = x0 será simplemente el valor
obtenido en la recta de regresión de Y sobre X al sustituir el valor de x por x0.
Es claro que la fiabilidad de esta predicción será tanto mayor cuando mayor
sea la correlación entre las variables (es decir mayor sea R2 o rxy ).
RECURSOS HÍDRICOS
2018-I
CIVIL
ANÁLISIS DE FRECUENCIAS DE PRECIPITACIONES,

UTILIZANDO LA ECUACIÓN DE WEIBULL. (CUADRO Y
GRAFICO)
 EJEMPLO 01:
Efectuar el analisis de frecuencias de precipitaciones usando la ecuacion de
WERBULL para la estacion Pachas (Moquegua) quecuenta con el registro del
año 1984 hasat el año 2010.
P P Tr=1/f
AÑO m Fq Fd F%
(mm) (mm) (años)
1984 291.7 400.500 1 1/28 0.036 3.571 28.000 160400.25
1985 67.1 317.800 2 2/28 0.071 7.143 14.000 100996.84
1986 187.9 291.700 3 3/28 0.107 10.714 9.333 85088.89
1987 101.7 263.200 4 4/28 0.143 14.286 7.000 69274.24
1988 93.1 263.000 5 5/28 0.179 17.857 5.600 69169.00
1989 212 259.700 6 6/28 0.214 21.429 4.667 67444.09
1990 70.9 221.300 7 7/28 0.250 25.000 4.000 48973.69
1991 86 212.000 8 8/28 0.286 28.571 3.500 44944.00
1992 53.6 209.600 9 9/28 0.321 32.143 3.111 43932.16
1993 400.5 187.900 10 10/28 0.357 35.714 2.800 35306.41
1994 147 184.100 11 11/28 0.393 39.286 2.545 33892.81
1995 91.3 182.200 12 12/28 0.429 42.857 2.333 33196.84
1996 80.4 180.300 13 13/28 0.464 46.429 2.154 32508.09
1997 317.8 177.400 14 14/28 0.500 50.000 2.000 31470.76
1998 180.3 170.000 15 15/28 0.536 53.571 1.867 28900.00
1999 114 147.000 16 16/28 0.571 57.143 1.750 21609.00
2000 182.2 120.200 17 17/28 0.607 60.714 1.647 14448.04
2001 263.2 114.000 18 18/28 0.643 64.286 1.556 12996.00
2002 184.1 101.700 19 19/28 0.679 67.857 1.474 10342.89
2003 120.2 93.100 20 20/28 0.714 71.429 1.400 8667.61
2004 170 91.300 21 21/28 0.750 75.000 1.333 8335.69
2005 209.6 86.000 22 22/28 0.786 78.571 1.273 7396.00
2006 177.4 81.900 23 23/28 0.821 82.143 1.217 6707.61
2007 81.9 80.400 24 24/28 0.857 85.714 1.167 6464.16
2008 263 70.900 25 25/28 0.893 89.286 1.120 5026.81
2009 255.7 67.100 26 26/28 0.929 92.857 1.077 4502.41
2010 221.3 53.600 27 27/28 0.964 96.429 1.037 2872.96
∑ 4627.9 28 ∑ 994867.25
RECURSOS HÍDRICOS
2018-I
CIVIL
SOLUCION:
a) Hallar la precipitación al P75% de probabilidad de ocurrencia.
La precipitación al P75% es = 91.3
b) Hallar la precipitación al P95% de probabilidad de ocurrencia.
No se tiene la precipitación al P95%, procedemos hacer la interpolación.
67.100 92.875%
P95% 95%
53.600 96.426%
P95% -53.600 67.1-53.6

₌
95%-96.4% 92.9-96.4
P95% = 59.021
c) Hallar la precipitación para 10 año s de retorno.
317.800 14
P10 10
291.700 9.3
P10 -291.700 317.8-291.7

₌
10-9.3 14-9.3
P95% = 295.587
RECURSOS HÍDRICOS
2018-I
CIVIL
d) GRAFICO PRECIPITACION (mm) VS TIEMPO (años).
P
F%
(mm)
3.571 400.5
7.143 317.800
10.714 291.700
14.286 263.2
17.857 263
21.429 255.7
25.000 221.3
28.571 212
32.143 209.6
35.714 187.9
39.286 184.1
42.857 182.2
46.429 180.3
50.000 177.4
53.571 170
57.143 147
60.714 120.2
64.286 114
67.857 101.7
71.429 93.1
75.000 91.3
78.571 86
82.143 81.9
85.714 80.4
89.286 70.9
92.857 67.1
96.429 53.6
e) cálculos adicionales.
Precipitacion media
= 171.404 mm
Desviacion estandar
88.06205191

Metodo de Minimos Cuadrados

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Metodo de Minimos Cuadrados

Hochgeladen von

Copyright:

Verfügbare Formate

UNIVERSIDAD PRIVADA

DOCENTE: Ing. FERMIN GARNICA TELLO

En el presente trabajo de investigación se presenta de modo que se estudie y predigan

El análisis de regresión, es una técnica estadística para modelar e investigar la

Y   0  1 x   , es conocido como modelo de regresión lineal simple,

parámetros  0 y 1 a fin de minimizar la suma de los cuadrados de las desviaciones

DETERMINACIÓN DEL MODELO DE REGRESIÓN LINEAL SIMPLE

Dadas n observaciones de la muestra, se pueden expresar como:

Por lo tanto si tenemos que la ecuación

Para resolver esto se deriva parcialmente y luego se iguala a cero.

Igualando a cero obtenemos el siguiente resultado.

Realizamos el mismo procedimiento para encontrar el valor de 1

Igualando a cero esta ecuación obtenemos el siguiente resultado de 0.

2.1 MÉTODO DE MÍNIMOS CUADRADOS

Es el segundo caso del que se ocupa la teoría de la regresión.

Llamaremos regresión de Y sobre X a la función que explica la variable Y (dependiente) para

Llamaremos regresión de X sobre Y a la función que explica la variable X (dependiente) para

La regresión es lineal cuando el modelo función de regresión seleccionado es una recta. En

tengamos una variable independiente. Cuando tengamos dos o más variables

2.1.1 MÉTODO DE MÍNIMOS CUADRADOS

Para cada valor de X, (xi ) tenemos dos valores de Y:

 El valor observado en la muestra (o en la nube de puntos ) yi.

El método de los mínimos cuadrados consiste en determinar los parámetros (a1,...,ar) de

Es decir, minimizamos la suma de las distancias verticales de los puntos a la curva.

La condición necesaria para obtener el mínimo es que las primeras derivadas

resolviendo este sistema, denominado sistema de ecuaciones normales, quedan

2.1.2 MODELO DE REGRESIÓN LINEAL SIMPLE.

 RECTA DE REGRESIÓN En el modelo de regresión lineal simple la función

A esta recta la llamaremos RECTA DE REGRESIÓN DE Y SOBRE X.

Vamos a deducir su ecuación usando el método de los mínimos cuadrados.

- Que derivando respecto a a y a b e igualando a cero:

- Que nos dará un sistema de dos ecuaciones normales y dos incógnitas

Y obtenemos que la recta de regresión de Y sobre X es y = a + bx con los valores

Que sería la misma recta pero expresada en punto pendiente. A la pendiente b de la

 RECTA DE REGRESIÓN DE X SOBRE Y Aplicando el mismo razonamiento

Igualmente a la pendiente b’ de la recta de regresión de X sobre Y se le denomina

2.1.3 MEDIDAS DE BONDAD DE AJUSTE: CORRELACIÓN

Se define la VARIANZA RESIDUAL como la media de todos los residuos elevados

 Si la varianza residual es grande los residuos serán grandes y la dependencia

Es fácil demostrar que la media de los residuos en la regresión lineal de Y sobre X

Se demuestra que Sy2 = Se2 + Sy*2

Es decir, la varianza total de la variable Y es la suma de dos varianzas: la varianza

Así pues, cuando aumenta la varianza debida a la regresión, disminuye la varianza

2.1.4 COEFICIENTE DE DETERMINACIÓN

El problema de la varianza residual es que vienen afectada por las unidades de

Se define el COEFICIENTE DE DETERMINACIÓN COMO:

el coeficiente de determinación (multiplicado por cien) representa el porcentaje de la

El objetivo último de la regresión es la predicción de una variable para un valor

ANÁLISIS DE FRECUENCIAS DE PRECIPITACIONES,

b) Hallar la precipitación al P95% de probabilidad de ocurrencia.

No se tiene la precipitación al P95%, procedemos hacer la interpolación.

P95% -53.600 67.1-53.6

c) Hallar la precipitación para 10 año s de retorno.

P10 -291.700 317.8-291.7

d) GRAFICO PRECIPITACION (mm) VS TIEMPO (años).

Das könnte Ihnen auch gefallen