Sie sind auf Seite 1von 30

Tema 3

Mtodos de estimacin paramtricos y seleccin del


modelo

3.1 Introduccin
En este tema nos dedicaremos al estudio de los mtodos de estimacin de parmetros en el
dominio temporal y frecuencial. Estos se basan en el supuesto de que el sistema pueda
representarse por una parte determinista o causal y una parte estocstica que engloba las
dinmicas no modelizables del sistema. En general se asume que la parte estocstica puede ser
representada por una variable Gausiana.

Los mtodos de estimacin en el dominio temporal que se estudian, tienen la particularidad de


que a partir de ellos se estiman modelos discretos (dominio-Z). Consecuentemente, en el caso
de desearse un modelo continuo (dominio-S o ecuacin diferencial) del sistema ser necesario
convertir el modelo discreto a continuo. Ello no presenta problemas cuando el sistema
presenta un mantenedor de orden cero. Contrariamente, utilizando tcnicas frecuanciales
podremos estimar modelos tanto continuos como discretos. La comparacin entre ambos
modelos se muestra en la siguiente tabla.

Tabla 3.1. Comparacin de modelos de sistemas


Mtodos frecuenciales Mtodos temporales
Funcin de transferencia en el dominio s y z Funcin de transferencia en el dominio z
Ruido aditivo en la entrada y en la salida Ruido aditivo al modelo
Modelo no paramtrico del ruido Modelo paramtrico del ruido
Retardo fraccional Retardo es un mltiplo entero de Ts
Sistemas SISO Sistemas MISO

Los mtodos de estimacin frecuenciales tienen diferentes ventajas y desventajas con respeto
a los mtodos temporales. Los ingenieros muchas veces prefieren la descripcin en el dominio
frecuencial por las siguientes razones [Kollr94]:
Mientras que la solucin de una ecuacin diferencial necesita la convolucin en el
dominio del tiempo, esta convolucin se sustituye por una simple multiplicacin en el
dominio de la frecuencia.
A menudo es posible descomponer la seal / ruido en diferentes bandas frecuenciales.
Con la seleccin adecuada de los coeficientes de Fourier en una banda de frecuencias
adecuada, es posible reducir el nmero de datos.
Es posible obtener un modelo continuo a partir de los datos.
Pequeas no linealidades pueden ser fcilmente mensurables y detectables en el dominio
de la frecuencia.

Por otro lado, trabajar en el dominio del tiempo tiene ventajas [Ljung91]:
Es ms natural trabajar con seales en el dominio temporal.
Son mtodos menos sensibles al tipo de seal de excitacin, los tcnicas frecuenciales
presentan problemas cuando estas no son peridicas.

3-1
Ciertas no linealidades son ms fciles de detectar, como es el caso de las saturaciones.
Pueden ser utilizados de forma recursiva.
Permiten medir directamente los transitorios del sistema.

En general, la base de todos los mtodos de estimacin consiste en minimizar unos residuos
(t), definiendo (t) como la diferencia entre el valor deseado de la salida, y(t), y el valor de
prediccin, y$ (t ) , que es funcin del modelo estimado. La minimizacin se realiza
generalmente utilizando un criterio cuadrtico. La metodologa de clculo a utilizar depender
de la relacin entre (t) y los parmetros que se quieren estimar. Cuando la relacin sea lineal
se podr utilizar un mtodo de clculo analtico, mientras que en el caso de una relacin no
lineal, el mtodo de clculo a utilizar ser iterativo.

Se debe decir que los modelos estimados, tanto en el dominio temporal como frecuencial,
sern modelos con dinmicas lineales. En la tabla 3.1 se muestran ms claramente estos
conceptos.

Tabla 3.2. Clarificacin del trmino linealidad.

ERROR
DINMICA PROCESO
lineal no-lineal
respecto al coeficiente a$

= yw
Lineal y '+ ay = u = y '+ ay
$ u
w' +aw
$ =u

= y w
No-lineal y'+ay 3 = u = y '+ay
$ 3 u
w'+aw
$ 3=u

3.2 Los modelos y los mtodos de estimacin paramtricos


discretos

3.2.1 Estructura de los modelos lineales discretos


Los mtodos de estimacin paramtricos estn muy relacionados con el modelo utilizado. La
forma general de representar la estructura de un modelo discreto es, segn [Ljung87]:

y (t ) = G ( q 1 )u ( t ) + H ( q 1 ) e( t ) (3.1)

Los errores de modelizacin se incluyen, a diferencia de otros mtodos de estimacin, en el


trmino e(t). A este trmino se le asocia una serie de variables Random independientes
uniformemente distribuida de media nula (ruido blanco). G(q-1 ) i H(q-1 ) son filtros de orden
finito que modelizan la parte determinista y la parte estocstica respectivamente.

Una caracterstica diferencial de las distintas estructuras derivadas de la ecuacin general


(3.1), es la forma de modelizar la parte estocstica o ruido. Por este motivo los modelos se
han agrupado en dos bloques:

3-2
- Modelos en que H(q-1 )=0

a) Modelos de media ajustada, MA:

y( t ) = B (q 1 ) u( t nk ) + e( t ) (3.2)
1 1
donde: G ( q ) = B( q ) , nk representa el retardo puro del proceso y B(q ) es un polinomio de
-1

grado nb que tiene la forma:

B ( q 1 ) = b0 + b1 q 1 + L+ bnb q nb (3.3)

Se les denomina tambin modelos de respuesta impulso finito (FIR). Tienen el inconveniente
que, para representar el comportamiento de un proceso, es necesario gran nmero de
coeficientes.

b) Modelos de error de salida, OE:

B (q 1 )
y( t ) = u( t nk ) + e( t ) (3.4)
F ( q 1 )

B ( q 1 ) nk
en este caso: G (q 1 ) = q , y F(q-1 ) es un polinomio autoregresivo de orden nf:
F (q 1 )
F ( q 1 ) = 1 + f 1q 1 +L+ f nf q nf (3.5)

- Modelos en que H(q-1 ) 0

c) Modelos autoregresivos con variables exgenas, ARX:

A( q 1 ) y (t ) = B( q 1 )u (t nk ) + e ( t ) (3.6)

en este modelo se considera que la parte determinista y la parte estocstica tienen el mismo
denominador:
B( q 1 ) nk
G( q 1 ) = q
A(q 1 )
(3.7)
1
1
H (q ) =
A( q 1 )
El polinomio A(q-1 ) es el polinomio autoregresivo de orden na:

A ( q 1 ) = 1 + a 1q 1 +L + a n a q na (3.8)

d) Modelos autoregresivos de media mvil y variables exgenas, ARMAX:

A( q 1 ) y (t ) = B( q 1 )u (t nk ) + C ( q 1 ) e(t ) (3.9)

Al igual que en c), G( q 1 ) i H( q 1 ) , tienen el mismo denominador:

3-3
B( q 1 ) nk
1
G (q ) = q
A(q 1 )
(3.10)
C( q 1 )
1
H (q ) =
A( q 1 )

y C(q-1 ) es un polinomio parecido a (3.8) de orden nc.

e) Otros modelos del termino error son:

1
A( q 1 ) y ( t ) = q nk B ( q 1 )u (t ) + e (t ) (3.11)
D (q 1 )

siendo D(q-1 ) un polinomio autoregresivo de orden nd. A este modelo se le denomina


ARARX.

Un modelo ms general es la estructura ARARMAX:

C( q 1 )
A( q 1 ) y ( t ) = q nk B ( q 1 )u (t ) + e (t ) (3.12)
D (q 1 )

f) Modelo Box-Jenkins, BJ:

B( q 1 ) C (q 1 )
y( t ) = q nk u ( t ) + e (t ) (3.13)
F (q 1 ) D( q 1 )

Una propiedad particular de esta estructura es que G(q-1 ) y H(q-1 ) no tienen parmetros
comunes.

- Resumen de los distintos tipos de modelos

Toda esta familia de modelos se puede representar por el modelo general (3.14)
esquematizado en la figura 3.1.

1 nk
B( q 1 ) C( q 1 )
A( q ) y ( t ) = q u (t ) + e (t ) (3.14)
F ( q 1 ) D (q 1 )

e(t)

C (q 1 )
D(q 1 )

u(t) +
B ( q 1 ) 1 y(t)
q nk
F ( q 1 ) + A(q 1 )

Figura 3.1. Esquema de bloques del modelo general (3.14)

3-4
Esta estructura es muy general, pero es til para elaborar algoritmos ya que sus resultados
cubren todos los casos especiales. La relacin entre modelos y los casos particulares se
exponen en la tabla 3.3.

Tabla 3.3. Relacin entre el modelo general y los casos especiales.

Polinomios utilizados de (3.14) Nombre de la estructura del modelo


B FIR
AB ARX
ABC ARMAX
ABD ARARX
ABCD ARARMAX
BF OE
BFCD BJ

3.2.2 Objetivos de los mtodos de estimacin paramtricos


Los mtodos de estimacin paramtricos tienen por objetivo estimar los parmetros de los
polinomios: A, B, C, D y/o F segn el modelo considerado, de forma que el error de
prediccin sea mnimo.

En el caso de la ecuacin general (3.14) el error de modelizacin o residuos se determina a


partir de la ecuacin (3.15).
D( q 1 ) 1
1
nk B( q )

( t ) = y (t ) y$ ( t ) = 1
A ( q ) y ( t ) q 1
u (t ) (3.15)
C( q ) F (q )

La ecuacin de los residuos (3.15) se puede evaluar considerando dos trminos:

Modelizacin de la parte determinista. Se observa que hay una relacin lineal entre el
error de prediccin y los coeficientes de los polinomios A y B, mientras que respecto a los
coeficientes del polinomio F la relacin es no lineal. Este hecho comporta que, para
estimar los parmetros del polinomio F, se debe utilizar un mtodo de clculo iterativo,
mientras que si solo es necesario estimar los parmetros de los polinomios A y B, los
mtodos de clculo a utilizar son analticos y, por tanto, ms sencillos.

Modelizacin de la parte estocstica. Los errores de modelizacin (t) no son conocidos


y la relacin que hay entre los coeficientes y los residuos no es lineal. Consecuentemente,
se deben estimar los valores de (t) al mismo tiempo que los valores de los parmetros de
los polinomios. En este caso, por lo tanto, los mtodos de clculo sern iterativos.

3.3 Mtodo de estimacin por mnimos cuadrados (LS)

3.3.1 Descripcin del mtodo de mnimos cuadrados


El mtodo LS estima modelos de estructura ARX (3.6). Estos modelos se pueden representar
por la ecuacin:

3-5
y ( t ) = T ( t ) + v( t ) (3.16)

siendo: y(t) es el valor de la salida en el instante t, (t) es el vector regresor o informacin, y


es el vector de parmetros.
( t ) = [ y ( t 1) L y ( t na ) u( t nk 1) L u( t nb nk )]
T

(3.17)
= [ a1 L a na b1 L bnb ]
El problema a resolver consiste en estimar el vector de parmetros, $ , partiendo de las N
observaciones realizadas: y(1), (1),...,y(N),(N).

De la ecuacin (3.16) se deducen un conjunto de ecuaciones lineales:


y (1) = T (1)$
y ( 2 ) = T ( 2)$
(3.18)
M
y ( N ) = T ( N )$

que pueden ser escritas en forma matricial segn:


Y = $ (3.19)

siendo: Y un vector de dimensin N, Y = [ y (1) y ( 2) L y ( N ) ] ; y una matriz de dimensin


T

d/N, = [ (1) ( 2) L ( N )] .
T

El error de modelizacin o residuo se define como:


= Y $ (3.20)
con =((1)...(N))T.

La estimacin por mnimos cuadrados (LS), consiste en minimizar la funcin residuo, V ($ ) ,


definida por la ecuacin (3.21).

1 N 2 1 T 1
V ( ) = (t ) = =
2
(3.21)
2 t =1 2 2

Sustituyendo la ecuacin (3.20) en (3.21), se obtiene que la funcin a minimizar es:


1
2
[
min V ( ) = V ( ) = Y T Y Y T T T Y + T T ] (3.22)

La derivada de la funcin (3.22) respecto a los parmetros debe ser nula. Deducindose que el
valor de los parmetros que minimiza V ($ ) es:

( )
1
$ = T TY (3.23)

La ecuacin anterior se puede escribir como un producto de sumas finitas:

3-6
1
N N
$ = ( t )( t )T ( t ) y( t ) (3.24)
t =1 t =1
de la cual, conocido el orden del modelo: na, nb y nk, es fcilmente calculable el valor de sus
parmetros.

Se debe tener en cuenta que la ecuacin planteada tiene solucin si la matriz T es


definida positiva o, equivalentemente s el rango n. En caso contrario la ecuacin tiene
infinitas soluciones. El requisito necesario para garantizar una solucin nica de la
ecuacin (3.23) es que la seal de excitacin sea persistentemente excitada de orden
mayor que d [Sderstrm89].

3.3.2 Propiedades del mtodo LS


Las propiedades estadsticas de este mtodo demuestran que dadas unos datos que satisfacen
la ecuacin (3.25)
y( t ) = T ( t ) 0 + e( t ) (3.25)

donde 0 es el vector de parmetros verdadero y asumiendo que e(t) es un ruido blanco de


media cero y variancia 2 :

(i) $ converge a 0 cuando N tiende a infinito


(ii) la variable Random N ( $ 0 ) se comporta como una distribucin normal de
media cero y covariancia PLS
PLS = $2 ( T )
1
(3.26)
(iii) un estimador de es:
2

$2 =
2V $ () (3.27)
Nd

tal y como se demuestra en [Sderstrm89].

Resaltar como principal ventaja de este mtodo que la conversin a un mnimo global est
garantizada y no existen mnimos locales.

Y como inconveniente resaltar que s la perturbacin v(t) no es un ruido blanco y la


relacin seal til/seal ruido es importante, la conversin al valor real de 0 no est
garantizada. Este hecho limita su utilizacin como mtodo general de estimacin.

3.3.3 Solucin de LS utilizando la ecuacin normal


La estimacin de los parmetros por el mtodo LS se realiza a partir de la ecuacin (3.24),
conocida con el nombre de ecuacin normal.

( )
1
$ = T TY

3-7
Resaltar como ventaja que la resolucin directa de esta ecuacin es sencilla y que los
clculos algebraicos a realizar son sencillos.

Presenta el inconveniente que la matriz T puede estar mal condicionada,


particularmente si es de gran dimensin, lo cual comporta errores numricos importantes
en la resolucin de la ecuacin (3.23). Es por este motivo que diferentes investigadores han
presentado alternativas para resolver esta ecuacin, una de ellas es por triangulacin
ortonormal.

3.3.4 Solucin de LS por triangulacin ortonormal


La triangulacin ortonormal o transformacin QR es una de les alternativas numricas
desarrolladas para resolver la ecuacin lineal (3.19) y evitar los errores generados por el mal
acondicionamiento de la matriz T [Ljung87].

Consiste en multiplicar el sistema de ecuaciones original (4.19) por una matriz ortonormal Q:

Q = QY (3.28)

En estas condiciones, la norma de la funcin error no de ve afectada por la transformacin


aplicada, ya que si Q es ortonormal: QQT = I, por tanto:

QY Q = Q (Y ) = (Y ) Q T Q (Y )
2 2 T

(3.29)
= (Y ) (Y ) = Y
T 2

El objetivo es buscar una matriz ortonormal Q tal que:


R
Q = (3.30)
0

donde R es una matriz cuadrada de dimensin d/d triangular por encima. La ecuacin (3.31)
se puede escribir como:

R
= QT (3.32)
0

A la ecuacin (3.31) se la denomina factoritzacin QR de . Una posible forma de construir


la matriz Q es utilizando la transformacin de Householder [Ljung87].

En estas condiciones, el segundo trmino de la ecuacin (3.28), QY, se puede descomponer en


dos matrices:

L
QY = (3.33)
M

y consecuentemente calcular la funcin prdida (3.21) como:

3-8
2
2 R L 2
V ($) = Q$ QY = $ = R$ L + M 2
(3.34)
0 M

Es fcil ver que V ($ ) se minimiza por cuando:

R$ = L (3.35)

y se obtiene que el mnimo de la funcin prdida vale:

( ) = M = MTM
2
minV
$
(3.36)

Como ventajas de esta metodologa de clculo mencionar:

1- el sistema lineal (3.35) est mejor condicionado que la ecuacin (3.23) y por tanto es
numricamente superior

2- la funcin prdida se calcula sin la necesidad de estimar el valor de sus parmetros.

Como inconvenientes destacar que requiere el doble de clculo que el mtodo directo.

3.4 Mtodo de mnimos cuadrados generalizado (GLS)


El mtodo de mnimos cuadrados presenta como principal inconveniente la no-convergencia
del algoritmo cuando el ruido presente en el proceso no es blanco. Una posible forma de
solucionar el problema es utilizando el mtodo de mnimos cuadrados generalizado el cual es
una extensin del mtodo LS [strm 71], [Zhu93].

Al considerar un modelo de tipo:

A( q 1 ) y (t ) = B( q 1 )u (t nk ) + H ( q 1 )e (t ) (3.37)

S la funcin de transferencia discreta del ruido, H(q-1 ), es conocida, el modelo puede


transformarse de la forma:
A( q 1 ) ~
y (t ) = B( q 1 )u~(t nk ) + e( t ) (3.38)
donde:
~y (t ) = 1 y (t )
G( q 1 )
1
u~(t ) = u (t )
G (q 1 )

Con estas nuevas seales filtradas de la entrada y la salida, el problema podra ser resuelto
aplicando el mtodo clsico de LS. Por lo tanto el mtodo GLS puede interpretarse como un
problema de estimacin de LS aplicando como criterio la generalizacin del error.

El problema que se plantea en la utilizacin de este mtodo es que la funcin de transferencia


H(q-1 ) no es conocida. Para solucionar este problema se requiere un proceso iterativo en
cuatro etapas el cual consiste en:

3-9
(1) Con el mtodo LS, hacer una primera estimacin de los polinomios A(q-1 ) y B(q-1 ):

A( q 1 ) y (t ) = B( q 1 )u (t nk ) + v (t ) (3.39)

(2) Analizar el residuo, (t), y determinar por ejemplo un modelo AR para aproximar H(q-1 ).
En este caso se tiene un modelo denominado ARARX (3.11).
1
G( q 1 ) =
D( q 1 ) (3.40)
D( q 1 ) ( t ) = e (t )

La estimacin de D(q-1 ) requiere otra vez la utilizacin del mtodo LS

(3) Filtrar (blanquear) la entrada y la salida usando el modelo obtenido en la etapa (2):
~y (t ) = D (q 1 ) y( t )
(3.41)
u~(t ) = D( q 1 ) u( t )

(4) Hacer una nueva estimacin por mnimos cuadrados utilizando los seales filtrados.

Este proceso debe repetirse, a partir de la etapa (2), tantas veces como sea necesario hasta
conseguir la convergencia.

La convergencia del mtodo se evala comprobando que los residuos definidos obtenidos
sean blancos. Para ello puede utilizarse el test de auto correlacin. Para utilizarse este mtodo
deben definirse tanto el orden de la parte determinista como el orden de la parte estocstica.
Para simplificar el problema, la mayora de las veces se considera que son del mismo orden.

3.5 Mtodo de la variable instrumento

3.5.1 Descripcin del mtodo de la variable instrumento


El mtodo de la variable instrumento (IV) tiene como objetivo aprovechar las ventajas del
mtodo LS y superar sus limitaciones. Tiene el inconveniente que para su utilizacin es
necesario definir una nueva variable llamada instrumento.

El planteamiento de este mtodo es muy sencillo. Consiste en multiplicar la ecuacin (3.15)


por un vector instrumento z(t)

z ( t ) y (t ) = z ( t ) T ( t ) + z ( t ) v (t ) (3.42)

que se debe caracterizar por ser independiente del ruido v(t), pero dependiente de la entrada y
la salida del sistema. Esta propiedad permite plantear el siguiente sistema de ecuaciones
lineales:

[
z( t ) ( t ) = z( t ) y (t ) T ( t )$ ] (3.43)

3-10
El vector de parmetros que minimiza la funcin prdida (3.22) vale, en este caso:

( )
1
$ = Z T ZTY (3.44)

donde Z es una matriz de la misma dimensin que .

Para que $ converja a 0 es necesario que la variable instrumento tenga como propiedades:
1 N

N t=1
z ( t ) T ( t ) sea singular
(3.45)
1 N
z (t)v(t ) = 0
N t=1
En otras palabras, es necesario que la variable instrumento sea fuertemente dependiente del
vector regresin, (t), pero sea independiente del ruido.

Este mtodo, al igual que LS, presenta el inconveniente de que la matriz ZT puede estar mal
condicionada cuando su dimensin es grande. Por este motivo puede utilizarse la
triangulacin ortonormal para calcular el valor de los parmetros.

Si se considera un modelo con una estructura ARMAX, una forma de garantizar las
condiciones (3.45) es considerando un vector instrumento definido por:

z( t ) = L( q 1 )[ x ( t 1) x (t 2) L - x( t - na ) u( t 1) L u( t - nb) ]
T
(3.46)
donde L es un filtro lineal y x(t) se genera a partir del sistema lineal:
N ( q 1 ) x ( t ) = M ( q 1 ) u( t ) (3.47)

El problema consiste en determinar el filtro, L, y el modelo lineal, N(q-1 ) y M(q-1 ). Una forma
sencilla seria:

(1) Aplicar LS
(2) Utilizar el modelo estimado como polinomios N y M, y determinar x(t) con (3.47)
(3) Considerando L=1, definir z(t) segn (3.46) y estimar el vector de parmetros a partir de la
ecuacin (3.44).

3.5.2 Mtodo IV ptimo propuesto por Ljung


El mtodo de la variable instrumento ptimo propuesto por Ljung [Ljung87], tambin
denominado variable instrumento en cuatro etapas, genera el instrumento, z(t), y el filtro, L,
estimando al mismo tiempo la funcin de transferencia de la parte determinista y estocstica.
Este clculo se realiza en cuatro etapas:

(1). Considera la estructura del modelo como un modelo ARX:

y$ ( t / ) = T ( t)$ (3.48)

3-11
y se utiliza LS para estimar . A los parmetros estimados se les denomina $ (N1) . A partir
de los parmetros se obtiene la funcin de transferencia (3.49), donde los subndices
indican las iteraciones realizadas.

B$ ( 1) ( q)
G$ N(1) ( q ) = $ N( 1) (3.49)
AN ( q )

(2) Con la funcin de transferencia estimada y considerando L=1, se genera el vector


instrumento, z(1)(t), segn se ha descrito en (4.46);

x (1) ( t ) = G$ N(1) (q 1 ) u( t )
(3.50)
z (1) ( t ) = [ x (1) ( t 1) K x (1) ( t na ) u (t 1) K u( t nb)]
T

La ecuacin (3.44) permite estimar un nuevo valor para los parmetros, y obtener la
correspondiente funcin de transferencia, G$ (N2 ) .

(3) Los nuevos polinomios, A$ N( 2) i B$ N( 2 ) , obtenidos de la funcin de transferencia G$ (N2 ) , sirven


para estimar la parte estocstica del proceso:

v$ N( 2) (t ) = A$ (N2) y (t ) B$ N( 2) u( t ) (3.51)

Considerando que el ruido se comporta como un modelo auto regresivo (AR) de orden d,
se estima, con el mtodo LS, el filtro L$ ( q 1 ) :

L$ ( q 1 ) v$ (N2 ) ( t ) = e (t ) (3.52)

(4) De la misma forma que en (3.50), se calcula de nuevo x (2)(t) pero considerando la funcin
de transferencia G$ (N2 ) . El vector instrumento ptimo viene dado por (3.53).

z (2 ) (t ) = L$ N ( q 1 )[ x ( 2) ( t 1) K x ( 2) ( t na ) u( t 1) K u( t nb) ]
T
(3.53)
Este nuevo instrumento junto con los filtros sirven para estimar el valor final de los
parmetros:
1 N
N ( 2)
N = z ( t ) FT
$ z ( 2)
( t ) y F (t )
t= 1 t =1 (3.54)
F ( t ) = L$ N ( q 1 ) (t ), y F ( t ) = L$ N ( q 1 ) y ( t )

Las propiedades estadsticas de este mtodo demuestran que la variable Random N ( $ 0 )


tiende a una distribucin Normal de media cero y variancia PIV:

3-12
1
1 $ N ( 2 ) N ( 2) T
P = N z ( t ) z (t )
N IV t =1 t =1
(3.55)
$N = [ y F ( t ) FT ( t )$N ]
1 N 2

N t =1

3.5.3 Solucin de la estimacin IV por triangulacin ortogonal


Al igual que LS se genera una matriz ortogonal Q que se debe caracterizar porqu el producto
QZ sea triangular por encima. Con esta propiedad la ecuacin (3.44) ser:

Z T Y = ( QZ ) Q$
T
(3.56)
Al descomponer la matriz Q en:
Q1
Q=
Q2
donde Q1 es una matriz cuadrada N/N. Puede definirse una matriz cuadrada y triangular por
encima Z1 = Q1 Z. Si se define la matriz 1 = Q1 y ya que Q2 Z = 0, la ecuacin (3.56) queda
transformada en:
Z T Y = Z1T1$ (3.57)

En (4.58) se demuestra que Z1 es la raz cuadrada de ZT Z

Z T Z = ( QZ ) QZ = Z1T Z1 + [ Q2 Z] Q2 Z = Z1T Z1
T T
(3.58)

y por tanto, la ecuacin (4.56) se puede escribir como:


Q Y = $
1 1 (3.59)

El error de modelizacin vendr dado en este caso por el producto Q2 Y y la funcin prdida
queda definida como:
minV
$
( ) = Q2 Y
2
= ( Q2 Y ) T
Q2 Y (3.60)
Cabe resaltar como ventaja de esta metodologa de clculo dos aspectos: que el sistema
lineal (3.59) est mejor condicionado que la ecuacin (3.44) y por tanto es numricamente
superior y que la funcin prdida se calcula sin la necesidad de estimar el valor de sus
parmetros.

Como inconvenientes debe destacase que requiere el doble de clculo que el mtodo
directo y complica mucho el mtodo IV ptimo.

3.5.4 Mtodo de la mxima probabilidad


El mtodo de la mxima probabilidad (ML) es uno de los mtodos ms generales para la
estimacin de parmetros. La idea bsica consiste en construir una funcin, denominada
funcin de probabilidad, que relacione los datos con los parmetros no conocidos. La
estimacin consiste en determinar el valor de los parmetros cuyo valor maximice la funcin.
La funcin de probabilidad consiste bsicamente en la funcin de densidad de probabilidad de

3-13
las observaciones. La estimacin de la mxima probabilidad significa que se selecciona el
valor de los parmetros que coinciden ms probablemente con las observaciones.

Supongamos que las observaciones estn representadas por un vector de variables Random
Y=[y1 , y2 , ..., yn ]T y indicamos la funcin de densidad de probabilidad como:

f(; y1 , y2 , ..., yn )=f y (; Y) (3.61)

La funcin de probabilidad de los valores observados puede expresarse como:

L()=f y (;Y) (3.62)

La estimacin s obtiene como:

max L( ) = L() (3.63)



El principio de mxima probabilidad es simple y se puede demostrar que converge


asintoticamente cuando N y la estimacin es eficiente (variancia mnima)[Sderstrom89].

Si consideramos un modelo genrico dado por la ecuacin (3.16) y considerando que v(t) es
una seal Gausiana, con una distribucin normal y de N elementos, concretamente de media
E[v]=0 y covariancia E[vv T ]=Cv conocida. La funcin de probabilidad de esta seal viene dada
por la expresin:

[
f (v ) = (2 ) det (Cv )
N
]
1 / 2 1 T 1
exp v Cv v (3.64)
2

En la cual al considerar el modelo (3.16) se obtiene:

[
f (v ) = (2 ) det (C v )
N
]
1 / 2 1 T 1
exp [Y ] Cv [Y ] (3.65)
2

En la prctica la funcin evaluada es:

2
[
N

2
T
]
log L ( ) = log (2 ) det (Cv ) [Y ] Cv1 [Y ]
1 1
(3.66)

Por lo tanto evaluando el mximo de esta funcin se estimar el valor de los parmetros . En
el caso en que el ruido corresponda a un ruido blanco con una matriz de covariancia Cv =2 I,
es fcil demostrar que la maximizacin de la funcin de mxima probabilidad (3.66) es
equivalente a minimizar la funcin prdida:

V ( ) =
1
[Y ]T [Y ] = 2 log L( ) + constant (3.67)
2

S no es conocido, la maximizacin de la ecuacin (3.66) con respecto a los parmetros y


debe realizarse separadamente. Para maximizar la ecuacin (3.66) se debe recurrir a mtodos
de clculo numrico, como el mtodo de Newton-Raphson.

3-14
Consideremos el caso de un sistema ARMAX (3.9) donde el ruido se supone que tiene una
distribucin normal y una matriz de covariancia conocida. En este caso la funcin del
logaritmo de probabilidad ser:

2
N
[
log L ( ) = log (2 ) det (Cv ) T C v1
1 1
2
] (3.68)

donde:
(t ) = y (t ) T (t ) ,
[
= a1 ,..., an , b1 ,...., bm , c1 ,..., c p ]
( t) = [ y (t 1),..., y (t n ), u (t 1),...., u( t m), v( t 1),..., v (t p) ] .

El problema en este caso es que v(t-1), ..., v(t-p) no son conocidos. Por lo tanto, en estas
circunstancias, la solucin solo es posible haciendo soluciones aproximadas (mtodo
iterativo) para conseguir a cada paso una mejor estimacin de la matriz de covariancia y de
los parmetros. Para ms detalles [Johansson93] y [strm80].

3.6 Mtodo de prediccin de error

3.6.1 Formulacin general del mtodo de prediccin de error


El mtodo de prediccin de error se basa de predecir el valor de la salida, y(t), en funcin de
los datos de entrada y salida al mismo y de un modelo estimado, de tal manera que se
minimice el error existente entre la variable predicha y su valor real.

Considerando la expresin lineal general de un sistema como en (3.16) y despreciando el


trmino ruido, la prediccin de la salida en el instante t se obtiene:

y (t ) = a1 y( t 1) L a n y( t n) + b1u (t 1) + L + bmu (t m ) = T ( t ) (3.69)

aqu la ecuacin del residuo definida por la ecuacin (3.15):

(t ) = y( t ) y (t t 1; ) (3.70)

puede ser interpretada como un error de prediccin donde la prediccin a un paso y (t t 1; )


se basa en todas los datos disponibles hasta el instante t-1 y el vector de parmetros del
modelo .

Para la formalizacin del mtodo se introduce la siguiente estructura general del modelo:

y (t ) = G( q 1 ; ) u( t ) + H ( q 1; )v (t ) (3.71)

Asumiendo que G(0;)=0, equivale a decir que el modelo tiene como mnimo un retardo puro
de una muestra entre entrada y salida. La forma general de expresar un predictor consiste en:

y (t | t 1; ) = L1 ( q 1; ) y (t ) + L2 ( q 1 ; )u (t ) (3.72)

3-15
la cual es una funcin de los datos anteriores, t-1, solo s los filtros de prediccin tienen como
restriccin: L1 (0;)=0 y L2 (0;)=0.

Hay varias formas de escribir el modelo (3.71) y determinar el predictor. Una vez definido el
modelo y el predictor, se calculan los errores de prediccin a partir de la ecuacin (3.70). La
estimacin de los parmetros, , se calcula de tal forma que los errores de prediccin sean
pequeos. El principio bsico de este mtodo se ilustra en la figura 3.1.

v(t)
u(t) + y(t)
PROCESO
+

+ (t)
Predictor -
(parmetros )

Minimizacin
de (t)

Figura 3.1. Esquema del mtodo de error de prediccin

Para definir el mtodo de prediccin de error el usuario debe realizar las siguientes
elecciones:

(1) Elegir la estructura del modelo. Esto concierne a la parametrizacin de G(q;) y H(q;)
en (3.71) como una funcin de . Por razones algoritmicas, la funcin de transferencia se
factoriza en polinomios en el numerador y en el denominador. En el contexto de la
identificacin, tal como se ha descrito en el apartado 3.2.1., hay distintos modelos de
parametrizacin: OEM, BJM, ...
(2) Elegir el predictor. Esto concierne a los filtros, L1 (q;) y L2 (q;) en la ecuacin (3.72),
una vez el modelo ha sido especificado. Estos filtros pueden ser seleccionados de distintas
formas. La forma ms utilizada es optimal mean square predictor. Esto significa que los
filtros son seleccionados de manera que bajo unas condiciones dadas del modelo los
errores de prediccin tienen la menor variancia posible.
En el caso del modelo general considerado en (3.71), el predictor ptimo seria:

[ ]
)y (t ) = 1 H 1 ( q 1 ; ) y (t ) + H 1 ( q 1 ; )G( q 1; )u (t ) (3.73)
El error de prediccin se determina de forma similar:

[ ]
(t ) = y (t ) )y (t ) = y (t ) 1 H 1 ( q 1 ; ) y (t ) + H 1 ( q 1 ; ) G( q 1 ; ) u( t ) (3.74)

(3) Elegir el criterio. Este se refiere a elegir una funcin que origine un valor escalar de todos
los errores de prediccin (1,), ..., (N,). Este criterio ser minimizado con respecto a

3-16
de manera que se realice la mejor prediccin. En el caso de una salida el criterio (funcin
error) puede definirse como una suma de cuadrados del error de prediccin, mientras que
en el caso de sistemas multi-variables como una proyeccin escalar de la matriz de
covariancia

1 N
V ( ) = h (t ; ) T (t ; ) (3.75)
N t=1

donde h() es una funcin de valor escalar y, generalmente, consiste en la traza de los pesos
de la matriz de covariaza o su determinante.

El anlisis del mtodo de prediccin de error muestra que la funcin perdida converge a un
mnimo y la estimacin es consistente cuando se satisfacen las siguientes condiciones:

Los datos {u(t),y(t)} son del proceso en estado estacionario.


La entrada es persistentemente excitada.
La Hessiana V() es no singular al menos alrededor del punto mnimo de V().
Los filtros G(q-1 ; ) y H(q-1 ; ) son funciones diferenciables del vector de parmetros .

En muchos casos el mnimo de V() no puede ser hallado de forma analtica. En estos casos la
minimizacin debe realizarse utilizando una rutina de clculo numrico. El mtodo ms
usualmente utilizado es el algoritmo de Newton-Raphson:

[ ( )] V ' ( )
( k +1) = ( k ) k V ' ' (k )
1 (k) T
(3.76)

Aqu ( k ) indica la iteracin k del clculo numrico. La secuencia de escalares k se utiliza


para controlar la longitud del paso. Estrictamente en el caso del algoritmo Newton-Rapson
k =1, de todas formas en la prctica muchas veces es necesario utilizar un paso variable para
asegurar la convergencia del mtodo.

3.7 Mtodos recursivos para la estimacin de parmetros


En los mtodos de identificacin recursivos, la estimacin de los parmetros se calcula
recursivamente en tiempo. Esto significa que la estimacin (t ) se calcula como una
modificacin de la estimacin (t 1) utilizando las nuevas medidas de u(t) y y(t). Los
mtodos recursivos para la estimacin de parmetros han sido desarrollados para aplicaciones
de la identificacin en tiempo real y su major campo de aplicacin son sistema de control
adaptativos y diagnostico de fallos. Ello es debido a que estas aplicaciones requieren que las
acciones y evaluaciones utilizadas utilicen el modelo mas actualizado del sistema.

Los mtodos de identificacin recursivos tienen las siguientes caractersticas generales:

Los modelos estimados con estos mtodos se adaptan fcilmente a los sistemas variantes
en el tiempo. Ellos permiten que el modelo siga los cambios de parmetros del sistema o
cambios debidos a condiciones de operacin en el caso de sistemas no lineales.

3-17
Los requerimientos de memoria son reducidos y no aumentan en el tiempo, debido a que
no se almacenan todos los datos.
Ellos se han derivado de una aproximacin de los mtodos no recursivos descritos
anteriormente.

3.7.1 Mtodo de mnimos cuadrados recursivo

Para deducir el mtodo de mnimos cuadrados recursivo (RLS) se parte de la ecuacin (3.24)
1
t t
( t ) = (k ) T ( k ) ( k ) y (k ) (3.77)
k =1 k =1

Para calcular esta expresin de forma recursiva se introduce como nueva notacin:

1
t
P(t ) = ( k ) T ( k ) (3.78)
k =1

Esta suma puede descomponerse en el valor de P(t) y el valor de P(t-1):

P 1 (t ) = P 1 (t 1) + ( k ) T (k ) (3.79)

Con este cambio de variables, los parmetros pueden estimarse utilizando:

t1
( t ) = P( t ) (k ) y ( k ) + (t ) y (t )

k =1 (3.80)
[
= P( t ) P 1 (t )( t 1) + (t ) y( t )]
Por lo tanto el mtodo de mnimos cuadrados recursivos adopta la forma:

[
( t ) = ( t 1 ) + P( t )( k ) y( t ) T ( k ) ( t 1 )] (3.81)

donde el ltimo valor puede ser interpretado como el error de prediccin, mientras que el
factor de correccin (P(t)(t)) puede ser considerado como un peso o factor de ganancia
determinado como el error de prediccin modifica los elementos del vector de parmetros
estimado.

El hecho de calcular P(t) en la ecuacin 3.79 requiere invertir una matriz a cada paso de
iteracin. Utilizando el lema [A + BCD]1 = A1 A 1 B[DA1 B + C 1 ]1 DA1 y
1
considerando A = P ( t 1 ), B = D y C = 1 se obtiene una expresin ms eficiente:
T

P( t ) = P( t 1 ) + K T ( k ) P( t 1 ) (3.82)
donde
[
K = P( t 1 )( t ) / 1 + T ( k )P( t 1 ) ( t ) ] (3.83)

3-18
que da como resultado una ganancia. La expresin de mnimos cuadrados recursivos queda
por tanto:

[ ]
( t ) = ( t 1 ) + K ( t ) y( t ) T ( k ) ( t 1 ) (3.84)

3.7.2 Valor inicial

Los algoritmos recursivos requieren aproximar el valor inicial del vector de parmetros y de
la matriz P(t). Si es posible realizar una primera estimacin del vector de los parmetros (por
ejemplo utilizando LS norecursivo) los la matriz P(0) debe reflejar la confianza de los
parmetros estimados. En el caso en que P(0) sea pequeo K(t) ser pequeo para los distintos
t y los parmetros estimados no variaran mucho del valor inicial. Mientras que, si P(0) es
grande la estimacin de los parmetros variar rpidamente del valor inicial. En ausencia de
informacin previa para realizar una primera estimacin de los parmetros, se acostumbra a
considerar: ( 0 ) = 0 y P( 0 ) = I , donde es un nmero grande.

3.7.3 Factor de oblido

Muchas aplicaciones pueden considerarse como sistemas de parmetros variables. En ellos se


requiere que los parmetros de modelo estimado se vayan adaptando en funcin de los
cambios del sistema. Interesa en estos casos controlar el cmo las medidas antiguas o las
recientes afectan sobre la estimacin de los parmetros o cmo de rpido son olvidadas las
medidas anteriores o antiguas.

Un mtodo utilizado en estos casos es el factor de olvido que proporciona un decrecimiento


exponencial de los pesos. La funcin prdida a minimizar adopta la expresin:

t
V ( ) = t k 2 ( k ) (3.85)
k =1

donde el valor recomendado de es un valor comprendido entre 0.90 y 0.995.

Por lo tanto el algoritmo de mnimos cuadrados recursivos con factor de olvido es:

[ ]
( t ) = ( t 1 ) + K ( t ) y( t ) T ( k ) ( t 1 ) (3.86)
K = P( t 1 )( t ) / [ + ( k ) P( t 1 )( t )]
T
(3.87)
P( t ) = [P( t 1 ) + K ( k )P( t 1 )] /
T
(4.88)
Para = 1 coincide con el mtodo de mnimos cuadrados comn.

3.7.4 Algoritmos de estimacin de parmetros recursivos

En la bibliografa hay distintos algoritmos de estimacin de parmetros recursivos, todos ellos


permiten estimar el valor de los parmetros del sistema en tiempo real. Una forma unificada
de representarlos es mediante las expresiones:

3-19
( t ) = ( t 1 ) + K ( t ) ( t ) (3.89)
K = ( t )P( t 1 ) ( t ) (3.90)
( t ) = y( t ) T ( t )P( t 1 ) ( t ) (3.91)

En la siguiente tabla se observan los valores de los parmetros, vector de datos y vector de
correccin para el caso de los mtodos: mnimos cuadrados (RLS), mtodo de la variable
instrumento recurdivo (RIV) y el mtodo de la mxima probabilidad recursivo (RML). En el
caso de incluirse el factor de olvido es necesario realizar las siguientes modificaciones:

(1) Reemplazar el 1 del denominador de (t) por .


(2) Dividir P(t) tambin por .

En Iserman (1991) se realiza una comparacin entre estos tres mtodos con respecto a las
caractersticas del estimador, su convergencia y el esfuerzo computacional. Las propiedades
de estos tres mtodos se resumen a continuacin:

RLS: Aplicable cuando la relacin ruido/seal es pequea. Esfuerzo computacional pequeo.

RIV: Tiene unas buenas prestaciones. Para acelerar la convergencia inicial se recomienda
empezar con RLS. Esfuerzo computacional mayor que RLS.

RML: Altas prestaciones del estimador. Lenta convergencia en la etapa inicial. Se estiman los
parmetros del ruido, pero la convergencia es lenta. El esfuerzo computacional es mayor que
en los otros dos.

Mtodo RLS RIV RML


[a L a b L b ] T
[a L a b L b ] T
[a L a b L b
1 n 1 m

]
1 n 1 m 1 n 1 m
T
c1 L c p
(t ) [ y( t 1 )L y( t n ) [ y( t 1 )L y( t n ) [ y( t 1 )L y( t n )
u ( t 1 ) L u ( t m )] u ( t 1 ) L u ( t m )] u ( t 1 )L u ( t m )
T T

( t 1 )L ( t p )]
T

( t ) 1 1 1
1 + ( t )P( t 1 ) ( t ) 1 + ( t ) P( t 1 ) ( t ) 1 + ( t ) P( t 1 ) ( t )
T T T

P(t) [ ] [ ] [
I K ( t ) T ( t ) P ( t 1 ) I K ( t ) T ( t ) P ( t 1 ) I K ( t ) T ( t ) P ( t 1 ) ]
(t) (t ) [
[ ( t 1 )L ( t n ) y' ( t 1 )L y' ( t n )
u ( t 1 )L u( t m )] u ' ( t 1 )L u ' ( t m )
T

' ( t 1 )L ' ( t p ) ] T

3-20
3.8 Mtodos de estimacin paramtricos frecuenciales
El objetivo de los mtodos de identificacin en el dominio frecuencial es el mismo que en el
dominio temporal: identificar un sistema lineal a partir de los datos. La principal diferencia
entre ambos radica en el dominio de trabajo. De todas formas los dos mtodos son
complementarios y, en algunos casos, ambos pueden utilizarse para solucionar el mismo
problema. Analizamos a continuacin, en que condiciones ambos mtodos identifican el
mismo sistema.

El modelo general utilizado en la identificacin en el dominio de la frecuencia de un sistema


lineal se muestra en la figura 5.1. El sistema se representa por su funcin de transferencia
H(), donde = s = j en el dominio de Laplace, o = z-1 = exp(-jTs) en el dominio z,
respectivamente, y H es una forma racional, eventualmente con un trmino retardo Td (3.92).

Ny

U H() +
Y Ym
Nu +

Um

Figura 3.2. Modelo general utilizado en la identificacin de sistemas en el dominio


frecuencial.

j T d
b 0 0 + b 1 1 + L + b nn nn
H () = e (3.92)
a 0 0 + a 1 1 + L + a nd nd

La seal de excitacin tiene una amplitud compleja Uk a la frecuencia angular k y la


respuesta del sistema es Yk = H( k )Uk . Lamplitud compleja de las seales de entrada y salida
medidas estan contaminada con ruido Nu y Ny , respectivamente, hecho que incorporadar un
error en las variables del modelo. Para la solucin propuesta, se asume que el ruido tiene
como caractersticas que:
es Gausiano
es independiente de las seales de entrada y salida
no hay correlacin entre las muestras de las diferentes frecuencias

Las medidas se realizan a distintas frecuencias k , k=1...F, las amplitudes de las entradas y
salidas son Umk y Ymk, respectivamente. Los parmetros no conocidos de la funcin de
transferencia se indican con el vector P. Con todo ello las ecuaciones bsicas son:

Yk = H( k ,P)Uk , k=1,2,...,F (3.93)

Ymk = H( k ,P)(Umk-Nuk )+Nyk , k=1,2,...,F (3.94)

3-21
Asumiendo que el ruido en las amplitudes complejas es Gausiana y no correlacionado, y que
el ruido de la entrada y la salida no estn tampoco correlacionados, su funcin de densidad
probabilstica puede escribirse como:

1 N Ruk
2
+ N Iuk
2
F 1 N Ryk2
+ N Iyk
2

p (N u , N y ) = exp

exp
k =1 2 uk 2 uk2
k =1 2 yk 2 yk2
2 2

(3.95)
1 Nuk N uk F 1 N yk N yk
= exp exp
k =1 2 uk

2 uk
2 2 2 2
k =1 2 yk 2 yk

donde NRuk , NIuk , NRyk y NIyk se corresponde con las partes real y imaginaria del ruido en las
seales de entrada y salida. N es el conjugado complejo de N, uk y yk son las
correspondientes desviaciones estndar, Nu y Ny indican los vectores formados por Nuk y Nyk
en las distintas frecuencias.

Substituyendo en (3.95) la variable ruido por Nuk =Umk-Uk y Nyk =Ymk-Yk , y haciendo el
logaritmo y asumiendo que u y y son conocidas, la funcin de mxima probabilidad es:

F
(U U k )(U mk U k ) F (Ymk Yk )(Ymk Yk )
ln( L(U , Y , P)) = cont mk (3.96)
k =1 2 uk2 k =1 2 uk2

La maximizacin de la ecuacin (3.95) se consigue minimizando la ecuacin (3.96) sujeto a la


restriccin (3.93).

F
(U mk U k )(U mk U k ) F (Ymk Yk )(Ymk Yk )
C LS ( L(U , Y , P)) = + (3.97)
k =1 2 uk2 k =1 2 2
uk

La restriccin (3.93) puede substituirse en (3.97) para eliminar Yk . Como resultado se obtiene
un problema de mnimos cuadrados con pesos no lineales. En general pero no se est
interesado en Uk , por lo tanto la mejor forma de minimizar la ecuacin (3.96) con la
restriccin (3.93) es utilizar la tcnica de multiplicadores de Lagrange para eliminarlos a
ambos (Uk y Yk ). En este caso la expresin a minimizar consiste en:

j T 2
1 F e
k d
N ( k , P)U mk D ( k , P)Ymk
C (P) = (3.98)
2 k =1 yk2 D ( k , P) 2 + uk2 N ( k , P) 2

donde N(,P) y D(,P) son el numerador y el denominador de la funcin de transferencia,


respectivamente.

La chi-cuadrada acostumbra a ser la funcin de coste ms utilizada en la resolucin del


mtodo de estimacin de mxima probabilidad para datos Gausianos. Para conseguir que la
funcin de coste (3.98) tienda a una distribucin chi-cuadrada se formulan distintas
alternativas, una de ellas es la expresada en la ecuacin (3.99) donde los pesos, W, han de ser
iguales a las variaciones de los trminos de los valores absolutos buscados.

3-22
1 F
j T 2
CWLS ( P) = Wtfk e k d U mk N ( k , P) Ymk D ( k , P) (3.99)
2 k =1

La minimizacin de est funcin se consigue de forma que:

e j k Td U mk N ( k , P) Ymk D ( k , P) = 0 (3.100)

El trmino residuo ser:


k = e j kTd U mk N ( k , P) Ymk D ( k , P) = 0

La variancia de este residuo ser igual a:

var { k } = 2 uk2 N ( k , P) + 2 2yk D ( k , P)


2 2

s Nuk y Nyk son independientes. Haciendo Wk =1/var{ k }, se obtiene que la funcin de coste
(3.99) consiste en la estimacin de un sistema lineal, denominado ELiS (Estimator for Linear
Systems).

Para minimizar la ecuacin (3.98) respecto a los parmetros P, deben utilizarse tcnicas no
lineales con restricciones y para ser utilizada, el usuario debe aportar el valor inicial del
retardo puro.

En el caso en que Nuk y Nyk no sean independientes por distintas razones:


- el sistema est en lazo cerrado.
- o hay ruido en la seal de entrada

la funcin coste a considerar es:

j T 2
1 F e k d N ( k , P)U mk D ( k , P)Ymk
C (P) = (3.101)
2 k =1 2yk D ( k , P) 2 + uk2 N ( k , P) 2 2real {CNDk }
con:
CNDk = c uyk e j k Td N ( k , P) D( k , P)
y
c uyk = 0.5 cov{Nuk , N yk } = 0.5 E{N uk , N yk }

3.9 Seleccin y validacin de la estructura del modelo


A dems de los mtodos de estimacin de los parmetros, otro aspecto muy importante es el
de buscar la estructura apropiada para el modelo (por ejemplo ver tabla 3.3). Para ello es
necesario entender los mtodos de estimacin o identificacin y conocer el sistema que se
desea identificar. Cuando la estructura del modelo ha sido determinada, los mtodos de
estimacin proporcionan un modelo particular de dicha estructura. Una vez identificado el
modelo otra cuestin a plantearse es si el modelo identificado es suficientemente bueno, para
ello se recurre a las tcnicas de validacin. Obsrvese que no siempre ser posible definir una
estructura del modelo, identificar los valores de los parmetros y validar de forma
independiente, sino al contrario las tres etapas estn muy interrelacionadas.

3-23
3.9.1 Seleccin de la estructura del modelo. Aspectos generales

La seleccin de la estructura del modelo tiene un considerable efecto sobre la cualidad del
modelo resultante y el coste de computacin. La cualidad del modelo puede, por ejemplo
evaluarse por el criterio del error cuadrtico. La mejor estructura del modelo es un
compromiso entre flexibilidad y ahorro. Entendiendo por flexibilidad que la estructura del
modelo tiene capacidad para describir diferentes sistemas y una forma de obtenerlo es
utilizando muchos parmetros. Por otro lado, el ahorro requiere la utilizacin de pocos
parmetros.

Para empezar a solucionar un problema de identificacin, cabe considerar tres aspectos


importantes:
* Tipos de conjuntos de modelos
* Dimensin del conjunto de modelos o seleccin del orden de los modelos
* Mtodos de identificacin

La seleccin del tipo dentro de un conjunto de modelos implica buscar entre diferentes clases
de modelos como entre modelos no lineares o lineares o entre modelos de entrada-salida, caja
negra o parametrizado fsicamente, y otros. La bsqueda de que tipo de modelo utilizar es un
poco subjetivo y involucra muchos factores que son independientes del conjunto de datos. La
bsqueda es habitualmente un compromiso entre diferentes factores, como cualidad del
modelo y esfuerzo de modelado. Para obtener unos buenos resultados con pocos parmetros,
suele utilizarse el conocimiento previo del proceso y algo de intuicin. La informacin previa
es muy til en el caso de modelos en tiempo continuo. La forma de evaluar (t,) y su
minimizacin influye mucho en el esfuerzo de programacin y el tiempo de clculo. Modelos
sofisticados suelen utilizarse solo en el caso de que no puedan ser validados los modelos
sencillos. Las regresiones lineales son los modelos ms simples y los que la minimizacin del
criterio es robusta. Cuando se realiza una transformacin no lineal de los datos puede ser
tambin evaluado con el ajuste de un modelo lineal.

La seleccin del orden del modelo implica la seleccin del nmero de parmetros de una
determinada clase de modelos. Este paso requiere usualmente alguna evaluacin del conjunto
de datos, de todas formas el conocimiento preliminar que se tiene del proceso muy a menudo
permite deducir un rango de ordenes del modelo a considerar.

La seleccin del mtodo de identificacin depende enormemente de la clase de modelo


seleccionado. Como se ha visto en apartados anteriores, un sistema lineal puede representarse
de diferentes formas, por su respuesta transitoria o frecuencial o modelo paramtrico.
Evidentemente podemos transformar unas en las otras, pero estas transformaciones estn muy
mal condicionadas en el sentido de que pequeos errores en una representacin pueden
originar mucho error en otra. La conclusin es clara, la bsqueda del mtodo est ntimamente
relacionada con el objetivo de la identificacin.

3.9.2 Anlisis preeliminareis de los datos para la seleccin de la estructura


del modelo
Ciertos tests o evaluaciones de los datos permiten deducir una posible estructura del modelo,
algunos de ellos han sido descritos en el tema 2. Estas tcnicas no conducen a la

3-24
determinacin completa del modelo del sistema. En el caso de mtodos paramtricos, el
problema se reduce a la seleccin del orden del modelo.

(1) La evaluacin del anlisis espectral estimado proporciona informacin sobre el rango de
frecuencias de inters del proceso y el nivel de ruido, por lo tanto no ayuda a disear
correctamente la seal de entrada y los filtros. La estimacin no paramtrica de la funcin
de transferencia G ( j ) proporciona informacin sobre los picos de resonancia y el
retardo de fase. Todo ello da una orientacin sobre el orden requerido par una adecuada
descripcin de las dinmicas del sistema (o la zona de inters).
(2) Evaluar el rango de la matriz de covarianza es un buen mtodo para estimar el orden del
sistema. Supngase que el sistema correcto se describe mediante:
y (t ) + a1 y( t 1) + L + a n y( t n) = b1u (t 1) + L + bn u (t n ) + v (t )
siendo n el verdadero orden del sistema. Si tomamos un modelo de orden s, el vector de
datos es:

( t ) = [ y (t ) y( t 1) L y( t s )u (t 1) Lu (t s ) ]
T

Considerando primero el caso en que v(t) 0, tenemos que la matriz de covarianza

1 N

R ( N ) =
N t =1
(t ) (t )
T

ser no singular para s n (en el caso que {u(t)} sea persistentemente excitada) y
singular para sn+1.

En el caso de ruido la matriz de convarianza puede ser utilizada siempre que la relacin
seal-ruido no sea muy grande, s es el caso puede utilizarse la frmula:

R ( N ) = R ( N ) 2 Rv

donde 2 Rv es la estimacin de la influencia del ruido del proceso en la matriz de


covarianza.
Una mejor alternativa, cuando la influencia de v(t) no es despreciable, es la de utilizar
otro vector de correlacin, por ejemplo en el caso en que {v(t)} y {u(t)} no estn
correlados (sistema en lazo abierto) podemos utilizar
( t ) = [u (t 1), u (t 2),L , u (t 2s ]
T

y por tanto la matriz de convarianza es

[
R ( N ) = E ( t ) T (t ) ]
es no singular para sn y singular para sn+1.

(3) El mtodo de correlacin es otro mtodo que permite obtener informacin acerca de que
variables incluir en la estructura del modelo. Esta variable podra ser y(t-n-1). La cuestin
que permite resolver es si una nueva variable contribuye de alguna forma en explicar la
variable de salida y(t). Ello puede realizarse mediante la correlacin entre la nueva
variable y la salida. De todas formas para descartar las posibles relaciones entre ellas, y
para conseguir estructuras de poca complejidad, la correlacin debera realizarse entra

3-25
ella y los residuos obtenidos como resultado de considerar un primer modelo
(t , ) = y (t ) y (t | ) . Ello se conoce con el nombre de correlacin parcial.

3.9.3 Criterios para la comparacin de la estructura de los modelos

Una aproximacin natural para determinar la estructura del modelo es simplemente testar
diferentes estructuras y comparar el resultado entre ellas. Los mtodos de tests ms
comnmente utilizados son:

* Test de la funcin error o prdida


* Test de cancelacin de polos y ceros
* Test del residuo

3.9.3.1 Test de la funcin error o prdida


El mtodo ms simple es mirar sencillamente la funcin prdida V ( ) directamente vinculada
con el orden del modelo. Cuando incrementa el orden la funcin prdida decrece hasta que se
mantiene constante o cambia lentamente. Otros mtodos se basan en test estadsticos de la
funcin prdida o en la evaluacin de diferentes criterios que tiene encuenta la complejidad
del modelo.

(1) Un mtodo estadstico para evaluar si la funcin prdida disminuye significativamente


cuando incrementa el orden del modelo es el F-test. Este test se basa en la independencia
estadstica de V 1 ( ) y V 1 ( ) V 2 ( ) donde los subndices indicap modelos con un nero
de parmetros p1 y p2 respectivamente. Para testar si la reduccin de la funcin es
significativa cuando el nmero de parmetros aumenta de p1 a p2 se utiliza:
V 1 ( ) V 2 ( ) N p2
t=
V 2 ( ) p1 p 2

Esta cantidad tiene una distribucin F[p1 - p2 , N - p2 ], entonces para un suficiente nmero
de muestras N, se cumple que: t > F [p1 - p2 , N - p2 ] entonces se cumple la hiptesis que
la reduccin de la funcin prdida es significativa con el aumento del nmero de
parmetros y por tanto el nuevo parmetro es aceptado con un nivel de confianza de 1- .
En la prctica, el nivel de confianza tiene un rango de 0.01 a 0.1.

(2) El criterio de anlisis de complejidad puede realizarse simplemente adicionado a la


funcin prdida un trmino extra que penalice la complejidad del modelo. En este caso se
selecciona el mejor modelo que minimice el criterio.

El criterio de informacin de Akaike (AIC) disminuye con la funcin prdida y aumenta


con el nmero de parmetros, se define como:

AIC ( p ) = N log V ( ) + 2 p
siendo:
1 N 2
V ( ) = (t, )
N t =1
Se ha observado que este criterio puede sobre estimar el orden del modelo.

3-26
Otro criterio propuesto por Akaike es final prediction error criterion (FPE):
N+ p
FPE( p) = V ( )
Np

Se ha observado que este criterio tiende a subestimar el modelo del sistema.

Una propiedad atractiva tanto del criterio de AIC como FPE es que el orden del modelo
se determina como resultado de valor mnimo del criterio y no es necesario evaluarlo en
funcin de unos niveles de confianza como es el caso del mtodo estadstico.

3.9.3.2 Test de cancelacin de polos-ceros


Si se considera que el orden del modelo es s y es superior al orden del proceso real n, originan
pares de polos-ceros muy prximos que pueden ser cancelados. Este fenmeno puede
utilizarse para testar el orden del modelo, calculando las races de los polinomios los cuales
A(q) y B(q) a partir de diferentes rdenes s.

3.9.3.3 Test de residuo


Resultado de comparar la salida con la prediccin del modelo:

(t , ) = y (t ) y (t , )

representa una forma de representar las diferencias entre las variables observadas y el
comportamiento del modelo estimado. En general los residuos deben ser blancos o
aproximadamente blancos y no correlados con la entrada, si el modelo es una buena
representacin del sistema. De lo contrario, indicara que o bien el modelo a la identificacin
no es completa.

La simple representacin de los residuos respecto a los valores ajustados; tal que la
representacin no revela ninguna dependencia clara. Otro diagrama til es el histograma de
los residuos, amplitudes, el cual revela si la distribucin difiere de una distribucin normal.

Otros tests tiles son los estudiados en el tema 2, test estadstico de auto correlacin de los
residuos (t), test de cross-correlacin entre los residuos y las entradas,

3.9.4 Validacin del modelo

La pregunta crucial una vez identificado un modelo es s este modelo es suficientemente


bueno para los objetivos considerados. La validacin permite comprobar s el modelo
identificado representa el comportamiento real, teniendo en cuenta las limitaciones de los
mtodos de identificacin y los objetivos finales. El problema planteado tiene distintos
aspectos:

1. El modelo, satisface suficientemente bien los datos observados?


2. Es el modelo suficientemente bueno para los requerimientos propuestos?
3. Describe el modelo al sistema real?

3-27
El mtodo para responder estas cuestiones es confrontar el modelo con ms informacin
como conocimientos a priori, datos experimentales y experiencia sobre el sistema real.

Puesto que el uso ms natural de la identificacin consiste en confrontar el modelo con los
datos, las tcnicas de identificacin tienden a centrarse en la pregunta 1. Mientras que la
pregunta 3, prescindiendo de los problemas de test, es filosficamente imposible de contestar,
la pregunta 2 es un requerimiento prctico importante. Evaluar si el problema que motivo la
tarea de modelizacin puede ser solucionado usando el modelo obtenido, puede considerarse
como la prueba ms importante de validacin del modelo. Por ejemplo, si un regulador
basado en el modelo satisface los requerimientos de control, entonces el modelo ser valido,
independientemente de la forma que tenga. No obstante, a menudo es imposible, costoso o
peligros probar todos los posible modelos con el uso que se ha previsto. Por ello, la confianza
en el modelo debe verificarse de otras maneras. Los dos mtodos principales son: la
verificacin de las asunciones a priori y la verificacin del comportamiento de la entrada-
salida.

3.9.4.1 Verification of a priori assumptions


Las pruebas de s las asunciones a priori de los mtodos de identificacin son ciertos puede
realizarse como:

* Linealizacin: Comparacin del modelo obtenido a partir de diferentes amplitudes


de la entrada. Comparacin de modelos con funciones transitorias medidas en ambas
direcciones.
* Varianza temporal. Comparacin del modelo con los diferentes conjuntos de datos.
* Residuos: Son los residuos estadsticamente independientes (auto correlacin), con
media cero?, Son independientes de la seal de entrada (correlacin cruzada con
respecto la seal de entrada?
* Medias, tendencias de la salida. Comparacin del modelo con y sin eliminacin de
las tendencias.
* Seal de entrada: Puede ser medida sin ruido? Es persistentemente excitada?.
* Matriz de covarianza de los parmetros estimados: la varianza y covarianza
decrementa con el incremento de nmero de muestras?

3.9.4.2 Verificacin del comportamiento de las entradas-salidas


Un juicio final del modelo identificado se obtiene comparando el comportamiento modelo
medido y predicho de la entrada-salida. Esto puede realizarse como:
* Comparacin de la variable medida y(t) y la seal de salida calculada y (t , ) :
- con la entrada u(t) utilizada en la identificacin,
- con otras seales de entrada como escalones o impulses.
* Comparacin de la funcin de correlacin cruzada basada en las seales medidas y
las del modelo.

Otra manera es validacin cruzada, esto significa la verificacin del modelo identificado con
otro conjunto de medidas. La comparacin entre los datos observados y la salida modelo se
muestra generalmente mirando las anomalas del modelo no detectadas previamente. La
validacin cruzada se considera la mejor manera de validar el modelo y la nica prueba
verdadera para su aplicabilidad general.

3-28
Bibliografa adicional sobre el tema
[strm 71] K. J. Astrom, P. Eykhoff. System Identification A survey. Automatica,7, p.
123-162, 1971

[strm80].K. J. Astrom, Maximum likelihood and prediction error methods. Automatica,16,


p. 551-574, 1980

[Bohlin94] Bohlin, T.: Interactive system identification: prospects and pitfalls, Springer
Verlag, 1991.

[Brdys94]Brdys, M. A. -Malinowski, K. : Computer aided control system design, World


Scientific, 1994.

[Evans92]Evans, D. C. -Rees, D. -Jones, D. L.: Design of test signals for identification of


linear systems with nonlinear distortion, IEEE Trans. on Instrumentation and Measurement,
.41, 6, p. 768- 774, 1992.

[Fasol80]Fasol, K. H. -Jorgl, H. P. : Principles of model building and identification,


Automatica, 16, p. 501-518, 1980.

[Godfrey80]Godfrey. K. R.: Correlation methods, Automatica, 16:, p. 527-534, 1980.

[Godfrey86]Godfrey, K. -Jones, P.: Signal processing for control, Springer-Verlag, 1986.

[Gustavsson72]Gustavsson, I: Comparison of different methods for identification of industrial


processes, Automatica, 6, p. 127-142, 1972

[Iserman80] R.. Iserman. Pranctial aspects of process identification, Automatica,16, p. 575-


587, 1980

[Johansson93] R. Johansson. System modeling and identification. Prentice Hall, 1993

[Kolls93] I. Kollr On Frecuency Domain Identification of Linear Systema IEEE Trans.


on Instrumentation and Measurement, Vol. 42 No 1, pp. 2-6, Feb. 1993.

[Landau90]Landau, I. D. : System identification and control design, Prentice Hall, 1990

[Ljung87] L.Ljung. System identification Theory for the user, Prentice Hall, 1987.

[Pintlon92] R. Pintelon, P. Guillaume, Y. Rolai and F. Verbeys, Identification of Linear


Systems Captured in a Feedback Loop IEEE Trans. on Instrumentation and Measurement,
Vol. 41, No 6, pp. 747-754, Dec 1992.

[Sderstrm89] T. Sderstrm, P. Stoica. System identification, Prentice Hall, 1989.

[Zhu93] Y. Zhu T. backx. Identification of multivariable idustrial process for simulation,


diagnosis and control. Springer-Verlag, 1993.

3-29
[Walter97]Walter, E Pronzato, L. Identification of Parametric Models from Experimental
Data. Masson Great Britain, 1997.

3-30

Das könnte Ihnen auch gefallen