Beruflich Dokumente
Kultur Dokumente
3.1 Introduccin
En este tema nos dedicaremos al estudio de los mtodos de estimacin de parmetros en el
dominio temporal y frecuencial. Estos se basan en el supuesto de que el sistema pueda
representarse por una parte determinista o causal y una parte estocstica que engloba las
dinmicas no modelizables del sistema. En general se asume que la parte estocstica puede ser
representada por una variable Gausiana.
Los mtodos de estimacin frecuenciales tienen diferentes ventajas y desventajas con respeto
a los mtodos temporales. Los ingenieros muchas veces prefieren la descripcin en el dominio
frecuencial por las siguientes razones [Kollr94]:
Mientras que la solucin de una ecuacin diferencial necesita la convolucin en el
dominio del tiempo, esta convolucin se sustituye por una simple multiplicacin en el
dominio de la frecuencia.
A menudo es posible descomponer la seal / ruido en diferentes bandas frecuenciales.
Con la seleccin adecuada de los coeficientes de Fourier en una banda de frecuencias
adecuada, es posible reducir el nmero de datos.
Es posible obtener un modelo continuo a partir de los datos.
Pequeas no linealidades pueden ser fcilmente mensurables y detectables en el dominio
de la frecuencia.
Por otro lado, trabajar en el dominio del tiempo tiene ventajas [Ljung91]:
Es ms natural trabajar con seales en el dominio temporal.
Son mtodos menos sensibles al tipo de seal de excitacin, los tcnicas frecuenciales
presentan problemas cuando estas no son peridicas.
3-1
Ciertas no linealidades son ms fciles de detectar, como es el caso de las saturaciones.
Pueden ser utilizados de forma recursiva.
Permiten medir directamente los transitorios del sistema.
En general, la base de todos los mtodos de estimacin consiste en minimizar unos residuos
(t), definiendo (t) como la diferencia entre el valor deseado de la salida, y(t), y el valor de
prediccin, y$ (t ) , que es funcin del modelo estimado. La minimizacin se realiza
generalmente utilizando un criterio cuadrtico. La metodologa de clculo a utilizar depender
de la relacin entre (t) y los parmetros que se quieren estimar. Cuando la relacin sea lineal
se podr utilizar un mtodo de clculo analtico, mientras que en el caso de una relacin no
lineal, el mtodo de clculo a utilizar ser iterativo.
Se debe decir que los modelos estimados, tanto en el dominio temporal como frecuencial,
sern modelos con dinmicas lineales. En la tabla 3.1 se muestran ms claramente estos
conceptos.
ERROR
DINMICA PROCESO
lineal no-lineal
respecto al coeficiente a$
= yw
Lineal y '+ ay = u = y '+ ay
$ u
w' +aw
$ =u
= y w
No-lineal y'+ay 3 = u = y '+ay
$ 3 u
w'+aw
$ 3=u
y (t ) = G ( q 1 )u ( t ) + H ( q 1 ) e( t ) (3.1)
3-2
- Modelos en que H(q-1 )=0
y( t ) = B (q 1 ) u( t nk ) + e( t ) (3.2)
1 1
donde: G ( q ) = B( q ) , nk representa el retardo puro del proceso y B(q ) es un polinomio de
-1
B ( q 1 ) = b0 + b1 q 1 + L+ bnb q nb (3.3)
Se les denomina tambin modelos de respuesta impulso finito (FIR). Tienen el inconveniente
que, para representar el comportamiento de un proceso, es necesario gran nmero de
coeficientes.
B (q 1 )
y( t ) = u( t nk ) + e( t ) (3.4)
F ( q 1 )
B ( q 1 ) nk
en este caso: G (q 1 ) = q , y F(q-1 ) es un polinomio autoregresivo de orden nf:
F (q 1 )
F ( q 1 ) = 1 + f 1q 1 +L+ f nf q nf (3.5)
A( q 1 ) y (t ) = B( q 1 )u (t nk ) + e ( t ) (3.6)
en este modelo se considera que la parte determinista y la parte estocstica tienen el mismo
denominador:
B( q 1 ) nk
G( q 1 ) = q
A(q 1 )
(3.7)
1
1
H (q ) =
A( q 1 )
El polinomio A(q-1 ) es el polinomio autoregresivo de orden na:
A ( q 1 ) = 1 + a 1q 1 +L + a n a q na (3.8)
A( q 1 ) y (t ) = B( q 1 )u (t nk ) + C ( q 1 ) e(t ) (3.9)
3-3
B( q 1 ) nk
1
G (q ) = q
A(q 1 )
(3.10)
C( q 1 )
1
H (q ) =
A( q 1 )
1
A( q 1 ) y ( t ) = q nk B ( q 1 )u (t ) + e (t ) (3.11)
D (q 1 )
C( q 1 )
A( q 1 ) y ( t ) = q nk B ( q 1 )u (t ) + e (t ) (3.12)
D (q 1 )
B( q 1 ) C (q 1 )
y( t ) = q nk u ( t ) + e (t ) (3.13)
F (q 1 ) D( q 1 )
Una propiedad particular de esta estructura es que G(q-1 ) y H(q-1 ) no tienen parmetros
comunes.
Toda esta familia de modelos se puede representar por el modelo general (3.14)
esquematizado en la figura 3.1.
1 nk
B( q 1 ) C( q 1 )
A( q ) y ( t ) = q u (t ) + e (t ) (3.14)
F ( q 1 ) D (q 1 )
e(t)
C (q 1 )
D(q 1 )
u(t) +
B ( q 1 ) 1 y(t)
q nk
F ( q 1 ) + A(q 1 )
3-4
Esta estructura es muy general, pero es til para elaborar algoritmos ya que sus resultados
cubren todos los casos especiales. La relacin entre modelos y los casos particulares se
exponen en la tabla 3.3.
Modelizacin de la parte determinista. Se observa que hay una relacin lineal entre el
error de prediccin y los coeficientes de los polinomios A y B, mientras que respecto a los
coeficientes del polinomio F la relacin es no lineal. Este hecho comporta que, para
estimar los parmetros del polinomio F, se debe utilizar un mtodo de clculo iterativo,
mientras que si solo es necesario estimar los parmetros de los polinomios A y B, los
mtodos de clculo a utilizar son analticos y, por tanto, ms sencillos.
3-5
y ( t ) = T ( t ) + v( t ) (3.16)
(3.17)
= [ a1 L a na b1 L bnb ]
El problema a resolver consiste en estimar el vector de parmetros, $ , partiendo de las N
observaciones realizadas: y(1), (1),...,y(N),(N).
d/N, = [ (1) ( 2) L ( N )] .
T
1 N 2 1 T 1
V ( ) = (t ) = =
2
(3.21)
2 t =1 2 2
1
2
[
min V ( ) = V ( ) = Y T Y Y T T T Y + T T ] (3.22)
La derivada de la funcin (3.22) respecto a los parmetros debe ser nula. Deducindose que el
valor de los parmetros que minimiza V ($ ) es:
( )
1
$ = T TY (3.23)
3-6
1
N N
$ = ( t )( t )T ( t ) y( t ) (3.24)
t =1 t =1
de la cual, conocido el orden del modelo: na, nb y nk, es fcilmente calculable el valor de sus
parmetros.
$2 =
2V $ () (3.27)
Nd
Resaltar como principal ventaja de este mtodo que la conversin a un mnimo global est
garantizada y no existen mnimos locales.
( )
1
$ = T TY
3-7
Resaltar como ventaja que la resolucin directa de esta ecuacin es sencilla y que los
clculos algebraicos a realizar son sencillos.
Consiste en multiplicar el sistema de ecuaciones original (4.19) por una matriz ortonormal Q:
Q = QY (3.28)
QY Q = Q (Y ) = (Y ) Q T Q (Y )
2 2 T
(3.29)
= (Y ) (Y ) = Y
T 2
donde R es una matriz cuadrada de dimensin d/d triangular por encima. La ecuacin (3.31)
se puede escribir como:
R
= QT (3.32)
0
L
QY = (3.33)
M
3-8
2
2 R L 2
V ($) = Q$ QY = $ = R$ L + M 2
(3.34)
0 M
R$ = L (3.35)
( ) = M = MTM
2
minV
$
(3.36)
1- el sistema lineal (3.35) est mejor condicionado que la ecuacin (3.23) y por tanto es
numricamente superior
Como inconvenientes destacar que requiere el doble de clculo que el mtodo directo.
A( q 1 ) y (t ) = B( q 1 )u (t nk ) + H ( q 1 )e (t ) (3.37)
Con estas nuevas seales filtradas de la entrada y la salida, el problema podra ser resuelto
aplicando el mtodo clsico de LS. Por lo tanto el mtodo GLS puede interpretarse como un
problema de estimacin de LS aplicando como criterio la generalizacin del error.
3-9
(1) Con el mtodo LS, hacer una primera estimacin de los polinomios A(q-1 ) y B(q-1 ):
A( q 1 ) y (t ) = B( q 1 )u (t nk ) + v (t ) (3.39)
(2) Analizar el residuo, (t), y determinar por ejemplo un modelo AR para aproximar H(q-1 ).
En este caso se tiene un modelo denominado ARARX (3.11).
1
G( q 1 ) =
D( q 1 ) (3.40)
D( q 1 ) ( t ) = e (t )
(3) Filtrar (blanquear) la entrada y la salida usando el modelo obtenido en la etapa (2):
~y (t ) = D (q 1 ) y( t )
(3.41)
u~(t ) = D( q 1 ) u( t )
(4) Hacer una nueva estimacin por mnimos cuadrados utilizando los seales filtrados.
Este proceso debe repetirse, a partir de la etapa (2), tantas veces como sea necesario hasta
conseguir la convergencia.
La convergencia del mtodo se evala comprobando que los residuos definidos obtenidos
sean blancos. Para ello puede utilizarse el test de auto correlacin. Para utilizarse este mtodo
deben definirse tanto el orden de la parte determinista como el orden de la parte estocstica.
Para simplificar el problema, la mayora de las veces se considera que son del mismo orden.
z ( t ) y (t ) = z ( t ) T ( t ) + z ( t ) v (t ) (3.42)
que se debe caracterizar por ser independiente del ruido v(t), pero dependiente de la entrada y
la salida del sistema. Esta propiedad permite plantear el siguiente sistema de ecuaciones
lineales:
[
z( t ) ( t ) = z( t ) y (t ) T ( t )$ ] (3.43)
3-10
El vector de parmetros que minimiza la funcin prdida (3.22) vale, en este caso:
( )
1
$ = Z T ZTY (3.44)
Para que $ converja a 0 es necesario que la variable instrumento tenga como propiedades:
1 N
N t=1
z ( t ) T ( t ) sea singular
(3.45)
1 N
z (t)v(t ) = 0
N t=1
En otras palabras, es necesario que la variable instrumento sea fuertemente dependiente del
vector regresin, (t), pero sea independiente del ruido.
Este mtodo, al igual que LS, presenta el inconveniente de que la matriz ZT puede estar mal
condicionada cuando su dimensin es grande. Por este motivo puede utilizarse la
triangulacin ortonormal para calcular el valor de los parmetros.
Si se considera un modelo con una estructura ARMAX, una forma de garantizar las
condiciones (3.45) es considerando un vector instrumento definido por:
z( t ) = L( q 1 )[ x ( t 1) x (t 2) L - x( t - na ) u( t 1) L u( t - nb) ]
T
(3.46)
donde L es un filtro lineal y x(t) se genera a partir del sistema lineal:
N ( q 1 ) x ( t ) = M ( q 1 ) u( t ) (3.47)
El problema consiste en determinar el filtro, L, y el modelo lineal, N(q-1 ) y M(q-1 ). Una forma
sencilla seria:
(1) Aplicar LS
(2) Utilizar el modelo estimado como polinomios N y M, y determinar x(t) con (3.47)
(3) Considerando L=1, definir z(t) segn (3.46) y estimar el vector de parmetros a partir de la
ecuacin (3.44).
y$ ( t / ) = T ( t)$ (3.48)
3-11
y se utiliza LS para estimar . A los parmetros estimados se les denomina $ (N1) . A partir
de los parmetros se obtiene la funcin de transferencia (3.49), donde los subndices
indican las iteraciones realizadas.
B$ ( 1) ( q)
G$ N(1) ( q ) = $ N( 1) (3.49)
AN ( q )
x (1) ( t ) = G$ N(1) (q 1 ) u( t )
(3.50)
z (1) ( t ) = [ x (1) ( t 1) K x (1) ( t na ) u (t 1) K u( t nb)]
T
La ecuacin (3.44) permite estimar un nuevo valor para los parmetros, y obtener la
correspondiente funcin de transferencia, G$ (N2 ) .
v$ N( 2) (t ) = A$ (N2) y (t ) B$ N( 2) u( t ) (3.51)
Considerando que el ruido se comporta como un modelo auto regresivo (AR) de orden d,
se estima, con el mtodo LS, el filtro L$ ( q 1 ) :
L$ ( q 1 ) v$ (N2 ) ( t ) = e (t ) (3.52)
(4) De la misma forma que en (3.50), se calcula de nuevo x (2)(t) pero considerando la funcin
de transferencia G$ (N2 ) . El vector instrumento ptimo viene dado por (3.53).
z (2 ) (t ) = L$ N ( q 1 )[ x ( 2) ( t 1) K x ( 2) ( t na ) u( t 1) K u( t nb) ]
T
(3.53)
Este nuevo instrumento junto con los filtros sirven para estimar el valor final de los
parmetros:
1 N
N ( 2)
N = z ( t ) FT
$ z ( 2)
( t ) y F (t )
t= 1 t =1 (3.54)
F ( t ) = L$ N ( q 1 ) (t ), y F ( t ) = L$ N ( q 1 ) y ( t )
3-12
1
1 $ N ( 2 ) N ( 2) T
P = N z ( t ) z (t )
N IV t =1 t =1
(3.55)
$N = [ y F ( t ) FT ( t )$N ]
1 N 2
N t =1
Z T Y = ( QZ ) Q$
T
(3.56)
Al descomponer la matriz Q en:
Q1
Q=
Q2
donde Q1 es una matriz cuadrada N/N. Puede definirse una matriz cuadrada y triangular por
encima Z1 = Q1 Z. Si se define la matriz 1 = Q1 y ya que Q2 Z = 0, la ecuacin (3.56) queda
transformada en:
Z T Y = Z1T1$ (3.57)
Z T Z = ( QZ ) QZ = Z1T Z1 + [ Q2 Z] Q2 Z = Z1T Z1
T T
(3.58)
El error de modelizacin vendr dado en este caso por el producto Q2 Y y la funcin prdida
queda definida como:
minV
$
( ) = Q2 Y
2
= ( Q2 Y ) T
Q2 Y (3.60)
Cabe resaltar como ventaja de esta metodologa de clculo dos aspectos: que el sistema
lineal (3.59) est mejor condicionado que la ecuacin (3.44) y por tanto es numricamente
superior y que la funcin prdida se calcula sin la necesidad de estimar el valor de sus
parmetros.
Como inconvenientes debe destacase que requiere el doble de clculo que el mtodo
directo y complica mucho el mtodo IV ptimo.
3-13
las observaciones. La estimacin de la mxima probabilidad significa que se selecciona el
valor de los parmetros que coinciden ms probablemente con las observaciones.
Supongamos que las observaciones estn representadas por un vector de variables Random
Y=[y1 , y2 , ..., yn ]T y indicamos la funcin de densidad de probabilidad como:
Si consideramos un modelo genrico dado por la ecuacin (3.16) y considerando que v(t) es
una seal Gausiana, con una distribucin normal y de N elementos, concretamente de media
E[v]=0 y covariancia E[vv T ]=Cv conocida. La funcin de probabilidad de esta seal viene dada
por la expresin:
[
f (v ) = (2 ) det (Cv )
N
]
1 / 2 1 T 1
exp v Cv v (3.64)
2
[
f (v ) = (2 ) det (C v )
N
]
1 / 2 1 T 1
exp [Y ] Cv [Y ] (3.65)
2
2
[
N
2
T
]
log L ( ) = log (2 ) det (Cv ) [Y ] Cv1 [Y ]
1 1
(3.66)
Por lo tanto evaluando el mximo de esta funcin se estimar el valor de los parmetros . En
el caso en que el ruido corresponda a un ruido blanco con una matriz de covariancia Cv =2 I,
es fcil demostrar que la maximizacin de la funcin de mxima probabilidad (3.66) es
equivalente a minimizar la funcin prdida:
V ( ) =
1
[Y ]T [Y ] = 2 log L( ) + constant (3.67)
2
3-14
Consideremos el caso de un sistema ARMAX (3.9) donde el ruido se supone que tiene una
distribucin normal y una matriz de covariancia conocida. En este caso la funcin del
logaritmo de probabilidad ser:
2
N
[
log L ( ) = log (2 ) det (Cv ) T C v1
1 1
2
] (3.68)
donde:
(t ) = y (t ) T (t ) ,
[
= a1 ,..., an , b1 ,...., bm , c1 ,..., c p ]
( t) = [ y (t 1),..., y (t n ), u (t 1),...., u( t m), v( t 1),..., v (t p) ] .
El problema en este caso es que v(t-1), ..., v(t-p) no son conocidos. Por lo tanto, en estas
circunstancias, la solucin solo es posible haciendo soluciones aproximadas (mtodo
iterativo) para conseguir a cada paso una mejor estimacin de la matriz de covariancia y de
los parmetros. Para ms detalles [Johansson93] y [strm80].
(t ) = y( t ) y (t t 1; ) (3.70)
Para la formalizacin del mtodo se introduce la siguiente estructura general del modelo:
y (t ) = G( q 1 ; ) u( t ) + H ( q 1; )v (t ) (3.71)
Asumiendo que G(0;)=0, equivale a decir que el modelo tiene como mnimo un retardo puro
de una muestra entre entrada y salida. La forma general de expresar un predictor consiste en:
y (t | t 1; ) = L1 ( q 1; ) y (t ) + L2 ( q 1 ; )u (t ) (3.72)
3-15
la cual es una funcin de los datos anteriores, t-1, solo s los filtros de prediccin tienen como
restriccin: L1 (0;)=0 y L2 (0;)=0.
Hay varias formas de escribir el modelo (3.71) y determinar el predictor. Una vez definido el
modelo y el predictor, se calculan los errores de prediccin a partir de la ecuacin (3.70). La
estimacin de los parmetros, , se calcula de tal forma que los errores de prediccin sean
pequeos. El principio bsico de este mtodo se ilustra en la figura 3.1.
v(t)
u(t) + y(t)
PROCESO
+
+ (t)
Predictor -
(parmetros )
Minimizacin
de (t)
Para definir el mtodo de prediccin de error el usuario debe realizar las siguientes
elecciones:
(1) Elegir la estructura del modelo. Esto concierne a la parametrizacin de G(q;) y H(q;)
en (3.71) como una funcin de . Por razones algoritmicas, la funcin de transferencia se
factoriza en polinomios en el numerador y en el denominador. En el contexto de la
identificacin, tal como se ha descrito en el apartado 3.2.1., hay distintos modelos de
parametrizacin: OEM, BJM, ...
(2) Elegir el predictor. Esto concierne a los filtros, L1 (q;) y L2 (q;) en la ecuacin (3.72),
una vez el modelo ha sido especificado. Estos filtros pueden ser seleccionados de distintas
formas. La forma ms utilizada es optimal mean square predictor. Esto significa que los
filtros son seleccionados de manera que bajo unas condiciones dadas del modelo los
errores de prediccin tienen la menor variancia posible.
En el caso del modelo general considerado en (3.71), el predictor ptimo seria:
[ ]
)y (t ) = 1 H 1 ( q 1 ; ) y (t ) + H 1 ( q 1 ; )G( q 1; )u (t ) (3.73)
El error de prediccin se determina de forma similar:
[ ]
(t ) = y (t ) )y (t ) = y (t ) 1 H 1 ( q 1 ; ) y (t ) + H 1 ( q 1 ; ) G( q 1 ; ) u( t ) (3.74)
(3) Elegir el criterio. Este se refiere a elegir una funcin que origine un valor escalar de todos
los errores de prediccin (1,), ..., (N,). Este criterio ser minimizado con respecto a
3-16
de manera que se realice la mejor prediccin. En el caso de una salida el criterio (funcin
error) puede definirse como una suma de cuadrados del error de prediccin, mientras que
en el caso de sistemas multi-variables como una proyeccin escalar de la matriz de
covariancia
1 N
V ( ) = h (t ; ) T (t ; ) (3.75)
N t=1
donde h() es una funcin de valor escalar y, generalmente, consiste en la traza de los pesos
de la matriz de covariaza o su determinante.
El anlisis del mtodo de prediccin de error muestra que la funcin perdida converge a un
mnimo y la estimacin es consistente cuando se satisfacen las siguientes condiciones:
En muchos casos el mnimo de V() no puede ser hallado de forma analtica. En estos casos la
minimizacin debe realizarse utilizando una rutina de clculo numrico. El mtodo ms
usualmente utilizado es el algoritmo de Newton-Raphson:
[ ( )] V ' ( )
( k +1) = ( k ) k V ' ' (k )
1 (k) T
(3.76)
Los modelos estimados con estos mtodos se adaptan fcilmente a los sistemas variantes
en el tiempo. Ellos permiten que el modelo siga los cambios de parmetros del sistema o
cambios debidos a condiciones de operacin en el caso de sistemas no lineales.
3-17
Los requerimientos de memoria son reducidos y no aumentan en el tiempo, debido a que
no se almacenan todos los datos.
Ellos se han derivado de una aproximacin de los mtodos no recursivos descritos
anteriormente.
Para deducir el mtodo de mnimos cuadrados recursivo (RLS) se parte de la ecuacin (3.24)
1
t t
( t ) = (k ) T ( k ) ( k ) y (k ) (3.77)
k =1 k =1
Para calcular esta expresin de forma recursiva se introduce como nueva notacin:
1
t
P(t ) = ( k ) T ( k ) (3.78)
k =1
P 1 (t ) = P 1 (t 1) + ( k ) T (k ) (3.79)
t1
( t ) = P( t ) (k ) y ( k ) + (t ) y (t )
k =1 (3.80)
[
= P( t ) P 1 (t )( t 1) + (t ) y( t )]
Por lo tanto el mtodo de mnimos cuadrados recursivos adopta la forma:
[
( t ) = ( t 1 ) + P( t )( k ) y( t ) T ( k ) ( t 1 )] (3.81)
donde el ltimo valor puede ser interpretado como el error de prediccin, mientras que el
factor de correccin (P(t)(t)) puede ser considerado como un peso o factor de ganancia
determinado como el error de prediccin modifica los elementos del vector de parmetros
estimado.
El hecho de calcular P(t) en la ecuacin 3.79 requiere invertir una matriz a cada paso de
iteracin. Utilizando el lema [A + BCD]1 = A1 A 1 B[DA1 B + C 1 ]1 DA1 y
1
considerando A = P ( t 1 ), B = D y C = 1 se obtiene una expresin ms eficiente:
T
P( t ) = P( t 1 ) + K T ( k ) P( t 1 ) (3.82)
donde
[
K = P( t 1 )( t ) / 1 + T ( k )P( t 1 ) ( t ) ] (3.83)
3-18
que da como resultado una ganancia. La expresin de mnimos cuadrados recursivos queda
por tanto:
[ ]
( t ) = ( t 1 ) + K ( t ) y( t ) T ( k ) ( t 1 ) (3.84)
Los algoritmos recursivos requieren aproximar el valor inicial del vector de parmetros y de
la matriz P(t). Si es posible realizar una primera estimacin del vector de los parmetros (por
ejemplo utilizando LS norecursivo) los la matriz P(0) debe reflejar la confianza de los
parmetros estimados. En el caso en que P(0) sea pequeo K(t) ser pequeo para los distintos
t y los parmetros estimados no variaran mucho del valor inicial. Mientras que, si P(0) es
grande la estimacin de los parmetros variar rpidamente del valor inicial. En ausencia de
informacin previa para realizar una primera estimacin de los parmetros, se acostumbra a
considerar: ( 0 ) = 0 y P( 0 ) = I , donde es un nmero grande.
t
V ( ) = t k 2 ( k ) (3.85)
k =1
Por lo tanto el algoritmo de mnimos cuadrados recursivos con factor de olvido es:
[ ]
( t ) = ( t 1 ) + K ( t ) y( t ) T ( k ) ( t 1 ) (3.86)
K = P( t 1 )( t ) / [ + ( k ) P( t 1 )( t )]
T
(3.87)
P( t ) = [P( t 1 ) + K ( k )P( t 1 )] /
T
(4.88)
Para = 1 coincide con el mtodo de mnimos cuadrados comn.
3-19
( t ) = ( t 1 ) + K ( t ) ( t ) (3.89)
K = ( t )P( t 1 ) ( t ) (3.90)
( t ) = y( t ) T ( t )P( t 1 ) ( t ) (3.91)
En la siguiente tabla se observan los valores de los parmetros, vector de datos y vector de
correccin para el caso de los mtodos: mnimos cuadrados (RLS), mtodo de la variable
instrumento recurdivo (RIV) y el mtodo de la mxima probabilidad recursivo (RML). En el
caso de incluirse el factor de olvido es necesario realizar las siguientes modificaciones:
En Iserman (1991) se realiza una comparacin entre estos tres mtodos con respecto a las
caractersticas del estimador, su convergencia y el esfuerzo computacional. Las propiedades
de estos tres mtodos se resumen a continuacin:
RIV: Tiene unas buenas prestaciones. Para acelerar la convergencia inicial se recomienda
empezar con RLS. Esfuerzo computacional mayor que RLS.
RML: Altas prestaciones del estimador. Lenta convergencia en la etapa inicial. Se estiman los
parmetros del ruido, pero la convergencia es lenta. El esfuerzo computacional es mayor que
en los otros dos.
]
1 n 1 m 1 n 1 m
T
c1 L c p
(t ) [ y( t 1 )L y( t n ) [ y( t 1 )L y( t n ) [ y( t 1 )L y( t n )
u ( t 1 ) L u ( t m )] u ( t 1 ) L u ( t m )] u ( t 1 )L u ( t m )
T T
( t 1 )L ( t p )]
T
( t ) 1 1 1
1 + ( t )P( t 1 ) ( t ) 1 + ( t ) P( t 1 ) ( t ) 1 + ( t ) P( t 1 ) ( t )
T T T
P(t) [ ] [ ] [
I K ( t ) T ( t ) P ( t 1 ) I K ( t ) T ( t ) P ( t 1 ) I K ( t ) T ( t ) P ( t 1 ) ]
(t) (t ) [
[ ( t 1 )L ( t n ) y' ( t 1 )L y' ( t n )
u ( t 1 )L u( t m )] u ' ( t 1 )L u ' ( t m )
T
' ( t 1 )L ' ( t p ) ] T
3-20
3.8 Mtodos de estimacin paramtricos frecuenciales
El objetivo de los mtodos de identificacin en el dominio frecuencial es el mismo que en el
dominio temporal: identificar un sistema lineal a partir de los datos. La principal diferencia
entre ambos radica en el dominio de trabajo. De todas formas los dos mtodos son
complementarios y, en algunos casos, ambos pueden utilizarse para solucionar el mismo
problema. Analizamos a continuacin, en que condiciones ambos mtodos identifican el
mismo sistema.
Ny
U H() +
Y Ym
Nu +
Um
j T d
b 0 0 + b 1 1 + L + b nn nn
H () = e (3.92)
a 0 0 + a 1 1 + L + a nd nd
Las medidas se realizan a distintas frecuencias k , k=1...F, las amplitudes de las entradas y
salidas son Umk y Ymk, respectivamente. Los parmetros no conocidos de la funcin de
transferencia se indican con el vector P. Con todo ello las ecuaciones bsicas son:
3-21
Asumiendo que el ruido en las amplitudes complejas es Gausiana y no correlacionado, y que
el ruido de la entrada y la salida no estn tampoco correlacionados, su funcin de densidad
probabilstica puede escribirse como:
1 N Ruk
2
+ N Iuk
2
F 1 N Ryk2
+ N Iyk
2
p (N u , N y ) = exp
exp
k =1 2 uk 2 uk2
k =1 2 yk 2 yk2
2 2
(3.95)
1 Nuk N uk F 1 N yk N yk
= exp exp
k =1 2 uk
2 uk
2 2 2 2
k =1 2 yk 2 yk
donde NRuk , NIuk , NRyk y NIyk se corresponde con las partes real y imaginaria del ruido en las
seales de entrada y salida. N es el conjugado complejo de N, uk y yk son las
correspondientes desviaciones estndar, Nu y Ny indican los vectores formados por Nuk y Nyk
en las distintas frecuencias.
Substituyendo en (3.95) la variable ruido por Nuk =Umk-Uk y Nyk =Ymk-Yk , y haciendo el
logaritmo y asumiendo que u y y son conocidas, la funcin de mxima probabilidad es:
F
(U U k )(U mk U k ) F (Ymk Yk )(Ymk Yk )
ln( L(U , Y , P)) = cont mk (3.96)
k =1 2 uk2 k =1 2 uk2
F
(U mk U k )(U mk U k ) F (Ymk Yk )(Ymk Yk )
C LS ( L(U , Y , P)) = + (3.97)
k =1 2 uk2 k =1 2 2
uk
La restriccin (3.93) puede substituirse en (3.97) para eliminar Yk . Como resultado se obtiene
un problema de mnimos cuadrados con pesos no lineales. En general pero no se est
interesado en Uk , por lo tanto la mejor forma de minimizar la ecuacin (3.96) con la
restriccin (3.93) es utilizar la tcnica de multiplicadores de Lagrange para eliminarlos a
ambos (Uk y Yk ). En este caso la expresin a minimizar consiste en:
j T 2
1 F e
k d
N ( k , P)U mk D ( k , P)Ymk
C (P) = (3.98)
2 k =1 yk2 D ( k , P) 2 + uk2 N ( k , P) 2
3-22
1 F
j T 2
CWLS ( P) = Wtfk e k d U mk N ( k , P) Ymk D ( k , P) (3.99)
2 k =1
e j k Td U mk N ( k , P) Ymk D ( k , P) = 0 (3.100)
s Nuk y Nyk son independientes. Haciendo Wk =1/var{ k }, se obtiene que la funcin de coste
(3.99) consiste en la estimacin de un sistema lineal, denominado ELiS (Estimator for Linear
Systems).
Para minimizar la ecuacin (3.98) respecto a los parmetros P, deben utilizarse tcnicas no
lineales con restricciones y para ser utilizada, el usuario debe aportar el valor inicial del
retardo puro.
j T 2
1 F e k d N ( k , P)U mk D ( k , P)Ymk
C (P) = (3.101)
2 k =1 2yk D ( k , P) 2 + uk2 N ( k , P) 2 2real {CNDk }
con:
CNDk = c uyk e j k Td N ( k , P) D( k , P)
y
c uyk = 0.5 cov{Nuk , N yk } = 0.5 E{N uk , N yk }
3-23
3.9.1 Seleccin de la estructura del modelo. Aspectos generales
La seleccin de la estructura del modelo tiene un considerable efecto sobre la cualidad del
modelo resultante y el coste de computacin. La cualidad del modelo puede, por ejemplo
evaluarse por el criterio del error cuadrtico. La mejor estructura del modelo es un
compromiso entre flexibilidad y ahorro. Entendiendo por flexibilidad que la estructura del
modelo tiene capacidad para describir diferentes sistemas y una forma de obtenerlo es
utilizando muchos parmetros. Por otro lado, el ahorro requiere la utilizacin de pocos
parmetros.
La seleccin del tipo dentro de un conjunto de modelos implica buscar entre diferentes clases
de modelos como entre modelos no lineares o lineares o entre modelos de entrada-salida, caja
negra o parametrizado fsicamente, y otros. La bsqueda de que tipo de modelo utilizar es un
poco subjetivo y involucra muchos factores que son independientes del conjunto de datos. La
bsqueda es habitualmente un compromiso entre diferentes factores, como cualidad del
modelo y esfuerzo de modelado. Para obtener unos buenos resultados con pocos parmetros,
suele utilizarse el conocimiento previo del proceso y algo de intuicin. La informacin previa
es muy til en el caso de modelos en tiempo continuo. La forma de evaluar (t,) y su
minimizacin influye mucho en el esfuerzo de programacin y el tiempo de clculo. Modelos
sofisticados suelen utilizarse solo en el caso de que no puedan ser validados los modelos
sencillos. Las regresiones lineales son los modelos ms simples y los que la minimizacin del
criterio es robusta. Cuando se realiza una transformacin no lineal de los datos puede ser
tambin evaluado con el ajuste de un modelo lineal.
La seleccin del orden del modelo implica la seleccin del nmero de parmetros de una
determinada clase de modelos. Este paso requiere usualmente alguna evaluacin del conjunto
de datos, de todas formas el conocimiento preliminar que se tiene del proceso muy a menudo
permite deducir un rango de ordenes del modelo a considerar.
3-24
determinacin completa del modelo del sistema. En el caso de mtodos paramtricos, el
problema se reduce a la seleccin del orden del modelo.
(1) La evaluacin del anlisis espectral estimado proporciona informacin sobre el rango de
frecuencias de inters del proceso y el nivel de ruido, por lo tanto no ayuda a disear
correctamente la seal de entrada y los filtros. La estimacin no paramtrica de la funcin
de transferencia G ( j ) proporciona informacin sobre los picos de resonancia y el
retardo de fase. Todo ello da una orientacin sobre el orden requerido par una adecuada
descripcin de las dinmicas del sistema (o la zona de inters).
(2) Evaluar el rango de la matriz de covarianza es un buen mtodo para estimar el orden del
sistema. Supngase que el sistema correcto se describe mediante:
y (t ) + a1 y( t 1) + L + a n y( t n) = b1u (t 1) + L + bn u (t n ) + v (t )
siendo n el verdadero orden del sistema. Si tomamos un modelo de orden s, el vector de
datos es:
( t ) = [ y (t ) y( t 1) L y( t s )u (t 1) Lu (t s ) ]
T
1 N
R ( N ) =
N t =1
(t ) (t )
T
ser no singular para s n (en el caso que {u(t)} sea persistentemente excitada) y
singular para sn+1.
En el caso de ruido la matriz de convarianza puede ser utilizada siempre que la relacin
seal-ruido no sea muy grande, s es el caso puede utilizarse la frmula:
R ( N ) = R ( N ) 2 Rv
[
R ( N ) = E ( t ) T (t ) ]
es no singular para sn y singular para sn+1.
(3) El mtodo de correlacin es otro mtodo que permite obtener informacin acerca de que
variables incluir en la estructura del modelo. Esta variable podra ser y(t-n-1). La cuestin
que permite resolver es si una nueva variable contribuye de alguna forma en explicar la
variable de salida y(t). Ello puede realizarse mediante la correlacin entre la nueva
variable y la salida. De todas formas para descartar las posibles relaciones entre ellas, y
para conseguir estructuras de poca complejidad, la correlacin debera realizarse entra
3-25
ella y los residuos obtenidos como resultado de considerar un primer modelo
(t , ) = y (t ) y (t | ) . Ello se conoce con el nombre de correlacin parcial.
Una aproximacin natural para determinar la estructura del modelo es simplemente testar
diferentes estructuras y comparar el resultado entre ellas. Los mtodos de tests ms
comnmente utilizados son:
Esta cantidad tiene una distribucin F[p1 - p2 , N - p2 ], entonces para un suficiente nmero
de muestras N, se cumple que: t > F [p1 - p2 , N - p2 ] entonces se cumple la hiptesis que
la reduccin de la funcin prdida es significativa con el aumento del nmero de
parmetros y por tanto el nuevo parmetro es aceptado con un nivel de confianza de 1- .
En la prctica, el nivel de confianza tiene un rango de 0.01 a 0.1.
AIC ( p ) = N log V ( ) + 2 p
siendo:
1 N 2
V ( ) = (t, )
N t =1
Se ha observado que este criterio puede sobre estimar el orden del modelo.
3-26
Otro criterio propuesto por Akaike es final prediction error criterion (FPE):
N+ p
FPE( p) = V ( )
Np
Una propiedad atractiva tanto del criterio de AIC como FPE es que el orden del modelo
se determina como resultado de valor mnimo del criterio y no es necesario evaluarlo en
funcin de unos niveles de confianza como es el caso del mtodo estadstico.
(t , ) = y (t ) y (t , )
representa una forma de representar las diferencias entre las variables observadas y el
comportamiento del modelo estimado. En general los residuos deben ser blancos o
aproximadamente blancos y no correlados con la entrada, si el modelo es una buena
representacin del sistema. De lo contrario, indicara que o bien el modelo a la identificacin
no es completa.
La simple representacin de los residuos respecto a los valores ajustados; tal que la
representacin no revela ninguna dependencia clara. Otro diagrama til es el histograma de
los residuos, amplitudes, el cual revela si la distribucin difiere de una distribucin normal.
Otros tests tiles son los estudiados en el tema 2, test estadstico de auto correlacin de los
residuos (t), test de cross-correlacin entre los residuos y las entradas,
3-27
El mtodo para responder estas cuestiones es confrontar el modelo con ms informacin
como conocimientos a priori, datos experimentales y experiencia sobre el sistema real.
Puesto que el uso ms natural de la identificacin consiste en confrontar el modelo con los
datos, las tcnicas de identificacin tienden a centrarse en la pregunta 1. Mientras que la
pregunta 3, prescindiendo de los problemas de test, es filosficamente imposible de contestar,
la pregunta 2 es un requerimiento prctico importante. Evaluar si el problema que motivo la
tarea de modelizacin puede ser solucionado usando el modelo obtenido, puede considerarse
como la prueba ms importante de validacin del modelo. Por ejemplo, si un regulador
basado en el modelo satisface los requerimientos de control, entonces el modelo ser valido,
independientemente de la forma que tenga. No obstante, a menudo es imposible, costoso o
peligros probar todos los posible modelos con el uso que se ha previsto. Por ello, la confianza
en el modelo debe verificarse de otras maneras. Los dos mtodos principales son: la
verificacin de las asunciones a priori y la verificacin del comportamiento de la entrada-
salida.
Otra manera es validacin cruzada, esto significa la verificacin del modelo identificado con
otro conjunto de medidas. La comparacin entre los datos observados y la salida modelo se
muestra generalmente mirando las anomalas del modelo no detectadas previamente. La
validacin cruzada se considera la mejor manera de validar el modelo y la nica prueba
verdadera para su aplicabilidad general.
3-28
Bibliografa adicional sobre el tema
[strm 71] K. J. Astrom, P. Eykhoff. System Identification A survey. Automatica,7, p.
123-162, 1971
[Bohlin94] Bohlin, T.: Interactive system identification: prospects and pitfalls, Springer
Verlag, 1991.
[Ljung87] L.Ljung. System identification Theory for the user, Prentice Hall, 1987.
3-29
[Walter97]Walter, E Pronzato, L. Identification of Parametric Models from Experimental
Data. Masson Great Britain, 1997.
3-30