Control Robusto
Short Description
Download Control Robusto...
Description
Captulo 8 El problema del control robusto 8.1 Introduccion Las caractersticas del dise~no de un sistema de control van a depender en gran medida, de la delidad con la que el modelo empleado describa el comportamiento del sistema. Uno de los principios del modelado de sistemas es el de simpli cacion; consistente en que de la forma mas simple posible el modelo capte los rasgos fundamentales bajo analisis del proceso. Un proceso real puede ser extremadamente complejo para ser descrito de forma absolutamente precisa por un modelo matematico, en cuyo caso se habla de errores de modelado. Si se a~nade el hecho de que se trata de describir al sistema con un modelo lineal e invariante en el tiempo, ello implica otro conjunto de hipotesis simpli cadoras que incrementan los errores de modelado originales o residuales. Se puede considerar por tanto, que cualquier modelo matematico de un proceso real va a ser en mayor o menor grado impreciso, o dicho de otra forma va a contar con incertidumbres o errores de modelado. Si se desea controlar de manera e ciente un proceso real, se debera de tener informacion sobre las posibles fuentes de incertidumbres, evaluando su efecto sobre el comportamiento del sistema completo. La necesidad de cumplir unas especi caciones de dise~no cada vez mas exigentes, ha llevado a tener en consideracion aspectos de importancia practica en el desarrollo 159
160
Introduccion
de los sistemas de control. De forma que el comportamiento del sistema se mantenga aceptable en un ambiente realista, en el que las incertidumbres van a estar siempre presentes. Entre los principales factores causantes de los errores de modelado pueden destacarse: 1. Modi caciones en el punto de trabajo de la planta o con respecto al modelo nominal. 2. Dinamica no lineal no considerada. 3. Dinamica de alta frecuencia no modelada. 4. Retardos de tiempo no contemplados. 5. Imprecisiones en los parametros, debidas al metodo de identi cacion y/o modelado empleado. Estos factores se pueden agrupar en dos grandes grupos: las incertidumbres parametricas (1) y (5) y las estructurales (2), (3) y (4). Con respecto al conocimiento disponible sobre las causas de las incertidumbres puede distinguirse entre incertidumbre estructurada y no estructurada. En el caso de incertidumbre no estructurada solo se conoce que existen discrepancias entre el modelo y la planta real, y posiblemente puede conocerse tambien el tama~no de las desviaciones de determinadas medidas entrada/salida (por ejemplo, la discrepancia en la respuesta frecuencial causada por la dinamica de alta frecuencia no modelada y/o diferencia en la respuesta temporal debido a la no consideracion de un elemento no lineal). Si se conoce de la incertidumbre que en cierta medida se debe a algunos elementos diferenciados de la planta, en la forma de tolerancias de sus valores (por ejemplo, la incertidumbre en el valor de un polo y/o un cero), en ese caso se trata de una incertidumbre estructurada. Es posible tambien, que se tenga un conocimiento parcial y separado de las fuentes de incertidumbre, en cuyo caso tambien podra hablarse de incertidumbre parcialmente estructurada (por ejemplo, el hecho practico de que las incertidumbres existentes en distintos actuadores sean independientes entre s). A la hora de plantearse el dise~no de un sistema de control robusto para un proceso con incertidumbres, surgen una serie de cuestiones escalonadas:
El problema del control robusto
161
1. Como modelar tales procesos. 2. Como analizar el sistema de control. 3. Como dise~nar el controlador. Para resolver los 3 puntos anteriores, se hace necesario la introduccion de nuevos conceptos y herramientas de calculo para el analisis y dise~no de sistemas de control. El campo de aplicacion de esta nueva disciplina denominada control robusto, abarca todos aquellos problemas que se caractericen por considerar incertidumbres en el modelo que sean tolerables por un controlador jo lineal e invariante en el tiempo; limitando con aquellos que necesitan un controlador variable (control adaptativo, control por plani cacion de la ganancia). Los objetivos de control tratan en cualquier caso, de que el controlador dise~nado funcione bien cuando se implante en el proceso real. Este objetivo, a su vez puede considerarse compuesto en una serie de subobjetivos. De estos, el principal es que el sistema sea estable en lazo cerrado, para unas condiciones de trabajo dadas o nominales. Es lo que se denomina Estabilidad Nominal (NS). Por otro lado, una vez conseguida la estabilidad es necesario que ciertas variables del sistema presenten un comportamiento adecuado y en algunos casos optimo respecto a una funcion de costes o ndice de comportamiento. Esto se tiene en cuenta referenciandolo como Comportamiento Nominal (NP). Es tambien muy importante, de cara a la aplicacion industrial, que se tenga en cuenta en el dise~no el conocimiento que se posea de la incertidumbre en el modelo. Otro requerimiento que se va pedir a un sistema de control es que sea estable en lazo cerrado, para el conjunto de posibles plantas que se puedan dar como consecuencia de la incertidumbre en el modelo de la planta. El objetivo perseguido se denomina Estabilidad Robusta (RS). Si ademas se considera que para todas las plantas posibles no basta con que el sistema de control permanezca estable sino que han de cumplirse unas especi caciones de funcionamiento, se considerara que se esta aludiendo al concepto de Comportamiento Robusto (RP). En la gura 8.1 queda resumido el problema de dise~no y los diferentes niveles de exigencia que se establecen sobre un sistema de control, tal y como se ha descrito anteriormente. El control de sistemas con incertidumbres entra dentro del campo de estudio de la
162
Introduccion
PROCESO REAL
-
Complejo
? Simpli caciones
?
?
Modelo matematico
Incertidumbres
-
?
Sistema de Control
?
Comportamiento ? Robusto Estabilidad (RP) ? Comportamiento Robusta (RS) ? Estabilidad Nominal (NP) Nominal (NS)
Figura 8.1: Planteamiento del problema de control
El problema del control robusto
163
disciplina conocida como Control Robusto. La decada de los ochenta se considera el perodo de desarrollo de dicha teora, pudiendose destacar entre otros los desarrollos teoricos realizados durante este perodo: 1) Metodos H1 (Zames y Francis, 1983; Doyle et al, 1989); 2) metodos LTR (Loop Transfer Recovery) (Doyle y Stein, 1981, Stein y Athans, 1987); 3) metodo de dise~no IMC (Internal Model Control) (Morari et al, 1989); 4) metodos de Kharatinov (Barmish, 1993); 5) metodo de Sntesis- (Balas et al, 1991); 6) metodo GPC (Generalized Predictive Control) (Clarke et al, 1989); 7) metodo QFT (Quantitative Feedback Theory) (Horowitz, 1982). Las principales aplicaciones de la teora de control robusto realizadas en los ultimos a~nos se han llevado a cabo en las areas de control de procesos qumicos, robotica, estructuras exibles y control de aeronaves (Dorato, 1993). Como consecuencia de los buenos resultados obtenidos, y del interes despertado en la comunidad cient ca y tecnica por la nueva disciplina, han surgido diferentes paquetes de CACSD (Dise~no de Sistemas de Control Asistido por Computador) para el dise~no de sistemas de control robusto, como ejemplos signi cativos se pueden citar: Program CC (Thompson, 1988), Robust-Control Toolbox (Chiang y Safonov, 1992) y -Analysis and Synthesis Toolbox (Balas et al, 1991) ambos para Matlab. Este captulo se centra en los metodos H2 , LTR y H1, habiendose empleado para el dise~no y analisis de los controladores, los dos paquetes de CASCD citados anteriormente en primer lugar.
8.2 Relaciones fundamentales La calidad de un dise~no va a depender en gran manera, del grado de aproximacion con el que se recojan, de forma matematica, los deseos de como se quiere que funcione el sistema bajo ciertas condiciones. Y por tanto, del conocimiento que se tenga de la planta, as como de lo que se le exija al sistema de control. Esto ultimo, quedara re ejado como las especi caciones de dise~no a cumplir por el controlador.
Relaciones fundamentales de control Un sistema de control generico puede verse representado en la gura 8.2, donde: G representa la planta, K el controlador, di; do las perturbaciones que afectan al proceso, r la referencia o consigna, y la respuesta del sistema y n el ruido ligado a las medidas de los sensores.
164
Relaciones fundamentales
r- h e - 6
K
di u- ? h
G
d
o ? - h r y-
?hn
Figura 8.2: Sistema de control y se~nales signi cativas Para caracterizar el comportamiento de un sistema de control resulta util de nir una serie de operadores, o matrices (funciones en el caso escalar) de transferencia:
Lazo Abierto o Razon de Retorno: Li = KG
;
Lo = GK
Fi = I + Li
;
Fo = I + Lo
1
;
So = Fo 1
Ti = I Si
;
To = I So
Diferencia de Retorno: Sensibilidad:
Si = Fi
Sensibilidad Complementaria: Sensibilidad del Control:
N = KSo
donde los subndices fi; og hacen referencia a que el operador se de na a la entrada o a la salida de la planta respectivamente. Del diagrama de bloques de la gura 8.2, pueden obtenerse las siguientes funciones (matrices en el caso de sistemas multivariables) de transferencia que van a determinar las propiedades mas relevantes a tener en cuenta para el dise~no de un sistema de control:
El problema del control robusto
165
1. Estabilidad interna: El sistema es internamente estable si son estables (ver apendice B.1) cada uno de los elementos de la matriz R, que relaciona los vectores r; di con y; u, siendo: " # " # y =R r u di donde: " 1 1G # GK ( I + GK ) ( I + GK ) R = K (I + GK ) 1 K (I + GK ) 1G 2. Comportamiento entrada-salida: y = To(r n) + Sodo + So Gdi
(8:1)
e = r y = So (r do n) SoGdi
(8.2)
3. Sensibilidad del sistema a peque~nos cambios en los parametros de la planta: Si la funcion (matriz) de transferencia en lazo abierto L0o (s) sufre una desviacion con respecto a la nominal Lo(s) debido a peque~nas variaciones en los parametros de la planta y/o del regulador, la correspondiente desviacion de la funcion (matriz) de sensibilidad complementaria To(s) viene dada por (MacFarlane, 1970): To 1(s)To(s) = So(s)Lo 1(s)Lo (s) (8:3) que es la generalizacion matricial de la relacion escalar de Bode (Kwakernaak, 1972): d ln T = dT=T = S d ln L dL=L 4. Demanda de control: u = KSo (r n do) + Sidi (8:4) El conjunto de ecuaciones 8.1-8.4 resumen los bene cios fundamentales y objetivos de dise~no inherentes a los sistemas de control realimentados. De ellas se desprende la existencia de una serie de objetivos contrapuestos: 1. De 8.2, se deriva que los errores de seguimiento del sistema e en presencia de cambios de consigna r y el efecto de perturbaciones do actuando a la salida de la planta pueden hacerse "peque~nos", procurando que el operador de sensibilidad So sea\peque~no" tambien (o equivalentemente Lo lo bastante grande). Para atenuar convenientemente las perturbaciones que actuen a la entrada de la planta di sera necesario que el producto SoG se mantenga lo menor posible.
166
Relaciones fundamentales
2. De la ecuacion 8.3, se deriva la conveniencia de mantener So (s) lo menor posible, ( Lo (s) lo mayor posible), a n de que el efecto de peque~nas variaciones de parametros en la planta no afecten de manera sensible al comportamiento del sistema en lazo cerrado. 3. Sin embargo, el aumentar excesivamente la ganancia en lazo abierto (Lo) o equivalentemente disminuir So, hace que dada la relacion existente entre So y To se provoque un aumento de la magnitud de To , produciendo dos consecuencias negativas: (a) Una posible ampli cacion del ruido de medida n y su transmision a la salida del sistema. (b) Una mayor sensibilidad del sistema a los efectos de la dinamica no modelada de alta frecuencia. 4. El esfuerzo de control u requerido para rechazar las perturbaciones actuantes sobre el sistema y conseguir una buena regulacion depende de las magnitudes de Si; So; K . Por tanto si se pretende que u no sea excesivo sera necesario mantener So, y Si lo su cientemente bajas. Pero dado que a su vez estas dependen inversamente de K , disminuir las primeras supone aumentar la ultima. Se presentan pues objetivos contradictorios, debiendose llegar en cada problema de dise~no a una solucion de compromiso. Habitualmente la dinamica inmodelada de alta frecuencia es la que da lugar a los mayores niveles de incertidumbre. Teniendo en cuenta que el ruido de medida suele ser tambien de alta frecuencia, y que las caractersticas de los sistemas dinamicos pueden muy bien asemejarse a ltros pasa bajo, una forma de resolver el problema planteado con los objetivos contrapuestos anteriores, es procurando que cada uno se cumpla en un rango de frecuencias de interes. Se pueden establecer tres zonas de frecuencias, de forma que dentro de cada una se trata de conseguir unos objetivos primordiales (ver gura 8.3):
Zona de baja frecuencia: En la que se requiere alta ganancia para conseguir: { Buen seguimiento de la referencia. { Adecuado rechazo de perturbaciones. { Reduccion de la sensibilidad del sistema a peque~nos cambios en los parametros de la planta.
El problema del control robusto
kLk
(db) 0
QQ
167
ZONA FRECUENCIA DE CRUCE - Estabilidad - Velocidad de respuesta
QQ Q
QQ QQ
ZONA DE BAJA FRECUENCIA - Seguimiento de consigna - Rechazo de perturbaciones - Comportamiento Robusto - Peque~nos cambios en parmetros
QQ
QQ
QQ B
ZONA DE ALTA FRECUENCIA - Rechazo ruido en sensores - Estabilidad Robusta
B BB
BB
BB
! (rad/s)
Figura 8.3: Zonas de frecuencias de interes
Zona de frecuencia intermedia: Va a ser determinante de propiedades tales
como: { Estabilidad y margenes de estabilidad. { Velocidad de respuesta y ancho de banda. Zona de alta frecuencia: Se va a requerir baja ganancia para: { Rechazo del ruido de los sensores. { Estabilidad robusta.
Las especi caciones de control pueden darse en el dominio frecuencial. Una forma de hacerlo es empleando funciones dependientes de la frecuencia, o de ponderacion, para acotar las magnitudes de los operadores de sensibilidad y sensibilidad complementaria. Para el caso de un sistema escalar pueden venir dados de la forma: j S (j!) j wS (!) y j T (j!) j wT (!) 8 ! Se pueden obtener las siguientes aproximaciones: ( ) j S j 1 j L j 1 () j T j 1
168
Relaciones fundamentales
(
)
j 1 j L j 1 () jj TS j 1 Para el rango de frecuencias donde j L j 1, las propiedades del sistema en lazo
cerrado dependen crticamente del valor de la fase del lazo abierto; as se tendra que: jLj1 j S j 1 arg L(j!) 180
()
j T j 1
Reglas practicas para el dise~no Las aproximaciones anteriores llevan a una serie de reglas utiles a la hora de realizar la sntesis de un sistema de control:
Alta ganancia en lazo abierto lleva a baja sensibilidad y buenas propiedades de rechazo de perturbaciones y seguimiento de la referencia (np).
Peque~na ganancia en lazo abierto es adecuada para que la respuesta debida al ruido en sensores sea considerablemente baja, y para mantener la estabilidad del sistema frente a incertidumbres en la planta (rs).
A frecuencias cercanas a la frecuencia de cruce de ganancia, la fase del sistema debe permanecer acotada lo su cientemente alejada de 180, para proporcionar unos adecuados margenes de estabilidad y para prevenir la ampli cacion de perturbaciones y ruidos.
El conjunto de reglas anteriores constituyen la base del dise~no clasico en el dominio frecuencial (Freudenberg et al, 1988, Maciejowski, 1989), consistente en que a partir del ajuste de la ganancia en lazo abierto se consiguen unas especi caciones de dise~no dadas en lazo abierto y/o cerrado. Otras tecnicas realizan tambien el proceso de ajuste en frecuencia, pero empleando directamente las funciones (matrices) de transferencia en lazo cerrado. En el captulo 9 se presentan algunas tecnicas de ajuste de las ganancias en lazo abierto (ltr), mientras que en el captulo 10 se describen algunos metodos para el ajuste de las ganancias en lazo cerrado (H2; H1)1 . La tecnica de ajustar las formas de las respuestas en frecuencia de ciertas funciones (matrices) de transferencia se conoce en general como Loop Shaping, en terminologa inglesa. 1
El problema del control robusto
169
Extension de conceptos a sistemas multivariables El concepto de ganancia de un sistema puede extenderse a sistemas multivariables haciendo uso de las relaciones entre las normas (ver apendice B.2) de las se~nales vectoriales de salida y entrada al sistema. En general, si k x k representa a cualquier norma de un vector x, se de ne la norma inducida de la matriz G por: k k G k= supx6=0 kkGx xk y en particular si se elige la norma Eucldea (de un vector complejo x):
p k x k= xH x
(donde xH representa el vector traspuesto conjudado de x), la norma inducida de la matriz es la norma espectral o de Hilbert:
k G ks= donde 2 es el autovalor maximo de la matriz GH G o de su traspuesta GGH , donde GH es la matriz traspuesta conjugada de G (ver apendice B.3). Si se tiene una matriz de transferencia G(s), con s = j!, y (0 ! 1), entonces su norma espectral va ser una funcion de !. Por tanto la norma k G(s)u(s) k va a depender de la direccion del vector u(s) y de la frecuencia !. Para cada valor de frecuencia es posible hallar unas cotas de la magnitud: k G(s)u(s) k k u(s) k que reemplazan el concepto de ganancia simple por el de rango de ganancias, estando este acotado (superior e inferiormente). Estas cotas son las denominadas ganancias principales extremas: [G(j!)], [G(j!)], que pueden calcularse a partir de los valores singulares maximo () y mnimo () de la matriz de transferencia G(j!) (ver apendice B.3) para cada frecuencia !. Para el caso de un sistema multivariable, las especi caciones de dise~no pueden darse empleando las ganancias principales extremas:
[S (j!)] wS (!)
170
Relaciones fundamentales
[T (j!)] wT (!) donde igual que para el caso escalar, las funciones de ponderacion (wS (!); wT (!)) se eligen de forma que se tengan en cuenta los objetivos a cumplir en cada intervalo de frecuencias de interes: 1. Baja frecuencia:
2. Frecuencia intermedia:
(S ) 1 i (T ) 1
j i(j!) j i(j!)
con mg,mf satisfactorios (ver apendice B.4). 3. Alta frecuencia:
(T ) 1
Teniendo en cuenta que para cualquier matriz arbitraria Q y su matriz unitaria I se cumple: maxf0; (Q)g (Q + I ) (Q) + 1 maxf0; (Q)g (Q + I ) (Q) + 1 se pueden transformar las especi caciones anteriores, empleando las ganancias principales extremas en lazo abierto: 1. A baja frecuencia: 2. A alta frecuencia:
(L) (1S ) si (L) 1 (L) (T ) si (L) 1
Las aproximaciones anteriores proporcionan una forma de transformar las especi caciones sobre (T ) y (S ), en expresiones de la matriz de transferencia en lazo abierto (ver gura 8.4): 1=[L(j!)] wS (!) [L(j!)] wT (!)
El problema del control robusto
171
dB (L)
0
NP
RS
T S-1 (L)
Figura 8.4: Correspondencia especi caciones lazo cerrado-lazo abierto
8.3 Descripcion de las incertidumbres Un diagrama de bloques general de un sistema de control de una planta con incertidumbres queda representado en la gura 8.5, donde E representa los errores de modelado existentes en la planta. De las posibles formas de representar el conocimiento impreciso que se tiene en el caso de un proceso escalar (incertidumbre tipo aditivo, multiplicativo etc.), cuando se trata de un sistema multivariable hay que considerar algunos otros casos; pues habra que tener en cuenta su situacion en el lazo de control. As por ejemplo, la incertidumbre de tipo multiplicativo podra estar a la entrada o a la salida, o incluso podran coexitir ambas simultaneamente. En cada caso habra que analizar el sistema en concreto y tratar de plasmar los errores de modelado de la forma mas conveniente. Las incertidumbres multiplicativas son las mas frecuentemente empleadas, debido a que satisfacen las propiedades intuitivas de ser peque~nas a baja frecuencia (donde el modelo de la planta nominal es generalmente bien conocido), y por otro lado son elevadas para alta frecuencia (donde el modelo es siempre mas impreciso). Habitualmente el nivel de incertidumbre aumenta con la frecuencia, debido principalmente a
172
Descripcion de las incertidumbres
E
di r
e - - 6
K
? -
u
6
do
?
G
? - y
?
n
Figura 8.5: Sistema de control con incertidumbres en la planta la dinamica no modelada de alta frecuencia (sensores, actuadores, modelos de orden reducido de la planta). Si bien, hay diversas formas de caracterizar la incertidumbre que exista en un sistema de control, como se pasa a describir a continuacion. La planta actual o real, G0 , puede expresarse de forma generica como:
G0 = G + G (8:5) donde G es el modelo nominal de la planta, y G representa la incertidumbre o errores de modelado presentes en el sistema. El tratamiento que se hace es considerar que el conjunto de incertidumbres que afectan al sistema puede ser representado por una incertidumbre equivalente, que se mani esta de alguna forma espec ca en un lugar localizado. En ocasiones ello no es posible, en cuyo caso se habla de incertidumbres simultaneas (dos o mas). Los modelos de incertidumbres mas empleados son: aditiva (iA), multiplicativa a la entrada/salida (iMi y iMo) de la planta, de realimentacion a la planta (iRp), como bucle realimentado a la entrada/salida de la planta (iRi, iRo), (ver gura 8.3). A continuacion se dan las expresiones correspondientes a cada una de ellas: 1. iA:
G0 = G + E G = E
El problema del control robusto
-E
r- e K
6
173
- ?e - G -y
r- e K - G
6
iMi
r- e K - e
6
6
6
- e?-y
iMo
E
-G
y -
r- e
6
K-e G
iRi
r- e K
-E
6
E
y -
iRp
G -e
6
E
y -
r- e K
6
iRo iA Figura 8.6: Algunos tipos de incertidumbres
-E - G - ?e y-
174 2. iMi: 3. iMo: 4. iRp: 5. iRi: 6. iRo:
Descripcion de las incertidumbres
G0 = G(I + E ) G = GE G0 = (I + E )G G = EG G0 = (I + GE ) 1G G = [(I + GE ) 1 I ]G G0 = G(I + E ) 1 G = G[(I + E ) 1 I ] G0 = (I + E ) 1G G = [(I + E ) 1 I ]G
En general, a la hora de la descripcion analtica de las incertidumbres en la planta estas pueden englobarse en dos grandes grupos: estructuradas y no estructuradas.
Incertidumbres no estructuradas Para este tipo de incertidumbre, lo que se conoce de E (s) puede consistir en una cota de su magnitud, generalmente dependiente de la frecuencia:
[E (j!)] (!) 8 !
(8:6)
Resulta interesante de cara a posteriores analisis el factorizar E (s) en la forma:
E (s) = e(s)(s) ; [(s)] 1 8!
(8:7)
Todas estas descripciones albergan la posibilidad de acoplamiento entre distintas fuentes de incertidumbres (por ejemplo, entre diferentes actuadores), considerando el caso mas desfavorable (E (s) es una matriz con elementos no nulos fuera de la diagonal principal). Pudiendo ocurrir, que se contemplen ciertas posibilidades que
El problema del control robusto
175
en la practica nunca se produzcan. Si eso ocurriera, el dise~no realizado se caracterizara por ser excesivamente conservador.
Incertidumbre estructurada Si de alguna manera se localizan las fuentes de las incertidumbres del sistema, se tendra una descripcion mas ajustada o estructurada de los errores de modelado. Esta puede estar constituida a su vez por multiples incertidumbres localizadas e independientes no estructuradas (Ei(s)). Las cuales pueden corresponder a dinamicas no modeladas de los actuadores, de los sensores, o de la propia planta. As, para cada uno de los bloques independientes Ei(s) se realiza la factorizacion:
Ei (s) = ei(s)i (s) ; [i (s)] 1 8!
(8:8)
La incertidumbre completa E (s) del sistema queda de la forma:
E (s) = diag fEi (s)g i = 1; : : : ; p siendo p el numero de bloques. Los errores de modelado tambien podran consistir en imprecisiones en algunos parametros del proceso, suponiendo en este caso una incertidumbre totalmente estructurada o parametrica. Este ultimo caso se dara por ejemplo, si existe una incertidumbre acotada en uno o varios polos y/o ceros de la planta, as como en la cuanti cacion de los elementos de retardo.
Ejemplo: Incertidumbres aditiva y multiplicativa Considerese un proceso en el que la dinamica de alta frecuencia no se ha considerado en el modelo nominal G, de forma que el modelo completo o real de la planta viene dado por
s2 + 2:4s + 144) G0(s) = G(s)Es(s); con: Es(s) = 100( 144(s2 + s + 100) donde Es es la incertidumbre en el modelo nominal. Esta se puede interpretar a su vez como una incertidumbre de tipo multiplicativo, aditivo, u otros. En el primer caso se tendra: G0 = G(1 + Em ); con Em = Es 1
176
Estabilidad robusta 10
Incertidumbre multiplicativa (dB)
0 -10 -20 -30 -40 -50 -60 -70 10 -1
10 0
10 1
10 2
rad/s
Figura 8.7: Magnitud de la incertidumbre multiplicativa y para el caso de incertidumbre aditiva: G = G + Ea; con Ea = G(Es 1) En las guras 8.7 y 8.8 se muestran respectivamente las respuestas en frecuencia (magnitudes) para cada tipo de incertidumbre. Puede verse como la incertidumbre multiplicativa es peque~na a baja frecuencia, donde el modelo es bien conocido, y se incrementa a medida que aumenta la frecuencia.
8.4 Estabilidad robusta Si el sistema de control dise~nado con el modelo nominal es estable, interesa saber si el sistema mantendra la estabilidad para cada uno de los elementos G0 del conjunto G de plantas posibles: G = fG0g Para el analisis del problema anterior, es util obtener una representacion del sistema como la de la gura 8.9.
El problema del control robusto
177
-10
Incertidumbre aditiva (dB)
-20
-30
-40
-50
-60
-70
-80 10 -1
10 0
10 1 rad/s
Figura 8.8: Magnitud de la incertidumbre aditiva
-
a
E
M
b
Figura 8.9: Sistema de interconexion
10 2
178
Estabilidad robusta
Teorema de la Peque~na Ganancia Este teorema ha jugado un importante papel en el desarrollo de la teora del control robusto (Dorato et al, 1987), y establece una condicion su ciente que garantiza la robustez de la estabilidad de un sistema (Lunze, 1989):
Teorema: Dado el sistema representado en la gura 8.9, donde M y E repre-
sentan sistemas cuadrados (mismo numero de entradas que de salidas) y estables, entonces el sistema en lazo cerrado sera estable si:
k EM k< 1 siendo k : k cualquier norma matricial compatible con el sistema (ver apendice B.2). Tanto M como E pueden ser sistemas no lineales y/o invariables en el tiempo. Sin embargo, el teorema establece solo una condicion su ciente para la estabilidad del sistema en lazo cerrado. Particularizando para el caso de sistemas lineales e invariantes en el tiempo (lti), el sistema de la gura 8.9 sera estable si se cumple:
[E (j!)M (j!)] < 1 8! La idea de aplicar este teorema, para analizar la robustez de un sistema de control con incertidumbres, se basa en el empleo de M (s) como el sistema visto por la incertidumbre E (s). Al sistema M (s) se le denomina Sistema de Interconexion, debido al hecho de que conecta la entrada "a" y la salida "b" de la incertidumbre E (s). En el caso de tratarse de sistemas lti, las se~nales externas, tales como perturbaciones y se~nales de referencia, no van a afectar a la estabilidad del sistema y de cara al analisis de robustez solo interesa la forma de como es visto el sistema por la incertidumbre. Para llegar a la representacion anterior, se parte de la representacion convencional de la planta y controlador, junto con los bloques de las incertidumbres que se tengan localizadas, se realizan las transformaciones equivalentes necesarias de forma que el resultado sea la separacion de la incertidumbre por un lado E (s) y del resto del sistema M (s) (sistema de interconexion) por otro.
El problema del control robusto
179
Ejemplo: Analisis de robustez Considerese un sistema de control con realimentacion unitaria, donde la planta nominal G y el controlador K (regulador 1) estan dados por
G(s) = s12 ; K (s) = 10(ss++51) El modelo real de la planta (incluida la incertidumbre) viene dado por,
G0(s) = G(s)[1 + Em(s)] siendo,
+ 0:6667) Em (s) = s( 0s:30556 2 + s + 100
Para este caso (incertidumbre de tipo multiplicativo) el sistema de interconexion coincide, salvo en signo, con la funcion de sensibilidad complementaria
M= T y aplicando el teorema de la peque~na ganancia, la maxima incertidumbre admisible o tolerable viene dada por: j E j j M1 j = j T1 j En la gura 8.10 se muestran tanto la incertidumbre j Em j (lnea a trazos), as como la tolerancia del sistema de control a incertidumbres multiplicativas (lnea continua). Como puede verse, el sistema veri ca la condicion exigida por el teorema de la peque~na ganancia, y por tanto tendra una estabilidad robusta. En la gura 8.11 pueden verse las respuestas obtenidas para la planta nominal y la real, observandose el efecto de la incertidumbre. Si se modi ca el controlador (regulador 2), de modo que este sea ahora,
K (s) = 32(ss++21) el test de la estabilidad robusta derivado del teorema de la peque~na ganancia no se cumple, tal y como puede verse en la gura 8.12. Sin embargo, dicho teorema solo aporta una condicion su ciente, y como se observa a partir de la respuesta temporal del sistema con la incertidumbre dada en la gura 8.13, el sistema realmente s
180
Estabilidad robusta 60
Incertidumbre y tolerancia (dB)
40
20
0
-20
-40
-60
-80 10 -1
10 0
10 1
10 2
rad/s
Figura 8.10: Tolerancia e incertidumbre multiplicativa con el regulador 1 1.4
1.2
respuestas
1
0.8
0.6
0.4
0.2
0 0
1
2
3
4
5
6
7
8
9
10
tiempo (seg)
Figura 8.11: Respuestas con regulador 1 del sistema nominal y del real
El problema del control robusto
181
60
Incertidumbre y tolerancia (dB)
40
20
0
-20
-40
-60
-80 10 -1
10 0
10 1
10 2
rad/s
Figura 8.12: Tolerancia e incertidumbre multiplicativa con el regulador 2 2.5
respuestas
2
1.5
1
0.5
0 0
1
2
3
4
5
6
7
8
9
10
tiempo (seg)
Figura 8.13: Respuestas con regulador 2 del sistema nominal y del real
182
Estabilidad robusta
veri ca la condicion de estabilidad robusta, ya que aunque la respuesta temporal sea poco amortiguada, s es estable. Si se considera E (s) una incertidumbre no estructurada y el sistema es lineal e invariante en el tiempo, se tiene el siguiente teorema que da condiciones necesarias y su cientes para la robustez de la estabilidad (rs) del sistema de control en lazo cerrado (Freudenberg et al, 1988; Morari et al, 1989)
Teorema: Supuesto el sistema de interconexion M (s) estable, y que la incer-
tidumbre E (s) es de tal clase que el sistema en lazo cerrado es estable si y solo si la proyeccion del determinante det[I M (s)E (s)] a lo largo del contorno de Nyquist D no envuelve al origen. Entonces, el sistema en lazo cerrado sera estable para todas las incertidumbres E (s) tales que: [E (j!)] 1 si y solamente si, se cumple alguna de las siguientes condiciones equivalentes : det[I M (j!)E (j!)] 6= 0 8 ! = [E (j!)] 1 , [M (j!)E (j!)] < 1 8 ! = [E (j!)] 1 , [M (j!)] < 1 8! , kM k1 < 1 En el caso de que la incertidumbre tenga una estructura diagonal de bloques, de nida por el conjunto: (8:9) X = fE (s) = diag fEi(s)g = [Ei (s)] g el analisis de la robustez de la estabilidad (rs) con el resultado del teorema anterior puede dar un resultado potencialmente conservativo, en el sentido de que suponga solo una condicion su ciente. Se tiene sin embargo, el siguiente teorema de robustez de la estabilidad (rs) menos conservador, al tener en cuenta la estructura de E (s) (Morari et al, 1989; Freudenberg et al, 1988):
Teorema: Supuesto el sistema de interconexion M (s) estable, y que la in-
certidumbre E (s) es de tal clase que el sistema en lazo cerrado es estable si y solo si la la proyeccion del determinante det[I M (s)E (s)] a lo largo del contorno de Nyquist D no envuelve al origen. Entonces, el sistema sera estable en lazo cerrado para todas las incertidumbres E (s) 2 X=1 si y solo si: [M (j!)] < 1 8! La de nicion de (M ) (valor singular estructurado ssv, apendice B.3) supone una generalizacion del radio espectral (M ) y del maximo valor singular (M ).
El problema del control robusto
183
Analisis de robustez con los valores singulares Como se ha presentado en apartados anteriores, hay diversas causas que originan la existencia de incertidumbre en el modelo de la planta. Siendo de interes practico el que, a la hora de plantear las especi caciones de dise~no, se tenga en cuenta el conocimiento que se posea sobre la incertidumbre. El planteamiento de un metodo, para el analisis de robustez de la estabilidad de un sistema de control, puede establecerse de modo generico como sigue: 1. Supuesta un tipo de incertidumbre en el modelo del proceso, se situa en el lugar del lazo donde se presuma que actue o pueda quedar re ejado su efecto. 2. El conocimiento que se tiene sobre la incertidumbre puede consistir en un cota superior de la magnitud de la incertidumbre como funcion de la frecuencia (no estructurada): [E (j!)] < e(!) 3. Se realizan las transformaciones adecuadas para llegar a la forma estandar de analisis ( gura 8.9), con el sistema de interconexion y la incertidumbre en dos bloques. 4. Por el teorema de la peque~na ganancia se tiene que una condicion su ciente (no necesaria) para que el sistema sea estable para ciertos niveles de incertidumbres es que: (EM ) < 1 8! o tambien: (E ) < (1M ) As por ejemplo, para una incertidumbre multiplicativa considerada a la salida de la planta, el sistema de interconexion es: M = GK (I + GK ) 1 y el test para la robustez se reduce a: (E ) < [I + (L) 1 ] Se demuestra en la practica, que los tests para robustez de la estabilidad bajo ciertas caractersticas de la incertidumbre dan condiciones excesivamente conservadoras.
184
Estabilidad robusta
Para el caso de un sistema 2 2 el analisis con i (M ) supone implcitamente que la incertidumbre actuante sobre el sistema sea en el caso mas desfavorable de la forma: caso a)
"
#
e11 (s) e12(s) e21 (s) e22(s)
Mientras que la incertidumbre podra darse de una forma mas estructurada, donde las incertidumbres en cada canal sean independientes entre s, sin que se afectaran con terminos de acoplamiento: caso b)
"
e1 (s) 0 0 e2(s)
#
O incluso que dichas incertidumbres fueran iguales en ambos canales: caso c)
"
e(s) 0 0 e(s)
#
Tambien, en algunos casos, puede ocurrir que el conocimiento que se tenga de la incertidumbre consista en posibles intervalos donde se encuentren los parametros con incertidumbres del modelo del sistema, en cuyo caso se tratara de una incertidumbre muy estructurada o parametrica: caso d)
2 66 k..1 .0. : : : 4 . . 0 0 :::
3
0 7 ... 7 5 kn
En los sistemas reales puede darse en general una combinacion de los distintos tipos de incertidumbre, pudiendo ser considerada parte como estructurada y parte como no estructurada. Segun el conocimiento que se posea del tipo de incertidumbre al que este sometido el sistema, se empleara unas determinadas herramientas de calculo para el analisis de la robustez de la estabilidad. As para estimar los niveles (o tolerancias) de incertidumbre permitidos, para los que el sistema mantiene su estabilidad, se propone emplear en cada caso:
El problema del control robusto
185
caso a) El valor singular maximo del sistema de interconexion (M ): 1 (M ) caso b) El valor singular estructurado de M : 1 (M ) caso c) El radio espectral de M :
1 (M ) caso d) El valor singular estructurado real de M (Packard y Doyle, 1993): 1 R(M ) Se comprueba, que el conservadurismo decrece de a) hacia d), con lo que el conocimiento (a priori) que se suministre sobre el tipo de incertidumbre existente en el modelo del sistema va a ser de suma importancia.
Ejemplo: Robustez frente a incertidumbre parametrica Considerese un sistema de control con realimentacion unitaria, cuya planta G y su regulador proporcional K estan dados respectivamente por,
G(s) = s2s(s++ba) ; K (s) = k Los valores de los parametros b; a; k se consideran constantes durante largos perodos de tiempo, pero por otro lado son desconocidos. Estando caracterizada la incertidumbre por los intervalos, 3 b 5; 0:5 a 0:5 5 k 15 Que puede a su vez ponerse de una forma conveniente para el calculo del sistema de interconexion M , as como para que la incertidumbre este normalizada, es decir, (E ) 1; 8 !
186
Estabilidad robusta
Para ello, se hace:
b = bo + b1 1; j 1 j 1; bo = 4; b1 = 1 a = ao + a1 2; j 2 j 1; ao = 0; a1 = 0:5 k = ko + k1 3; j 3 j 1; ko = 10; k1 = 5 De esta forma, el bloque de incertidumbre E es una matriz diagonal constituida por numeros reales con valor absoluto inferior o igual a la unidad,
E = diagf1; 2 ; 3g 1.2
sv(M), mu_real(M)
1
sv(M)
0.8
0.6
0.4 mu_real(M) 0.2
0 10 -1
10 0
10 1
10 2
rad/s
Figura 8.14: Analisis de robustez para incertidumbre parametrica Los valores de bo ; b1 ; ao; a1; ko; k1 se han incluido en M , y dado que (E ) 1, la condicion su ciente para que el sistema tenga una estabilidad robusta es que,
(M ) 1; (caso mas conservador) o si se tiene en cuenta el caracter parametrico de la incertidumbre, la condicion es
R(M ) 1; (caso de incertidumbre parametrica)
El problema del control robusto
187
En la gura 8.14 se tienen ambos valores; observandose que mientras a partir del analisis con (M ) no se cumple la condicion su ciente de estabilidad robusta, esta s se veri ca si se emplea R(M ). En el primer caso se esta considerando una situacion excesivamente conservadora e irreal, mientras que en el segundo caso se esta explcitamente considerando que la incertidumbre es de tipo parametrica.
8.5 Comportamiento robusto Dentro de las especi caciones de dise~no hay que considerar el comportamiento nominal (np) deseado del sistema en lazo cerrado. Este alude a aspectos relacionados con el rechazo a perturbaciones externas actuantes sobre el sistema, a la reduccion de los errores de seguimiento, al esfuerzo de control y a un comportamiento adecuado aun en el caso de peque~nas variaciones en los parametros del modelo nominal de la planta. Como se ha visto anteriormente, una forma analtica de expresar los requerimientos anteriores es mediante una relacion frecuencial basada en el modelo nominal de la planta, de la forma: [WS (j!)S (j!)] 1 (8:10) donde WS (j!) es una funcion (matriz) de ponderacion que pone de mani esto los per les deseados de la funcion de sensibilidad S (j!) en las distintas regiones de frecuencia. Si el per l deseado es el mismo en todos los canales (especi cacion homogenea) entonces: WS (s) = wS (s)I y queda:
[S (j!)] j w (1j!) j S El problema de analisis del comportamiento robusto (rp), consiste en determinar si el sistema en lazo cerrado satisface las especi caciones de comportamiento para todas las posibles plantas G0(s) 2 G . Sera determinar si se cumple:
[WS (j!)S 0(j!)] 1 supuesto que se veri ca 8.10 para la planta nominal G(s). Dada la representacion del sistema de la gura 8.15, en la que se tienen caracterizadas las incertidumbres por ET (s); y donde se especi ca un np para el sistema nominal expresado mediante una relacion entre dos se~nales (vectores) v y w, por
188
Comportamiento robusto
ET
w -
M
v-
Figura 8.15: Analisis del comportamiento robusto medio de: v = ES 1 w. Se tiene el siguiente teorema de robustez del comportamiento (rp) (Freudenberg et al, 1989; Morari et al, 1989):
Teorema: Dado el sistema M(s) de la gura 8.15, supuesto estable y obtenido con el modelo nominal de la planta, sujeto a la incertidumbre ET , con (ET ) 1. El sistema satisface la condicion de comportamiento robusto si y solo si:
(M ) < 1 8! donde (M ) se calcula con respecto a la incertidumbre estructurada de forma diagonal E = diag fET ; ES g; siendo ES (s) una incertidumbre cticia con [ES (j!)] 1, la cual esta relacionada con el comportamiento nominal deseado. En el teorema anterior se realiza la transformacion del problema de rp en uno de rs equivalente, con un bloque adicional de incertidumbre. Se hace al transformar la especi cacion de np en lazo cerrado (expresada como una relacion entre dos se~nales w y v), en una incertidumbre cticia representada por ES (ver gura 8.16) (Doyle 1983, Morari et al. 1989, Freudenberg 1989). Con lo expuesto hasta ahora, los requerimientos para un sistema de control pueden escalonarse en cuatro niveles de complejidad o exigencia: 1. El primero es el mas elemental e imprescindible: la estabilidad del sistema nominal (ns). 2. A continuacion esta el conseguir un comportamiento nominal (np) deseado. 3. El tercer objetivo consiste en gozar de una estabilidad robusta (rs).
El problema del control robusto
189
ES ET
w -
E
M
v
Figura 8.16: Equivalencia entre comportamiento robusto y estabilidad robusta 4. Y nalmente, que el comportamiento deseado se mantenga aun con la existencia de incertidumbres, lo que supone un comportamiento robusto (rp). Si se realiza una particion del sistema de interconexion (caso de rs para incertidumbres simultaneas, o rp para un tipo de incertidumbre actuando sobre la planta): " # M M 11 12 M (s) = M M 21
22
de forma que M (s) incluye el escalado apropiado para que la incertidumbre este normalizada: [E (s)] < 1, los objetivos anteriores pueden analizarse a partir de M (s) empleando en cada caso (Skogestad et al, 1988; Freudenberg, 1989):
ns: M es estable np: (M22 ) < 1 8 ! rs: Segun sea estructurada o no estructurada la incertidumbre ET : (M11 ) < 1 o (M11 ) < 1 8 !
rp: (M ) < 1 8 !
190
Robustez de plantas con fuerte ganancia direccional
8.6 Robustez de plantas con fuerte ganancia direccional A diferencia de los sistemas escalares, un proceso multivariable se caracteriza porque la ganancia que el sistema mani esta para una determinada perturbacion y/o consigna va a depender de la direccion espacial que esta tenga, dado su caracter vectorial. Potencialmente puede haber una fuerte discrepancia entre las ganancias de la planta para dos se~nales actuando en distintos canales o lazos. Una medida de la direccionalidad de la planta se obtiene del numero de condicion de su matriz de transferencia G(s), de nido como: (j!)] [G(j!)] = [[G G(j!)] un valor elevado de (G) implica una fuerte dependencia direccional de G. Las matrices con elevados numeros de condicion estan numericamente mal condicionadas para el calculo de su inversa. Empleando este resultado, se dice que un sistema esta mal condicionado para ciertas frecuencias si su matriz de transferencia, a esas frecuencias, tiene un numero de condicion elevado. Si este es proximo a uno, se dice que el sistema esta bien condicionado. Los valores singulares de las matrices no son independientes de escalados, por lo que el numero de condicion de una planta va a depender de las unidades empleadas a la entrada y a la salida de la planta. Un controlador que compense la direccionalidad acusada de una planta, aplicando se~nales de control elevadas en la direccion donde la ganancia del sistema es baja, puede dar buenos resultados si el modelo del proceso es muy preciso. Pero si debido a las incertidumbres, la direccion del vector de control, de elevada magnitud, generado no coincide exactamente con la direccion de baja ganancia de la planta, entonces la ampli cacion de las se~nales de control pueden ser mucho mayores que las esperadas con el modelo; resultando un comportamiento nada satisfactorio del sistema de control. Los problemas para el control de una planta con incertidumbres y una direccionalidad acusada, se ponen especialmente de mani esto, cuando se analiza la robustez de la estabilidad frente a incertidumbres simultaneas y/o la robustez del comportamiento del sistema de control. Como se ha visto en el apartado anterior, en ambos casos la herramienta de analisis es el valor singular estructurado del sistema de interconexion M (s).
El problema del control robusto
191
Cuando se tienen dos fuentes de incertidumbre separadas, o cuando se especi ca un comportamiento deseado para un proceso con una incertidumbre dada, el sistema de interconexion queda de la forma: " # M ( s ) M ( s ) 11 12 M (s) = M (s) M (s) 21 22 y la incertidumbre equivalente: " # E ( s ) E ( s ) 11 12 E (s) = E (s) E (s) 21 22 dado que si (E ) , la condicion de estabilidad robusta para el sistema es: (M ) < 1 8 ! entonces como: (M ) max f(Miig i ocurre que el margen de estabilidad frente a incertidumbres simultaneas no va a ser mejor que los margenes frente a cada tipo de incertidumbre actuando sola. Resulta interesante obtener cotas de (M ) expresadas en funcion de los valores singulares de los elementos Mij , de forma que puedan emplearse para facilitar el dise~no y analisis. Con este objetivo, se dan los siguientes resultados (Freudenber 1989): (M ) [(M12 )(M21 )]1=2 max f(M11 ); (M22 )g (M ) [(M12 )(M21 )]1=2 + max f(M11 ); (M22 )g En las ecuaciones anteriores puede verse la dependencia de la robustez del sistema de los elementos Mij ; i 6= j . Si ocurre que: [ (M12 )(M21 )]1=2 1 (8:11) maxf(M11 )(M22 )g el sistema sera mucho mas sensible a incertidumbres simultaneas que a las mismas actuando de forma individual. Por ello, aunque se tenga garantizada la robustez frente a cada incertidumbre individual (elementos Mii , (Mii ) < 1) pueden existir un par de peque~nas incertidumbres que actuando simultaneamente causen la inestabilidad del sistema, siempre que: [ (M12 )(M21 )]1=2 1 (8:12)
192
Robustez de plantas con fuerte ganancia direccional
- EI r- h - 6
K
ES
- ?h-
-r
G
- ?h
r r y-
Figura 8.17: Incertidumbres para problema de comportamiento robusto. y por tanto:
(M ) [(M12 )(M21 )]1=2 1
Los sistemas que, al menos potencialmente, pueden llevar con mas facilidad a la condicion anterior, son aquellos que tengan plantas mal condicionadas; especialmente si no se toman algunas precauciones a la hora del dise~no. El problema de analizar la robustez en la estabilidad de un sistema con incertidumbres multiplicativas a la entrada y a la salida actuando simultaneamente, o el de analisis del comportamiento robusto de un sistema con incertidumbre multiplicativa a la entrada, son especialmente crticos, y ponen de mani esto lo dicho anteriormente. Para el sistema de la gura 8.17 se trata de analizar la robustez en el comportamiento del sistema. Se supone que los errores de modelado de la planta pueden expresarse como una incertidumbre multiplicativa a su entrada:
EI (s) = wI (s)I (s)
[I (j!)] 1 8!
y que la especi cacion de comportamiento nominal puede expresarse mediante una incertidumbre ctcia equivalente (ver gura 8.18):
ES (s) = wS (s)S (s) Se obtiene que:
"
[S (j!)] 1 8!
# " # a1 = M b1 a2 b2
El problema del control robusto
193
a1
-
I (s)
a2
-
S (s)
M (s)
b1 b2
Figura 8.18: Problema de estabilidad robusta equivalente. siendo el sistema de interconexion:
"
I wI M = S TGw o I
KSo wS SowS
#
si G(s) es invertible, el termino M12 puede ponerse como: M12 = TI G 1. Si se supone que los elementos M12 ; M21 cumplen las condiciones 8.11 y 8.12 se tendra que (M ) 1, y como: [(M )]1=2 (So wI G)(TI wS G 1) (SowI )(TI wS )(G) se pone de mani esto el hecho de que si la planta tiene una acusada ganancia direccional ((G) elevado), la estabilidad del sistema experimentara una mayor sensibilidad a incertidumbres simultaneas. Otras relaciones de interes, que ponen de relieve lo anterior, a la vez que tambien incluyen el efecto de la ganancia direccional del controlador dise~nado, se dan a continuacion (Freudenberg 1989, Morari et al. 1989):
(M ) (wS So) + (wI To ) (M ) (wI TI ) + (wS SI ) (M ) (wI TI ) + (1 + p )(wS So)
194
Robustez de plantas con fuerte ganancia direccional
q (M ) maxf(wI TI ); (wS So)g + (wI TI )(wS So )
= min f(G); (K )g Las expresiones anteriores pueden ayudar durante el dise~no, pero hay que tener en cuenta que si se emplean para analizar directamente la robustez del sistema, pueden llevar a dise~nos muy conservadores, debido a que para plantas con marcada ganancia direccional la cota puede estar excesivamente sobre-estimada. Sera conveniente por tanto, de cara al dise~no nal, calcular el valor de (M ) de forma directa.
Ejemplo: Planta con fuerte ganancia direccional Sea la siguiente matriz de transferencia G(s), correspondiente a un proceso multivariable compuesto de dos entradas y dos salidas
"
0:864 G(s) = 75s1+ 1 01::878 082 1:096
#
Este sistema reune especialmente las caractersticas anteriormente citadas sobre la fuerte ganancia direccional. Con la peculiaridad de que su numero de condicion toma un valor elevado y constante, de 141.3, para todo el rango de frecuencias. Es pues, un ejemplo de lo que se denomina una planta mal condicionada, o sea con valores de (G) 1 en el rango de frecuencias de interes. En la gura 8.19 pueden verse sus ganancias extremas o valores singulares en funcion de la frecuencia. Tambien se muestran la parte real (curva continua) y la parte imaginaria (curva de trazos) de los elementos de la matriz de ganancia relativa (rga) (ver apendice B.5) en la gura 8.20.
El problema del control robusto
195
20
Ganancias extremas de G
0
-20
-40
-60
-80
-100
-120 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
rad/s
Figura 8.19: Ganancias extremas para planta con fuerte ganancia direccional 40
40 RGA(G_11)
20
20
0
0
-20
-20
-40 10 -5
10 -2
10 1
10 4
-40 10 -5
RGA(G_12)
10 -2
rad/s 40
20
20
0
0
-40 10 -5
10 -2 rad/s
10 4
rad/s
40
-20
10 1
RGA(G_21)
-20
10 1
-40 10 -5
10 4
RGA(G_22)
10 -2
10 1
10 4
rad/s
Figura 8.20: Parte real e imaginaria de los elementos de la matriz de ganancia relativa (rga).
Captulo 9 Metodos de dise~no LTR 9.1 Introduccion El metodo de dise~no de sistemas de control denominado Recuperacion de la funcion de Transferencia del Lazo abierto (ltr),1 surgio como consecuencia del objetivo de mejorar la robustez de los controladores basados en el procedimiento Lineal Cuadratico Gaussiano (lqg) (Doyle y Stein, 1979). Posteriormente, la teora en torno a ltr ha transcendido de sus orgenes, constituyendo una metodologa de dise~no sistematica y exible para sistemas de control tanto escalares como multivariables. Durante la decada de los ochenta tuvo su epoca de desarrollo e implantacion (Athans, 1986; Stein y Athans, 1987; Maciejowski, 1985), y sigue siendo un tema de investigacion y estudio (Zhang y Freudenberg, 1993; Saberi et al, 1993; Saeki, 1992). Como se ha presentado en el captulo anterior, las especi caciones de dise~no pueden plantearse en el dominio de la frecuencia. En este captulo se trata el problema del ajuste de las ganancia del sistema en lazo abierto, a n que cumplan unas especi caciones de dise~no dadas. El metodo de dise~no basado en la teora lqg, junto con un procedimiento para recuperar cierta funcion de transferencia en lazo abierto especi cada, constituye la tecnica conocida como lqg/ltr. Un controlador basado en observador (cbo) cumple el Principio de Separacion, proporcionando a la hora del dise~no la division de este en dos problemas independientes: 1
Loop Transfer Recovery en terminologa inglesa
197
198
Propiedades del regulador LQR
1. Dise~no del controlador por realimentacion de estados. 2. Dise~no del observador para reconstruir el estado a partir de la medida de la respuesta del sistema. Por tanto, si el sistema de control con realimentacion de estados (lqsf)2 es estable en lazo cerrado y tiene un comportamiento nominal adecuado, ello garantiza las mismas propiedades para el sistema nominal con cbo. Sin embargo, con la presencia de incertidumbres en el modelo, el regulador con el vector de estados estimado (lqsef)3 no lleva necesariamente al mismo comportamiento obtenido por realimentacion de estados, as como tambien puede haber un deterioro de las propiedades de robustez con respecto al regulador lqsf (Doyle y Stein, 1981). Surge de esta forma, la motivacion de desarrollar estructuras de control basadas en observador (cbo), u otras no basadas en observador (cnbo), que mantengan o al menos conserven la parte esencial, de las propiedades que caracterizan al dise~no basado en la realimentacion de estados (lqsf), o a su problema dual, el ltro de Kalman (kbf). En este captulo se presentan dos estructuras empleadas en el dise~no ltr. Una basada en observador (cbo) y otra no basada en observador (cnbo).
9.2 Propiedades del regulador LQR Como se ha visto en el captulo 8, para un proceso que pueda describirse por un modelo lineal e invariante en el tiempo, el comportamiento del sistema en lazo cerrado y su robustez van a depender de ciertas funciones (matrices) de transferencia asociadas al sistema de control, tales como la funcion de sensibilidad S (s) y su complementaria T (s). A la vez, como se ha descrito en el captulo anterior, estas se pueden expresar a partir de la funcion (matriz) de transferencia en lazo abierto L(s). Basado en lo anterior, una manera de formular las especi caciones de dise~no consiste en de nir la funcion (matriz) de transferencia en lazo abierto deseada (ftlad) Lt (s). El problema sera encontrar un controlador con una estructura determinada que proporcione la ftlad. 2 3
linear quadratic state feedback en la terminologa inglesa. linear quadratic state estimated feedback en la terminologa inglesa.
Metodos de dise~no LTR
199
En la literatura se han sugerido dos metodos para obtener Lt (s) que proporcionan unas caractersticas muy aceptables. Una se basa en el empleo de la teora de control optimo cuadratico (lqr), y la otra esta basada en la teora del ltro Kalman (kbf). La ventaja esgrimida para el empleo de estos metodos es que el sistema adquiere, de forma automatica, ciertas propiedades muy estimables desde el punto de vista del comportamiento nominal y de la robustez de la estabilidad.
Obtencion de la ftlad a traves de lqr Suponiendo que se conoce un modelo de la planta, expresado en el espacio de estados por el conjunto de ecuaciones:
x_ = A x + B u y = Cx (9.1) donde se supone tambien, que las ecuaciones anteriores incluyen posibles escalados y/o ampliaciones realizadas sobre el modelo de la planta, a fn de adecuarla para el dise~no. El comportamiento deseado del sistema puede especi carse de forma conveniente mediante la optimizacion de una funcion de coste J . Si se de ne el vector:
z = Mx en el que sus componentes son combinaciones lineales de las variables de estado (M es una matriz constante de dimensiones adecuadas); y las matrices de ponderacion: Q = QT 0 Rc = RcT > 0 se trata de minimizar: Z1 J = (zT Qz + uT Rcu)dt 0 Z1 = (xT M T QMx + uT Rcu)dt (9.2) 0
El problema anterior es el llamado lqr, cuya solucion es de la forma:
u = Kcx denominandose a Kc matriz de realimentacion de estados. A partir de la solucion Pc de la ecuacion algebraica de Riccati de control (AREc) siguiente: AT Pc + PcA PcBRc 1 B T Pc + Qc = 0 (9:3)
200
Propiedades del regulador LQR
G(s)
r - as B - 6 b s
(s)
Kc
C
y
-
x
Figura 9.1: Estructura regulador lqr (lqsf) con se obtiene: siendo:
Qc = M T QM Kc = Rc 1B T Pc Pc = PcT 0
El problema tendra solucion Pc y sera unica, si el par (A; B ) es estabilizable (todos los modos inestables son controlables). Se de ne Hc(s), como la funcion (matriz) de transferencia en lazo abierto entre la entrada a la planta y la se~nal de retorno. Es la relacion entre la se~nal que entra por el punto\a" y la que retorna por el punto\b" de la gura 9.1. Se denomina Funcion de Relacion del Retorno o de Lazo Abierto:
Hc(s) = Kc(s)B donde: (s) = (sI A) 1 , y la correspondiente Funcion de Diferencia del Retorno: Fc(s) = I + Hc(s) A partir de la ecuacion AREc y de algunas manipulaciones algebraicas (MacFarlane 1979), se obtiene:
FcT ( s)RcFc(s) = Rc + GTc ( s)QGc(s) con:
Gc(s) = M (sI A) 1B
(9:4)
Metodos de dise~no LTR
201
En el caso de que:
Rc = I
se obtiene:
FcT ( s)Fc(s) I (9:5) mostrando Safonov y Athans (1977) que la desigualdad anterior garantiza para el sistema un margen de fase (MF) mnimo de 60 (se admite un cambio de fase de al menos 60 simultaneamente en cada canal sin que produzca la inestabilidad del sistema), un margen de ganancia (MG) in nito (frente a variaciones en forma de valor real > 1, o modi cacion de la ganancia en continua, generados de forma simultanea en todos los canales sin que el sistema pierda su estabilidad nominal) y un margen de tolerancia para reduccion de la ganancia (TRG) de hasta 6db (reduccion simultanea de la ganancia 0:5 < 1, o sea de hasta el 50% de su valor nominal, en cada canal sin que desestabilice al sistema de control). De 9.5 se desprende que: y por tanto: como: se tendra que:
i (FcH Fc) 1 (FcH Fc) 1
(FcH Fc) (FcH )(Fc) = 2(Fc)
2 (Fc) 1 ) (Fc) 1 dada la relacion Si = Fc 1, y teniendo en cuenta la propiedad de los valores singulares de una matriz no singular P (P 1) = (1P ) se obtiene: (Si) 1 (9:6) lo cual tiene la interpretacion fsica en el caso escalar, de que el sistema no ampli cara las perturbaciones actuantes a la salida de la planta. Por otro lado teniendo en cuenta que: Ti(s) = I Si(s) con lo que: (Ti) (I ) + (Fc 1) 1 + (1F ) c 1 + 1=1 = 2
(9.7)
202
Propiedades del regulador LQR
La desigualdad 9.7, puede interpretarse como una medida de la robustez de la estabilidad para el caso de incertidumbre multiplicativa no estructurada existente a la entrada de la planta. De forma que, a partir del teorema de peque~na ganancia (ver captulo 8), una condicion su ciente para que el sistema permanezca estable para una incertidumbre no estructurada E (s) es que: (E ) (1T ) i ya que en este caso, M (s) = Ti(s), y por tanto: (E ) 21 lo que fsicamente equivale a decir que el sistema de control puede aceptar hasta un 50% de incertidumbre relativa en la planta, manteniendo la estabilidad. Otra caracterstica de Hc(s) es que para algun par de numeros reales f; !og se cumple: (Hc) ! ; 8 ! > !o lo que se traduce en la propiedad de una cada de la ganancia del sistema de 20 db=dec a alta frecuencia. En resumen, puede decirse que el controlador lqr tiene las siguientes propiedades:
Ley de control optima. Amplios margenes de fase (MF) y ganancia (MG), (TRG). Robustez de la estabilidad (rs) frente a incertidumbres de tipo multiplicativo
situadas a la entrada de la planta. Respuesta en frecuencia en lazo abierto con una pendiente de cada suave a alta frecuencia.
Las propiedades anteriores son todas, salvo la ultima, muy atractivas para un sistema de control. Sera deseable ademas, si ello fuera posible, que manteniendo las tres primeras casi sin alteracion, se consiguiera un aumento de la pendiente de cada a alta frecuencia. Es en esa zona donde se mani estan fundamentalmente los errores de modelado, con lo que se reforzara la robustez frente a la dinamica inmodelada de alta frecuencia.
Metodos de dise~no LTR
203
Ajuste de las ganancias principales Como se ha visto para el problema lqr la matriz de transferencia de diferencia de retorno Fc(s) cumple la igualdad 9.4; si se supone, sin perdida de generalidad (bastara con escalar la entrada al sistema), que Rc = I , queda:
FcT ( s)Fc(s) = Rc + GTc ( s)QGc (s)= de la cual se deduce que (Doyle et al. 1981, Maciejouski 1989):
"
#1=2
2 i (Fc) = 1 + i (Q1=2 Gc)
(9:8)
y de esta se obtienen las siguientes expresiones para los valores singulares extremos:
# 1 = 2 (Fc 1 + (Q Gc) # " 1 1 = 2 (Fc ) = 1 + (Q Gc) 1) =
"
1=2
1=2
De las ecuaciones anteriores se deriva la posibilidad de modi car los valores singulares o ganancias principales de Fc 1 = Si, actuando sobre la matriz Q y el escalar . Si en el rango de frecuencias de interes ! 2 D! se cumple:
(Hc) 1 la expresion 9.8 se reduce a:
i (Hc) i (Qp Gc) 1=2
(9:9)
la relacion 9.9 puede emplearse para realizar ajustes de Hc(s) en una doble vertiente: a) El valor del parametro modi ca de forma simultanea todas las ganancias principales. b) La matriz Q puede emplearse para modi car solo una de las ganancias principales dejando el resto inalteradas, por medio del empleo de las propiedades de los valores y vectores singulares (ver apendice B.3).
204
El controlador LQG
Ajuste de i (Hc) para un\i" dado Dado el producto de matrices de orden m p
Q1=2 Gc(j!) para una frecuencia particular ! = !1 , es posible descomponerla en sus valores singulares: r X Q1=2 Gc(j!1) = U V H = uii viH ; r = minfm; pg i=1
si se modi ca Q1=2 en la forma:
Q1=2 = Q1=2 (I + uj uHj ) teniendo en cuenta la propiedad de los vectores singulares
uj uHi se obtiene:
=
(
0 si i 6= j 1 si i = j
)
Q1=2 Gc(j!1) = (PI + uj uHj ) Pri=1 uii viH = ri6=j uiiviH + (1 + )uj j vjH
con lo que unicamente se modi ca la ganancia principal j que pasa de j a (1+ )j . Por tanto, bajo la hipotesis 9.9 se tiene una forma explcita de manipular los i(Hc) de forma independiente o unilateral para un\i" dado.
9.3 El controlador LQG El regulador lineal cuadratico gausiano (lqg) es un procedimiento basicamente formulado en el dominio temporal, y con tratamiento en lazo cerrado. Sin embargo, puede tambien plantearse como un procedimiento de optimizacion en el dominio frecuencial, tal y como se presenta en esta seccion, as como siguiendo el enfoque dado en el apendice A.3. En este apartado se describe en primer lugar el procedimiento de dise~no lqg, y a continuacion se pasa al principal interes de este captulo: los metodos de dise~no de control robusto denominados en general ltr. Se realiza para ello una formulacion en el espacio de estados, y un tratamiento en el dominio de la frecuencia a la hora de formular los objetivos de dise~no.
Metodos de dise~no LTR
r- i - 6
205
us
-
sy -
Planta
u^ Kc
s
(s)
-
?i
B
Ko
i 6-
C
Figura 9.2: Estructura regulador lqg/ltr-i Si el sistema se encuentra sometido a perturbaciones estocasticas y/o el vector de estado no es accesible, se emplea un observador para estimar los estados. Caso de elegir como observador el ltro de Kalman (kbf), se denomina al metodo lqg. Este tiene la ventaja de que minimiza la varianza del error de estimacion a partir de la caracterizacion de los ruidos, de los que se suponen conocidas las matrices de covarianza. En la gura 9.2 se muestra la estructura del controlador lqg. Si el modelo de la planta junto con las perturbaciones estocasticas se puede representar por el conjunto de ecuaciones: x_ = A x + B u + v1 y = C x + v2 (9.10) siendo v1 ; v2 realizaciones de ruido blanco gausiano caracterizados por: E [v1 ; v1T ] = W 0 ; E [v2; v2T ] = Ro > 0 ; E [v1 ; v2T ] = 0 donde W; ; Ro son conocidos, estimados o elegidos de forma arbitraria de cara al dise~no del observador. La solucion del problema lqg se hace dividiendolo en dos subproblemas independientes (Principio de Separacion) (Gopal, 1982): 1. El problema de control: resuelto como lqr. Suponiendo que el vector de estados estimado coincide con el del proceso.
206
El controlador LQG
2. Y el problema del observador: resuelto como kbf. Para un modelo exacto de la planta, la estabilidad del sistema controlado por realimentacion de estados (lqr, o tambien nombrado como lqsf) garantizara tambien la del sistema empleando el vector de estados estimado (lqsef). Para resolver el subproblema del observador ( ltro Kalman): x^_ = A x^ + B u + Ko (y y^) y^ = C x^
(9.11)
se necesita encontrar la matriz de ganancia del observador Ko. Para ello se resuelve la ecuacion algebraica de Riccati del observador (AREo):
APo + PoAT PoC T Ro 1CPo + Qo = 0 con:
Qo = V1
T
(9:12)
; Ko = PoC T Ro 1
Para (A; C ) detectable (todos los modos inestables son observables) hay una solucion Po unica de 9.12, con Po = PoT 0 De las ecuaciones del modelo de la planta 9.1, del observador 9.11, y la ley de control: u = Kcx^ se puede de nir el error de estimacion :
= x x^ resultando
" # " #" # x_ = A BKc BKc x _ 0 A Ko C
lo que indica que los polos del sistema en lazo cerrado son la union de los polos correspondientes a la ley de control (lqr) y los polos del observador (kbf). El compensador lqg queda:
K (s) = Kc(sI A + BKc + KoC ) 1 Ko y la ftla de nida a la entrada de la planta:
L(s) = K (s)G(s)
(9:13)
Metodos de dise~no LTR
207
Es un hecho remarcado en la literatura, que el empleo de estimadores de estados puede deteriorar la robustez del sistema, as como su comportamiento en lazo cerrado si no se tienen modelos muy precisos de la planta. La circunstancia de tratar de mejorar la robustez de un sistema lqg fue lo que originalmente provoco el desarrollo de la metodologa lqg/ltr. Al incluir el estimador de estados, potencialmente pueden deteriorarse las propiedades del control lqr, o lo que es lo mismo de la ftla (L(s)) con respecto a la ftlad (Lt (s)).
9.4 Controlador LTR basado en observador Como se describe en el captulo 8, las especi caciones de dise~no pueden realizarse a traves de expresiones o cotas para ciertas funciones (matrices) de transferencia en lazo abierto (ftla). Dependiendo de en que puntos se de nan tales ftla, normalmente a la entrada o a la salida de la planta, se empleara una estrategia de dise~no diferente. El metodo se denominara lqg/ltr-i, si se considera a la entrada de la planta, y lqg/ltr-o si es a la salida, o tambien conocidos como metodos ltr basados en observador, por derivarse tales metodos de la teora relacionada con los reguladores lqg, la cual emplea un ltro de Kalman (observador de estado) para estimar el vector de estado.
9.4.1 Metodo LQG/LTR-i Existen diferentes metodos para realizar la llamada recuperacion de la funcion de transferencia en lazo abierto (Saberi et al, 1993), en este apartado se emplea el procedimiento introducido por Doyle y Stein (1979); y que consiste en modi car los parametros libres de dise~no del observador, de forma que la ftla recupere las caractersticas frecuenciales de la ftlad. Esto se consigue, en el caso de sistemas de fase mnima (todos sus ceros se encuentran en el semiplano izquierdo), haciendo depender la matriz de covarianza del ruido en el proceso de un parametro escalar\q", llamado ganancia de recuperacion (gain recovery): Qo = Qo + qZ siendo Z = Z T 0 una matriz arbitraria. Para el caso de sistema de fase mnima (ver apendice A.2), se demuestra (Stein y Athans, 1987) que: 1 qlim !1 K (s)G(s) = Kc(sI A) B = Hc(s)
208
Controlador LTR basado en observador
El controlador lqg/ltr: K (s), sustituye la dinamica de la planta por la dinamica deseada, y de nida por Hc(s). Los ceros de K (s) corresponden a los ceros de Hc(s), y algunos de sus polos se emplean para cancelar los ceros de la planta G(s). Es por esto, que el metodo solo garantiza una recuperacion asintotica para plantas con modelos inversos estables. La presencia de ceros inestables tiene el efecto de limitar las caractersticas del comportamiento obtenible, independientemente de la metodologa de dise~no que se emplee. Sin embargo, si los ceros inestables de la planta estan lo su cientemente alejados del ancho de banda del sistema de control, entonces es posible una recuperacion parcial en el rango de frecuencias de interes, y a efectos practicos la presencia de tales ceros no afectan de manera sensible a la robustez y comportamiento del sistema a baja frecuencia. Es posible, que para alcanzar un nivel de recuperacion deseado, las demandas del controlador sean excesivamente elevadas. Para un sistema con peque~nos errores de modelado ello no es crtico, sin embargo para sistemas donde las incertidumbres juegan un importante papel, puede darse el caso extremo de que se provoque la inestabilidad del sistema de control. Basado en esta idea, se han propuesto por diferentes autores (Athans, 1986; Lopez y Rubio, 1994) controladores lqg con recuperacion parcial (zonas de baja y media frecuencia) (ltr-i), el cual exhibira unas caractersticas de comportamiento similares al lqg en el rango de frecuencias de interes, y que adicionalmente presenta unas mejores propiedades de robustez frente a la presencia de dinamica inmodelada de alta frecuencia.
Ejemplo: Dise~nos lqr, lqg, lqg/ltr Sea el sistema dado por las siguientes ecuaciones: x_ = Ax + Bu + w y = Cx + v donde las matrices A, B , C , y vienen dadas por: ! ! 0 1 0 A= 3 4 ; B= 1 ; C= 2 1 ;
=
35 61
!
Dicho sistema corresponde a una funcion de transferencia de la forma: +2 G(s) = uy((ss)) = (s +s1)( s + 3) Se considera en primer lugar el control lqr. Para ello se trata de encontrar el regulador optimo que minimice el siguiente criterio cuadratico o funcion de coste: Z1 J = (xT M T Mx + u2) dt 0
Metodos de dise~no LTR
209
donde se emplean: M = 52:915 8:944 ; Rc = 1; Q = diagf1; 1g Con estos datos puede ser calculado el regulador lineal cuadratico (lqr), bien a partir de la descripcion por variables de estado, tal y como se detalla a lo largo de este captulo, o mediante el uso de funciones de transferencia, como se describe en el apendice A. Siguiendo el primer metodo, y resolviendo la correspondiente ecuacion de Riccati de control se tendra que la matriz de realimentacion de estados es, Kc = [ 50 10 ] Las correspondientes funciones de transferencia implicadas en el desarrollo son respectivamente: s + 52:915 Gc(s) = M (s)B = 8(:944 s + 1)(s + 3) 50 + 10s Hc(s) = (s + 1)(s + 3) La funcion de transferencia correspondiente al bucle cerrado se obtiene de la expresion general: Gbc(s) = C (sI A + BKc) 1B o en el caso de tratarse de un sistema de simple entrada-salida, tambien puede obtenerse de, (9:14) Gbc(s) = 1 +GG(s)(s) = s2 +s14+s2+ 53 c Con este regulador lqr se cumplen las especi caciones del sistema en bucle cerrado (regulador optimo, que situa los polos del sistema en lazo cerrado en las posiciones 7:0 2:0j ), y la funcion de transferencia del bucle abierto Hc(s), tiene como era de esperar muy buenas caracteristicas de robustez: margen de fase de 86 y margen de ganancia in nito. Sin embargo, si el estado no es accesible es necesario dise~nar un observador de estado o ltro de Kalman para estimarlo, con lo cual se obtiene el correspondiente controlador lqg. Para ello se tendran las siguientes matrices de covarianza: Qo = T ; Ro = 1 que tras resolver la correspondiente ecuacion algebraica de Riccati se obtiene la matriz de ganancia del ltro de Kalman Ko. Una vez conocidas Kc y Ko , el regulador se puede obtener de forma general a partir de la expresion, K (s) = Kc(sI A + BKc + Ko C ) 1Ko
210 de donde se obtiene:
Controlador LTR basado en observador
s + 2:6) K (s) = (s 1000( 18:66)(s + 42:7)
Si se calcula la funcion de transferencia en bucle cerrado con el regulador lqg, se obtiene la misma obtenida anteriormente (ecuacion 9.14), dado que la inclusion del observador no modi ca el lazo cerrado del sistema de control. Sin embargo, si se analiza la funcion de transferencia en lazo abierto K (s)G(s), se obtiene un margen de fase de 15 y un margen de ganancia de 1:9 db. Los cuales son sensiblemente inferiores a los obtenidos con el regulador lqr. Por lo que la robustez del sistema con el regulador lqg sufre un serio deterioro. A n de mejorar la robustez, a continuacion se dise~na un regulador lqg/ltr. Para ello, se modi ca la matriz de covarianza en la forma: Qo = T + qBB T Para dise~nar el regulador lqg/ltr se va incrementando q desde cero (regulador lqg) hasta un valor razonable para tener un compromiso entre la estimacion y la robustez. Este proceso se puede ver en la gura 9.3, donde se representa el diagrama de Nyquist de la funcion de transferencia en bucle abierto para distintos valores del parametro q; as mismo en la tabla adjunta se dan los valores de los margenes de estabilidad obtenidos en cada caso. Margen de Margen de q ganancia (db) fase (grados) 0 -1.9 15.0 100 -2.6 20.0 500 -5.2 32.5 1000 -8.0 42.5 10000 1 74.5
9.4.2 Metodo LQG/LTR-o La tecnica consiste en explotar la dualidad existente entre los problemas lqr y kbf. Esta lleva a demostrar que si se establecen las equivalencias: AT ! A ; C T ! B BT ! C ; !M V1 ! Q ; Ro ! Rc
Metodos de dise~no LTR
211
1
0.5 q=100 q=0
Imag G(jw)
0
q=500
-0.5
q=1000
-1
q=10000
-1.5
Glqr -2 -3
-2.5
-2
-1.5
-1
-0.5
0
Real G(jw)
Figura 9.3: Diagrama de Nyquist para diferentes q la funcion (matriz) de transferencia en lazo abierto del observador (kbf):
Ho (s) = C (sI A) 1Ko = C (s)Ko goza de las mismas propiedades analizadas para el controlador lqr. Con la diferencia, de que ahora se presentan para una ftlad de nida a la salida de la planta en vez de la entrada (ver gura 9.4). Para el caso de planta de fase mnima se conseguira la recuperacion asintotica
r- as Ko - 6
(s)
C
Figura 9.4: Estructura de Ho (s) (kbf)
bs
y-
212
Controlador LTR no basado en observador
r-
m - 6 -6
B
? Ko - m
(s)
-Kc
Planta
y-
C Figura 9.5: Estructura regulador lqg/ltr-o de la ftlad a la salida de la planta: qlim !1 G(s)K (s) = C (sI
A) 1 Ko = Ho(s)
donde ahora el parametro\q" (ganancia de recuperacion) se emplea para modi car la matriz de ponderacion del estado, Qc en 9.2, de la forma:
Qc = Qc + qZ siendo Z = Z T 0 una matriz arbitraria. En la gura 9.5 se muestra la estructura del regulador lqg/ltr-o.
9.5 Controlador LTR no basado en observador El compensador obtenido con el metodo lqg/ltr-i tiene la forma 9.13, la ftla tomada a la entrada es: L(s) = K (s)G(s), y la ftlad especi cada es: Lt (s) = Hc(s). El error entre ambas (error de recuperacion):
E (s) = Lt (s) L(s)
(9:15)
puede expresarse como:
E (s) = N (s)[I + N (s)] 1[I + Hc(s)] Se de ne el nivel de recuperacion como el tama~no de E (s): [E (s)]
(9:16) (9:17)
Metodos de dise~no LTR
213
El error de recuperacion se anula si y solo si:
N (s) = 0 ; 8 ! siendo:
N (s) = Kc(sI A + KoC ) 1 B
(9:18)
En ese caso, se dice que se produce una recuperacion exacta de la ftlad a la entrada de la planta (eLTRi). En otro caso, se dira que la recuperacion ha sido solo aproximada (aLTRi), si el tama~no de N (s) se hace su cientemente peque~no para cualquier !. Se tratara de encontrar una matriz Ko(q) que consiga:
N (s) = Kc(sI A + Ko(q)C ) 1B ! 0
(9:19)
Para mantener la independencia entre los dise~nos de la realimentacion de estados y el observador, para una matriz Kc dada, se cumplira la relacion 9.19 si: (sI A + Ko(q)C ) 1B ! 0 q ! 1 Se puede comprobar, que a medida que el parametro\q" aumenta, tambien lo hace el tama~no de Ko(q), de forma que: si q ! 1 entonces kKo(q)kF ! 1 donde se de ne:
q
kKokF = traza(KoKoT )
La dependencia anterior ocasiona que para conseguir una recuperacion aproximada con [N (s)] lo su cientemente peque~no, tenga a veces que aumentar Ko excesivamente, provocando un incremento del ancho de banda del compensador, lo cual va a ser contraproducente en algunas situaciones practicas. Si se considera u^ la se~nal a la salida del compensador, y u(s) la se~nal de control de entrada a la planta, puede obtenerse:
u^(s) = N (s)u(s) Kc(sI A + KoC ) 1 y(s) Motivado por la relacion anterior y dado que la condicion de eLTRi se consigue anulando N (s), o equivalentemente haciendo que u^(s) no dependa explcitamente de u(s), Chen y col. (Chen et al. 1991) desarrollan una estructura para controlador no basada en observador (cnbo), donde la se~nal que genera el controlador no depende
214
Controlador LTR no basado en observador
r
-j - 6
u
u^
Kc
xc
y
Planta (s)
-
Ko
-
j 6-
C
Figura 9.6: Estructura del cnbo ltr-i de manera explcita de la se~nal de control a la planta (ver gura 9.6). Se elimina de esta forma la dependencia de la matriz de distribucion B de la se~nal de control, caracterstica de las estructuras convencionales basadas en observador. Las ecuaciones descriptivas del cnbo son:
x_ c = (A KoC )xc + Koy yc = Kcxc u^ = yc
(9.20)
y equivalentemente la representacion entrada-salida:
K (s) = Kc(sI A + KoC ) 1Ko
(9:21)
Si se compara su estructura con la cbo (ecuacion 9.13), se comprueba que unicamente di eren en que no aparece el termino BKc. Para obtener Ko y Kc se pueden resolver de forma similar a la realizada con el controlador basado en observador convencional. El controlador se desea estable, de forma que hay que examinar los autovalores i(A Ko C ) para cada Ko obtenido
Metodos de dise~no LTR
215
durante el proceso de dise~no. Para este regulador no se cumple el principio de separacion, por lo que para garantizar la estabilidad del sistema nominal en lazo cerrado se analiza si la matriz: " # A K C K C o o Alc = BKc A cumple: Re[i(Alc)] < 0 Se demuestra (Chen et al. 1991), que existe un valor de la ganancia de recuperacion qo tal que 8q qo , el sistema nominal en lazo cerrado y el controlador son asintoticamente estables. El error de recuperacion 9.15 obtenido con el cnbo es:
Ec(s) = N (s)
(9:22)
Si se toma la misma matriz Ko para cnbo y cbo, y se comparan 9.16 y 9.22, se obtiene que el nivel de recuperacion (9.17) obtenido para el primero es superior. As, si se cumple: [Lt (s)] 1 8! 2 D! y se supone un cierto nivel de recuperacion:
[N (s)] 1 siendo Lt (s) = Hc(s) y D! la region de frecuencias de interes. La relacion entre el error de recuperacion del cbo (E (s)) y del cnbo (Ec(s)) se obtiene de: (E ) = [M (I + M ) 1 (I + Hc)] (M ) [(I + M ) 1 ](I + Hc) = (M ) (I + Hc) = (Ec)(I + Hc) (I + M ) (I + M ) (Ec)[(M()H+c)1 1] (Ec)1(Hc) (Ec) concluyendo: (E ) (Ec) 8 ! 2 D! Se obtiene que un cnbo consigue mayor nivel de recuperacion que empleando un cbo para el mismo valor de Ko (q ) (y por tanto para el mismo valor de la ganancia
216
Controlador LTR no basado en observador
B r- -
6
Ko
? xc - ( s )
-Kc
u
Planta
y-
Figura 9.7: Estructura ltr-o (cnbo) de recuperacion\q"). Una consecuencia inmediata de gran utilidad practica, es que para un mismo grado de recuperacion el cnbo necesita matrices Ko con tama~nos (kKokF ) menores que los obtenidos con el cbo; y consecuentemente el regulador tendra un ancho de banda menor, protegiendo de esa forma al sistema de demandas de control excesivas, y en algunos casos de la posible saturacion de los actuadores. Otra ventaja consiste en que de esa forma se evita la ampli cacion innecesaria del ruido de medida; y nalmente una mayor robustez frente a la dinamica no modelada de alta frecuencia. En el desarrollo anterior se ha analizado la sntesis ltr-i con el cnbo. Tambien es posible realizar un dise~no ltr-o especi cando una ftlad a la salida de la planta. En este caso la estructura del regulador es la representada en la gura 9.7, con las ecuaciones descriptivas del cnbo ltr-o dadas por:
x_ c = (A BKc)xc + Ko(y r) yc = Kcxc u = yc
(9.23)
y la representacion entrada-salida del regulador:
K (s) = Kc(sI A + BKc)Ko Si se compara con la estructura cbo (ecuacion 9.13), se comprueba que unicamente di eren en que no aparece el termino KoC . Representa el caso dual del regulador
Metodos de dise~no LTR
217
ltr-i (cnbo), por lo que los resultados anteriores obtenidos para este, son igualmente validos (Saberi et al, 1993).
Como se comenta brevemente en la introduccion y se ha planteado a lo largo de la exposicion de este captulo, el procedimiento ltr constituye una metodologa de dise~no sistematica que ha transcendido de sus orgenes, y aunque por tradicion sigue denominandose lqg/ltr, se ha independizado del problema lqg. Dado que, el metodo ltr consiste en de nitiva en especi car una funcion (matriz) de transferencia en lazo abierto (que cumpla las especi caciones de dise~no deseadas), y a traves del ajuste de uno de los parametros de dise~no se realiza la recuperacion o aproximacion de la ftlad por medio de un regulador ltr.
Ejemplo: Dise~no ltr-i con estructura no basada en observador A continuacion se comparan las recuperaciones obtenidas mediante un regulador lqg/ltr-i convencional (cbo), y un regulador ltr-i no basado en observador (cnbo), para el mismo ejemplo visto anteriormente. Para ello, se parte del mismo sistema dado en el ejemplo anterior. El procedimiento de recuperacion, al igual que antes se indicara, consiste en hacer depender la matriz de covarianza Qo del parametro q, o tambien llamado ganancia de recuperacion, en la forma
Qo =
T
+ qBB T
El regulador lqg/ltr-i convencional se obtiene de,
K (s) = Kc(sI A + BKc + Ko C ) 1Ko mientras que el regulador ltr-i con estructura no basada en observador esta dado por, K (s) = Kc(sI A + KoC ) 1Ko Los niveles de recuperacion, o grados de aproximacion a la funcion de transferencia en lazo abierto obtenida con el regulador lqr, conseguidos por ambos reguladores (cbo y cnbo) pueden verse en las guras 9.8 a 9.13, para diferentes valores de q (las curvas continuas corresponden al control lqr, y las de trazos al ltr). Puede verse como la recuperacion obtenida con el cnob es sensiblemente superior al cbo. Ello genera una consecuencia positiva de cara a la robustez frente a la dinamica inmodelada de alta frecuencia, as como la menor sensibilidad frente a las perturbaciones. Ya que a medida que aumenta q se incrementa la ganancia del observador y consecuentemente el ancho de banda del regulador. De forma que para alcanzar
218
Controlador LTR no basado en observador 40
CBO q= 0
40 20
mag(L) (db)
mag(L) (db)
20 0 -20 -40 -60 10 -3
0 -20 -40
10 0
-60 10 -3
10 3
0
0
-50
-50
-100 -150 10 0
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 0
-100 -150 -200 10 -3
10 3
w (rad/s)
10 0
10 3
w (rad/s)
Figura 9.8: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q1 CBO q= 500
50
mag(L) (db)
mag(L) (db)
50
0
-50
-100 10 -3
10 0
0
-50
-100 10 -3
10 3
0
0
-50
-50
-100 -150 10 0 w (rad/s)
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 500
10 3
-100 -150 -200 10 -3
10 0
10 3
w (rad/s)
Figura 9.9: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q2
Metodos de dise~no LTR CBO q= 2500
50
mag(L) (db)
mag(L) (db)
50
219
0
-50
-100 10 -3
10 0
0
-50
-100 10 -3
10 3
0
0
-50
-50
-100 -150 10 0
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 2500
-100 -150 -200 10 -3
10 3
w (rad/s)
10 0
10 3
w (rad/s)
Figura 9.10: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q3 CBO q= 3600
50
mag(L) (db)
mag(L) (db)
50
0
-50
-100 10 -3
10 0
0
-50
-100 10 -3
10 3
0
0
-100
-100
-200 -300 10 0 w (rad/s)
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-400 10 -3
CNBO q= 3600
10 3
-200 -300 -400 10 -3
10 0
10 3
w (rad/s)
Figura 9.11: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q4
220
Controlador LTR no basado en observador 40
CBO q= 25000
40 20
mag(L) (db)
mag(L) (db)
20 0 -20 -40 -60 10 -3
0 -20 -40
10 0
-60 10 -3
10 3
0
0
-50
-50
-100 -150 10 0
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 25000
-100 -150 -200 10 -3
10 3
w (rad/s)
10 0
10 3
w (rad/s)
Figura 9.12: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q5 40
CBO q= 1e+005
40 20
mag(L) (db)
mag(L) (db)
20 0 -20 -40 -60 10 -3
0 -20 -40
10 0
-60 10 -3
10 3
0
0
-50
-50
-100 -150 10 0 w (rad/s)
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 1e+005
10 3
-100 -150 -200 10 -3
10 0
10 3
w (rad/s)
Figura 9.13: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q6
Metodos de dise~no LTR
221
- E (s) a
r
- Lt (s) - ?j rb L(s)
Figura 9.14: El error de recuperacion como una incertidumbre aditiva una recuperacion adecuada, sea necesario incrementar de forma excesiva el valor del parametro q o ganancia de recuperacion. Se extrae por tanto del analisis anterior, que la ventaja basica del regulador ltr (cnbo) es que consigue una aproximacion o recuperacion mejor que un regulador lqg/ltr (cbo) para un mismo valor de q . Lo cual tiene mucha relevancia de cara a la implementacion fsica del regulador en un ambiente real.
9.6 Controlador
LT R=H
1
En el captulo siguiente se trata ampliamente la teora relacionada con el control H1. Sin embargo, a continuacion se plantea un problema particularmente interesante: se trata de encontrar un regulador lqg/ltr-i, tal que una medida de la aproximacion de la respuesta en frecuencia en lazo abierto conseguida por el regulador ltr al lqr este acotada superiormente. Dicha medida se va a caracterizar mediante una cota H1, tal y como se describe a continuacion. En este apartado se presenta un procedimiento para obtener un controlador
lqg/ltr que consigue aproximar la respuesta en frecuencia en lazo abierto (ftla) a una especi cada (ftlad), con un determinado grado de aproximacion o de re-
cuperacion. La solucion se obtiene resolviendo un problema de control suboptimo H1. Como ya se ha descrito en este captulo, el procedimiento lqg/ltr-i consiste en encontrar un controlador K (s) que consiga acercar a la ftla: L(s) = K (s)G(s) a una ftlad: Lt (s) = Hc(s) dada.
Controlador LTR=H1
222
Para el analisis del problema de la recuperacion, puede interpretarse a L(s) como si se tratara de Lt (s) con una incertidumbre aditiva (ver gura 9.14): E (s) = L(s) Lt (s) Se de ne el grado de recuperacion (Saeki 1992), como: E = kE (s)[I + Lt (s)] 1k1
(9:24)
Si se emplea un cbo, se obtiene un error de recuperacion que puede expresarse: E (s) = Kc(sI A + BKc + KoC ) 1B [I + Hc(s)] (9:25) como se desea que E (s) sea lo menor posible (al menos en el rango de frecuencias de interes), se puede plantear el problema de conseguir un grado de recuperacion por debajo de un mnimo deseable E , y expresarlo como una cota H1. Teniendo en cuenta la de nicion 9.24 y la expresion 9.25 queda: E = kKc(sI A + BKc + Ko C ) 1B [I + Hc(s)][I + Hc(s)] 1k1 < E lo que equivale a encontrar una matriz Ko (q) que satisfaga: kKc(sI A + BKc + KoC ) 1B k1 < E
(9:26) (9:27)
Para obtener la solucion del problema anterior, se tiene el siguiente teorema (Saeki, 1992):
Teorema: Existe una matriz Ko, que satisface la ecuacion 9.27, si y solo si la
ecuacion algebraica de Riccati:
(A BKc)X + X (A BKc)T X ( 1 C T C 12 KcT Kc)X + Q + BB T = 0 (9:28) E tiene una solucion X = X T > 0, para un numero real > 0, lo su cientemente peque~no y una matriz arbitraria Q = QT > 0. Obteniendose como solucion: Ko = 21 XC T El papel desempe~nado por es similar al de 1=q2 en el procedimiento de recuperacion descrito en apartados anteriores. El resultado anterior es valido tanto para plantas de fase mnima as como para plantas de fase no mnima. A continuacion se da un procedimiento a seguir para el calculo del regulador LTR=H1:
Metodos de dise~no LTR
223
1. Se elige una matriz arbitraria simetrica de nida positiva Q, un valor de E dentro del intervalo 0 < E < 1 y un valor lo su cientemente peque~no de = 1 > 0 2. Se resuelve la ecuacion de Riccati 9.28. 3. Si su solucion X no es de nida positiva se incrementa el valor de E y se vuelve al paso 2. 4. Si X es de nida positiva se resuelve la ecuacion 9.28 para distintos valores de 2 (0; 1 ), para todos los cuales la ecuacion de Riccati tiene solucion de nida positiva. 5. Se elige la matriz Ko para un valor de del intervalo anterior, para el cual se obtiene el valor inferior de la norma de Frobenius de la matriz Ko ,
q
kK kF = traza (KoT Ko) Con el procedimiento anterior, se consigue el grado de recuperacion deseado, a la vez que se evita incrementar el tama~no de Ko , y con ello el que el ancho de banda aumente en exceso, protegiendo por tanto al sistema frente a la dinamica inmodelada de alta frecuencia, de las perturbaciones y ruidos de medida de los sensores.
Ejemplo: Controlador LTR=H1 Se van a considerar dos casos, el primero correspondiente a una planta de fase mnima (caso 1), y el segundo (caso 2) que trata con una planta de fase no mnima; a n de ver la validez del procedimiento para ambos tipos de plantas. Para ambos casos se emplea,
A=
"
#
" #
0 1 ; B= 0 3 4 1
la matriz de realimentacion de estados es Kc = [ 50 10 ], y la matriz Q se elige de la forma, " # 1 0 Q= 0 1
Controlador LTR=H1
224 Para caso 1 (fase mmina):
h i C = 2 1 ; y se elige E = 0:1
Para caso2 (fase no mnima):
h C= 2
i
0:1 ; y se elige E = 0:35
En las guras 9.15 y 9.16 se muestra la dependencia de la norma de Frobenius de la matriz de ganancia del observador Ko en funcion del parametro . Para todos los valores de mostrados en dichas guras se consiguen respectivamente
E < 0:1 (fase mnima) E < 0:35 (fase no mnima) Sin embargo, se elige el valor de para el que se obtiene el valor de kKokF inferior. Y por tanto, el regulador consigue el objetivo pre jado, pero con un ancho de banda inferior; protegiendo as al sistema frente a las incertidumbres, perturbaciones y ruidos que afectan a la planta.
Metodos de dise~no LTR
225
1600 1400
Norma de Frobenius de Ko
1200 1000 800 600 400 200 0 0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6 x10 -5
epsilon
Figura 9.15: Norma de Frobenius en funcion de para sistema de fase mnima x10 5 4.4
Norma de Frobenius de Ko
4.2
4
3.8
3.6
3.4
3.2
3 1
2
3
4
5 epsilon
6
7
8
9 x10 -9
Figura 9.16: Norma de Frobenius en funcion de para sistema de fase no mnima
Captulo 10 Controladores H1 10.1 Introduccion Como se ha descrito en el captulo 8, una forma de establecer las especi caciones de dise~no, consiste en la minimizacion de determinada funcion de coste formulada en el dominio frecuencial. Dos medidas de comportamiento, ampliamente empleadas en los problemas de control optimo y robusto, son las normas H2 y H1. La solucion al problema de control de optimizacion H2 (tambien denominado de Wiener-Hopf) fue desarrollada durante las decadas de los 60 y 70; mientras que el dise~no con H1 se inicio en el decenio de los 80 y continua aun su desarrollo. La formulacion del problema de control optimo H1 fue realizada por Zames en 1981 para el caso escalar y basada en una representacion entrada-salida, obteniendo la solucion del problema en 1984 (Zames y Francis, 1984). Posteriormente los mismos autores obtienen la solucion para el caso multivariable. Los primeros algoritmos para la resolucion de los problemas H1, desarrollados desde 1984 a 1988, tenan el inconveniente de que el controlador obtenido era, en general, de un orden elevado (Francis, 1987) comparado con el de la planta, por lo que como paso previo a la implementacion fsica del regulador era conveniente realizar un intenso trabajo para obtener reguladores de menor dimension. Es a partir del trabajo de Doyle y colaboradores (1989), cuando se da un fuerte impulso para la solucion algortmica de los problemas de control H1, obteniendose un controlador de la misma dimension que la planta ampliada, o tambien deno227
Justi cacion del control H1
228
minada planta generalizada, (constituida por el modelo del proceso junto con las matrices de ponderacion que constituyen las especi caciones de dise~no). Con ello, da comienzo la llamada segunda generacion de algoritmos en el espacio de estados de la teora H1. Caracterizada por el planteamiento del problema de optimizacion formulado en el espacio de estados y resuelto, de forma mas simple, a partir de dos ecuaciones algebraicas de Riccati desacopladas. En este captulo se tratan en primer lugar las tecnicas inicialmente desarrolladas para la solucion de los problemas de control H1, pasando a continuacion a describir las tecnicas basadas en el espacio de estados.
10.2 Justi cacion del control
1
H
En este apartado se trata de justi car la utilidad del control H1 en la teora de control. Para ello, se ha elegido el planteamiento de dos problemas de control esenciales: el problema del comportamiento nominal optimo, y el problema de la estabilidad robusta. En ambos casos, y a n de simpli car la exposicion, as como para que el lector familiarizado con la teora clasica de control lo encuentre mas ameno, se trata en ambos casos el problema escalar. Tambien se presenta la conexion entre la teora de juegos diferencial y el control H1.
10.2.1 Interpretacion H1 del comportamiento nominal El metodo de optimizacion de sistemas de control H1 esta relacionado con la minimizacion del valor de pico de la respuesta en frecuencia de cierta funcion en bucle cerrado. Para aclarar y profundizar en el signi cado de la aseveracion anterior, considerese el ejemplo del sistema basico de control de la gura 10.1; donde la planta tiene la funcion de transferencia G(s) y el controlador K (s), la se~nal d representa las perturbaciones actuando sobre el sistema y la se~nal y la salida del sistema. A partir de la gura 10.1, puede obtenerse la dependencia de la respuesta del sistema y la variable de control, con el resto de variables que actuan sobre el sistema. Queda: y(s) = T (s) r(s) + S (s) d(s) T (s) n(s) (10.1) u(s) = K (s) S (s) [r(s) n(s) d(s)] (10.2) Como puede verse en la ecuacion 10.1, la funcion de sensibilidad S caracteriza
Controladores H1
6
r -
229
d
K (s)
u-
- ?
G(s)
y
-
6 n
Figura 10.1: Estructura de un sistema de control convencional el comportamiento del sistema de control con respecto a las perturbaciones (d). Un problema de dise~no puede consistir en obtener un controlador K que consiga un rechazo o atenuacion considerable de las perturbaciones,
S0 al menos en la zona de frecuencias de actuacion de la perturbacion. El problema original considerado por Zames (1981) consiste en encontrar un compensador K que haga al sistema de control estable y minimice el valor de pico de nido como, k S k1= max (10:3) ! jS (j! )j Dado que para algunas funciones el valor de pico puede no existir, se reemplaza este por el supremo o menor de las cotas superiores, as que,
jjS jj1 = sup jS (j!)j !
(10:4)
En general, para el caso multivariable, signi ca minimizar el supremo del valor singular maximo. k S k1= sup [S (j!)] !
La justi cacion de este problema reside en que si el valor de pico de la funcion de sensibilidad es peque~no, entonces la magnitud de S necesariamente es peque~na para
Justi cacion del control H1
230
todas las frecuencias, y por tanto las perturbaciones seran atenuadas para todas las frecuencias. La minimizacion de jjS jj1 es la optimizacion del peor caso, porque ello equivale a la minimizacion del efecto sobre la salida de la peor perturbacion (es decir, una perturbacion armonica a la frecuencia donde jS j tiene el valor de pico). El problema del peor caso tiene una interpretacion matematica muy signi cativa, tal y como se expone a continuacion. Supuesto que la pertubacion d es desconocida para las frecuencias de interes, pero tiene energa nita, el valor,
jjdjj2 =
sZ 1
1
jd(t)j2dt
(10:5)
se conoce como la norma-2 de la perturbacion d. La energa de d es el cuadrado de la norma-2. Entonces, la norma jjS jj del sistema S con entrada d y salida y inducida por la norma-2, se de ne como, (10:6) jjS jj = sup jjjjdyjjjj2 d:jjdjj2 0, de ah que se le de el adjetivo de interior. Se dice que una funcion de transferencia es exterior (outer) si no tiene ceros en Re s > 0 (o sea que quedan en el exterior de dicho semiplano complejo de la derecha). Desde el punto de vista de sistemas, una funcion de transferencia interior es un sistema estable de fase no mnima y pasa-todo con ganancia unidad; y una exterior es estable y de fase mnima. Toda funcion (matriz) de transferencia T 2 RH1 tiene una factorizacion
T = TiTo siendo Ti interior y To exterior. Para obtenerlas se pueden emplear por ejemplo las funciones\iofr.m y iofc.m" para Matlab de Robust Control Toolbox (Chiang y Safonov, 1992), o las funciones\inner y outer" del Program CC (Thompson, 1988). Para resolver el caso general, se transforma el problema de la siguiente forma:
kT1 T2Qk1 = kR X k1 con
R = T2i 1T1 2 RL1 ; X = T2o Q 2 RH1
donde se ha obtenido la factorizacion T2 = T2i T2o , siendo T2i una funcion de transferencia interior y T2o una exterior (conviene tener en cuenta que T2i fsicamente equivale a un ltro pasa-todo de ganancia unidad). Aplicando el teorema de Nehari, se obtiene que,
= inf fkR X k1 : R 2 RL1; X 2 RH1g = k Rk
248
Soluciones al problema de ajuste del modelo
A continuacion se da un algoritmo (alfaQ) para calcular y el optimo Q(s), para el caso escalar:
kT1 T2 Qk1; con: T2
T2T3 ; o tambien si: T3 = 1
1. Realizar la factorizacion interior-exterior de T2,
T2 = T2i T2o 2. Calcular,
R = T2i 1T1 se obtiene una realizacion mnima, R(s) (A; B; C; D)
3. Se resuelven las ecuaciones de Lyapunov,
AWc + WcAT = BB T AT Wo + WoA = C T C 4. Se obtiene el valor propio maximo, del producto de grammianos WcWo , y su correspondiente vector propio v. 5. Calcular,
f (s) (A; v; C; 0); g(s) = ( AT ; 1Wov; B T ; 0); X = R f=g 6. Se obtienen,
=j j; Q = T2o1X
Una vez calculado Q, se puede obtener el regulador optimo K a partir de la ecuacion 10.18.
10.5.2 Optimizacion del comportamiento nominal A n de ver la aplicabilidad de los resultados y metodos anteriores se plantea el problema de conseguir una especi cacion de comportamiento nominal (np) dada.
Controladores H1
249
w-
j 6
z
- G
K
-
Figura 10.9: Problema de comportamiento nominal. Sea el sistema de la gura 10.9, en la que se emplea una nomenclatura para las se~nales de acuerdo con la empleada en el problema estandar. As, se tiene que, z = Sw; S = =1 1 + GK Se plantea el problema de conseguir un seguimiento adecuado, al menos en el rango de frecuencias [0; !1]. Para ello se propone la siguiente especi cacion:
j S (j!) j< ; 8 ! 2 [0; !1] as por ejemplo, con = 0:01 se requiere un error de seguimiento inferior al 1% en dicho rango de frecuencias. Esto mismo se puede realizar de forma aproximada empleando una funcion de ponderacion W y la condicion
kWS k1 <
(10:19)
Una posible eleccion para W es la siguiente: 1
W (s) = (0:01w11 s + 1)k (0:1w1 s + 1)
k
Teniendo en cuenta la forma general del problema estandar, se tiene que P22 = G, ya que: z = w y = Gu e = w Gu u = Ke y por tanto, " # 1 G P= 1 G
250
Soluciones al problema de ajuste del modelo Si se realiza una factorizacion coprima de P22 ,
P22 = N=M; MX NY = 1 los reguladores que estabilizan al sistema vendran dados por, K = YX MQ NQ ; Q 2 RH1 al sustituir en S se obtiene, S = MX MNQ con lo que el problema de comportamiento nominal 10.19 equivale a
kT1 T2Qk1 < con: T1 = WMX; T2 = WMN . Se tratara de obtener un valor de
= inf fkT1 T2Qk1 : Q 2 RH1 tal que < , dependiendo el valor de del exponente k de W (s); por lo que se indicara por k .
Algoritmo (KNP) A continuacion se da un para resolver este problema de np. 1. Realizar la factorizacion coprima de G:
G = N=M; MX NY = 1 2. Se de ne la funcion de ponderacion, 1 s + 1)k (0 : 01 w 1 W (s) = (0:1w1 1s + 1)k
se toma inicialmente el valor k = 1. 3. Se obtiene
T1 = WMX; T2 = WMN; V (s) = (s + 1)l donde el exponente l es el grado relativo de G.
Controladores H1 4. Se sustituye T2 k ,
251
T2V , y por medio del algoritmo alfaQ, ya descrito, calcula
k = minfkT1 T2 Q1k1 : Q1 2 RH1 Si k , se incrementa k en uno, y se vuelve al paso 3. En otro caso, continuar. 5. Por medio del algoritmo alfaQ, calcular Q1 2 RH1, tal que, k = kT1 T2Q1 k1 6. Se calcula nalmente el regulador, a K = YX MQ NQa con Qa(s) = V (s)Q1 (s)=(0:1w1 1s + 1)l.
Ejemplo: Con el siguiente ejemplo, se ilustra el procedimiento anterior para una planta de fase no mnima s 2) G(s) = (s (+s 1)(1)( s2 + s + 1) Para las especi caciones de comportamiento nominal se emplean w1 = 0:01; = 0:1 ( 20 db). Por tanto, se desea conseguir un error de seguimiento inferior al 10% para se~nales de referencia con ancho de banda inferior a 0:01 rad/s. 1. Como la planta es estable, se toman:
N = G; M = 1; X = 1; Y = 1 2. Se elige 3. Se calculan
s + 1 k W (s) = 10s + 1 s + 1 k T1(s) = 10s + 1 ; V (s) = s + 1 k s 2) T2 (s) = 10ss++11 (s (+s 1)(1)( s2 + s + 1)
252
Soluciones al problema de ajuste del modelo
4. Se obtienen: 1 = 0:2299; 2 = 0:0511, y por tanto 2 < ; k = 2. 5. Se calcula
0:3613)(s2 + s + 1) Q1(s) = 6:114 (s + (s + 4:656)(s + 1)2
6. Y nalmente
:3613)(s2 + s + 1) Qa (s) = 6:114 (s(s++4:0656)( s + 1)(10s + 1) (s + 0:3613)(s + 1)(s2 + s + 1) K (s) = 0:6114 (s + 0:004698)( s + 0:5280)(s2 + 5:612s + 9:599) En la gura 10.10 pueden verse las magnitudes de las funciones de sensibilidad j S (j!) j y sensibilidad complementaria j T (j!) j obtenidas; la respuesta temporal para consigna escalon unidad se tiene en la gura 10.11, puede comprobarse el comportamiento de fase no mnima que presenta el sistema. 5 0 Sensibilidad
-5
magnitud (dB)
-10 -15 -20 -25 -30 Sensibilidad complementaria
-35 -40 -45 10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
rad/s
Figura 10.10: Magnitudes de j S (j!) j; j T (j!) j, problema de np
Controladores H1
253
1
respuesta lazo cerrado
0.8
0.6
0.4
0.2
0
-0.2
0
10
20
30
40
50
60
70
80
segundos
Figura 10.11: Respuesta temporal a escalon unidad, problema de np
10.6 Problemas de control de estados
2
1
H ;H
en el espacio
En la primera parte de este captulo se ha presentado una forma de resolver el problema de control H1 para el caso de sistemas de una entrada y una salida (planta escalar), el cual sigue el tratamiento original realizado por Francis (1987). Igualmente, siguiendo un procedimiento similar, aunque bastante mas elaborado y complejo, es posible obtener los correspondientes algoritmos para resolver el problema multivariable. Si bien, para ello resulta mas ventajoso emplear el tratamiento en el espacio de estados que se presenta a continuacion; el cual es general y valido independientemente del caracter escalar o vectorial de la planta a controlar, consituyendo un metodo mas compacto. A pesar de ello, se ha comenzado este captulo con el procedimiento entradasalida descrito en los apartados anteriores; a n de presentar los orgenes del problema, as como el planteamiento seguido para su resolucion. Se trata con ello que el lector se situe ante el problema de control H1 con una perspectiva que va desde su enfoque clasico al planteamiento actual.
Problemas de control H2; H1 en el espacio de estados
254
Los algoritmos desarrollados en el espacio de estado se caracterizan en general por estar basados en la solucion de dos ecuaciones algebraicas de Riccati desacopladas, partiendo de las matrices de estado de la planta ampliada o generalizada. A partir del trabajo de Doyle et al.(1989) se inicia la etapa actual del desarrollo de algoritmos para la resolucion de los problemas de control H1. Considerese una realizacion en el espacio de estados de la planta ampliada P (s) (ver gura 10.5) expresada como:
x_p = Apxp + B1 w + B2u z = C1 x + D11 w + D12u e = C2 x + D21 w + D22u
(10.20)
o en forma abreviada como,
P (s) (Ap; Bp; Cp; Dp) con,
Bp = [B1 B2 ] ; CpT = [C1 C2] " # D D 11 12 Dp = D D 21
22
De forma general, el problema de dise~no se puede expresar de la siguiente forma: dado el sistema de la gura 10.5, se tratara de encontrar un regulador K (s) 4 , asintoticamente estable que haga al sistema en lazo cerrado Tzw internamente estable y que minimice la norma H2 (problema H2) o la norma H1 (problema H1) de Tzw . En el tratamiento que hacen Doyle et al.(1989) de ambos problemas (H2; H1), en el espacio de estados se tienen en cuenta algunas suposiciones, que sirven para simpli car la formulacion, y van a constituir las hipotesis de trabajo del problema de control optimo H1 que a continuacion se desarrolla. Las condiciones supuestas para las matrices de estado de la planta ampliada P (s) son las siguientes: 1. Los pares (Ap; B1) y (Ap; B2 ) son estabilizables. 2. Los pares (C1; Ap) y (C2 ; Ap) son detectables. Los controladores racionales propios, detectables y estabilizables que dotan al sistema en lazo cerrado de estabilidad interna son denominados controladores admisibles. 4
Controladores H1
255
3. D12T C1 = 0 y D12T D12 = I 4. B1D21T = 0 y D21D21T = I 5. D11 = 0 y D22 = 0 Las suposiciones (1) y (2) garantizan la existencia de la solucion de las ecuaciones de Riccati de control y del observador. La suposicion (3) implica la ortogonalidad entre C1 x y D12 u, lo cual en la formulacion de un problema lqg implica que la funcion de costes no tendra ponderacion cruzada entre el estado x y la entrada de control u, a la vez que la matriz de ponderacion del vector de control sera la matriz unidad. La (4) equivale a la (3) para las matrices de covarianza de los ruidos actuantes sobre el proceso y sobre la medida (ruido en sensores). La suposicion (5) se hace para simpli car la formulacion, y no supone perdida de generalidad, ya que un problema determinado puede transformarse en uno equivalente que satisfaga tales requerimientos (Green y Limebeer, 1995, Safonov et al.1989).
10.6.1 Controlador optimo H2 Como se ha descrito en el apartado anterior, una forma de expresar algunas de las especi caciones de dise~no es mediante la minimizacion de la norma H2 de la funcion (matriz) de transferencia Tzw . O expresado en terminos de se~nales: se trata de encontrar un controlador K (s) asintoticamente estable que estabilice al sistema en lazo cerrado y que minimice la norma H2 de la se~nal de respuesta del sistema a una se~nal de entrada caracterizada por ser ruido blanco con intensidad unidad. Esto expresado en forma analtica supone la minimizacion de la funcion de coste: Z1 T ( j! )T (j! )]d! = kT k2 JH2 = 21 traza[Tzw (10:21) zw zw 2 0 Una forma de calcular la norma H2 es mediante:
kTzw k22 = traza(CT WcCTT ) = traza(BTT WoBT )
(10:22)
donde las matrices (AT ; BT ; CT ; DT ) determinan una realizacion en el espacio de estados del sistema Tzw ; y las matrices Wc y Wo son sus respectivos grammianos de controlabilidad y observabilidad. Estos se pueden obtener resolviendo las correspondientes ecuaciones de Lyapunov:
AT Wc + WcATT + BT BTT = 0
Problemas de control H2; H1 en el espacio de estados
256
ATT Wo + WoAT + CTT CT = 0 El controlador optimo K (s) que minimiza kTzw k2 se calcula resolviendo el par de ecuaciones algebraicas de Riccati independientes:
ATp X2 + X2 Ap X2 B2B2T X2 C1T C1 = 0
(10:23)
ApY2 + Y2ATp Y2C2T C2Y2 B1 B1T = 0
(10:24)
que teniendo en cuenta la de nicion del operador de Riccati (ver apendice C.2) puede ponerse de forma equivalente como:
X2 = Ric(HX 2) Y2 = Ric(HY 2 ) siendo las matrices Hamiltonianas asociadas: " T # A B B p 2 2 HX 2 = C T C ATp 1 1
HY 2 =
"
ATp B1 B1T
C2T C2T Ap
#
A partir de las soluciones X2; Y2 respectivas de 10.23 y 10.24 se tiene el compensador optimo: K (s) = Kc(sI Ap + B2Kc + KoC2) 1 Ko (10:25) donde: Kc = B2T X2 ; Ko = Y2C2T son las matrices de realimentacion de estados y de ganancia del observador, en la estructura convencional del controlador lqg. El mnimo de JH2 se obtiene de : min kTzw k22 = kGcB1k22 + kKcGok22 = kGcKo k22 + kC1Gok22 con:
Gc(s) = (C1 + D12 Kc)(sI Ap B2Kc) 1 Go(s) = (sI Ap KoC2 ) 1(B1 + Ko D21)
(10:26)
Controladores H1
257
10.6.2 Relacion entre LQG/LTR y H2 Los problemas de dise~nos lqg/ltr-i y lqg/ltr-o pueden interpretarse como dos casos particulares del problema de optimizacion H2 de sensibilidad mixta (Stein et al. 1987). A continuacion de pone de mani esto dicha correspondencia. Considerese la planta a controlar G(s) representada por las ecuaciones de estado
x_ = Ax + Bu + v1 y = Cx + Iv2 z = Mx donde: G(s) = C (s)B; (s) = (sI A) 1 y los ruidos sobre el proceso (v1) y sobre los sensores (v2) se consideran ruidos gausianos con intensidad unidad e incorrelados entre s. Un regulador optimo lqg minimiza la funcion de coste ) ( ZT 1 T 2 T (10:27) JLQG = E T (z z + u u)dt 0 Teniendo en cuenta que se tienen las siguientes relaciones " # " # 2 u(s) 3 y(s) = G(s) C (s) I 64 v (s) 75 1 z(s) M (s)B M (s) 0 v (s) 2
u(s) = K (s)y(s) " # " # z = T v1 zw v u 2 " # T T 11 12 Tzw = T T 21 22
se obtiene: donde, con,
T11 T12 T21 T22
(10:28)
= M (s) M (s)K (s)[I + G(s)K (s)] 1C (s) = M (s)BK (s)[I + G(s)K (s)] 1 = K (s)[I + G(s)K (s)] 1C (s) = K (s)[IG(s)K (s)] 1
Sustituyendo la ecuacion 10.28 en la 10.27 y teniendo en cuenta el teorema de Parseval (Stein y Athans, 1987) se obtiene que la funcion de coste dada en 10.27 se
Problemas de control H2; H1 en el espacio de estados
258
puede expresar en el dominio de la frecuencia como
1 Z1 H ]d! JLQG = 2 tr [Tzw Tzw 0
Lo cual establece la relacion entre los problemas de optimizacion H2 y lqg. A continuacion se avanza mas en dicha relacion, estableciendose las condiciones bajo las cuales el problema de dise~no lqg/ltr se puede transformar en un problema de control optimo H2 de sensibilidad mixta.
Caso lqg/ltr-i. Si se consideran las siguientes condiciones: W (s) = M (s)B (1=) = B 0 queda:
Tzw (s)
"
# " # W (s)[I + K (s)G(s)] 1 0 = W (s)Si(s) 0 [I + K (s)G(s)]1K (s)G(s) 0 Ti (s) 0
A partir de lo cual se concluye que el problema lqg/ltr-i equivale a un problema de sensibilidad mixta H2 .
Caso lqg/ltr-o. Si se consideran las siguentes condiciones: W (s) = C (s) (1=) M = C 0 queda: T (s) Tzw
"
#
"
[I + G(s)K (s)] 1W (s) 0 = So(s)W (s) 0 G(s)K (s)[I + G(s)K (s)]1 0 To (s) 0
#
Y por tanto, al igual que para el caso anterior, tambien se obtiene que el problema lqg/ltr-o equivale a un problema de sensibilidad mixta H2 .
Controladores H1
259
10.6.3 Controlador H1 En un determinado problema de control, puede que se este interesado en minimizar el maximo alcanzable por la respuesta frecuencial de Tzw , en vez de minimizar algun tipo de promedio, como se hace en la optimizacion H2 . En ese caso, se plantea un problema de optimizacion H1, en el que se trata de obtener el mnimo de:
kTzw k1 = sup (Tzw ) !
(10:29)
Para contrastar los problemas H1 y H2 , considerese el caso monovariable (escalar) en el que se tenga: kTzw k1 esto equivale a que para una se~nal w con kwkrms 1, el sistema dara una respuesta z = Tzw w tal que kTzw wkrms ; mientras que si:
kTzuk2 ello equivale a que para una se~nal particular w de ruido blanco de intensidad unidad, el sistema dara una respuesta z = Tzw w con kTzw wkrms . Por lo tanto un problema de minimizacion H1 es mas general que uno H2, al abarcar el primero la posibilidad de una gama mas amplia de se~nales de entrada. Otra distincion la supone el hecho de que H2 minimiza el valor cuadratico medio de la magnitud sobre todas las frecuencias, no haciendo alusion directa alguna a la existencia de posibles picos de peque~na anchura (resonancias pronunciadas pero muy estrechas), pues su efecto sobre el calculo del promedio sera poco apreciable. Sin embargo, la optimizacion H1 es el maximo de esos posibles picos el que tiene en cuenta (Stoorvogel, 1992). Para remarcar el aspecto distintivo entre los reguladores H2 y H1, a continuacion se va a utilizar el problema de sensibilidad mixta anteriormente de nido. Como se describe en el captulo 8, a partir de la relacion:
(WS So ) 1 se especi ca un comportamiento nominal deseado (np) y con:
(WT To) 1
Problemas de control H2; H1 en el espacio de estados
260
se especi ca una robustez de la estabilidad (rs) del sistema de control frente a incertidumbres multiplicativas situadas a la salida de la planta. 5 Una forma de que se veri quen simultaneamente las desigualdades anteriores es haciendo que se cumpla:
WS So kTzw k1 =
W T To
1
1
(10:30)
El regulador optimo H1 minimizara dicho valor, mientras que el regulador optimo H2 minimizara la norma kTzw k2 ; por lo que el primero trata directamente con el problema de maximizar la robustez del sistema de control, y de ah su atractivo y utilidad en los problemas de control robusto. El calculo de la norma H1 se puede hacer directamente a partir de su de nicion (10.29), o de forma indirecta. As, si se tiene una realizacion de Tzw dada por las matrices (AT ; BT ; CT ; DT ), se de ne la matriz Hamiltoniana asociada H como:
H=
"
AT BT BTT = 2 CTT CT ATT
#
y se establecen las siguientes equivalencias (Doyle et al. 1989): 1. Tzw cumple:
kTzw k1 <
(10:31)
2. H no tiene autovalores en el eje imaginario. 3. H 2 dom (Ric) (ver apendice C.2) 4. H 2 dom (Ric) y Ric(Tzw ) > 0 si (C; A) es observable. Teniendo en cuenta (1) y (2) se puede derivar un metodo para calcular kTzw k1: 1. Se selecciona un escalar > 0. 2. Se forma la matriz H y se testea si tiene autovalores en el eje imaginario. 3. Se aumenta o disminuye de acuerdo con el resultado del paso 2. 5
En ese caso el sistema de interconexion coincide con la funcion de sensibilidad complementaria:
M (s) = To (s) (ver captulo 8).
Controladores H1
261
4. Se repite el proceso, iterando con hasta encontrar un valor crtico o que con cierta precision cumpla la condicion del paso 2, en ese caso se consigue una cota ajustada kTzw k1 < o. Para encontrar un controlador asintoticamente estable K (s), que consiga kTzw k1 <
, se resuelven el par de ecuaciones algebraicas de Riccati siguientes (Doyle et al, 1989):
ATp X1 + X1Ap X1[(1= 2)B1B1T B2 B2T ]X1 + C1T C1 = 0
(10:32)
ApY1 + Y1ATp Y1[(1= )2C1T C1 C2T C2]Y1 + B1 B1T = 0
(10:33)
o teniendo en cuenta la de nicion del operador de Riccati (ver apendice C.2):
X1 = Ric(HX 1) Y1 = Ric(HY 1) con las matrices Hamiltonianas asociadas: " 2 )B B T B B T # A (1 = p 1 1 2 2 HX 1 = C T C ATp 1 1
HY 1 =
"
ATp (1= 2)C1T C1 C2T C2 B1 C1T Ap
#
El controlador resultante es:
K (s) = Kc[sI Ap (1= 2)B1B1T X1 B2Kc ZKoC2] 1 Ko
(10:34)
donde:
Kc = B2T X1; Ko = Y1C2T ; Z = [I (1= 2)Y1X1] 1; K1 = B1 B1T X1(1= 2) El compensador 10.34 consigue kTzw k1 < , sin embargo la solucion no sera valida (es decir: el sistema en lazo cerrado no sera asintoticamente estable) a menos que se cumplan las condiciones siguientes:
X1 0 Y1 0 j max (X1Y1) j < 2
(10.35)
262
Problemas de control H2; H1 en el espacio de estados
Aunque no sea tan evidente como en el caso H2 , el controlador H1 tiene una estructura constituida por una realimentacion de estados y un observador (ver gura 10.12). La dinamica del compensador queda descrita por el conjunto de ecuaciones: x^_ = Apx^ + B2 u + ZKo (^y y) + B1w^ y^ = C2x^ u = Kcx^ (10.36) 2 T w^ = (1= )B1 X1x^ donde Kc representa la matriz de realimentacion de estados, ZKo la matriz de ganancia del observador y w^ supone un estimado de la peor perturbacion que pudiera darse sobre el sistema, en el sentido de que maximizara la magnitud (Doyle et al, 1989): kzk22 2kwk22 El calculo para obtener la solucion de un problema de optimizacion H1 requiere un proceso iterativo, iniciandose con un valor inicial para el parametro , probando si se cumplen todas las condiciones necesarias (10.31,10.35) y modi candolo hasta encontrar una solucion adecuada. El proceso de busqueda puede terminar con el valor mnimo min, o en una solucion suboptima ( o > min).
10.6.4 Algoritmo de calculo del regulador H1 A la hora de aplicar el algoritmo de calculo del regulador H1 anteriormente descrito, pueden aparecer algunos problemas numericos que di culten o hagan imposible su resolucion. Por ello, se han desarrollado, y aun se siguen desarrollando en la actualidad, diferentes algoritmos de calculo que tratan de mejorar y facilitar la resolucion numerica de las ecuaciones. En la bibiliografa especializada pueden encontrarse diferentes opciones para dicho calculo (Green y Limebeer, 1995). A continuacion se da un algoritmo alternativo al descrito anteriormente, que mejora las propiedades numericas para el calculo del controlador H1. La ley de control se obtiene de
u = Kcx^ y el estimador del estado se calcula a partir de las ecuaciones x^_ = Apx^ + B2 u + B1w^ + Z1Ko (y y^)
Controladores H1
263
B2 r
? x^ - ZK - - ( s ) Kc p o 6 6 6 -
u
- G(s)
y
-
K1 C2 Figura 10.12: Estructura del controlador H1
w^ = B1T X1x^(1= 2) y^ = C2 x^ + D21 B1T X1x^(1= 2) Las matrices Kc; Ko; Z1 se obtienen respectivamente de,
Kc = D120 (B2T X1 + D12T C1 );
D120 = (D12T D12 )
1
Ko = (Y1C2T + B1 D21T )D210 ; D210 = (D21 D21T ) Z1 = (I 2 Y1X1) 1
1
Las matrices X1; Y1 son soluciones de las correspondientes ecuaciones de Riccati, o de forma equivalente (ver apendice C.2):
"
donde,
0 DT C1 2 B1 B T B2 D0 B T # A B D p 2 12 12 1 12 2 X1 = Ric C10T C10 (Ap B2 D120 D12T C1 )T " T D0 C2 )T 2 C T C1 C T D0 C2 # ( A B D p 1 21 21 1 2 21 Y1 = Ric B10 D10T (Ap B1 D21T D210 C2)
C10 = (I D12 D120 D12T )C1; B10 = B1(I D21T D210 D21 )
Problemas de control H2; H1 en el espacio de estados
264
Finalmente, se dan las matrices del regulador K ,
K (s) [Ar ; Br ; Cr ; Dr ] con,
Ar = Ap B2Kc Z1Ko C2 + 2(B1 B1T Z1Ko D21B1T )X1 Br = Z1Ko; Cr = Kc; Dr = 0
as como la realizacion de Tzw :
" # " #" # " # x_ = Ap B2 Kc x + B1 Z1Ko C2 T22 x^ Z1KoD21 w x^_ " # " # " # z = C1 D12 Kc + 0 w y C2 0 D21
donde se tiene que,
T22 = Ap B2Kc + 2B1 B1T X1 Z1Ko(C2 + 2 D21 B1T X1)
10.6.5 Ejemplos ilustrativos Ejemplo: Dise~no H1 de sistema doble integrador Sea el sistema compuesto por la planta nominal a controlar ( gura 10.13),
G(s) = s12 = uy((ss)) la perturbacion d, y el ruido de medida n actuantes sobre el sistema, cuyo conjunto queda descrito por las ecuaciones siguientes:
x_ 1 = d + u x_ 2 = x1 y = x2 + n Se desea dise~nar un regulador H1 que consiga atenuar el efecto de d y n sobre el sistema, a la vez que la se~nal de control no tome valores excesivos a n de evitar en lo posible la saturacion de los actuadores. Para lo cual, se incluira la se~nal de control, junto con la propia variable de estado x2 , en las variables empleadas para evaluar
Controladores H1
265
d
?
-
u
- 1 s
x1 - 1 s
x2
-
?
y
n
Figura 10.13: Diagrama de bloques
w
- 6
- 1 s
s
x2- ?
x1 - 1 s
s u
K (s)
y
Figura 10.14: Diagrama de bloques para H1
-
z
Problemas de control H2; H1 en el espacio de estados
266
el comportamiento del sistema en lazo cerrado; o sea, como elementos de z. Por lo que los respectivos vectores w; z implicados en los desarrollos teoricos comentados anteriormente ( gura 10.14), son en este caso:
" # " # d w = n ; z = xu2
Para la eleccion realizada, queda que las matrices que componen la realizacion de la planta generalizada son de la forma:
2 66 01 6 P (s) = 66 0 64 0
0 0 1 0 0 1
O sea,
Ap = B1 = C1 = D11 = D21 =
" " " " h
0 0 1 0
1 0 0 0 0
0 0 0 0 1
1 0 0 1 0
3 77 77 77 5
# #
1 0 ; 0 0
#
0 1 ; 0 0
#
0 0 ; 0 0
i
0 1 ;
2 3 1 6 B2 = 4 75 0
h i C2 = 0 1 " # D12 = 01 h i D22 = 0
Siguiento los pasos dados en este apartado, y tras un proceso iterativo de busqueda para el valor de , se obtiene que el algoritmo da una solucion factible para = 2:62, el cual esta proximo pero no coincide con el valor optimo. Para obtener el optimo se pueden emplear algoritmos mas so sticados; tales y como se dan en el Robust Control Toolbox (funcion\hinfsyn"), o en el -Synthesis Toolbox (funcion\hinfopt"), para Matlab. Para = 2:62 se obtiene el siguiente regulador H1:
Controladores H1
267
:3(s + 0:39) K (s) = (s +578 2:33)(s + 220:72) que equivale basicamente a un compensador de adelanto con un polo situado a alta frecuencia, incluido para mejorar la robustez del sistema. Para este regulador se obtienen: un margen de fase de 44.6 grados, un margen de ganancia de 44.3 db, y un porcentaje de incertidumbre multiplicativa tolerable (1/max(T )) del 70%. Para analizar el comportamiento del controlador dise~nado frente a la dinamica inmodelada, se considera que la planta real viene dada por G0 = G(1 + Em) con, s + 0:6667) Em (s) = s( 0:s30556 2 + s + 100 80
Tolerancia e incertidumbre (dB)
60 40 Tolerancia 20 0 -20 -40
Incertidumbre multiplicativa
-60 -80 10 -1
10 0
10 1
10 2
rad/s
Figura 10.15: Incertidumbre tolerable e incertidumbre existente En la gura 10.15 se muestran el nivel de tolerancia a incertidumbre multiplicativa del sistema de control, as como la magnitud de Em (j!). La respuesta temporal
Problemas de control H2; H1 en el espacio de estados
268 1.4
1.2
respuesta
1
0.8
0.6
0.4
0.2
0 0
2
4
6
8
10
12
14
tiempo (seg)
Figura 10.16: Comportamientos con planta nominal y planta real puede verse en la gura 10.16, en la que se muestra el comportamiento para el modelo nominal de la planta G, y para el modelo real G0. Como puede verse, en este caso el efecto de la dinamica inmodelada es muy poco apreciable, cosa que pone de mani esto la robustez del comportamiento del sistema de control, al menos para este tipo de incertidumbre.
Ejemplo: Dise~no de controladores H2; H1 de tiempo discreto En este ejemplo se plantea el problema de controlar una planta, cuyo modelo matematico es de tiempo continuo G(s), por medio de un regulador de tiempo discreto K (z), empleando un perodo de muestreo de Tm = 0:01 segundos. En la gura 10.17 se muestra el diagrama de bloques del sistema de control. El procedimiento de dise~no empleado sigue los pasos siguientes: 1. Se obtiene un modelo discreto de la planta G(z), empleando para ello la aproximacion del mantenedor de orden cero (ZOH).
Controladores H1
r -i
6 Tm
269
K (z)
Tm
ZHO
G(s)
y -
Figura 10.17: Controlador H1 de tiempo discreto 2. Se realiza la transformacion bilineal inversa, obteniendose un sistema continuo en el plano-w G(w). 3. Se dise~na el controlador H2; H1, obteniendo K (w) 4. Se emplea la transformacion bilineal para obtener el regulador equivalente de tiempo discreto K (z). En forma sintetica, dicho proceso de dise~no consiste en: 1
G(s) ZOH ! G(z) bilin! G(w) H2;H!1 K (w) bilin ! K (z ) donde el operador bilin empleado realiza una trasformacion del plano w al plano z consistente en: w = T2(z(z +1)1) m La transformacion inversa bilin 1 se emplea para dise~nar un regulador de tiempo discreto con tecnicas de tiempo continuo en el plano-w. La funcion de transferencia de la planta a controlar es,
G(s) = s3 + 30s2 +900 700s + 1000 En la gura 10.18 pueden verse las respuestas en frecuencia de G(s) y G(w) para un perodo de muestreo de Tm = 0:01 seg: Las especi caciones de dise~no para el sistema de control son:
Problemas de control H2; H1 en el espacio de estados
270 50
0 |G(w)|
|G(s)|, |G(w)| (db)
-50
-100
|G(s)|
-150
-200
-250 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.18: Respuestas en frecuencia de G(s)yG(w)
Especi cacion de comportamiento nominal (NP): reduccion de la sensibilidad
de al menos 1=100 hasta una frecuencia de aproximadamente 1 rad=seg. Lo anterior puede conseguirse mediante una funcion de ponderacion WS de la forma, s + 1)2 WS 1 = 0(:01( s=30 + 1)2 Especi cacion de estabilidad robusta (RS): un ancho de banda de unos 30 rad=s, una tolerancia a incertidumbre multiplicativa superior al 32 %, y una cada de j T j inferior a 20 db para frecuencias superiores a 2000 rad=s. Estas especi caciones se pueden tener en cuenta eligiendo una funcion de ponderacion WT de la forma, s=300 + 1) WT 1(s) = 3:16( (s=10 + 1) El parametro empleado en WS tiene el sentido fsico de que al aumentarlo se impone al sistema de control una especi cacion de np mas exigente (un valor inferior de j S j a baja frecuencia). El proceso de dise~no consiste en jar WT y variar , de forma que se cumpla la condicion de estabilidad robusta, as como que se optimice el comportamiento nominal simultaneamente para el valor mayor de posible. En la gura 10.19 se muestran las formas de WT 1 y WS 1 para = 1:5.
Controladores H1
271
20
10
|1/W_S|, |1/W_T| (db)
0
-10
|1/W_T|
-20
-30 |1/W_S| -40
-50 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.19: Respuesta en frecuencia de funciones de ponderacion inversas WS 1; WT 1 Se plantea por tanto un problema de control H1 de sensibilidad mixta (np + rs):
W S
S kTzw k1 =
W T
< 1 (10:37) T
1
Se inicia el proceso de dise~no con = 1, obteniendose un regulador H1 para el que se cumplen las especi caciones de dise~no. A n de mejorar las prestaciones del regulador, se inicia un proceso iterativo dando valores al parametro . Se concluye nalmente, que el objetivo de dise~no 10.37 se veri ca con un regulador H1 para un valor de hasta = 1:5, no cumpliendose para un regulador H2. En la gura 10.20 pueden compararse las respuestas en frecuencia de Tzw para ambos reguladores. Como puede comprobarse, el regulador H2 no consigue el objetivo kTzw k1 < 1, mientras s se alcanza con el regulador H1. En las guras 10.21, 10.22, 10.23 y 10.24 se muestran respectivamente las respuestas en frecuencia de WS 1 con S , WT 1 con T , para el regulador H2 y el H1. Finalmente en la gura 10.25 se muestra la curva de Nichols (de la funcion de transferencia en lazo abierto L = GK ) obtenida con el regulador H1. A partir de ella, puede obtenerse que el controlador dise~nado proporciona un margen de ganancia de
Problemas de control H2; H1 en el espacio de estados
272 4
H_2
2 0
|T_zw| (db)
-2 -4 H_inf
-6 -8 -10 -12 -14 -16 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.20: Respuesta en frecuencia de Tzw para reguladores H2 y H1 12 decibelios, y un margen de fase de 43 grados. Por otro lado, a partir de 1= j T j se obtiene una tolerancia a incertidumbre multiplicativa superior al 60 % en el peor de los casos. El regulador H1 obtenido, K (z), es de orden 6, el mismo de la planta generalizada. Ya que la planta a controlar es de orden 3, la funcion de ponderacion WS es de orden 2, y WT es de primer orden.
z6 40:2747z5 + 13:4628z4 + 35:544z3 31:404z2 + 3:7234z + 2:2497 K (z) = 16:7016 z6 1:5311z5 + 0:1799z4 + 0:2894z3 + 0:0413z2 + 0:0169z + 0:0037 En las guras 10.26 y 10.27 se muestran respectivamente la se~nal de control y la respuesta obtenida con el regulador H1.
Controladores H1
273
20 |1/W_S|
10
|S|, |1/W_S| (db)
0 |S| -10
-20
-30
-40
-50 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.21: Magnitudes de WS 1 y S para regulador H2 20 10 0
|T|, |1/W_T| (db)
|T| -10
|1/W_T|
-20 -30 -40 -50 -60 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.22: Magnitudes de WT 1 y T para regulador H2
Problemas de control H2; H1 en el espacio de estados
274 20
|1/W_S|
10
|S|, |1/W_S| (db)
0 |S| -10
-20
-30
-40
-50 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.23: Magnitudes de WS 1 y S para regulador H1 20 10 0
|T|, |1/W_T| (db)
|T| -10
|1/W_T|
-20 -30 -40 -50 -60 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.24: Magnitudes de WT 1 y T para regulador H1
Controladores H1
275
60
40
|L| (db)
20
0
-20
-40
-60
-80 -450
-400
-350
-300
-250
-200
-150
-100
-50
0
arg(L) (gra)
Figura 10.25: Curva de Nichols para regulador H1 20 15 10
control
5 0 -5 -10 -15 -20
5
10
15
20
25
30
35
40
45
50
muestras (Tm=0.01 seg.)
Figura 10.26: Se~nal de control para cambio en escalon unidad, con regulador H1
Problemas de control H2; H1 en el espacio de estados
276
1.4 1.2
respuesta
1 0.8 0.6 0.4 0.2 0
5
10
15
20
25
30
35
40
45
50
muestras (Tm=0.01 seg.)
Figura 10.27: Respuesta a escalon unidad, con regulador H1
Captulo 11 Aplicacion de control robusto 11.1 Introduccion Hasta la decada de los ochenta las aplicaciones de las tecnicas de control moderno en los buques haba sido algo bastante inusual. A pesar de la amplia aceptacion y exitos conseguidos en otras ramas de la ingeniera (probablemente el contrapunto sea la industria aeronautica), donde los avances de la teora de control han sido rapidamente incorporados en la busqueda de la mejora del funcionamiento y seguridad. Las razones de la inercia presentada por la industria naval hay que buscarlas en diversos factores, tales como: la mayor duracion de los barcos comparados con los aviones, la resistencia a intentar nuevas tecnicas cuando los metodos tradicionales han demostrado tener un funcionamiento valido, as como la cada en la industria de construccion naval, entre otros. En muchos casos, la innovacion ha consistido en la sustitucion directa de los antiguos sistemas de control analogicos por otros equivalentes digitales, y el aprovechamiento de la potencia de computacion del ordenador empleado, para incorporar o mejorar tareas de monitorizacion y alarma; mas que para explotar los bene cios que podra reportar el empleo de algoritmos de control avanzado. Los primeros autopilotos para el guiado automatico de barcos eran simples dispositivos en los que el error de rumbo se utilizaba para producir una orden al servosistema del timon proporcional al error del rumbo. Posteriormente se modi co incluyendo el efecto derivativo para mejorar la respuesta transitoria y el efecto inte277
278
Introduccion
gral para corregir los errores estacionarios debidos a las perturbaciones ambientales. Debido a su simplicidad, abilidad y bajo coste, los autopilotos pid aun se mantienen en la mayora de barcos. Uno de los principales inconvenientes es la necesidad de sintonizacion por parte del operador, para adaptarse al cambio de condiciones de navegacion. Ha sido el perodo de nales de los setenta y durante la decada de los ochenta, cuando la mejora del sistema de control de los buques ha experimentado un notable incremento en investigacion y desarrollo. La justi cacion se debe primordialmente a razones tales como: 1. Las elevadas subidas del precio del petroleo y la busqueda de la reduccion del coste en los transportes. 2. La exigencia de mejora en la seguridad del transporte martimo. 3. La transferencia tecnologica acelerada por los recientes avances de la microelectronica, informatica y telecomunicaciones. 4. El exito obtenido en otras ramas de la industria, en la aplicacion de los ultimos desarrollos de la teora de control. El impulso proporcionado en la ultima decada se pone de mani esto, en el hecho de que todos los buques de nueva construccion incorporan un sistema automatico mas o menos so sticado para el control del rumbo. Por otro lado, ha demostrado ser de gran utilidad, tanto para buques de la Marina Mercante como para los de la Armada, el que adicionalmente al problema del control del rumbo de un buque (escalar o monovariable), se considere el empleo de sistemas activos de estabilizacion para la regulacion del movimiento de balance; lo cual da lugar a un problema de control multivariable (sistema con dos entradas y dos salidas). Si bien en la mayora de sistemas instalados a bordo se tratan como dos problemas de control independientes, en el sentido de que los reguladores se dise~nan de forma independiente entre s, sin tener en cuenta el caracter vectorial de la planta. El problema del control de un buque puede interpretarse segun la losofa del control robusto, dado la gran cantidad de factores que van a in uir en la incertidumbre del modelo de la planta. La dinamica de un buque va a depender de una serie de factores, entre los que cabe destacar (Lopez et al, 1995):
Aplicacion de control robusto
279
Velocidad de crucero
Condiciones de carga
?
? Dinamica del buque
6 Perturbaciones ambientales
6 Otros factores
Figura 11.1: Factores que afectan a un buque 1. Velocidad de crucero. 2. Estado de carga. 3. Estado del mar, vientos y corrientes. 4. Profundidad. 5. Densidad del agua del mar. Un sistema de control e caz ha de tener en cuenta los errores de modelado que se pueden acumular debido al efecto de diferentes factores. Por lo que el analisis de robustez del sistema es esencial, dadas las diversas circunstancias que van a in uir sobre la dinamica de la planta y por tanto sobre el comportamiento del sistema de control. En este captulo se describen los dise~nos de controladores LTR, H2 y H1 multivariables para el control del rumbo y balance de un buque, proponiendose un conjunto de indicadores de robustez para su evaluacion.
280
Descripcion de la planta
11.2 Descripcion de la planta La complejidad de la dinamica de un buque, as como el alto coste economico y de tiempo para la realizacion de pruebas de mar experimentales, puso de mani esto la necesidad del empleo de modelos que captaran el comportamiento de un barco en diversas condiciones de navegacion. A partir de nales de los setenta el empleo de modelos matematicos hizo que se avanzara en el dise~no y aplicacion de nuevos sistemas de control en la industria naval, gracias a los avances conseguidos en los computadores digitales empleados para realizar las simulaciones. A partir de las leyes de la mecanica, para un solido rgido con seis grados de libertad (3 rotaciones y 3 traslaciones), se pueden obtener las ecuaciones que gobiernan el movimiento de un buque, referidas a un sistema de referencia jado en el propio barco: Para la traslacion (fuerzas):
X = m[u_ + qw rv xG (q2 + r2) + yG(pq r_) + zG (pr + q_)] Y = m[v_ + ru pw yG(r2 + p2) + zG (qr p_) + xG (qp + r_)] Z = m[w_ + pv qu zG(p2 + q2) + xG (rp q_) + yG(rq + p_)]
(11.1)
y para el giro (pares o momentos de fuerza):
K = Ixp_ + (Iz Iy )qr + m[yG(w_ + pv qu) zG (u_ + ru pw)] M = Iy q_ + (Ix Iz )rp + m[zG (u_ + qw rv) xG(w_ + pv qu)] N = Iz r_ + (Iy Ix)pq + m[xG (v_ + ru pw) yG(u_ + qw rv)]
(11.2)
El sistema de referencia esta situado en el buque y no tiene por que coincidir con el centro de gravedad del mismo (a veces se emplea el centro de simetra). Las magnitudes que aparecen en las ecuaciones anteriores son:
m: masa del barco. Ix; Iy ; Iz : momentos de inercia respecto a cada eje coordenado. xG ; yG; zG: posicion del centro de masas. ; ; : angulos de giro respecto a los ejes coordenados (x; y; z). r = _ ; p = ;_ q = _: velocidades angulares respecto a los tres ejes.
Aplicacion de control robusto
281
u; v; w: componentes del vector velocidad referidos a los ejes coordenados (x; y; z). Tambien se emplean como: Vx = u; Vy = v; Vz = w.
X; Y; Z : componentes en cada eje de las fuerzas actuantes sobre el barco. K; M; N : componentes en cada eje de los pares o momentos actuantes sobre el buque.
En las guras (11.2),(11.3) y (11.4) se muestra el signi cado fsico de las variables mas signi cativas del modelo. Z
X
Y
Figura 11.2: Sistema con 6 grados de libertad Si solo se consideran el desplazamiento en el plano horizontal y los giros respecto a los ejes (x; z), el sistema se reduce a un problema de cuatro grados de libertad. Las ecuaciones del movimiento quedan en ese caso:
2 (1 X 00 ) 66 0 G 64 0 0
0
(1 Yv_00 ) (zG00 + Kvv00_ ) (x00G Nv00_ )
0
L(zG00 + Yp_00 ) 00 K 00 ) L(kxx p_ 00 L(zG x00G + Np00_ )
3 2 u_ 3 2 X tot L(x00G Yr_00 ) 777 666 v_ 777 = 666 Ytot L(zG00 x00G + Kr00_ ) 5 4 p_ 5 4 Ktot Ntot r_ L(kzz002 Nr00_ ) 0
3 77 75
(11:3)
282
Descripcion de la planta
Vx
V
Vy
Figura 11.3: Variables: ; ; u = Vx; v = Vy ; V
Figura 11.4: Variables: ;
Aplicacion de control robusto
283
Donde el subndice \tot" indica las fuerzas y pares totales actuando sobre el casco, debidos a los efectos: hidrodinamicos, viento, olas y corriente; y el resto de variables son las magnitudes fsicas del buque as como sus coe cientes hidrodinamicos. Para buques de grandes dimensiones, la consideracion anterior es razonable, ya que los movimientos mas signi cativos son los que afectan al gobierno del barco (rumbo y movimiento en el plano), y al movimiento de balance (giro con respecto a un eje axial al buque); despreciandose el desplazamiento vertical y el giro con respecto a un eje transversal conocido como movimiento de cabeceo. En ese caso, el modelo, desde el punto de vista del control, se caracteriza por una o dos entradas de control (angulos de timon y aletas estabilizadoras) y dos salidas (angulos de rumbo y balance); tratandose por tanto de un sistema multivariable. Si unicamente se esta interesado en el control del rumbo (por ejemplo, para el caso de grandes petroleros, en los que el movimiento de balance es menos apreciable), el modelo matematico se reduce a un sistema escalar de una entrada y una salida (ver ejemplo del control del rumbo dado en el captulo 4, apartado 4.4). Entre las razones que justi can el empleo de sistemas de control del movimiento de balance pueden destacarse: 1. Medida de seguridad en navegacion; ya que un corrimiento o desplazamiento de la carga, causado por un angulo de escora excesivo, puede poner en serio peligro la estabilidad del buque. 2. No tener que desviarse en exceso de una ruta dada debido a unas condiciones ambientales adversas. 3. Mejora en las condiciones de trabajo de la tripulacion. 4. Aumento de la comodidad del pasaje, en su caso. 5. Conseguir una plataforma estable adecuada, para el disparo y aterrizaje a bordo, en los buques de la Armada. Para ello, se pueden emplear diferentes tecnicas: 1) sistemas de depositos o tanques de agua; 2) utilizacion del timon como sistema de estabilizacion del balance (rrs); y 3) la que ha resultado ser mas e caz, al menos para velocidades superiores a 12 nudos, que utiliza super cies de control o aletas estabilizadoras. Al considerar el problema de control de los angulos de rumbo ( ) y balance (), empleando como variables de control los angulos de timon () y de las aletas (), se plantea un problema de control de un sistema multivariable. En determinados
284
Descripcion de la planta angulo de estabilizadores ()
angulo de balance ()
-
-
BUQUE angulo de timon ()
-
-
angulo de rumbo ( )
Figura 11.5: Componentes de entrada-salida del problema multivariable buques, existe una fuerte interaccion entre las distintas variables de entrada y salida, por lo que el empleo de dos controladores independientes puede no dar buenos resultados. En ese caso, si se quiere conseguir un buen comportamiento, se hace aconsejable el empleo de tecnicas de control de sistemas multivariables. Desde el punto de vista del control de un buque se puede decir que hay dos condiciones de navegacion bien diferenciadas (Lopez et al, 1995). La primera, se trata del caso en que el problema es el realizar una determinada maniobra que conlleve esfuerzos grandes y prolongados de las variables de control (timon y aletas estabilizadoras), en cuyo caso los efectos no lineales dominan el comportamiento del sistema. La otra, se da en situaciones de mantenimiento del rumbo, o cuando el proceso de regulacion para un cambio de consigna requiere unas desviaciones de las super cies de control (pala de timon y aletas estabilizadoras) que no sean excesivas en tiempo y magnitud. Bajo dichas condiciones el sistema se puede aproximar por un modelo lineal. Ello puede hacerse linealizando las ecuaciones del movimiento en torno a una solucion estacionaria, para unas condiciones nominales de funcionamiento. Otra posible forma es realizando una identi cacion de la planta por algunos de los metodos dados en el captulo 3; o una identi cacion en el dominio de la frecuencia, como se hizo para obtener el modelo matematico lineal mlmv19 que se describe a continuacion. Para ilustrar el dise~no de controladores multivariables, se emplean los modelos lineales o linealizados multivariables (dos entradas y dos salidas) para unas condiciones de operacion de dos buques. Se emplean por un lado el modelo matematico que denominaremos mlmv19 (modelo lineal de orden elevado obtenido por identi cacion); y por otro modelo no lineal y variable en el tiempo que llamaremos modnl. En el primer caso, (mlmv19) el modelo matematico corresponde a un buque
Aplicacion de control robusto
285
(s) s
- G11 (s) - m(s-) 6 - G12 (s)
(s)
s - G22(s) - m(s-) 6
- G21 (s) Figura 11.6: Diagrama de bloque del sistema multivariable tipo fragata para unas condiciones nominales de funcionamiento y una velocidad de 18 nudos1 . Fue obtenido por (Freeman et al, 1982) empleando tecnicas de respuesta en frecuencia, a partir de las cuales se obtuvieron las cuatro funciones de transferencia (G11 ; G12; G21 ; G22) que caracterizan la matriz de transferencia del sistema multivariable. Las ecuaciones descriptivas de la planta vienen dadas por: " # " #" # (s) = G11 (s) G12(s) (s) (s) G21 (s) G22(s) (s)
(11:4)
:92(1:54s2 + 0:976s + 0:0077) G11(s) = (19:84s4 + 24:34s19 3 + 7:69s2 + 5:34s + 0:234)(s2 + 3:645s + 13:28) :916(0:965s2 + 0:61s 0:176) G12(s) = (15:66s4 + 21:32s13 3 + 6:87s2 + 3:81s + 0:193)(s2 + 9:402s + 7:952) 0:1 G21(s) = (s2 + 3:645s + 13 :28)(21:5s2 + s) G22(s) = (s2 + 9:402s +0:74266 :952)(18:1s2 + s) La variable a controlar y1 corresponde al angulo de balance , la variable a controlar y2 es el angulo de rumbo , la variable de control u1 corresponde al angulo 1
Navegacion: 1 Nudo = 1852 metros/hora.
286
Descripcion de la planta
de aletas estabilizadoras , y la variable de control u2 corresponde al angulo de timon . Dado que una realizacion mnima en el espacio de estados de este modelo es de dimension elevada (diecinueve), se va a emplear un modelo de orden reducido de la planta, a n de obtener un controlador de menor dimension y para hacer un analisis posterior de la robustez del sistema de control frente a la dinamica inmodelada de alta frecuencia (debida en este caso a la diferencia entre el modelo de orden completo y el modelo de orden reducido). Si se calculan los valores singulares de Hankel del modelo completo de la planta:
Hi para: i = 1; 2; : : : ; 19 se obtiene que:
H 7 < 0:1H 6 y dado que Hi+1 Hi , se elige un modelo reducido de sexto orden. En la gura 11.7 se muestran las ganancias principales del modelo completo y del modelo reducido, como puede verse se consigue una buena aproximacion hasta una frecuencia de 3 radianes/segundo. Dado que esta frecuencia va a ser muy superior al ancho de banda del sistema en lazo cerrado, puede considerarse una aproximacion aceptable en el rango de frecuencias de interes. Las matrices de estado obtenidas para el modelo reducido de la planta son: 0 0:049 0:015 0:255 0:442 0:986 0:094 1 B 0:012 0:279 0:211 0:632 0:112 0:357 C CC B B CC B 0 : 010 0 : 151 0 : 228 0 : 443 0 : 182 0 : 555 A = B B 0:092 0:482 0:213 0:118 0:896 0:017 C C B B @ 0:053 0:179 0:080 0:067 0:569 0:117 CA 0:001 0:203 0:307 0:010 0:034 0:178 ! 0 : 001 0 : 001 0 : 013 0 : 004 0 : 039 0 : 017 T B = 0:025 0:035 0:031 0:102 0:106 0:033
C =
0:011 0:023
0:796 0:001
0:478 0:001
1:149 0:001
0:113 0:000
0:480 0:000
!
Para la sntesis del regulador se emplea el modelo reducido, sin embargo la evaluacion de la respuesta temporal se realiza con el modelo de orden completo. En la gura 11.8 se muestra el numero de condicion, (G), de la planta, a partir del cual puede comprobarse que la planta tiene una fuerte direccionalidad en la ganancia, puesto que (G) 1 para todas las frecuencias (ver captulo 8).
Aplicacion de control robusto
287
100
50
sv (db)
0 G -50
Gp
-100
Gp
-150
-200 10 -4
10 -3
10 -2
10 -1
10 0
10 1
G
10 2
w (rad/s)
Figura 11.7: Respuestas en frecuencia de modelos completo (Gp) y reducido (G) 100 90 80 70
k(G)
60 50 40 30 20 10 0 10 -3
10 -2
10 -1 w (rad/s)
Figura 11.8: Numero de condicion de la planta
10 0
288
Descripcion de la planta
En el segundo caso (modnl), el modelo matematico corresponde al desarrollado por (Kallstrom et al, 1982), y corresponde a un buque mercante del tipo ro/ropasajeros. Este modelo es multivariable, no lineal y variable en el tiempo, sirviendo para caracterizar el comportamiento del buque tanto en operacion de mantenimiento de rumbo, como en grandes maniobras. La validacion experimental de este modelo fue realizada de forma exhaustiva por sus autores, ajustando sus parametros hasta conseguir una excelente correspondencia entre los resultados experimentales y las simulaciones. Por ello, se puede considerar el modnl como un buen banco de pruebas para evaluar los dise~nos de sistemas de control desarrollados tanto escalares como multivariables (Lopez y Rubio, 1995a; Messer y Grimble, 1992; Kallstrom et al, 1982). Las expresiones correspondientes a cada uno de los terminos que aparecen en la ecuacion 11.3, correspondientes a los pares y fuerzas debidos a los factores hidrodinamicos y las perturbaciones ambientales, pueden encontrarse en (Kallstrom et al, 1982; Lopez, 1994). Los angulos de timon y aletas que se generan como magnitudes de mando a traves de un controlador, ya sea automatico o manual, han de ser ejecutados por las respectivas maquinas del timon y de las aletas estabilizadoras. Las dinamicas de estos dispositivos se modelan como sistemas de primer orden, dados por: _ = (c )=R ; j _ j _max ; j j max _ = (c )=F ; j _ j _ max ; j j max siendo c y c los angulos de mando de consigna que se remiten como orden a la sala de maquinas (con las constantes de tiempo R y F ). Para mostrar la naturaleza no lineal del modnl, se presentan a continuacion algunas pruebas de simulacion. En las guras 11.9 y 11.10 puede verse la perdida sustancial de velocidad que experimenta el sistema si se somete a una prolongada activacion de la variable de control (angulo de timon). En dichas guras se muestran la derivada del rumbo (o velocidad angular) r, y la velocidad V , para angulos de timon de 20 y 10 grados respectivamente. Se representan as mismo el angulo de balance , y su derivada p. La velocidad nominal o de crucero inicial es en ambos casos de 15 nudos. Se observa, que a mayor angulo de timon mayor es la perdida de velocidad. Y dado que la dinamica del buque depende fuertemente y de forma no lineal de dicha velocidad, as como tambien de otras magnitudes, _ ; ; ;_ ; se tendra que durante dicha operacion el sistema tendra un comportamiento no lineal y variable en el tiempo.
Aplicacion de control robusto
289
0
8
V (m/s)
r (grad/seg)
-0.2 -0.4 -0.6
7
6
-0.8 -1 0
5 0
500
8
0.6
6
0.4
4 2 0 -2
500 t (seg)
p (grad/s)
fi (grad)
t (seg)
0.2 0 -0.2
0
-0.4 0
500 t (seg)
500 t (seg)
Figura 11.9: r(t); V (t); (t); p(t) para = 20; V = 15 nudos 0
8
V (m/s)
r (grad/seg)
7 -0.5
-1
6 5 4
-1.5 0
3 0
500 t (seg)
1
15
p (grad/s)
fi (grad)
10 5 0 -5
500 t (seg)
0
500 t (seg)
0.5
0
-0.5
0
500 t (seg)
Figura 11.10: r(t); V (t); (t); p(t) para = 10; V = 7:72 m=s
290
Descripcion de la planta polos (seg) 0 -0.02825 0.30494j 3.27 -0.0081 123.17 -0.1403 7.12
Tabla 11.1: Polos y constantes de tiempo de modnl linealizado para V = 7:72m=s Para realizar el dise~no de los reguladores es necesario que se disponga de un modelo lineal de la planta. Para ello, el modnl se linealiza en torno a la solucion estacionaria u = V; v = r = = p = = = 0 donde V es la velocidad de crucero. A continuacion se dan las matrices de una representacion de estado del modelo (modnl) linealizado para una velocidad V = 15 nudos, as como la tabla 11.1 con los polos y constantes de tiempo ( ) asociados (no se considera la dinamica de los actuadores). Como puede verse el sistema tiene un par de polos complejos conjugados muy poco amortiguados.
0 0:02720 B B B 0:00250 0:00128 A=B B B 0 @
0:15048 0:04043 0:00129 1 0
0
0 0:06466 B B 0:01426 B B B = B 0:0007 B 0 @ 0
0:1747 0:01319 0:00554 0 0
0:00443 0:39268 0:13732 0 1
1 CC CC CC ; A
0:26255 0:09381 0:00204 0 0
0 BB 00 B CT = B BB 0 @1
0 0 0 0 0 1
0 0 0 0 0
1 CC CC CC A
1 CC CC CC A
Aplicacion de control robusto
291
11.3 Evaluacion de los controladores Cuando se realiza el dise~no de un regulador utilizando para ello algun criterio de optimizacion, o siguiendo una determinada tecnica, conviene evaluar las caractersticas de dicho regulador frente a diferentes indicadores de comportamiento y robustez, que proporcionen una vision mas global de las prestaciones del regulador. A continuacion se proponen un conjunto de indicadores para evaluar los dise~nos que se realicen.
Analisis de la respuesta temporal y se~nales de control. Caracterizacion del rechazo de las perturbaciones actuantes a la salida (do) y a la entrada (di) de la planta, por medio de:
Ido = [So (j!)];
Idi = [SoG(j!)]
Indicador de Comportamiento Nominal (una medida del grado de recuperacion a una frecuencia ! = !o dada):
(
o )] [L(j!o )] INP = min [[LL((j! ; t j!o )] [Lt (j!o )]
)
Margenes de Estabilidad (extension al caso multivariable de los margenes de
fase y ganancia clasicos, se emplean para ello los valores propios, i de la matriz de transferencia en lazo abierto):
MG = min fMG(i )g ; i
MF = min fMF (i )g i
En el caso de un sistema multivariable, los margenes de fase y ganancia as obtenidos no proporcionan la utilidad que tienen en el caso de los sistemas escalares para caracterizar la robustez del sistema. Pero s pueden utilizarse como indicadores de robustez cualitativos (Lunze, 1989; Doyle y Stein, 1981), en el sentido de que si se obtienen valores poco satisfactorios de MG y MF, ello sera indicativo de la falta de robustez.
Indicadores de Estabilidad Robusta (estimacion del tanto por ciento de incertidumbre tolerable para la que el sistema mantiene su estabilidad):
2
El subndice\i" indica que se trata de un indicador con respecto a incertidumbre de tipo multiplicativo que se considera re ejada a la entrada de la planta, mientras que con el subndice\o" se indica que se considera a la salida. 2
292
Dise~no de controladores LTR multivariables
{ Incertidumbre multiplicativa no estructurada: 3 I11i : M = Ti ; I11o : M = To min ! f1= [M (j! )]g 100% { Incertidumbre multiplicativa con estructura diagonal: I12i : M = Ti ; I12o : M = To min ! f1=[M (j! )]g 100% { Incertidumbres multiplicativas simultaneas con estructuras diagonales: I1s : min ! f1=[M (j! )]g 100% "
# T S K i i M= SG T o o Indicadores de Comportamiento Robusto (estima el tanto por ciento de incertidumbre de tipo multiplicativo con estructura diagonal tolerable para la que el sistema cumple una especi cacion de comportamiento dada de la forma (So WS ) 1): " # T KS W i o S I3i : M = SoG SoWS " # T T W o o S I3o : M = So To WS min ! f1=[M (j! )]g 100%
11.4 Dise~no de controladores LTR multivariables En este apartado se realiza el dise~no de controladores LTR (LTR-o y LTR-i) con la estructura convencional, as como para la estructura no basada en observador, ambas descritas en el captulo 9. representan los valores singulares extremos, y el valor singular estructurado. M representa el sistema de interconexion correspondiente a cada caso. 3 ;
Aplicacion de control robusto
293
11.4.1 Dise~no LTR-o Para el dise~no del regulador se sigue el procedimiento descrito en el captulo 9. El parametro\q" (ganancia de recuperacion) se incrementa solo lo necesario para realizar una recuperacion aceptable en el rango de frecuencias de interes del sistema (zonas de baja y media frecuencia). As se evita incrementar la sensibilidad del sistema a la dinamica no modelada de alta frecuencia (rs), y se aproximan las especi caciones de dise~no (np). Se desea que el sistema consiga un buen rechazo de las perturbaciones y unos errores de seguimiento lo su cientemente peque~nos (aproximacion de la accion integral). Para ello, se toman los siguientes parametros de dise~no: " # " # 10 0 0 : 9817 0 : 1342 T Ro = 0 1 ; Qo = a W a ; W = 0:1342 0:0184
Rc = I2; Qc = CaT Ca ; Ca = [C O2]; BaT = [B O2] " # " # A B O n 2 Aa = O ; ; q = q1 = 103 a= I I 2n 22 22 donde Aa ; Ba y Ca son las matrices de la planta ampliada. En la gura 11.11 se muestran las ganancias principales de L(s) para el controlador lqg/ltr-o (cbo); como puede verse, el controlador no consigue una recuperacion adecuada. Si se incrementa q hasta 1000q1, se obtiene el nivel de recuperacion deseado a baja frecuencia, pero a costa de un incremento en el ancho de banda del regulador. Esto produce como consecuencia que las ordenes generadas por el controlador sean de magnitudes mayores, con lo que se puede provocar la saturacion de los actuadores de una forma mas frecuente, una mayor sensibilidad a las incertidumbres y a las perturbaciones ambientales, as como la posible generacion de ordenes de control irrealizables fsicamente por el sistema. Si se emplea un controlador ltr-o (cnbo) con los mismos parametros de dise~no dados arriba, se observa la mejora en el grado de recuperacion conseguida a baja frecuencia con respecto al cbo ( gura 11.12); puede comprobarse que es el mismo que el obtenido con la estructura estandar (cbo) para q = 1000q1. El efecto de incrementar el valor de q puede verse al comparar las guras 11.13 y 11.14, donde se muestran las respuestas temporales y demandas de control para ambos controladores: cbo, q = 1000q1 y cnbo, q = q1. En la gura 11.15 se puede observar como el regulador dise~nado cumple las especi caciones deseadas para el rechazo de las perturbaciones actuantes tanto a la salida (i (So)), como a la entrada (i (SoG)) de la planta. En la misma gura se
294
Dise~no de controladores LTR multivariables 150 KBF 100
sv(L) (db)
50
LTR KBF
LTR 0 KBF -50 q=1000 (cbo) -100
-150 10 -5
LTR
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
w (rad/s)
Figura 11.11: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cbo 150
100
sv(L) (db)
50
0 KBF -50 q=1000 (cnbo) LTR
-100
-150 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
w (rad/s)
Figura 11.12: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cnbo
Aplicacion de control robusto
295
8 y2
y (gra)
6 4 y1
2 0 -2
0
50
100
150
200
250
300
t (seg) 60 q=1e6, (cbo)
u (gra)
40
u1
20 0 u2
-20 -40 0
10
20
30
40
50
60
70
80
90
100
t (seg)
Figura 11.13: Respuesta temporal para cbo, q = 103q1 8 y2
y (gra)
6 4 2
y1
0 -2
50
0
100
150
200
250
300
t (seg) 60
u (gra)
40
q=1e3, (cnbo)
u1
20 0 u2
-20 -40 0
10
20
30
40
50
60
70
80
90
t (seg)
Figura 11.14: Respuesta temporal para cnbo, q = q1
100
Dise~no de controladores LTR multivariables 20
20
0
0
sv(SoG) (db)
sv(So) (db)
296
-20 -40 -60 -80 10 -5
-20 -40 -60
10 -2
-80 10 -5
10 1
rad/s 60
1/[sv(M),ssv(M)] (db)
1/[sv(M),ssv(M)] (db)
10 1
rad/s
60 40 20 iMies 0 iMi -20 10 -5
10 -2
10 -2
10 1
40 iMoes
20
iMo
0 -20 10 -5
rad/s
10 -2
10 1
rad/s
Figura 11.15: Caracterstica rechazo perturbaciones y niveles de incertidumbre tolerables representan tambien unas estimaciones de las tolerancias del sistema de control a incertidumbres de tipo multiplicativo, que se den a la entrada (iMi) o a la salida de la planta (iMo) respectivamente. Para incertidumbre no estructurada se representa: 1=[M (j!)] y para el caso de incertidumbres con estructura diagonal (a la entrada de la planta puede corresponder a la dinamica no modelada de los actuadores: iMies, y si se considera a la salida de la planta se podra representar la dinamica de los sensores (iMoes), se representa: 1=[M (j!)] donde M (j!) es el sistema de interconexion. Con 1=[M (j!)] se obtienen unas estimaciones de las tolerancias a las incertidumbres mayores que con 1=[M (j!)], o lo que es lo mismo: se obtiene una estimacion de la robustez de la estabilidad superior. Esto es logico, al suponer la primera una condicion menos conservativa que la ultima. Puede comprobarse tambien, que el sistema es mas robusto frente a incertidumbres situadas a la salida de la planta que frente a incertidumbres situadas a la entrada; ello es consecuencia de que el dise~no realizado es ltr-o. En la tabla 11.2 se resumen los valores de los indicadores de robustez consegui-
Aplicacion de control robusto Controlador cbo: q = 1000q1 cnbo: q = q1
297
I11i I12i I11o I12o I1s MG MF I3o I3i % % % % % db gra % % 23.0 27.5 76.1 76.1 22.0 26.9 59.8 38.3 24.5 25.3 62.1 74.9 74.9 34.3 18.9 51.8 53.5 40.9
Tabla 11.2: Indicadores de robustez de los controladores LTR-o (mlmv19) dos por ambos controladores ltr-o para el mismo grado de recuperacion (inp) 4. Finalmente, se puede realizar una implementacion del regulador en tiempo discreto, empleando un perodo de muestreo de hasta 1 segundo, con el cual el regulador de tiempo discreto proporciona un comportamiento en lazo cerrado equivalente al de tiempo continuo.
11.4.2 Dise~no LTR-i En este apartado se presentan los resultados de simulacion obtenidos con el modelo no lineal multivariable; a n de evaluar los controladores que se dise~nan a partir de modelos linealizados para distintas condiciones de trabajo. En la seccion anterior se ha realizado un dise~no ltr-o, en esta se hace uno ltr-i, para as ilustrar aplicaciones de ambas metodologas. Una discusion mas amplia sobre el dise~no y analisis de reguladores ltr-i para distintas condiciones de funcionamiento puede encontrarse en (Lopez, 1994; Lopez y Rubio, 1995a). Con el modelo linealizado de la planta (modnl) para una velocidad de V = 15 nudos y los parametros de dise~no: # " # " 0 : 1 0 10 0 T Rc = 0 1 Qc = C QC Q = 0 1 Ro = I2 Qo = BB T q = 106 se obtiene un regulador lqg/ltr-i. En la gura 11.16 se tiene la respuesta obtenida con el modelo lineal, que puede compararse con la obtenida para el modelo no lineal dada en la gura 11.17. El controlador se ha calculado para una condicion de trabajo dada, por lo que interesa ver el comportamiento del sistema en otras condiciones diferentes. Esto se Los valores de la tabla 11.2 estan expresados: MF en grados, MG en decibelios y el resto de indicadores en tanto por ciento de incertidumbre tolerable. 4
298
Dise~no de controladores LTR multivariables 8 y2
y (gra)
6 4 2
y1
0 -2
0
20
40
60
80
100
120
140
160
180
200
120
140
160
180
200
t (seg) 10 u2
u (gra)
5 0 u1
-5 -10 0
20
40
60
80
100 t (seg)
Figura 11.16: Respuesta con modelo linealizado de modnl 8
y (gra)
6
y2
4 2
y1
0 -2
0
20
40
60
80
100
120
140
160
180
200
120
140
160
180
200
t (seg) 10
u (gra)
5
u2
0 u1
-5 -10 0
20
40
60
80
100 t (seg)
Figura 11.17: Respuesta con modelo no lineal (modnl)
Aplicacion de control robusto
299
hace analizando las respuestas temporales del sistema a cambio de consigna tipo escalon de 5 grados, para velocidades de crucero de V1 = 10 nudos y V2 = 21 nudos respectivamente, que se muestran en la gura 11.18. Como puede verse, ambas respuestas son satisfactorias.
4
0.4 0.2
V2
roll (deg)
heading (deg)
6
V1 2
V2
0
V1 -0.2
0 0
50
100
150
-0.4 0
200
50
t (sec)
V2
fin (deg)
rudder (deg)
0 -2 V1 -4
0
150
200
150
200
2
2
-6
100 t (sec)
50
100 t (sec)
150
200
0
V2 V1
-2
-4
0
50
100 t (sec)
Figura 11.18: Respuestas temporales para diferentes condiciones de navegacion Se ha visto que, para excursiones moderadas del vector de control, el sistema no lineal (modnl) responde adecuadamente con el regulador lineal dise~nado. Sin embargo, el modelo es fuertemente no lineal, por ello se trata de evaluar al controlador en una situacion en la que los efectos no lineales dominen el comportamiento del sistema. Esta circunstancia se da en el caso de grandes cambios de consigna, en los que el vector de control puede llegar a saturarse o tomar valores elevados, durante perodos de tiempo relativamente largos; con las consiguientes perdidas de velocidad y cambios en la planta que ello produce. En la gura 11.19 se muestra la respuesta del sistema para un cambio de consigna de 180 grados; como puede verse, el comportamiento es excelente: no produce una sobreoscilacion apreciable y la interaccion con la otra variable a controlar es muy baja, si se compara con los resultados obtenidos para la misma maniobra empleando un controlador monovariable (ver gura 11.20). La importancia de este controlador estriba en que al reducir el angulo de inclinacion o balance (tambien denominado de
300
Dise~no de controladores LTR multivariables
200
40
150
20
u2 (gra)
y2 (gra)
escora) durante la maniobra, se mejora la robustez del sistema frente a un angulo de escora excesivo, que circunstancialmente puede a su vez provocar un desplazamiento de la carga y por tanto un fuerte cambio en las caractersticas que determinan la estabilidad del buque, aumentando el peligro de vuelco.
100 50
0 -20
0 0
500
-40 0
1000
t (seg)
500
1000
t (seg) 40 20
u1 (gra)
y1 (gra)
10
0
-20
-10 0
0
500 t (seg)
1000
-40 0
500
1000
t (seg)
Figura 11.19: Respuesta modnl controlador multivariable, ltr-i El regulador anterior se ha desarrollado para conseguir un funcionamiento adecuado para cambios en la referencia. Como ya se ha dicho, otra importante condicion de funcionamiento se re ere a la situacion de mantenimiento del rumbo y reduccion del movimiento de balance. La exigencia anterior no esta garantizada en presencia de perturbaciones para el controlador LTR-i anterior (ver gura 11.21). En dicha gura se muestran las tolerancias a incertidumbres y la caracterstica en frecuencia para el rechazo de las perturbaciones que se den tanto a la entrada como a la salida de la planta. El comportamiento esperado del sistema frente a perturbaciones, se puede determinar a partir de las respuestas en frecuencia de So(s)G(s) y So(s), dadas en la gura 11.21; de la que se deduce que las perturbaciones no van a ser atenuadas independientemente de la direccion en que estas se den. Para ello se propone modi car las matrices de ponderacion y ampliar el modelo de la planta para el dise~no del controlador ltr-i; incorporando una caracterstica de alta ganancia en lazo abierto
301
200
40
150
20
u2 (gra)
y2 (gra)
Aplicacion de control robusto
100 50
0 -20
0 0
500
-40 0
1000
t (seg)
500
1000
t (seg) 40 20
u1 (gra)
y1 (gra)
10
0
-20
-10 0
0
500
1000
-40 0
t (seg)
500
1000
t (seg)
Figura 11.20: Respuesta modnl controlador monovariable a baja frecuencia (aproximacion de la accion integral). Para ello se emplea un modelo linealizado de la planta para una velocidad de crucero de 21 nudos. Los parametros de dise~no tomados para el regulador ltr-i 5 son los siguientes:
! ! B C T Aa = ; Ba = O ; Ca = O 22 22 " # 1 0 Rc = 5 0 1 Qc = MaT QMa " # " # 100 0 0 : 1 0 Q = 0 1 Ma = C 0 0:1 = Ba Ro = I2 Qo = T ; q = 106 donde las matrices Aa ; Ba y Ca corresponden al modelo de la planta ampliada utilizado para el calculo del regulador. A On2 C O22
!
Se emplea la version no basada en observador, dado que a baja frecuencia se produce una recuperacion del lazo abierto sensiblemente superior que con un regulador lqg/ltr-i estandar. 5
302
Dise~no de controladores LTR multivariables 80
1/sv_max(M) (db)
1/sv_max(M) (db)
80 60 40
iMi
20 0 -20 10 -4
10 -1
60 40 20 0 -20 10 -4
10 2
10 -1
10 2
w (rad/s)
20
20
0
0
sv(SoG) (db)
sv(So) (db)
w (rad/s)
-20 -40 -60 -80 10 -4
iMo
-20 -40 -60
10 -1 w (rad/s)
10 2
-80 10 -4
10 -1
10 2
w (rad/s)
Figura 11.21: Caractersticas de la tolerancia a incertidumbres y rechazo de las perturbaciones En la gura 11.22 se muestran los valores singulares extremos de So(j!) y So (j!)G(j!). Como puede verse, [So (j!)G(j!)] < 1 ( 4:96db) para toda !; as mismo, [So (j!)G(j!)] y [So(j!)] son ambos lo su cientemente peque~nos en la zona de baja frecuencia, como es deseable. Con este controlador se obtienen los siguientes indicadores de robustez: I11i = 62%; I12i = 70%; I11o = 61%; I12o = 63%; I1s = 38%. La gura 11.23 muestra las respuestas temporales del sistema para el controlador LTR-i (NOBC) multivariable, y para un controlador que no tiene en cuenta el caracter vectorial de la planta. En las simulaciones se emplea una altura signi cativa de olas de 4m y un angulo de incidencia de 45 relativo al curso de referencia del buque. Puede verse que hay una mejora notable en la reduccion del movimiento del balance si se emplea el controlador LTR-i multivariable. La gura 11.24 muestra el rumbo (heading) y el balance (roll) para condiciones de velocidad no nominales (18 nudos y 16:5 nudos); se observa que el comportamiento es adecuado, lo cual representa otra prueba de la robustez del controlador dise~nado. Debido a las dinamicas asociadas a la planta y a los reguladores, estos se pueden implementar directamente en un computador digital con un perodo de muestreo de
Aplicacion de control robusto
303 80
1/sv_max(M) (db)
1/sv_max(M) (db)
80 60 40
iMi
20 0 -20 10 -4
10 -1
60 40 20 0 -20 10 -4
10 2
10 -1
10 2
w (rad/s)
20
20
0
0
sv(SoG) (db)
sv(So) (db)
w (rad/s)
-20 -40 -60 -80 10 -4
iMo
-20 -40 -60
10 -1
-80 10 -4
10 2
w (rad/s)
10 -1
10 2
w (rad/s)
Figura 11.22: Caractersticas de la tolerancia a incertidumbres y rechazo de las perturbaciones 10
10 SISO controller
SISO controller
heading (deg)
roll (deg)
5 0 -5 -10 0
5 0 -5 -10 0
500 t (sec)
10
10 MIMO controller
MIMO controller
heading (deg)
5
roll (deg)
500 t (sec)
0 -5 -10 0
500 t (sec)
5 0 -5 -10 0
500 t (sec)
Figura 11.23: Operacion con rumbo constante bajo accion de las olas
Dise~no de controladores H2 y H1 multivariables 10
10
5
5
heading (deg)
roll (deg)
304
0 -5 -10 0
0 -5 -10 0
500
10
10
5
5
0 -5 -10 0
500 t (sec), V=9.5m/s
heading (deg)
roll (deg)
t (sec), V=9.5m/s
500
0 -5 -10 0
t (sec), V=8m/s
500 t (sec), V=8m/s
Figura 11.24: Comportamiento para condiciones de trabajo no nominales 0:1 segundos, sin tener en cuenta de una manera explcita el caracter muestreado del sistema de control. Todas las implementaciones de los algoritmos LTR-i empleados en las simulaciones con el modelo no lineal (modnl) se realizan de esta forma (Lopez y Rubio, 1995a). Otra posibilidad sera utilizar un regulador de tiempo discreto equivalente, empleando por ejemplo un perodo de muestreo de 0.5 segundos.
11.5 Dise~no de controladores riables
2
H
y
1
H
multiva-
Para obtener un conjunto (WH ) de matrices de ponderacion implicadas en los problemas de dise~no H2 y H1 (ver captulo 10):
WH = fWS (s); WU (s); WT (s); Wr (s); Wn(s); Wdo (s); Wdi (s)g
(11:5)
que den una solucion fsicamente realizable y satisfactoria, se pueden emplear dos procedimientos:
Aplicacion de control robusto
305
1. Empezar sin informacion previa sobre la di cultad del problema de dise~no a tratar, e interpretar las especi caciones de dise~no en el dominio frecuencial como elementos de WH . Ensayar distintas combinaciones, hasta conseguir unos resultados adecuados. 2. Comenzar a partir de unos resultados previos, obtenidos con alguna tecnica de dise~no, que pongan de mani esto la di cultad del problema de control, den una interpretacion en frecuencia de los resultados y sirvan para sugerir posibles mejoras, a partir de una adecuada seleccion de los elementos de WH . En este captulo se emplea el segundo procedimiento, de forma que se aprovechan los resultados de una primera fase de dise~no de un controlador ltr, a partir de los cuales se sugieren los elementos de WH , comparando nalmente los resultados obtenidos por los reguladores ltr, H2 y H1. La metodologa de dise~no propuesta tiene dos etapas o fases. La primera fase es opcional y consiste en el dise~no de un controlador H2. En la segunda fase se obtiene un regulador H1 basado en los resultados de la primera etapa. Si as se considera, solo se realiza la segunda etapa (Lopez y Rubio, 1995c; Lopez 1994). El algoritmo propuesto sigue los siguientes pasos: 1. Seleccionar los elementos de WH . 2. Resolver el problema del regulador optimo H2 (captulo 10). 3. Ver si las respuestas temporal y frecuencial son adecuadas (analizar los indicadores de comportamiento y robustez); si no es as, se vuelve al paso 1. 4. Calcular el valor 2:
kTzw k1 = 2
5. Hacer: = 2 6. Resolver el problema del regulador H1 para el valor de (ver captulo 10). 7. Si no se encuentra solucion para el valor de empleado, se toma uno mayor y se vuelve al paso 6. Para encontrar el valor de para el que se consigue el regulador optimo H1, se puede emplear, por ejemplo, el metodo de la biseccion como procedimiento iterativo de busqueda del optimo. 8. Calcular el valor 1:
kTzw k1 = 1
306
Dise~no de controladores H2 y H1 multivariables
9. Ver si las respuestas temporal y frecuencial son adecuadas; si no es as, se aumenta el valor de y se vuelve al paso 6. 10. Disminuir el valor de y volver al paso 6. El proceso iterativo anterior, se interrumpe cuando se llega al valor optimo
= opt, o a un valor de > opt, para el que al disminuir su valor el regulador H1 obtenido no da una respuesta temporal adecuada (por ejemplo: un excesivo aumento de la magnitud de control comparado con el regulador H2 previo); o si ocurre que aun a pesar de disminuir el valor de kTzw k1, el controlador obtenido tiene globalmente unos indicadores de robustez menos satisfactorios. Puede igualmente darse el caso, de que al calcular el regulador H1 optimo directamente empleando algunas de las funciones que tienen incorporadas los paquetes de programas de Dise~no de Sistemas de Control por Computador (cacsd), tales como Program CC, y Robust Control Toolbox, sea necesario el empleo de un regulador suboptimo que de mejores caractersticas de robustez globales. De ah la importancia del conjunto de indicadores de robustez propuesto (Lopez, 1994).
11.5.1 Controladores H1 para sistema de orden elevado Se plantea el problema de obtener el dise~no de controladores H2 y H1, a n de realizar un analisis comparativo entre ellos y con los resultados anteriores obtenidos con los reguladores LTR-o. Para realizar los dise~nos se emplea el modelo de orden reducido (sexto orden) obtenido para el modelo mlmv19 descrito anteriormente, el cual es de orden diecinueve. Una vez obtenidos los reguladores se evaluan con el modelo de orden completo del buque. En primer lugar se plantea el problema de optimizacion de sensibilidad mixta descrito en el captulo 10. Para seleccionar las funciones de ponderacion: WS (s) y WT (s), se utilizan como ayuda los per les (respuestas en frecuencia) de la ftlad empleados para el dise~no ltr. O en otro caso, se parte simplemente de las especi caciones de dise~no sin disponer de dise~nos anteriores. Tras algunos ensayos, se toma para la especi cacion del comportamiento nominal (np):
2 3:1623s + 9:0 10 6 s + 0:09 WS 1(s) = 664 0
6
3 0 77 3:1623s + 4:510 6 75 s + 0:045
Aplicacion de control robusto
307
y como funcion de ponderacion de la funcion de sensibilidad complementaria To(s): 2 3:1623s + 1500 3 0 6 7 WT 1(s) = 64 3162:3s + 474:34 3:1623s + 750 75 0 3162:3s + 237:17 en la gura 11.25 se muestran ambas funciones (matrices) de ponderacion, las cuales re ejan las especi caciones de dise~no en el dominio de la frecuencia. 80 70 W_S
sv(W_S),sv(W_T) (db)
60 50 40
W_T 30 20 10 0 -10 -20 10 -6
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
rad/s
Figura 11.25: Respuestas en frecuencia de WS y WT Se calcula el regulador optimo H2 (sensibilidad mixta) de la forma descrita en el captulo 10. Este regulador consigue: kTzw (j!)k1 2 = 0:566 El valor = 2 se utiliza como valor de partida para resolver el problema de optimizacion H1. Empleando un proceso iterativo para el calculo del regulador H1, se obtiene: kTzw (j!)k1 = o = 0:480 Dado que o < 2, se consigue una mejora con respecto al regulador H2 anterior, en el sentido de que se veri ca la desigualdad kTzw k1 1
Dise~no de controladores H2 y H1 multivariables
308
con mas holgura. Las respuestas temporales de ambos reguladores, para un cambio tipo escalon de [0; 5]T grados en la referencia, son muy similares; en la gura 11.26 se muestran para el regulador H1. 6 y2
y (gra)
4 2 0
y1 -2
0
20
40
60
80
100
120
140
160
180
200
60
70
80
90
100
t (seg) 60
u (gra)
40
u1
20 0 u2
-20 -40 0
10
20
30
40
50 t (seg)
Figura 11.26: Respuesta temporal controlador H1 (sensibilidad mixta) Como se describe en el captulo 8, la responsabilidad de la atenuacion de las perturbaciones que actuen sobre la planta, y de conseguir un seguimiento adecuado a cambios de referencia, recae sobre las matrices de transferencia So(s) y So(s)G(s). En la gura 11.27 se tienen los valores singulares de ambas para el controlador H1 (sensibilidad mixta). El comportamiento de So es totalmente satisfactorio,
[So(j!)] 1;
a baja frecuencia
como era de esperar del planteamiento hecho con el problema de sensibilidad mixta. Sin embargo, no ocurre lo mismo con SoG; dado que segun se deduce de la gura 11.27, se pueden dar perturbaciones vectoriales, actuantes a la entrada de la planta, que no sean atenuadas por el sistema. Para conseguir una caracterstica similar a la del controlador ltr-o dise~nado en la seccion anterior, se modi ca la funcion de coste de modo que Tzw incluya un termino que pondere tambien al factor SoG, puesto que de lo visto en el captulo 8
Aplicacion de control robusto
309
20
sv(So) (db)
0 -20 -40 -60 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 0
10 1
10 2
w (rad/s)
sv(SoG) (db)
50 0 -50 -100 -150 10 -5
10 -4
10 -3
10 -2
10 -1 w (rad/s)
Figura 11.27: So y So G para controlador H1 (sensibilidad mixta) se obtiene que el vector de error entre la referencia y la respuesta del sistema viene dado por,
e = r y = So (r do n) SoGdi En el planteamiento general del problema de optimizacion realizado en el captulo 10, se considera el caso particular:
"
# " #" # z1(s) = WS (s)So(s) WS (s)So(s)G(s)Wdi (s) r(s) z3(s) WT (s)To (s) WT (s)So(s)G(s)Wdi (s) di(s)
donde Wdi (s) se elige de forma que se especi que, con los elementos (1,2) y (2,2) de Tzw , el objetivo de conseguir como resultado un controlador que a baja frecuencia satisfaga: [So (j!)G(j!)] 1 (11:6) Este objetivo puede alcanzarse (ver gura 11.30) tomando las siguientes matrices
Dise~no de controladores H2 y H1 multivariables
310 de ponderacion:
Wdi (s) = s +1 1 I 2 2 0 66 3:1623ss++72:210 :2768 10 5 WS (s) = 64 s + 3:6 10 2 0 3:1623s + 1:1384 2 3162:3s + 379:47 3 10 0 6 7 WT (s) = 64 3:1623s + 1200 3162:3s + 189:74 75 0 3:1623s + 600
5
3 77 75
En las guras 11.28 y 11.29 se muestran respectivamente las funciones de ponderacion WS , WT , as como WS Wdi y WT Wdi , para el caso del problema de rechazo a las perturbaciones. 80 70 W_S
sv(W_S),sv(W_T) (db)
60 50 40 30
W_T
20 10 0 -10 -20 10 -6
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
rad/s
Figura 11.28: Respuestas en frecuencia de WS y WT Con el regulador H2 se obtiene kTzw k1 = 1:533; mientras que el regulador H1, consigue kTzw k1 = 1:195. En la gura 11.31 se muestra la respuesta temporal del sistema con el controlador H1 para un cambio de consigna [0; 5]T grados. Si se calculan los indicadores de robustez propuestos para los controladores
Aplicacion de control robusto
311
60 W_S W_di
sv(W_S W_di),sv(W_T W_di) (db)
40
20 W_T W_di 0
-20
-40
-60
-80 10 -6
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
rad/s
Figura 11.29: Respuestas en frecuencia de WS Wdi y WT Wdi
sv(So) (db)
50
0
-50
-100 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 0
10 1
10 2
w (rad/s)
sv(SoG) (db)
50 0 -50 -100 -150 10 -5
10 -4
10 -3
10 -2
10 -1 w (rad/s)
Figura 11.30: So y SoG controlador H1
Dise~no de controladores H2 y H1 multivariables
312 8
y2
y (gra)
6 4 2
y1
0 -2
0
50
100
150
200
250
300
200
250
300
t (seg) 60
u (gra)
40
u1
20 0 u2
-20 -40 0
50
100
150 t (seg)
Figura 11.31: Respuesta temporal controlador H1
dise~nados, se obtienen los resultados que se resumen en la tabla 11.3. Los valores de la tabla estan expresados: MF en grados, MG en decibelios y el resto en tanto por ciento de incertidumbre tolerable.
I11i % H2 (s. mixta) 37 H1 (s. mixta) 45.2 H2 42.1 H1 31.7 Controlador
I12i % 82.4 86.3 45.8 39.8
I11o % 100 100 72.9 74.4
I12o % 100 100 74.1 74.4
I1s % 42.5 44.5 34.8 28.8
MG db 37.6 72.1 12.3 9.1
MF gra 74.9 80.6 58.7 58.2
I3o % 68.1 73.5 51.8 52.3
I3i % 51.0 55.6 37.9 33.2
Tabla 11.3: Indicadores de robustez de los controladores H2 y H1 (mlmv19)
Aplicacion de control robusto
313
11.5.2 Regulador H1 para una planta no lineal En este apartado se va a dise~nar un controlador H1 para el modnl, cuyos objetivos son: 1) obtener un rechazo adecuado de las perturbaciones ambientales (las cuales se mani estan a la entrada y a la salida de la planta), y 2) una estabilidad robusta para ciertos niveles de incertidumbre. Para ello, como se ha justi cado en el apartado anterior, se toma la siguiente matriz de transferencia:
"
WS (s)So(s) WS (s)So(s)G(s)Wdi (s) Tzw = W T (s)To (s) WT (s)So (s)G(s)Wdi (s)
#
y por tanto, en la funcion de coste,
kTzw k1 aparecen de manera explcita las matrices de transferencia So y SoG; las cuales son como ya se ha indicado, las responsables directas que determinan la atenuacion de las perturbaciones que actuen sobre la planta. Las respectivas matrices de ponderacion (dependientes de la frecuencia) WS ; Wdi se eligen para conseguir tales objetivos. El termino WT To se emplea para tener en cuenta la incertidumbre en el modelo de la planta, y se elige de forma que se consiga una tolerancia a incertidumbres de tipo multiplicativo de un 50% en el peor caso. El modelo de la planta es no lineal, sin embargo para hacer el dise~no se emplea un modelo linealizado, y posteriormente el controlador se prueba con el modelo matematico no lineal. El regulador obtenido es suboptimo para las condiciones de operacion para las que se ha realizado la linealizacion, por ello no esta garantizado para el conjunto de puntos en su vecindad debido a la dinamica no lineal del sistema. Sin embargo, el controlador se dise~na con unas buenas propiedades de robustez, siendo los resultados obtenidos por simulacion satisfactorios. Para una velocidad de crucero de 21 nudos se eligen (tras algunos ensayos, y ayudado de los resultados obtenidos con el regulador ltr-i dise~nado en la seccion anterior) las siguientes matrices de transferencia de ponderacion:
2 s + 0:072 66 3:1623s + 2:2768 10 WS (s) = 4 0
Wdi (s) = s +1 1 I
5
0 s + 3:6 10 2 3:1623s + 1:1384 10
5
3 77 5
314
Dise~no de controladores H2 y H1 multivariables
2 3162:3s + 379:47 0 6 WT (s) = 64 3:1623s + 1200 3162:3s + 189:74 0 3:1623s + 600
3 77 5
Con las cuales, el regulador H2 obtiene kTzw k1 = 1:046, y el H1 reduce dicho valor a kTzw k1 = 0:91. En la gura 11.32 se muestran las respuestas en frecuencia de [So(j!)] y [So (j!)G(j!)]; como puede comprobarse, ambas magnitudes son lo su cientemente peque~nas en el rango de baja frecuencia. La gura 11.33 muestra los niveles estimados de incertidumbre multiplicativa no estructurada tolerables por el sistema a la entrada de la planta (iMi), y a la salida (iMo). Esta gura representa 1=(M ), donde M es el sistema de interconexcion para cada tipo particular de incertidumbre. Si se trata de incertidumbre no estructurada, de la gura 11.33 se desprende que para el caso de incertidumbre multiplicativa situada a la entrada de la planta Ei (donde G0 = G(I + Ei)), esta no causara la inestabilidad del sistema, siempre que kEik1 < 0:56 (o sea, que el sistema permite hasta un 56% de incertidumbre relativa). Igualmente, para el caso en que la incertidumbre este a la salida Eo (tal que = (I + Eo )G) se obtiene que kEok1 < 0:66 (lo cual supone un 66% de incertidumbre tolerable en el caso mas desfavorable). Si se analiza la robustez del sistema con respecto a incertidumbres estructuradas (estructura diagonal), se obtienen respectivamente unas tolerancias del 62% y 67% respectivamente, lo cual implica una estimacion menos conservativa, ya que en estos casos se emplea 1=(M ), donde (M ) es el valor singular estructurado de M .
G0
Para evaluar el comportamiento del controlador dise~nado frente a las perturbaciones ambientales, el sistema se somete a unas condiciones de navegacion caracterizadas por una altura signi cativa de olas de 4m, corriente de 2m=s, y viento con velocidad de 20m=s, actuando las perturbaciones en una direccion de 45 grados relativa al curso de referencia del buque. Las respuestas temporales obtenidas se muestran en las guras 11.34 y 11.35, en las que se puede comparar el comportamiento obtenido con el regulador H1 multivariable, y un controlador escalar que no considera la naturaleza multivariable de la planta. Puede comprobarse que con el regulador H1 se obtiene una mejora considerable en la reduccion del movimiento de balance, as como en el mantenimiento del rumbo. En la gura 11.36 se muestra el comportamiento obtenido con el mismo controlador para una velocidad de crucero de 18 nudos, diferente a la nominal empleada para el dise~no. Para la implementacion del regulador en un computador digital se emplea un controlador de tiempo discreto equivalente con un perodo de muestreo
Aplicacion de control robusto
315
sv(So) (db)
50 0 -50 -100 -150 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 0
10 1
10 2
w (rad/s)
sv(SoG) (db)
50 0 -50 -100 -150 10 -5
10 -4
10 -3
10 -2
10 -1 w (rad/s)
Figura 11.32: [So(j!)] y [So(j!)G(j!)]
1/sv(M) (db)
40
20
Multiplicativa a la entrada (iMi)
0 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 -1
10 0
10 1
w (rad/s)
1/sv(M) (db)
40 Multiplicativa a la salida (iMo) 20
0 10 -5
10 -4
10 -3
10 -2 w (rad/s)
Figura 11.33: Tolerancias a incertidumbres (1=[M (j!)])
Dise~no de controladores H2 y H1 multivariables
316 5
heading (deg)
Controlador SISO 0
-5
0
50
100
150
200
250
300
350
400
450
500
300
350
400
450
500
t (sec) 5
heading (deg)
Controlador MIMO 0
-5
0
50
100
150
200
250 t (sec)
Figura 11.34: Rumbo para controladores SISO y MIMO 15 Controlador SISO
roll (deg)
10 5 0 -5
0
50
100
150
200
250
300
350
400
450
500
300
350
400
450
500
t (sec) 15 Controlador MIMO
roll (deg)
10 5 0 -5
0
50
100
150
200
250 t (sec)
Figura 11.35: Movimiento de balance para controladores SISO y MIMO
Aplicacion de control robusto
I11i % 1: LTR-i 68.5 2: LTR-i 62.3 3: H2 52.3 4: H1 56.2 Contrl
I12i % 78.7 69.8 58.3 61.9
317
I11o % 60.7 60.5 63.7 67.3
I12o % 71.7 63.1 63.7 67.3
I1s % 44.4 37.6 31.3 33.5
MG db 25.8 27.6 17.8 11.5
MF I3o I3i gra % % 66.7 59.5 52.1 53.1 46 49.7 39.7 50.3 53.2 42.6
Tabla 11.4: Indicadores de robustez de los controladores para modnl de 0:1 segundos (se utiliza para ello la transformacion bilineal, ver captulo 10). Se emplea este perodo con el criterio de obtener unas respuestas temporales del sistema en lazo cerrado equivalentes para el regulador de tiempo continuo y el de tiempo discreto. En la tabla 11.4 se resumen los indicadores de robustez de los controladores dise~nados para el modelo no lineal (modnl).
heading (deg)
5
0
-5
0
50
100
150
200
250
300
350
400
450
500
300
350
400
450
500
t (sec) 15
roll (deg)
10 5 0 -5
0
50
100
150
200
250 t (sec)
Figura 11.36: Comportamiento para condicion no nominal
318
Sntesis de los resultados obtenidos
11.6 Sntesis de los resultados obtenidos En este apartado se trata de resumir y remarcar los principales resultados obtenidos en los estudios llevados a cabo. De ello cabe destacar: 1. Se han realizado diversos dise~nos para el control de un sistema multivariable, como es el control del rumbo y balance de un buque. 2. Para evaluar los diferentes dise~nos LTR, H2 y H1 se ha propuesto un conjunto de indicadores de comportamiento y robustez. 3. El problema de dise~no de un sistema de control multivariable es sensiblemente mas complejo que el de un sistema escalar. Sin embargo, los algoritmos empleados para resolver tales problemas se realizan en el espacio de estados y son independientes de la dimension y caracter vectorial o escalar de la planta. Sin embargo puede ser necesario emplear un metodo de calculo alternativo en algunos de los pasos intermedios del algoritmo, debido a los problemas numericos que aparecen con mayor frecuencia en el caso de sistemas multivariables y/o en sistemas de dimension elevada. 4. Se han empleado las metodologas LTR-i y LTR-o, en sus versiones de estructura basada en observador (cbo), o convencional, y no basada en observador (cnbo). Mostrandose que para un mismo nivel de recuperacion es aconsejable, en general, el empleo de la ultima, siempre que el sistema en lazo abierto presente elevada ganancia a baja frecuencia. Ya que, para un nivel de recuperacion dado, proporciona unos reguladores mas robustos y mas realizables desde un punto de vista de la aplicacion industrial. En otro caso (para controladores que no aproximen la accion integral, como los empleados para obtener respuestas sin sobre-oscilacion apreciable a cambios de consigna tipo escalon), la estructura cbo se caracteriza por conseguir mejores propiedades de robustez. 5. La eleccion de la sntesis LTR-i o de la LTR-o, va a depender de las especi caciones de dise~no y de que en cada caso concreto la eleccion de una de ellas sea mas propicia para satisfacer tales especi caciones. As, si se conoce a priori que los efectos de las incertidumbres del sistema pueden quedar re ejados a la salida de la planta, o si esta tiene mas salidas que entradas, sera mas ventajoso emplear la metodologa LTR-o. Mientras que si la planta tiene mas entradas que salidas y/o la incertidumbre puede considerarse que queda re ejada a la entrada de la planta, resulta mas aconsejable utilizar el metodo LTR-i.
Aplicacion de control robusto
319
6. El metodo de dise~no seguido para los reguladores H2 y H1, calcula en primera fase un regulador H2, a partir del cual se obtiene el H1, con el que se consigue disminuir el valor de la funcion de coste kTzw k1 obtenido con el dise~no H2. La robustez del sistema, en general, mejora para el controlador H1, pero en cada caso hay que examinarla, antes de decidir entre los reguladores H2 y H1. 7. Un regulador H1 suboptimo puede proporcionar unas propiedades de robustez y comportamiento globalmente mas satisfactorias que el regulador H1 optimo. 8. Los resultados del empleo de una u otra metodologa de dise~no, van a depender en gran manera de diversos factores: (a) De los requerimientos de control que se precisen. (b) Del modo en que estos se expresen de forma matematica. (c) De la experiencia que se tenga a la hora de seleccionar los parametros de dise~no. (d) De seguir un procedimiento iterativo sistematico que simpli que el dise~no y reduzca el numero de iteraciones. Se han obtenido buenos resultados con cada una de las metodologas analizadas: LTR, H2 y H1. 9. Se ha comprobado, al menos para los casos analizados, que un controlador H1 con prestaciones similares a un controlador LTR, requiere una dimension mayor, necesita perodos de muestreo sensiblemente inferiores y posee propiedades numericas menos favorables; por lo que desde un punto de vista practico, y en determinados casos concretos, podra ser mas recomendable el empleo de controladores ltr (Lopez y Rubio, 1995b). La metodologa H1 aborda de una forma explcita las especi caciones del sistema en lazo cerrado y los niveles de incertidumbre que el sistema de control debe soportar, por lo que resulta mas simple la formulacion de ciertos problemas de control robusto. La metodologa LTR consiste sin embargo, en un procedimiento indirecto, ya que trata con las funciones (matrices) de transferencia en lazo abierto, no pudiendose expresar de manera directa (a partir de las matrices de ponderacion empleadas para el dise~no) los niveles de incertidumbre tolerables, teniendo que calcularse estos a posteriori. Por otro lado, la metodologa H1 junto con el procedimiento de dise~no conocido como sntesis- (Balas et al, 1991) puede proporcionar de forma directa reguladores con un comportamiento robusto.
320
Sntesis de los resultados obtenidos
En general, se puede decir que ningun metodo proporciona la solucion total al problema de dise~no; ya que con tecnicas diferentes, y con distintos grados de so sticacion, pueden obtenerse resultados similares. En cada caso particular habra que determinar a partir de las caractersticas del sistema a controlar y de las exigencias de dise~no, cual es la metodologa que proporciona los mejores resultados. Resulta por tanto de interes el desarrollo de metodos iterativos informatizados para el ajuste y seleccion automatizada de los parametros de dise~no, en funcion de unas especi caciones realizadas por el operador (cosa que no siempre es sencilla, especialmente en el caso de sistemas multivariables). Integrando diferentes tecnicas de control robusto en un sistema que ofrezca al usuario la posibilidad de comparar y decidir la estrategia de control que pueda conseguir mejores resultados, o que mejor se adapte al problema concreto de dise~no. Hay que remarcar que la teora de control en torno a los metodos H1 esta en continua evolucion, as como el desarrollo de tecnicas de dise~no de controladores multi-objetivos, tales como la conocida por H2=H1; existiendo la en actualidad grandes esfuerzos de investigacion en torno a tales metodos (Doyle et al. 1994, Haddad et al, 1994; Rotea et al, 1991; Stoorvogel, 1992; Khargonekar et al, 1991; Green y Limebeer, 1995; Grimble, 1994).
Apendice A Analisis de los sistemas de control basados en observador A.1 Analisis de robustez con y sin observador Sea un sistema de control por realimentacion del vector de estado, y el correspondiente sistema que emplea un observador para estimar el estado del proceso, tal como muestran las guras A.1 y A.2 respectivamente. Entre los esquemas correspondientes de estas guras (Doyle y Stein, 1979), se cumplen las siguientes propiedades: 1. La funcion de transferencia de los bucles cerrados es la misma en ambos casos. 2. La funcion de transferencia en bucle abierto abriendo en el esquema de la
G(s)
r - as B - 6 b s
(s)
Kc
C
-
x
Figura A.1: Realimentacion del vector de estado 321
y
322
Analisis de robustez con y sin observador
r
0 - j u (1)t (2)t u - 6
-
u^ Kc
y
Planta
-
B
?j
(s)
-
Ko
j 6
C
Figura A.2: Diagrama del controlador LQG gura A.2 por el punto (1) es la misma. En efecto:
en la gura A.1, u = Kc x = KcB u0 en la gura A.2, u = Kc x^ = KcB u0 ya que x^ = Bu0, al tener los dos sistemas (planta y observador) la misma se~nal de entrada. 3. Las funciones de transferencia abriendo en el esquema completo (A.2) por (2) son diferentes. Se puede demostrar que solo son iguales si se modi ca Ko , pasando a depender de un parametro q y tendiendo este a in nito. Ello se demostrara en la proxima seccion. El hecho de que sean distintos en este caso, se debe a que la dinamica del error del observador (y y^) es tenida en cuenta, si se rompe el bucle (o si se introducen perturbaciones) por (2), cosa que no ocurre si se abre por (1) (A.2).
-
Analisis de los sistemas de control basados en observador
323
A.2 Condicion su ciente para la recuperacion A continuacion se va a desarrollar la condicion su ciente para que el bucle abierto lqg tienda al lqr. A partir de la gura A.1 se tiene que la funcion de transferencia en lazo abierto (que relaciona la se~nal que entra por el punto a y sale por el punto b) del regulador lqr viene dada por, Hc(s) = LLQR (s) = Kc(sI A) 1B (A:1) Para ello, se hacen depender las ganancias del ltro de Kalman de un determinado parametro q. Si se cumple que: Ko(q) = BW (A:2) lim q!1 q siendo W cualquier matriz no singular entonces; el bucle abierto lqg se aproxima asintoticamente al lqr. En efecto, la funcion de transferencia de bucle abierto con observador viene dada por, LLQG = Kc(sI A + BKc + KoC ) 1Ko C B (A:3) Si se hace = (sI A + BKc) 1 y teniendo en cuenta el lema de inversion de matrices, (A + BCD) 1 = A 1 A 1 B (C 1 + DA 1 B ) 1DA 1 (A:4) dicha expresion, puede ser escrita como: LLQG = Kc[ Ko(1 + C Ko) 1 C ]Ko C B = = [Kc Ko Kc Ko(1 + C Ko) 1 C Ko] C B = = [Kc Ko(1 (1 + C Ko) 1 )C Ko] C B = = Kc Ko(1 + C Ko) 1 C B
(A.5)
Si en esta ultima expresion se aplica la condicion de recuperacion dada por la expresion (A.2), se tiene, LLQG = Kc qBW (1 + C qBW ) 1 C B que cuando se hace tender q a in nito se reduce a: LLQG = Kc BW (C BW ) 1 C B
324
Condicion su ciente para la recuperacion
Aplicando a esta ultima expresion, nuevamente el lema de inversion de matrices (A.4) y sustituyendo por su valor se llega a,
LLQG = = = =
Kc BW (C BW ) 1 C B = KcBW (1 + KcB ) 1 [C BW (1 + KcB ) 1 ] KcBW (C BW ) 1 C B = KcB
1
C B =
Luego la expresion nal que se obtiene es,
LLQG(s) = KcB la cual es identica a la expresion (A.1) correspondiente a LLQR (s). Con esto queda demostrada la convergencia al tender el parametro q a in nito, de las funciones de transferencia en bucle abierto, cuando se tiene una estructura de realimentacion directa del estado o con un observador ( ltro de Kalman). Para que Ko cumpla la condicion de recuperacion se tendra que introducir alguna modi cacion en el ltro de Kalman. Para ello, se dise~na el ltro de Kalman con unas matrices de covarianzas cticias. Se tomaran:
Q = Qo + q2 BV B T R = Ro
(A.6) (A.7)
siendo V cualquier matriz no singular y donde Qo y Ro son las matrices de covarianzas nominales de w y v; y q es un parametro escalar conocido como ganancia de recuperacion. Con estas modi caciones se calcula el ltro de Kalman:
Ko = PC T R 1 AP + PAT + Q PC T R 1CP = 0
(A:8) (A:9)
Introduciendo las anteriores matrices de covarianzas en la ecuacion (A.9), resulta:
AP + PAT + Qo + q2BV B T PC T R 1CP = 0
(A:10)
Analisis de los sistemas de control basados en observador y dividiendo la expresion por q2 se llega a, A qP2 + qP2 AT + Qq2o + BV B T q2( qP2 )C T R 1C ( qP2 ) = 0
325 (A:11)
Hay que destacar el hecho de que en la anterior ecuacion (A.11), existen dos tipos de variables: q, que es el parametro cuyo valor se modi ca para recuperar la funcion de transferencia, y la matriz P , de la cual dependen los valores de las ganancias del ltro de Kalman y que solo puede ser encontrada una vez asignado a q un valor determinado. Por tanto, si se hace tender q a in nito se tendra:
! BV B T q2( qP2 )C T R 1 C ( qP2 ) q!1 y teniendo en cuenta el valor de Ko (ecuacion A.8), se tiene: Ko(q)RKoT (q) q!1 ! BV B T q2 que descomponiendo lo anterior se llega a: 1 1 1 Ko(q) q!1 2 2 ! B V | (R{z ) } = BW q
W
Se cumple, por tanto, la condicion de recuperacion (ecuacion A.2). Se calculara, por tanto, el ltro de Kalman a partir de la matriz de covarianza modi cada, de este modo, a medida que se aumente el valor del parametro q mas cerca se estara de la funcion de transferencia en bucle abierto del lqr. Al hacer esto, se pierde precision en la estimacion del estado, ya que se esta calculando el ltro de Kalman con unas covarianzas cticias, sin embargo, se gana en robustez.
A.3 Planteamiento del Metodo LQG en el Dominio de la Frecuencia La ecuacion de Riccati se puede interpretar en el dominio de la frecuencia, de forma que proporcione expresiones en terminos de funciones de transferencia. Sea el sis-
326
Planteamiento del Metodo LQG en el Dominio de la Frecuencia
tema,
x_ = Ax + Bu
(A:12)
donde u es de dimension 1 por simplicidad, y sometido al criterio de funcionamiento:
J=
Z1 0
(xT Qcx + u2) dt
(A:13)
Se supone r = 1 sin perdida de generalidad, ya que puede ser englobado en los elementos de la matriz Qc. La ecuacion de Riccati correspondiente viene dada por:
AT Pc + PcA PcBR 1B T Pc + Qc = 0 que a su vez puede ser reordenada de la forma:
Pc A AT Pc = Qc PcBB T Pc Sumando y restando sPc al primer miembro se tiene:
Pc(sI A) + ( sI AT )Pc = Qc PcBB T Pc que llamando (s) = (sI A) 1 conduce a:
Pc 1 (s) + T 1 ( s)Pc = Qc KcT Kc Premultiplicando por B T T ( s) y postmultiplicando por (s)B se llega a:
B T T ( s)Pc | 1 ({z s)(s}) B + B T | T ( s){zT 1 ( s)} Pc(s)B = I
I
T B T T ( s)[Qc KcT Kc](s)BB T T ( s) P|{z} cB + B | {zP}c (s)B =
B T T ( s)Qc(s)B B T T (
Kc KcT s)KcT Kc(s)B
Analisis de los sistemas de control basados en observador
327
La funcion de transferencia en bucle abierto cuando se aplica la ley de control
lqr es Hc = Kc (s)B = B T T (s)KcT , luego la anterior expresion se puede escribir:
HcT ( s) + Hc(s) = B T T ( s)Qc(s)B HcT ( s)Hc(s)
(A:14)
que a su vez se puede reescribir de la forma: [1 + HcT ( s)][1 + Hc(s)] = 1 + B T T ( s)Qc (s)B
(A:15)
Se de ne: Fc(s) 1 + Hc(s), y Fc(s) se conoce como la funcion de diferencias del retorno. Ahora supongase el segundo miembro de (A.15) factorizado de la forma (factorizacion espectral): 1 + B T T ( s)Qc(s)B = c(s)c( s)
(A:16)
se tiene entonces que (A.15) se puede reescribir:
Fc(s)Fc( s) = c(s)c( s) y por tanto:
Fc(s) = c(s) con lo que se llega a la expresion que da la funcion de transferencia del sistema en bucle abierto, con la realimentacion de las variables de estado: Hc(s) = c(s) 1 Observese que mediante la factorizacion espectral anterior se ha resuelto la ecuacion de Riccati al determinar c(s). En efecto se ha obtenido Hc (s), lo cual es equivalente a determinar Kc, ya que ambas vienen relacionadas por la expresion Hc(s) = KcB . Es decir, manipulando exclusivamente funciones de transferencia se llega a determinar la solucion al problema lqr. Una vez demostrado lo anterior se puede comprobar lo que se haba a rmado sobre la robustez de los reguladores lqr. Si se factoriza Qc de la forma Qc = M T M y se hace s = j! en la ecuacion de Riccati (A.15) se obtiene:
328
Planteamiento del Metodo LQG en el Dominio de la Frecuencia
j 1 + Hc(j!) j2= 1+ j M (j!)B j2 de donde:
k1 + Hc(j!)k > 1
(A:17)
Si se interpreta esta condicion en el plano polar, la curva de Hc(j!) no puede entrar dentro de un crculo de centro ( 1; 0) y radio 1, por lo que se asegura un margen de fase mayor de 60 grados y un margen de ganancia in nito. Un desarrollo analogo para el problema de la observacion llevara a un resultado del mismo tipo. Para el ltro de Kalman se tiene que la matriz de ganancia del observador esta dada por, Ko = PoC T obteniendose esta de la ecuacion de Riccati:
APo + PoAT + Qo PoC T CPo = 0 Si se de ne la funcion de transferencia en bucle abierto del observador como la que resulta de cortar el bucle del ltro de Kalman por el punto (1) en la gura A.2, se tendra: Ho = C Ko (A:18) Y efectuando un desarrollo similar al realizado para el control se llegara a:
Ho(s) = o (s) 1 con:
o (s)o( s) = 1 + C (s)QoT ( s)C T
(A:19)
Lo que se obtiene no es Ko, sino Ho(s), pero ambos resultados, como se ha visto, son equivalentes.
Procedimiento de calculo De lo desarrollado en esta seccion se puede resumir que mediante la manipulacion de funciones de transferencias, se llega a resolver el problema lqg. El procedimiento sera especi car la matriz Qc en forma factorizada como Qc = M T M , lo cual es equivalente a especi car la funcion de transferencia Gc(s) = M (s)B . A partir de
Analisis de los sistemas de control basados en observador
329
esta funcion de transferencia y mediante la factorizacion de la ecuacion de diferencias del retorno: [1 + HcT ( s)][1 + Hc(s)] = 1 + GTc ( s)Gc(s) (A:20) se puede llegar a deducir Hc(s), funcion de transferencia de bucle abierto del lqr. De forma analoga, especi cando la matriz Qo en forma factorizada como Qo = o bien especi car la funcion de transferencia Go(s) = C (s) , y mediante la factorizacion de la ecuacion de diferencias del retorno: [1 + Ho(s)][1 + HoT ( s)] = 1 + Go (s)GTo ( s) (A:21) se puede calcular Ho(s). T
Con estas dos funciones de transferencia: Hc(s); Ho(s), se pueden calcular las ganancias de la ley de control y del ltro de Kalman Kc y Ko, ya que estan directamente relacionadas por las expresiones (A.1) y (A.18) rese~nadas anteriormente.
A.4 Regulador LQG obtenido mediante ecuacion diofantica A continuacion se deduce una ecuacion diofantica, que puede ser utilizada como alternativa para obtener la expresion del regulador lqg. Este regulador a partir de la (ecuacion A.3) viene dado por, GR (s) = Kc(sI A + BKc + KoC ) 1Ko (A:22) que operando como se ha visto en la seccion (A.2), se llega a la expresion (A.5) de la funcion de transferencia en bucle abierto, y por tanto para el regulador sera, GR(s) = Kc Ko(1 + C Ko) 1 (A:23) Utilizando nuevamente el lema de inversion de matrices (A.4) se obtiene la expresion: GR (s) = [KcKo KcB (1 + C B ) 1 KcKo ](1 + C Ko) 1 (A:24) que llamando kk(s) = KcKo , y teniendo en cuenta las expresiones de Gc (A.1) y Go (A.18), puede escribirse, GR (s) = [kk Gc(1 + Gc) 1 kk](1 + C Ko) 1 = = [kk(1 Gc(1 + Gc) 1)][1 + C Ko C B (1 + Gc) 1kcKo] 1 = = kk(1 + Gc) 1[1 + Go Gp(1 + Gc) 1 kk] 1 (A.25)
330
Regulador LQG obtenido mediante ecuacion diofantica
GR(s) = 1 + G + G +kkG G G kk c o c o p GR(s) = (1 + G )(1 +kkG ) G kk c o p
(A:26) (A:27)
Esta expresion da una relacion en terminos de funciones de transferencia para el regulador lqg. Si se expresan las funciones de transferencia deseadas Gdc y Gdo como cociente de dos polinomios en s, y sustituyendo en la expresion (A.27) se tiene:
Gdc(s) = nd1((ss)) y Gdo (s) = nd((ss)) 1
(A:28)
(s) kk(s)d1(s) nr (s) (A:29) GR (s) = (s) kk = = c(s)o (s) n(s)kk(s)d1(s) dr (s) c o (s) n(s)kk(s) d ( s ) d1(s)d(s) d(s) donde c(s) es el factor positivo procedente de la factorizacion del termino derecho de la ecuacion (A.20) y o(s) el correspondiente a la ecuacion (A.21). A partir de la ecuacion (A.29), se puede llegar a la ecuacion diofantica que permite obtener la expresion del regulador mediante la manipulacion de polinomios en s, donde nr (s) y dr (s) son las incognitas. En efecto, haciendo nr (s) = kk(s)d1(s), se tiene: c(s)o(s) = dr (s) d(s) + n(s) nr (s) (A:30)
Apendice B Elementos matematicos utiles en la teora de control B.1 Polos y ceros de un sistema multivariable Sea un sistema lineal e invariante en el tiempo (slit) descrito por el conjunto de ecuaciones: x_ (t) = Ax(t) + Bu(t) y(t) = Cx(t) + Du(t) (B.1) donde x 2
View more...
Comments