Indice general 1 Introduccion al problema del control realimentado
1
1.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : :
1
1.2 Los bene cios de la realimentacion : : : : : : : : : : : : : : : : : : :
2
1.3 Sensibilidad en bucle abierto y en bucle cerrado. : : : : : : : : : : : : 3 1.4 Analisis y dise~no en presencia de incertidumbres : : : : : : : : : : : : 5 1.5 Posibles planteamientos : : : : : : : : : : : : : : : : : : : : : : : : :
6
1.6 Sistemas de tiempo continuo y de tiempo discreto : : : : : : : : : : : 7
2 Control adaptativo
9
2.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : :
9
2.2 Controladores adaptativos con modelo de referencia (MRAC) : : : : : 13 2.3 Reguladores autoajustables (STR) : : : : : : : : : : : : : : : : : : : : 16 2.4 Ejemplo simple : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 17 2.5 >Porque control adaptativo? : : : : : : : : : : : : : : : : : : : : : : : 19 2.6 El problema del control adaptativo : : : : : : : : : : : : : : : : : : : 23 i
ii
Indice general
3 Algoritmo de identi cacion de parametros
27
3.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 27 3.2 Modelo del sistema y de las perturbaciones : : : : : : : : : : : : : : : 28 3.3 Metodo de mnimos cuadrados : : : : : : : : : : : : : : : : : : : : : : 29 3.3.1 Caso determinista : : : : : : : : : : : : : : : : : : : : : : : : : 30 3.3.2 Caso no determinista : : : : : : : : : : : : : : : : : : : : : : : 30 3.3.3 Metodo recursivo : : : : : : : : : : : : : : : : : : : : : : : : : 32 3.4 Metodo de mnimos cuadrados extendidos y generalizados : : : : : : : 33 3.5 Aproximacion estocastica : : : : : : : : : : : : : : : : : : : : : : : : : 33 3.6 Metodo de variable instrumental : : : : : : : : : : : : : : : : : : : : : 34 3.7 Metodo de maxima verosimilitud : : : : : : : : : : : : : : : : : : : : 35 3.8 Modi caciones al algoritmo de identi cacion : : : : : : : : : : : : : : 35 3.9 Algoritmos de identi cacion rapidos : : : : : : : : : : : : : : : : : : : 38 3.10 Estimacion de los valores de continua : : : : : : : : : : : : : : : : : : 38 3.11 Algoritmo de identi cacion propuesto : : : : : : : : : : : : : : : : : : 39 3.12 Convergencia e identi cabilidad : : : : : : : : : : : : : : : : : : : : : 41 3.13 Ejemplo de identi cacion : : : : : : : : : : : : : : : : : : : : : : : : : 44
4 Control adaptativo por modelo de referencia
47
4.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 47 4.2 Dise~no de controladores adaptativos : : : : : : : : : : : : : : : : : : : 48 4.2.1 Enfoque de sensibilidad : : : : : : : : : : : : : : : : : : : : : : 49
Indice general
iii
4.2.2 Metodo de Lyapunov : : : : : : : : : : : : : : : : : : : : : : : 50 4.2.3 Metodo de hiperestabilidad : : : : : : : : : : : : : : : : : : : 54 4.3 Estructura general de los sistemas adaptativos (MRAC) : : : : : : : : 55 4.4 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : : : : : 58 4.4.1 Metodo del gradiente : : : : : : : : : : : : : : : : : : : : : : : 60 4.4.2 Metodo de Lyapunov : : : : : : : : : : : : : : : : : : : : : : : 62 4.4.3 Metodo de hiperestabilidad : : : : : : : : : : : : : : : : : : : 66
5 Reguladores autoajustables (STR)
73
5.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 73 5.2 Asignacion de polos y ceros : : : : : : : : : : : : : : : : : : : : : : : 76 5.3 Casos particulares : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 80 5.4 Prediccion optima : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 81 5.5 Regulador de mnima varianza : : : : : : : : : : : : : : : : : : : : : : 83 5.6 Control predictivo generalizado : : : : : : : : : : : : : : : : : : : : : 85 5.6.1 Formulacion del control predictivo generalizado : : : : : : : : 86 5.6.2 Consideracion de ruidos coloreados : : : : : : : : : : : : : : : 91 5.7 Controladores para plantas con parametros desconocidos : : : : : : : 92 5.8 Algoritmos con estructura explcita e implcita : : : : : : : : : : : : : 93 5.9 Propiedad de autosintona : : : : : : : : : : : : : : : : : : : : : : : : 96 5.10 Procedimiento de sntesis : : : : : : : : : : : : : : : : : : : : : : : : : 98 5.11 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : : : : : 99
iv
Indice general 5.11.1 Ejemplo de mnima varianza : : : : : : : : : : : : : : : : : : : 99 5.11.2 Control adaptativo PI : : : : : : : : : : : : : : : : : : : : : : 100 5.11.3 Control de robot movil : : : : : : : : : : : : : : : : : : : : : : 102
6 Autoajuste y ajuste por tabla de controladores
113
6.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 113 6.2 Control PID : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 115 6.3 Metodos de respuesta transitoria : : : : : : : : : : : : : : : : : : : : 116 6.3.1 Metodo de respuesta en escalon de Ziegler-Nichols : : : : : : : 117 6.3.2 Caracterizacion de la respuesta en escalon : : : : : : : : : : : 117 6.4 Metodos basados en realimentacion con rele : : : : : : : : : : : : : : 118 6.4.1 El metodo del balance armonico : : : : : : : : : : : : : : : : : 119 6.4.2 El metodo de Ziegler-Nichols en bucle cerrado : : : : : : : : : 121 6.4.3 Oscilaciones de rele : : : : : : : : : : : : : : : : : : : : : : : : 121 6.5 Ajuste por tabla : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 123 6.6 Dise~no de reguladores con ajuste por tabla : : : : : : : : : : : : : : : 124 6.6.1 Actuador no lineal : : : : : : : : : : : : : : : : : : : : : : : : 125 6.6.2 Tanque de seccion variable : : : : : : : : : : : : : : : : : : : : 126 6.6.3 Transformacion no lineal : : : : : : : : : : : : : : : : : : : : : 129
7 Aplicacion de control adaptativo
133
7.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 133
Indice general
v
7.2 Descripcion de la planta : : : : : : : : : : : : : : : : : : : : : : : : : 134 7.3 Modelo dinamico del campo : : : : : : : : : : : : : : : : : : : : : : : 136 7.3.1 Modelo concentrado : : : : : : : : : : : : : : : : : : : : : : : 136 7.3.2 Modelo distribuido : : : : : : : : : : : : : : : : : : : : : : : : 137 7.4 Control en adelanto : : : : : : : : : : : : : : : : : : : : : : : : : : : : 140 7.5 Control en bucle cerrado : : : : : : : : : : : : : : : : : : : : : : : : : 140 7.5.1 Controlador PI : : : : : : : : : : : : : : : : : : : : : : : : : : 141 7.5.2 Controlador PI por asignacion de polos : : : : : : : : : : : : : 142 7.5.3 Controlador autoajustable : : : : : : : : : : : : : : : : : : : : 143 7.5.4 Controlador PID adaptativo : : : : : : : : : : : : : : : : : : : 144 7.5.5 Controlador predictivo generalizado : : : : : : : : : : : : : : : 146 7.5.6 Supervision : : : : : : : : : : : : : : : : : : : : : : : : : : : : 148 7.6 Estudios de simulacion : : : : : : : : : : : : : : : : : : : : : : : : : : 150 7.7 Resultados en planta : : : : : : : : : : : : : : : : : : : : : : : : : : : 152
8 El problema del control robusto
159
8.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 159 8.2 Relaciones fundamentales : : : : : : : : : : : : : : : : : : : : : : : : 163 8.3 Descripcion de las incertidumbres : : : : : : : : : : : : : : : : : : : : 171 8.4 Estabilidad robusta : : : : : : : : : : : : : : : : : : : : : : : : : : : : 176 8.5 Comportamiento robusto : : : : : : : : : : : : : : : : : : : : : : : : : 187 8.6 Robustez de plantas con fuerte ganancia direccional : : : : : : : : : : 190
vi
Indice general
9 Metodos de dise~no LTR
197
9.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 197 9.2 Propiedades del regulador LQR : : : : : : : : : : : : : : : : : : : : : 198 9.3 El controlador LQG : : : : : : : : : : : : : : : : : : : : : : : : : : : : 204 9.4 Controlador LTR basado en observador : : : : : : : : : : : : : : : : : 207 9.4.1 Metodo LQG/LTR-i : : : : : : : : : : : : : : : : : : : : : : : 207 9.4.2 Metodo LQG/LTR-o : : : : : : : : : : : : : : : : : : : : : : : 210 9.5 Controlador LTR no basado en observador : : : : : : : : : : : : : : : 212 9.6 Controlador LTR=H1 : : : : : : : : : : : : : : : : : : : : : : : : : : 221
10 Controladores H1
227
10.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 227 10.2 Justi cacion del control H1 : : : : : : : : : : : : : : : : : : : : : : : 228 10.2.1 Interpretacion H1 del comportamiento nominal : : : : : : : : 228 10.2.2 Interpretacion H1 de la estabilidad robusta : : : : : : : : : : 231 10.2.3 Control H1 y la teora de juegos diferencial : : : : : : : : : : 233 10.3 Planteamiento del problema general de control : : : : : : : : : : : : : 234 10.3.1 Problema de seguimiento : : : : : : : : : : : : : : : : : : : : : 237 10.3.2 Problema de estabilidad robusta : : : : : : : : : : : : : : : : : 238 10.4 Parametrizacion de los controladores : : : : : : : : : : : : : : : : : : 239 10.4.1 El problema de ajuste del modelo : : : : : : : : : : : : : : : : 242 10.4.2 Aplicabilidad del teorema de Nehari : : : : : : : : : : : : : : : 244
Indice general
vii
10.5 Soluciones al problema de ajuste del modelo : : : : : : : : : : : : : : 246 10.5.1 El problema escalar : : : : : : : : : : : : : : : : : : : : : : : : 246 10.5.2 Optimizacion del comportamiento nominal : : : : : : : : : : : 248 10.6 Problemas de control H2; H1 en el espacio de estados : : : : : : : : : 253 10.6.1 Controlador optimo H2 : : : : : : : : : : : : : : : : : : : : : : 255 10.6.2 Relacion entre LQG/LTR y H2 : : : : : : : : : : : : : : : : : 257 10.6.3 Controlador H1 : : : : : : : : : : : : : : : : : : : : : : : : : : 259 10.6.4 Algoritmo de calculo del regulador H1 : : : : : : : : : : : : : 262 10.6.5 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : 264
11 Aplicacion de control robusto
277
11.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 277 11.2 Descripcion de la planta : : : : : : : : : : : : : : : : : : : : : : : : : 280 11.3 Evaluacion de los controladores : : : : : : : : : : : : : : : : : : : : : 291 11.4 Dise~no de controladores LTR multivariables : : : : : : : : : : : : : : 292 11.4.1 Dise~no LTR-o : : : : : : : : : : : : : : : : : : : : : : : : : : : 293 11.4.2 Dise~no LTR-i : : : : : : : : : : : : : : : : : : : : : : : : : : : 297 11.5 Dise~no de controladores H2 y H1 multivariables : : : : : : : : : : : : 304 11.5.1 Controladores H1 para sistema de orden elevado : : : : : : : 306 11.5.2 Regulador H1 para una planta no lineal : : : : : : : : : : : : 313 11.6 Sntesis de los resultados obtenidos : : : : : : : : : : : : : : : : : : : 318
viii
Indice general
A Analisis de los sistemas de control basados en observador
321
A.1 Analisis de robustez con y sin observador : : : : : : : : : : : : : : : : 321 A.2 Condicion su ciente para la recuperacion : : : : : : : : : : : : : : : : 323 A.3 Planteamiento del Metodo LQG en el Dominio de la Frecuencia : : : 325 A.4 Regulador LQG obtenido mediante ecuacion diofantica : : : : : : : : 329
B Elementos matematicos utiles en la teora de control
331
B.1 Polos y ceros de un sistema multivariable : : : : : : : : : : : : : : : : 331 B.2 Normas : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 333 B.3 Los Valores Singulares : : : : : : : : : : : : : : : : : : : : : : : : : : 334 B.4 Los Valores Propios : : : : : : : : : : : : : : : : : : : : : : : : : : : : 337 B.5 La Matriz de Ganancia Relativa : : : : : : : : : : : : : : : : : : : : : 339
C De niciones y algoritmos relacionados con la teora H1
343
C.1 Algunas de niciones : : : : : : : : : : : : : : : : : : : : : : : : : : : 343 C.2 El operador de Riccati : : : : : : : : : : : : : : : : : : : : : : : : : : 345 C.3 El problema de aproximacion de Hankel : : : : : : : : : : : : : : : : 346 C.4 El algoritmo de Glover : : : : : : : : : : : : : : : : : : : : : : : : : : 348
Indice general
ix
x
Indice general
Prologo Este libro pretende ser una puesta al da sobre el control de sistemas en los que no se conoce con precision su dinamica. Para ello se aborda el problema desde dos puntos de vista diferentes, como son las tecnicas de Control Adaptativo y las metodologas de dise~no de Controladores Robustos. A lo largo del libro se procede a describir ambos enfoques y se ilustran con algunos ejemplos teoricos, as como mediante la exposicion de dos aplicaciones a procesos reales. Los captulos 2 al 7 se dedican a las tecnicas de control adaptativo y los captulos 8 al 11 al control robusto. El libro esta organizado en once captulos. El primero constituye una introduccion al tema, y en el se tratan cuestiones relativas al control realimentado y a los posibles enfoques para tener en cuenta la presencia de incertidumbres en los sistemas reales. El captulo segundo se dedica a una descripcion de las tecnicas de dise~no de controladores adaptativos. Los algoritmos de identi cacion de parametros se describen en el captulo 3, siendo estos una parte esencial de los sistemas de control adaptativos. Los captulos 4 y 5 se dedican a describir en profundidad las dos tecnicas basicas de control adaptativo, como son, los controladores adaptativos por modelo de referencia (MRAC) y los controladores adaptativos autoajustables (STR). En el captulo 6 se describen varias tecnicas de autoajuste y ajuste por tabla de controladores. Estas tecnicas, sin ser consideradas por muchos autores como adaptativas, son de gran utilidad y aplicabilidad en el control de procesos industriales.
Las tecnicas descritas en los captulos 2 al 6 son aplicadas en el captulo 7, al control de un proceso real particularmente interesante, como es el control de un campo de colectores solares cilndrico parabolico tipo acurex, disponible en la planta solar de Tabernas (Almera). En el captulo 8 se hace una introduccion al problema del control robusto, de niendose algunos conceptos clave en el estudio de la robustez de sistemas de control. El captulo 9 se dedica a las metodologas de dise~no ltr o metodologas de recuperacion de la funcion de transferencia. Aunque estas tecnicas fueron desarrolladas inicialmente para el controlador lqg, hoy en da han transcendido para convertirse en tecnicas de ajuste de funciones de transferencia. El captulo 10 se dedica a la tecnica de dise~no de controladores robustos conocida como H1. Dado que esta metodologa esta hoy en da en permanente desarrollo, existe una gran variedad de posibles algoritmos. En este libro se presenta el planteamiento inicial para resolver el problema de control H1, as como algunas de las metodologas basadas en la descripcion por variables de estado. Por ultimo, el captulo 11 se dedica a la aplicacion de los desarrollos planteados en los captulos 8, 9 y 10 al control de un barco. Para ello, se presentan distintos desarrollos para control multivariable, haciendo especial enfasis en el grado de robustez que se consigue, evaluado mediante distintos ndices de comportamiento. El libro esta compuesto de material recogido de apuntes y notas impartidas a alumnos de cursos de doctorado y de artculos publicados por los autores. El material de este libro ha servido y sirve en la actualidad, como parte fundamental de un curso de doctorado. El libro va dirigido a una gran variedad de personas, el unico requisito es tener unos conocimientos basicos de la teora de control.
Agradecimientos Los autores desean expresar su agradecimiento a las personas que de distintas formas han hecho posible este libro. En primer lugar a Javier Aracil y Eduardo F. Camacho, por sus valiosas sugerencias, estmulos y consejos. Tambien deseamos expresar nuestro agradecimiento a todos los compa~neros de los Departamentos de Ingeniera de Sistemas y Automatica de las Universidades de Sevilla y Cadiz, especialmente a Manolo Berenguel y Carlos Bordons por sus aportaciones en la elaboracion de pruebas en la Planta Solar de Almera. As mismo a Julio Terron y Manuel Haro por su disponibilidad y cooperacion. Parte del material incluido en el libro es el fruto del trabajo de investigacion realizado, que ha sido nanciado por la cicyt y el ciemat. Deseamos expresar nuestro agradecimiento a estas instituciones por su nanciacion. Tambien deseamos expresar nuestro agradecimiento al departamento de Sistemas de la Fabrica de Artillera y Sistemas de la empresa bazan en San Fernando (Cadiz) y en especial a Francisco Gonzalez Mene, que nos motivo en el estudio y aplicacion de las tecnicas de control robusto. Por ultimo damos las gracias a nuestras familias por el apoyo, paciencia y tiempo, durante la escritura del libro, sin lo cual, este libro no habra sido posible. Sevilla, Diciembre de 1995
Francisco Rodrguez Rubio
Ing. de Sistemas y Automatica Escuela Superior de Ingenieros 41012 - Sevilla E-mail:
[email protected]
Cadiz, Diciembre de 1995
Manuel Jesus Lopez Sanchez
Ing. de Sistemas y Automatica Facultad de Ciencias Nauticas 11510 - Puerto Real. Cadiz E-mail:
[email protected]
Captulo 1 Introduccion al problema del control realimentado 1.1 Introduccion En la con guracion estandar de un sistema de control, la planta y el controlador forman un bucle cerrado en el que cada componente ejerce una in uencia sobre el otro. La entrada a la planta u depende a traves del controlador de la variable controlada y, la cual a su vez depende de la entrada por la dinamica de la planta. Este fenomeno se llama realimentacion. La realimentacion se considera como un concepto general para controlar sistemas tecnicos, ecologicos o sociales. Las plantas qumicas, por ejemplo, tienen cientos de bucles para hacer que las temperaturas, presiones o ujos permanezcan en los niveles dados a pesar de la in uencia de las se~nales externas no medibles. Controladores multivariables mas complejos son utilizados para procesos con dos o mas se~nales acopladas fuertemente, tales como sistemas de aire acondicionado, columnas de destilacion, plantas de generacion de energa electrica, calderas de vapor o aviones. Pretendemos ver los sistemas realimentados desde el punto de vista del control ingenieril, el cual tiene por mision encontrar un controlador para conseguir o mantener la estabilidad, mejorar la robustez, atenuar las perturbaciones, asegurar la regulacion asintotica, etc. Un sistema realimentado consta de un proceso dado con unas propiedades jas y de un controlador que puede elegirse libremente. 1
2
Los bene cios de la realimentacion
1.2 Los bene cios de la realimentacion Los sistemas realimentados muestran varias propiedades importantes porque el comportamiento del sistema global esta dado por las propiedades de la interaccion de cada una de las partes. La realimentacion hace posible estabilizar sistemas inestables, mejorar la robustez ante variaciones del comportamiento de algunas partes del sistema, o atenuar las pertubaciones externas no medibles. Hay muchas razones para introducir deliberadamente la realimentacion en procesos que funcionan bien. El principal bene cio de la realimentacion no puede deducirse sin la consideracion de las incertidumbres en el comportamiento de la planta. Hay dos razones por las que la salida de la planta y, para una entrada dada u, produce una trajectoria que no esta completamente determinada previamente. Primero, la dinamica de la planta no se conoce completamente, por lo que el modelo de la planta solo puede considerarse como una aproximacion mas que como una descripcion exacta. Segundo, perturbaciones desconocidas pueden in uir en el comportamiento del sistema. En este caso, la salida y no es solo la respuesta a la se~nal de control u, sino a la perturbacion d, que es generalmente indeterminada en el sentido que puede ser cualquier cosa dentro de un conjunto de posibles se~nales de perturbacion ( gura 1.1).
e 6
r -
d
K (s)
u-
G(s)
- ?
y
-
Figura 1.1: Control en bucle cerrado Indeterminaciones de esta clase ocurren en menor o mayor medida en todos los problemas de control, porque a causa del proceso de modelado y dise~no, el sistema a ser controlado tiene que ser considerado fuera de su entorno. Usualmente no es facil saber que fenomenos tienen que ser considerados como parte de la planta o como conexiones entre la planta y su entorno y cuales no. Bajo estas circunstancias
Introduccion al problema del control realimentado
3
es importante conocer que las principales propiedades de los sistemas realimentados dependen solo debilmente de tales indeterminaciones. Robustez frente a elementos de dinamicas inmodeladas y perturbaciones, pueden igualmente ser considerados como una propiedad estructural de los sistemas realimentados. Como la se~nal de control u es calculada por el controlador dependiendo del valor actual de y, hay que tener en cuenta el efecto de las se~nales de control anteriores y de las perturbaciones. Esta propiedad fundamental de los sistemas realimentados se hace evidente por la comparacion de las con guraciones de los sistemas de control en bucle abierto y en bucle cerrado. El control en bucle abierto esta basado en la exactitud del modelo de la planta, dado que la se~nal de control se calcula en base al modelo. Los efectos que resultan de las dos clases de indeterminaciones aparecen enteramente como desviaciones de la trajectoria resultante sobre la respuesta especi cada. Sin embargo, en el control en bucle cerrado, se compara el valor actual de la salida y con la se~nal de referencia r, y la entrada a la planta se calcula dependiendo de la se~nal de error. Ademas de la informacion dada a priori acerca de la planta en forma de un modelo matematico, el control realimentado usa el conocimiento acerca del comportamiento actual de la planta y de las perturbaciones existentes, lo cual es suministrado implcitamente por la medida del valor de y. La introduccion de la realimentacion esta principalmente motivada por el conocimiento incompleto del sistema a ser controlado y por el efecto de las perturbaciones externas. Mas estrictamente, el uso de la realimentacion puede verse como no justi cable, si no hay indeterminaciones en el sistema, porque para sistemas no perturbados, el control en bucle abierto produce la misma o probablemente mejor respuesta.
1.3 Sensibilidad en bucle abierto y en bucle cerrado. Sea un sistema cuya funcion de transferencia en bucle abierto es G(s). Si la funcion de transferencia en bucle cerrado es T (s) se tendra que en el dominio de frecuencias de interes, es decir, para ! 2 [0; ], siendo la frecuencia angular que de ne el ancho de banda para el que se proyecta el sistema, se tendra que,
T (s) ' 1 es decir, se pretende que en el anterior dominio de frecuencias la reproduccion de
4
Sensibilidad en bucle abierto y en bucle cerrado.
las se~nales sea lo mas el posible. Se sabe que la relacion que liga a G(s) y a T (s) es T (s) = 1 +G(Gs()s) Por lo tanto, puesto que T ' 1 para todas las frecuencias de interes, se tendra que
G 1 para ! 2 [0; ] (1:1) Se de ne la sensibilidad de un sistema, dado por su funcion de transferencia T (s), como la variacion que sufre esta funcion de transferencia como consecuencia de la variacion de uno de los parametros p que interviene en la misma. Se denota por SpT la sensibilidad de la funcion de transferencia T (s) con respecto a variaciones del parametro p. Formalmente se escribe: on de T (s) SpT = %%variaci variacion de p lo que a su vez puede escribirse SpT = dT=T = dT p dp=p dp T Supongase, que uno de los parametros que aparecen en G(s) sufre una variacion (por envejecimiento, efecto de perturbaciones exteriores, etc.). La sensibilidad de la funcion de transferencia en bucle cerrado T (s) a la variacion de un parametro de G(s) sera: 1 SGT = (1 +1G)2 G = T 1+G lo que habida cuenta de la expresion 1.1 conduce a SGT 1 es decir, un sistema en bucle cerrado tiene una sensibilidad a las variaciones de los elementos que constituyen la cadena en bucle abierto mucho menor que 1. Este resultado debe compararse con la sensibilidad de un sistema en bucle abierto G = G1G2, que puede escribirse, SGG1 = 1 Se concluye de lo anterior que la introduccion de la realimentacion reduce notablemente la sensibilidad del sistema con respecto a la variacion de los parametros. Es este un resultado fundamental que justi ca sobradamente la introduccion de la realimentaccion en el dise~no de sistemas de control.
Introduccion al problema del control realimentado
5
1.4 Analisis y dise~no en presencia de incertidumbres La mayora de los metodos de analisis y dise~no para sistemas realimentados presuponen que se dispone de un modelo su cientemente exacto del proceso a controlar o del sistema en bucle cerrado, respectivamente. En este modelo esta jado, tanto la estructura del modelo como los parametros. Aunque algunos de los metodos hacen algunas consideraciones sobre el efecto de las posibles incertidumbres, el tratamiento y atenuacion de las pertubaciones no son su principal razon de ser. Sin embargo, un enfoque mas realista para el control por realimentacion tiene que tener en cuenta las imprecisiones del modelo, lo cual es la principal razon para la utilizacion de la realimentacion. Otra forma de abordar el problema es tratar con principios y metodos que nos permitan considerar explcitamente las discrepancias entre el modelo y el proceso real. Esto es, intentar analizar y dise~nar el controlador sin tener un modelo matematico preciso de la planta. Intentar obtener resultados que no solo sean validos para el modelo aproximado, sino que lo sean para un rango de modelos de la planta dados y en consecuencia para el proceso real. La conveniencia de investigaciones teoricas sobre el analisis y dise~no de sistemas robustos pone de mani esto que la robustez es una cuestion fundamental en los sistemas realimentados que ha sido explorada desde hace bastante tiempo (Dorato 1987, Grimble 1994). Conforme a la declaracion de que un ingeniero encuentra una herramienta y una solucion para cada problema, puede ser tosco, ya que muchos bucles de control tienen que operar sin ningun modelo matematico. Las bien conocidas reglas de Ziegler y Nichols y similares, son un ejemplo obvio para un ingeniero practico, el cual se ha basado originalmente en un modelo aproximado simple, pero que es utilizado sucesivamente sin con rmacion del grado de aproximacion de este tipo de modelos para el proceso bajo consideracion. Sin embargo, sin un profundo conocimiento de los bene cios de la realimentacion, el campo de aplicaciones de los controladores lineales invariantes en el tiempo, para el caso de desconocimiento del proceso, variable con el tiempo o no lineal, debe quedar mucho mas limitado. Experiencias practicas y ejemplos academicos muestran que una mera introduccion a la realimentacion no garantiza obtener los requerimientos de robustez e insensibilidad frente a las imprecisiones del modelo. La realimentacion debe estar relacionada con la clase y cantidad de incertidumbre del modelo y con las propiedades que seran preservadas. Desde el punto de vista ingenieril, las investigaciones teoricas sobre la robustez
6
Posibles planteamientos
de los sistemas realimentados, deben estar encaminadas a,
determinar las capacidades fundamentales de la realimentacion lineal para
controlar plantas con incertidumbres, y elaborar procedimientos de analisis y dise~no practicos.
La primera tarea concierne a preguntas como: > Que incertidumbre del modelo puede ser tolerada por el controlador lineal ? > Que estructura debe tener el controlador ? > Bajo que condiciones debe ser dise~nado el controlador para que asegure la estabilidad (integridad) en el caso de fallo del sensor o actuador ? La segunda tarea es claro que va hacia la explotacion sistematica de la robustez.
1.5 Posibles planteamientos Principalmente, para el dise~no de controladores a partir de modelos de la planta que son lineales e invariantes con el tiempo, hay dos posibles enfoques para contemplar las incertidumbres en el modelo del sistema y las perturbaciones sobre este (Grimble 1994). El primero de ellos es utilizar un controlador adaptativo, el cual estima los parametros y calcula la se~nal de control basandose en dichos parametros. La metodologa de los reguladores autoajustables es la adecuada en este caso, pero conlleva el dise~no en lnea, con el esfuerzo de calculo necesario para ello, mucho mayor que en el caso de un regulador mas simple. El segundo enfoque es considerar las incertidumbres del sistema en el dise~no de un controlador jo, lo cual lleva a un esquema de control robusto, que es mas insensible a las variaciones en los parametros y a las perturbaciones. Existen distintas losofas para hacer esto, desde el calculo de un controlador lqg con recuperacion de la funcion de transferencia del lqr, lo cual conduce a un controlador robusto llamado lqg/ltr, a considerar la minimizacion de una cierta norma de una funcion de transferencia. Las normas mas empleadas son la norma H2 y la norma H1. Tambien estan apareciendo recientemente en la literatura enfoques combinados de los mencionados anteriormente. Por ejemplo el dise~no de sistemas de control robustos H1 adaptativos. Aunque estos enfoques son difciles de tratar por el momento. A lo largo de este texto nos centraremos en algunos aspectos de ambos enfoques, tratando de ilustrar la aplicacion al control de procesos.
Introduccion al problema del control realimentado
7
1.6 Sistemas de tiempo continuo y de tiempo discreto Las se~nales de interes en el control de sistemas (se~nales de control, error, salida de los actuadores, etc.), son usualmente se~nales en tiempo continuo y las especi caciones (ancho de banda, sobreoscilacion, tiempo de subida, etc.), se formulan tambien en tiempo continuo. Pero dado que la tecnologa digital ofrece multiples bene cios, los sistemas de control actuales emplean tecnologa digital para la realizacion de los controladores. Un controlador digital ejecuta basicamente tres funciones: muestrea y cuanti ca una se~nal de tiempo continuo (tal como el error de seguimiento) para obtener una se~nal digital; procesa esta se~nal digital utilizando un computador digital; y posteriormente convierte la se~nal digital resultante a una se~nal de tiempo continuo. Este proceso involucra sistemas de tiempo continuo y sistemas de tiempo discreto. Los sistemas muestreados operan en tiempo continuo, pero algunas se~nales de tiempo continuo son muestreadas en ciertos instantes de tiempo (normalmente de forma periodica), produciendo se~nales de tiempo discreto. Por ello, los sistemas muestreados son sistemas hbridos, que involucran ambos tipos de se~nales. La sntesis de un controlador digital puede efectuarse de acuerdo con los tres metodos alternativos siguientes:
Discretizacion de controladores analogicos. Discretizacion de la planta y dise~no en tiempo discreto. Dise~no directo utilizando la representacion en tiempo discreto. En el primer caso se emplean los metodos basados en la utilizacion de representaciones en tiempo continuo para determinar un controlador analogico que posteriormente se discretiza (por ejemplo mediante la tranformacion bilineal), obteniendose una descripcion del controlador como un sistema de tiempo discreto. La ventaja de este metodo es que el dise~no se realiza en tiempo continuo donde las especi caciones se dan de forma natural. Este metodo es valido siempre y cuando el periodo de muestreo sea lo su cientemente peque~no para que la actuacion del controlador digital se aproxime a la del analogico. Esto lleva a que se necesite un hardware mas potente y caro, por lo que hay que llegar a un compromiso entre el coste y la precision del controlador aproximado.
8
Sistemas de tiempo continuo y de tiempo discreto
En el segundo caso se utilizan tecnicas espec cas en tiempo discreto, contemplandose espec camente los procesos de muestreo y reconstruccion de se~nales. En este caso se utiliza una representacion equivalente del conjunto como un sistema de tiempo discreto. La ventaja de este metodo es su simplicidad. Por contra, el enfoque ignora completamente que ocurre entre los instantes de muestreo, y por otro lado las especi caciones de tiempo continuo no siempre se pueden trasladar de forma clara a tiempo discreto. Por ultimo, si el periodo de muestreo cambia, el controlador debe ser redise~nado. En el tercer caso el controlador se dise~na directamente para el sistema de tiempo discreto. La ventaja es que en este caso se resuelve el problema sin aproximaciones. A lo largo de los proximos captulos, se describen tecnicas de dise~no de controladores tanto para sistemas en tiempo continuo como para sistemas en tiempo discreto. En algunos casos los desarrollos teoricos estan demostrados para sistemas continuos, no existiendo hasta el momento desarrollos equivalentes para sistemas en tiempo discreto, siendo necesario por tanto, para la realizacion digital de estos controladores emplear el primer tratamiento de los tres mencionados. En otros casos el planteamiento se realiza directamente para sistemas en tiempo discreto, por lo que su realizacion es mas directa. En otras ocasiones, debido a la naturaleza del proceso de identi cacion se dispone de una descripcion en tiempo discreto y los controladores a dise~nar estan basados en la teora de sistemas de tiempo continuo. En este caso se calcula la aproximacion de tiempo continuo del sistema (por ejemplo mediante la tranformacion bilineal inversa), se dise~na el controlador y posteriormente se deshace el cambio para la realizacion del controlador en un computador digital.
Captulo 2 Control adaptativo 2.1 Introduccion El termino adaptativo signi ca cambiar el comportamiento conforme a nuevas circunstancias. Un regulador adaptativo es un regulador que puede modi car su comportamiento en respuesta a cambios en la dinamica del sistema y a las perturbaciones. Este mismo objetivo es el de la inclusion de la realimentacion en el bucle de control, por lo que surge la pregunta de cual es la diferencia entre control realimentado y control adaptativo. Existen muchas de niciones de control adaptativo, siendo una de las mas aceptadas, que control adaptativo es un tipo especial de control no lineal en el que el estado del proceso puede ser separado en dos escalas de tiempo que evolucionan a diferente velocidad. La escala lenta corresponde a los cambios de los parametros y por consiguiente a la velocidad con la cual los parametros del regulador son modi cados, y la escala rapida que corresponde a la dinamica del bucle ordinario de realimentacion. El esquema basico de control adaptativo, (Landau 1974) segun puede verse en la gura 2.1, esta compuesto de un bucle principal de realimentacion negativa, en el que actua al igual que en los sistemas convencionales un regulador y de otro bucle en el que se mide un cierto ndice de funcionamiento, el cual es comparado con el ndice deseado y se procesa el error en un mecanismo de adaptacion que ajusta los parametros del regulador y en algunos casos actua directamente sobre la se~nal de control. Tambien puede existir un tercer bucle dedicado a supervisar la marcha de 9
10
Introduccion
los dos bucles anteriores (Isermann 1982), en orden a asegurar la estabilidad del sistema y a mejorar la actuacion del conjunto. El mecanismo de adaptacion presenta una solucion en tiempo real al problema de dise~no para sistemas con parametros conocidos, aunque como veremos mas adelante, puede ir a un tiempo de muestreo superior al correspondiente al regulador e identi cador. La caracterstica fundamental que distingue a los sistemas adaptativos es la presencia de un bucle de control en el que se compara un ndice de funcionamiento (Landau 1981).
? r - Actuacion Deseada
?
Comparacion Decision
6
- Controlador Ajustable
-u 6
- Mecanismo de
Adaptacion
Perturbacion
?
y
-
Planta
?
?
Medida del Indice de Actuacion
Figura 2.1: Con guracion basica de control adaptativo Existen muchos tipos de controladores que proporcionan buenas caractersticas de regulacion en presencia de cambios de los parametros del sistema y que segun la de nicion anterior no son realmente adaptativos, puesto que la adaptacion se realiza en bucle abierto. Un ejemplo muy utilizado de control adaptativo en bucle abierto es el denominado Cambio por tabla1. Consiste en la modi cacion de los parametros del controlador a partir de una tabla que ha sido calculada previamente para distintos puntos de funcionamiento, en funcion de una variable auxiliar. Un caso tpico es el control de vuelo de un avion, cuyo regulador puede ser cambiado en funcion de la altura de este. 1
En la terminologa inglesa se denomina Gain Scheduling
Control adaptativo
11 Mecanismo de Adaptacion
r
C
e - Controlador Ajustable 6
-
Medida de la Variable auxiliar u
- Planta
Medio Ambiente y
-
C
CW
Figura 2.2: Sistema adaptativo en bucle abierto En la gura 2.2, se presenta esquematicamente este tipo de controladores. Se supone que existe una fuerte relacion entre la variable auxiliar y la dinamica de los parametros del sistema. Este tipo de adaptacion tiene la ventaja de que el controlador puede ser cambiado muy rapidamente, dependiendo de la rapidez con que la variable auxiliar re eje el cambio de la dinamica del proceso, siendo muy importante la eleccion de dicha variable. Sin embargo estos reguladores consumen mucho tiempo en la realizacion de la tabla de parametros, presentando as mismo algunos problemas en la conmutacion de unos parametros a otros. Segun sean dise~nados los bloques descritos anteriormente, podemos tener uno u otro tipo de control adaptativo, pudiendose dividir principalmente en dos grupos: Controladores adaptativos con modelo de referencia (mrac) y Reguladores autoajustables (str). mrac y str pueden ser considerados como una aproximacion a la solucion del
problema de control adaptativo. La hipotesis que justi ca la aproximacion es que para cualquier juego de valores posibles de los parametros de la planta y las perturbaciones, existe un controlador lineal con una complejidad jada, tal que el conjunto de controlador y planta tienen caractersticas preespeci cadas. 1. Los controladores adaptativos con modelo de referencia, intentan alcanzar para una se~nal de entrada de nida, un comportamiento en bucle cerrado dado por un modelo de referencia. 2. Los reguladores adaptativos autoajustables, tratan de alcanzar un control optimo, sujeto a un tipo de controlador y a obtener informacion del proceso y
12
Introduccion sus se~nales.
Estas dos tecnicas han sido desarrolladas separadamente durante varios a~nos, pudiendose demostrar su equivalencia en muchos casos. Las ventajas de mrac estan en su rapida adaptacion para una entrada de nida y en la simplicidad de tratamiento de la estabilidad utilizando la teora de estabilidad de sistemas no lineal. Sin embargo, no se adapta convenientemente si la se~nal de entrada al sistema tiene poca riqueza. El str tiene la ventaja de que se adapta para cualquier caso y en particular para perturbaciones no medibles, teniendo al mismo tiempo una estructura modular, lo que hace posible la programacion por bloques, siendo facil de realizar distintos reguladores. En este captulo se hace una breve introduccion a las distintas variantes de control adaptativo, describiendose las ventajes e inconvenientes de estos controladores. En captulos posteriores se analizan con mas detalle cada uno de ellos. Hasta la actualidad han sido propuestas varias formas de dise~no del algoritmo de control de un sistema lineal, pudiendose clasi car estas de diferentes maneras, siendo una posible, en funcion de que el criterio de dise~no sea optimo o no optimo, pudiendose destacar entre ellos los siguientes : 1. Criterio optimo:
Controlador de mnima varianza de Astrom y Wittenmark 1973. Controlador de mnima varianza generalizado de Clarke y
Gawthrop 1975,1979. Controladores predictivos generalizados Clarke y Gawthrop 1988. 2. Criterio no optimo:
Asignacion de polos y ceros (Wellstead et al. 1979). Asignacion de polos y ceros (Astrom y Wittenmark 1980). Controlador en tiempo mnimo (Isermann 1981). Regulador PID (Ortega 1982).
Control adaptativo
13
2.2 Controladores adaptativos con modelo de referencia (MRAC) Los sistemas adaptativos con modelo de referencia fueron dise~nados primeramente para sistemas continuos por minimizacion de un ndice de actuacion, siendo dicho ndice la integral del error al cuadrado (Hang 1973). Esta regla de dise~no fue propuesta por Whitaker del MIT (1958), Instrumentation Laboratory, denominandose por ello como la regla del MIT. En cuanto a las con guraciones posibles con modelo de referencia, la mas usual es utilizar un modelo paralelo ( gura 2.3), aunque son posibles otras con guraciones (Landau 1974, 1981), como modelo serie, serie-paralelo, etc. Mecanismo de Adaptacion
CC
- Controlador Ajustable 6
r - ?
uPlanta
BBN
de - Modelo Referencia
yp -
? 6 ym
Figura 2.3: Estructura con modelo de referencia (MRAC) Existe una dualidad entre los sistemas de control adaptativo a un modelo de referencia y el problema de identi cacion con un modelo ajustable, siendo en este caso el modelo de referencia la planta a identi car. Dado un modelo de referencia Gm (s; p) y un sistema ajustable Ga(s; p^), el cual se desea que siga al modelo para que el error sea nulo (o mnimo en el caso de la presencia de perturbaciones), se de ne el ndice de funcionamiento:
14
Controladores adaptativos con modelo de referencia (MRAC)
Z J = 12 e2 dt ; e = ym ya ym ya p^
salida del modelo de referencia, salida del modelo ajustable, parametro a ajustar.
Usando la tecnica de optimizacion del gradiente (Landau 1981) se tiene que la regla de adaptacion es: @J ^p(e; t) = Kgrad(J ) = K @ p^ siendo ^p la variacion de p^ con relacion al ultimo valor calculado y K es la ganancia de adaptacion. La variacion del parametro ajustable con relacion al tiempo sera:
@ @J p^_ = ddtp^ = K @t @ p^
!
Si se asume variacion lenta de la ley de adaptacion, se puede intercambiar el orden de las derivadas:
! @ @J p^_ = K @ p^ @t = K @@p^ 12 e2 p^_ = Ke @@ep^ La ley de adaptacion (2.1) representa la regla del M.I.T.
luego,
@e = @ (ym ya) = @ya @ p^ @ p^ @ p^ a p^_ = Ke @y @ p^
(2:1)
Control adaptativo
15
La @ya =@ p^ es la funcion de sensibilidad del modelo ajustable con respecto al parametro. En este caso la funcion de sensibilidad es proporcional a ym, quedando la ley de adaptacion de la forma :
p^_ = K1 e ym Esta regla ha sido muy popular debido a su simplicidad. Sin embargo para el caso de ajuste de varios parametros requiere un numero elevado de funciones de sensibilidad (tantas como parametros). Por otro lado la ganancia de adaptacion gobierna la velocidad de respuesta, si esta es muy grande el sistema puede ser inestable y si es muy peque~na la velocidad sera muy lenta. Para obtener un buen compromiso entre velocidad de respuesta y estabilidad es necesario un laborioso estudio por simulacion. Otra tecnica de dise~no se fundamenta en la utilizacion del segundo metodo de Lyapunov, el cual tiene la ventaja de que asegura la estabilidad global para cualquier valor de la ganancia de adaptacion y cualquier tipo de entrada. La principal desventaja de este metodo es que se requiere el conocimiento del vector de estado, que no siempre es accesible. Otra desventaja es que no es aplicable a los casos donde los parametros del conjunto planta mas controlador no pueden ser modi cados directamente.
6
-
-
w
Parte lineal e invariante en el tiempo
Parte no-lineal y/o variable en el tiempo
-
v
Figura 2.4: Separacion del sistema (Hiperestabilidad) Landau (1981) propone una tecnica de dise~no basada en el concepto de hiperestabilidad y en la teora de estabilidad de Popov. El concepto de hiperestabilidad esta relacionado con la estabilidad de una clase de sistemas, tales que pueden ser
16
Reguladores autoajustables (STR)
separados en dos bloques, gura 2.4. Este sistema esta formado por una parte lineal invariante en el tiempo y otra no lineal y/o variable en el tiempo. Si la entrada y salida de la parte no lineal estan relacionadas por la desigualdad de Popov : Zt n(0; t) = v w dt Yo2; 8t > 0: 0
donde v es la entrada y w la salida e Yo2 es una constante nita positiva independiente de t, el problema de encontrar la estabilidad absoluta de este sistema, se concreta en averiguar las condiciones que debe de cumplir la parte lineal para que el conjunto sea estable. Para dise~nar la ley de adaptacion mediante esta tecnica se tienen que seguir los pasos que se detallan a continuacion de forma resumida : 1. Transformar el sistema con modelo de referencia en uno equivalente que tenga la estructura de la gura 2.4. 2. Encontrar la ley de adaptacion para que se cumpla la desigualdad de Popov. 3. Encontrar la parte de la ley de adaptacion que aparezca en la parte lineal para que el conjunto del sistema sea globalmente estable. 4. Volver al sistema original y formular la ley de adaptacion explcitamente. Una discusion extensa de esta tecnica puede encontrarse en el libro de Landau (1981), resultando en casos particulares que la ley de adaptacion es de la forma proporcional + integral o proporcional + integral + derivada. Con esta tecnica se garantiza la estabilidad del conjunto, siendo su principal desventaja que a menudo son necesarios una serie de diferenciadores.
2.3 Reguladores autoajustables (STR) El diagrama de bloques de estos controladores se puede ver en la gura 2.5; en el se distinguen tres partes claramente diferenciadas:
un algoritmo recursivo de estimacion de parametros
Control adaptativo
17
un mecanismo de adaptacion que desarrolla la tarea de dise~no del regulador y un regulador con parametros ajustables. Estos reguladores conforman una estructura suboptima basada en el principio de separacion de las tareas de control e identi cacion. El dise~no se hace de forma que se suponen parametros conocidos y despues estos son sustituidos por sus estimados. Desde el punto de vista del control estocastico de sistemas no lineales, es claramente un controlador que aplica el principio de equivalencia cierta (supone que los parametros identi cados coinciden con los reales). Actuacion Deseada
6
-
Dise~no del - Controlador
BB
- Controlador Ajustable
Estimacion de - la Planta
s
- Planta
s
-
BBN
Figura 2.5: Esquema del regulador autoajustable (STR) La idea de los reguladores autoajustables puede ser aplicada a muchos problemas de control que no son formulados como un problema de control estocastico. Dada la modularidad y la separacion del control e identi cacion, pueden formarse muchas clases de reguladores autoajustables por combinacion de diferentes metodos de dise~no e identi cadores.
2.4 Ejemplo simple A continuacion se describe un ejemplo simple (Astrom 1980), en el que se ilustra el problema de control adaptativo y las aproximaciones mas usuales. Supongase el
18
Ejemplo simple
sistema discreto cuya ecuacion en diferencias es de la forma:
y(t + 1) = y(t) + bu(t) + e(t) donde y es la salida del proceso, u, la se~nal de control, e, es un ruido blanco y b, un parametro jo. Se quiere minimizar el criterio:
!
N 1X 2 J = Nlim E !1 N 1 y (t)
Cuando se conoce el parametro b, la ley de control que minimiza el criterio es:
u(t) = y(t)=b; =) y(t + 1) = e(t) Si no se conoce el parametro b, pero se sabe que en el instante t tiene una distribucion gausiana normal de media ^b(t) y covarianza P (t). El problema de control que tiene en cuenta el estado, en este caso la salida y(t), ^b(t) y P (t) llevara consigo la resolucion de la ecuacion de Bellman, que para este caso podra ser resuelta numericamente. Este sera el problema del control Dual. Sin embargo se pueden hacer aproximaciones, derivandose una de ellas de aplicar el principio de equivalencia cierta, para lo cual se empleara la ley de control: u(t) = y(t)=^b(t) Si las estimaciones de ^b(t) son malas y llega a tomar un valor peque~no, el esfuerzo de control puede llegar a ser muy grande. Una forma de evitar esto es utilizar el control cauteloso siguiente: ^ u(t) = ^2 b(t) y(t) b (t) + P (t) El control cauteloso puede presentar algunos problemas debido a la incertidumbre de la estimacion, dado que para P (t) >> ^b2(t), u(t) puede ser muy peque~na y al tener poca riqueza la identi cacion es pobre, con lo que se incrementa P (t), por lo que u(t) puede llegar a ser cero. Si este control se aplica a un proceso estable, el fenomeno se llama apagado, ya que el proceso ira a un punto de funcionamiento, igual al que tena sin control. Si se aplica a un proceso inestable, al ser u(t) = 0, la salida puede ser muy grande y no se podra controlar al sistema, en este caso el fenomeno se conoce como escape.
Control adaptativo
19
2.5 >Porque control adaptativo? Dado que un controlador adaptativo es un sistema no lineal en el que es necesario ajustar una serie de parametros, es importante explorar bajo que circunstancias es insu ente utilizar un controlador jo y sera necesario un controlador adaptativo. Un controlador convencional esta pensado para controlar sistemas (la mayor parte de las veces lineales), cuyos parametros permanecen constantes. Esto es una buena aproximacion en la mayor parte de los casos, cuando se pretende regular un sistema en un punto jo de operacion. Cuando exiten pertubaciones, si estas son peque~nas, dicha aproximacion continua siendo su ciente para obtener un buen control. Sin embargo, la aproximacion en torno a un punto de funcionamiento no suele seguir siendo buena, si el punto de funcionamiento cambia. Vamos a ver mediante algunos ejemplos, cuando es su ciente un regulador jo o cuando es necesario otro tipo de control, o un controlador adaptativo. En general no es inmediato decidir el tipo de control que se necesitara. Es necesario estudiar cada caso en particular antes de decidirse por el tipo de control a aplicar.
Actuador no lineal Muchos actuadores poseen caractersticas no lineales, las cuales crean di cultades para el control.
yr
-
e 6
Planta
Gc
u
- Valvula v- G0
y-
Figura 2.6: Diagrama de bloques de sistema realimentado Supongase un sistema lineal ( gura 2.6), con un regulador PI cuyo actuador es una valvula con la caracterstica,
v = f (u) = u4; u 0
20
>Porque control adaptativo?
Linealizando el sistema en torno al punto de operacion estacionario, puede demostrarse que la ganancia del bucle es proporcional a la derivada de la funcion f (u). Se deduce entonces que el sistema puede funcionar correctamente en un punto de trabajo y pobremente en otros. Esto puede ilustrarse particularizando el sistema de la gura 2.6 con: 1 1 G0 (s) = (s + 1)3 ; Gc(s) = K 1 + T s ; K = 0:15; Ti = 1:0 i En la gura 2.7 puede verse la respuesta a un escalon de distinta magnitud, la cual pone de mani esto el hecho de tener distinto comportamiento dependiendo del valor del escalon (punto de funcionamiento).
Sistema de depositos interconectados Otro ejemplo particularmente interesante es aquel en el que existen tanques y tuberas largas interconectados. Supongase un sistema como el de la gura 2.8 en el que se pretende controlar la concentracion en el segundo tanque. La ecuacion diferencial que controla dicho proceso viene dada por: Vm dcdt(t) = q(t) [cin(t ) c(t)] donde, = Vqd ; T = Vqm que cuando se aplica la transformada de Laplace queda, s Gp(s) = 1 e+ Ts sistema de primer orden en el que varan la constante de tiempo T y el retardo asociado . Si se simula a este sistema en bucle cerrado con un regulador PI con constantes K = 0:5 y Ti = 1:1, puede verse que el comportamiento de este sistema vara considerablemente con las variaciones de caudal ( gura 2.9). Con estos ejemplos se pone mani esto que existen muchos procesos que pueden ser candidatos para aplicar control adaptativo. Si la modi cacion de los parametros
Control adaptativo
21
0.4 0.3 0.2 0.1 0 0
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
1.5
1
0.5
0 0
a 8 6 4 2 0 0
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
15
10
5
0 0
b Figura 2.7: Respuesta a diferentes escalones
22
>Porque control adaptativo?
b""b"b Cin
Vd
Vm C
-
Figura 2.8: Sistema de tanques interconectados
1.6 1.4 1.2
cs
1 0.8 0.6 0.4 0.2 0 0
1
2
3
4
5
6
7
8
9
tiempo
Figura 2.9: Respuestas a escalon para diferentes caudales
10
Control adaptativo
23
es conocida, puede aplicarse un controlador ajustable por tabla (gain scheduling), pero cuando existen partes del sistema cuya variacion no conocemos y no podemos medir (por ejemplo la carga de un robot), un buen candidato es aplicar control adaptativo identi cando solo la parte que desconocemos.
2.6 El problema del control adaptativo Los ejemplos de la seccion anterior muestran porque es necesario utilizar control adaptativo. Ellos ponen de mani esto que los procesos industriales son bastante complejos y la variacion de parametros no puede determinarse desde un primer momento. Por lo tanto, puede ser ventajoso emplear esfuerzo en desarrollar controladores mas inteligentes. Un controlador mas complejo puede utilizarse para diferentes procesos y por tanto el mayor costo en el desarrollo puede compartirse entre las diversas aplicaciones. Sin embargo, es muy importante recordar que la utilizacion de un controlador adaptativo no sustituye el buen conocimiento del proceso que es necesario para elegir las especi caciones, la estructura del controlador y el metodo de dise~no. Como se ha visto en las secciones precedentes, un controlador adaptativo debe contener:
Una ley de control con parametros ajustables. Caracterizacion de la respuesta del sistema en bucle cerrado (Modelo de referencia o las especi caciones para el dise~no).
Procedimiento de dise~no. Actualizacion de parametros basado en las medidas. Realizacion de la ley de control. Estas partes son un poco diferentes para los distintos esquemas de control adaptativo, pero tienen muchos factores comunes. Existe hoy en da una separacion entre la teora y la practica en control adaptativo. En teora es posible manejar situaciones idealizadas. En la practica se utilizan algoritmos bastante complejos, que introducen reglas concretas para manejar las
24
El problema del control adaptativo
posibles di cultades encontradas durante el analisis o con la experiencia de la aplicacion. El hecho de que haya variaciones signi cativas en la respuesta en bucle abierto, no signi ca necesariamente que sea necesario un controlador adaptativo. Esto puede ilustrarse con los siguientes ejemplos.
Diferente respuesta en bucle abierto El sistema con funcion de transferencia en bucle abierto dado por, G0 (s) = (s + 1)(1 s + a) con a=-0.01, 0 y 0.01, tiene una dinamica muy diferente para los valores de a ( gura 2.10a). Sin embargo el sistema realimentado unitariamente da las respuestas de la gura 2.10b. 400 300 200 100 0 0
50
100
150
200
250
300
2
4
6
8
10
12
1.5
1
0.5
0 0
Figura 2.10: Respuestas en tiempo diferentes en bucle abierto La razon estriba en que las funciones de transferencia de los tres sistemas son muy similares en el entorno de la frecuencia de cruce, mientras que son diferentes a
Control adaptativo
25
baja frecuencia.
Similar respuesta en bucle abierto El sistema con funcion de transferencia en bucle abierto dado por, sT ) G0(s) = (s + 1)(20(1 s + 20)(Ts + 1) con T=0, 0.015 y 0.03, tiene una dinamica para los valores de T ( gura 2.11a) muy similar. Sin embargo el sistema realimentado con u = 20(yr y), da las respuesta de la gura 2.10b. 1 0.8 0.6 0.4 0.2 0 0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
2 1.5 1 0.5 0 0
Figura 2.11: Respuestas en tiempo similares en bucle abierto Este sistema tiene un comportamiento inverso al anterior. La razon estriba en que las funciones de transferencia de los tres sistemas son muy similares a baja frecuencia, mientras que son bastante diferentes a alta frecuencia. La ense~nanza a seguir de estos ejemplos es que es esencial conocer la respuesta en frecuencia a la frecuencia de cruce deseada, para poder juzgar si las variaciones de los parametros afectaran a la respuesta en bucle cerrado.
26
El problema del control adaptativo
Captulo 3 Algoritmo de identi cacion de parametros 3.1 Introduccion Una parte muy importante de los sistemas adaptativos es el algoritmo de identi cacion de parametros, consumiendo este la mayor parte del tiempo de calculo en cada periodo de muestreo, y siendo muy cierta la frase de que una buena identi cacion lleva a un buen control. La identi cacion de sistemas tiene diversos signi cados en la literatura cient ca. La acepcion mas usada es la dada por Sage et al. (1971), que de nen la identi cacion o modelado de un sistema como el proceso de determinar un conjunto de ecuaciones diferenciales o en diferencias, o los parametros de tales ecuaciones, que describen un proceso fsico de acuerdo con un determinado criterio. El modelo del proceso puede obtenerse algunas veces por consideraciones fsicas, siendo mucho mas di cil determinar el modelo de las perturbaciones, que tienen tanta o mas importancia. Por otro lado un proceso puede no ser representable por un modelo matematico, siendo necesario una jerarqua de modelos complejos que implementan hasta el mas mnimo detalle. Desde el punto de vista del dise~nador es deseable disponer de modelos simples, aunque solo sean validos para estudios a groso modo. Es tarea del ingeniero elegir el modelo adecuado entre la gran variedad de modelos existentes entre un modelo simple o complejo. 27
28
Modelo del sistema y de las perturbaciones
Desde el punto de vista de procesamiento, la identi cacion puede ser hecha en lnea con el proceso o bien las medidas efectuadas son guardadas en un archivo y posteriormente procesadas. Por otro lado, si la identi cacion en lnea se hace cada periodo de muestreo, tenemos lo que se llama\identi cacion en tiempo real". Para el caso de los sistemas adaptativos, estamos interesados en la identi cacion en tiempo real, por lo que normalmente utilizaremos la version recursiva de los algoritmos. Por todo ello, es interesante disponer de un algoritmo de identi cacion que sea adecuado en tiempo de ejecucion y convergencia. La identi cacion de un sistema comprende las siguientes tareas :
Estudio experimental. (Adquisicion de datos). Formulacion de un criterio. Seleccionar la estructura del modelo. Estimacion de los parametros. Validacion del modelo obtenido.
A continuacion describimos los algoritmos de identi cacion de parametros de sistemas lineales discretos mas utilizados y algunas modi caciones de estos, propuestas por diversos autores. Un buen artculo monogra co sobre identi cacion es el de Astrom y Eykho (1971). La demostracion exhaustiva de los distintos metodos puede encontrarse en Eykho (1974) y en otros textos clasicos, como por ejemplo en Ljung (1987).
3.2 Modelo del sistema y de las perturbaciones Suponemos que el sistema puede ser modelado como un proceso estable, invariante en el tiempo y linealizable, con una sola entrada y una sola salida, por lo que puede ser descrito por una ecuacion lineal en diferencias de la forma :
y(k) + a1 y(k 1) + + any(k n) = b1 u(k d 1) + b2 u(k d 2) + + bnu(k d n) + v(k) + c1 v(k 1) + c2 v(k 2) + + cnv(k n) o bien en forma vectorial: y(k) = 'T (k) + v(k) (3:1)
Algoritmo de identi cacion de parametros
29
donde: 'T (k) = ( y(k 1); y(k 2) y(k n); u(k d 1); u(k d 2) u(k d n); v(k); v(k 1); v(k 2); ::; v(k n))
T = (a1 ; a2; an; b1; b2 ; bn; c1; c2; cn) u(k) = U (k) U1 (3.2) y(k) = Y (k) Y1 U (k) e Y (k) son los valores de entrada y salida del sistema en el instante k, U1 es el valor medio de la se~nal de entrada, Y1 es el valor medio de la variable de salida y v(k) es una se~nal de ruido estadsticamente independiente y estacionaria con distribucion normal y de media nula. Asumimos que las perturbaciones pueden ser modeladas por un proceso ARMA1 , con el mismo polinomio que el sistema. La funcion de transferencia en z de este sistema puede escribirse como: (z 1 ) d C (z 1 ) v(z) y (z ) = B z u ( z ) + (3:3) A(z 1 ) A(z 1 ) donde: A(z 1 ) = 1 + a1 z 1 + a2 z 2 + :::: + anz n (3.4) 1 1 2 n B (z ) = b1 z + b2 z + :::: + bnz 1 C (z ) = 1 + c1 z 1 + c2z 2 + :::: + cnz n El primer cociente B (z 1 )=A(z 1 ) representa el modelo de la planta, y el segundo C (z 1 )=A(z 1) representa el modelo de las perturbaciones. El conjunto planta mas perturbaciones, se denomina modelo ARMAX2 .
3.3 Metodo de mnimos cuadrados Este metodo es el mas popular y mas utilizado en la practica como parte fundamental de los sistemas de control adaptativo. De acuerdo con Gauss, el principio de mnimos cuadrados consiste en buscar los parametros desconocidos de tal forma que la suma de los cuadrados de las diferencias entre los valores observados y calculados multiplicado por un numero que mide el grado de precision, sea un mnimo. Para poder obtener una solucion analtica, los valores calculados deben ser funciones lineales de los parametros desconocidos. 1 2
Auto Regresive Moving Average Auto Regresive Moving Average con una variable eXogenous
30
Metodo de mnimos cuadrados
3.3.1 Caso determinista En un primer paso vamos a considerar que el sistema a identi car es perfectamente determinista y que sobre el mismo no inciden perturbaciones ni ruidos de ningun tipo. Para este caso el modelo de la seccion 3.2 se reduce a:
y(k) + a1 y(k 1) + + any(k n) = b1 u(k d 1) + b2 u(k d 2) + + bn u(k d n) Por lo que, para encontrar los 2n parametros se necesitan realizar 2n medidas de u(k) e y(k), con las que se puede plantear un sistema de ecuaciones lineales, donde las incognitas son los parametros ai y bj . O sea,
y(k) = 'T (k) y(k + 1) = 'T (k + 1)
y(k + N 1) = 'T (k + N 1) O bien,
Yk = k donde N = 2n y cuya solucion viene dada por: ^ = k 1 Yk
3.3.2 Caso no determinista Normalmente el sistema no es perfectamente determinista, sino que esta afectado por ruidos. En el modelo descrito anteriormente (ecuaciones 3.3 y 3.5), para el caso considerado se supone que C (z 1 ) = 1 , v(k) = e(k) y que el error residual e(k) es incorrelado con los elementos de '(k), de media nula y distribucion normal, por lo que el modelo del sistema resulta ser:
y(k) = 'T (k) ^(k) + e(k)
(3:5)
Algoritmo de identi cacion de parametros
31
donde,
'T (k) = ( y(k 1); y(k 2) y(k n); u(k d 1); u(k d 2) u(k d n) T (k) = (a1; a2 ; an; b1 ; b2 ; bn ) El primer termino del segundo miembro (ecuacion 3.5), puede ser interpretado como la prediccion de un paso y^(k=k 1) de la salida y(k) con los datos disponibles en el instante k 1, por lo que el error resulta ser la diferencia entre la salida real y su prediccion: e(k) = y(k) y^(k=k 1) El metodo de mnimos cuadrados consiste en minimizar el cuadrado del error:
J=
X k
e2k =
X k
(yk 'Tk )2
(3:6)
O bien en forma matricial,
J = kT k
= (Yk k )T (Yk k ) = YkT Yk YkT k T Tk Yk + T Tk k
Calculando la derivada e igualando a cero se obtiene: 2YkT k + 2T Tk k = 0 que resolviendo se llega a la expresion de,
^MC = ( Tk k ) 1 Tk Yk
(3:7)
El desarrollo anterior se ha realizado para 2n parametros, pero es igualmente valido para el caso de na + nb parametros. Si el sistema esta cambiando o bien estamos identi cando un sistema no lineal en una determinada zona de trabajo y pasamos a otra, necesitamos tomar otras medidas (N > 2n) y volver a calcular los parametros estimados. Este proceso, a la luz de la expresion 3.7, conlleva la inversion de una matriz de dimension 2n 2n, por lo que si la identi cacion se realiza en tiempo real puede sobrepasar el tiempo de muestreo necesario para el sistema de control.
32
Metodo de mnimos cuadrados
3.3.3 Metodo recursivo Los metodos recursivos aprovechan parte de los calculos realizados en un paso para el siguiente, por lo que el calculo de los parametros en un instante se realiza como, ^N +1 = ^N + correccion (3:8) Ademas si el sistema esta variando, (o bien se desea una actualizacion permanente de los parametros), se suelen ponderar las medidas que se van tomando, dandole mas peso a las mas recientes como se vera en un apartado posterior. Para el desarrollo de la version recursiva se plantean las expresiones de los parametros en los instantes N y N + 1 y se calcula el termino de correccion de la expresion 3.8. La solucion es bien conocida y conduce a los siguientes pasos (Franklin y Powell 1980): 1. Seleccionar los valores iniciales de P (k) y ^(k). 2. Obtener los nuevos valores de y(k + 1) y u(k + 1). 3. Calcular el error residual a priori :
e(k + 1) = y(k + 1) 'T (k + 1)^(k)
(3:9)
4. Calcular L(k + 1) dado por la expresion :
'(k + 1) L(k + 1) = 1 + 'T (Pk(+k)1) P (k)'(k + 1) 5. Calcular los nuevos parametros estimados dados por : ^(k + 1) = ^(k) + L(k + 1)e(k + 1)
(3:10)
6. Actualizar la matriz de covarianza.
P (k + 1) = (I L(k + 1)'T (k + 1))P (k) 7. Actualizar el vector de medidas '(k + 2). 8. Hacer k = k + 1 y volver al paso 2.
(3:11)
Algoritmo de identi cacion de parametros
33
La estimacion de los parametros () esta dada por los valores de la estimacion anterior corregida por un termino lineal del error entre la salida y su prediccion, siendo L(k + 1) la ganancia de la correccion. La ecuacion 3.10 tambien puede ser interpretada (Astrom 1980), como una cuasiNewton iteracion para minimizar e2 , donde ' = gradp(e) y el termino 'e puede ser interpretado como el gradiente de e2 =2. La matriz de covarianza P (k) modi ca la direccion del gradiente y determina la longitud del paso. Tambien puede interpretarse como un factor de ganancia que determina el cambio de la identi cacion. Cuando los residuos estan correlados, los parametros estimados pueden sufrir desviaciones. Por otro lado el orden del sistema y el retardo deben ser conocidos exactamente.
3.4 Metodo de mnimos cuadrados extendidos y generalizados En mnimos cuadrados se supone que los residuos estan incorrelados, si no es as, se puede utilizar una version extendida, en cuyo caso se supone que los residuos estan correlados de la forma C (z 1 )e(k), donde el polinomio C (z 1 ) tiene todos sus ceros dentro del circulo unidad. De todo ello se deduce que utilizando el modelo 3.1 con v^(k) = e(k) cuyo valor es calculado mediante la ecuacion 3.9, se puede identi car el modelo de la planta y de las perturbaciones. Por otro lado, el metodo de mnimos cuadrados generalizados se utiliza cuando se dispone de alguna informacion acerca de las perturbaciones, como puede ser el conocimiento del polinomio C (z 1 ) o la matriz de covarianza, en cuyo caso puede demostrarse que se obtienen mejores resultados si la matriz N = E (vvT ), es distinta de la identidad, minimizando en este caso el criterio J = eT N 1 e en vez de J = eT e, que se utiliza en mnimos cuadrados.
3.5 Aproximacion estocastica Este es un metodo de identi cacion recursiva, caracterizado por su gran simplicidad. Existen muchas versiones de este algoritmo, siendo una de ellas (Isermann 1981), la
34
Metodo de variable instrumental
que minimiza la funcion de costo:
J = 12 e2 (k) resultando el algoritmo:
e(k + 1) = y(k + 1) 'T (k + 1)^(k) ^(k + 1) = ^(k) + W (k + 1)'(k + 1)e(k + 1) Puede verse que el metodo es muy similar al de mnimos cuadrados, con la diferencia del factor W (k + 1) que es de eleccion libre. Una de las formas mas frecuentes de escoger este factor es:
W (k + 1) = Constante (k + 1) La desventaja del metodo, es que los parametros sufren desviaciones de los exactos y que la convergencia no es muy buena.
3.6 Metodo de variable instrumental Si solo se esta interesado en los parametros del sistema y no en los del modelo de las perturbaciones cuando estas estan correladas con '(k), se puede utilizar el metodo de variable instrumental. Este metodo (Isermann 1981), sustituye el vector '(k) por otro W (k) que es incorrelado con e(k). Dicho vector es de la forma:
W T (k) = ( h(k 1); h(k 2) h(k n); u(k d 1); u(k d 2) u(k d n)) donde h(k) = y^(k) = W T (k)^aux (k) es la salida de un modelo auxiliar de parametros ^aux (k), sin perturbaciones. La estructura del algoritmo es igual a la de mnimos cuadrados recursivos. Los parametros suelen ltrarse con un ltro paso bajo. La eleccion de los parametros iniciales presenta algunos problemas, por lo que suele inicializarse con los parametros estimados por mnimos cuadrados.
Algoritmo de identi cacion de parametros
35
3.7 Metodo de maxima verosimilitud Este metodo se basa en maximizar la probabilidad de las medidas obtenidas en los parametros ai y bi y es fuertemente no lineal en los ci . Por ello este metodo requiere muchos mas calculos que los anteriores, siendo de aplicacion practica limitada por este motivo. El modelo utilizado es el dado el apartado 3.2, pudiendose estimar los parametros del sistema y los del modelo de las perturbaciones.
3.8 Modi caciones al algoritmo de identi cacion Todos los algoritmos citados pueden darse bajo una formulacion uni cada (Isermann 1981). Por otro lado se ha supuesto que los parametros del sistema son invariantes con el tiempo, por lo que el identi cador formulado tiene memoria in nita, es decir, tienen el mismo peso todas las medidas obtenidas. Sin embargo si los parametros del sistema varian lentamente, bien por derivas o por que el sistema sea no lineal, es conveniente reducir la memoria del identi cador con el objeto de que este pueda seguir las variaciones del sistema, ponderando las medidas de forma que tengan mas peso las ultimas sobre las mas antiguas. Esto puede hacerse (Wellstead y Zanker 1978) esencialmente:
Introduciendo un factor de olvido (c). Sumando una matriz positiva (R) a la matriz de covarianza (P ) del identi -
cador. O bien por una combinacion de las dos tecnicas anteriores.
Los dos metodos consiguen que la matriz P no se haga muy peque~na, ya que en el identi cador original, esta matriz es monotonamente decreciente. El metodo mas empleado es el del factor de olvido, que en algunos casos puede ser variable.
Inclusion de un factor de olvido Introduciendo un factor de olvido, se consigue que el identi cador tenga memoria nita. La modi cacion en concreto consiste en sustituir P (k) por P (k)=c.
36
Modi caciones al algoritmo de identi cacion
Para c = 1 se tiene el algoritmo de mnimos cuadrados normal, mientras que para c < 1 el algoritmo olvida las medidas mas antiguas. Como referencia se puede decir que para c = 0:99 tiene una memoria de 100 pasos, siendo un rango normal de utilizacion del factor de olvido entre 0:98 y 1, pudiendo en algunos casos especiales disminuirse hasta 0:95. La eleccion de c es un compromiso entre una gran eliminacion del ruido o un mejor seguimiento de la variacion de los parametros. La funcion de costo que se minimiza por mnimos cuadrados pasa a ser:
J=
k X
m=1
ck me2(k)
Suma de una matriz positiva Este metodo (random walk), consiste en sumar una matriz (R) positiva a la matriz P (k), que pasa a ser de la forma : P (k + 1) = (I L(k + 1)'T (k + 1))P (k) + R con ello se asegura que la matriz de covarianza permanezca limitada a un valor superior a R.
Problemas que pueden presentarse Si a lo largo del tiempo el punto de funcionamiento del sistema no cambia, es decir, en este caso la excitacion es pobre, pueden aparecer algunos problemas. El producto P (k)'(k) puede hacerse cero o muy peque~no, por lo que la expresion 3.11 se reduce a P (k + 1) = P (k)=c. Si se utiliza un factor de olvido menor de la unidad, P (k) puede crecer mucho, siendo por ello el identi cador muy sensible a cualquier cambio (problema de Blow up o bursts, identi cador windup). Al mismo tiempo pueden presentarse problemas numericos en P (k) (Latawiec 1983, Astrom 1983). Para evitar el problema mencionado se han utilizado varias tecnicas, las cuales no son excluyentes.
Posibles soluciones 1. Un metodo para evitar los problemas mencionados es utilizar un factor de
Algoritmo de identi cacion de parametros
37
olvido variable (Fortescue 1981), basandose para ello en la informacion disponible, de forma que es calculado a cada paso segun la expresion: 2 1 'T (k + 1)L(k + 1) e(k + 1) So Cuando el error tiende a cero, c(k) tiende a uno, por lo que puede evitarse el problema de crecimiento de la matriz P (k). El parametro So debe buscarse a priori, (So esta relacionado con la suma de los errores al cuadrado), pero el identi cador es menos sensible a su busqueda que a la de c(k). Normalmente en la fase inicial de puesta en marcha del algoritmo es cuando interesa que el factor de olvido sea peque~no, ya que es en esta fase cuando los parametros son mas inciertos, siendo necesario que a lo largo del tiempo se incremente al valor que deseamos tener. Esto puede conseguirse facilmente, utilizando por ejemplo una expresion de la forma (Isermann 1981):
c(k + 1) = 1
c(k + 1) = coc(k) + cf (1 co ) con: co < 1 y c(0) < 1 siendo el lmite de c(k + 1) cuando k tiende a in nito igual a cf . La tecnica del factor de olvido variable no elimina totalmente los problemas mencionados anteriormente, pero disminuye la probabilidad de aparicion. 2. Otra posible solucion para evitar el crecimiento de la matriz P (k), es hacer c(k) = 1 cuando la traza de la matriz P (k) exceda de un cierto valor (Cordero 1981). 3. Landau 1981 y Lozano 1982, proponen una estructura con dos factores de olvido, cuya expresion es de la forma: L(k + 1) = c1(k) PT (k)'(k + 1) c2 (k) + ' (k + 1)P (k)'(k + 1) P (k + 1) = (I L(k + 1)'T (k + 1)) cP ((kk)) 1 donde
0 < c1(k) < 1 y 0 < c2(k) < 2;
obteniendose los mejores resultados para ganancia constante P (k) = P (0), o bien para traza constante traza(P (k)) = traza(P (0)). Una posible solucion es jar el cociente c1 (k)=c2(k) entre 0:8 y 1, resolviendo la ecuacion de P (k + 1) para c1 (k) de forma que la traza de P (k + 1) sea igual a la traza de P (k) e igual a una constante.
38
Algoritmos de identi cacion rapidos
3.9 Algoritmos de identi cacion rapidos Cuando el tiempo es un factor primordial, se puede utilizar un algoritmo rapido como por ejemplo el que sugiere Robin (1981). La idea de estos algoritmos es usar una propiedad de invarianza. En concreto, de una iteracion a la siguiente de un algoritmo recursivo, mucha de la informacion que se necesita en el instante k + 1 ya se tiene en el instante k, aunque en otro lugar distinto al que se precisa. Por ello utilizando este hecho se puede ahorrar tiempo, ya que en vez de calcular nuevamente todos los datos, a algunos solo habra que cambiarlos de lugar, siendo menor el tiempo de traslacion que el de calculo.
3.10 Estimacion de los valores de continua Como se ha visto, el identi cador trabaja con los valores incrementales de las se~nales de entrada y salida con respecto a los valores de continua U1 e Y1. Por ello estos valores deben ser calculados o cancelados. A continuacion se dan varias formas de poder hacer esto.
Utilizacion de los incrementos de las variables Mediante este metodo no se necesitan conocer los valores de continua ya que:
u(k) = u(k) u(k 1) = (U (k) U1) (U (k 1) U1) = U (k) U (k 1) y(k) = y(k) y(k 1) = (Y (k) Y1) (Y (k 1) Y1) = Y (k) Y (k 1) La expresion anterior es aplicar un ltro paso alto tanto a la entrada como a la salida.
Calculo de los valores medios Una forma simple de calcular U1 e Y1 es hallando su valor medio para una serie de medidas o bien recursivamente:
Algoritmo de identi cacion de parametros
1 X M U1 = M u(i) i=1
39
1 X M Y1 = M y(i) i=1
U1(k) = U1(k 1) + k1 (U (k) U1(k 1)) Y1(k) = Y1(k 1) + k1 (Y (k) Y1(k 1))
Mediante estimacion de una constante Si se tiene descrito el sistema por la ecuacion en diferencias de la forma:
Y (k) =
a1 Y (k 1) a2Y (k 2) anY (k n) + b1 U (k d 1) + b2U (k d 2) + + bnU (k d n)
Sustituyendo las expresiones 3.3 se obtiene:
y(k) =
a1 y(k 1) a2 y(k 2) any(k n) + b1 u(k d 1) + b2 u(k d 2) + ::: + bnu(k d n) + K
K = (1 + a1 + a2 + :: + an)Y1 (b1 + b2 + :: + bn)U1
(3:12)
Luego extendiendo el vector p(k) con un elemento K mas y el vector de datos '(k) con un 1, se puede estimar la constante K y jando uno de los dos valores U1 o bien Y1 se podra calcular el otro. Se obtienen buenos resultados tomando Y1 igual a la referencia y calculando U1 por la expresion 3.12. Para estimacion de sistemas en bucle cerrado donde actua un regulador, Wittenmark (1973), recomienda sustituir y(k) por y(k) r(k) y u(k) por u(k) = u(k) u(k 1), tanto para el identi cador como para el regulador.
3.11 Algoritmo de identi cacion propuesto Dadas las buenas caractersticas de simplicidad y convergencia, el metodo de identi cacion mas utilizado es el de mnimos cuadrados recursivos, normal o extendido,
40
Algoritmo de identi cacion propuesto
con un factor de olvido variable y utilizando las soluciones propuestas para salvar algunos problemas que se pueden presentar, quedando resumido en los pasos: 1. Seleccionar los valores iniciales de P (k) y ^(k). 2. Obtener los nuevos valores de y(k + 1) y u(k + 1). 3. Calcular el error residual a priori :
e(k + 1) = y(k + 1) 'T (k + 1)^(k) 4. Calcular L(k+1) dado por la expresion : (k + 1) L(k + 1) = c(k) + 'PT ((kk)+'1) P (k)'(k + 1) 5. Calcular los nuevos parametros estimados dados por : ^(k + 1) = ^(k) + L(k + 1)e(k + 1) 6. Calcular el nuevo factor de olvido c(k + 1).
c(k + 1) = 1 (1 'T (k + 1)L(k + 1)) e(k S+ 1)
2
o
Si Si
c(k + 1) < cmin Entonces c(k + 1) = cmin c(k + 1) > 1 Entonces c(k + 1) = 1
7. Actualizar la matriz de covarianza.
W (k + 1) = (I L(k + 1)'T (k + 1))P (k) + R1 ! W ( k + 1) Si tr c(k + 1) > trmax Entonces c(k + 1) = 1 P (k + 1) = Wc((kk++1)1) 8. Actualizar el vector de medidas '(k + 2). 9. Hacer k = k + 1 y volver al paso 2.
Algoritmo de identi cacion de parametros
41
3.12 Convergencia e identi cabilidad El criterio general que debe cumplir un algoritmo de identi cacion es que los parametros no sufran desviaciones, o sea, que E (^(N )) = o para N ! 1. Para mnimos cuadrados las condiciones que se necesitan, (Isermann 1981), se pueden resumir en : 1. El orden de los polinomios y el retardo (d) del sistema deben ser conocidos. 2. U1 e Y1 deben ser conocidos exactamente. 3. u(k) debe ser persistentemente excitada de orden n o mayor. 4. y(k) debe estar perturbada por un ruido estacionario. 5. e(k) debe ser incorrelado con los elementos de '(k). 6. E (e(k)) = 0. 7. La convergencia tambien depende de los valores de inicializacion del identi cador.
Identi cacion en bucle cerrado Un sistema en bucle cerrado se dice identi cable si los parametros estimados son consistentes cuando, usando un metodo de identi cacion apropiado, se tiene que: lim E (^(N )) = o
N !1
y la salida debe ser medible. Dado que en los sistemas de control adaptativo la identi cacion se realiza con el sistema operando en bucle cerrado, pueden aparecer problemas de identi cabilidad en ciertos parametros, cuando se utiliza un regulador lineal y no se emplean se~nales externas de excitacion. En Isermann (1981), se plantean las condiciones de identi cabilidad de un sistema actuando en bucle cerrado sin se~nales externas. Estas condiciones estan relacionadas con los ordenes de los polinomios del sistema y del regulador. A continuacion se exponen los resultados mas importantes.
42 Dado el sistema : A(z donde, A(z B (z C (z
Convergencia e identi cabilidad 1 )y (k + d) = B (z 1 )u(k ) + C (z 1 )e(k + d) 1) 1) 1)
(3:13)
= 1 + a1z 1 + a2z 2 + + ama z ma = b1 z 1 + b2 z 2 + + bmb z mb = 1 + c1z 1 + c2 z 2 + + cmc z mc
Suponiendo que el sistema opera en bucle cerrado con un regulador de la forma: (z 1 ) y(t) u(t) = Q P (z 1 ) donde, Q(z 1 ) = q1 z 1 + q2 z 2 + :::: + qv z v P (z 1) = 1 + p1z 1 + p2 z 2 + :::: + pw z w
Primera condicion Introduciendo el regulador en la ecuacion del sistema 3.13, suponiendo d = 0 y sumando en ambos miembros de la igualdad el termino 'Sy', donde S es un polinomio arbitrario en z 1 , se tiene que : Ay + Sy = BQ P y + Sy + Ce Multiplicando por Q y operando se obtiene : (A + S )Qy = ( SP + BQ) Q y + CQe P Ay = Bu + Ce siendo, A = (A + S )Q B = SP + BQ C = CQ O sea, dado que S es arbitrario, existen muchas soluciones basadas en las medidas de u(k), y(k) y e(k). Luego esta condicion implica que los ordenes del modelo del proceso y de las perturbaciones deben ser conocidos con exactitud.
Algoritmo de identi cacion de parametros
43
Segunda condicion La funcion de transferencia de la salida a las perturbaciones es de la forma : CP 1 + b01 + b0 2:: + b0r z r y(z) = = e(z) AP + Bz d Q 1 + a0 1 + a0 2:: + a0l z f Luego debe cumplirse que, f = max(ma + w; mb + d + v) r = mc + w El numero de parametros a identi car es ma + mb que deben ser calculados a partir de f , o sea , f debe ser mayor o igual a ma + mb. Dicha condicion se expresa por: o sea,
max(ma + w; mb + d + v) ma + mb max(w mb; d + v ma ) 0
En dicha condicion pueden ocurrir dos casos : 1. d + v ma w mb 0 v w mb + ma d ma d 2. w mb d + v ma 0 w d + v ma + mb mb Por otro lado para estimar los mc parametros de C (z 1 ), se necesita que r sea mayor que mc, lo cual se cumple si se escoge por ejemplo w > 0. Si A y C tienen p ceros comunes, estos no pueden ser identi cados y la condicion 3.12 quedara como: max(w mb; d + v ma ) p Para hacer cumplir esta condicion, segun el caso, habra que jar algunos parametros a priori para disminuir el numero de parametros a identi car o bien habra que aumentar el retardo (d) del sistema. Normalmente p = 0 y se considerara que los ordenes de los polinomios son iguales a n, por lo que esta condicion se puede expresar como: max(w; v + d) n
44
Ejemplo de identi cacion
Un ejemplo Supongamos un sistema con orden de los polinomios A y B igual a n y que trabaja con el regulador de mnima varianza que se describira mas adelante (apartado 5.5), dado por: G y(k) u(k) = zBF Los ordenes de los polinomios G y F son respectivamente n 1 y d, luego :
v =n 1 y w =n+d 1 De acuerdo con la condicion expresada en el apartado anterior, para que el sistema sea identi cable, el retardo debe ser mayor o igual a 1 o bien habra que jar un parametro.
3.13 Ejemplo de identi cacion A continuacion se muestra la evolucion de los parametros identi cados en bucle abierto, del sistema dado por su funcion de transferencia: 1 + 4z 2 3 z G(z) = 1 z 1 2z 2 cuando se le somete a una entrada aleatoria de media cero. Puede observarse en la gura 3.1, como los parametros convergen a los valores correctos.
Algoritmo de identi cacion de parametros
45
5.0
Parametros
4.0
a1 a2 b1 b2
3.0
2.0
1.0
0.0 0.0
10.0
20.0
30.0 40.0 Tiempo
50.0
Figura 3.1: Parametros identi cados
60.0
70.0
46
Ejemplo de identi cacion
Captulo 4 Control adaptativo por modelo de referencia 4.1 Introduccion Como se menciono en el captulo 2, la tecnica de control adaptativo por modelo de referencia (mrac) fue introducida por Whitacker en 1958, siendo su forma mas popular la mostrada en la gura 4.1. En este esquema puede verse un controlador primario que se utiliza para obtener el comportamiento en bucle cerrado (como en cualquier esquema de control convencional). Por otro lado como los parametros del proceso pueden ser desconocidos y variables, es difcil encontrar un controlador jo que responda en todas las situaciones. En la tecnica mrac, la respuesta deseada a una se~nal de entrada del proceso se especi ca como un modelo de referencia. El mecanismo de adaptacion mira la salida yp del proceso y la salida ym del modelo de referencia y calcula los parametros adecuados de forma que la diferencia tienda a cero. El mecanismo de adaptacion puede utilizar, si estan disponibles, ademas de las se~nales de salida del proceso y del modelo de referencia (yp, ym), las se~nales de entrada, de referencia y las variables de estado del proceso. En el esquema de la gura 4.1, el modelo de referencia esta colocado en paralelo con el proceso. Este esquema es bastante usual, aunque existen diversas posibilidades, como colocarlo en serie o bien una combinacion serie-paralelo. A lo largo de este captulo nos centraremos en la estructura paralelo. 47
48
Dise~no de controladores adaptativos Mecanismo de Adaptacion
CC
- Controlador Ajustable 6
r - ?
uPlanta
BBN
de - Modelo Referencia
yp
-
? 6 ym
Figura 4.1: Esquema general de MRAC paralelo Una de las partes mas importantes en control adaptativo es el dise~no de la ley de control. La primera ley de control adaptativo haca uso de los modelos de sensibilidad y mas tarde de la teora de estabilidad de Lyapunov y de la teora de hiperestabilidad de Popov. Estas ultimas garantizan la estabilidad del conjunto del sistema, lo que las hace particularmente interesantes, convirtiendose en metodos de dise~no estandar.
4.2 Dise~no de controladores adaptativos Como se ha visto en la seccion anterior, un sistema de control adaptativo basicamente esta formado por tres partes: un controlador primario, un modelo de referencia y la ley de adaptacion. Por lo tanto para el dise~no de un sistema de control adaptativo, sera necesario de nir las tres partes. Dado que la parte que caracteriza al control adaptativo es la ley de adaptacion, en lo que sigue, nos centraremos fundamentalmente en esta parte.
Control adaptativo por modelo de referencia
49
Controlador Primario El controlador primario puede tener en principio cualquiera de las con guraciones conocidas para el dise~no de controladores lineales. Sin embargo, debe cumplir la condicion de que sea posible que el conjunto del proceso y el controlador puedan reproducir al modelo de referencia. Este requisito, supone restricciones sobre el orden y la estructura del controlador. Por otro lado para que pueda aplicarse una adaptacion directa, la se~nal de control debe ser una funcion lineal de los parametros.
Modelo de referencia El modelo de referencia, que especi ca el comportamiento deseado en bucle cerrado, se da usualmente en forma parametrica. La condicion mencionada anteriormente para el seguimiento del modelo de referencia, tambien condiciona en ciertos aspectos el modelo de referencia posible, en cuanto al orden relativo del proceso (exceso de polos). Por otro lado el modelo elegido debe ser sensible a la dinamica del proceso, ya que si por ejemplo se elige un modelo con una dinamica muy rapida, la se~nal de control sera muy grande causando saturaciones y no pudiendo el sistema responder a dicha dinamica. Por ello la eleccion del modelo de referencia no es facil, eligiendose normalmente un modelo conservador.
4.2.1 Enfoque de sensibilidad Este metodo esta basado en el uso de los modelos de sensibilidad para adaptar los parametros en la direccion correcta. La deduccion de este metodo comienza con el planteamiento de un ndice de actuacion, normalmente cuadratico:
J (t + T ) =
Z t+T t
e21 ( )d
En esta ecuacion e1 = yp ym y el ndice J se evalua sobre el periodo T jo, en el cual los parametros permanecen constantes. En el instante (t + T ) los parametros son ajustados en la direccion decreciente de J . Z t+T @e ( ) (t + T ) = (t) @@J = (t) 2e1( ) 1 d (4:1) @ t debe ser una matriz cuadrada de nida positiva, que representa la ganancia de adaptacion. Usualmente es diagonal. Teniendo en cuenta que: @e1 ( ) = @yp @ @
50
Dise~no de controladores adaptativos La ecuacion (4.1) queda:
(t + T ) (t) = 1 Z t+T 2e ( ) @yp d 1 T @ t Que en el lmite para T ! 0 da la ley de adaptacion: d = 2 e @yp 1 dt @
(4:2)
(4:3)
El factor @yp=@ representa la sensibilidad de la salida del proceso a las variaciones en , y puede ser generado por un modelo de sensibilidad. Como puede observarse esta ley de adaptacion es la misma obtenida en el captulo 2, denominada como la regla del MIT. El modelo de sensibilidad anterior se sustituye por la sensibilidad del modelo de referencia, dado que normalmente el modelo del proceso se desconoce. Esta suposicion se hace en base a que pasado un tiempo la respuesta del sistema converge a la respuesta del modelo de referencia. La principal desventaja de este metodo, es la ausencia de un criterio que garantice la estabilidad del sistema de control. El sistema puede hacerse inestable si el modelo de referencia no se escoge adecuadamente o si la ganancia de adaptacion se elige demasiado grande.
4.2.2 Metodo de Lyapunov Dado el caracter no lineal y variable en el tiempo de los sistemas adaptativos por modelo de referencia mrac, no son validos los criterios de estabilidad de sistemas lineales. Un metodo bien conocido es el metodo directo de Lyapunov. Este metodo establece que un sistema tiene un equilibrio x = 0, asintoticamente estable, si existe una funcion, llamada de Lyapunov, V (x) que satisface:
V (x) V_ (x) V (x) V (0)
> 0 para x 6= 0 de nida positiva < 0 para x 6= 0 de nida negativa ! 1 para jjxjj ! 1 = 0
(4.4)
Control adaptativo por modelo de referencia
51
Como la funcion de Lyapunov es similar a una funcion de energa, esta debe decrecer con el tiempo. Utilizando este metodo en el dise~no de sistemas adaptativos, se trasladan las especi caciones de estabilidad directamente en la ley de adaptacion, siguiendo los pasos: 1. El primer paso es encontrar la ecuacion de error, bien en la salida (yp ym) o en las variables de estado (xp xm ). 2. Encontrar una funcion de Lyapunov como una funcion del error entre las se~nales y del error en los parametros ( = ^ ). En su forma mas simple esta funcion toma la forma: V = eT Pe + T 1 Donde las matrices P y 1 deben ser de nidas positivas. 3. Calcular la derivada de la funcion de Lyapunov. La derivada debe ser de nida negativa. Generalmente toma la forma: V_ = eT Qe + algunos terminos incluyendo El primer termino garantiza que la derivada es de nida negativa, por lo que, haciendo el resto igual a cero se tiene una posible solucion. La matriz Q es de nida positiva. Las matrices P y Q, para un sistema gobernado por una matriz A, estan relacionadas por la ecuacion de Lyapunov: Q = AT P + PA (4:5) 4. Haciendo el termino extra igual a cero se obtiene la ley de adaptacion. Normalmente tiene la forma: _ = " (4:6) " esta directamente relacionado con el error e y es una version modi cada del vector de se~nales (referencia, salida, etc).
Ejemplo de sistema de primer orden Considerando el sistema de la gura 4.2, donde la se~nal de control esta dada por: u = K r, siendo K la ganancia ajustable que hay que calcular, la deduccion de la ley de adaptacion es como sigue: y_p = bKr yp y_m = r ym e_ = y_p y_m = (bK 1)r (yp ym) (4.7) = e + (bK 1)r
52
Dise~no de controladores adaptativos Proceso
- K
u-
b s+1
yp
? e 6
r -
-
1 s+1
ym
Modelo Figura 4.2: Sistema y modelo de primer orden Teniendo en cuenta que el termino (bK 1) es proporcional al error en el parametro, la funcion de Lyapunov en este caso puede elegirse como: V = e2 + 1 (bK 1)2 Su derivada resulta ser: V_ = 2ee_ + 2 b K_ (bK 1) 2b = 2e[ e + (bK 1)r] + K_ (bK 1)
= 2e2 + 2e(bK 1)r + 2b K_ (bK 1) (4.8)
El primer termino es negativo. As que haciendo el resto igual a cero se obtiene la ley de adaptacion: 2b
2e(bK 1)r + K_ (bK 1) = 0 =) K_ = er = 1 er
b En esta ley de adaptacion el parametro libre es 1 , siendo necesario conocer el signo de b para jar el de 1. En las guras 4.3 y 4.4 se representa una simulacion del ejemplo descrito cuando el parametro b vale inicialmente 4 y en el instante 20 pasa a valer 2. Puede observarse
Control adaptativo por modelo de referencia
53
Salidas yp - ym
1.5 1 0.5 0 -0.5 -1
0
5
10
15
20
25
30
35
40
25
30
35
40
Tiempo 0.5
Parametro k
0.4 0.3 0.2 0.1 0 0
5
10
15
20 Tiempo
Figura 4.3: Proceso de primer orden ( 1 = 0:1)
Salidas yp - ym
1.5 1 0.5 0 -0.5 -1
0
5
10
15
20
25
30
35
40
25
30
35
40
Tiempo
Parametro k
0.6
0.4
0.2
0 0
5
10
15
20 Tiempo
Figura 4.4: Proceso de primer orden ( 1 = 0:5)
54
Dise~no de controladores adaptativos
como la adaptacion es buena en ambos casos, siendo mas rapida en el caso de la gura 4.4, dado que la ganancia de adaptacion es superior. En lnea a trazos se representa la salida del modelo de referencia y en lnea continua la salida del modelo ajustable. La principal desventaja del metodo de Lyapunov es que no es un metodo sistematico, dado que hay que encontrar la funcion de Lyapunov V adecuada en cada caso.
4.2.3 Metodo de hiperestabilidad Con este metodo tambien se consigue una ley de adaptacion estable. Como en el metodo de Lyapunov, en primer lugar se formulan las ecuaciones de error. Estas ecuaciones se dividen en una parte lineal invariable con el tiempo y otra no lineal y variable con el tiempo. La primera parte contiene usualmente al modelo de referencia y su salida es la se~nal de error que es utilizada para la ley de adaptacion. La segunda parte contiene la ley de adaptacion y su salida negada es la entrada a la parte lineal. Esta estructura se corresponde con la vista en la seccion 2.2 del captulo 2. La teora de hiperestabilidad garantiza la estabilidad asintotica si ambas partes (lineal y no lineal), satisfacen las condiciones de pasividad (Landau 1979): 1. La parte lineal (llamese G(s)), debe ser estrictamente positiva. Ello signi ca que: (a) G(s) debe ser real si s es real. (b) los polos de G(s) deben tener parte real negativa, y (c) la parte real de G(j!) de ser mayor que cero para 1 < ! < 1. 2. La parte no lineal debe cumplir la desigualdad de Popov.
Zt 0
vT w dt 2 ; 8t > 0
siendo v el vector de entrada y w el vector de salida de la parte no lineal, y 2 una constante nita positiva que no depende de t.
Control adaptativo por modelo de referencia
55
4.3 Estructura general de los sistemas adaptativos (MRAC) Considerando de nuevo el esquema paralelo de la gura 4.1, pueden considerarse dos posibles formas de descripcion: mediante variables de estado o bien entrada-salida. Considerando la primera de ellas, puede escogerse el modelo de referencia como el conjunto de ecuaciones lineales,
x_ = AM x + BM u;
x(0) = x0
(4:9)
donde x es el vector de estado y u es el vector de entrada. Este modelo se supone estable y completamente controlable. En cuanto al modelo ajustable (planta mas controlador), puede utilizarse la siguiente representacion,
y_ = AS (e; t)x + BS (e; t)u;
x(0) = x0 ; AS (0) = AS0; BS (0) = BS0; (4:10)
El vector de error generalizado viene dado por:
e=x y
El objetivo de dise~no, en el caso parametrico, es encontrar la ley de adaptacion tal que las matrices de parametros AS (e; t) y BS (e; t) sean modi cadas de forma que el error tienda a cero para cualquier entrada u. La derivada del error puede obtenerse restando las ecuaciones anteriores, donde ademas se suma y resta el termino AM y.
e_ = x_ y_ = AM x + BM u AS (e; t)x BS (e; t)u + AM y AM y
(4:11)
pudiendose expresar como:
e_ = AM e + [AM AS (e; t)]y + [BM BS (e; t)]u
(4:12)
Si se desea que el mecanismo de adaptacion tenga memoria (lo cual es lo mas habitual), debe considerarse la inclusion de un integrador en el mecanismo de
56
Estructura general de los sistemas adaptativos (MRAC)
ll e _ - l, 6 ,,
e
AM y
? 6
ZZ ? ZZ ZZ 6ZZ u
AM AS (0)
? 6
F (e; t) G(e; t)
BM BS (0)
Figura 4.5: Representacion equivalente del modelo de error
Control adaptativo por modelo de referencia
57
adaptacion. Esto tendra el efecto de que los parametros ajustables dependeran no solo del error en un instante sino tambien de los valores pasados. Por ello la ley de adaptacion se de ne como: AS (e; t) = F (e; ; t) + AS (0); 0 t
BS (e; t) = G(e; ; t) + BS (0); 0 t
(4.13)
Las ecuaciones 4.12 y 4.13, pueden representarse segun la gura 4.5, sistema que se puede descomponer en un sistema lineal y otro no lineal, al cual se le pueden aplicar el criterio de Popov de estabilidad (o criterio de hiperestabilidad).
w -e_ 6 6 1
w
ll e l , , ,
- D
AM y
? 6 SNL
ZZ? ZZ ZZ 6ZZ u
v
SL
AS (0) AM
? 6
BS (0) BM
? 6
, , ,l ll
1
2
, , ,l ll
1
2
Figura 4.6: Sistema adaptativo por modelo de referencia paralelo Para conseguir cumplir dicho criterio, por un lado la parte lineal se modi ca a~nadiendole un termino D en serie. En cuanto a las funciones F y G, caben muchas
58
Ejemplos ilustrativos
posibilidades de eleccion, pero teniendo en cuenta que deseamos que el error en regimen permanente sea cero, pueden elegirse de la forma:
F (e; t) = G(e; t) =
Z1 0
Z1 0
1 (v; t)dt + 2 (v; t) 1(v; t)dt + 2(v; t)
(4.14)
La estructura nal del sistema sera la representada en la gura 4.6 donde los parametros de dise~no seran las funciones D, 1 , 2 , 1 y 2 . La resolucion se realiza para cada caso concreto y no de forma general, ya que el caso general resulta bastante complicado.
4.4 Ejemplos ilustrativos En primer lugar vamos a ver un ejemplo de control de un barco, de los dos primeros metodos comentados y posteriormente un ejemplo del metodo de hiperestabilidad. Generalmente, la dinamica de un barco se obtiene aplicando las leyes de Newton al movimiento del barco. Para buques de grandes dimensiones, el movimiento en el plano vertical puede despreciarse, dado que el efecto del balance y cabezada es peque~no en esos casos. El movimiento es descrito generalmente por un sistema de coordenadas jo al barco (ver gura 4.7). Un modelo simple que describe el comportamiento dinamico de un buque puede expresarse mediante la ecuacion diferencial (modelo de Nomoto de 3er orden):
_ t) = K 3 _ (t) + (t) 3) (t) + 1 + 1 (t) + 1 ( (4:15) 1 2 1 2 1 2 donde es el rumbo y el angulo de timon. Asumiendo condiciones iniciales nulas, (4.15) puede escribirse como, (s) = K (3 s + 1) (s) s(1 s + 1)(2s + 1)
(4:16)
donde K , 1 , 2 y 3 son parametros, los cuales son funcion de la constante de velocidad axial del barco u y de su longitud l, pudiendose expresar dichos parametros como:
Control adaptativo por modelo de referencia
59
Ψ δ
u
v
x
y V
Figura 4.7: Sistema de coordenadas del barco
u K = K0 l ! l i = i0 u ; i = 1; 2; 3:
(4.17) (4.18)
En nuestro ejemplo tomaremos los siguientes parametros que corresponden a un buque tipo carguero (Layne y Passino 1993): K0 = 3:86, 10 = 5:66, 20 = 0:38, 30 = 0:89, y l = 161 m. Tambien asumimos que el barco esta navegando en la direccion x a una velocidad de 5 m/s. En la navegacion de mantenimiento de rumbo, un barco solo experimenta peque~nas desviaciones del curso marcado. De esta forma, el modelo (4.15) se obtiene de la linealizacion de las ecuaciones de movimiento en torno a un angulo de timon de cero grados ( = 0). Como resultado de esto, el angulo de timon no debe exceder aproximadamente de 5o, en otro caso el modelo sera inadecuado, ya que se pondra de mani esto el comportamiento no lineal. Para nuestro proposito, necesitamos un modelo que sea valido para variaciones del angulo de timon superiores a los 5o, por ello, utilizaremos el modelo propuesto por Bech y Smitt (Layne y Passino 1993). Este modelo extendido esta dado por,
60
Ejemplos ilustrativos
_ t)) = K 3 _(t) + (t) 3) (t) + 1 + 1 (t) + 1 H ( ( 1 2 1 2 12
(4:19)
_ t)) es una funcion no lineal de ( _ t). La funcion H ( ( _ t)) puede caldonde H ( ( cularse de la relacion entre y _ en regimen permanente tal que 3) = _ = 0. _ puede Un experimento conocido como el test de espiral ha demostrado que H ( ) aproximarse por: _ = a _ 3 + b _ H ( ) (4:20) donde a y b son dos valores reales constantes tal que a es siempre positivo. En nuestro ejemplo elegiremos ambos valores de a y b como la unidad. A continuacion vamos a presentar dos controladores adaptativos por modelo de referencia para el sistema descrito anteriormente. Ambos utilizaran un controlador proporcional derivativo (PD). Los metodos considerados son el metodo del gradiente y el metodo basado en el criterio de estabilidad de Lyapunov para dise~no de controladores adaptativos.
4.4.1 Metodo del gradiente El mecanismo de ajuste de parametros utilizando este metodo puede ser implementado mediante la conocida regla del MIT. Para ello, se utiliza la funcion de costo, J = 21 2e (t) (4:21) donde e(t) = m (t) (t) y d = @ J dt @ por lo que, d = (t) @ e (t) e dt @ Para el desarrollo de la regla del MIT para el control del barco, asumimos que el barco puede ser modelado por un sistema lineal de segundo orden. Este modelo
Control adaptativo por modelo de referencia
61
puede obtenerse eliminando el polo del sistema correspondiente a 2 en (4.15), dado que la dinamica asociada a este polo es mucho mayor que la resultante del polo 1 . Por otro lado, se supone que el sistema opera con peque~nos valores de la derivada del angulo de timon, de forma que el termino correspondiente a _ es despreciable; quedando en ese caso que el modelo (conocido como de Nomoto) de 2o orden del buque tiene la forma: (t) + 1 ( _ t) = K (t) (4:22) 1 1 El controlador PD que puede emplearse en este caso viene dado por, _ t) (t) = kp( r (t) (t)) kd (
(4:23)
donde kp y kd son las ganancias proporcional y derivativa respectivamente y r (t) es la salida deseada. Sustituyendo 4.23 en 4.22 se obtiene,
!
!
!
t) + 1 + Kkd ( _ t) + Kkp (t) = Kkp r (t) ( 1 1 1
(4:24)
cuya funcion de transferencia es, (t) =
Kkp
s2 +
1+Kkd1 1
s+
Kkp r (t) 1
El modelo de referencia para este sistema se escoge como: !n2 m (t) = 2 s + 2!ns + !n2 r (t)
(4:25)
(4:26)
con = 1 y !n = 0:05. Combinando 4.26 con 4.25 y calculando la derivada parcial con respecto a kp y kd se tiene,
y
0 1 K @ e (t) = @ 1+Kkd1 Kkp A ( (t) r (t)) 2 @kp s + 1 s + 1 0 1 Ks @ e(t) = @ 1+Kkd1 Kkp A (t) 2 @kd s + 1 s + 1
(4:27) (4:28)
62
Ejemplos ilustrativos
En general las expresiones 4.27 y 4.28 no se pueden utilizar porque los parametros kp y kd no se conocen, pero en el caso optimo se tiene que, ! ! Kk 1 + Kk d p 2 s + s + = s2 + 2!ns + !n2 (4:29) 1 1 Ademas el termino K=1 puede incluirse en la ganancia de adaptacion . No obstante, esto requiere que se conozca el signo de K=1 . En general debe ser positivo para asegurar que la adaptacion del controlador se hace en la direccion negativa del gradiente. Para un buque de las caractersticas rese~nadas en el apartado anterior el signo de K=1 es negativo lo cual implica que el de con K=1 incluido debe ser negativo para asegurar la direccion negativa del gradiente. Despues de estas aproximaciones se obtienen las ecuaciones diferenciales del controlador PD siguientes:
! dkp = 1 1 2 dt s + 2!ns + !n2 ( r ) e ! dkd = s 2 2 dt s + 2!ns + !n2 e
(4:30) (4:31)
donde 1 y 2 son numeros negativos. Despues de muchas simulaciones, se han encontrado que los mejores parametros son: 1 = 0:005 y 2 = 0:1 En la gura 4.8, puede verse la evolucion de la respuesta del sistema junto con la salida del modelo de referencia y la se~nal de referencia. En el instante de tiempo 2300 segundos se cambia la velocidad de 5 m/s a 7.5 m/s, variable que afecta en gran medida a la dinamica del buque. Puede observarse como la salida del sistema se va aproximando a la salida deseada conforme los parametros del controlador PD van convergiendo a los valores optimos. En la gura 4.9 se muestran la se~nal de control y los parametros kp y kd. La convergencia de estos ultimos es un poco lenta, aunque como se aprecia en la gura 4.8 el seguimiento es bueno a partir de 1500 segundos.
4.4.2 Metodo de Lyapunov A continuacion se va a resolver el mismo ejemplo anterior utilizando el metodo de Lyapunov descrito en la seccion 4.2.2. En este caso tambien se utilizara un regulador
Control adaptativo por modelo de referencia
63
80 60
Rumbo (grados)
40 20 0 -20 -40 -60 -80 0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Tiempo (segundos)
Figura 4.8: Respuesta ante entradas en escalon
Angulo de timon
100 50 0 -50 -100 0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
3500
4000
4500
5000
Tiempo (segundos)
kd - kp
0
-200
-400 0
500
1000
1500
2000
2500
3000
Tiempo (segundos)
Figura 4.9: Evolucion de la se~nal de control y de los parametros
64
Ejemplos ilustrativos
PD (4.23) y se considerara el modelo reducido (4.22). Tambien se emplearan los mismos valores de = 1 y !n = 0:05. Las ecuaciones que describen la dinamica del barco pueden ponerse en forma matricial de la siguiente forma:
! _ =
0
Kkp 1
1
!
1+Kkd 1
!
+ _
0
!
r
(4:32)
m + 0 !n2 r _ m
(4:33)
Kkp 1
As mismo el modelo de referencia esta dado por:
! _ m = m
0 !n2
1 2!n
!
!
!
La dinamica que describe la evolucion del error e(t) = m (t) expresarse por: _ e = Am e + (Am As(t)) + (Bm Bs(t)) r
(t) puede (4:34)
donde el subndice m y s corresponde a las matrices del modelo y del sistema ajustable dados por las ecuaciones 4.32 y 4.33. Los vectores corresponden a: e = [ e _ e]T ;
_T = [ ]
El punto de equilibrio e = 0 es asintoticamente estable si se elige la ley de adaptacion como: A_ s(t) = P e T (4.35) _Bs(t) = P e r donde P es una matriz de nida positiva, solucion de la ecuacion de Lyapunov ATm P + PAm = Q < 0. Resolviendo para Q la matriz identidad se tiene que:
! ! p p 25 : 0125 200 : 000 11 12 P = p p = 200:000 2005:00 21 22
(4:36)
Control adaptativo por modelo de referencia
65
Por otro lado a partir de las ecuaciones 4.35 para k_ p y k_ d, se tiene la ley de adaptacion,
k_ p =
1 (p21 e + p22 _ e)( r )
(4.37)
k_ d =
2 (p21 e + p22 _ e) _
(4.38)
donde 1 y 2 son numeros negativos. Despues de varias simulaciones, se han encontrado los valores de los parametros: 1 = 0:0005 y 2 = 0:001 80 60
Rumbo (grados)
40 20 0 -20 -40 -60 -80 0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Tiempo (segundos)
Figura 4.10: Respuesta ante entradas en escalon En la gura 4.10, puede verse la evolucion de la respuesta del sistema junto con la salida del modelo de referencia y la se~nal de referencia. Puede observarse como la salida del sistema se va aproximando a la salida deseada conforme los parametros del controlador PD van convergiendo a los valores optimos. En la gura 4.11 se muestran la se~nal de control y los parametros kp y kd. La convergencia de estos ultimos es un poco lenta, aunque como se aprecia en la gura 4.10 el seguimiento es bueno a partir de 500 segundos.
66
Ejemplos ilustrativos
Angulo de timon
100 50 0 -50 -100 0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
3500
4000
4500
5000
Tiempo (segundos)
kd - kp
0
-200
-400 0
500
1000
1500
2000
2500
3000
Tiempo (segundos)
Figura 4.11: Evolucion de la se~nal de control y de los parametros
4.4.3 Metodo de hiperestabilidad Supongase el modelo de referencia y el sistema ajustable dados por:
yR = 2 u s + a1s + a2 yA = ^ 2 u s + a1s + a2
(4.39) (4.40)
La aplicacion del enfoque de hiperestabilidad a este caso conlleva los siguientes pasos: 1. Transformar el sistema en la forma equivalente de dos bloques, con la parte lineal y no lineal. 2. Encontrar la solucion de la parte de la ley de adaptacion no lineal utilizando el criterio de Popov.
Control adaptativo por modelo de referencia
67
3. Encontrar la solucion de la parte de la ley de adaptacion correspondiente a la parte lineal de forma que sea estrictamente positiva. 4. Realizar la ley de adaptacion. Siguiendo estos pasos, en primer lugar restando las ecuaciones 4.40 y 4.39 se tiene, (1 + a1 s + a2 s2)" = [ ^("; t)]u (4:41) donde ^("; t), de acuerdo con la estructura general de la ley de adaptacion vendra dado por: Zt ^("; t) = ^(0) (4:42) 1 (v; t; )d + 2 (v; t) + 0
siendo v la salida de la parte lineal, que es la salida del error generalizado con el operador D. O sea, v = D(s)". La parte derecha de la ecuacion 4.41, puede considerarse como una entrada w1 = [ ^("; t)]u. Por lo que la parte lineal vendra de nida por: (1 + a1 s + a2 s2)" = w1 v = D(s)" (4.43) Si se considera la expresion dada por la ecuacion 4.42, la se~nal w1 aparece como la salida del bloque no lineal que tiene a su vez como entrada la se~nal v. Por lo tanto se tiene,
w = w1 = [ ^("; t)]u = u
Z t 0
^(0) 1 (v; t; )d + 2 (v; t) +
(4:44)
El esquema equivalente correspondiente puede verse en la gura 4.12. El segundo paso, corresponde a encontrar la solucion para se veri que,
Z t1 0
v w dt =
Z t1 0
vu
Z t 0
1 (v; t; )d
1
y
2
de forma que
+ 2 (v; t) + ^(0) dt 02
(4:45)
En este caso particular, para resolver la desigualdad puede descomponerse en dos integrales I1 e I2 tales que,
68
Ejemplos ilustrativos
w 6
1
-
1 1+a1 s+a2 s2
w
e-
v
D(s)
^(0)
? HHH 6
@@ @ 6 u
1
2
Figura 4.12: Esquema equivalente del ejemplo
I1 = I2 =
Z t1 0
Z t1 0
vu
Z t 0
^(0) dt 12 1 (v; t; )d +
v u 2 (v; t)dt 22
(4.46) (4.47)
Si se hace que ambas integrales sean 0, la suma sera 0 y por lo tanto 2 para todo t 0. Centrandonos, en primer lugar, en la integral I2 , una solucion puede ser, 2 (v; t) = k2 (t) v
u; [k2(t) 0] para todo t 0
(4:48)
A su vez de la ecuacion 4.48, pueden deducirse soluciones particulares:
Adaptacion proporcional: 2 (v; t) = k2
v u; k2 0
(4:49)
Control adaptativo por modelo de referencia
69
Adaptacion mediante rele: { Si se elige k2(t) = k2=jvj, 2 (v; t) = k2 (v=jv j) u = k2
signo(v) u; k2 0
(4:50)
{ Si se elige k2(t) = k2=juj, 2 (v; t) = k2
signo(u) v; k2 0
(4:51)
signo(uv); k2 0
(4:52)
{ Si se elige k2(t) = k2=juvj, 2 (v; t) = k2
Para la resolucion de la integral I1, teniendo en cuenta un resultado bien conocido como, Z t1 h i (4:53) f_(t)k1f (t)dt = k21 f 2(t1) f 2(0) 12 k1f 2 (0); k1 0 0 puede hacerse, f_(t) = vu y Zt k1f (t) = ^(0) (4.54) 1 (v; t; )d + 0
Diferenciando con respecto a t se obtiene,
1 (v; t) = k1 vu
(4:55)
Si se elige k1 0 se cumple la condicion buscada. En conjunto la ley de adaptacion, con la eleccion particular que se ha realizado, quedara,
^("; t) =
Zt 0
k1 v u dt + k2 v u + ^(0)
(4:56)
Considerando el producto vu como una variable, se tiene que la ley de adaptacion (ecuacion 4.56), tiene una parte proporcional y otra integral (PI). El tercer paso, consiste en encontrar el termino D, tal que la parte lineal GSL, sea una funcion de transferencia estrictamente real positiva.
GSL = 1 + aDs(s+) a s2 1
2
(4:57)
70
Ejemplos ilustrativos
Para ello el modelo de referencia debe ser estable y los coe cientes a1 , a2 y los de D(s) deben ser reales. Eligiendo D(s) = d0 + d1s, puede encontrarse que, 2 Re[GSL(jw)] = d0(aa2 + (wd21)a21 + ad20w)w2 2
1
(4:58)
As que para que 4.58 sea mayor que cero para todo w real, se tiene la condicion,
d0a2 0 =) d0 0 a1 d1 d0 0 =) d1 d0=a1
(4.59)
El cuarto paso es realizar la estructura completa del sistema de control adaptativo, la cual corresponde en este a una ley de adaptacion proporcional mas integral que puede verse en la gura 4.13. Puede observarse que en la realizacion de esta estructura tambien es necesario un termino derivada del error. En algunos casos puede accederse al estado completo del modelo de referencia y del modelo ajustable por lo que podra obtenerse directamente el termino derivada sin tener que realizar un derivador.
Control adaptativo por modelo de referencia
-
1+a1 s+a2 s2
u
-@@ 6@^
1 1+a1 s+a2 s2
^(0)- HHH 6
71
yM
-d
dt
?e r d 6
e_ - d 1
0
yA k1 k2
r
@@ v 6@ u
Figura 4.13: MRAC con ley de adaptacion P+I
- ?
72
Ejemplos ilustrativos
Captulo 5 Reguladores autoajustables (STR) 5.1 Introduccion En general cuando dise~namos un controlador, este se dise~na para un punto de funcionamiento determinado del proceso. Ahora bien, si los parametros del proceso varan con el tiempo, ya sea por derivas o desgastes de las constantes fsicas, o bien porque el proceso es no lineal y se modi ca el punto de funcionamiento en el que estamos trabajando, el controlador calculado para un punto de funcionamiento concreto, no sera en general el adecuado para este tipo de situaciones. Cuando nos enfrentamos con este tipo de problemas, podemos plantear una estructura de control que ademas del bucle principal de regulacion que existe en todo sistema de control, incorpore un segundo bucle de control, en el que a partir de la informacion recogida del proceso y con un determinado criterio de dise~no, se modi quen los parametros del regulador. Como se vio en el captulo 2 sobre los controladores adaptativos, esto puede hacerse con dos planteamientos diferentes: con un modelo de referencia o bien mediante los reguladores autoajustables1 . En este caso, se comienza con un metodo de dise~no para sistemas con parametros conocidos, sustituyendo posteriormente los parametros conocidos por sus estimados 1
Self-tuning regulator (STR) en la terminologa inglesa
73
74
Introduccion
y recalculando el controlador en cada paso. La aplicacion de esta idea es lo que se conoce como el principio de equivalencia cierta. El diagrama de bloques de estos controladores se puede ver en la gura 5.1; en el se distinguen tres partes claramente diferenciadas:
un algoritmo recursivo de estimacion de parametros un mecanismo de adaptacion que desarrolla la tarea de dise~no del regulador y un regulador con parametros ajustables. Estos reguladores conforman una estructura suboptima basada en el principio de separacion de las tareas de control e identi cacion. Actuacion Deseada
6
-
Dise~no del - Controlador
BB
- Controlador Ajustable
Estimacion de - la Planta
s
- Planta
s
-
BBN
Figura 5.1: Esquema de regulador autoajustable (STR) La idea de los reguladores autoajustables puede ser aplicada a muchos problemas de control que no son formulados como un problema de control estocastico. Dada la modularidad y la separacion del control e identi cacion, pueden formarse muchas clases de reguladores autoajustables por combinacion de diferentes metodos de dise~no e identi cadores. En cuanto al modelo de la planta, supondremos en general, que sobre el sistema actuan perturbaciones estocasticas, por lo que el proceso estara descrito por su modelo ARMAX, de la siguiente forma:
Reguladores autoajustables (STR) (z 1 ) z d u(k) + C (z 1 ) v(k) y (k ) = B A(z 1 ) A(z 1 )
75 (5:1)
donde los distintos polinomios y variables tienen el siguiente signi cado:
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + :::: + anz n B (z 1 ) = b1 z 1 + b2 z 2 + :::: + bnz n C (z 1 ) = 1 + c1 z 1 + c2z 2 + :::: + cnz n siendo y(k) la secuencia de salida, u(k) la se~nal de control del sistema, v(k) una se~nal aleatoria independiente con distribucion gaussiana N (0; ), d es el retardo del sistema y z 1 es el operador retardo tal que y(k) = z 1 y(k + 1). En cuanto al criterio de dise~no, pueden dividirse en dos tipos, segun el planteamiento del problema sea: estocastico o no estocastico. Cuando el planteamiento es estocastico, se consideran sistemas cuyas se~nales no se pueden conocer exactamente y tampoco se pueden predecir. En el dise~no con planteamiento estocastico, normalmente se minimiza un cierto ndice de actuacion, como por ejemplo para el caso de mnima varianza, se trata de minimizar las variaciones con respecto a cero, ya que se trata de un problema de regulacion. J = E fy2(k + d + 1)g O bien puede plantearse un ndice mas general de la forma:
J = E f(Py(k + d + 1) + Qu(k) Rr(k))2 g Mediante el planteamiento no estocastico, se considera que las perturbaciones que inciden sobre un sistema son exactamente conocidas, pudiendose describir estos sistemas analticamente por medio de un sistema dinamico determinista. En este caso el ndice de actuacion se da en funcion de unas especi caciones que debe cumplir la salida del sistema, lo que normalmente se traduce en especi car una funcion de transferencia deseada en bucle cerrado, como es el caso de asignacion de polos. En la actualidad, se ha demostrado en numerosos casos, que ambos planteamientos conducen a resultados similares.
76
Asignacion de polos y ceros
A continuacion se exponen algunas tecnicas de dise~no de controladores, que son utilizadas frecuentemente en control adaptativo.
5.2 Asignacion de polos y ceros Astrom y Wittenmark (1980) proponen una estructura de control con dise~no por asignacion de polos como la dada en la gura 5.2. Esta estructura puede interpretarse como un compensador en adelanto y un compensador en bucle cerrado. Tambien puede demostrarse que dicha estructura corresponde a un controlador lineal por realimentacion del estado y a un observador. La ley de control puede dise~narse para unos polos deseados del sistema en bucle cerrado, preservando los ceros inestables del sistema en bucle abierto.
v(k) -
w(k)-
S
6
-
1 M
C A
-
Bz d A
G
? y(k) -
-
Figura 5.2: Estructura de control por asignacion de polos y ceros El problema que se plantea consiste en hacer que la funcion de transferencia, desde la salida a la referencia, del sistema ( gura 5.2), sea de la forma: (5:2) y(k) = RP m z d w(k) m donde los polinomios Rm y Pm no tienen factores comunes y el grado de Pm es mayor o igual a Rm. Esto permitira dar las especi caciones del problema de seguimiento
Reguladores autoajustables (STR)
77
en terminos de la respuesta deseada a una se~nal de referencia. Tambien habra que especi car la dinamica del observador mediante el polinomio Ao . El metodo de dise~no elegido es el de sntesis algebraica directa. La solucion consiste basicamente en resolver una ecuacion polinomial con ciertas restricciones en los ordenes de los polinomios para asegurar que el regulador propuesto sea causal y con realizacion mnima. A partir de la gura 5.2, la funcion de transferencia en bucle cerrado que se obtiene es: d CM y(k) = AMSBz w (k) + (5:3) d + BGz AM + BGz d v(k) Suponiendo que las perturbaciones son despreciables e igualando dicha ecuacion con la 5.2, se tiene la siguiente ecuacion polinomial: (AM + BGz d )Rm = SBPm
(5:4)
Las raices de esta ecuacion polinomial contienen las raices de los polinomios S , B y Pm. Si el polinomio B no esta contenido en el polinomio Rm , entonces formara parte del regulador que cancelara estos ceros, luego para que as pueda ocurrir, los ceros del polinomio B deben ser estables o estar contenidos en Rm . Factorizando B como B B +, donde el superndice corresponde a los ceros inestables y el + a los ceros estables. Haciendo tambien,
Rm = B Rm1 M = M1B + S = AoRm1
(5.5)
introduciendolos en la ecuacion 5.4, se obtiene la expresion :
AM1 + B Gz d = Ao Pm
(5:6)
Para resolver esta ecuacion polinomial, cuyas incognitas son M1 y G, pueden utilizarse varios metodos, como son: resolucion de un sistema de ecuaciones lineales simultaneas, utilizacion del metodo de la matriz polinomial (Aracil 1974), o bien como apuntan Alix et al. (1982), mediante un segundo algoritmo de identi cacion, lo que conduce a un metodo llamado cuasi-directo.
78
Asignacion de polos y ceros La ecuacion caracterstica del bucle cerrado es de la forma:
AM + BGz d = AM1 B + + B B +Gz d = B +Ao Pm
(5:7)
luego dicha ecuacion tiene como ceros suyos, los ceros estables del sistema en bucle abierto, los ceros del observador y los polos del modelo deseado. La ecuacion 5.6 (5.7), tiene in nitas soluciones, pudiendose obtener una solucion unica realizable. Para ello es necesario determinar los ordenes mnimos de los polinomios para que el controlador por asignacion de polos y ceros de Astrom y Wittenmark, sea causal. El grado de un polinomio A, se escribe como grd(A). A partir de la ecuacion 5.7, se sabe que, max(grd(A)+ grd(M ); grd(B )+ grd(G)+ d) = grd(B +)+ grd(Ao)+ grd(Pm) (5:8) Ademas para que el regulador sea causal debe cumplirse que,
grd(G) < grd(M ) y grd(S ) < grd(M ) (5:9) Por otro lado para una ecuacion de la forma, AX + BY = C donde X e Y son las incognitas, se tiene una solucion unica, (resultado conocido del algebra), si grd(X ) < grd(B ) o grd(Y ) < grd(A) A partir de (5.8) pueden ocurrir dos casos: 1. grd(A) + grd(M ) = grd(B +) + grd(Ao) + grd(Pm) o sea, grd(M ) = grd(B +) + grd(Ao) + grd(Pm) grd(A) y para obtener una solucion unica,
grd(G) < grd(A) tomando grd(G) < grd(A) 1 El grado del polinomio del observador puede deducirse utilizando 5.9, que sustituyendo se tiene, grd(Ao) > 2grd(A) grd(Pm) grd(B +) 1
Reguladores autoajustables (STR)
79
2. grd(B ) + grd(G) + d = grd(B +) + grd(Ao) + grd(Pm) o sea, grd(G) = grd(Ao) + grd(Pm) grd(B ) d y para obtener una solucion unica, grd(M ) < grd(B ) + d tomando grd(M ) < grd(B ) + d 1 Sustituyendo grd(M ) = grd(M1) + grd(B +), en los dos casos nos dan las condiciones para los grados de M1 y G como: grd(G) = grd(A) 1 grd(M1) = grd(Ao) + grd(Pm) grd(A) (5.10) o bien, grd(G) = grd(Ao) + grd(Pm) grd(B ) d grd(M1) = grd(B ) + d 1 (5.11)
- Rm z
yr (k)
d
Pm
s
w (k ) -
Rm Pm
-
A B
? u -
-
G M
e ? 6
Bz d A
y(k) -
s
Figura 5.3: Interpretacion como modelo de referencia La estructura del regulador dise~nado puede interpretarse como seguimiento a un modelo de referencia de la forma dada en 5.2. Operando con la ecuacion 5.4, para obtener S=M y sustituyendo en la expresion del regulador, u(k) = M1 (Sw(k) Gy(k)) (5:12)
80
Casos particulares
se tiene,
A y (k + d) + G (y (k) y(k)) u(k ) = B r M r
(5:13)
que corresponde a la estructura de la gura 5.3. En dicha estructura se puede observar que el regulador esta compuesto de dos partes, un controlador en adelanto (feedforward) y un controlador en bucle cerrado. Si la se~nal e es igual a cero, la accion del bloque G=M desaparece y la relacion que liga la entrada con la salida es justamente el modelo de referencia 5.2. Por otro lado es de notar que el bloque A=B no es realizable pero s lo es Rm A=PmB .
5.3 Casos particulares Como se desprende de la deduccion anterior, para el dise~no del regulador propuesto es necesario factorizar el polinomio B y resolver la ecuacion polinomial 5.6. Estos pasos pueden consumir un tiempo de calculo apreciable y si se pretende que el algoritmo funcione en lnea con el proceso (caso normal en control adaptativo), es de gran interes considerar casos particulares en los que dichos calculos se simpli quen. 1. Cancelacion de todos los ceros del sistema. En este caso se supone que el sistema es de fase mnima, pudiendose cancelar todos los ceros del sistema en bucle abierto, por lo que se tiene,
B+ = B B =1 Rm = Rm1 = K M = M1 B S = KAo que sustituyendo en la ecuacion 5.6, se llega a, AM1 + Gz d = PmAo (5:14) Dicha ecuacion es mas simple de resolver, sobre todo si se toman las condiciones 5.11. Este caso tambien puede verse como el controlador de Clarke y Gawthrop si se eligen, M1 = zF C = z 1 Ao Q = 0 w(k) = 0
Reguladores autoajustables (STR)
81
2. No se cancela ningun cero del sistema. Si el sistema a controlar es de fase no mnima, se supone que todos los ceros estan fuera del circulo unidad, y se eligen los ceros del sistema en bucle cerrado como Rm = KB , siendo K una constante, o sea,
B+ = 1 Rm = BRm1 = KB S = KAo
B =B M = M1
la ecuacion resultante es de la forma,
AM + BGz d = Pm Ao
5.4 Prediccion optima El problema de control estocastico esta ntimamente ligado con el de prediccion. Por ello vamos a desarrollar el predictor optimo (Astrom 1970, Wittenmark 1974), de d pasos de la salida de un sistema, el cual sera necesario posterioremente. Dado el proceso estocastico en tiempo discreto:
A(z 1 )y(k + d) = B (z 1 )u(k) + C (z 1 )v(k + d)
(5:15)
donde,
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + :::: + anz n B (z 1 ) = b1 z 1 + b2 z 2 + :::: + bnz n C (z 1 ) = 1 + c1 z 1 + c2z 2 + :::: + cnz n consideramos el problema de encontrar la prediccion de la salida en el instante k + d con la informacion disponible en el instante k, tal que la esperanza matematica de y(k + d) y(k + d=k) al cuadrado sea mnima, siendo y(k) la secuencia de salida, u(k) la se~nal de control del sistema y v(k) una se~nal aleatoria independiente con distribucion gaussiana N (0; ).
82
Prediccion optima
Predictor optimo La ecuacion del sistema 5.15 puede escribirse como : (z 1 ) C (z 1 ) v(k + d) y(k + d) = B u ( k ) + A(z 1 ) A(z 1 )
(5:16)
El ultimo termino de la expresion anterior es una funcion de v(k + d); v(k + d 1) v(k); v(k 1) , donde v(k + d); v(k +1) no estan disponibles en el instante k, por ello se va a descomponer este ultimo termino, mediante la utilizacion de la identidad: con;
C (z 1 ) = A(z 1 )F (z 1 ) + z
(d+1) G(z 1 )
F (z 1 ) = 1 + f1z 1 + ::: + fd z d G(z 1 ) = go + g1z 1 + ::: + gn 1z
(5.17)
(n 1)
quedando el sistema 5.16 de la forma: (z 1 ) u(k) + F (z 1 )v(k + d) + z 1 G(z 1 ) v(k) y(k + d) = B A(z 1 ) A(z 1 )
(5:18)
resolviendo la ecuacion 5.16 para v(k). 1 (z 1 ) d v(k) = CA((zz 1)) y(k) B C (z 1 ) z u(k)
(5:19)
Sustituyendo 5.19 en 5.18 y operando con la ayuda de la identidad 5.17. 1 1 1 1 (z 1 ) 1 )v (k +d)+ z G(z ) y (k ) B (z ) G(z ) z y(k +d) = B u ( k )+ F ( z A(z 1 ) C (z 1 ) C (z 1 ) A(z 1 )
(d+1) u(k )
1 (z 1 ) B (z 1 )F (z 1 ) u(k) y(k + d) = F (z 1 )v(k + d) + z CG y ( k ) + (z 1 ) C (z 1 )
Reguladores autoajustables (STR)
83
Tomando la esperanza matematica del error de prediccion. (En lo que se sigue, se omite z 1 en los polinomios para mayor claridad).
E (y(k + d) y^(k + d=k))2 = z 1 G y(k) + BF u(k) y^(k + d=k))2 = = E (Fv(k + d) + C C 1 z G y(k) + BF u(k) y^(k + d=k))2 + = E (Fv(k + d))2 + E ( C C 1G BF z + 2E (Fv(k + d)( C y(k) + C u(k) y^(k + d=k))) El ultimo termino es cero puesto que v(k + d) es independiente, y sobre el primer termino no podemos in uir, luego la mejor prediccion de la salida se obtiene igualando a cero el segundo termino, con lo que resulta que: 1 (z 1 ) B (z 1 )F (z 1 ) u(k) y^(k + d=k) = z CG y ( k ) + (z 1 ) C (z 1 )
O bien :
(z 1 ) zB (z 1 )F (z 1 ) u(k) y ( k ) + y^(k + d + 1=k) = G C (z 1 ) C (z 1 )
siendo el error de prediccion,
y(k + d + 1) y^(k + d + 1=k) = F (z 1)v(k + d + 1)
5.5 Regulador de mnima varianza Este regulador optimo pretende reducir el efecto de las perturbaciones sobre la salida. Para ello la estrategia de control consiste en calcular la se~nal de control u(k), como una funcion de los valores disponibles en ese instante, o sea, u(k 1); u(k 2); ; y(k); y(k 1); , de tal forma que se minimice el criterio:
J = E (y2(k + d=k)) Se supone que sobre el sistema actuan perturbaciones estocasticas, por lo que el proceso estara descrito por su modelo ARMA, de la siguiente forma:
A(z 1 )y(k + d) = B (z 1 )u(k) + C (z 1 )v(k + d)
(5:20)
84
Regulador de mnima varianza
donde los distintos polinomios y variables tienen el signi cado dado en el apartado anterior. Deduciendose que la se~nal de control u(k) afecta a la salida y(k + d) pero no antes. Utilizando la identidad,
C (z 1 ) = A(z 1 )F (z 1) + z (d+1) G(z 1 ) (5:21) El segundo miembro de la igualdad anterior puede descomponerse, quedando la ecuacion: 1 1 (z 1 ) 1 )v (k + d) + z G(z ) v (k ) y(k + d) = B u ( k ) + F ( z (5:22) A(z 1 ) A(z 1 ) Los dos ultimos terminos del lado derecho de la igualdad tienen la siguiente interpretacion: 1. F (z 1 )v(k + d), es una combinacion lineal de las perturbaciones producidas entre el instante k y k + d, cuyo efecto sobre la salida y(k + d) no se puede controlar con u(k), ya que v(k + d) para d > 0, es independiente de y(k 1); y(k 2) ; u(k 1); u(k 2) 2. z 1 G(z 1 )v(k)=A(z 1), es el efecto sobre la salida de las perturbaciones anteriores a k. Resolviendo la ecuacion 5.20 para v(k) y sustituyendo su expresion en 5.22 se obtiene: 1 G(z 1 ) F (z 1 )B (z 1 ) z 1 y(k + d) = F (z )v(k + d) + C (z 1 ) u(k) + C (z 1 ) y(k) Tomando la esperanza matematica en ambos miembros se tiene que: 1 E (y2(k + d)) = E (Fv(k + d))2 + E ( FB u (k) + z G y(k))2 + C C 1G z FB + 2E (Fv(k + d)( C y(k) + C u(k))) El ultimo termino de la expresion anterior es cero, ya que v(k + d) es independiente de los valores anteriores de y(k) y u(k), y sobre el primer termino del segundo miembro de la ecuacion no se puede in uir, luego el mnimo se obtendra igualando a cero el termino que queda, resultando que : 1 (z 1 ) u(k) = F (zz 1G)B y(k) (z 1 )
Reguladores autoajustables (STR) o bien,
1 u(k) = zB (zG(1z)F ()z 1 ) y(k)
85 (5:23)
A la vista de las expresiones obtenidas y comparandolas con la deduccion del predictor optimo en el apartado anterior, se puede interpretar el problema del regulador de mnima varianza, como la determinacion del predictor y buscar la se~nal de control tal que la prediccion coincida con la salida deseada. En este caso y^(k + d=k) = 0.
5.6 Control predictivo generalizado El Control predictivo generalizado (gpc) fue propuesto por Clarke et al. (Clarke 1987a), y se ha convertido en uno de los metodos mas populares en el ambito del Control Predictivo tanto en el mundo industrial como en el academico. Se ha empleado con exito en numerosas aplicaciones industriales (Clarke 1988), mostrando buenas prestaciones, a la vez que un cierto grado de robustez respecto a sobreparametrizacion o retardos mal conocidos. Puede resolver muchos problemas de control diferentes para un amplio campo de procesos con un numero razonable de variables de dise~no, que son especi cadas por el operario dependiendo del conocimiento previo del proceso y de los objetivos de control. Pero a pesar de este exito en la practica, este metodo adolece de la ausencia de un analisis teorico completo que estudie la in uencia de los parametros de dise~no (horizontes, secuencias de ponderacion) sobre la estabilidad del bucle cerrado as como de resultados de robustez. La idea basica del gpc es calcular una secuencia de futuras acciones de control de tal forma que minimice una funcion de coste multipaso. El ndice a minimizar es la esperanza matematica de una funcion cuadratica que mide por un lado la distancia entre la salida predicha del sistema y una cierta trayectoria de referencia hasta el horizonte de prediccion, y por otro el esfuerzo de control necesario para obtener dicha salida. Esta idea ha sido usada por Lelic y Zarrop (Lelic 1987a), y Lelic y Wellstead (Lelic 1987b), para la obtencion de un controlador por asignacion de polos generalizado que pertenece a la clase de los controladores de horizonte extendido y es una extension de los bien conocidos controladores por asignacion de polos. El Control Predictivo Generalizado tiene muchas ideas en comun con otros controladores predictivos, ya que esta basado en las mismas ideas pero posee a su vez algunas diferencias. Como se vera mas adelante, es capaz de proporcionar una solucion explcita (en ausencia de restricciones), puede trabajar con procesos inestables o de fase no mnima e incorpora el concepto de horizonte de control as como
86
Control predictivo generalizado
la consideracion en la funcion de coste de ponderacion de los incrementos en las acciones de control. Las diversas posibilidades disponibles para el gpc conducen a una gran variedad de objetivos de control comparado con otras realizaciones, algunas de las cuales pueden ser consideradas como subconjuntos o casos lmites del gpc.
5.6.1 Formulacion del control predictivo generalizado La mayora de los procesos de una sola entrada y una sola salida (single-input singleoutput, siso), al ser considerados en torno a un determinado punto de trabajo y tras ser linealizados, pueden ser descritos de la siguiente forma: A(z 1 )y(t) = z d B (z 1 )u(t 1) + C (z 1 )e(t) donde u(t) y y(t) son respectivamente la se~nal de control y la salida del proceso y e(t) es un ruido blanco de media cero. A, B y C son los siguientes polinomios en el operador de desplazamiento hacia atras z 1 : A(z 1 ) = 1 + a1 z 1 + a2 z 2 + ::: + ana z na B (z 1 ) = b0 + b1 z 1 + b2 z 2 + ::: + bnb z nb C (z 1 ) = 1 + c1z 1 + a2z 2 + ::: + cncz nc donde d es el tiempo muerto del sistema. Este modelo es conocido como Autorregresivo de Media Movil (Controller AutoRegressive Moving-Average carma). En muchas aplicaciones industriales en las que las perturbaciones son no-estacionarias resulta mas conveniente (Clarke 1987a), el uso de un modelo carma integrado, dando lugar al carima, que viene descrito por: A(z 1 )y(t) = B (z 1 )z d u(t 1) + C (z 1 ) e(t) con 4 = 1 z 1 (5:24)
4
Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. Notese que en el caso de que C pueda ser truncado se puede absorber en A y B . El caso general de ruido coloreado (C distinto de 1), es tratado mas adelante. El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuencia de se~nales de control que minimice una funcion de coste de la forma:
J (N1 ; N2; Nu) = E f
N2 X
j =N1
(j )[^y(t+j j t)
Nu X 2 w(t+j )] + (j )[4u(t+j j =1
1)]2g (5:25)
Reguladores autoajustables (STR)
87
donde E f.g es la esperanza matematica e y^(t + j j t) es la prediccion optima j pasos hacia delante de la salida del proceso con datos conocidos hasta el instante t, N1 y N2 son los horizontes mnimo y maximo de coste, Nu es el horizonte de control y (j ) y (j ) son las secuencias de ponderacion mientras que w(t + j ) es la futura trayectoria de referencia, que se puede calcular segun se muestra en la gura 5.4. En (Clarke 1987a) se considera (j ) igual a 1 y (j ) constante.
r(t+k) w1(t+k)
w2 (t+k)
y(t)
t Figura 5.4: Trajectoria de referencia El objetivo es pues el calculo de la futura secuencia de control u(t), u(t +1),... de tal manera que la salida futura del proceso y(t + j ) permanezca proxima a w(t + j ). Esto se logra minimizando J (N1 ; N2; Nu). Con la intencion de minimizar la funcion de coste, se obtendra previamente la prediccion optima de y(t + j ) para j N1 y j N2. Considerese la siguiente ecuacion diofantica: 1 = Ej (z 1 ) 4 A + z j Fj (z 1 ) 1 = Ej (z 1 )A~ + z j Fj (z 1 )
(5.26)
Los polinomios Ej and Fj estan unicamente de nidos con grados j 1 y na respectivamente. Se pueden obtener dividiendo 1 entre A~(z 1 ) hasta que el resto
88
Control predictivo generalizado
pueda ser factorizado como z j Fj (z 1 ) . El cociente de la division es entonces el polinomio Ej (z 1 ). Si se multiplica la ecuacion (5.24) por Ej (z 1 ) zj 4 A~(z 1 )Ej (z 1 )y(t + j ) = Ej (z 1 )B (z 1 ) 4 u(t + j d 1) + Ej (z 1 )e(t + j()5.27) Teniendo en cuenta (5.26), la ecuacion (5.27) queda: (1 z j Fj (z 1 ))y(t + j ) = Ej (z 1 )B (z 1 ) 4 u(t + j d 1) + Ej (z 1 )e(t + j ) La cual puede ser escrita como y(t + j ) = Fj (z 1 )y(t) + Ej (z 1 )B (z 1 ) 4 u(t + j d 1) + Ej (z 1 )e(t + j ) (5:28) Al ser el grado del polinomio Ej (z 1 ) igual a j 1 los terminos del ruido en la ecuacion (5.28) estan todos en el futuro. La mejor prediccion de y(t + j ) sera por consiguiente: y^(t + j j t) = Gj (z 1 ) 4 u(t + j d 1) + Fj (z 1 )y(t) donde Gj (z 1 ) = Ej (z 1 )B (z 1 ) Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursivamente, de forma que los nuevos valores en el paso j +1 (Ej+1 y Fj+1) sean funcion de los del paso j . La recursividad de la ecuacion diofantica ha sido demostrada en (Clarke 1987a). A continuacion se muestra una demostracion mas simple. Existen otras formulaciones del gpc que no estan basadas en la recursividad de esta ecuacion (Albertos 1989). Considerese que los polinomios Ej y Fj se han obtenido dividiendo 1 entre A~(z 1 ) hasta que el resto haya sido factorizado como z j Fj (z 1 ) . Con: Fj (z 1 ) = fj;0 + fj;1z 1 + + fj;naz na Ej (z 1 ) = ej;0 + ej;1z 1 + + ej;j 1z (j 1) Supongase que se utiliza el mismo procedimiento para obtener Ej+1 y Fj+1, es decir, dividir 1 entre A~(z 1 ) hasta que el resto se pueda factorizar como z (j+1) Fj+1(z 1 ) con Fj+1(z 1 ) = fj+1;0 + fj+1;1z 1 + + fj+1;naz na
Reguladores autoajustables (STR)
89
Esta claro que solamente es necesario dar un paso mas en la division para obtener los polinomios Ej+1 y Fj+1. Donde Ej+1 vendra dado por:
Ej+1(z 1 ) = Ej (z 1 ) + ej+1;j z
j
con ej+1;j = fj;0
Los coe cientes del polinomio Fj+1 se pueden expresar como:
fj+1;i = fj;i+1 fj;0 a~i+1 i = 0 na 1 El polinomio Gj+1 puede ser obtenido recursivamente como sigue:
Gj+1 = Ej+1B = (Ej + fj;0z j )B = Gj + fj;0z j B Es decir, los primeros j coe cientes de Gj+1 seran identicos a los de Gj mientras que el resto viene dado por:
gj+1;j+i = gj;j+i + fj;0 bi
para i = 0 nb
Para resolver el gpc es necesario obtener el conjunto de se~nales de control u(t), u(t + 1), ...,u(t + N ) que minimizan la ecuacion (5.25). Al tener el proceso un retardo de d perodos de muestreo, la salida solo se vera in uenciada por la se~nal u(t) despues del instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes pueden ser de nidos como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido hacer N1 < d + 1 ya que los terminos de (5.25) solo dependeran de las se~nales de control pasadas. Por otro lado, haciendo N1 > d + 1 los primeros puntos de la secuencia de salida, que seran los mejor estimados, no se tendran en cuenta. El conjunto de las j predicciones optimas:
y^(t + d + 1 j t) = Gd+1 4 u(t) + Fd+1y(t) y^(t + d + 2 j t) = Gd+2 4 u(t + 1) + Fd+2 y(t) ... y^(t + d + N j t) = Gd+N 4 u(t + N 1) + Fd+N y(t) puede ser escrito en forma matricial como:
y = Gu + F(z 1 )y(t) + G0 (z 1 ) 4 u(t 1)
(5:29)
90
Control predictivo generalizado Donde
y G G0(z 1 ) F(z 1 )
2 y^(t + d + 1 j t) 3 2 3 4 u(t) 66 y^(t + d + 2 j t) 77 66 4u(t + 1) 77 7 66 77 = 66 u = ... ... 75 4 4 5 y^(t + d + N j t) 4u(t + N 1) 2 g 3 0 ::: 0 0 66 g1 g0 ::: 0 77 = 66 .. ... ... ... 775 4 . g g ::: g 2 N 1 N 2 z(G0 (z 1 ) g ) 3 d+1 0 66 77 z2 (Gd+2 (z 1 ) g0 g1 z 1 ) 6 77 = 6 ... 4 5 N 1 1 ( N 1) z (G (z ) g0 g1z gN 1z ) 2 F (dz+N1 ) 3 66 Fdd+1 (z 1 ) 777 = 66 +2.. 75 4 . Fd+N (z 1 )
Al depender los ultimos terminos de la ecuacion (5.29) solo del pasado, pueden agruparse en f, dando lugar a: y = Gu + f (5:30) Entonces la ecuacion (5.25) puede escribirse como: J = (Gu + f w)T (Gu + f w) + uT u donde: h i w = w(t + d + 1) w(t + d + 2) w(t + d + N ) T La ecuacion (5.31) se puede poner como: J = 12 uT Hu + bu + f0 donde:
H = 2(GT G + I) b = 2(f w)T G f0 = (f w)T (f w)
(5:31) (5.32)
(5:33)
Reguladores autoajustables (STR)
91
El mnimo de J , siempre que no existan restricciones en la se~nal de control, puede ser calculado igualando a cero el gradiente de J , lo cual conduce a:
u = H 1bT
(5:34)
Debido al uso de la estrategia deslizante, solo el primer elemento del vector u es aplicado realmente, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo. La solucion propuesta involucra la inversion (o al menos la triangularizacion) de una matriz de dimension N N , lo cual conlleva una gran carga de calculo. El concepto ya usado en otros metodos de horizonte de control es empleado en (Clarke 1987a) con la nalidad de reducir la cantidad de calculo, asumiendo que las se~nales de control permaneceran en un valor constante a partir del intervalo Nu < N . Por tanto la dimension de la matriz que hay que invertir queda reducida a Nu Nu, quedando la carga de calculo reducida (en el caso lmite de Nu = 1, se reduce al caso escalar, como en el epsac, (De Keyser 1985) aunque restringiendo la optimalidad. Para aumentar la rapidez del algoritmo, fundamental sobre todo en el caso adaptativo, en Camacho y Bordons (1994,1995), se presenta un metodo desarrollado para la gran mayora de procesos industriales y con una carga de calculo mnima. Tambien existen realizaciones usando redes neuronales de Hop eld para obtener algoritmos rapidos (Quero 1990).
5.6.2 Consideracion de ruidos coloreados Cuando el polinomio del ruido C (z 1) de la ecuacion (5.24) no es igual a 1 la prediccion cambia ligeramente. Para calcular el predictor en esta situacion se debe resolver la siguiente ecuacion diofantica: C (z 1 ) = Ej (z 1 )A~(z 1 ) + z j Fj (z 1 ) (5:35) con (Ej (z 1 )) = j polinomio.
1 y (Fj (z 1 )) = (A~(z 1 ))
1, siendo () el grado del
Multiplicando la ecuacion (5.24) por 4Ej (z 1 ) y usando (5.35)
C (z 1 )(y(t + j ) Ej (z 1 )e(t + j )) = Ej (z 1 )B (z 1 ) 4 u(t + j 1) + Fj (z 1 )y(t) Como los terminos de ruido estan todos en el futuro, el valor esperado para el termino de la izquierda de la ecuacion anterior es:
92
Controladores para plantas con parametros desconocidos
E [C (z 1 )(y(t + j ) Ej (z 1 )e(t + j ))] = C (z 1 )^y(t + j jt) El valor esperado de la salida puede ser generado por la ecuacion:
C (z 1 )^y(t + j jt) = Ej (z 1 )B (z 1 ) 4 u(t + j 1) + Fj (z 1 )y(t)
(5:36)
Notese que esta ecuacion de prediccion podra ser usada para generar las predicciones de forma recursiva. Se puede obtener una expresion explcita para la prediccion optima de j pasos resolviendo la siguiente ecuacion diofantica: 1 = C (z 1 )Mj (z 1 ) + z j Nj (z 1 ) con (Mj (z 1 )) = j 1 y (Nj (z 1 )) = (C (z 1 )) 1.
(5:37)
Multiplicando la ecuacion (5.36) por Mj (z 1 ) y usando (5.37),
y^(t + j jt) = Mj Ej (z 1 )B (z 1 ) 4 u(t + j 1) + Mj (z 1 )Fj (z 1 )y( t) + Nj (z 1 )y(t) que se puede expresar como:
y^(t+j jt) = G(z 1 )4u(t+j 1)+Gp(z 1 )4u(t+j 1)+(Mj (z 1 )Fj (z 1 )+Nj (z 1 ))y(t) con (G(z 1 )) < j . Estas predicciones se pueden usar en la funcion de coste que se minimiza de la misma forma que el caso de ruido blanco.
5.7 Controladores para plantas con parametros desconocidos En los apartados anteriores se han dise~nado reguladores y controladores para plantas cuyos parametros se han supuesto conocidos. En este punto reemplazaremos esta hipotesis por otra en que se supone que los parametros son desconocidos y constantes. No obstante, como han demostrado experimentalmente algunos autores (Astrom 1973, Clarke et. al. 1979, Wellstead et al. 1979), estas tecnicas pueden ser aplicadas cuando los parametros varan lentamente o bien bruscamente, pero sus valores se mantienen constantes durante largos periodos de tiempo.
Reguladores autoajustables (STR)
93
Como se ha comentado anteriormente, la idea en que se basan los reguladores autoajustables (STR), reside en la aplicacion del principio de equivalencia cierta. Ello implica el utilizar un algoritmo de identi cacion de parametros, y calcular los parametros del regulador en base a suponer que los parametros estimados coinciden con los reales.
5.8 Algoritmos con estructura explcita e implcita Dentro de los controladores autoajustables, que aplican el principio de equivalencia cierta, para realizar el mecanismo de adaptacion, existen basicamente dos tipos de algoritmos, unos que identi can directamente los parametros de la planta (algoritmo con identi cacion explcita), gura 5.1, y otros que mediante una reescritura del modelo de la planta, simpli can los pasos, estimandose en este caso directamente los parametros del controlador (algoritmo con identi cacion implcita), gura 5.5. Actuacion Deseada
6
-
-
Identi cacion modelo reparametrizado
BB
- Controlador Ajustable
s
- Planta
s
-
BBN
Figura 5.5: Algoritmo con identi cacion implcita
Algoritmo con identi cacion explcita 1. Estimar los parametros del modelo 5.20 mediante un algoritmo de identi cacion de parametros, como el propuesto en el captulo 3.
94
Algoritmos con estructura explcita e implcita 2. Calcular los parametros del controlador, segun se ha visto en los apartados anteriores, necesitandose en muchos casos resolver una ecuacion polinomial. 3. Calcular la se~nal de control con los parametros del controlador. 4. Repetir los pasos 1, 2 y 3 en cada periodo de muestreo.
Mediante este algoritmo se puede realizar un paquete de programas de control, donde el paso 1 de identi cacion sera comun para todos los controladores, cambiando cada uno de estos bajo demanda del usuario, segun el tipo de proceso a controlar.
Algoritmo con identi cacion implcita 1. Estimar los parametros del modelo reparametrizado mediante un algoritmo de identi cacion de parametros. 2. Calcular la se~nal de control con los parametros del controlador. 3. Repetir los pasos 1 y 2 en cada periodo de muestreo. La realizacion de este algoritmo no siempre es posible, ya que para el paso 1, se necesita en cada caso particular reformular el modelo para que aparezcan directamente los parametros del controlador. Se ilustran estos dos tipos de algoritmos, para el caso de dise~no del controlador con el criterio de asignacion de polos, poniendose de mani esto, que en el caso de la identi cacion implcita, la reescritura del modelo conduce a un modelo bilineal en los parametros que entra~na una mayor di cultad para su identi cacion. Tambien se hace notar que la reescritura del modelo no siempre es posible y hay que realizarla para cada caso en particular.
Algoritmo con identi cacion explcita Dados: Rm, Ao, Pm, d 1. Estimar A y B en el modelo,
d y (k ) = B A z u(k)
Reguladores autoajustables (STR) 2. Factorizar el polinomio B = B + B 3. Resolver la ecuacion siguiente para M1 y G, AM1 + B Gz d = Ao Pm que corresponde a un sistema de ecuaciones lineales. 4. Calcular la se~nal de control mediante, ( 1 S = Ao Rm1 u(k) = M (Sw(k) Gy(k)) M = M1 B +
95
(5:38)
5. Ir al paso 1.
Algoritmo con identi cacion implcita La ecuacion 5.38 puede reescribirse de la siguiente forma:
AM1 y(k) + B Gz d y(k) = AoPm y(k) como por otro lado Ay(k) = Bz d u(k), lleva a,
M1 Bz d u(k) + B Gz d y(k) = AoPmy(k) teniendo en cuenta que M = M1 B + y B = B +B , resulta:
AoPm y(k) = B z d [Mu(k) + Gy(k)] Esta ecuacion puede verse como el modelo de un proceso, en el que los polinomios del controlador M y G aparecen directamente. Teniendo en cuenta esto, puede escribirse el algoritmo de control adaptativo con identi cacion implcita siguiente: Dados: Rm1 , Ao, Pm, d 1. Estimar M , G y B en el modelo, AoPm y(k) = B z d [Mu(k) + Gy(k)]
96
Propiedad de autosintona 2. Calcular la se~nal de control mediante, u(k) = M1 (Sw(k) Gy(k)) 3. Ir al paso 1.
S = AoRm1
Hay que hacer notar que el modelo a identi car en este caso es bilineal en los parametros, por lo que la identi cacion no es trivial. Para el caso en que B = 1, o sea que tengamos un sistema de fase mnima que tiene todos sus ceros estables, el algoritmo se reduce notablemente, ya que la identi cacion del modelo resultante no presenta ningun problema.
Ventajas e inconvenientes de uno y otro algoritmo En el caso de la identi cacion explcita se necesitan mas calculos en cada paso. Por otro lado se tienen directamente los parametros de la planta, lo que es particularmente interesante para poder realizar la supervision del control. As mismo, como se ha mencionado anteriormente, permitir un unico algoritmo en el que puede cambiarse el controlador en cada caso. En el caso de la identi cacion implcita se necesitan menos calculos en cada paso, pero la identi cacion es en general mas complicada. Se necesita reescribir el modelo en cada caso particular, y ello no siempre es posible.
5.9 Propiedad de autosintona Se ilustra aqu, la propiedad de autosintona de los controladores autoajustables para el caso del regulador de mnima varianza. Este regulador que se estudio en un apartado anterior, tiene como resultado que : 1 u(k) = zB (zG(1z)F ()z 1 ) y(k) utilizandose la identidad :
C (z 1 ) = A(z 1 )F (z 1 ) + z
(d+1) G(z 1 )
Reguladores autoajustables (STR) con;
F (z 1) = 1 + f1 z 1 + ::: + fd z d G(z 1) = go + g1 z 1 + ::: + gn 1z
97
(n 1)
As mismo vimos que el modelo del sistema puede escribirse como: (z 1 ) y(k) + zF (z 1 )B (z 1 ) u(k) + F (z 1 )v(k + d + 1) y(k + d + 1) = G C (z 1 ) C (z 1 ) que para el caso en que C (z 1 ) = 1, o sea, no se consideran las perturbaciones, el algoritmo de identi cacion se reduce notablemente, quedando el modelo:
y(k + d + 1) = A0 (z 1 )y(k) + B 0(z 1 )u(k) + v(k + d + 1) donde A0 (z 1 ) es de orden n 1 y B 0(z 1 ) de orden n + d 1. Este ultimo modelo puede utilizarse para estimar los parametros de A0 y B 0 por mnimos cuadrados y de esta forma la ley de control de mnima varianza resulta simplemente:
A0(z 1 ) y(k) u(k) = B 0 (z 1 )
donde
A0 (z 1 ) = a0o + a01 z 1 + ::: + a0n 1 z (n 1) B 0 (z 1 ) = b0o + b01 z 1 + ::: + b0n+d 1 z (n+d
1)
que coincidira con el regulador calculado para el caso del conocimiento exacto de los parametros de la planta. Para el caso en que C (z 1 ) 6= 1, cabe esperar que los parametros sufran desviaciones, sin embargo, como veremos a continuacion, el regulador converge al regulador calculado con parametros conocidos. Si utilizamos el regulador:
A0 y(k) u(k) = B 0
98
Procedimiento de sntesis
Al sustituir dicho regulador en el modelo de la planta y operando se obtiene la funcion de transferencia en bucle cerrado de la forma: 0 CB y(k) = AB 0 + BA0 z d v(k) As mismo, como el control es de mnima varianza, esta funcion debe ser de la forma: y(k) = F (z 1)v(k) Luego igualando las dos expresiones anteriores y reordenando la ecuacion resultante se obtiene, 0 FBA d C = AF + z B 0 que comparando con la identidad:
C = AF + z
(d+1) G
se obtiene la expresion del regulador obtenida anteriormente (5.23),
A0 = G B 0 zBF Cuando utilizamos la propiedad de autosintona podemos utilizar un algoritmo de identi cacion de mnimos cuadrados, mucho mas simple que el que sera necesario para identi car los polinomios A,B y C del modelo original, y el regulador que se obtiene converge al optimo.
5.10 Procedimiento de sntesis A continuacion se dan resumidos los pasos del procedimiento a seguir para el calculo del control, en el que se suponen conocidos los grados de los polinomios A, B y C , as como el retardo (d) del sistema.
1er paso :
Reguladores autoajustables (STR)
99
Identi car usando mnimos cuadrados el siguiente modelo: y(k) = A0(z 1 )z (d+1) y(k) + B 0(z 1 )z (d+1) u(k) + e(k) donde A0 y B 0 estan de nidos por: A0 (z 1 ) = a0o + a01 z 1 + ::: + a0n 1 z (n 1) B 0 (z 1 ) = b0o + b01 z 1 + ::: + b0n+d 1 z (n+d 1) e(k) es el residuo de la identi cacion y b0o se ja de antemano por condiciones de identi cabilidad. 2o paso : Calcular la se~nal de control por la expresion, A0 (z 1 ) y(k) u(k) = B 0 (z 1 ) Los pasos descritos anteriormente son efectuados en cada periodo de muestreo, constituyendo un procedimiento de sntesis de los controladores autoajustables.
5.11 Ejemplos ilustrativos 5.11.1 Ejemplo de mnima varianza Dado el sistema,
y(k) + ay(k 1) = bu(k 1) + e(k) + ce(k 1) donde a = 0:5, b = 3 y c = 0:7. El regulador de mnima varianza para este sistema es: u(k) = a b c y(k) = 0:4y(k) Un regulador con esta estructura puede obtenerse empleando un algoritmo de control adaptativo autoajustable, como el descrito en las secciones precedentes, basado en el modelo: y(k) + y(k 1) = u(k 1) + "(k 1) La gura 5.6 muestra la evolucion del parametro cuando = 1. Puede verse como este converge al valor de 0:4.
100
Ejemplos ilustrativos 0 -0.1 -0.2
parametro
-0.3 -0.4 -0.5 -0.6 -0.7 -0.8 -0.9 -1 0
50
100
150
200
250
300
350
400
tiempo
Figura 5.6: Parametro estimado
5.11.2 Control adaptativo PI Vamos a ver un ejemplo de control adaptativo suponiendo que el sistema se modela como un sistema de primer orden y el regulador que se va a emplear es un PI. A partir de las entradas y salidas (u e y), se identi caran los parametros del modelo y mediante un metodo de dise~no se actualizaran los parametros del regulador PI. En un primer paso se utilizara como metodo de dise~no la regla de Ziegler-Nichols. Dicha regla se basa en los parametros de la respuesta a un escalon de un sistema de primer orden con retardo, G(s) = 1 +Ks e d s (5:39) Si se elige un tiempo de muestreo (Tm ) tal que d = Tm d, el equivalente discreto viene dado por, 1 G(z 1 ) = 1 bzaz 1 z d (5:40)
Reguladores autoajustables (STR)
101
siendo la correspondencia entre ambas representaciones, a = e Tm = ; = lnTma ; K = 1 b a Luego con este sistema de control adaptativo, en primer lugar se estiman los parametros a y b, a partir de estos se calculan y K , y aplicando las reglas de Ziegler-Nichols, se obtendrian los parametros del regulador PI. Como dichas reglas son para el sistema continuo, la realizacion practica, conllevara la discretizacion del regulador PI. Veamos otro metodo de dise~no: el basado en la tecnica de asignacion de polos. En este caso, al igual que en el anterior, se identi cara el sistema dado por 5.40 y suponiendo que estos parametros son los correctos se dise~nara un regulador PI discreto, el cual viene dado por: 1 (5:41) GR(z 1 ) = q01+ qz1 z1 Para el caso en que d = 0, la funcion de transferencia total del conjunto regulador y planta en bucle cerrado viene dada por:
z + q1 =q0) GT (z) = (z a)(zbq0 (1) + bq0 (z + q1 =q0)
(5:42)
Sistema de segundo orden, donde se pueden jar los dos polos (con q0 y q1 ), aunque no se puede jar el cero. Una forma de asignar los polos, puede ser cancelando el polo en a (puede hacerse si el sistema es estable), con q1 =q0 = a. De esta forma solo habra que jar un polo. La funcion de transferencia total quedara: 0 GT (z) = (z bq 1) + bq0
(5:43)
Luego si el polo deseado es p quedaran como ecuaciones del regulador adaptativo:
q0 = 1 ^ p b
q1 = q0 a^
(5:44)
102
Ejemplos ilustrativos
A la vista de estas ecuaciones esta claro, que cuanto mayor se elija p mayor sera el esfuerzo de control (u). Luego no puede ponerse el polo todo lo cerca del cero que se quiera. Puede elegirse, por ejemplo como p = 0:9 a, con lo que estamos especi cando que la respuesta del sistema controlado sea mas rapida que la del sistema original. Puede observarse que las ecuaciones del controlador adaptativo que se obtiene en este caso son muy simples, as como los parametros a identi car que seran a^, ^b y un termino para evitar las componentes de continua. La ecuacion del sistema para identi car sera: yk = ayk 1 + buk 1 + Constante (5:45)
5.11.3 Control de robot movil Con este ejemplo se pretende estudiar el comportamiento de un controlador adaptativo aplicado al seguimiento de trayectorias de un robot movil. Como se vera, el problema presenta algunas caractersticas que lo hacen adecuado para el control adaptativo y los resultados que se obtienen parecen corroborar esta adecuacion.
Modelo del Sistema Supongase un robot movil (vehculo) y un sistema de referencia asociado a el (ver gura 5.7). El robot se desplaza a lo largo del eje vertical de este sistema. Se tiene como referencia un punto objetivo que se desea alcanzar y que se supone esta sobre la trayectoria que debe seguir el robot. Conforme el robot se desplaza a lo largo del eje OY, debe anularse el error a lo largo del eje OX, desde la posicion original hasta el objetivo. El desplazamiento a lo largo del eje OX se controla gracias a las maniobras sobre la rueda de direccion del robot, que de niran la curvatura del arco que describira en su desplazamiento. El sistema que se desea analizar y controlar es el de la evolucion de la mencionada distancia horizontal hasta el punto objetivo, usando como se~nal accionadora la curvatura comandada por la direccion del vehculo. La relacion basica entre arco y angulo establece que,
dS = r d ) d = dS
Reguladores autoajustables (STR)
103 OY
objetivo
dΦ
ds dy’
r dΦ
OX dx’ r
centro giro
vehiculo
Figura 5.7: Esquema de robot movil y trayectoria objetivo donde es la curvatura ( = 1=r). Observando la gura anterior, se pueden deducir las siguientes relaciones: dx0 = r (1 cos d) dy0 = r send Como ya se ha indicado, se ha considerado un sistema de referencia ligado al movil. Pasando a un sistema de referencia absoluto, respecto al cual, el sistema local forma un angulo , se tiene, dx = cos dx0 sen dy0 dy = sen dx0 + cos dy0 Si se hace la suposicion de que d es su cientemente peque~no: send ! d; cos d ! 1; De forma que,
dx0 = 0;
dy0 = r d = dS ;
104
Ejemplos ilustrativos Y, por tanto:
dx = sen dS ;
dy = cos dS ;
Introduciendo la velocidad en las ecuaciones: dx = V sen dt dy = V cos dt El sistema de interes es el que involucra el desplazamiento horizontal en funcion de la curvatura. dx = V sen dt d = V dt Por otro lado, se asume que la curvatura real del robot se obtiene a partir de la curvatura comandada (a la que llamaremos se~nal de control u) a traves de una cierta dinamica que se puede expresar como: d = 1 (u ) dt Resumiendo, el sistema dinamico que se debera controlar es: dx = V sen dt d = V dt d = 1 (u ) dt
(5.46)
Donde la se~nal de control es u(t) y la se~nal de salida es x(t). Este sistema puede linealizarse tomando el sistema de referencia absoluto tal que la orientacion del vehculo en todo instante () sea peque~na. Haciendo la aproximacion del peque~no angulo, se obtiene el siguiente sistema linealizado: dx = V dt
Reguladores autoajustables (STR)
d = V dt d = 1 (u ) dt
105 (5.47)
Algoritmo de control El sistema descrito resulta adecuado para el control adaptativo debido principalmente a dos motivos. En primer lugar, se trata de un sistema no lineal, por lo que el control adaptativo posibilitara la obtencion de aproximaciones lineales apropiadas para cada punto de trabajo y por otro lado el sistema es variable en el tiempo. Ademas en el caso de que se pudiera linealizar mediante la mencionada aproximacion del peque~no angulo, se tratara de un sistema lineal variable, puesto que la velocidad (V ) que aparece en las expresiones no permanece constante a lo largo del desplazamiento del robot. La tecnica de control que se va aplicar es Control Adaptativo Autoajustable mediante Asignacion de Polos. El ciclo de control consta de tres pasos fundamentales: 1. Identi cacion de un sistema lineal aproximado al sistema real en el punto de trabajo actual. 2. Calculo del regulador apropiado para el sistema identi cado. 3. Obtencion y aplicacion de la se~nal de control producida por el regulador, a partir del error entre la referencia y la salida del sistema. La identi cacion se realizara por Mnimos Cuadrados Recursivos, considerando un modelo de tercer orden de la forma: 1 1 2 3 G(z 1 ) = YU ((zz 1 )) = 1 +b1az z +1 +b2az z +2 +b3 za z 3 1 2 3 Como se ha descrito en el captulo 3 el algoritmo basico de identi cacion, suele ser insu ente en las aplicaciones practicas por lo que hay que incluir una serie de mejoras. Po ello se ha incluido un factor de olvido variable, en el rango entre 0.96 y 1. Al mismo tiempo se ha incluido acotacion inferior y superior de la matriz
106
Ejemplos ilustrativos
de covarianza. Para acotar inferiormente esta matriz se le suma una matriz R1 constante y para acotarla superiormente se ha impuesto una cota superior a la traza de dicha matriz. En cada ciclo del algoritmo de control, se redise~na el controlador. Se ha optado por dise~nar el controlador usando asignacion de polos y forzando a que el sistema completo resultante en bucle cerrado posea error estacionario nulo. En la gura 5.8 se puede observar la disposicion de este controlador. r
T
e
1 S
u
B A
x
R
Figura 5.8: Estructura del controlador En el metodo de asignacion de polos se pretende que el sistema en bucle cerrado, incluyendo al controlador, posea una dinamica especi cada. Para ello se exige que la funcion de transferencia posea un denominador igual a un polinomio deseado P (z 1 ). La funcion de transferencia del bucle cerrado de la gura 5.8 es: 1 1 GBC (z 1 ) = A(z 1 ) ST(z(z 1) )+BB(z(z )1 ) R(z 1 )
y se desea que tenga la forma:
P (1) B (z 1 ) GBCd(z 1 ) = B (1) P (z 1 )
En este caso el sistema resultante no incluye ceros adicionales a los de la planta (como ocurre en otras variantes del metodo de asignacion de polos), y tampoco se intenta cancelar ninguno de los ceros del sistema original (esto signi ca que el metodo sera aplicable con independencia de que el sistema original posea ceros inestables). Por ultimo, se exige que el sistema tenga ganancia estatica unitaria. Los polinomios R(z 1 ); S (z 1 ) se obtienen resolviendo la ecuacion polinomica:
A(z 1 ) S (z 1 ) + B (z 1 ) R(z 1 ) = P (z 1)
Reguladores autoajustables (STR)
107
Ademas, como ya se ha indicado, se desea un integrador en el paso directo para garantizar que el error estacionario sea cero. Para ello, se exige que S (z 1) sea de la forma: S (z 1 ) = (1 z 1 ) S 0 (z 1 ) (5:48)
T (z 1 ) debe cumplir: P (1) = A(1) S (1) + B (1) R(1) T (1) = B (1) B (1) Aplicando (5.48), resulta que S (1) = 0, con lo cual, T (1) = R(1). Para especi car el polinomio deseado P (z 1 ) se ha optado por indicar directamente los polos deseados y asignarlos en funcion de los del sistema original. En primer lugar, se ha realizado la identi cacion del sistema dinamico del robot movil, resultando que los polos son:
p0 = 1:0012 + 0:0233i; p1 = 1:0012 0:0233i; p2 = 0:8163 Los polos deseados se especi can en:
p0 = 0:8 + 0:0233i; p1 = 0:8 0:0233i; p2 = 0:8163 Con estos valores se consiguen unos buenos margenes de estabilidad, que se estiman en:
M 39:27 grados MG 6:98 dB Se ha supuesto que en el sistema existe una saturacion debida al actuador y/o convertidores, por lo que esta debe tenerse en cuenta en el controlador. Es decir, que a la se~nal uk obtenida a partir del regulador se le aplica: uk = satura(uk ). De esta forma, el regulador usara los valores exactos que se aplicaron al sistema. En la gura 5.9 se expone el esquema completo del sistema de control implementado.
Simulaciones Realizadas Los parametros del modelo utilizado han sido:
108
Ejemplos ilustrativos 1
Actuacion Deseada
r
T
1
rAux
P
Diseño Controlador
1 S
e
B A
Identificador
u
Planta
x
1 xAux
R
1
Figura 5.9: Bucle de control completo
Periodo de muestreo: h = 0:3 s Velocidad inicial: V = 1:2 m=s. En el caso de las simulaciones que se hagan con velocidad constante, este sera el valor que tenga la velocidad durante toda la simulacion.
Constante de tiempo del control de la curvatura: = 5 h Saturacion de la se~nal de control: usat = 10 En la mayora de los casos, se ha utilizado como entrada de referencia una sucesion de pulsos positivos o negativos, de amplitud y anchura aleatorias dentro de unos rangos. Como estimacion inicial del sistema, se usa una identi cacion hecha previamente para el sistema linealizado. En la gura 5.10 se muestra el resultado para el caso de usar un controlador jo, considerando que el sistema es lineal pero variable. La velocidad se vara en escalones de amplitud 0.1. Se puede observar que cuando la velocidad se distancia signi cativamente de la inicial, no se consigue un control aceptable.
Reguladores autoajustables (STR)
109
5 Referencia Salida Velocidad
4 3 2 1 0 −1 −2 −3 −4 −5 0
100
200
300
400
500
600
700
800
900
1000
Figura 5.10: Sistema lineal variable con controlador jo En la gura 5.11 se muestra el resultado para el caso de control adaptativo con el algoritmo de identi cacion completo comentado previamente. Puede observarse que el comportamiento del sistema es bastante bueno. A ttulo ilustrativo, se muestra en la gura 5.12 la evolucion de los coe cientes del numerador de la funcion de transferencia identi cada. Para forzar mas la variacion del sistema, se sometio a la velocidad a un crecimiento continuo en forma de rampa de pendiente 0.01. En la gura 5.13, se puede observar el resultado con el regulador adaptativo. Por ultimo se comprueba el comportamiento del controlador frente a la presencia tanto de la no-linealidad como de la variacion de la velocidad. En la gura 5.14, se muestra la respuesta del sistema variando la velocidad, como ya se hizo anteriormente en forma de rampa con pendiente 0.01. Puede apreciarse que, el considerar ambas caractersticas, no afecta signi cativamente al comportamiento del sistema. En este caso la referencia son escalones con un ltro de primer orden para suavizar la se~nal de referencia, ello tiene como consecuencia que el punto de trabajo cambie mas suavemente.
110
Ejemplos ilustrativos 10 Referencia Salida Velocidad
5
0
−5 0
100
200
300
400
500
600
700
800
900
1000
Figura 5.11: Sistema lineal variable con control adaptativo b1 b2 b3
0.3 0.25 0.2 0.15 0.1 0.05 0 −0.05 −0.1 −0.15 −0.2 0
100
200
300
400
500
600
700
800
900
1000
Figura 5.12: Evolucion de algunos de los parametros identi cados
Reguladores autoajustables (STR)
111
12 Referencia Salida Velocidad
10
8
6
4
2
0
−2
−4 0
100
200
300
400
500
600
700
800
900
1000
Figura 5.13: Sistema lineal variable con control adaptativo 10 Referencia Salida Velocidad
8 6 4 2 0 −2 −4 −6 −8 −10 0
100
200
300
400
500
600
700
800
Figura 5.14: Sistema no lineal variable.
900
1000
112
Ejemplos ilustrativos
Captulo 6 Autoajuste y ajuste por tabla de controladores 6.1 Introduccion Los esquemas de control adaptativos como mrac y str necesitan de informacion a priori acerca de la dinamica del proceso. Es importante conocer las escalas de tiempo, las cuales son crticas para determinar los intervalos de muestreo y ltros. La importancia de la informacion a priori tambien aparecio en conexion con intentos de desarrollar tecnicas para ajuste automatico de reguladores PID. Tales reguladores son usados para sistemas de control con un amplio rango de constantes de tiempo. Desde el punto de vista del usuario sera ideal disponer de una funcion mediante la cual el regulador pudiera ser ajustado. Aunque los esquemas adaptativos convencionales parecen ser herramientas ideales para el ajuste automatico, resultaron inadecuadas porque requeran conocimiento previo de las escalas de tiempo. Los reguladores simples (como PIDs), con dos o mas parametros pueden ser ajustados manualmente si no hay demasiada interaccion entre los diferentes parametros, pero el ajuste manual no es posible para reguladores mas complejos. Tradicionalmente, el ajuste de tales reguladores ha tomado la via de la modelizacion o identi cacion y dise~no del regulador. Esto requiere un consumo de tiempo elevado, ademas de ser un procedimiento costoso, que solo puede ser aplicado a sistemas crticos en tama~no o en importancia o a sistemas que van a ser manufacturados 113
114
Introduccion
en grandes cantidades. Algunos fabricantes estan incorporando funciones de autoajuste en sus reguladores, que obtienen la informacion a priori que requiere todo especialista para poder ajustar un regulador manualmente, y con ello llegan a realizar un ajuste automatico de los parametros del regulador. Todas las tecnicas adaptativas pueden ser usadas para el ajuste automatico de controladores. En tales aplicaciones, el bucle de adaptacion opera durante un tiempo y puede conmutarse entre este y el controlador jo. Normalmente se a~naden se~nales de perturbacion para mejorar la estimacion de los parametros. El regulador adaptativo esta operativo hasta que el funcionamiento es satisfactorio, entonces el bucle de adaptacion es desconectado y el sistema se deja correr con los parametros jos del regulador. El autoajuste puede ser considerado como un camino conveniente para incorporar modelado y dise~no automatico en un regulador. Simpli ca el uso del regulador y ampla la clase de problemas en que los metodos de dise~no automatico pueden ser usados con un coste razonable. Como se comento en el captulo 2, otra alternativa a los sistemas de control adaptativos son los controladores ajustables por tabla. En muchas situaciones se sabe como cambia la dinamica de un proceso con las condiciones de operacion del mismo. Una fuente de cambio en la dinamica pueden ser las no linealidades que se presentan, es entonces posible cambiar los parametros del controlador observando las condiciones de operacion del proceso. Esta idea recibe el nombre de ajuste por tabla (en la terminologa inglesa, gain sheduling), y consiste en una realimentacion no lineal que cambia los parametros en funcion de las condiciones de operacion de una manera previamente programada. La idea de relacionar los parametros del controlador a variables auxiliares no es reciente, pero el hardware necesario para implementarlo facilmente no ha estado disponible hasta hace poco tiempo. El ajuste por tabla es muy costoso llevarlo a cabo con tecnicas analogicas, sin embargo es facil de implementar en sistemas controlados por computadoras, con un software adecuado. Esta tecnica es muy buena para compensar las variaciones de los parametros del proceso o de no linealidades conocidas. Es controvertido si un sistema con ajuste por tabla puede ser considerado como sistema adaptativo, porque los parametros se cambian en bucle abierto. Es un metodo muy adecuado para manejar las variaciones
Autoajuste y ajuste por tabla de controladores
115
de parametros en sistemas de control de vuelo. A continuacion se van a comentar algunas de las tecnicas de ajuste de controladores que pueden utilizarse para obtener aproximaciones de los procesos dinamicos. Los metodos pueden utilizarse para ajuste automatico de reguladores del tipo PID o como preajustes para algoritmos de control adaptativos mas so sticados. As mismo se comentara la tecnica de ajuste por tabla y se ilustrara mediante algunos ejemplos.
6.2 Control PID Muchos problemas de control pueden ser manejados muy bien mediante controladores PID. Este algoritmo es muy conocido y es un estandar para el control de procesos. La version academica del algoritmo es:
Zt u(t) = Kc e(t) + T1 e( )d + Td de dt i o
!
(6:1)
donde u es la variable de control, e el error de nido como e = r y, donde r es el valor de referencia, e y la salida del proceso. Los algoritmos utilizados actualmente contienen varias modi caciones. Es practica estandar dejar que la accion derivada solo opere sobre la variable de salida. Puede ser ventajoso dejar la parte proporcional actuar solo una fraccion del valor de referencia. La accion derivada es sustituda por una aproximacion que reduce la ganancia en alta frecuencia. La accion integral tambien se modi ca para que no mantenga la integracion cuando la variable de control se sature (anti-windup). Se toman precauciones para que no se produzcan transitorios cuando el regulador se conmuta de control manual a control automatico o cuando los parametros se cambian. Una version razonable del regulador PID puede ser descrita por: donde
u(t) = P (t) + I (t) + D(t)
(6.2)
P (t) = Kc(uc(t) by(t)) dI = Kc (u (t) y(t)) + 1 (v(t) u(t)) dt Ti c Tt Td dD + D = K T dy c d N dt dt
(6.3)
116
Metodos de respuesta transitoria
El ultimo termino en la expresion dI=dt se introduce para mantener la integral limitada cuando la variable de salida se satura. La variable v es una se~nal de seguimiento, la cual es igual a la salida saturada del actuador, y el parametro Tt es una constante de tiempo para la accion de seguimiento. Los parametros esenciales para ser ajustados son Kc, Td y Ti. El parametro N puede ser jo; un valor tpico es N = 10. La constante de tiempo de seguimiento es tpicamente una fraccion del tiempo de integracion Ti.
6.3 Metodos de respuesta transitoria Varios metodos sencillos de ajuste para controladores PID estan basados en experimentos de respuesta transitoria. Muchos procesos industriales tienen una respuesta ante entrada en escalon del tipo mostrado en la gura 6.1. En la cual, la respuesta
63.2 %
28.3 %
t2
t1
L
T
Figura 6.1: Respuesta al escalon unitario de un proceso industrial tpico escalon es monotona despues de un tiempo inicial. Un sistema con una respuesta escalon de este tipo puede ser aproximado por la funcion de transferencia: G(s) = 1 +kTs e sL (6:4) donde k es la ganancia estatica, L el tiempo aparente de retraso, T la constante de tiempo aparente y a es el punto de corte de la tangente con el eje de ordenadas.
Autoajuste y ajuste por tabla de controladores
117
Hay que hacer notar que la distancia desde el origen al corte de la prolongacion de la recta tangente a la curva (a), cumple la relacion,
a = k TL
(6:5)
6.3.1 Metodo de respuesta en escalon de Ziegler-Nichols Una manera simple de determinar los parametros de un regulador PID basada en los datos de respuesta en escalon fue desarrollada por Ziegler y Nichols y publicada en 1942. El metodo usa solo dos de los parametros rese~nados anteriormente, a y L. Los parametros del regulador se dan en la siguiente tabla. Controlador Kc Ti Td P 1/a PI 0.9a 3L PID 1.2/a 2L L/2 La regla de ajuste Ziegler-Nichols fue desarrollada a partir de simulaciones empricas de muchos sistemas diferentes. La regla tiene el inconveniente de que se obtienen sistemas en bucle cerrado que estan pobremente amortiguados. Sistemas con mejor amortiguamiento pueden obtenerse por modi cacion de los valores numericos de la tabla. Mediante el uso de parametros adicionales es posible determinar si la regla de Ziegler-Nichols es aplicable. Si la constante de tiempo T esta determinada, una regla emprica es establecer que la regla de Ziegler-Nichols es aplicable si 0:1 < L=T < 1. Para valores grandes de L=T es ventajoso usar leyes de control que compensan el tiempo muerto. Para valores peque~nos de L=T , puede obtenerse un procedimiento mejorado con compensadores de alto-orden. Es tambien posible usar reglas de ajuste mas so sticadas basadas en los tres parametros.
6.3.2 Caracterizacion de la respuesta en escalon Los parametros k, L y T pueden ser determinados a partir de una construccion gra ca tal como la indicada en la gura 6.1. Tal metodo es difcil de automatizar. El parametro k puede ser obtenido de la relacion de cambios estaticos de entrada
118
Metodos basados en realimentacion con rele
y salida en regimen permanente. Hay un metodo siemple, basado en mediciones de area, para determinar L y T ( gura 6.2). Determinando el area A0 y A1 se tiene:
T + L = Ak0 y T = eAk 1
(6.6) (6.7)
donde e es la base del logaritmo natural. Los inconvenientes esenciales al metodo son que puede ser difcil conocer el tama~no del escalon en la se~nal de control y determinar si se ha alcanzado el regimen permanente. El escalon debera ser del tama~no su ciente como para que la respuesta del sistema sufra variaciones, y no demasiado grande como probocar perturbaciones. 1
k
A0 0.5 A1 0 0
20
40
60
|| || || || || || || || |
80 L+T
100
120
140
160
t
Figura 6.2: Metodo del area para la determinacion de L y T
Re namiento en linea Si se obtiene un ajuste razonable del regulador, el amortiguamiento y la frecuencia natural del sistema en bucle cerrado pueden determinarse a partir de la respuesta transitoria en bucle cerrado, pudiendose mejorar el ajuste del regulador.
6.4 Metodos basados en realimentacion con rele Los principales inconvenientes de los metodos de respuesta transitoria es que son sensibles a las perturbaciones, porque se basan en experimentos en bucle abierto. Los metodos basados en reles evitan esta di cultad porque los experimentos necesarios son ejecutados en bucle cerrado.
Autoajuste y ajuste por tabla de controladores
119
La idea basica es que muchos procesos tendran oscilaciones de ciclo lmite bajo realimentacion con rele. Las propiedades esenciales del proceso pueden determinarse de los parametros del ciclo lmite, y los parametros de un regulador PID pueden por tanto calcularse. La gura 6.3 muestra un diagrama de bloque para la aplicacion de este metodo. Cuando se requiere un ajuste, el conmutador se coloca en la posicion T, lo cual signi ca que la realimentacion por rele es activada y el regulador PID se desconecta. Cuando se alcanza un ciclo lmite, los parametros PID son calculados y el controlador PID es entonces conectado al proceso. Debera usarse en primer lugar un metodo aproximado para hacerse una idea de la informacion que puede obtenerse de un experimento con realimentacion por rele.
- PID r
6
A
-
T
c !c !!
u-
Proceso
y
-
- Rele
Figura 6.3: Diagrama de bloque de autoajuste por rele
6.4.1 El metodo del balance armonico A continuacion se va a comentar un metodo aproximado llamado metodo de balance armonico o el metodo de la funcion descriptiva. Considerando un sistema realimentado simple, compuesto de una parte lineal con la funcion de transferencia G(s) y la realimentacion con un rele ideal. El diagrama de bloques se muestra en la gura 6.4. Se asume que r = 0. Una condicion de aproximacion para las oscilaciones puede ser determinada como sigue: Asumiendo que hay un ciclo lmite con perodo Tu y frecuencia wu = 2=Tu tal que la salida de rele es una onda simetrica periodica cuadrada. Si la amplitud del rele es d, por expansion en serie de Fourier de la salida de rele, se muestra que el primer armonico tiene la amplitud 4d=. Se asume
120
Metodos basados en realimentacion con rele
r
e 6
-
Rele
u-
Proceso
y
-
Figura 6.4: Sistema lineal con control por rele ademas que los procesos dinamicos tienen caracter paso bajo y que la contribucion del primer armonico domina la salida. La se~nal de error tiene entonces la amplitud: (6:8) a = 4d jG(jwu)j La condicion para la oscilacion es tal que: 4d 1 (6:9) argG(jwu) = y Ku = = a jG(jwu)j donde Ku puede interpretarse como la ganancia equivalente del rele para transmision de se~nales sinusoidales con amplitud a. La condicion es ademas que el sistema lineal en la gura 6.4, tenga una curva Nyquist que intersecte el eje real negativo. La amplitud a y la frecuencia de oscilacion wu son facilmente deducibles de la ecuacion 6.9. La frecuencia del ciclo lnmite es ademas automaticamente ajustada a la frecuencia wu en la cual el proceso dinamico en bucle abierto tiene un retraso de fase de 180o. Fsicamente Ku es la ganancia que lleva el sistema al lmite de estabilidad bajo control proporcional. Un experimento con realimentacion por rele dara ademas el perodo y la amplitud de la funcion de transferencia en bucle abierto del proceso en la frecuencia en la cual el retardo de fase es 180o. Hay que hacer notar tambien que una se~nal de entrada cuyo contenido de energa esta concentrado en wu es generada automaticamente en el experimento. Se pueden utilizar varios re namientos o mejoras del metodo. La amplitud de las oscilaciones del ciclo lmite pueden especi carse por introduccion de una realimentacion que ajuste la amplitud del rele. Por otro lado, una histeresis en el rele es util para hacer al sistema menos sensible al ruido. Se va a mostrar a continuacion como determinar los parametros de un regulador PID. El metodo puede ser insensible a las perturbaciones por comparacion y promediado de varios perodos de oscilacion.
Autoajuste y ajuste por tabla de controladores
121
6.4.2 El metodo de Ziegler-Nichols en bucle cerrado Una regla simple para escoger los parametros de los reguladores PID esta idealmente emparejada a la determinacion de Ku y Tu por el metodo del rele. Los valores del controlador estan dados en la tabla adjunta. Estos parametros dan un sistema en bucle cerrado con amortiguamiento bajo. Sistemas con mejor amortiguamiento pueden obtenerse por ligeras modi caciones de los valores de la tabla. Controlador Kc Ti Td P 0.5 Ku PI 0.4 Ku 0.8 Tu PID 0.6 Ku 0.5 Tu 0.12 Tu
Estimaciones mejoradas A partir del experimento del rele se han obtenido solo dos parametros (Ku y Tu). Cambiando el punto de trabajo durante el experimento es posible determinar la ganancia estatica (k) del proceso. El producto kKu puede utilizarse para evaluar si el ajuste del regulador PID mediante las reglas de Ziegler Nichols es adecuado. Si 2 < kKu < 20 entonces puede utilizarse el metodo. Valores mas peque~nos indican que se necesita una ley de control que admita compensacion del tiempo muerto. Valores mas grandes indican que debe utilizarse un algoritmo de control mas complejo.
6.4.3 Oscilaciones de rele Dado que los ciclos lmites con realimentacion por rele es una idea clave de los metodos de autoajuste por rele, es importante comprender por que un sistema lineal oscila en estas condiciones y cuando la oscilacion es estable. Es importante tambien tener metodos para la determinacion del perodo y la amplitud de las oscilaciones. Considerando el sistema mostrado en la gura 6.4, e introduciendo la realizacion en el espacio de estados de la funcion de transferencia G(s):
dx = A x + B u dt y = Cx
(6.10)
122
Metodos basados en realimentacion con rele
El rele puede ser descrito por:
u=
(
d; si e > 0 d; si e < 0
(6:11)
donde e = r - y. A continuacion se va analizar el periodo del ciclo lmite. Para ello asumiendo que el sistema de nido en la gura 6.4 y las ecuaciones 6.10 y 6.11 tiene un ciclo lmite simetrico con perodo T . El perodo T es entonces el valor mas peque~no de T > 0 que satisface la ecuacion, C (I + ) 1 = 0 (6:12) donde = eAT=2 y
=
Z T=2 0
eAsds B
Hay que hacer notar que la condicion de la ecuacion 6.12 puede escribirse tambien como, HT=2( 1) = 0 (6:13) donde HT=2(z) es la funcion de transferencia impulsional obtenida cuando se muestrea el sistema de ecuacion 6.10 con perodo T=2. Habiendo obtenido la formula exacta de la ecuacion 6.12 para T , es posible investigar la precision de la aproximacion de la funcion descriptiva. Considerando el caso simetrico e introduciendo h = T=2. La funcion de transferencia impulsional obtenida cuando se muestrea el sistema de ecuacion 6.10 con perodo h esta dada por: 1 X 1 (1 e h(s+jnws) )G(s + jnw ) Hh(esh) = h1 s n= 1 s + jhws donde ws = 2=h. Haciendo sh = j
+ 2n 2 G j h 1 j ( + 2n ) + 2n 1 X 4 = Im G j =0 h 0 (1 + 2n)
Hh( 1) =
1 X
Autoajuste y ajuste por tabla de controladores
123
El primer termino de la serie da, 4 2 4 Hh( 1) Im G j h = Im G j T = 0 que es el mismo resultado para el calculo de T obtenido del analisis de la funcion descriptiva. Esto implica que la aproximacion de la funcion descriptiva es correcta solo si G(s) tiene un caracter de paso-bajo.
6.5 Ajuste por tabla Algunas veces es posible encontrar variables auxiliares que correlacionan bien los cambios en la dinamica de un proceso. Es entonces posible reducir los efectos de las variaciones de los parametros simplemente cambiando los parametros del regulador como funcion de las variables auxiliares. Mecanismo de Adaptacion r
C
e - Controlador Ajustable 6
-
Medida de la Variable auxiliar u
- Planta
Medio Ambiente y
-
CCW
Figura 6.5: Controlador ajustable por tabla Como se observa en la gura 6.5, el ajuste por tabla puede verser por tanto como un sistema de control realimentado, en el que las ganancias de realimentacion son ajustadas usando una compensacion de prealimentacion. Como ejemplo, en los sistemas de vuelo se usan como variables auxiliares el numero de Mach y la presion dinamica, que pueden medirse mediante sensores. El problema principal en el dise~no de sistemas con ajuste por tabla es encontrar las variables auxiliares apropiadas. Esto se hace normalmente basandose en el
124
Dise~no de reguladores con ajuste por tabla
conocimiento fsico del sistema. En control de procesos, el caudal de produccion puede escogerse frecuentemente como variable auxiliar, puesto que las constantes de tiempo y tiempo de retardo son inversamente proporcional a dicho caudal. Cuando se determinan las variables auxiliares, los parametros del regulador se calculan para un determinado numero de condiciones de operacion, usando algun metodo de dise~no adecuado. El regulador es por tanto sintonizado o calibrado para cada condicion de operacion. La estabilidad y actuacion del sistema son evaluados por simulacion; teniendo una atencion especial a la transicion entre diferentes condiciones de operacion. Algunas veces es posible obtener ajuste por tabla introduciendo las transformaciones no lineales de tal manera que el sistema transformado no depende de las condiciones de operacion. Las medidas auxiliares se usan junto con las medidas del proceso para calcular las variables transformadas. La variable de control transformada se calcula y se retransforma antes de ser aplicada al proceso. El regulador resultante puede considerarse compuesto de dos transformaciones no lineales con un regulador lineal en medio. Otras veces la transformacion se basa en las variables obtenidas indirectamente a traves de estimacion de estados. El ajuste por tabla tiene la ventaja de que los parametros del regulador pueden cambiarse muy rapidamente en respuestas a los cambios del proceso. Puesto que no existe estimacion de los parametros, la limitacion depende de como de rapido responden las medidas auxiliares a los cambios del proceso.
6.6 Dise~no de reguladores con ajuste por tabla Es difcil dar reglas generales para dise~nar este tipo de reguladores. La cuestion clave es determinar las variables que pueden usarse como variables de ajuste. Es claro que estas se~nales auxiliares deben re ejar las condiciones de operacion de la planta. Idealmente tendramos una expresion que relaciona los parametros del regulador con las variables de ajuste. Es necesario por tanto tener una buena informacion de la dinamica del proceso, si se utiliza el ajuste por tabla. Como ideas generales debemos tener en cuenta:
Linealizacion de actuadores no lineales. Ajuste por tabla basado en medida de variables auxiliares.
Autoajuste y ajuste por tabla de controladores
125
Ajuste de tiempo basado en el caudal de produccion. Transformaciones no lineales.
6.6.1 Actuador no lineal Considerando el sistema no lineal de la gura 2.6, comentado en el captulo 2, con un regulador PI cuyo actuador es una valvula con la caracterstica,
v = f (u) = u4; u 0 Sea f^ 1 una aproximacion de la inversa de la caracterstica de la valvula. Para compensar la no linealidad, la salida del regulador se lleva a traves de esta funcion antes de ser aplicada a la valvula.
r
-- PI 6
c-
f^
1
u
- f
v-
Go
y
-
Figura 6.6: Compensacion no lineal del actuador Esto da la relacion,
v = f (u) = f (f^ 1(c))
donde c es la salida del regulador PI. La funcion f (f^ 1(c)) debera tener menos variacion en ganancia que f . Si f^ 1 es la inversa exacta, entonces v = c. Si consideramos que f (u) = u4 puede ser aproximada por dos lineas: una conectando los puntos (0,0) y (1.3,3), y otra conectando este punto y el (2,16), entonces tenemos la gura 6.7. en donde
f
1 (c) =
(
0:433c 0c3 0:0538c + 1:139 3 c 16
126
Dise~no de reguladores con ajuste por tabla
v
20 15 10 5 0 0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
u
Figura 6.7: Caracterstica no lineal de la valvula La gura 6.8 muestra los cambios en la se~nal de referencia en cuatro condiciones de operacion diferentes cuando utilizamos la aproximacion de la inversa de la valvula. Al comparar las respuestas con el sistema sin compensar de la gura 2.7, se observa una considerable mejora en la respuesta del sistema. Con esta mejora es posible hacer al proceso mas insensible a la nolinealidad de la valvula. Este ejemplo nos muestra una idea muy util y simple para compensar no linealidades conocidas. En la practica es a menudo su ciente aproximar la no linealidad mediante unos poco segmentos lineales. Hay varios controladores comerciales que pueden hacer esta clase de compensacion.
6.6.2 Tanque de seccion variable Consideremos un tanque donde la seccion A varia con la altura h. El modelo es, d (A(h)h) = q aq2gh i dt donde qi es el ujo de entrada y a es la seccion de la tubera de salida. Si qi es la entrada y h la salida del sistema, el modelo linealizado en un punto de operacion, qin0 y h0 , viene dado por la funcion de transferencia, G(s) = s + donde = A(1h0)
Autoajuste y ajuste por tabla de controladores
127
0.4 0.3 0.2 0.1 0 0
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
1
0.5
0 0
6
4
2
0 0
10
5
0 0
Figura 6.8: Respuesta a escalon del sistema compensado
128
Dise~no de reguladores con ajuste por tabla
Un controlador PI del tanque viene dado por, Z 1 u(t) = K e(t) + T (e )d i donde K = 2! y Ti = 2!!2 Esto nos da un sistema de bucle cerrado con una frecuencia natural ! y un amortiguamiento relativo . Introduciendo las expresiones de y se tiene el siguiente controlador ajustable por tabla, 0 K = 2!A(h0) 2qhin0 0 Ti = 2! = 2A(hq0in)h0 !2 Los valores numericos son frecuentemente tal que 2!, por lo que las expresiones pueden simpli carse entonces a:
K = 2!A(h0) Ti = 2! En este caso, es por tanto su ciente hacer la ganancia proporcional a la seccion del tanque. En la gura 6.9 se muestra la respuesta de este regulador para un tanque piramidal con seccion variable igual a hl. Este ejemplo pone de mani esto que algunas veces se pueden medir una o dos variables en un proceso y usarlas como entradas para el ajuste de la ganancia. Frecuentemente no es tan facil como aparece en este ejemplo, determinar los parametros del controlador como funcion de las variables medidas. El dise~no del regulador debe entonces rehacerse para diferentes puntos de trabajo del proceso. Tambien debe tenerse cuidado con las se~nales que se miden por si tienen ruidos, en este caso pueden ltrarse antes de ser utilizadas como variables de ajuste.
Autoajuste y ajuste por tabla de controladores
129
1 0.9 0.8 0.7 0.6 0.5 0
10
20
30
40
50
60
70
80
90
10
20
30
40
50
60
70
80
90
0.7 0.6 0.5 0.4 0.3 0
Figura 6.9: Respuesta del sistema en diferentes puntos de trabajo
6.6.3 Transformacion no lineal Es de gran interes encontrar las transformaciones que hacen al sistema transformado lineal e independiente de las condiciones de operacion. En algunos procesos esto puede hacerse mediante escalas de tiempos. Todos los procesos asociados con el
ujo de material tienen esta propiedad: molinos rodantes, bandas transportadoras,
ujo en tuberas, etc. Un sistema de la forma
x(t) = f (x(t)) + g(x(t))u(t) puede ser transformado en un sistema lineal, con tal de que todos los estados del sistema puedan ser medidos y darse las condiciones de observabilidad generalizada. El dise~no se hace en primer lugar transformando el sistema en un sistema lineal jo. La transformacion es generalmente no lineal y depende de los estados del proceso. Entonces se dise~na un regulador para el modelo transformado, y las se~nales de control del modelo son retransformadas en las se~nales de control originales. El resultado es un controlador no lineal de tipo especial, que puede ser interpretado
130
Dise~no de reguladores con ajuste por tabla
como un controlador de ajuste por tabla. El controlador se construye a partir del conocimiento acerca de las no linealidades en el modelo.
Transformacion no lineal de segundo orden Consideremos el sistema,
dx1 = f (x ; x ) 1 1 2 dt dx2 = f (x ; x ; u) 2 1 2 dt
Supongamos que las variables de estado pueden ser medidas y que queremos encontrar una realimentacion tal que la respuesta de la variable x1 a al se~nal de mando viene dada por la funcion de transferencia, !2 G(s) = s2 + 2&!s (5) (6:14) + !2 Introduciendo nuevas coordenadas z1 y z2 de nidas como, z1 = x1 1 z2 = dx dt = f1 (x1 ; x2) y la nueva se~nal de control v, de nida por v = F (x1; x2 ; u) = @@((xf1 )) f1 + @@((xf1 )) f2 (6:15) 1 2 De estas transformaciones resulta un sistema lineal, dz1 = z 2 dt dz2 = v (6.16) dt Facilmente se observa que la realimentacion lineal v = !2(uc z1 ) 2&!z2 (6:17) da la funcion de transferencia en bucle cerrado (6.14) de uc a z1 = x1 para el sistema lineal de la ecuacion (6.16), se continua para transformar a las variables originales. De las ecuaciones (6.15) y (6.17) se tiene para las variables originales: v = F (x1 ; x2; u) = !2(uc x1 ) 2&!f1(x1 ; x2)
Autoajuste y ajuste por tabla de controladores
131
Resolviendo esta ecuacion para u se obtiene la realimentacion deseada. Del teorema de la funcion implcita, una condicion para la solucion local es que la derivada parcial @F @u sea diferente de cero. La generalizacion del ejemplo requiere una solucion al problema general de transformar un sistema no lineal en uno lineal mediante realimentacion no-lineal. Una version simple del problema tambien se da en el control de robots industriales. En este caso la ecuacion basica puede escribirse como
J ddt'2 = Te 2
donde J es el momento de inercia, ' un angulo de una union, y Te un par que depende de la corriente del motor, los angulos de par, y sus dos derivadas. Las ecuaciones son por tanto de la forma considerada y la realimentacion no lineal se obtiene determinando las corrientes que dan el par deseado. El problema se llama transformacion de par.
132
Dise~no de reguladores con ajuste por tabla
Captulo 7 Aplicacion de control adaptativo 7.1 Introduccion Desde la introduccion del regulador autoajustable (self-tuning) por Astrom y Wittenmark (1973), han aparecido en la literatura muchos trabajos, poniendo de mani esto las propiedades del control adaptativo (Astrom, 1983 y Landau, 1974). Estos trabajos son en su mayor parte teoricos y aunque se han realizado algunas aplicaciones (Borisson 1976, Buchholt 1979, Kallstrom 1979, Narendra 1980, Dumont 1982, Rubio 1982, etc.), todava no esta bien aceptado a nivel industrial. En este captulo se presenta una aplicacion de un controlador adaptativo al control de la temperatura de salida en un campo de colectores distribuidos de una Central Electrica Termosolar (CETS). Desde hace algun tiempo y fundamentalmente tras la crisis energetica, se ha puesto de mani esto un creciente interes por el aprovechamiento de fuentes energeticas no exploradas hasta ahora, o que lo han sido insu cientemente. Tal es el caso de la energa solar, siendo una de las mas prometedoras las plantas electricas termosolares. Las Centrales Electricas Termosolares, son sistemas empleados para obtener la energa electrica a partir de la energa solar mediante la transformacion previa de esta en energa termica. El dise~no de este tipo de centrales no comienza hasta 1977 (Ruz y Gomez 1982), y no es hasta 1981 cuando se ponen en marcha las primeras.
133
134
Descripcion de la planta
La diferencia fundamental entre una planta convencional y una planta solar, es que la energa primaria no puede ser manipulada por el hombre, es intermitente y cuando se tiene, resulta cara de transformar. Por todo ello, en una planta solar se requiere un so sticado sistema de control capaz de mantener unas especi caciones mas rigurosas que un control clasico. Fundamentalmente existen dos tipos de CETS, segun el numero de componentes que transforman la energa solar en termica, si es solo uno, se denominan sistemas de receptor central (CRS) y si cada captador dispone de su propio dispositivo de transformacion, se denominan sistemas de colectores distribuidos (DCS). Esta aplicacion se centrara en las CETS de colectores distribuidos y particularmente en el sistema de control necesario para conseguir un aprovechamiento optimo de la energa disponible.
7.2 Descripcion de la planta La central en concreto a la que se ha aplicado el control adaptativo, es la planta SSPS situada en el municipio de Tabernas (Almera). En dicha planta se dispone de un campo de captadores cilindroparabolicos con seguimiento solar en elevacion del tipo ACUREX. Una fotografa de este campo puede verse en la gura 7.1. Los tubos receptores, situados en la lnea focal, emplean el ujo solar concentrado para calentar un aceite termico, proviniente de la parte inferior de un tanque de almacenamiento por estrati cacion termica a cuya parte superior es devuelto el aceite una vez aumentada su temperatura. El tanque esta conectado a varios sistemas para utilizar la energa almacenada en el. Tambien aprovechando el principio de estrati cacion termica, para lo cual el aceite se toma caliente de la parte superior y se devuelve fro a la inferior. Un diagrama simpli cado del campo de colectores solares puede verse en la gura 7.2. Como puede comprenderse, las condiciones ambientales a que esta sometida una CETS son en general distintas de las condiciones de dise~no mencionadas. Por su propia naturaleza, la disponibilidad de energa solar depende de la fecha y hora, de las condiciones meteorologicas y demas perturbaciones existentes. La planta esta sometida a perturbaciones en la energa de entrada, que pueden ser lentas, debidas a variaciones de insolacion a la largo de un da claro, o bien bruscas, causadas fundamentalmente por la aparicion de nubes y por variaciones de la temperatura de entrada al campo en la puesta en marcha del sistema de conversion
Aplicacion de control adaptativo
135
Figura 7.1: Campo de colectores distribuidos ACUREX
Campo acurex
Tanque Almacenamiento p
@ 6
@
p
p
p
6 -
Bomba
XXX
H H A
Buer
? 6
H H
Hacia Generador Vapor o Planta Desalinizadora
Figura 7.2: Diagrama esquematico del campo de colectores
136
Modelo dinamico del campo
de potencia. Todas estas perturbaciones nos obligan a variar continuamente el ujo de control, lo que a su vez provoca que el tiempo de residencia del uido en el campo sea variable. De todo lo expuesto, se desprende que el proceso a controlar es un sistema fuertemente no-lineal con retardo variable en el tiempo, y por tanto desde el punto de vista de control, en el que se considera un modelo lineal, sera un proceso con parametros variables y retardo tambien variable.
7.3 Modelo dinamico del campo Con el objeto de poder evaluar mas facilmente y con mas rapidez los distintos controladores posibles, es de interes disponer de un modelo dinamico de la planta, que permita simular una gran variedad de comportamientos as como de perturbaciones. En un primer paso se dise~no un modelo concentrado simpli cado del campo, pasandose posteriormente a un modelo de parametros distribuido que permite tener una mayor exactitud del comportamiento del campo.
7.3.1 Modelo concentrado Supuesta una representacion concentrada de la planta, el cambio de energa interna del campo puede ser dada por: _ C dT (7:1) dt = No RI V Pcp(T Ti ) Hl (Tm Ta) El producto Pcp es una funcion de la temperatura y puede ser aproximado a 1924 KJ/l o C . A partir de los datos experimentales el coe ciente de perdidas termicas es de 1.05 Kw/ oC . Para identi car el resto de los parametros pueden utilizarse varios metodos, sometiendo al campo a varios tests. En este caso se ha sometido al campo a una se~nal cuadrada y los datos tomados se han utilizado para ajustarlos al modelo dado anteriormente, mediante un metodo de mnimos cuadrados conocido como el metodo de Powell (Camacho 1977). Del resultado de la identi cacion, se estima el parametro C=2267 Kw/ oC y NoR = 1322m2.
Aplicacion de control adaptativo
137
7.3.2 Modelo distribuido El campo Acurex esta formado por colectores solares distribuidos del tipo Acurex, modelo 3001. Estos colectores son parabolicos y con seguimiento del sol en un solo eje (elevacion). El campo esta dispuesto en 20 las de colectores, las cuales forman 10 lazos paralelos. En total en el campo hay 480 modulos orientados de este a oeste y la super cie total de espejos es 2674 m2 . Los tubos receptores, situados en la lnea focal, emplean el ujo solar concentrado para calentar un aceite termico, proveniente de la parte inferior de un tanque de almacenamiento por estrati cacion termica a cuya parte superior es devuelto el aceite caliente. El tanque puede almacenar, en el punto de dise~no, 2.7 Mwth de energa en aceite termico proveniente de los campos de colectores distribuidos. El tanque esta conectado con un generador de vapor o una planta desalinizadora, tambien aprovechando el principio de estrati cacion termica. El aceite se toma a elevada temperatura de la parte superior del tanque, se enfra al ceder su calor, y se devuelve frio a la parte inferior. El colector Acurex posee una super cie parabolica para concentrar la radiacion solar directa sobre el tubo receptor, que esta localizado en la zona focal de la parabola. El aceite termico es bombeado a traves de la tubera receptora y recoge el calor transferido a traves de las paredes del tubo. El sistema esta provisto con un sistema de seguimiento del sol que mueve los espejos alrededor de un eje paralelo a aquel en el que se situa la tuberia. El mecanismo de seguimiento puede alcanzar tres posibles estados:
Seguimiento ('track'): El mecanismo sigue el sol y los colectores enfocan sobre la tuberia.
Desenfocado ('desteer'): El mecanismo sigue el sol, pero desenfoca el colector varios grados, de forma que el tubo receptor se situa fuera de la zona focal y el uido no se calienta.
Bocabajo ('stow'): El mecanismo lleva al colector a una posicion invertida, no existiendo nigun tipo de seguimiento del sol. A este estado se llega al nal del da o si una alarma grave se produce.
Un bucle ACUREX esta formado por cuatro colectores de doce modulos, conectados en serie de forma apropiada. El bucle tiene 172 m. de longitud, siendo de 142
138
Modelo dinamico del campo
m. la parte activa del bucle y el resto 30 m. pasiva. Debido a la complejidad del sistema y a la existencia de no-linealidades, se ha desarrollado un modelo numerico para la simulacion de dicho sistema, habiendose hecho las siguientes hipotesis:
Las propiedades del aceite son consideradas como funciones de la temperatura, varian con el tiempo y el espacio.
El ujo incidente de calor en cada seccion se supone que es circunferencialmente uniforme e igual al valor medio.
Las variaciones de temperatura radial en la pared del tubo son despreciadas.
Esta suposicion es razonable para una pared na que tiene una buena conductividad termica.
El ujo de aceite y la irradiancia son consideradas como funciones del tiempo
y en cada instante son las mismas en cada momento. (Se supone uido incomprensible).
Las perdidas por conduccion de calor axial en ambos lados de la pared y del
uido son despreciadas. La conduccion axial en el tubo debe ser peque~na ya que la pared es na, teniendo una alta resistencia termica. En el uido la conduccion axial es relativamente peque~na porque la conductividad del aceite es pobre.
Con las hipotesis anteriores y aplicando la conservacion de la energa en el tubo de metal de un volumen de control de longitud dx sobre un intervalo de tiempo dt, se tiene: m CmAm @T@tm = InoD HlG(Tm Ta ) LHt (Tm Tf ) (7:2) Similarmente para un elemento de uido: f f Cf Af @T + f Cf V_ @Tf = LHt (Tm Tf ) @t @x
(7:3)
En la ecuaciones anteriores el subndice m se re ere al metal y el f al uido y:
c A T
= = = =
densidad calor espec co area transversal temperatura
Aplicacion de control adaptativo
I no H1 D Ht G L V_
= = = = = = = =
139
irradiacion coe ciente de re ectividad funcion de las peerdidas metal-ambiente anchura espejos coe ciente de transmision metal uido Diametro exterior del tubo Diametro interior del tubo caudal de aceite
Las ecuaciones que describen el comportamiento en un elemento pasivo son similares, excepto que la entrada de energa solar es cero y el coe ciente de perdidas es mucho menor. Estas ecuaciones han sido resueltas utilizando un procedimiento iterativo en diferencias nitas. Las temperaturas del uido y del tubo absorbedor son calculadas para cada intervalo de tiempo y para cada elemento de longitud. La longitud de cada segmento es de 1 m y el intervalo de integracion es de 0,5 segundos. Este intervalo de integracion se ha elegido como un compromiso entre el tiempo de calculo necesario y la precision obtenida. Se ha elegido un algoritmo en dos etapas para resolver las ecuaciones de las temperaturas. En la primera etapa se calculan las temperaturas del uido y del metal suponiendo que el uido este en regimen estacionario. En la segunda etapa la temperatura del uido es corregida en funcion de la energa neta transportada por el uido.
1a Etapa Tm (n; k) = Tm (n; k 1) + R Ct A (InoD Hl G(Tm (n; k 1) Ta ) m m m LHt1 (Tm (n; k 1) T1f (n; k 1)) Tf (n; k) = T1f (n; k 1) + RHtC1 At (Tm (n; k 1) T1f (n; k 1)) f f f 2a Etapa t (T (n; k) T (n 1; k)) T1f (n; k) = Tf (n; k 1) AV f f f x
140
Control en adelanto
En estas ecuaciones en diferencias, Tf (n; k) y Tm (n; k) son las temperaturas en el segmento n durante el intervalo de tiempo k. T1f es la temperatura del uidos antes de la correccion mientras que Tf es la temperatura del uido despues de la correccion. A partir de datos reales de la planta se han determinado las distintas constantes y coe cientes que aparecen en las ecuaciones anteriores, siendo ajustados muchos de ellos a funciones polinomiales de la temperatura, mediante un metodo de mnimos cuadrados.
7.4 Control en adelanto A partir de la representacion concentrada de la planta, ecuacion 7.1, se tiene en el regimen permanente: l (Tm Ta ) V_ = No RIPc (H p Tr Ti ) Esta ultima ecuacion puede ser aproximada por:
V_ = K1TRI TK2 r i Esta expresion constituye el calculo del ujo como funcion de la temperatura de referencia, temperatura de entrada, re ectancia y de la irradiancia, siendo utilizada para el control en adelanto (feedforward). Las constantes K1 y K2 , han sido determinadas experimentalmente, teniendo los valores de K1 = 0:93 y K2 = 155 (Carmona, 1983).
7.5 Control en bucle cerrado Es necesario compensar el error que pueda producirse mediante un regulador en bucle cerrado. Dado que el ujo calculado en bucle abierto, es una buena estimacion, el valor de la se~nal de control del bucle cerrado se ha saturado a mas, menos un 20% del valor de bucle abierto, con ello se consigue mejor estabilidad en los transitorios, ya que se ha reducido la banda de regulacion.
Aplicacion de control adaptativo
temp. entrada (Tin)
3 eP.I. - 6
? ?
Tref-
Mecanismo Adaptacion
141
u - Compensacion us
Serie
?
Radiacion
? ? - Planta
Identi cador
To = y-
?
Figura 7.3: Estructura de control con compensacion serie
7.5.1 Controlador PI La planta en consideracion presenta un retardo muy grande (del orden de 2 a 8 minutos), y variable con el ujo de entrada. Para este tipo de sistemas en que el retardo es mucho mayor que el orden del sistema, puede considerarse (Isermann, 1981) un tipo particular de controlador. Suponiendo que la planta se modela por la ecuacion y(k) = bu(k d), donde d es el retardo en perodos de muestreo y b la ganancia del sistema, el controlador que resulta por control en tiempo mnimo tiene por expresion: u(k) = u(k d) + e(k)=b (7:4) Si en vez de utilizar este controlador directamente, se aproxima un regulador P.I. para que tenga la misma respuesta, se obtiene: u(k) = u(k 1) + qoe(k) + qie(k 1) (7:5) donde : qo = 1=(2b) qi = qo (d 2)=d (7.6) Para este regulador, puede demostrarse (Isermann, 1981), que es menos sensible al error en la exactitud del retardo, por ello resulta mas conveniente su utilizacon
142
Control en bucle cerrado
que el controlador 7.4, dada las caracteristicas del proceso. Por todo ello en el bucle de realimentacion se ha utilizado un P.I. Tambien ha de tenerse en cuenta que cuando exista un error en la determinacion del retardo, es mejor considerarlo mayor del que se prevea, en orden a asegurar la estabilidad.
7.5.2 Controlador PI por asignacion de polos Desde el punto de vista de dise~no del controlador adaptativo autoajustable, el proceso puede modelarse como un sistema de primer orden, que relaciona los cambios en el ujo de aceite con la temperatura de salida. Observando la respuesta al escalon obtenida de la planta, indica que en tiempo contnuo, puede aproximarse por una funcion de transferencia de primer orden con un retardo: (7:7) g(s) = (1 +Ks) e sd El retardo d , constante de tiempo y ganancia K del sistema varia con el ujo de aceite y en el punto de operacion a bajo ujo el retardo es aproximadamente el doble que el retardo a ujo maximo. Puede verse (Rubio 1989), que un camino para adaptar esta variacion en el tiempo de retardo es usar un modelo de la forma, bo + b1 z 1 ) z 2 g(z) = ((1 (7:8) az 1 ) El perodo de muestreo se escoge igual al tiempo de retardo mnimo. De esta forma el mnimo retardo esta representado por el modelo con el parametro b1 = 0. Cuando b0 = 0, el modelo representa el maximo tiempo de retardo de dos perodos. Para los valores del tiempo de retardo donde d no sea un multiplo entero del perodo de muestreo, por ejemplo T < d < 2T , el factor (bo + b1 z 1 ) actua como una aproximacion discreta de Pade de primer orden del retardo. Basado en este modelo se dise~na el siguiente algoritmo autoajustable por asignacion de polos. La funcion de transferencia de un controlador PI viene dada por: g1 z 1 ) k(z) = go(1 (1 z 1 )
(7:9)
Escogiendo el cero del controlador que cancele el polo de la planta, o sea haciendo a = g1, El polinomio caracterstico en bucle cerrado, P (z), es de la forma: P (z) = z3 z2 + goboz + gob1
Aplicacion de control adaptativo
143
Si al sistema en bucle cerrado se le especi ca que tenga un polo en z = A, entonces del polinomio caracterstico P (z) evaluado en A, se deduce que go hay que elegirlo tal que: 2 (1 A) go = A (7:10) (bo A + b1) Entonces conociendo a; bo and b1 del modelo, los parametros del controlador go y g1 pueden calcularse especi cando un polo dominante en bucle cerrado en z = A. Analizando P(z) puede deducirse la localizacion de los otros dos polos del sistema. P (z) = [z2 (1 A)z + gobo A(1 A)](z A) A partir del lugar de las raices del sistema, se tiene que aparte del polo en z = A, el sistema tendra otros dos polos reales, uno negativo y otro positivo. Resolviendo P(z) se puede validar la localizacion de estos polos, comprobandose que efectivamente corresponden a modos que decaen rapidamente y que el polo en z = A es el polo dominante. Algunos valores tpicos de simulaciones han sido:
A g0 0:9 a 1:539 0:95 a 1:2398
g1 1:3851 1:1778
Los coe cientes del regulador g0 y g1 se saturan para evitar sobreoscilaciones en las ocasiones en que el identi cador no funcione correctamente, debido al paso de nubes u otras perturbaciones.
7.5.3 Controlador autoajustable Se ha desarrollado un algoritmo de control adaptativo autoajustable, version explcita mediante el metodo de asignacion de polos desarrollado en la seccion anterior. Los parametros del modelo del sistema se determinan en lnea mediante el metodo de mnimos cuadrados recursivos. El algoritmo de estimacion de parametros incorpora factorizacion UDU (Bierman 1977) y factor de olvido variable (Fortescue 1981). La funcion de transferencia en z del modelo puede representarse mediante la ecuacion en diferencias de la forma: y(n) = a y(n 1) + bo u(n 2) + b1 u(n 3) + d
144
Control en bucle cerrado
El termino d es una constante introducida para tener en cuenta los valores medios de las se~nales de entrada y salida. Las perturbaciones del sistema son tales que puede emplearse un modelo determinista. Desde el punto de vista de la identi cacion el sistema anterior tiene cuatro parametros a determinar: [a bo b1 d]. Un rasgo particular del sistema es que se necesita incluir un termino de adelanto en el bucle de control. El modelo de la planta descrito esta basado en la relacion entre los cambios de la temperatura de salida y los cambios en el ujo de aceite. Pero la temperatura de salida de la planta esta in uida por los cambios de otras variables del sistema, tales como, la irradiancia solar y la temperatura de entrada del aceite. Si cualquiera de estas variables cambia durante la fase de indenti cacion, ello introduce un cambio en la salida del sistema que no esta motivado por cambios en el ujo, por que las variaciones que se produciran en los parametros estimados seran innecesarias y el modelo se desajustara. Dado que la irradiacion solar y la temperatura de entrada pueden medirse, este problema puede reducirse mediante la incorporacion de un termino de adelanto, calculado para las condiciones de regimen permanente, el cual realiza un ajuste en el ujo de entrada, encaminado a eliminar el cambio en la temperatura de salida causado por la variacion en la irradiancia solar y la temperatura de entrada. Si el termino en adelanto fuese perfecto los cambios en la temperatura de salida solo serian debido a los cambios en la se~nal de entrada. Evidentemente la eliminacion exacta de estos cambios es imposible, pero este termino reduce considerablemente los mayores problemas inherentes en el modelo planteado y permite una mejor identi cacion de los parametros de este. La se~nal del termino en adelanto tambien produce bene cios cuando hay pertubaciones en la irradiancia solar y en la temperatura de entrada, pero la principal razon para incluir este termino es para preservar la validez del modelo del sistema asumido en el algoritmo de control adaptativo autoajustable.
7.5.4 Controlador PID adaptativo Se ha realizado un desarrollo teorico paralelo al del regulador P.I. por asignacion de polos con el n de ensayar un regulador P.I.D. adaptativo. La funcion de transferencia en el dominio del tiempo puede escribirse:
Aplicacion de control adaptativo
145
Gpid(s) = Kpid(1 + T1s + Td s) i
Para pasar al dominio discreto se utiliza la aproximacion de Euler para el termino integral y la rectangular hacia detras (Backward) para el derivativo (Astrom 1984).
uk = Kpid(1 + T (zTm 1) + ( Td Td )( z T1d )) Tm + N z (NTm +Td ) i eik = z 1 1 ek edk =
z
z 1
ek Td (NTm +Td )
Para calcular los parametros caractersticos (ganancia del controlador, tiempo integral y derivativo) se han utilizado las reglas de Ziegler-Nichols (Z-N) en bucle abierto. Los dos mecanismos de adaptacion usados han sido: 1. Usar tiempos integral y derivativo jos, adaptando solo la ganancia del controlador (dado que no se puede con un modelo del sistema de primer orden estimar el retardo puro), pero tomandola un cuarto (para evitar comportamiento oscilatorio) de la usada por el metodo de Z-N en bucle abierto. 2. Se adapta la ganancia, tiempo integral y derivativo a~nadiendo un cero a la funcion de transferencia para estimar un retardo variable, como se indica en (Camacho 1992). b0 + b1 z 1 ) g(z) = z 2 ((1 az 1 ) Dado que el perodo de muestreo se escoge igual al mnimo valor del retardo, este se representa en el modelo con b1 = 0. Cuando b0 = 0 el modelo tiene un retardo maximo de dos perodos de muestreo. Para valores del retardo no multiplos enteros del perodo de muestreo, el numerador actua como una aproximacion discreta de Pade a un retraso.
146
Control en bucle cerrado
7.5.5 Controlador predictivo generalizado En esta seccion se expone un metodo sencillo para aplicar GPC adaptativo. Una descripcion detallada del metodo puede encontrarse en (Camacho 1993, 1994, 1995). Este metodo simpli cado disminuye la complejidad de calculos que hay que realizar a la hora de aplicar un controlador predictivo adaptativo. El metodo hace uso del hecho de que un controlador predictivo generalizado da lugar a una ley de control con pocos parametros. Estos parametros pueden ser calculados en el rango de interes de los parametros del proceso. Se usa una funcion que aproxima los parametros reales del controlador y que implica menor esfuerzo computacional. Como se vio en el apartado 5.6, este controlador minimiza una funcion de coste de la forma: N2 X
J (N1 ; N2; N3) = E f
j =N1
(j )[^y(t + j j t) w(t + j )]2 +
N3 X
j =1
(j )[4u(t + j 1)]2g (7:11)
De acuerdo con el metodo descrito en (Camacho 1993,1995) y los requerimientos para control adaptativo se escoge un modelo CARIMA. (7:12) A(z 1 )y(t) = B (z 1 )u(t 1)z d + C (z 1 ) "(t)
4
que para el caso concreto que nos ocupa, A; B y C son los polinomios: A(z 1 ) = 1 az 1 ; B (z 1 ) = b ; C (z 1 ) = 1 Con d = 1. Este esquema permite accion integral para eliminar osets en la se~nal de salida. "(t) (1 az 1 )y(t) = bz 1 u(t 1) + (7:13)
4
Considerando el retardo d, se escogen N1 = d + 1, N2 = d + N y N3 = N . En nuestro caso N1 = 2 y N2 = 16. El rango de posibles valores de se ha obtenido via simulacion (Camacho 1995) y es (3 7). Si disminuye se obtienen controladores mas rapidos. Si y^(t + j j t) y y^(t + j 1 j t) son conocidas, como las componentes de los ruidos estan todas en el futuro, el mejor valor esperado para y^(t + j + 1 j t) viene dado por: y^(t + j + 1 j t) = (1 + a)^y(t + j j t) ay^(t + j 1 j t) + b 4 u(t + j 1) (7:14)
Aplicacion de control adaptativo
147
Como se deduce en (Camacho 1995), si la secuencia de referencias futuras, w(t + j ), no se conoce y se considera igual a la referencia actual r(t), el incremento de control 4u(t) puede escribirse como:
4 u(t) = l1 y^(t + 1 j t) + l2 y(t) + l3 r(t)
(7:15)
15 15 Donde qP = [l1l2 ] y l3 = P qj P rij .
i=1
j =1
Si las referencias futuras fueran conocidas l3 = qR sera un vector de ganancias que las multiplicaria. Los coe cientes l1 , l2, l3 ; son funciones de a; b, (i) y (i). Si se dise~na el GPC considerando que la planta tiene ganancia estatica unidad, los coe cientes en (7.15) dependeran solo de (i) y (i) (que se suponen jos) y del polo de la planta que variara en el caso de control adaptativo. Haciendo esto, se usa una secuencia de ponderacion normalizada que se corregira de forma adecuada en sistemas con ganancia estatica distinta de la unidad. El valor de y^(t + 1 j t) se obtiene usando el predictor descrito en (7.14). El esquema de control propuesto puede verse en la gura 7.4. Los parametros estimados de la planta se usan para calcular los parametros del controlador (l1; l2 ; l3) via un mecanismo de adaptacion. Solar radiation Inlet oil temperature
r(t)
l3
+ + +
1 - a^ b^
+ +
FEED PLANT
y(t)
FORWARD
-1 Z IDENT b^
^a ADAPT
l2
PREDICTOR
l1
Figura 7.4: Esquema de control adaptativo La forma estandar de calcular los parametros del controlador sera calculando una serie de matrices y resolviendo una ecuacion matricial seguido de la generacion de la ley de control de la ecuacion (7.15). Esto trae consigo la triangularizacion de una matriz N N , que es prohibitivo en aplicaciones en tiempo real.
148
Control en bucle cerrado
Como se sugiere en (Camacho 1993, 1994), los coe cientes del controlador se pueden calcular por interpolacion en un conjunto de valores conocidos previos. En el libro (Camacho 1995), se calculan estos coe cientes para (i) = 1, (i) = 5 y N = 15. El polo del sistema se cambia en pasos de 0.0005 de 0.85 a 0.95, que son los valores que garantizan la estabilidad del sistema si la identi cacion de los mismos no es muy precisa. Es importante rese~nar que como la ganancia del bucle cerrado debe ser igual a la unidad, la suma de los tres parametros debe ser cero, y por tanto solo dos de ellos deben ser conocidos. En el caso de (i) = 5, (i) = 1 y para un horizonte de control de 15 los coe cientes del controlador vienen dados por:
l1 = 0:4338 0:6041^a=(1:11 a^) l2 = 0:4063 + 0:4386^a=(1:082 a^) l3 = l1 l2
(7.16)
Estas expresiones dan una buena aproximacion de los parametros reales del controlador (error inferior al 0.6 por ciento). En cada perodo de muestreo el controlador adaptativo debe realizar los siguientes pasos ( gura 7.4): 1. Estimar los parametros del modelo lineal a partir de entradas y salidas de la planta. 2. Ajustar los parametros del controlador usando las expresiones obtenidas para li (ecu. 7.16). 3. Calcular y^(t + d j t) usando el predictor (ecu. 7.14). 4. Calcular la se~nal de control usando (ecu. 7.15). 5. Supervisar el perfecto funcionamiento del control.
7.5.6 Supervision Un requerimiento basico del algoritmo de control adaptativo es que el bucle cerrado es estable si los parametros estimados convergen a ciertos valores. Para garantizar
Aplicacion de control adaptativo
149
dicha convergencia deben cumplirse ciertas condiciones, las cuales dependen del tipo de perturbaciones y de si la entrada es lo su cientemente rica. Como se ha comentado se pueden conseguir una serie de mejoras en el comportamiento del sistema en bucle cerrado si paralelamente al algoritmo se mantiene un cierto nivel de supervision que chequee los parametros fundamentales del proceso:
los parametros estimados. La variable de control. La evolucion del identi cador. En el caso concreto de la planta solar las medidas tomadas son las siguientes: 1. En cuanto a la identi cacion de la planta, sabemos que la ganancia del sistema es negativa e inferior a un cierto valor. Por ello la ganancia identi cada es ltrada antes de considerarla como valida, para evitar una identi cacion erronea, que se puede producir en los casos en que la irradiancia (principal parametro de la planta que vara), disminuye y por tanto la ganancia identi cada aparentemente sera positiva, dado que a una disminucion de ujo le correspondera una disminucion de temperatura. ^b(k) < Co y ^bf (k + 1) = r^bf (k) + (1 r)^b(k + 1) El identi cador trabaja con las variaciones de temperatura y ujo con respecto a los valores de regimen permanente, estando dados estos valores por la temperatura de referencia y por el ujo calculado por el controlador en adelanto. Mas concretamente, el polo estimado del sistema en bucle abierto debe variar entre 0.85 y 0.95 y la ganancia estatica del sistema entre 0.9 y 1.2. Estos margenes se han escogido analizando la respuesta dinamica del sistema, y son necesarios pues si se produce una estimacion erronea de los parametros puede llegar a hacerse inestable el proceso. La temperatura de referencia para el control por adelanto se ltra antes de ser usada por el identi cador para cancelar dinamicas no modeladas. Este ltro es de la forma:
tfff = 0:5 tff + 0:5 tfff
150
Estudios de simulacion
donde tff es la temperatura de referencia para el controlador por adelanto calculada por el regulador del sistema en bucle cerrado (predictivo, etc.) y tfff es la temperatura de referencia al control por adelanto ltrada, que es la que se da como entrada al identi cador. 2. La traza de la matriz de covarianza del identi cador es chequeada en cada instante, acotandola de la forma, Traza de P (k) < Po =) P (k) = P (k) + R 3. La variable de control esta saturada en mas o menos un 20% del valor de
ujo calculado en bucle abierto (feedforward). Ademas se utiliza un control PI cauteloso al comienzo del control, modi cando la expresion 7.6 por: 1 qo = (2 b + traza (P (k)) b) 4. Como se ha comentado el mecanismo de estimacion de parametros solo funciona cuando la se~nal de entrada contiene su ciente informacion dinamica. Estas consideraciones pueden tenerse en cuenta chequeando el cumplimiento de las siguientes condiciones: j 4u j A kX =0
k= N
j 4u(k) j B
Si una de estas condiciones es verdadera, se activa el identi cador. En otro caso se usa el ultimo conjunto de parametros identi cados. Los valores tpicos de A, B y N escogidos en simulacion son: A = 9, 7 B 9 y N = 5. 5. Respecto a los mecanismos de adaptacion, solo funcionan cuando los valores estimados se encuentran contenidos en los rangos (0:85 a^ 0:95 y 0:9 k^est 1:2, donde k^est es la ganancia estimada de la planta ^b=(1 a^)) para evitar inestabilidad en casos de no convergencia del estimador. Un controlador jo se usa en situaciones en que no se cumplen estas condiciones (por ejemplo en el comienzo de la operacion).
7.6 Estudios de simulacion Se han realizado estudios de simulacion para evaluar la capacidad del modelo, la identi cacion de los parametros y la actuacion del controlador autoajustable. El controlador se ha evaluado mediante el modelo no lineal desarrollado.
Aplicacion de control adaptativo
151
950
295 285
750
700
280
650
600
10
11
12
13
14
15
16
17
277
Tiempo (Horas)
Figura 7.5: Respuesta simulada a cambios de referencia con compensacion serie La gura 7.5 corresponde a la simulacion de un perodo de 8 horas con radiacion solar en forma senoidal con una se~nal de ruido sumada para simular peque~nas nubes dispersas. La temperatura de referencia es una onda cuadrada con cambios entre 280 oC y 285 oC . En este caso el controlador utilizado es un PI adaptativo, como el que se ha descrito en los apartados anteriores. Como se ha comentado anteriormente la caracterstica dinamica del campo vara con el ujo. Como puede verse en la gura 7.5, durante el perodo de test, el nivel de irradiancia varia entre 600 y 900 watts=m2 . La variacion necesaria en el ujo nominal para mantener la temperatura de salida en el rango de 280-285, se mostrara similar a la de la irradiancia I , (un decremento en la irradiancia I , requiere un decremento en el ujo de aceite para mantener una temperatura de salida ja y viceversa). El tiempo de retardo se reduce y la velocidad de respuesta de la planta aumenta con el incremento de ujo de aceite. Por lo tanto, comparando con valores bajos de la irradiancia I , cuando la irradiancia I es alta, (correspondiendo un ujo alto), el tiempo de retardo se reducira, as como la constante efectiva del modelo de la planta. Esto ultimo se corresponde con un valor bajo del polo a. Puede verse como la variacion en el polo a, en el perodo de test, sigue las variaciones en la irradiancia I.
152
Resultados en planta
Referente a la funcion de transferencia del modelo de la planta, el valor mnimo del retardo viene dado cuando b1 = 0, y el maximo retardo cuando b0 = 0. Por lo tanto, el termino normalizado jb0=(b0 + b1 )j, se incrementara con un valor alto del nivel de irradiancia, I , (incremento de ujo y decremento del tiempo de retardo). La respuesta simulada muestra que jb0=(b0 + b1)j sigue la variacion en I , y da una indicacion de como el modelo se acomoda a las variaciones en el tiempo de retardo. Las variaciones de los parametros simulados muestra que para el caso de compensacion serie, se ha obtenido la tendencia esperada en los valores. Sin embargo en el caso de compensacion en paralelo, la variacion en escalones de la temperatura de referencia provoca variaciones en el ujo que no son vistas por el estimador y da valores erroneos de los parametros estimados. Los valores estimados de a y jb0 =(b0 + b1 )j, varian sustancialmente, y cada cambio de referencia provoca saltos considerables en los valores estimados y la tendencia hacia los valores correctos no se sigue durante el perodo de test. Este efecto puede aliviarse si se introduce un ltro al controlador en adelanto, para evitar estos cambios rapidos en la se~nal de adelanto, correspondientes a los cambios de referencia.
7.7 Resultados en planta Las estructuras de control mencionadas anteriormente han sido probadas en el campo acurex de la planta solar de Tabernas (Almera), ello ha demostrado que los controladores pueden operar en presencia de cambios en la dinamica del proceso causados por cambios en las condiciones de operacion de la planta. Como se ha mencionado anteriormente, el campo de colectores distribuidos puede ser utilizado para diferentes propositos, en diferentes modos de operacion y con condiciones de operacion variables (diferentes muestras de radiacion solar, temperatura de entrada de aceite, temperatura de referencia, etc). Todos estos factores tienen, de esta forma, que ser tenidos en cuenta para evaluar las capacidades de las posibles estrategias de control. Aunque los estudios de simulacion mencionados en la seccion anterior ayudan considerablemente en esta tarea, se han realizado una serie de tests en la planta real. Como se ha inferido anteriormente, las caractersticas dinamicas de la planta varian signi cativamente a lo largo del rango de operacion, lo cual hace difcil obtener un buen control con un regulador PI jo. Esto puede verse en la gura 7.6 donde la actuacion es buena a nivel bajo de ujo ( gura 7.7) de 8 litros/seg aproximadamente, pero a alto nivel de ujo sobre 11 litros/seg la respuesta es signi cativamente mas
Aplicacion de control adaptativo
153
260 Adap.
Fijo 255
Temperatura (grados C)
Adap. 250
Fijo
Fijo
245
Adap.
240
235
230 10
10.5
11
11.5
12
12.5
13
13.5
14
Tiempo (Horas)
Figura 7.6: Respuesta con regulador P.I. jo. Temperatura de salida 950
13.6 l/s
Radiacion (w/m^2)
700 10
10.5
11
11.5
12
12.5
13
13.5
14
7.0
Tiempo (Horas)
Figura 7.7: Respuesta con regulador P.I. jo. Irradianza y ujo.
154
Resultados en planta
oscilante y tiene mayor tiempo de establecimiento. Las guras 7.8, 7.9 y 7.10 muestran resultados de la planta utilizando el controlador PI autoajustable con incorporacion del controlador en adelanto en serie. Los resultados son signi cativos ya que se muestra la actuacion durante unas 3 horas de operacion cuando el nivel de irradiancia esta cambiando sustancialmente, debido a la presencia de nubes dispersas. Las perturbaciones injectadas son en la forma de cambios en escalones en la temperatura de referencia. Esto genera informacion dinamica para la estimacion, as mismo el resultado en la respuesta de la temperatura de salida sirve para demostrar la calidad de la actuacion del sistema de control. 310
800
grC .. .. . .... . ... ......... .............................. . ........ . . . . . . ... . .. .. . .. .. ..... .......... ..... ... .......
200 11.5
12
12.5
13
13.5
14
265
250
235
220 14.5
Tiempo (Horas)
Figura 7.8: Salida con control PI adaptativo El perodo desde las 11:39 a las 12:46 corresponde a la fase de puesta en marcha de la planta, cuando el aceite esta recirculando, y el controlador esta en perodo de autoajuste. Despues de este perodo, se obtiene un buen seguimiento a la respuesta en escalon, permaneciendo la temperatura de referencia muy proxima a la se~nal de referencia, a pesar de los cambios signi cativos en el nivel de irradiancia de esta experiencia. Esto ultimo demuestra los efectos bene ciosos del controlador por adelanto en serie, el cual no solo sirve para reducir las variaciones no esperadas en la temperatura de salida sino que tambien reduce las desviaciones erroneas en los
Aplicacion de control adaptativo
155 1.2
0.94
1.0
0.92
Polo a
0.86
0.4
0.84
0.2
0.82 11.5
12
12.5
13
13.5
14
0.0 14.5
Tiempo (Horas)
Figura 7.9: Evolucion de los parametros
b0
0.05
0
-0.05 11.5
12
12.5
13
13.5
14
14.5
13.5
14
14.5
Tiempo (Horas) 0.1
b1
0.08 0.06 0.04 0.02 0 11.5
12
12.5
13 Tiempo (Horas)
Figura 7.10: Evolucion de los parametros
156
Resultados en planta
parametros estimados. Esto puede verse en la respuesta de los parametros estimados de la gura 7.9 en la que el parametro estimado (a), muestra cambios suaves durante el perodo del experimento. Este sigue las variaciones experadas necesarias para igualar los cambios en la respuesta caracterstica del sistema. Los niveles de irradiancia y la temperatura de salida requerida determinan el ujo de aceite necesario, el cual a su vez determina la velocidad de la respuesta del sistema y el tiempo de retardo. Mediante los tests de control realizados en la planta, es difcil demostrar las ventajas relativas de un controlador con respecto a otro. Dado que las condiciones exactas de nivel de irradiancia y de temperatura de entrada nunca pueden ser reproducidas. Sin embargo, en orden a dar una indicacion de la mejora producida por el esquema de control PI adaptativo autoajustable sobre un controlador jo tipo PI, las condiciones de irradiancia para el test correspondiente a la gura 7.7 (para un controlador jo PI), son aplicadas en un estudio de simulacion al controlador autoajustable. La respuesta de la temperatura de salida para el caso adaptativo se superpone como se muestra en la gura 7.6. Puede verse que el regulador de parametros jo PI trabaja bien para las condiciones correspondientes al primer escalon, pero para los otros escalones, donde el nivel de irradiacion es mayor, el comportamiento se deteriora. El controlador autoajustable por otro lado, una vez que los parametros se han ajustado, proporciona un comportamiento mejor el cual se mantiene a pesar de los cambios en las condiciones de operacion. Tambien, para las condiciones del experimento de la gura 7.8, las condiciones de irradiancia se han aplicado al modelo de simulacion incorporando el controlador de parametros jos PI. Otra vez puede verse que el controlador jo PI, el cual esta ajustado para las condiciones de ujo medio, tiende a oscilar cuando el nivel de ujo es bajo, caso que se produce al nal del test cuando la temperatura de referencia es alta (270 oC ) coincidiendo con nivel bajo de irradiancia (alrededor de 600 watts=m2 ). El esquema de control adaptativo autoajustable funciona mucho mejor que el controlador jo, ante los cambios en la caracterstica dinamica de la planta, que corresponden a un da de operacion con variaciones grandes del nivel de irradiancia. La gura 7.11 muestra la temperatura de salida del aceite y la referencia cuando se aplica el GPC adaptativo. El valor de escogido fue 5, y, como se aprecia se obtiene una respuesta muy rapida ante cambios en la referencia (tiempo de subida del orden de 7 minutos). Para tener menor sobreoscilacion el factor de ponderacion
Aplicacion de control adaptativo
157
set point/outlet temperatures ( C)
190.0
180.0
170.0
160.0 11.0
11.5
12.0
12.5 13.0 local time (hours)
13.5
14.0
14.5
Figura 7.11: GPC Adaptativo: Temperatura de salida del aceite 730.0
Radiacion solar (W/m2 )
710.0
690.0
670.0
650.0
630.0 11.0
11.5
12.0
12.5 13.0 tiempo local (horas)
13.5
14.0
14.5
11.5
12.0
12.5 13.0 tiempo local (horas)
13.5
14.0
14.5
7.0
flujo de aceite (l/s)
6.5
6.0
5.5
5.0
4.5 11.0
Figura 7.12: GPC Adaptativo: Radiacion solar y caudal de aceite
158
Resultados en planta
debe aumentarse. La evolucion de la radiacion en este test se puede comprobar en la gura 7.12. Corresponde a un da con peque~nas nubes. El caudal de aceite, cambio desde 4.5 l/s a 7 l/s, y el controlador pudo mantener un buen comportamiento ante cambios en la dinamica del proceso. Debido al hecho de que las condiciones de un ensayo no se pueden reproducir de forma exacta, para comparar el comportamiento de los esquemas de control propuestos, se utilizaron los datos de un da de operacion con un controlador PI jo para simular el comportamiento de todos los esquemas de control comentados. La gura 7.13 muestra los resultados obtenidos aplicando el controlador PI jo a la planta y los resultados obtenidos aplicando los dos controladores adaptativos PID y el GPC. El PI jo funciona bien para las condiciones en las que fue dise~nado, pero no muy bien fuera de ellas.
referencia/temperatura de salida (C)
260.0 temperatura de referencia controllador PI fijo controlador PID Z-N adaptativo controlador Z-N PID adaptativo completo controlador GPC adaptativo
255.0
250.0
245.0
240.0 10.2
10.7
11.2
11.7 12.2 12.7 tiempo local (horas)
13.2
13.7
Figura 7.13: PI jo, PID adaptativo y GPC adaptativo
14.2
Captulo 8 El problema del control robusto 8.1 Introduccion Las caractersticas del dise~no de un sistema de control van a depender en gran medida, de la delidad con la que el modelo empleado describa el comportamiento del sistema. Uno de los principios del modelado de sistemas es el de simpli cacion; consistente en que de la forma mas simple posible el modelo capte los rasgos fundamentales bajo analisis del proceso. Un proceso real puede ser extremadamente complejo para ser descrito de forma absolutamente precisa por un modelo matematico, en cuyo caso se habla de errores de modelado. Si se a~nade el hecho de que se trata de describir al sistema con un modelo lineal e invariante en el tiempo, ello implica otro conjunto de hipotesis simpli cadoras que incrementan los errores de modelado originales o residuales. Se puede considerar por tanto, que cualquier modelo matematico de un proceso real va a ser en mayor o menor grado impreciso, o dicho de otra forma va a contar con incertidumbres o errores de modelado. Si se desea controlar de manera e ciente un proceso real, se debera de tener informacion sobre las posibles fuentes de incertidumbres, evaluando su efecto sobre el comportamiento del sistema completo. La necesidad de cumplir unas especi caciones de dise~no cada vez mas exigentes, ha llevado a tener en consideracion aspectos de importancia practica en el desarrollo 159
160
Introduccion
de los sistemas de control. De forma que el comportamiento del sistema se mantenga aceptable en un ambiente realista, en el que las incertidumbres van a estar siempre presentes. Entre los principales factores causantes de los errores de modelado pueden destacarse: 1. Modi caciones en el punto de trabajo de la planta o con respecto al modelo nominal. 2. Dinamica no lineal no considerada. 3. Dinamica de alta frecuencia no modelada. 4. Retardos de tiempo no contemplados. 5. Imprecisiones en los parametros, debidas al metodo de identi cacion y/o modelado empleado. Estos factores se pueden agrupar en dos grandes grupos: las incertidumbres parametricas (1) y (5) y las estructurales (2), (3) y (4). Con respecto al conocimiento disponible sobre las causas de las incertidumbres puede distinguirse entre incertidumbre estructurada y no estructurada. En el caso de incertidumbre no estructurada solo se conoce que existen discrepancias entre el modelo y la planta real, y posiblemente puede conocerse tambien el tama~no de las desviaciones de determinadas medidas entrada/salida (por ejemplo, la discrepancia en la respuesta frecuencial causada por la dinamica de alta frecuencia no modelada y/o diferencia en la respuesta temporal debido a la no consideracion de un elemento no lineal). Si se conoce de la incertidumbre que en cierta medida se debe a algunos elementos diferenciados de la planta, en la forma de tolerancias de sus valores (por ejemplo, la incertidumbre en el valor de un polo y/o un cero), en ese caso se trata de una incertidumbre estructurada. Es posible tambien, que se tenga un conocimiento parcial y separado de las fuentes de incertidumbre, en cuyo caso tambien podra hablarse de incertidumbre parcialmente estructurada (por ejemplo, el hecho practico de que las incertidumbres existentes en distintos actuadores sean independientes entre s). A la hora de plantearse el dise~no de un sistema de control robusto para un proceso con incertidumbres, surgen una serie de cuestiones escalonadas:
El problema del control robusto
161
1. Como modelar tales procesos. 2. Como analizar el sistema de control. 3. Como dise~nar el controlador. Para resolver los 3 puntos anteriores, se hace necesario la introduccion de nuevos conceptos y herramientas de calculo para el analisis y dise~no de sistemas de control. El campo de aplicacion de esta nueva disciplina denominada control robusto, abarca todos aquellos problemas que se caractericen por considerar incertidumbres en el modelo que sean tolerables por un controlador jo lineal e invariante en el tiempo; limitando con aquellos que necesitan un controlador variable (control adaptativo, control por plani cacion de la ganancia). Los objetivos de control tratan en cualquier caso, de que el controlador dise~nado funcione bien cuando se implante en el proceso real. Este objetivo, a su vez puede considerarse compuesto en una serie de subobjetivos. De estos, el principal es que el sistema sea estable en lazo cerrado, para unas condiciones de trabajo dadas o nominales. Es lo que se denomina Estabilidad Nominal (NS). Por otro lado, una vez conseguida la estabilidad es necesario que ciertas variables del sistema presenten un comportamiento adecuado y en algunos casos optimo respecto a una funcion de costes o ndice de comportamiento. Esto se tiene en cuenta referenciandolo como Comportamiento Nominal (NP). Es tambien muy importante, de cara a la aplicacion industrial, que se tenga en cuenta en el dise~no el conocimiento que se posea de la incertidumbre en el modelo. Otro requerimiento que se va pedir a un sistema de control es que sea estable en lazo cerrado, para el conjunto de posibles plantas que se puedan dar como consecuencia de la incertidumbre en el modelo de la planta. El objetivo perseguido se denomina Estabilidad Robusta (RS). Si ademas se considera que para todas las plantas posibles no basta con que el sistema de control permanezca estable sino que han de cumplirse unas especi caciones de funcionamiento, se considerara que se esta aludiendo al concepto de Comportamiento Robusto (RP). En la gura 8.1 queda resumido el problema de dise~no y los diferentes niveles de exigencia que se establecen sobre un sistema de control, tal y como se ha descrito anteriormente. El control de sistemas con incertidumbres entra dentro del campo de estudio de la
162
Introduccion
PROCESO REAL
-
Complejo
? Simpli caciones
?
?
Modelo matematico
Incertidumbres
-
?
Sistema de Control
?
Comportamiento ? Robusto Estabilidad (RP) ? Comportamiento Robusta (RS) ? Estabilidad Nominal (NP) Nominal (NS)
Figura 8.1: Planteamiento del problema de control
El problema del control robusto
163
disciplina conocida como Control Robusto. La decada de los ochenta se considera el perodo de desarrollo de dicha teora, pudiendose destacar entre otros los desarrollos teoricos realizados durante este perodo: 1) Metodos H1 (Zames y Francis, 1983; Doyle et al, 1989); 2) metodos LTR (Loop Transfer Recovery) (Doyle y Stein, 1981, Stein y Athans, 1987); 3) metodo de dise~no IMC (Internal Model Control) (Morari et al, 1989); 4) metodos de Kharatinov (Barmish, 1993); 5) metodo de Sntesis- (Balas et al, 1991); 6) metodo GPC (Generalized Predictive Control) (Clarke et al, 1989); 7) metodo QFT (Quantitative Feedback Theory) (Horowitz, 1982). Las principales aplicaciones de la teora de control robusto realizadas en los ultimos a~nos se han llevado a cabo en las areas de control de procesos qumicos, robotica, estructuras exibles y control de aeronaves (Dorato, 1993). Como consecuencia de los buenos resultados obtenidos, y del interes despertado en la comunidad cient ca y tecnica por la nueva disciplina, han surgido diferentes paquetes de CACSD (Dise~no de Sistemas de Control Asistido por Computador) para el dise~no de sistemas de control robusto, como ejemplos signi cativos se pueden citar: Program CC (Thompson, 1988), Robust-Control Toolbox (Chiang y Safonov, 1992) y -Analysis and Synthesis Toolbox (Balas et al, 1991) ambos para Matlab. Este captulo se centra en los metodos H2 , LTR y H1, habiendose empleado para el dise~no y analisis de los controladores, los dos paquetes de CASCD citados anteriormente en primer lugar.
8.2 Relaciones fundamentales La calidad de un dise~no va a depender en gran manera, del grado de aproximacion con el que se recojan, de forma matematica, los deseos de como se quiere que funcione el sistema bajo ciertas condiciones. Y por tanto, del conocimiento que se tenga de la planta, as como de lo que se le exija al sistema de control. Esto ultimo, quedara re ejado como las especi caciones de dise~no a cumplir por el controlador.
Relaciones fundamentales de control Un sistema de control generico puede verse representado en la gura 8.2, donde: G representa la planta, K el controlador, di; do las perturbaciones que afectan al proceso, r la referencia o consigna, y la respuesta del sistema y n el ruido ligado a las medidas de los sensores.
164
Relaciones fundamentales
r- h e - 6
K
di u- ? h
G
d
o ? - h r y-
?hn
Figura 8.2: Sistema de control y se~nales signi cativas Para caracterizar el comportamiento de un sistema de control resulta util de nir una serie de operadores, o matrices (funciones en el caso escalar) de transferencia:
Lazo Abierto o Razon de Retorno: Li = KG
;
Lo = GK
Fi = I + Li
;
Fo = I + Lo
1
;
So = Fo 1
Ti = I Si
;
To = I So
Diferencia de Retorno: Sensibilidad:
Si = Fi
Sensibilidad Complementaria: Sensibilidad del Control:
N = KSo
donde los subndices fi; og hacen referencia a que el operador se de na a la entrada o a la salida de la planta respectivamente. Del diagrama de bloques de la gura 8.2, pueden obtenerse las siguientes funciones (matrices en el caso de sistemas multivariables) de transferencia que van a determinar las propiedades mas relevantes a tener en cuenta para el dise~no de un sistema de control:
El problema del control robusto
165
1. Estabilidad interna: El sistema es internamente estable si son estables (ver apendice B.1) cada uno de los elementos de la matriz R, que relaciona los vectores r; di con y; u, siendo: " # " # y =R r u di donde: " 1 1G # GK ( I + GK ) ( I + GK ) R = K (I + GK ) 1 K (I + GK ) 1G 2. Comportamiento entrada-salida: y = To(r n) + Sodo + So Gdi
(8:1)
e = r y = So (r do n) SoGdi
(8.2)
3. Sensibilidad del sistema a peque~nos cambios en los parametros de la planta: Si la funcion (matriz) de transferencia en lazo abierto L0o (s) sufre una desviacion con respecto a la nominal Lo(s) debido a peque~nas variaciones en los parametros de la planta y/o del regulador, la correspondiente desviacion de la funcion (matriz) de sensibilidad complementaria To(s) viene dada por (MacFarlane, 1970): To 1(s)To(s) = So(s)Lo 1(s)Lo (s) (8:3) que es la generalizacion matricial de la relacion escalar de Bode (Kwakernaak, 1972): d ln T = dT=T = S d ln L dL=L 4. Demanda de control: u = KSo (r n do) + Sidi (8:4) El conjunto de ecuaciones 8.1-8.4 resumen los bene cios fundamentales y objetivos de dise~no inherentes a los sistemas de control realimentados. De ellas se desprende la existencia de una serie de objetivos contrapuestos: 1. De 8.2, se deriva que los errores de seguimiento del sistema e en presencia de cambios de consigna r y el efecto de perturbaciones do actuando a la salida de la planta pueden hacerse "peque~nos", procurando que el operador de sensibilidad So sea\peque~no" tambien (o equivalentemente Lo lo bastante grande). Para atenuar convenientemente las perturbaciones que actuen a la entrada de la planta di sera necesario que el producto SoG se mantenga lo menor posible.
166
Relaciones fundamentales
2. De la ecuacion 8.3, se deriva la conveniencia de mantener So (s) lo menor posible, ( Lo (s) lo mayor posible), a n de que el efecto de peque~nas variaciones de parametros en la planta no afecten de manera sensible al comportamiento del sistema en lazo cerrado. 3. Sin embargo, el aumentar excesivamente la ganancia en lazo abierto (Lo) o equivalentemente disminuir So, hace que dada la relacion existente entre So y To se provoque un aumento de la magnitud de To , produciendo dos consecuencias negativas: (a) Una posible ampli cacion del ruido de medida n y su transmision a la salida del sistema. (b) Una mayor sensibilidad del sistema a los efectos de la dinamica no modelada de alta frecuencia. 4. El esfuerzo de control u requerido para rechazar las perturbaciones actuantes sobre el sistema y conseguir una buena regulacion depende de las magnitudes de Si; So; K . Por tanto si se pretende que u no sea excesivo sera necesario mantener So, y Si lo su cientemente bajas. Pero dado que a su vez estas dependen inversamente de K , disminuir las primeras supone aumentar la ultima. Se presentan pues objetivos contradictorios, debiendose llegar en cada problema de dise~no a una solucion de compromiso. Habitualmente la dinamica inmodelada de alta frecuencia es la que da lugar a los mayores niveles de incertidumbre. Teniendo en cuenta que el ruido de medida suele ser tambien de alta frecuencia, y que las caractersticas de los sistemas dinamicos pueden muy bien asemejarse a ltros pasa bajo, una forma de resolver el problema planteado con los objetivos contrapuestos anteriores, es procurando que cada uno se cumpla en un rango de frecuencias de interes. Se pueden establecer tres zonas de frecuencias, de forma que dentro de cada una se trata de conseguir unos objetivos primordiales (ver gura 8.3):
Zona de baja frecuencia: En la que se requiere alta ganancia para conseguir: { Buen seguimiento de la referencia. { Adecuado rechazo de perturbaciones. { Reduccion de la sensibilidad del sistema a peque~nos cambios en los parametros de la planta.
El problema del control robusto
kLk
(db) 0
QQ
167
ZONA FRECUENCIA DE CRUCE - Estabilidad - Velocidad de respuesta
QQ Q
QQ QQ
ZONA DE BAJA FRECUENCIA - Seguimiento de consigna - Rechazo de perturbaciones - Comportamiento Robusto - Peque~nos cambios en parmetros
QQ
QQ
QQ B
ZONA DE ALTA FRECUENCIA - Rechazo ruido en sensores - Estabilidad Robusta
B BB
BB
BB
! (rad/s)
Figura 8.3: Zonas de frecuencias de interes
Zona de frecuencia intermedia: Va a ser determinante de propiedades tales
como: { Estabilidad y margenes de estabilidad. { Velocidad de respuesta y ancho de banda. Zona de alta frecuencia: Se va a requerir baja ganancia para: { Rechazo del ruido de los sensores. { Estabilidad robusta.
Las especi caciones de control pueden darse en el dominio frecuencial. Una forma de hacerlo es empleando funciones dependientes de la frecuencia, o de ponderacion, para acotar las magnitudes de los operadores de sensibilidad y sensibilidad complementaria. Para el caso de un sistema escalar pueden venir dados de la forma: j S (j!) j wS (!) y j T (j!) j wT (!) 8 ! Se pueden obtener las siguientes aproximaciones: ( ) j S j 1 j L j 1 () j T j 1
168
Relaciones fundamentales
(
)
j 1 j L j 1 () jj TS j 1 Para el rango de frecuencias donde j L j 1, las propiedades del sistema en lazo
cerrado dependen crticamente del valor de la fase del lazo abierto; as se tendra que: jLj1 j S j 1 arg L(j!) 180
()
j T j 1
Reglas practicas para el dise~no Las aproximaciones anteriores llevan a una serie de reglas utiles a la hora de realizar la sntesis de un sistema de control:
Alta ganancia en lazo abierto lleva a baja sensibilidad y buenas propiedades de rechazo de perturbaciones y seguimiento de la referencia (np).
Peque~na ganancia en lazo abierto es adecuada para que la respuesta debida al ruido en sensores sea considerablemente baja, y para mantener la estabilidad del sistema frente a incertidumbres en la planta (rs).
A frecuencias cercanas a la frecuencia de cruce de ganancia, la fase del sistema debe permanecer acotada lo su cientemente alejada de 180, para proporcionar unos adecuados margenes de estabilidad y para prevenir la ampli cacion de perturbaciones y ruidos.
El conjunto de reglas anteriores constituyen la base del dise~no clasico en el dominio frecuencial (Freudenberg et al, 1988, Maciejowski, 1989), consistente en que a partir del ajuste de la ganancia en lazo abierto se consiguen unas especi caciones de dise~no dadas en lazo abierto y/o cerrado. Otras tecnicas realizan tambien el proceso de ajuste en frecuencia, pero empleando directamente las funciones (matrices) de transferencia en lazo cerrado. En el captulo 9 se presentan algunas tecnicas de ajuste de las ganancias en lazo abierto (ltr), mientras que en el captulo 10 se describen algunos metodos para el ajuste de las ganancias en lazo cerrado (H2; H1)1 . La tecnica de ajustar las formas de las respuestas en frecuencia de ciertas funciones (matrices) de transferencia se conoce en general como Loop Shaping, en terminologa inglesa. 1
El problema del control robusto
169
Extension de conceptos a sistemas multivariables El concepto de ganancia de un sistema puede extenderse a sistemas multivariables haciendo uso de las relaciones entre las normas (ver apendice B.2) de las se~nales vectoriales de salida y entrada al sistema. En general, si k x k representa a cualquier norma de un vector x, se de ne la norma inducida de la matriz G por: k k G k= supx6=0 kkGx xk y en particular si se elige la norma Eucldea (de un vector complejo x):
p k x k= xH x
(donde xH representa el vector traspuesto conjudado de x), la norma inducida de la matriz es la norma espectral o de Hilbert:
k G ks= donde 2 es el autovalor maximo de la matriz GH G o de su traspuesta GGH , donde GH es la matriz traspuesta conjugada de G (ver apendice B.3). Si se tiene una matriz de transferencia G(s), con s = j!, y (0 ! 1), entonces su norma espectral va ser una funcion de !. Por tanto la norma k G(s)u(s) k va a depender de la direccion del vector u(s) y de la frecuencia !. Para cada valor de frecuencia es posible hallar unas cotas de la magnitud: k G(s)u(s) k k u(s) k que reemplazan el concepto de ganancia simple por el de rango de ganancias, estando este acotado (superior e inferiormente). Estas cotas son las denominadas ganancias principales extremas: [G(j!)], [G(j!)], que pueden calcularse a partir de los valores singulares maximo () y mnimo () de la matriz de transferencia G(j!) (ver apendice B.3) para cada frecuencia !. Para el caso de un sistema multivariable, las especi caciones de dise~no pueden darse empleando las ganancias principales extremas:
[S (j!)] wS (!)
170
Relaciones fundamentales
[T (j!)] wT (!) donde igual que para el caso escalar, las funciones de ponderacion (wS (!); wT (!)) se eligen de forma que se tengan en cuenta los objetivos a cumplir en cada intervalo de frecuencias de interes: 1. Baja frecuencia:
2. Frecuencia intermedia:
(S ) 1 i (T ) 1
j i(j!) j i(j!)
con mg,mf satisfactorios (ver apendice B.4). 3. Alta frecuencia:
(T ) 1
Teniendo en cuenta que para cualquier matriz arbitraria Q y su matriz unitaria I se cumple: maxf0; (Q)g (Q + I ) (Q) + 1 maxf0; (Q)g (Q + I ) (Q) + 1 se pueden transformar las especi caciones anteriores, empleando las ganancias principales extremas en lazo abierto: 1. A baja frecuencia: 2. A alta frecuencia:
(L) (1S ) si (L) 1 (L) (T ) si (L) 1
Las aproximaciones anteriores proporcionan una forma de transformar las especi caciones sobre (T ) y (S ), en expresiones de la matriz de transferencia en lazo abierto (ver gura 8.4): 1=[L(j!)] wS (!) [L(j!)] wT (!)
El problema del control robusto
171
dB (L)
0
NP
RS
T S-1 (L)
Figura 8.4: Correspondencia especi caciones lazo cerrado-lazo abierto
8.3 Descripcion de las incertidumbres Un diagrama de bloques general de un sistema de control de una planta con incertidumbres queda representado en la gura 8.5, donde E representa los errores de modelado existentes en la planta. De las posibles formas de representar el conocimiento impreciso que se tiene en el caso de un proceso escalar (incertidumbre tipo aditivo, multiplicativo etc.), cuando se trata de un sistema multivariable hay que considerar algunos otros casos; pues habra que tener en cuenta su situacion en el lazo de control. As por ejemplo, la incertidumbre de tipo multiplicativo podra estar a la entrada o a la salida, o incluso podran coexitir ambas simultaneamente. En cada caso habra que analizar el sistema en concreto y tratar de plasmar los errores de modelado de la forma mas conveniente. Las incertidumbres multiplicativas son las mas frecuentemente empleadas, debido a que satisfacen las propiedades intuitivas de ser peque~nas a baja frecuencia (donde el modelo de la planta nominal es generalmente bien conocido), y por otro lado son elevadas para alta frecuencia (donde el modelo es siempre mas impreciso). Habitualmente el nivel de incertidumbre aumenta con la frecuencia, debido principalmente a
172
Descripcion de las incertidumbres
E
di r
e - - 6
K
? -
u
6
do
?
G
? - y
?
n
Figura 8.5: Sistema de control con incertidumbres en la planta la dinamica no modelada de alta frecuencia (sensores, actuadores, modelos de orden reducido de la planta). Si bien, hay diversas formas de caracterizar la incertidumbre que exista en un sistema de control, como se pasa a describir a continuacion. La planta actual o real, G0 , puede expresarse de forma generica como:
G0 = G + G (8:5) donde G es el modelo nominal de la planta, y G representa la incertidumbre o errores de modelado presentes en el sistema. El tratamiento que se hace es considerar que el conjunto de incertidumbres que afectan al sistema puede ser representado por una incertidumbre equivalente, que se mani esta de alguna forma espec ca en un lugar localizado. En ocasiones ello no es posible, en cuyo caso se habla de incertidumbres simultaneas (dos o mas). Los modelos de incertidumbres mas empleados son: aditiva (iA), multiplicativa a la entrada/salida (iMi y iMo) de la planta, de realimentacion a la planta (iRp), como bucle realimentado a la entrada/salida de la planta (iRi, iRo), (ver gura 8.3). A continuacion se dan las expresiones correspondientes a cada una de ellas: 1. iA:
G0 = G + E G = E
El problema del control robusto
-E
r- e K
6
173
- ?e - G -y
r- e K - G
6
iMi
r- e K - e
6
6
6
- e?-y
iMo
E
-G
y -
r- e
6
K-e G
iRi
r- e K
-E
6
E
y -
iRp
G -e
6
E
y -
r- e K
6
iRo iA Figura 8.6: Algunos tipos de incertidumbres
-E - G - ?e y-
174 2. iMi: 3. iMo: 4. iRp: 5. iRi: 6. iRo:
Descripcion de las incertidumbres
G0 = G(I + E ) G = GE G0 = (I + E )G G = EG G0 = (I + GE ) 1G G = [(I + GE ) 1 I ]G G0 = G(I + E ) 1 G = G[(I + E ) 1 I ] G0 = (I + E ) 1G G = [(I + E ) 1 I ]G
En general, a la hora de la descripcion analtica de las incertidumbres en la planta estas pueden englobarse en dos grandes grupos: estructuradas y no estructuradas.
Incertidumbres no estructuradas Para este tipo de incertidumbre, lo que se conoce de E (s) puede consistir en una cota de su magnitud, generalmente dependiente de la frecuencia:
[E (j!)] (!) 8 !
(8:6)
Resulta interesante de cara a posteriores analisis el factorizar E (s) en la forma:
E (s) = e(s)(s) ; [(s)] 1 8!
(8:7)
Todas estas descripciones albergan la posibilidad de acoplamiento entre distintas fuentes de incertidumbres (por ejemplo, entre diferentes actuadores), considerando el caso mas desfavorable (E (s) es una matriz con elementos no nulos fuera de la diagonal principal). Pudiendo ocurrir, que se contemplen ciertas posibilidades que
El problema del control robusto
175
en la practica nunca se produzcan. Si eso ocurriera, el dise~no realizado se caracterizara por ser excesivamente conservador.
Incertidumbre estructurada Si de alguna manera se localizan las fuentes de las incertidumbres del sistema, se tendra una descripcion mas ajustada o estructurada de los errores de modelado. Esta puede estar constituida a su vez por multiples incertidumbres localizadas e independientes no estructuradas (Ei(s)). Las cuales pueden corresponder a dinamicas no modeladas de los actuadores, de los sensores, o de la propia planta. As, para cada uno de los bloques independientes Ei(s) se realiza la factorizacion:
Ei (s) = ei(s)i (s) ; [i (s)] 1 8!
(8:8)
La incertidumbre completa E (s) del sistema queda de la forma:
E (s) = diag fEi (s)g i = 1; : : : ; p siendo p el numero de bloques. Los errores de modelado tambien podran consistir en imprecisiones en algunos parametros del proceso, suponiendo en este caso una incertidumbre totalmente estructurada o parametrica. Este ultimo caso se dara por ejemplo, si existe una incertidumbre acotada en uno o varios polos y/o ceros de la planta, as como en la cuanti cacion de los elementos de retardo.
Ejemplo: Incertidumbres aditiva y multiplicativa Considerese un proceso en el que la dinamica de alta frecuencia no se ha considerado en el modelo nominal G, de forma que el modelo completo o real de la planta viene dado por
s2 + 2:4s + 144) G0(s) = G(s)Es(s); con: Es(s) = 100( 144(s2 + s + 100) donde Es es la incertidumbre en el modelo nominal. Esta se puede interpretar a su vez como una incertidumbre de tipo multiplicativo, aditivo, u otros. En el primer caso se tendra: G0 = G(1 + Em ); con Em = Es 1
176
Estabilidad robusta 10
Incertidumbre multiplicativa (dB)
0 -10 -20 -30 -40 -50 -60 -70 10 -1
10 0
10 1
10 2
rad/s
Figura 8.7: Magnitud de la incertidumbre multiplicativa y para el caso de incertidumbre aditiva: G = G + Ea; con Ea = G(Es 1) En las guras 8.7 y 8.8 se muestran respectivamente las respuestas en frecuencia (magnitudes) para cada tipo de incertidumbre. Puede verse como la incertidumbre multiplicativa es peque~na a baja frecuencia, donde el modelo es bien conocido, y se incrementa a medida que aumenta la frecuencia.
8.4 Estabilidad robusta Si el sistema de control dise~nado con el modelo nominal es estable, interesa saber si el sistema mantendra la estabilidad para cada uno de los elementos G0 del conjunto G de plantas posibles: G = fG0g Para el analisis del problema anterior, es util obtener una representacion del sistema como la de la gura 8.9.
El problema del control robusto
177
-10
Incertidumbre aditiva (dB)
-20
-30
-40
-50
-60
-70
-80 10 -1
10 0
10 1 rad/s
Figura 8.8: Magnitud de la incertidumbre aditiva
-
a
E
M
b
Figura 8.9: Sistema de interconexion
10 2
178
Estabilidad robusta
Teorema de la Peque~na Ganancia Este teorema ha jugado un importante papel en el desarrollo de la teora del control robusto (Dorato et al, 1987), y establece una condicion su ciente que garantiza la robustez de la estabilidad de un sistema (Lunze, 1989):
Teorema: Dado el sistema representado en la gura 8.9, donde M y E repre-
sentan sistemas cuadrados (mismo numero de entradas que de salidas) y estables, entonces el sistema en lazo cerrado sera estable si:
k EM k< 1 siendo k : k cualquier norma matricial compatible con el sistema (ver apendice B.2). Tanto M como E pueden ser sistemas no lineales y/o invariables en el tiempo. Sin embargo, el teorema establece solo una condicion su ciente para la estabilidad del sistema en lazo cerrado. Particularizando para el caso de sistemas lineales e invariantes en el tiempo (lti), el sistema de la gura 8.9 sera estable si se cumple:
[E (j!)M (j!)] < 1 8! La idea de aplicar este teorema, para analizar la robustez de un sistema de control con incertidumbres, se basa en el empleo de M (s) como el sistema visto por la incertidumbre E (s). Al sistema M (s) se le denomina Sistema de Interconexion, debido al hecho de que conecta la entrada "a" y la salida "b" de la incertidumbre E (s). En el caso de tratarse de sistemas lti, las se~nales externas, tales como perturbaciones y se~nales de referencia, no van a afectar a la estabilidad del sistema y de cara al analisis de robustez solo interesa la forma de como es visto el sistema por la incertidumbre. Para llegar a la representacion anterior, se parte de la representacion convencional de la planta y controlador, junto con los bloques de las incertidumbres que se tengan localizadas, se realizan las transformaciones equivalentes necesarias de forma que el resultado sea la separacion de la incertidumbre por un lado E (s) y del resto del sistema M (s) (sistema de interconexion) por otro.
El problema del control robusto
179
Ejemplo: Analisis de robustez Considerese un sistema de control con realimentacion unitaria, donde la planta nominal G y el controlador K (regulador 1) estan dados por
G(s) = s12 ; K (s) = 10(ss++51) El modelo real de la planta (incluida la incertidumbre) viene dado por,
G0(s) = G(s)[1 + Em(s)] siendo,
+ 0:6667) Em (s) = s( 0s:30556 2 + s + 100
Para este caso (incertidumbre de tipo multiplicativo) el sistema de interconexion coincide, salvo en signo, con la funcion de sensibilidad complementaria
M= T y aplicando el teorema de la peque~na ganancia, la maxima incertidumbre admisible o tolerable viene dada por: j E j j M1 j = j T1 j En la gura 8.10 se muestran tanto la incertidumbre j Em j (lnea a trazos), as como la tolerancia del sistema de control a incertidumbres multiplicativas (lnea continua). Como puede verse, el sistema veri ca la condicion exigida por el teorema de la peque~na ganancia, y por tanto tendra una estabilidad robusta. En la gura 8.11 pueden verse las respuestas obtenidas para la planta nominal y la real, observandose el efecto de la incertidumbre. Si se modi ca el controlador (regulador 2), de modo que este sea ahora,
K (s) = 32(ss++21) el test de la estabilidad robusta derivado del teorema de la peque~na ganancia no se cumple, tal y como puede verse en la gura 8.12. Sin embargo, dicho teorema solo aporta una condicion su ciente, y como se observa a partir de la respuesta temporal del sistema con la incertidumbre dada en la gura 8.13, el sistema realmente s
180
Estabilidad robusta 60
Incertidumbre y tolerancia (dB)
40
20
0
-20
-40
-60
-80 10 -1
10 0
10 1
10 2
rad/s
Figura 8.10: Tolerancia e incertidumbre multiplicativa con el regulador 1 1.4
1.2
respuestas
1
0.8
0.6
0.4
0.2
0 0
1
2
3
4
5
6
7
8
9
10
tiempo (seg)
Figura 8.11: Respuestas con regulador 1 del sistema nominal y del real
El problema del control robusto
181
60
Incertidumbre y tolerancia (dB)
40
20
0
-20
-40
-60
-80 10 -1
10 0
10 1
10 2
rad/s
Figura 8.12: Tolerancia e incertidumbre multiplicativa con el regulador 2 2.5
respuestas
2
1.5
1
0.5
0 0
1
2
3
4
5
6
7
8
9
10
tiempo (seg)
Figura 8.13: Respuestas con regulador 2 del sistema nominal y del real
182
Estabilidad robusta
veri ca la condicion de estabilidad robusta, ya que aunque la respuesta temporal sea poco amortiguada, s es estable. Si se considera E (s) una incertidumbre no estructurada y el sistema es lineal e invariante en el tiempo, se tiene el siguiente teorema que da condiciones necesarias y su cientes para la robustez de la estabilidad (rs) del sistema de control en lazo cerrado (Freudenberg et al, 1988; Morari et al, 1989)
Teorema: Supuesto el sistema de interconexion M (s) estable, y que la incer-
tidumbre E (s) es de tal clase que el sistema en lazo cerrado es estable si y solo si la proyeccion del determinante det[I M (s)E (s)] a lo largo del contorno de Nyquist D no envuelve al origen. Entonces, el sistema en lazo cerrado sera estable para todas las incertidumbres E (s) tales que: [E (j!)] 1 si y solamente si, se cumple alguna de las siguientes condiciones equivalentes : det[I M (j!)E (j!)] 6= 0 8 ! = [E (j!)] 1 , [M (j!)E (j!)] < 1 8 ! = [E (j!)] 1 , [M (j!)] < 1 8! , kM k1 < 1 En el caso de que la incertidumbre tenga una estructura diagonal de bloques, de nida por el conjunto: (8:9) X = fE (s) = diag fEi(s)g = [Ei (s)] g el analisis de la robustez de la estabilidad (rs) con el resultado del teorema anterior puede dar un resultado potencialmente conservativo, en el sentido de que suponga solo una condicion su ciente. Se tiene sin embargo, el siguiente teorema de robustez de la estabilidad (rs) menos conservador, al tener en cuenta la estructura de E (s) (Morari et al, 1989; Freudenberg et al, 1988):
Teorema: Supuesto el sistema de interconexion M (s) estable, y que la in-
certidumbre E (s) es de tal clase que el sistema en lazo cerrado es estable si y solo si la la proyeccion del determinante det[I M (s)E (s)] a lo largo del contorno de Nyquist D no envuelve al origen. Entonces, el sistema sera estable en lazo cerrado para todas las incertidumbres E (s) 2 X=1 si y solo si: [M (j!)] < 1 8! La de nicion de (M ) (valor singular estructurado ssv, apendice B.3) supone una generalizacion del radio espectral (M ) y del maximo valor singular (M ).
El problema del control robusto
183
Analisis de robustez con los valores singulares Como se ha presentado en apartados anteriores, hay diversas causas que originan la existencia de incertidumbre en el modelo de la planta. Siendo de interes practico el que, a la hora de plantear las especi caciones de dise~no, se tenga en cuenta el conocimiento que se posea sobre la incertidumbre. El planteamiento de un metodo, para el analisis de robustez de la estabilidad de un sistema de control, puede establecerse de modo generico como sigue: 1. Supuesta un tipo de incertidumbre en el modelo del proceso, se situa en el lugar del lazo donde se presuma que actue o pueda quedar re ejado su efecto. 2. El conocimiento que se tiene sobre la incertidumbre puede consistir en un cota superior de la magnitud de la incertidumbre como funcion de la frecuencia (no estructurada): [E (j!)] < e(!) 3. Se realizan las transformaciones adecuadas para llegar a la forma estandar de analisis ( gura 8.9), con el sistema de interconexion y la incertidumbre en dos bloques. 4. Por el teorema de la peque~na ganancia se tiene que una condicion su ciente (no necesaria) para que el sistema sea estable para ciertos niveles de incertidumbres es que: (EM ) < 1 8! o tambien: (E ) < (1M ) As por ejemplo, para una incertidumbre multiplicativa considerada a la salida de la planta, el sistema de interconexion es: M = GK (I + GK ) 1 y el test para la robustez se reduce a: (E ) < [I + (L) 1 ] Se demuestra en la practica, que los tests para robustez de la estabilidad bajo ciertas caractersticas de la incertidumbre dan condiciones excesivamente conservadoras.
184
Estabilidad robusta
Para el caso de un sistema 2 2 el analisis con i (M ) supone implcitamente que la incertidumbre actuante sobre el sistema sea en el caso mas desfavorable de la forma: caso a)
"
#
e11 (s) e12(s) e21 (s) e22(s)
Mientras que la incertidumbre podra darse de una forma mas estructurada, donde las incertidumbres en cada canal sean independientes entre s, sin que se afectaran con terminos de acoplamiento: caso b)
"
e1 (s) 0 0 e2(s)
#
O incluso que dichas incertidumbres fueran iguales en ambos canales: caso c)
"
e(s) 0 0 e(s)
#
Tambien, en algunos casos, puede ocurrir que el conocimiento que se tenga de la incertidumbre consista en posibles intervalos donde se encuentren los parametros con incertidumbres del modelo del sistema, en cuyo caso se tratara de una incertidumbre muy estructurada o parametrica: caso d)
2 66 k..1 .0. : : : 4 . . 0 0 :::
3
0 7 ... 7 5 kn
En los sistemas reales puede darse en general una combinacion de los distintos tipos de incertidumbre, pudiendo ser considerada parte como estructurada y parte como no estructurada. Segun el conocimiento que se posea del tipo de incertidumbre al que este sometido el sistema, se empleara unas determinadas herramientas de calculo para el analisis de la robustez de la estabilidad. As para estimar los niveles (o tolerancias) de incertidumbre permitidos, para los que el sistema mantiene su estabilidad, se propone emplear en cada caso:
El problema del control robusto
185
caso a) El valor singular maximo del sistema de interconexion (M ): 1 (M ) caso b) El valor singular estructurado de M : 1 (M ) caso c) El radio espectral de M :
1 (M ) caso d) El valor singular estructurado real de M (Packard y Doyle, 1993): 1 R(M ) Se comprueba, que el conservadurismo decrece de a) hacia d), con lo que el conocimiento (a priori) que se suministre sobre el tipo de incertidumbre existente en el modelo del sistema va a ser de suma importancia.
Ejemplo: Robustez frente a incertidumbre parametrica Considerese un sistema de control con realimentacion unitaria, cuya planta G y su regulador proporcional K estan dados respectivamente por,
G(s) = s2s(s++ba) ; K (s) = k Los valores de los parametros b; a; k se consideran constantes durante largos perodos de tiempo, pero por otro lado son desconocidos. Estando caracterizada la incertidumbre por los intervalos, 3 b 5; 0:5 a 0:5 5 k 15 Que puede a su vez ponerse de una forma conveniente para el calculo del sistema de interconexion M , as como para que la incertidumbre este normalizada, es decir, (E ) 1; 8 !
186
Estabilidad robusta
Para ello, se hace:
b = bo + b1 1; j 1 j 1; bo = 4; b1 = 1 a = ao + a1 2; j 2 j 1; ao = 0; a1 = 0:5 k = ko + k1 3; j 3 j 1; ko = 10; k1 = 5 De esta forma, el bloque de incertidumbre E es una matriz diagonal constituida por numeros reales con valor absoluto inferior o igual a la unidad,
E = diagf1; 2 ; 3g 1.2
sv(M), mu_real(M)
1
sv(M)
0.8
0.6
0.4 mu_real(M) 0.2
0 10 -1
10 0
10 1
10 2
rad/s
Figura 8.14: Analisis de robustez para incertidumbre parametrica Los valores de bo ; b1 ; ao; a1; ko; k1 se han incluido en M , y dado que (E ) 1, la condicion su ciente para que el sistema tenga una estabilidad robusta es que,
(M ) 1; (caso mas conservador) o si se tiene en cuenta el caracter parametrico de la incertidumbre, la condicion es
R(M ) 1; (caso de incertidumbre parametrica)
El problema del control robusto
187
En la gura 8.14 se tienen ambos valores; observandose que mientras a partir del analisis con (M ) no se cumple la condicion su ciente de estabilidad robusta, esta s se veri ca si se emplea R(M ). En el primer caso se esta considerando una situacion excesivamente conservadora e irreal, mientras que en el segundo caso se esta explcitamente considerando que la incertidumbre es de tipo parametrica.
8.5 Comportamiento robusto Dentro de las especi caciones de dise~no hay que considerar el comportamiento nominal (np) deseado del sistema en lazo cerrado. Este alude a aspectos relacionados con el rechazo a perturbaciones externas actuantes sobre el sistema, a la reduccion de los errores de seguimiento, al esfuerzo de control y a un comportamiento adecuado aun en el caso de peque~nas variaciones en los parametros del modelo nominal de la planta. Como se ha visto anteriormente, una forma analtica de expresar los requerimientos anteriores es mediante una relacion frecuencial basada en el modelo nominal de la planta, de la forma: [WS (j!)S (j!)] 1 (8:10) donde WS (j!) es una funcion (matriz) de ponderacion que pone de mani esto los per les deseados de la funcion de sensibilidad S (j!) en las distintas regiones de frecuencia. Si el per l deseado es el mismo en todos los canales (especi cacion homogenea) entonces: WS (s) = wS (s)I y queda:
[S (j!)] j w (1j!) j S El problema de analisis del comportamiento robusto (rp), consiste en determinar si el sistema en lazo cerrado satisface las especi caciones de comportamiento para todas las posibles plantas G0(s) 2 G . Sera determinar si se cumple:
[WS (j!)S 0(j!)] 1 supuesto que se veri ca 8.10 para la planta nominal G(s). Dada la representacion del sistema de la gura 8.15, en la que se tienen caracterizadas las incertidumbres por ET (s); y donde se especi ca un np para el sistema nominal expresado mediante una relacion entre dos se~nales (vectores) v y w, por
188
Comportamiento robusto
ET
w -
M
v-
Figura 8.15: Analisis del comportamiento robusto medio de: v = ES 1 w. Se tiene el siguiente teorema de robustez del comportamiento (rp) (Freudenberg et al, 1989; Morari et al, 1989):
Teorema: Dado el sistema M(s) de la gura 8.15, supuesto estable y obtenido con el modelo nominal de la planta, sujeto a la incertidumbre ET , con (ET ) 1. El sistema satisface la condicion de comportamiento robusto si y solo si:
(M ) < 1 8! donde (M ) se calcula con respecto a la incertidumbre estructurada de forma diagonal E = diag fET ; ES g; siendo ES (s) una incertidumbre cticia con [ES (j!)] 1, la cual esta relacionada con el comportamiento nominal deseado. En el teorema anterior se realiza la transformacion del problema de rp en uno de rs equivalente, con un bloque adicional de incertidumbre. Se hace al transformar la especi cacion de np en lazo cerrado (expresada como una relacion entre dos se~nales w y v), en una incertidumbre cticia representada por ES (ver gura 8.16) (Doyle 1983, Morari et al. 1989, Freudenberg 1989). Con lo expuesto hasta ahora, los requerimientos para un sistema de control pueden escalonarse en cuatro niveles de complejidad o exigencia: 1. El primero es el mas elemental e imprescindible: la estabilidad del sistema nominal (ns). 2. A continuacion esta el conseguir un comportamiento nominal (np) deseado. 3. El tercer objetivo consiste en gozar de una estabilidad robusta (rs).
El problema del control robusto
189
ES ET
w -
E
M
v
Figura 8.16: Equivalencia entre comportamiento robusto y estabilidad robusta 4. Y nalmente, que el comportamiento deseado se mantenga aun con la existencia de incertidumbres, lo que supone un comportamiento robusto (rp). Si se realiza una particion del sistema de interconexion (caso de rs para incertidumbres simultaneas, o rp para un tipo de incertidumbre actuando sobre la planta): " # M M 11 12 M (s) = M M 21
22
de forma que M (s) incluye el escalado apropiado para que la incertidumbre este normalizada: [E (s)] < 1, los objetivos anteriores pueden analizarse a partir de M (s) empleando en cada caso (Skogestad et al, 1988; Freudenberg, 1989):
ns: M es estable np: (M22 ) < 1 8 ! rs: Segun sea estructurada o no estructurada la incertidumbre ET : (M11 ) < 1 o (M11 ) < 1 8 !
rp: (M ) < 1 8 !
190
Robustez de plantas con fuerte ganancia direccional
8.6 Robustez de plantas con fuerte ganancia direccional A diferencia de los sistemas escalares, un proceso multivariable se caracteriza porque la ganancia que el sistema mani esta para una determinada perturbacion y/o consigna va a depender de la direccion espacial que esta tenga, dado su caracter vectorial. Potencialmente puede haber una fuerte discrepancia entre las ganancias de la planta para dos se~nales actuando en distintos canales o lazos. Una medida de la direccionalidad de la planta se obtiene del numero de condicion de su matriz de transferencia G(s), de nido como: (j!)] [G(j!)] = [[G G(j!)] un valor elevado de (G) implica una fuerte dependencia direccional de G. Las matrices con elevados numeros de condicion estan numericamente mal condicionadas para el calculo de su inversa. Empleando este resultado, se dice que un sistema esta mal condicionado para ciertas frecuencias si su matriz de transferencia, a esas frecuencias, tiene un numero de condicion elevado. Si este es proximo a uno, se dice que el sistema esta bien condicionado. Los valores singulares de las matrices no son independientes de escalados, por lo que el numero de condicion de una planta va a depender de las unidades empleadas a la entrada y a la salida de la planta. Un controlador que compense la direccionalidad acusada de una planta, aplicando se~nales de control elevadas en la direccion donde la ganancia del sistema es baja, puede dar buenos resultados si el modelo del proceso es muy preciso. Pero si debido a las incertidumbres, la direccion del vector de control, de elevada magnitud, generado no coincide exactamente con la direccion de baja ganancia de la planta, entonces la ampli cacion de las se~nales de control pueden ser mucho mayores que las esperadas con el modelo; resultando un comportamiento nada satisfactorio del sistema de control. Los problemas para el control de una planta con incertidumbres y una direccionalidad acusada, se ponen especialmente de mani esto, cuando se analiza la robustez de la estabilidad frente a incertidumbres simultaneas y/o la robustez del comportamiento del sistema de control. Como se ha visto en el apartado anterior, en ambos casos la herramienta de analisis es el valor singular estructurado del sistema de interconexion M (s).
El problema del control robusto
191
Cuando se tienen dos fuentes de incertidumbre separadas, o cuando se especi ca un comportamiento deseado para un proceso con una incertidumbre dada, el sistema de interconexion queda de la forma: " # M ( s ) M ( s ) 11 12 M (s) = M (s) M (s) 21 22 y la incertidumbre equivalente: " # E ( s ) E ( s ) 11 12 E (s) = E (s) E (s) 21 22 dado que si (E ) , la condicion de estabilidad robusta para el sistema es: (M ) < 1 8 ! entonces como: (M ) max f(Miig i ocurre que el margen de estabilidad frente a incertidumbres simultaneas no va a ser mejor que los margenes frente a cada tipo de incertidumbre actuando sola. Resulta interesante obtener cotas de (M ) expresadas en funcion de los valores singulares de los elementos Mij , de forma que puedan emplearse para facilitar el dise~no y analisis. Con este objetivo, se dan los siguientes resultados (Freudenber 1989): (M ) [(M12 )(M21 )]1=2 max f(M11 ); (M22 )g (M ) [(M12 )(M21 )]1=2 + max f(M11 ); (M22 )g En las ecuaciones anteriores puede verse la dependencia de la robustez del sistema de los elementos Mij ; i 6= j . Si ocurre que: [ (M12 )(M21 )]1=2 1 (8:11) maxf(M11 )(M22 )g el sistema sera mucho mas sensible a incertidumbres simultaneas que a las mismas actuando de forma individual. Por ello, aunque se tenga garantizada la robustez frente a cada incertidumbre individual (elementos Mii , (Mii ) < 1) pueden existir un par de peque~nas incertidumbres que actuando simultaneamente causen la inestabilidad del sistema, siempre que: [ (M12 )(M21 )]1=2 1 (8:12)
192
Robustez de plantas con fuerte ganancia direccional
- EI r- h - 6
K
ES
- ?h-
-r
G
- ?h
r r y-
Figura 8.17: Incertidumbres para problema de comportamiento robusto. y por tanto:
(M ) [(M12 )(M21 )]1=2 1
Los sistemas que, al menos potencialmente, pueden llevar con mas facilidad a la condicion anterior, son aquellos que tengan plantas mal condicionadas; especialmente si no se toman algunas precauciones a la hora del dise~no. El problema de analizar la robustez en la estabilidad de un sistema con incertidumbres multiplicativas a la entrada y a la salida actuando simultaneamente, o el de analisis del comportamiento robusto de un sistema con incertidumbre multiplicativa a la entrada, son especialmente crticos, y ponen de mani esto lo dicho anteriormente. Para el sistema de la gura 8.17 se trata de analizar la robustez en el comportamiento del sistema. Se supone que los errores de modelado de la planta pueden expresarse como una incertidumbre multiplicativa a su entrada:
EI (s) = wI (s)I (s)
[I (j!)] 1 8!
y que la especi cacion de comportamiento nominal puede expresarse mediante una incertidumbre ctcia equivalente (ver gura 8.18):
ES (s) = wS (s)S (s) Se obtiene que:
"
[S (j!)] 1 8!
# " # a1 = M b1 a2 b2
El problema del control robusto
193
a1
-
I (s)
a2
-
S (s)
M (s)
b1 b2
Figura 8.18: Problema de estabilidad robusta equivalente. siendo el sistema de interconexion:
"
I wI M = S TGw o I
KSo wS SowS
#
si G(s) es invertible, el termino M12 puede ponerse como: M12 = TI G 1. Si se supone que los elementos M12 ; M21 cumplen las condiciones 8.11 y 8.12 se tendra que (M ) 1, y como: [(M )]1=2 (So wI G)(TI wS G 1) (SowI )(TI wS )(G) se pone de mani esto el hecho de que si la planta tiene una acusada ganancia direccional ((G) elevado), la estabilidad del sistema experimentara una mayor sensibilidad a incertidumbres simultaneas. Otras relaciones de interes, que ponen de relieve lo anterior, a la vez que tambien incluyen el efecto de la ganancia direccional del controlador dise~nado, se dan a continuacion (Freudenberg 1989, Morari et al. 1989):
(M ) (wS So) + (wI To ) (M ) (wI TI ) + (wS SI ) (M ) (wI TI ) + (1 + p )(wS So)
194
Robustez de plantas con fuerte ganancia direccional
q (M ) maxf(wI TI ); (wS So)g + (wI TI )(wS So )
= min f(G); (K )g Las expresiones anteriores pueden ayudar durante el dise~no, pero hay que tener en cuenta que si se emplean para analizar directamente la robustez del sistema, pueden llevar a dise~nos muy conservadores, debido a que para plantas con marcada ganancia direccional la cota puede estar excesivamente sobre-estimada. Sera conveniente por tanto, de cara al dise~no nal, calcular el valor de (M ) de forma directa.
Ejemplo: Planta con fuerte ganancia direccional Sea la siguiente matriz de transferencia G(s), correspondiente a un proceso multivariable compuesto de dos entradas y dos salidas
"
0:864 G(s) = 75s1+ 1 01::878 082 1:096
#
Este sistema reune especialmente las caractersticas anteriormente citadas sobre la fuerte ganancia direccional. Con la peculiaridad de que su numero de condicion toma un valor elevado y constante, de 141.3, para todo el rango de frecuencias. Es pues, un ejemplo de lo que se denomina una planta mal condicionada, o sea con valores de (G) 1 en el rango de frecuencias de interes. En la gura 8.19 pueden verse sus ganancias extremas o valores singulares en funcion de la frecuencia. Tambien se muestran la parte real (curva continua) y la parte imaginaria (curva de trazos) de los elementos de la matriz de ganancia relativa (rga) (ver apendice B.5) en la gura 8.20.
El problema del control robusto
195
20
Ganancias extremas de G
0
-20
-40
-60
-80
-100
-120 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
rad/s
Figura 8.19: Ganancias extremas para planta con fuerte ganancia direccional 40
40 RGA(G_11)
20
20
0
0
-20
-20
-40 10 -5
10 -2
10 1
10 4
-40 10 -5
RGA(G_12)
10 -2
rad/s 40
20
20
0
0
-40 10 -5
10 -2 rad/s
10 4
rad/s
40
-20
10 1
RGA(G_21)
-20
10 1
-40 10 -5
10 4
RGA(G_22)
10 -2
10 1
10 4
rad/s
Figura 8.20: Parte real e imaginaria de los elementos de la matriz de ganancia relativa (rga).
196
Robustez de plantas con fuerte ganancia direccional
Captulo 9 Metodos de dise~no LTR 9.1 Introduccion El metodo de dise~no de sistemas de control denominado Recuperacion de la funcion de Transferencia del Lazo abierto (ltr),1 surgio como consecuencia del objetivo de mejorar la robustez de los controladores basados en el procedimiento Lineal Cuadratico Gaussiano (lqg) (Doyle y Stein, 1979). Posteriormente, la teora en torno a ltr ha transcendido de sus orgenes, constituyendo una metodologa de dise~no sistematica y exible para sistemas de control tanto escalares como multivariables. Durante la decada de los ochenta tuvo su epoca de desarrollo e implantacion (Athans, 1986; Stein y Athans, 1987; Maciejowski, 1985), y sigue siendo un tema de investigacion y estudio (Zhang y Freudenberg, 1993; Saberi et al, 1993; Saeki, 1992). Como se ha presentado en el captulo anterior, las especi caciones de dise~no pueden plantearse en el dominio de la frecuencia. En este captulo se trata el problema del ajuste de las ganancia del sistema en lazo abierto, a n que cumplan unas especi caciones de dise~no dadas. El metodo de dise~no basado en la teora lqg, junto con un procedimiento para recuperar cierta funcion de transferencia en lazo abierto especi cada, constituye la tecnica conocida como lqg/ltr. Un controlador basado en observador (cbo) cumple el Principio de Separacion, proporcionando a la hora del dise~no la division de este en dos problemas independientes: 1
Loop Transfer Recovery en terminologa inglesa
197
198
Propiedades del regulador LQR
1. Dise~no del controlador por realimentacion de estados. 2. Dise~no del observador para reconstruir el estado a partir de la medida de la respuesta del sistema. Por tanto, si el sistema de control con realimentacion de estados (lqsf)2 es estable en lazo cerrado y tiene un comportamiento nominal adecuado, ello garantiza las mismas propiedades para el sistema nominal con cbo. Sin embargo, con la presencia de incertidumbres en el modelo, el regulador con el vector de estados estimado (lqsef)3 no lleva necesariamente al mismo comportamiento obtenido por realimentacion de estados, as como tambien puede haber un deterioro de las propiedades de robustez con respecto al regulador lqsf (Doyle y Stein, 1981). Surge de esta forma, la motivacion de desarrollar estructuras de control basadas en observador (cbo), u otras no basadas en observador (cnbo), que mantengan o al menos conserven la parte esencial, de las propiedades que caracterizan al dise~no basado en la realimentacion de estados (lqsf), o a su problema dual, el ltro de Kalman (kbf). En este captulo se presentan dos estructuras empleadas en el dise~no ltr. Una basada en observador (cbo) y otra no basada en observador (cnbo).
9.2 Propiedades del regulador LQR Como se ha visto en el captulo 8, para un proceso que pueda describirse por un modelo lineal e invariante en el tiempo, el comportamiento del sistema en lazo cerrado y su robustez van a depender de ciertas funciones (matrices) de transferencia asociadas al sistema de control, tales como la funcion de sensibilidad S (s) y su complementaria T (s). A la vez, como se ha descrito en el captulo anterior, estas se pueden expresar a partir de la funcion (matriz) de transferencia en lazo abierto L(s). Basado en lo anterior, una manera de formular las especi caciones de dise~no consiste en de nir la funcion (matriz) de transferencia en lazo abierto deseada (ftlad) Lt (s). El problema sera encontrar un controlador con una estructura determinada que proporcione la ftlad. 2 3
linear quadratic state feedback en la terminologa inglesa. linear quadratic state estimated feedback en la terminologa inglesa.
Metodos de dise~no LTR
199
En la literatura se han sugerido dos metodos para obtener Lt (s) que proporcionan unas caractersticas muy aceptables. Una se basa en el empleo de la teora de control optimo cuadratico (lqr), y la otra esta basada en la teora del ltro Kalman (kbf). La ventaja esgrimida para el empleo de estos metodos es que el sistema adquiere, de forma automatica, ciertas propiedades muy estimables desde el punto de vista del comportamiento nominal y de la robustez de la estabilidad.
Obtencion de la ftlad a traves de lqr Suponiendo que se conoce un modelo de la planta, expresado en el espacio de estados por el conjunto de ecuaciones:
x_ = A x + B u y = Cx (9.1) donde se supone tambien, que las ecuaciones anteriores incluyen posibles escalados y/o ampliaciones realizadas sobre el modelo de la planta, a fn de adecuarla para el dise~no. El comportamiento deseado del sistema puede especi carse de forma conveniente mediante la optimizacion de una funcion de coste J . Si se de ne el vector:
z = Mx en el que sus componentes son combinaciones lineales de las variables de estado (M es una matriz constante de dimensiones adecuadas); y las matrices de ponderacion: Q = QT 0 Rc = RcT > 0 se trata de minimizar: Z1 J = (zT Qz + uT Rcu)dt 0 Z1 = (xT M T QMx + uT Rcu)dt (9.2) 0
El problema anterior es el llamado lqr, cuya solucion es de la forma:
u = Kcx denominandose a Kc matriz de realimentacion de estados. A partir de la solucion Pc de la ecuacion algebraica de Riccati de control (AREc) siguiente: AT Pc + PcA PcBRc 1 B T Pc + Qc = 0 (9:3)
200
Propiedades del regulador LQR
G(s)
r - as B - 6 b s
(s)
Kc
C
y
-
x
Figura 9.1: Estructura regulador lqr (lqsf) con se obtiene: siendo:
Qc = M T QM Kc = Rc 1B T Pc Pc = PcT 0
El problema tendra solucion Pc y sera unica, si el par (A; B ) es estabilizable (todos los modos inestables son controlables). Se de ne Hc(s), como la funcion (matriz) de transferencia en lazo abierto entre la entrada a la planta y la se~nal de retorno. Es la relacion entre la se~nal que entra por el punto\a" y la que retorna por el punto\b" de la gura 9.1. Se denomina Funcion de Relacion del Retorno o de Lazo Abierto:
Hc(s) = Kc(s)B donde: (s) = (sI A) 1 , y la correspondiente Funcion de Diferencia del Retorno: Fc(s) = I + Hc(s) A partir de la ecuacion AREc y de algunas manipulaciones algebraicas (MacFarlane 1979), se obtiene:
FcT ( s)RcFc(s) = Rc + GTc ( s)QGc(s) con:
Gc(s) = M (sI A) 1B
(9:4)
Metodos de dise~no LTR
201
En el caso de que:
Rc = I
se obtiene:
FcT ( s)Fc(s) I (9:5) mostrando Safonov y Athans (1977) que la desigualdad anterior garantiza para el sistema un margen de fase (MF) mnimo de 60 (se admite un cambio de fase de al menos 60 simultaneamente en cada canal sin que produzca la inestabilidad del sistema), un margen de ganancia (MG) in nito (frente a variaciones en forma de valor real > 1, o modi cacion de la ganancia en continua, generados de forma simultanea en todos los canales sin que el sistema pierda su estabilidad nominal) y un margen de tolerancia para reduccion de la ganancia (TRG) de hasta 6db (reduccion simultanea de la ganancia 0:5 < 1, o sea de hasta el 50% de su valor nominal, en cada canal sin que desestabilice al sistema de control). De 9.5 se desprende que: y por tanto: como: se tendra que:
i (FcH Fc) 1 (FcH Fc) 1
(FcH Fc) (FcH )(Fc) = 2(Fc)
2 (Fc) 1 ) (Fc) 1 dada la relacion Si = Fc 1, y teniendo en cuenta la propiedad de los valores singulares de una matriz no singular P (P 1) = (1P ) se obtiene: (Si) 1 (9:6) lo cual tiene la interpretacion fsica en el caso escalar, de que el sistema no ampli cara las perturbaciones actuantes a la salida de la planta. Por otro lado teniendo en cuenta que: Ti(s) = I Si(s) con lo que: (Ti) (I ) + (Fc 1) 1 + (1F ) c 1 + 1=1 = 2
(9.7)
202
Propiedades del regulador LQR
La desigualdad 9.7, puede interpretarse como una medida de la robustez de la estabilidad para el caso de incertidumbre multiplicativa no estructurada existente a la entrada de la planta. De forma que, a partir del teorema de peque~na ganancia (ver captulo 8), una condicion su ciente para que el sistema permanezca estable para una incertidumbre no estructurada E (s) es que: (E ) (1T ) i ya que en este caso, M (s) = Ti(s), y por tanto: (E ) 21 lo que fsicamente equivale a decir que el sistema de control puede aceptar hasta un 50% de incertidumbre relativa en la planta, manteniendo la estabilidad. Otra caracterstica de Hc(s) es que para algun par de numeros reales f; !og se cumple: (Hc) ! ; 8 ! > !o lo que se traduce en la propiedad de una cada de la ganancia del sistema de 20 db=dec a alta frecuencia. En resumen, puede decirse que el controlador lqr tiene las siguientes propiedades:
Ley de control optima. Amplios margenes de fase (MF) y ganancia (MG), (TRG). Robustez de la estabilidad (rs) frente a incertidumbres de tipo multiplicativo
situadas a la entrada de la planta. Respuesta en frecuencia en lazo abierto con una pendiente de cada suave a alta frecuencia.
Las propiedades anteriores son todas, salvo la ultima, muy atractivas para un sistema de control. Sera deseable ademas, si ello fuera posible, que manteniendo las tres primeras casi sin alteracion, se consiguiera un aumento de la pendiente de cada a alta frecuencia. Es en esa zona donde se mani estan fundamentalmente los errores de modelado, con lo que se reforzara la robustez frente a la dinamica inmodelada de alta frecuencia.
Metodos de dise~no LTR
203
Ajuste de las ganancias principales Como se ha visto para el problema lqr la matriz de transferencia de diferencia de retorno Fc(s) cumple la igualdad 9.4; si se supone, sin perdida de generalidad (bastara con escalar la entrada al sistema), que Rc = I , queda:
FcT ( s)Fc(s) = Rc + GTc ( s)QGc (s)= de la cual se deduce que (Doyle et al. 1981, Maciejouski 1989):
"
#1=2
2 i (Fc) = 1 + i (Q1=2 Gc)
(9:8)
y de esta se obtienen las siguientes expresiones para los valores singulares extremos:
# 1 = 2 (Fc 1 + (Q Gc) # " 1 1 = 2 (Fc ) = 1 + (Q Gc) 1) =
"
1=2
1=2
De las ecuaciones anteriores se deriva la posibilidad de modi car los valores singulares o ganancias principales de Fc 1 = Si, actuando sobre la matriz Q y el escalar . Si en el rango de frecuencias de interes ! 2 D! se cumple:
(Hc) 1 la expresion 9.8 se reduce a:
i (Hc) i (Qp Gc) 1=2
(9:9)
la relacion 9.9 puede emplearse para realizar ajustes de Hc(s) en una doble vertiente: a) El valor del parametro modi ca de forma simultanea todas las ganancias principales. b) La matriz Q puede emplearse para modi car solo una de las ganancias principales dejando el resto inalteradas, por medio del empleo de las propiedades de los valores y vectores singulares (ver apendice B.3).
204
El controlador LQG
Ajuste de i (Hc) para un\i" dado Dado el producto de matrices de orden m p
Q1=2 Gc(j!) para una frecuencia particular ! = !1 , es posible descomponerla en sus valores singulares: r X Q1=2 Gc(j!1) = U V H = uii viH ; r = minfm; pg i=1
si se modi ca Q1=2 en la forma:
Q1=2 = Q1=2 (I + uj uHj ) teniendo en cuenta la propiedad de los vectores singulares
uj uHi se obtiene:
=
(
0 si i 6= j 1 si i = j
)
Q1=2 Gc(j!1) = (PI + uj uHj ) Pri=1 uii viH = ri6=j uiiviH + (1 + )uj j vjH
con lo que unicamente se modi ca la ganancia principal j que pasa de j a (1+ )j . Por tanto, bajo la hipotesis 9.9 se tiene una forma explcita de manipular los i(Hc) de forma independiente o unilateral para un\i" dado.
9.3 El controlador LQG El regulador lineal cuadratico gausiano (lqg) es un procedimiento basicamente formulado en el dominio temporal, y con tratamiento en lazo cerrado. Sin embargo, puede tambien plantearse como un procedimiento de optimizacion en el dominio frecuencial, tal y como se presenta en esta seccion, as como siguiendo el enfoque dado en el apendice A.3. En este apartado se describe en primer lugar el procedimiento de dise~no lqg, y a continuacion se pasa al principal interes de este captulo: los metodos de dise~no de control robusto denominados en general ltr. Se realiza para ello una formulacion en el espacio de estados, y un tratamiento en el dominio de la frecuencia a la hora de formular los objetivos de dise~no.
Metodos de dise~no LTR
r- i - 6
205
us
-
sy -
Planta
u^ Kc
s
(s)
-
?i
B
Ko
i 6-
C
Figura 9.2: Estructura regulador lqg/ltr-i Si el sistema se encuentra sometido a perturbaciones estocasticas y/o el vector de estado no es accesible, se emplea un observador para estimar los estados. Caso de elegir como observador el ltro de Kalman (kbf), se denomina al metodo lqg. Este tiene la ventaja de que minimiza la varianza del error de estimacion a partir de la caracterizacion de los ruidos, de los que se suponen conocidas las matrices de covarianza. En la gura 9.2 se muestra la estructura del controlador lqg. Si el modelo de la planta junto con las perturbaciones estocasticas se puede representar por el conjunto de ecuaciones: x_ = A x + B u + v1 y = C x + v2 (9.10) siendo v1 ; v2 realizaciones de ruido blanco gausiano caracterizados por: E [v1 ; v1T ] = W 0 ; E [v2; v2T ] = Ro > 0 ; E [v1 ; v2T ] = 0 donde W; ; Ro son conocidos, estimados o elegidos de forma arbitraria de cara al dise~no del observador. La solucion del problema lqg se hace dividiendolo en dos subproblemas independientes (Principio de Separacion) (Gopal, 1982): 1. El problema de control: resuelto como lqr. Suponiendo que el vector de estados estimado coincide con el del proceso.
206
El controlador LQG
2. Y el problema del observador: resuelto como kbf. Para un modelo exacto de la planta, la estabilidad del sistema controlado por realimentacion de estados (lqr, o tambien nombrado como lqsf) garantizara tambien la del sistema empleando el vector de estados estimado (lqsef). Para resolver el subproblema del observador ( ltro Kalman): x^_ = A x^ + B u + Ko (y y^) y^ = C x^
(9.11)
se necesita encontrar la matriz de ganancia del observador Ko. Para ello se resuelve la ecuacion algebraica de Riccati del observador (AREo):
APo + PoAT PoC T Ro 1CPo + Qo = 0 con:
Qo = V1
T
(9:12)
; Ko = PoC T Ro 1
Para (A; C ) detectable (todos los modos inestables son observables) hay una solucion Po unica de 9.12, con Po = PoT 0 De las ecuaciones del modelo de la planta 9.1, del observador 9.11, y la ley de control: u = Kcx^ se puede de nir el error de estimacion :
= x x^ resultando
" # " #" # x_ = A BKc BKc x _ 0 A Ko C
lo que indica que los polos del sistema en lazo cerrado son la union de los polos correspondientes a la ley de control (lqr) y los polos del observador (kbf). El compensador lqg queda:
K (s) = Kc(sI A + BKc + KoC ) 1 Ko y la ftla de nida a la entrada de la planta:
L(s) = K (s)G(s)
(9:13)
Metodos de dise~no LTR
207
Es un hecho remarcado en la literatura, que el empleo de estimadores de estados puede deteriorar la robustez del sistema, as como su comportamiento en lazo cerrado si no se tienen modelos muy precisos de la planta. La circunstancia de tratar de mejorar la robustez de un sistema lqg fue lo que originalmente provoco el desarrollo de la metodologa lqg/ltr. Al incluir el estimador de estados, potencialmente pueden deteriorarse las propiedades del control lqr, o lo que es lo mismo de la ftla (L(s)) con respecto a la ftlad (Lt (s)).
9.4 Controlador LTR basado en observador Como se describe en el captulo 8, las especi caciones de dise~no pueden realizarse a traves de expresiones o cotas para ciertas funciones (matrices) de transferencia en lazo abierto (ftla). Dependiendo de en que puntos se de nan tales ftla, normalmente a la entrada o a la salida de la planta, se empleara una estrategia de dise~no diferente. El metodo se denominara lqg/ltr-i, si se considera a la entrada de la planta, y lqg/ltr-o si es a la salida, o tambien conocidos como metodos ltr basados en observador, por derivarse tales metodos de la teora relacionada con los reguladores lqg, la cual emplea un ltro de Kalman (observador de estado) para estimar el vector de estado.
9.4.1 Metodo LQG/LTR-i Existen diferentes metodos para realizar la llamada recuperacion de la funcion de transferencia en lazo abierto (Saberi et al, 1993), en este apartado se emplea el procedimiento introducido por Doyle y Stein (1979); y que consiste en modi car los parametros libres de dise~no del observador, de forma que la ftla recupere las caractersticas frecuenciales de la ftlad. Esto se consigue, en el caso de sistemas de fase mnima (todos sus ceros se encuentran en el semiplano izquierdo), haciendo depender la matriz de covarianza del ruido en el proceso de un parametro escalar\q", llamado ganancia de recuperacion (gain recovery): Qo = Qo + qZ siendo Z = Z T 0 una matriz arbitraria. Para el caso de sistema de fase mnima (ver apendice A.2), se demuestra (Stein y Athans, 1987) que: 1 qlim !1 K (s)G(s) = Kc(sI A) B = Hc(s)
208
Controlador LTR basado en observador
El controlador lqg/ltr: K (s), sustituye la dinamica de la planta por la dinamica deseada, y de nida por Hc(s). Los ceros de K (s) corresponden a los ceros de Hc(s), y algunos de sus polos se emplean para cancelar los ceros de la planta G(s). Es por esto, que el metodo solo garantiza una recuperacion asintotica para plantas con modelos inversos estables. La presencia de ceros inestables tiene el efecto de limitar las caractersticas del comportamiento obtenible, independientemente de la metodologa de dise~no que se emplee. Sin embargo, si los ceros inestables de la planta estan lo su cientemente alejados del ancho de banda del sistema de control, entonces es posible una recuperacion parcial en el rango de frecuencias de interes, y a efectos practicos la presencia de tales ceros no afectan de manera sensible a la robustez y comportamiento del sistema a baja frecuencia. Es posible, que para alcanzar un nivel de recuperacion deseado, las demandas del controlador sean excesivamente elevadas. Para un sistema con peque~nos errores de modelado ello no es crtico, sin embargo para sistemas donde las incertidumbres juegan un importante papel, puede darse el caso extremo de que se provoque la inestabilidad del sistema de control. Basado en esta idea, se han propuesto por diferentes autores (Athans, 1986; Lopez y Rubio, 1994) controladores lqg con recuperacion parcial (zonas de baja y media frecuencia) (ltr-i), el cual exhibira unas caractersticas de comportamiento similares al lqg en el rango de frecuencias de interes, y que adicionalmente presenta unas mejores propiedades de robustez frente a la presencia de dinamica inmodelada de alta frecuencia.
Ejemplo: Dise~nos lqr, lqg, lqg/ltr Sea el sistema dado por las siguientes ecuaciones: x_ = Ax + Bu + w y = Cx + v donde las matrices A, B , C , y vienen dadas por: ! ! 0 1 0 A= 3 4 ; B= 1 ; C= 2 1 ;
=
35 61
!
Dicho sistema corresponde a una funcion de transferencia de la forma: +2 G(s) = uy((ss)) = (s +s1)( s + 3) Se considera en primer lugar el control lqr. Para ello se trata de encontrar el regulador optimo que minimice el siguiente criterio cuadratico o funcion de coste: Z1 J = (xT M T Mx + u2) dt 0
Metodos de dise~no LTR
209
donde se emplean: M = 52:915 8:944 ; Rc = 1; Q = diagf1; 1g Con estos datos puede ser calculado el regulador lineal cuadratico (lqr), bien a partir de la descripcion por variables de estado, tal y como se detalla a lo largo de este captulo, o mediante el uso de funciones de transferencia, como se describe en el apendice A. Siguiendo el primer metodo, y resolviendo la correspondiente ecuacion de Riccati de control se tendra que la matriz de realimentacion de estados es, Kc = [ 50 10 ] Las correspondientes funciones de transferencia implicadas en el desarrollo son respectivamente: s + 52:915 Gc(s) = M (s)B = 8(:944 s + 1)(s + 3) 50 + 10s Hc(s) = (s + 1)(s + 3) La funcion de transferencia correspondiente al bucle cerrado se obtiene de la expresion general: Gbc(s) = C (sI A + BKc) 1B o en el caso de tratarse de un sistema de simple entrada-salida, tambien puede obtenerse de, (9:14) Gbc(s) = 1 +GG(s)(s) = s2 +s14+s2+ 53 c Con este regulador lqr se cumplen las especi caciones del sistema en bucle cerrado (regulador optimo, que situa los polos del sistema en lazo cerrado en las posiciones 7:0 2:0j ), y la funcion de transferencia del bucle abierto Hc(s), tiene como era de esperar muy buenas caracteristicas de robustez: margen de fase de 86 y margen de ganancia in nito. Sin embargo, si el estado no es accesible es necesario dise~nar un observador de estado o ltro de Kalman para estimarlo, con lo cual se obtiene el correspondiente controlador lqg. Para ello se tendran las siguientes matrices de covarianza: Qo = T ; Ro = 1 que tras resolver la correspondiente ecuacion algebraica de Riccati se obtiene la matriz de ganancia del ltro de Kalman Ko. Una vez conocidas Kc y Ko , el regulador se puede obtener de forma general a partir de la expresion, K (s) = Kc(sI A + BKc + Ko C ) 1Ko
210 de donde se obtiene:
Controlador LTR basado en observador
s + 2:6) K (s) = (s 1000( 18:66)(s + 42:7)
Si se calcula la funcion de transferencia en bucle cerrado con el regulador lqg, se obtiene la misma obtenida anteriormente (ecuacion 9.14), dado que la inclusion del observador no modi ca el lazo cerrado del sistema de control. Sin embargo, si se analiza la funcion de transferencia en lazo abierto K (s)G(s), se obtiene un margen de fase de 15 y un margen de ganancia de 1:9 db. Los cuales son sensiblemente inferiores a los obtenidos con el regulador lqr. Por lo que la robustez del sistema con el regulador lqg sufre un serio deterioro. A n de mejorar la robustez, a continuacion se dise~na un regulador lqg/ltr. Para ello, se modi ca la matriz de covarianza en la forma: Qo = T + qBB T Para dise~nar el regulador lqg/ltr se va incrementando q desde cero (regulador lqg) hasta un valor razonable para tener un compromiso entre la estimacion y la robustez. Este proceso se puede ver en la gura 9.3, donde se representa el diagrama de Nyquist de la funcion de transferencia en bucle abierto para distintos valores del parametro q; as mismo en la tabla adjunta se dan los valores de los margenes de estabilidad obtenidos en cada caso. Margen de Margen de q ganancia (db) fase (grados) 0 -1.9 15.0 100 -2.6 20.0 500 -5.2 32.5 1000 -8.0 42.5 10000 1 74.5
9.4.2 Metodo LQG/LTR-o La tecnica consiste en explotar la dualidad existente entre los problemas lqr y kbf. Esta lleva a demostrar que si se establecen las equivalencias: AT ! A ; C T ! B BT ! C ; !M V1 ! Q ; Ro ! Rc
Metodos de dise~no LTR
211
1
0.5 q=100 q=0
Imag G(jw)
0
q=500
-0.5
q=1000
-1
q=10000
-1.5
Glqr -2 -3
-2.5
-2
-1.5
-1
-0.5
0
Real G(jw)
Figura 9.3: Diagrama de Nyquist para diferentes q la funcion (matriz) de transferencia en lazo abierto del observador (kbf):
Ho (s) = C (sI A) 1Ko = C (s)Ko goza de las mismas propiedades analizadas para el controlador lqr. Con la diferencia, de que ahora se presentan para una ftlad de nida a la salida de la planta en vez de la entrada (ver gura 9.4). Para el caso de planta de fase mnima se conseguira la recuperacion asintotica
r- as Ko - 6
(s)
C
Figura 9.4: Estructura de Ho (s) (kbf)
bs
y-
212
Controlador LTR no basado en observador
r-
m - 6 -6
B
? Ko - m
(s)
-Kc
Planta
y-
C Figura 9.5: Estructura regulador lqg/ltr-o de la ftlad a la salida de la planta: qlim !1 G(s)K (s) = C (sI
A) 1 Ko = Ho(s)
donde ahora el parametro\q" (ganancia de recuperacion) se emplea para modi car la matriz de ponderacion del estado, Qc en 9.2, de la forma:
Qc = Qc + qZ siendo Z = Z T 0 una matriz arbitraria. En la gura 9.5 se muestra la estructura del regulador lqg/ltr-o.
9.5 Controlador LTR no basado en observador El compensador obtenido con el metodo lqg/ltr-i tiene la forma 9.13, la ftla tomada a la entrada es: L(s) = K (s)G(s), y la ftlad especi cada es: Lt (s) = Hc(s). El error entre ambas (error de recuperacion):
E (s) = Lt (s) L(s)
(9:15)
puede expresarse como:
E (s) = N (s)[I + N (s)] 1[I + Hc(s)] Se de ne el nivel de recuperacion como el tama~no de E (s): [E (s)]
(9:16) (9:17)
Metodos de dise~no LTR
213
El error de recuperacion se anula si y solo si:
N (s) = 0 ; 8 ! siendo:
N (s) = Kc(sI A + KoC ) 1 B
(9:18)
En ese caso, se dice que se produce una recuperacion exacta de la ftlad a la entrada de la planta (eLTRi). En otro caso, se dira que la recuperacion ha sido solo aproximada (aLTRi), si el tama~no de N (s) se hace su cientemente peque~no para cualquier !. Se tratara de encontrar una matriz Ko(q) que consiga:
N (s) = Kc(sI A + Ko(q)C ) 1B ! 0
(9:19)
Para mantener la independencia entre los dise~nos de la realimentacion de estados y el observador, para una matriz Kc dada, se cumplira la relacion 9.19 si: (sI A + Ko(q)C ) 1B ! 0 q ! 1 Se puede comprobar, que a medida que el parametro\q" aumenta, tambien lo hace el tama~no de Ko(q), de forma que: si q ! 1 entonces kKo(q)kF ! 1 donde se de ne:
q
kKokF = traza(KoKoT )
La dependencia anterior ocasiona que para conseguir una recuperacion aproximada con [N (s)] lo su cientemente peque~no, tenga a veces que aumentar Ko excesivamente, provocando un incremento del ancho de banda del compensador, lo cual va a ser contraproducente en algunas situaciones practicas. Si se considera u^ la se~nal a la salida del compensador, y u(s) la se~nal de control de entrada a la planta, puede obtenerse:
u^(s) = N (s)u(s) Kc(sI A + KoC ) 1 y(s) Motivado por la relacion anterior y dado que la condicion de eLTRi se consigue anulando N (s), o equivalentemente haciendo que u^(s) no dependa explcitamente de u(s), Chen y col. (Chen et al. 1991) desarrollan una estructura para controlador no basada en observador (cnbo), donde la se~nal que genera el controlador no depende
214
Controlador LTR no basado en observador
r
-j - 6
u
u^
Kc
xc
y
Planta (s)
-
Ko
-
j 6-
C
Figura 9.6: Estructura del cnbo ltr-i de manera explcita de la se~nal de control a la planta (ver gura 9.6). Se elimina de esta forma la dependencia de la matriz de distribucion B de la se~nal de control, caracterstica de las estructuras convencionales basadas en observador. Las ecuaciones descriptivas del cnbo son:
x_ c = (A KoC )xc + Koy yc = Kcxc u^ = yc
(9.20)
y equivalentemente la representacion entrada-salida:
K (s) = Kc(sI A + KoC ) 1Ko
(9:21)
Si se compara su estructura con la cbo (ecuacion 9.13), se comprueba que unicamente di eren en que no aparece el termino BKc. Para obtener Ko y Kc se pueden resolver de forma similar a la realizada con el controlador basado en observador convencional. El controlador se desea estable, de forma que hay que examinar los autovalores i(A Ko C ) para cada Ko obtenido
Metodos de dise~no LTR
215
durante el proceso de dise~no. Para este regulador no se cumple el principio de separacion, por lo que para garantizar la estabilidad del sistema nominal en lazo cerrado se analiza si la matriz: " # A K C K C o o Alc = BKc A cumple: Re[i(Alc)] < 0 Se demuestra (Chen et al. 1991), que existe un valor de la ganancia de recuperacion qo tal que 8q qo , el sistema nominal en lazo cerrado y el controlador son asintoticamente estables. El error de recuperacion 9.15 obtenido con el cnbo es:
Ec(s) = N (s)
(9:22)
Si se toma la misma matriz Ko para cnbo y cbo, y se comparan 9.16 y 9.22, se obtiene que el nivel de recuperacion (9.17) obtenido para el primero es superior. As, si se cumple: [Lt (s)] 1 8! 2 D! y se supone un cierto nivel de recuperacion:
[N (s)] 1 siendo Lt (s) = Hc(s) y D! la region de frecuencias de interes. La relacion entre el error de recuperacion del cbo (E (s)) y del cnbo (Ec(s)) se obtiene de: (E ) = [M (I + M ) 1 (I + Hc)] (M ) [(I + M ) 1 ](I + Hc) = (M ) (I + Hc) = (Ec)(I + Hc) (I + M ) (I + M ) (Ec)[(M()H+c)1 1] (Ec)1(Hc) (Ec) concluyendo: (E ) (Ec) 8 ! 2 D! Se obtiene que un cnbo consigue mayor nivel de recuperacion que empleando un cbo para el mismo valor de Ko (q ) (y por tanto para el mismo valor de la ganancia
216
Controlador LTR no basado en observador
B r- -
6
Ko
? xc - ( s )
-Kc
u
Planta
y-
Figura 9.7: Estructura ltr-o (cnbo) de recuperacion\q"). Una consecuencia inmediata de gran utilidad practica, es que para un mismo grado de recuperacion el cnbo necesita matrices Ko con tama~nos (kKokF ) menores que los obtenidos con el cbo; y consecuentemente el regulador tendra un ancho de banda menor, protegiendo de esa forma al sistema de demandas de control excesivas, y en algunos casos de la posible saturacion de los actuadores. Otra ventaja consiste en que de esa forma se evita la ampli cacion innecesaria del ruido de medida; y nalmente una mayor robustez frente a la dinamica no modelada de alta frecuencia. En el desarrollo anterior se ha analizado la sntesis ltr-i con el cnbo. Tambien es posible realizar un dise~no ltr-o especi cando una ftlad a la salida de la planta. En este caso la estructura del regulador es la representada en la gura 9.7, con las ecuaciones descriptivas del cnbo ltr-o dadas por:
x_ c = (A BKc)xc + Ko(y r) yc = Kcxc u = yc
(9.23)
y la representacion entrada-salida del regulador:
K (s) = Kc(sI A + BKc)Ko Si se compara con la estructura cbo (ecuacion 9.13), se comprueba que unicamente di eren en que no aparece el termino KoC . Representa el caso dual del regulador
Metodos de dise~no LTR
217
ltr-i (cnbo), por lo que los resultados anteriores obtenidos para este, son igualmente validos (Saberi et al, 1993).
Como se comenta brevemente en la introduccion y se ha planteado a lo largo de la exposicion de este captulo, el procedimiento ltr constituye una metodologa de dise~no sistematica que ha transcendido de sus orgenes, y aunque por tradicion sigue denominandose lqg/ltr, se ha independizado del problema lqg. Dado que, el metodo ltr consiste en de nitiva en especi car una funcion (matriz) de transferencia en lazo abierto (que cumpla las especi caciones de dise~no deseadas), y a traves del ajuste de uno de los parametros de dise~no se realiza la recuperacion o aproximacion de la ftlad por medio de un regulador ltr.
Ejemplo: Dise~no ltr-i con estructura no basada en observador A continuacion se comparan las recuperaciones obtenidas mediante un regulador lqg/ltr-i convencional (cbo), y un regulador ltr-i no basado en observador (cnbo), para el mismo ejemplo visto anteriormente. Para ello, se parte del mismo sistema dado en el ejemplo anterior. El procedimiento de recuperacion, al igual que antes se indicara, consiste en hacer depender la matriz de covarianza Qo del parametro q, o tambien llamado ganancia de recuperacion, en la forma
Qo =
T
+ qBB T
El regulador lqg/ltr-i convencional se obtiene de,
K (s) = Kc(sI A + BKc + Ko C ) 1Ko mientras que el regulador ltr-i con estructura no basada en observador esta dado por, K (s) = Kc(sI A + KoC ) 1Ko Los niveles de recuperacion, o grados de aproximacion a la funcion de transferencia en lazo abierto obtenida con el regulador lqr, conseguidos por ambos reguladores (cbo y cnbo) pueden verse en las guras 9.8 a 9.13, para diferentes valores de q (las curvas continuas corresponden al control lqr, y las de trazos al ltr). Puede verse como la recuperacion obtenida con el cnob es sensiblemente superior al cbo. Ello genera una consecuencia positiva de cara a la robustez frente a la dinamica inmodelada de alta frecuencia, as como la menor sensibilidad frente a las perturbaciones. Ya que a medida que aumenta q se incrementa la ganancia del observador y consecuentemente el ancho de banda del regulador. De forma que para alcanzar
218
Controlador LTR no basado en observador 40
CBO q= 0
40 20
mag(L) (db)
mag(L) (db)
20 0 -20 -40 -60 10 -3
0 -20 -40
10 0
-60 10 -3
10 3
0
0
-50
-50
-100 -150 10 0
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 0
-100 -150 -200 10 -3
10 3
w (rad/s)
10 0
10 3
w (rad/s)
Figura 9.8: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q1 CBO q= 500
50
mag(L) (db)
mag(L) (db)
50
0
-50
-100 10 -3
10 0
0
-50
-100 10 -3
10 3
0
0
-50
-50
-100 -150 10 0 w (rad/s)
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 500
10 3
-100 -150 -200 10 -3
10 0
10 3
w (rad/s)
Figura 9.9: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q2
Metodos de dise~no LTR CBO q= 2500
50
mag(L) (db)
mag(L) (db)
50
219
0
-50
-100 10 -3
10 0
0
-50
-100 10 -3
10 3
0
0
-50
-50
-100 -150 10 0
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 2500
-100 -150 -200 10 -3
10 3
w (rad/s)
10 0
10 3
w (rad/s)
Figura 9.10: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q3 CBO q= 3600
50
mag(L) (db)
mag(L) (db)
50
0
-50
-100 10 -3
10 0
0
-50
-100 10 -3
10 3
0
0
-100
-100
-200 -300 10 0 w (rad/s)
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-400 10 -3
CNBO q= 3600
10 3
-200 -300 -400 10 -3
10 0
10 3
w (rad/s)
Figura 9.11: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q4
220
Controlador LTR no basado en observador 40
CBO q= 25000
40 20
mag(L) (db)
mag(L) (db)
20 0 -20 -40 -60 10 -3
0 -20 -40
10 0
-60 10 -3
10 3
0
0
-50
-50
-100 -150 10 0
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 25000
-100 -150 -200 10 -3
10 3
w (rad/s)
10 0
10 3
w (rad/s)
Figura 9.12: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q5 40
CBO q= 1e+005
40 20
mag(L) (db)
mag(L) (db)
20 0 -20 -40 -60 10 -3
0 -20 -40
10 0
-60 10 -3
10 3
0
0
-50
-50
-100 -150 10 0 w (rad/s)
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200 10 -3
CNBO q= 1e+005
10 3
-100 -150 -200 10 -3
10 0
10 3
w (rad/s)
Figura 9.13: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q6
Metodos de dise~no LTR
221
- E (s) a
r
- Lt (s) - ?j rb L(s)
Figura 9.14: El error de recuperacion como una incertidumbre aditiva una recuperacion adecuada, sea necesario incrementar de forma excesiva el valor del parametro q o ganancia de recuperacion. Se extrae por tanto del analisis anterior, que la ventaja basica del regulador ltr (cnbo) es que consigue una aproximacion o recuperacion mejor que un regulador lqg/ltr (cbo) para un mismo valor de q . Lo cual tiene mucha relevancia de cara a la implementacion fsica del regulador en un ambiente real.
9.6 Controlador
LT R=H
1
En el captulo siguiente se trata ampliamente la teora relacionada con el control H1. Sin embargo, a continuacion se plantea un problema particularmente interesante: se trata de encontrar un regulador lqg/ltr-i, tal que una medida de la aproximacion de la respuesta en frecuencia en lazo abierto conseguida por el regulador ltr al lqr este acotada superiormente. Dicha medida se va a caracterizar mediante una cota H1, tal y como se describe a continuacion. En este apartado se presenta un procedimiento para obtener un controlador
lqg/ltr que consigue aproximar la respuesta en frecuencia en lazo abierto (ftla) a una especi cada (ftlad), con un determinado grado de aproximacion o de re-
cuperacion. La solucion se obtiene resolviendo un problema de control suboptimo H1. Como ya se ha descrito en este captulo, el procedimiento lqg/ltr-i consiste en encontrar un controlador K (s) que consiga acercar a la ftla: L(s) = K (s)G(s) a una ftlad: Lt (s) = Hc(s) dada.
Controlador LTR=H1
222
Para el analisis del problema de la recuperacion, puede interpretarse a L(s) como si se tratara de Lt (s) con una incertidumbre aditiva (ver gura 9.14): E (s) = L(s) Lt (s) Se de ne el grado de recuperacion (Saeki 1992), como: E = kE (s)[I + Lt (s)] 1k1
(9:24)
Si se emplea un cbo, se obtiene un error de recuperacion que puede expresarse: E (s) = Kc(sI A + BKc + KoC ) 1B [I + Hc(s)] (9:25) como se desea que E (s) sea lo menor posible (al menos en el rango de frecuencias de interes), se puede plantear el problema de conseguir un grado de recuperacion por debajo de un mnimo deseable E , y expresarlo como una cota H1. Teniendo en cuenta la de nicion 9.24 y la expresion 9.25 queda: E = kKc(sI A + BKc + Ko C ) 1B [I + Hc(s)][I + Hc(s)] 1k1 < E lo que equivale a encontrar una matriz Ko (q) que satisfaga: kKc(sI A + BKc + KoC ) 1B k1 < E
(9:26) (9:27)
Para obtener la solucion del problema anterior, se tiene el siguiente teorema (Saeki, 1992):
Teorema: Existe una matriz Ko, que satisface la ecuacion 9.27, si y solo si la
ecuacion algebraica de Riccati:
(A BKc)X + X (A BKc)T X ( 1 C T C 12 KcT Kc)X + Q + BB T = 0 (9:28) E tiene una solucion X = X T > 0, para un numero real > 0, lo su cientemente peque~no y una matriz arbitraria Q = QT > 0. Obteniendose como solucion: Ko = 21 XC T El papel desempe~nado por es similar al de 1=q2 en el procedimiento de recuperacion descrito en apartados anteriores. El resultado anterior es valido tanto para plantas de fase mnima as como para plantas de fase no mnima. A continuacion se da un procedimiento a seguir para el calculo del regulador LTR=H1:
Metodos de dise~no LTR
223
1. Se elige una matriz arbitraria simetrica de nida positiva Q, un valor de E dentro del intervalo 0 < E < 1 y un valor lo su cientemente peque~no de = 1 > 0 2. Se resuelve la ecuacion de Riccati 9.28. 3. Si su solucion X no es de nida positiva se incrementa el valor de E y se vuelve al paso 2. 4. Si X es de nida positiva se resuelve la ecuacion 9.28 para distintos valores de 2 (0; 1 ), para todos los cuales la ecuacion de Riccati tiene solucion de nida positiva. 5. Se elige la matriz Ko para un valor de del intervalo anterior, para el cual se obtiene el valor inferior de la norma de Frobenius de la matriz Ko ,
q
kK kF = traza (KoT Ko) Con el procedimiento anterior, se consigue el grado de recuperacion deseado, a la vez que se evita incrementar el tama~no de Ko , y con ello el que el ancho de banda aumente en exceso, protegiendo por tanto al sistema frente a la dinamica inmodelada de alta frecuencia, de las perturbaciones y ruidos de medida de los sensores.
Ejemplo: Controlador LTR=H1 Se van a considerar dos casos, el primero correspondiente a una planta de fase mnima (caso 1), y el segundo (caso 2) que trata con una planta de fase no mnima; a n de ver la validez del procedimiento para ambos tipos de plantas. Para ambos casos se emplea,
A=
"
#
" #
0 1 ; B= 0 3 4 1
la matriz de realimentacion de estados es Kc = [ 50 10 ], y la matriz Q se elige de la forma, " # 1 0 Q= 0 1
Controlador LTR=H1
224 Para caso 1 (fase mmina):
h i C = 2 1 ; y se elige E = 0:1
Para caso2 (fase no mnima):
h C= 2
i
0:1 ; y se elige E = 0:35
En las guras 9.15 y 9.16 se muestra la dependencia de la norma de Frobenius de la matriz de ganancia del observador Ko en funcion del parametro . Para todos los valores de mostrados en dichas guras se consiguen respectivamente
E < 0:1 (fase mnima) E < 0:35 (fase no mnima) Sin embargo, se elige el valor de para el que se obtiene el valor de kKokF inferior. Y por tanto, el regulador consigue el objetivo pre jado, pero con un ancho de banda inferior; protegiendo as al sistema frente a las incertidumbres, perturbaciones y ruidos que afectan a la planta.
Metodos de dise~no LTR
225
1600 1400
Norma de Frobenius de Ko
1200 1000 800 600 400 200 0 0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6 x10 -5
epsilon
Figura 9.15: Norma de Frobenius en funcion de para sistema de fase mnima x10 5 4.4
Norma de Frobenius de Ko
4.2
4
3.8
3.6
3.4
3.2
3 1
2
3
4
5 epsilon
6
7
8
9 x10 -9
Figura 9.16: Norma de Frobenius en funcion de para sistema de fase no mnima
226
Controlador LTR=H1
Captulo 10 Controladores H1 10.1 Introduccion Como se ha descrito en el captulo 8, una forma de establecer las especi caciones de dise~no, consiste en la minimizacion de determinada funcion de coste formulada en el dominio frecuencial. Dos medidas de comportamiento, ampliamente empleadas en los problemas de control optimo y robusto, son las normas H2 y H1. La solucion al problema de control de optimizacion H2 (tambien denominado de Wiener-Hopf) fue desarrollada durante las decadas de los 60 y 70; mientras que el dise~no con H1 se inicio en el decenio de los 80 y continua aun su desarrollo. La formulacion del problema de control optimo H1 fue realizada por Zames en 1981 para el caso escalar y basada en una representacion entrada-salida, obteniendo la solucion del problema en 1984 (Zames y Francis, 1984). Posteriormente los mismos autores obtienen la solucion para el caso multivariable. Los primeros algoritmos para la resolucion de los problemas H1, desarrollados desde 1984 a 1988, tenan el inconveniente de que el controlador obtenido era, en general, de un orden elevado (Francis, 1987) comparado con el de la planta, por lo que como paso previo a la implementacion fsica del regulador era conveniente realizar un intenso trabajo para obtener reguladores de menor dimension. Es a partir del trabajo de Doyle y colaboradores (1989), cuando se da un fuerte impulso para la solucion algortmica de los problemas de control H1, obteniendose un controlador de la misma dimension que la planta ampliada, o tambien deno227
Justi cacion del control H1
228
minada planta generalizada, (constituida por el modelo del proceso junto con las matrices de ponderacion que constituyen las especi caciones de dise~no). Con ello, da comienzo la llamada segunda generacion de algoritmos en el espacio de estados de la teora H1. Caracterizada por el planteamiento del problema de optimizacion formulado en el espacio de estados y resuelto, de forma mas simple, a partir de dos ecuaciones algebraicas de Riccati desacopladas. En este captulo se tratan en primer lugar las tecnicas inicialmente desarrolladas para la solucion de los problemas de control H1, pasando a continuacion a describir las tecnicas basadas en el espacio de estados.
10.2 Justi cacion del control
1
H
En este apartado se trata de justi car la utilidad del control H1 en la teora de control. Para ello, se ha elegido el planteamiento de dos problemas de control esenciales: el problema del comportamiento nominal optimo, y el problema de la estabilidad robusta. En ambos casos, y a n de simpli car la exposicion, as como para que el lector familiarizado con la teora clasica de control lo encuentre mas ameno, se trata en ambos casos el problema escalar. Tambien se presenta la conexion entre la teora de juegos diferencial y el control H1.
10.2.1 Interpretacion H1 del comportamiento nominal El metodo de optimizacion de sistemas de control H1 esta relacionado con la minimizacion del valor de pico de la respuesta en frecuencia de cierta funcion en bucle cerrado. Para aclarar y profundizar en el signi cado de la aseveracion anterior, considerese el ejemplo del sistema basico de control de la gura 10.1; donde la planta tiene la funcion de transferencia G(s) y el controlador K (s), la se~nal d representa las perturbaciones actuando sobre el sistema y la se~nal y la salida del sistema. A partir de la gura 10.1, puede obtenerse la dependencia de la respuesta del sistema y la variable de control, con el resto de variables que actuan sobre el sistema. Queda: y(s) = T (s) r(s) + S (s) d(s) T (s) n(s) (10.1) u(s) = K (s) S (s) [r(s) n(s) d(s)] (10.2) Como puede verse en la ecuacion 10.1, la funcion de sensibilidad S caracteriza
Controladores H1
6
r -
229
d
K (s)
u-
- ?
G(s)
y
-
6 n
Figura 10.1: Estructura de un sistema de control convencional el comportamiento del sistema de control con respecto a las perturbaciones (d). Un problema de dise~no puede consistir en obtener un controlador K que consiga un rechazo o atenuacion considerable de las perturbaciones,
S0 al menos en la zona de frecuencias de actuacion de la perturbacion. El problema original considerado por Zames (1981) consiste en encontrar un compensador K que haga al sistema de control estable y minimice el valor de pico de nido como, k S k1= max (10:3) ! jS (j! )j Dado que para algunas funciones el valor de pico puede no existir, se reemplaza este por el supremo o menor de las cotas superiores, as que,
jjS jj1 = sup jS (j!)j !
(10:4)
En general, para el caso multivariable, signi ca minimizar el supremo del valor singular maximo. k S k1= sup [S (j!)] !
La justi cacion de este problema reside en que si el valor de pico de la funcion de sensibilidad es peque~no, entonces la magnitud de S necesariamente es peque~na para
Justi cacion del control H1
230
todas las frecuencias, y por tanto las perturbaciones seran atenuadas para todas las frecuencias. La minimizacion de jjS jj1 es la optimizacion del peor caso, porque ello equivale a la minimizacion del efecto sobre la salida de la peor perturbacion (es decir, una perturbacion armonica a la frecuencia donde jS j tiene el valor de pico). El problema del peor caso tiene una interpretacion matematica muy signi cativa, tal y como se expone a continuacion. Supuesto que la pertubacion d es desconocida para las frecuencias de interes, pero tiene energa nita, el valor,
jjdjj2 =
sZ 1
1
jd(t)j2dt
(10:5)
se conoce como la norma-2 de la perturbacion d. La energa de d es el cuadrado de la norma-2. Entonces, la norma jjS jj del sistema S con entrada d y salida y inducida por la norma-2, se de ne como, (10:6) jjS jj = sup jjjjdyjjjj2 d:jjdjj2 0, de ah que se le de el adjetivo de interior. Se dice que una funcion de transferencia es exterior (outer) si no tiene ceros en Re s > 0 (o sea que quedan en el exterior de dicho semiplano complejo de la derecha). Desde el punto de vista de sistemas, una funcion de transferencia interior es un sistema estable de fase no mnima y pasa-todo con ganancia unidad; y una exterior es estable y de fase mnima. Toda funcion (matriz) de transferencia T 2 RH1 tiene una factorizacion
T = TiTo siendo Ti interior y To exterior. Para obtenerlas se pueden emplear por ejemplo las funciones\iofr.m y iofc.m" para Matlab de Robust Control Toolbox (Chiang y Safonov, 1992), o las funciones\inner y outer" del Program CC (Thompson, 1988). Para resolver el caso general, se transforma el problema de la siguiente forma:
kT1 T2Qk1 = kR X k1 con
R = T2i 1T1 2 RL1 ; X = T2o Q 2 RH1
donde se ha obtenido la factorizacion T2 = T2i T2o , siendo T2i una funcion de transferencia interior y T2o una exterior (conviene tener en cuenta que T2i fsicamente equivale a un ltro pasa-todo de ganancia unidad). Aplicando el teorema de Nehari, se obtiene que,
= inf fkR X k1 : R 2 RL1; X 2 RH1g = k Rk
248
Soluciones al problema de ajuste del modelo
A continuacion se da un algoritmo (alfaQ) para calcular y el optimo Q(s), para el caso escalar:
kT1 T2 Qk1; con: T2
T2T3 ; o tambien si: T3 = 1
1. Realizar la factorizacion interior-exterior de T2,
T2 = T2i T2o 2. Calcular,
R = T2i 1T1 se obtiene una realizacion mnima, R(s) (A; B; C; D)
3. Se resuelven las ecuaciones de Lyapunov,
AWc + WcAT = BB T AT Wo + WoA = C T C 4. Se obtiene el valor propio maximo, del producto de grammianos WcWo , y su correspondiente vector propio v. 5. Calcular,
f (s) (A; v; C; 0); g(s) = ( AT ; 1Wov; B T ; 0); X = R f=g 6. Se obtienen,
=j j; Q = T2o1X
Una vez calculado Q, se puede obtener el regulador optimo K a partir de la ecuacion 10.18.
10.5.2 Optimizacion del comportamiento nominal A n de ver la aplicabilidad de los resultados y metodos anteriores se plantea el problema de conseguir una especi cacion de comportamiento nominal (np) dada.
Controladores H1
249
w-
j 6
z
- G
K
-
Figura 10.9: Problema de comportamiento nominal. Sea el sistema de la gura 10.9, en la que se emplea una nomenclatura para las se~nales de acuerdo con la empleada en el problema estandar. As, se tiene que, z = Sw; S = =1 1 + GK Se plantea el problema de conseguir un seguimiento adecuado, al menos en el rango de frecuencias [0; !1]. Para ello se propone la siguiente especi cacion:
j S (j!) j< ; 8 ! 2 [0; !1] as por ejemplo, con = 0:01 se requiere un error de seguimiento inferior al 1% en dicho rango de frecuencias. Esto mismo se puede realizar de forma aproximada empleando una funcion de ponderacion W y la condicion
kWS k1 <
(10:19)
Una posible eleccion para W es la siguiente: 1
W (s) = (0:01w11 s + 1)k (0:1w1 s + 1)
k
Teniendo en cuenta la forma general del problema estandar, se tiene que P22 = G, ya que: z = w y = Gu e = w Gu u = Ke y por tanto, " # 1 G P= 1 G
250
Soluciones al problema de ajuste del modelo Si se realiza una factorizacion coprima de P22 ,
P22 = N=M; MX NY = 1 los reguladores que estabilizan al sistema vendran dados por, K = YX MQ NQ ; Q 2 RH1 al sustituir en S se obtiene, S = MX MNQ con lo que el problema de comportamiento nominal 10.19 equivale a
kT1 T2Qk1 < con: T1 = WMX; T2 = WMN . Se tratara de obtener un valor de
= inf fkT1 T2Qk1 : Q 2 RH1 tal que < , dependiendo el valor de del exponente k de W (s); por lo que se indicara por k .
Algoritmo (KNP) A continuacion se da un para resolver este problema de np. 1. Realizar la factorizacion coprima de G:
G = N=M; MX NY = 1 2. Se de ne la funcion de ponderacion, 1 s + 1)k (0 : 01 w 1 W (s) = (0:1w1 1s + 1)k
se toma inicialmente el valor k = 1. 3. Se obtiene
T1 = WMX; T2 = WMN; V (s) = (s + 1)l donde el exponente l es el grado relativo de G.
Controladores H1 4. Se sustituye T2 k ,
251
T2V , y por medio del algoritmo alfaQ, ya descrito, calcula
k = minfkT1 T2 Q1k1 : Q1 2 RH1 Si k , se incrementa k en uno, y se vuelve al paso 3. En otro caso, continuar. 5. Por medio del algoritmo alfaQ, calcular Q1 2 RH1, tal que, k = kT1 T2Q1 k1 6. Se calcula nalmente el regulador, a K = YX MQ NQa con Qa(s) = V (s)Q1 (s)=(0:1w1 1s + 1)l.
Ejemplo: Con el siguiente ejemplo, se ilustra el procedimiento anterior para una planta de fase no mnima s 2) G(s) = (s (+s 1)(1)( s2 + s + 1) Para las especi caciones de comportamiento nominal se emplean w1 = 0:01; = 0:1 ( 20 db). Por tanto, se desea conseguir un error de seguimiento inferior al 10% para se~nales de referencia con ancho de banda inferior a 0:01 rad/s. 1. Como la planta es estable, se toman:
N = G; M = 1; X = 1; Y = 1 2. Se elige 3. Se calculan
s + 1 k W (s) = 10s + 1 s + 1 k T1(s) = 10s + 1 ; V (s) = s + 1 k s 2) T2 (s) = 10ss++11 (s (+s 1)(1)( s2 + s + 1)
252
Soluciones al problema de ajuste del modelo
4. Se obtienen: 1 = 0:2299; 2 = 0:0511, y por tanto 2 < ; k = 2. 5. Se calcula
0:3613)(s2 + s + 1) Q1(s) = 6:114 (s + (s + 4:656)(s + 1)2
6. Y nalmente
:3613)(s2 + s + 1) Qa (s) = 6:114 (s(s++4:0656)( s + 1)(10s + 1) (s + 0:3613)(s + 1)(s2 + s + 1) K (s) = 0:6114 (s + 0:004698)( s + 0:5280)(s2 + 5:612s + 9:599) En la gura 10.10 pueden verse las magnitudes de las funciones de sensibilidad j S (j!) j y sensibilidad complementaria j T (j!) j obtenidas; la respuesta temporal para consigna escalon unidad se tiene en la gura 10.11, puede comprobarse el comportamiento de fase no mnima que presenta el sistema. 5 0 Sensibilidad
-5
magnitud (dB)
-10 -15 -20 -25 -30 Sensibilidad complementaria
-35 -40 -45 10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
rad/s
Figura 10.10: Magnitudes de j S (j!) j; j T (j!) j, problema de np
Controladores H1
253
1
respuesta lazo cerrado
0.8
0.6
0.4
0.2
0
-0.2
0
10
20
30
40
50
60
70
80
segundos
Figura 10.11: Respuesta temporal a escalon unidad, problema de np
10.6 Problemas de control de estados
2
1
H ;H
en el espacio
En la primera parte de este captulo se ha presentado una forma de resolver el problema de control H1 para el caso de sistemas de una entrada y una salida (planta escalar), el cual sigue el tratamiento original realizado por Francis (1987). Igualmente, siguiendo un procedimiento similar, aunque bastante mas elaborado y complejo, es posible obtener los correspondientes algoritmos para resolver el problema multivariable. Si bien, para ello resulta mas ventajoso emplear el tratamiento en el espacio de estados que se presenta a continuacion; el cual es general y valido independientemente del caracter escalar o vectorial de la planta a controlar, consituyendo un metodo mas compacto. A pesar de ello, se ha comenzado este captulo con el procedimiento entradasalida descrito en los apartados anteriores; a n de presentar los orgenes del problema, as como el planteamiento seguido para su resolucion. Se trata con ello que el lector se situe ante el problema de control H1 con una perspectiva que va desde su enfoque clasico al planteamiento actual.
Problemas de control H2; H1 en el espacio de estados
254
Los algoritmos desarrollados en el espacio de estado se caracterizan en general por estar basados en la solucion de dos ecuaciones algebraicas de Riccati desacopladas, partiendo de las matrices de estado de la planta ampliada o generalizada. A partir del trabajo de Doyle et al.(1989) se inicia la etapa actual del desarrollo de algoritmos para la resolucion de los problemas de control H1. Considerese una realizacion en el espacio de estados de la planta ampliada P (s) (ver gura 10.5) expresada como:
x_p = Apxp + B1 w + B2u z = C1 x + D11 w + D12u e = C2 x + D21 w + D22u
(10.20)
o en forma abreviada como,
P (s) (Ap; Bp; Cp; Dp) con,
Bp = [B1 B2 ] ; CpT = [C1 C2] " # D D 11 12 Dp = D D 21
22
De forma general, el problema de dise~no se puede expresar de la siguiente forma: dado el sistema de la gura 10.5, se tratara de encontrar un regulador K (s) 4 , asintoticamente estable que haga al sistema en lazo cerrado Tzw internamente estable y que minimice la norma H2 (problema H2) o la norma H1 (problema H1) de Tzw . En el tratamiento que hacen Doyle et al.(1989) de ambos problemas (H2; H1), en el espacio de estados se tienen en cuenta algunas suposiciones, que sirven para simpli car la formulacion, y van a constituir las hipotesis de trabajo del problema de control optimo H1 que a continuacion se desarrolla. Las condiciones supuestas para las matrices de estado de la planta ampliada P (s) son las siguientes: 1. Los pares (Ap; B1) y (Ap; B2 ) son estabilizables. 2. Los pares (C1; Ap) y (C2 ; Ap) son detectables. Los controladores racionales propios, detectables y estabilizables que dotan al sistema en lazo cerrado de estabilidad interna son denominados controladores admisibles. 4
Controladores H1
255
3. D12T C1 = 0 y D12T D12 = I 4. B1D21T = 0 y D21D21T = I 5. D11 = 0 y D22 = 0 Las suposiciones (1) y (2) garantizan la existencia de la solucion de las ecuaciones de Riccati de control y del observador. La suposicion (3) implica la ortogonalidad entre C1 x y D12 u, lo cual en la formulacion de un problema lqg implica que la funcion de costes no tendra ponderacion cruzada entre el estado x y la entrada de control u, a la vez que la matriz de ponderacion del vector de control sera la matriz unidad. La (4) equivale a la (3) para las matrices de covarianza de los ruidos actuantes sobre el proceso y sobre la medida (ruido en sensores). La suposicion (5) se hace para simpli car la formulacion, y no supone perdida de generalidad, ya que un problema determinado puede transformarse en uno equivalente que satisfaga tales requerimientos (Green y Limebeer, 1995, Safonov et al.1989).
10.6.1 Controlador optimo H2 Como se ha descrito en el apartado anterior, una forma de expresar algunas de las especi caciones de dise~no es mediante la minimizacion de la norma H2 de la funcion (matriz) de transferencia Tzw . O expresado en terminos de se~nales: se trata de encontrar un controlador K (s) asintoticamente estable que estabilice al sistema en lazo cerrado y que minimice la norma H2 de la se~nal de respuesta del sistema a una se~nal de entrada caracterizada por ser ruido blanco con intensidad unidad. Esto expresado en forma analtica supone la minimizacion de la funcion de coste: Z1 T ( j! )T (j! )]d! = kT k2 JH2 = 21 traza[Tzw (10:21) zw zw 2 0 Una forma de calcular la norma H2 es mediante:
kTzw k22 = traza(CT WcCTT ) = traza(BTT WoBT )
(10:22)
donde las matrices (AT ; BT ; CT ; DT ) determinan una realizacion en el espacio de estados del sistema Tzw ; y las matrices Wc y Wo son sus respectivos grammianos de controlabilidad y observabilidad. Estos se pueden obtener resolviendo las correspondientes ecuaciones de Lyapunov:
AT Wc + WcATT + BT BTT = 0
Problemas de control H2; H1 en el espacio de estados
256
ATT Wo + WoAT + CTT CT = 0 El controlador optimo K (s) que minimiza kTzw k2 se calcula resolviendo el par de ecuaciones algebraicas de Riccati independientes:
ATp X2 + X2 Ap X2 B2B2T X2 C1T C1 = 0
(10:23)
ApY2 + Y2ATp Y2C2T C2Y2 B1 B1T = 0
(10:24)
que teniendo en cuenta la de nicion del operador de Riccati (ver apendice C.2) puede ponerse de forma equivalente como:
X2 = Ric(HX 2) Y2 = Ric(HY 2 ) siendo las matrices Hamiltonianas asociadas: " T # A B B p 2 2 HX 2 = C T C ATp 1 1
HY 2 =
"
ATp B1 B1T
C2T C2T Ap
#
A partir de las soluciones X2; Y2 respectivas de 10.23 y 10.24 se tiene el compensador optimo: K (s) = Kc(sI Ap + B2Kc + KoC2) 1 Ko (10:25) donde: Kc = B2T X2 ; Ko = Y2C2T son las matrices de realimentacion de estados y de ganancia del observador, en la estructura convencional del controlador lqg. El mnimo de JH2 se obtiene de : min kTzw k22 = kGcB1k22 + kKcGok22 = kGcKo k22 + kC1Gok22 con:
Gc(s) = (C1 + D12 Kc)(sI Ap B2Kc) 1 Go(s) = (sI Ap KoC2 ) 1(B1 + Ko D21)
(10:26)
Controladores H1
257
10.6.2 Relacion entre LQG/LTR y H2 Los problemas de dise~nos lqg/ltr-i y lqg/ltr-o pueden interpretarse como dos casos particulares del problema de optimizacion H2 de sensibilidad mixta (Stein et al. 1987). A continuacion de pone de mani esto dicha correspondencia. Considerese la planta a controlar G(s) representada por las ecuaciones de estado
x_ = Ax + Bu + v1 y = Cx + Iv2 z = Mx donde: G(s) = C (s)B; (s) = (sI A) 1 y los ruidos sobre el proceso (v1) y sobre los sensores (v2) se consideran ruidos gausianos con intensidad unidad e incorrelados entre s. Un regulador optimo lqg minimiza la funcion de coste ) ( ZT 1 T 2 T (10:27) JLQG = E T (z z + u u)dt 0 Teniendo en cuenta que se tienen las siguientes relaciones " # " # 2 u(s) 3 y(s) = G(s) C (s) I 64 v (s) 75 1 z(s) M (s)B M (s) 0 v (s) 2
u(s) = K (s)y(s) " # " # z = T v1 zw v u 2 " # T T 11 12 Tzw = T T 21 22
se obtiene: donde, con,
T11 T12 T21 T22
(10:28)
= M (s) M (s)K (s)[I + G(s)K (s)] 1C (s) = M (s)BK (s)[I + G(s)K (s)] 1 = K (s)[I + G(s)K (s)] 1C (s) = K (s)[IG(s)K (s)] 1
Sustituyendo la ecuacion 10.28 en la 10.27 y teniendo en cuenta el teorema de Parseval (Stein y Athans, 1987) se obtiene que la funcion de coste dada en 10.27 se
Problemas de control H2; H1 en el espacio de estados
258
puede expresar en el dominio de la frecuencia como
1 Z1 H ]d! JLQG = 2 tr [Tzw Tzw 0
Lo cual establece la relacion entre los problemas de optimizacion H2 y lqg. A continuacion se avanza mas en dicha relacion, estableciendose las condiciones bajo las cuales el problema de dise~no lqg/ltr se puede transformar en un problema de control optimo H2 de sensibilidad mixta.
Caso lqg/ltr-i. Si se consideran las siguientes condiciones: W (s) = M (s)B (1=) = B 0 queda:
Tzw (s)
"
# " # W (s)[I + K (s)G(s)] 1 0 = W (s)Si(s) 0 [I + K (s)G(s)]1K (s)G(s) 0 Ti (s) 0
A partir de lo cual se concluye que el problema lqg/ltr-i equivale a un problema de sensibilidad mixta H2 .
Caso lqg/ltr-o. Si se consideran las siguentes condiciones: W (s) = C (s) (1=) M = C 0 queda: T (s) Tzw
"
#
"
[I + G(s)K (s)] 1W (s) 0 = So(s)W (s) 0 G(s)K (s)[I + G(s)K (s)]1 0 To (s) 0
#
Y por tanto, al igual que para el caso anterior, tambien se obtiene que el problema lqg/ltr-o equivale a un problema de sensibilidad mixta H2 .
Controladores H1
259
10.6.3 Controlador H1 En un determinado problema de control, puede que se este interesado en minimizar el maximo alcanzable por la respuesta frecuencial de Tzw , en vez de minimizar algun tipo de promedio, como se hace en la optimizacion H2 . En ese caso, se plantea un problema de optimizacion H1, en el que se trata de obtener el mnimo de:
kTzw k1 = sup (Tzw ) !
(10:29)
Para contrastar los problemas H1 y H2 , considerese el caso monovariable (escalar) en el que se tenga: kTzw k1 esto equivale a que para una se~nal w con kwkrms 1, el sistema dara una respuesta z = Tzw w tal que kTzw wkrms ; mientras que si:
kTzuk2 ello equivale a que para una se~nal particular w de ruido blanco de intensidad unidad, el sistema dara una respuesta z = Tzw w con kTzw wkrms . Por lo tanto un problema de minimizacion H1 es mas general que uno H2, al abarcar el primero la posibilidad de una gama mas amplia de se~nales de entrada. Otra distincion la supone el hecho de que H2 minimiza el valor cuadratico medio de la magnitud sobre todas las frecuencias, no haciendo alusion directa alguna a la existencia de posibles picos de peque~na anchura (resonancias pronunciadas pero muy estrechas), pues su efecto sobre el calculo del promedio sera poco apreciable. Sin embargo, la optimizacion H1 es el maximo de esos posibles picos el que tiene en cuenta (Stoorvogel, 1992). Para remarcar el aspecto distintivo entre los reguladores H2 y H1, a continuacion se va a utilizar el problema de sensibilidad mixta anteriormente de nido. Como se describe en el captulo 8, a partir de la relacion:
(WS So ) 1 se especi ca un comportamiento nominal deseado (np) y con:
(WT To) 1
Problemas de control H2; H1 en el espacio de estados
260
se especi ca una robustez de la estabilidad (rs) del sistema de control frente a incertidumbres multiplicativas situadas a la salida de la planta. 5 Una forma de que se veri quen simultaneamente las desigualdades anteriores es haciendo que se cumpla:
WS So kTzw k1 =
W T To
1
1
(10:30)
El regulador optimo H1 minimizara dicho valor, mientras que el regulador optimo H2 minimizara la norma kTzw k2 ; por lo que el primero trata directamente con el problema de maximizar la robustez del sistema de control, y de ah su atractivo y utilidad en los problemas de control robusto. El calculo de la norma H1 se puede hacer directamente a partir de su de nicion (10.29), o de forma indirecta. As, si se tiene una realizacion de Tzw dada por las matrices (AT ; BT ; CT ; DT ), se de ne la matriz Hamiltoniana asociada H como:
H=
"
AT BT BTT = 2 CTT CT ATT
#
y se establecen las siguientes equivalencias (Doyle et al. 1989): 1. Tzw cumple:
kTzw k1 <
(10:31)
2. H no tiene autovalores en el eje imaginario. 3. H 2 dom (Ric) (ver apendice C.2) 4. H 2 dom (Ric) y Ric(Tzw ) > 0 si (C; A) es observable. Teniendo en cuenta (1) y (2) se puede derivar un metodo para calcular kTzw k1: 1. Se selecciona un escalar > 0. 2. Se forma la matriz H y se testea si tiene autovalores en el eje imaginario. 3. Se aumenta o disminuye de acuerdo con el resultado del paso 2. 5
En ese caso el sistema de interconexion coincide con la funcion de sensibilidad complementaria:
M (s) = To (s) (ver captulo 8).
Controladores H1
261
4. Se repite el proceso, iterando con hasta encontrar un valor crtico o que con cierta precision cumpla la condicion del paso 2, en ese caso se consigue una cota ajustada kTzw k1 < o. Para encontrar un controlador asintoticamente estable K (s), que consiga kTzw k1 <
, se resuelven el par de ecuaciones algebraicas de Riccati siguientes (Doyle et al, 1989):
ATp X1 + X1Ap X1[(1= 2)B1B1T B2 B2T ]X1 + C1T C1 = 0
(10:32)
ApY1 + Y1ATp Y1[(1= )2C1T C1 C2T C2]Y1 + B1 B1T = 0
(10:33)
o teniendo en cuenta la de nicion del operador de Riccati (ver apendice C.2):
X1 = Ric(HX 1) Y1 = Ric(HY 1) con las matrices Hamiltonianas asociadas: " 2 )B B T B B T # A (1 = p 1 1 2 2 HX 1 = C T C ATp 1 1
HY 1 =
"
ATp (1= 2)C1T C1 C2T C2 B1 C1T Ap
#
El controlador resultante es:
K (s) = Kc[sI Ap (1= 2)B1B1T X1 B2Kc ZKoC2] 1 Ko
(10:34)
donde:
Kc = B2T X1; Ko = Y1C2T ; Z = [I (1= 2)Y1X1] 1; K1 = B1 B1T X1(1= 2) El compensador 10.34 consigue kTzw k1 < , sin embargo la solucion no sera valida (es decir: el sistema en lazo cerrado no sera asintoticamente estable) a menos que se cumplan las condiciones siguientes:
X1 0 Y1 0 j max (X1Y1) j < 2
(10.35)
262
Problemas de control H2; H1 en el espacio de estados
Aunque no sea tan evidente como en el caso H2 , el controlador H1 tiene una estructura constituida por una realimentacion de estados y un observador (ver gura 10.12). La dinamica del compensador queda descrita por el conjunto de ecuaciones: x^_ = Apx^ + B2 u + ZKo (^y y) + B1w^ y^ = C2x^ u = Kcx^ (10.36) 2 T w^ = (1= )B1 X1x^ donde Kc representa la matriz de realimentacion de estados, ZKo la matriz de ganancia del observador y w^ supone un estimado de la peor perturbacion que pudiera darse sobre el sistema, en el sentido de que maximizara la magnitud (Doyle et al, 1989): kzk22 2kwk22 El calculo para obtener la solucion de un problema de optimizacion H1 requiere un proceso iterativo, iniciandose con un valor inicial para el parametro , probando si se cumplen todas las condiciones necesarias (10.31,10.35) y modi candolo hasta encontrar una solucion adecuada. El proceso de busqueda puede terminar con el valor mnimo min, o en una solucion suboptima ( o > min).
10.6.4 Algoritmo de calculo del regulador H1 A la hora de aplicar el algoritmo de calculo del regulador H1 anteriormente descrito, pueden aparecer algunos problemas numericos que di culten o hagan imposible su resolucion. Por ello, se han desarrollado, y aun se siguen desarrollando en la actualidad, diferentes algoritmos de calculo que tratan de mejorar y facilitar la resolucion numerica de las ecuaciones. En la bibiliografa especializada pueden encontrarse diferentes opciones para dicho calculo (Green y Limebeer, 1995). A continuacion se da un algoritmo alternativo al descrito anteriormente, que mejora las propiedades numericas para el calculo del controlador H1. La ley de control se obtiene de
u = Kcx^ y el estimador del estado se calcula a partir de las ecuaciones x^_ = Apx^ + B2 u + B1w^ + Z1Ko (y y^)
Controladores H1
263
B2 r
? x^ - ZK - - ( s ) Kc p o 6 6 6 -
u
- G(s)
y
-
K1 C2 Figura 10.12: Estructura del controlador H1
w^ = B1T X1x^(1= 2) y^ = C2 x^ + D21 B1T X1x^(1= 2) Las matrices Kc; Ko; Z1 se obtienen respectivamente de,
Kc = D120 (B2T X1 + D12T C1 );
D120 = (D12T D12 )
1
Ko = (Y1C2T + B1 D21T )D210 ; D210 = (D21 D21T ) Z1 = (I 2 Y1X1) 1
1
Las matrices X1; Y1 son soluciones de las correspondientes ecuaciones de Riccati, o de forma equivalente (ver apendice C.2):
"
donde,
0 DT C1 2 B1 B T B2 D0 B T # A B D p 2 12 12 1 12 2 X1 = Ric C10T C10 (Ap B2 D120 D12T C1 )T " T D0 C2 )T 2 C T C1 C T D0 C2 # ( A B D p 1 21 21 1 2 21 Y1 = Ric B10 D10T (Ap B1 D21T D210 C2)
C10 = (I D12 D120 D12T )C1; B10 = B1(I D21T D210 D21 )
Problemas de control H2; H1 en el espacio de estados
264
Finalmente, se dan las matrices del regulador K ,
K (s) [Ar ; Br ; Cr ; Dr ] con,
Ar = Ap B2Kc Z1Ko C2 + 2(B1 B1T Z1Ko D21B1T )X1 Br = Z1Ko; Cr = Kc; Dr = 0
as como la realizacion de Tzw :
" # " #" # " # x_ = Ap B2 Kc x + B1 Z1Ko C2 T22 x^ Z1KoD21 w x^_ " # " # " # z = C1 D12 Kc + 0 w y C2 0 D21
donde se tiene que,
T22 = Ap B2Kc + 2B1 B1T X1 Z1Ko(C2 + 2 D21 B1T X1)
10.6.5 Ejemplos ilustrativos Ejemplo: Dise~no H1 de sistema doble integrador Sea el sistema compuesto por la planta nominal a controlar ( gura 10.13),
G(s) = s12 = uy((ss)) la perturbacion d, y el ruido de medida n actuantes sobre el sistema, cuyo conjunto queda descrito por las ecuaciones siguientes:
x_ 1 = d + u x_ 2 = x1 y = x2 + n Se desea dise~nar un regulador H1 que consiga atenuar el efecto de d y n sobre el sistema, a la vez que la se~nal de control no tome valores excesivos a n de evitar en lo posible la saturacion de los actuadores. Para lo cual, se incluira la se~nal de control, junto con la propia variable de estado x2 , en las variables empleadas para evaluar
Controladores H1
265
d
?
-
u
- 1 s
x1 - 1 s
x2
-
?
y
n
Figura 10.13: Diagrama de bloques
w
- 6
- 1 s
s
x2- ?
x1 - 1 s
s u
K (s)
y
Figura 10.14: Diagrama de bloques para H1
-
z
Problemas de control H2; H1 en el espacio de estados
266
el comportamiento del sistema en lazo cerrado; o sea, como elementos de z. Por lo que los respectivos vectores w; z implicados en los desarrollos teoricos comentados anteriormente ( gura 10.14), son en este caso:
" # " # d w = n ; z = xu2
Para la eleccion realizada, queda que las matrices que componen la realizacion de la planta generalizada son de la forma:
2 66 01 6 P (s) = 66 0 64 0
0 0 1 0 0 1
O sea,
Ap = B1 = C1 = D11 = D21 =
" " " " h
0 0 1 0
1 0 0 0 0
0 0 0 0 1
1 0 0 1 0
3 77 77 77 5
# #
1 0 ; 0 0
#
0 1 ; 0 0
#
0 0 ; 0 0
i
0 1 ;
2 3 1 6 B2 = 4 75 0
h i C2 = 0 1 " # D12 = 01 h i D22 = 0
Siguiento los pasos dados en este apartado, y tras un proceso iterativo de busqueda para el valor de , se obtiene que el algoritmo da una solucion factible para = 2:62, el cual esta proximo pero no coincide con el valor optimo. Para obtener el optimo se pueden emplear algoritmos mas so sticados; tales y como se dan en el Robust Control Toolbox (funcion\hinfsyn"), o en el -Synthesis Toolbox (funcion\hinfopt"), para Matlab. Para = 2:62 se obtiene el siguiente regulador H1:
Controladores H1
267
:3(s + 0:39) K (s) = (s +578 2:33)(s + 220:72) que equivale basicamente a un compensador de adelanto con un polo situado a alta frecuencia, incluido para mejorar la robustez del sistema. Para este regulador se obtienen: un margen de fase de 44.6 grados, un margen de ganancia de 44.3 db, y un porcentaje de incertidumbre multiplicativa tolerable (1/max(T )) del 70%. Para analizar el comportamiento del controlador dise~nado frente a la dinamica inmodelada, se considera que la planta real viene dada por G0 = G(1 + Em) con, s + 0:6667) Em (s) = s( 0:s30556 2 + s + 100 80
Tolerancia e incertidumbre (dB)
60 40 Tolerancia 20 0 -20 -40
Incertidumbre multiplicativa
-60 -80 10 -1
10 0
10 1
10 2
rad/s
Figura 10.15: Incertidumbre tolerable e incertidumbre existente En la gura 10.15 se muestran el nivel de tolerancia a incertidumbre multiplicativa del sistema de control, as como la magnitud de Em (j!). La respuesta temporal
Problemas de control H2; H1 en el espacio de estados
268 1.4
1.2
respuesta
1
0.8
0.6
0.4
0.2
0 0
2
4
6
8
10
12
14
tiempo (seg)
Figura 10.16: Comportamientos con planta nominal y planta real puede verse en la gura 10.16, en la que se muestra el comportamiento para el modelo nominal de la planta G, y para el modelo real G0. Como puede verse, en este caso el efecto de la dinamica inmodelada es muy poco apreciable, cosa que pone de mani esto la robustez del comportamiento del sistema de control, al menos para este tipo de incertidumbre.
Ejemplo: Dise~no de controladores H2; H1 de tiempo discreto En este ejemplo se plantea el problema de controlar una planta, cuyo modelo matematico es de tiempo continuo G(s), por medio de un regulador de tiempo discreto K (z), empleando un perodo de muestreo de Tm = 0:01 segundos. En la gura 10.17 se muestra el diagrama de bloques del sistema de control. El procedimiento de dise~no empleado sigue los pasos siguientes: 1. Se obtiene un modelo discreto de la planta G(z), empleando para ello la aproximacion del mantenedor de orden cero (ZOH).
Controladores H1
r -i
6 Tm
269
K (z)
Tm
ZHO
G(s)
y -
Figura 10.17: Controlador H1 de tiempo discreto 2. Se realiza la transformacion bilineal inversa, obteniendose un sistema continuo en el plano-w G(w). 3. Se dise~na el controlador H2; H1, obteniendo K (w) 4. Se emplea la transformacion bilineal para obtener el regulador equivalente de tiempo discreto K (z). En forma sintetica, dicho proceso de dise~no consiste en: 1
G(s) ZOH ! G(z) bilin! G(w) H2;H!1 K (w) bilin ! K (z ) donde el operador bilin empleado realiza una trasformacion del plano w al plano z consistente en: w = T2(z(z +1)1) m La transformacion inversa bilin 1 se emplea para dise~nar un regulador de tiempo discreto con tecnicas de tiempo continuo en el plano-w. La funcion de transferencia de la planta a controlar es,
G(s) = s3 + 30s2 +900 700s + 1000 En la gura 10.18 pueden verse las respuestas en frecuencia de G(s) y G(w) para un perodo de muestreo de Tm = 0:01 seg: Las especi caciones de dise~no para el sistema de control son:
Problemas de control H2; H1 en el espacio de estados
270 50
0 |G(w)|
|G(s)|, |G(w)| (db)
-50
-100
|G(s)|
-150
-200
-250 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.18: Respuestas en frecuencia de G(s)yG(w)
Especi cacion de comportamiento nominal (NP): reduccion de la sensibilidad
de al menos 1=100 hasta una frecuencia de aproximadamente 1 rad=seg. Lo anterior puede conseguirse mediante una funcion de ponderacion WS de la forma, s + 1)2 WS 1 = 0(:01( s=30 + 1)2 Especi cacion de estabilidad robusta (RS): un ancho de banda de unos 30 rad=s, una tolerancia a incertidumbre multiplicativa superior al 32 %, y una cada de j T j inferior a 20 db para frecuencias superiores a 2000 rad=s. Estas especi caciones se pueden tener en cuenta eligiendo una funcion de ponderacion WT de la forma, s=300 + 1) WT 1(s) = 3:16( (s=10 + 1) El parametro empleado en WS tiene el sentido fsico de que al aumentarlo se impone al sistema de control una especi cacion de np mas exigente (un valor inferior de j S j a baja frecuencia). El proceso de dise~no consiste en jar WT y variar , de forma que se cumpla la condicion de estabilidad robusta, as como que se optimice el comportamiento nominal simultaneamente para el valor mayor de posible. En la gura 10.19 se muestran las formas de WT 1 y WS 1 para = 1:5.
Controladores H1
271
20
10
|1/W_S|, |1/W_T| (db)
0
-10
|1/W_T|
-20
-30 |1/W_S| -40
-50 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.19: Respuesta en frecuencia de funciones de ponderacion inversas WS 1; WT 1 Se plantea por tanto un problema de control H1 de sensibilidad mixta (np + rs):
W S
S kTzw k1 =
W T
< 1 (10:37) T
1
Se inicia el proceso de dise~no con = 1, obteniendose un regulador H1 para el que se cumplen las especi caciones de dise~no. A n de mejorar las prestaciones del regulador, se inicia un proceso iterativo dando valores al parametro . Se concluye nalmente, que el objetivo de dise~no 10.37 se veri ca con un regulador H1 para un valor de hasta = 1:5, no cumpliendose para un regulador H2. En la gura 10.20 pueden compararse las respuestas en frecuencia de Tzw para ambos reguladores. Como puede comprobarse, el regulador H2 no consigue el objetivo kTzw k1 < 1, mientras s se alcanza con el regulador H1. En las guras 10.21, 10.22, 10.23 y 10.24 se muestran respectivamente las respuestas en frecuencia de WS 1 con S , WT 1 con T , para el regulador H2 y el H1. Finalmente en la gura 10.25 se muestra la curva de Nichols (de la funcion de transferencia en lazo abierto L = GK ) obtenida con el regulador H1. A partir de ella, puede obtenerse que el controlador dise~nado proporciona un margen de ganancia de
Problemas de control H2; H1 en el espacio de estados
272 4
H_2
2 0
|T_zw| (db)
-2 -4 H_inf
-6 -8 -10 -12 -14 -16 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.20: Respuesta en frecuencia de Tzw para reguladores H2 y H1 12 decibelios, y un margen de fase de 43 grados. Por otro lado, a partir de 1= j T j se obtiene una tolerancia a incertidumbre multiplicativa superior al 60 % en el peor de los casos. El regulador H1 obtenido, K (z), es de orden 6, el mismo de la planta generalizada. Ya que la planta a controlar es de orden 3, la funcion de ponderacion WS es de orden 2, y WT es de primer orden.
z6 40:2747z5 + 13:4628z4 + 35:544z3 31:404z2 + 3:7234z + 2:2497 K (z) = 16:7016 z6 1:5311z5 + 0:1799z4 + 0:2894z3 + 0:0413z2 + 0:0169z + 0:0037 En las guras 10.26 y 10.27 se muestran respectivamente la se~nal de control y la respuesta obtenida con el regulador H1.
Controladores H1
273
20 |1/W_S|
10
|S|, |1/W_S| (db)
0 |S| -10
-20
-30
-40
-50 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.21: Magnitudes de WS 1 y S para regulador H2 20 10 0
|T|, |1/W_T| (db)
|T| -10
|1/W_T|
-20 -30 -40 -50 -60 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.22: Magnitudes de WT 1 y T para regulador H2
Problemas de control H2; H1 en el espacio de estados
274 20
|1/W_S|
10
|S|, |1/W_S| (db)
0 |S| -10
-20
-30
-40
-50 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.23: Magnitudes de WS 1 y S para regulador H1 20 10 0
|T|, |1/W_T| (db)
|T| -10
|1/W_T|
-20 -30 -40 -50 -60 10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.24: Magnitudes de WT 1 y T para regulador H1
Controladores H1
275
60
40
|L| (db)
20
0
-20
-40
-60
-80 -450
-400
-350
-300
-250
-200
-150
-100
-50
0
arg(L) (gra)
Figura 10.25: Curva de Nichols para regulador H1 20 15 10
control
5 0 -5 -10 -15 -20
5
10
15
20
25
30
35
40
45
50
muestras (Tm=0.01 seg.)
Figura 10.26: Se~nal de control para cambio en escalon unidad, con regulador H1
Problemas de control H2; H1 en el espacio de estados
276
1.4 1.2
respuesta
1 0.8 0.6 0.4 0.2 0
5
10
15
20
25
30
35
40
45
50
muestras (Tm=0.01 seg.)
Figura 10.27: Respuesta a escalon unidad, con regulador H1
Captulo 11 Aplicacion de control robusto 11.1 Introduccion Hasta la decada de los ochenta las aplicaciones de las tecnicas de control moderno en los buques haba sido algo bastante inusual. A pesar de la amplia aceptacion y exitos conseguidos en otras ramas de la ingeniera (probablemente el contrapunto sea la industria aeronautica), donde los avances de la teora de control han sido rapidamente incorporados en la busqueda de la mejora del funcionamiento y seguridad. Las razones de la inercia presentada por la industria naval hay que buscarlas en diversos factores, tales como: la mayor duracion de los barcos comparados con los aviones, la resistencia a intentar nuevas tecnicas cuando los metodos tradicionales han demostrado tener un funcionamiento valido, as como la cada en la industria de construccion naval, entre otros. En muchos casos, la innovacion ha consistido en la sustitucion directa de los antiguos sistemas de control analogicos por otros equivalentes digitales, y el aprovechamiento de la potencia de computacion del ordenador empleado, para incorporar o mejorar tareas de monitorizacion y alarma; mas que para explotar los bene cios que podra reportar el empleo de algoritmos de control avanzado. Los primeros autopilotos para el guiado automatico de barcos eran simples dispositivos en los que el error de rumbo se utilizaba para producir una orden al servosistema del timon proporcional al error del rumbo. Posteriormente se modi co incluyendo el efecto derivativo para mejorar la respuesta transitoria y el efecto inte277
278
Introduccion
gral para corregir los errores estacionarios debidos a las perturbaciones ambientales. Debido a su simplicidad, abilidad y bajo coste, los autopilotos pid aun se mantienen en la mayora de barcos. Uno de los principales inconvenientes es la necesidad de sintonizacion por parte del operador, para adaptarse al cambio de condiciones de navegacion. Ha sido el perodo de nales de los setenta y durante la decada de los ochenta, cuando la mejora del sistema de control de los buques ha experimentado un notable incremento en investigacion y desarrollo. La justi cacion se debe primordialmente a razones tales como: 1. Las elevadas subidas del precio del petroleo y la busqueda de la reduccion del coste en los transportes. 2. La exigencia de mejora en la seguridad del transporte martimo. 3. La transferencia tecnologica acelerada por los recientes avances de la microelectronica, informatica y telecomunicaciones. 4. El exito obtenido en otras ramas de la industria, en la aplicacion de los ultimos desarrollos de la teora de control. El impulso proporcionado en la ultima decada se pone de mani esto, en el hecho de que todos los buques de nueva construccion incorporan un sistema automatico mas o menos so sticado para el control del rumbo. Por otro lado, ha demostrado ser de gran utilidad, tanto para buques de la Marina Mercante como para los de la Armada, el que adicionalmente al problema del control del rumbo de un buque (escalar o monovariable), se considere el empleo de sistemas activos de estabilizacion para la regulacion del movimiento de balance; lo cual da lugar a un problema de control multivariable (sistema con dos entradas y dos salidas). Si bien en la mayora de sistemas instalados a bordo se tratan como dos problemas de control independientes, en el sentido de que los reguladores se dise~nan de forma independiente entre s, sin tener en cuenta el caracter vectorial de la planta. El problema del control de un buque puede interpretarse segun la losofa del control robusto, dado la gran cantidad de factores que van a in uir en la incertidumbre del modelo de la planta. La dinamica de un buque va a depender de una serie de factores, entre los que cabe destacar (Lopez et al, 1995):
Aplicacion de control robusto
279
Velocidad de crucero
Condiciones de carga
?
? Dinamica del buque
6 Perturbaciones ambientales
6 Otros factores
Figura 11.1: Factores que afectan a un buque 1. Velocidad de crucero. 2. Estado de carga. 3. Estado del mar, vientos y corrientes. 4. Profundidad. 5. Densidad del agua del mar. Un sistema de control e caz ha de tener en cuenta los errores de modelado que se pueden acumular debido al efecto de diferentes factores. Por lo que el analisis de robustez del sistema es esencial, dadas las diversas circunstancias que van a in uir sobre la dinamica de la planta y por tanto sobre el comportamiento del sistema de control. En este captulo se describen los dise~nos de controladores LTR, H2 y H1 multivariables para el control del rumbo y balance de un buque, proponiendose un conjunto de indicadores de robustez para su evaluacion.
280
Descripcion de la planta
11.2 Descripcion de la planta La complejidad de la dinamica de un buque, as como el alto coste economico y de tiempo para la realizacion de pruebas de mar experimentales, puso de mani esto la necesidad del empleo de modelos que captaran el comportamiento de un barco en diversas condiciones de navegacion. A partir de nales de los setenta el empleo de modelos matematicos hizo que se avanzara en el dise~no y aplicacion de nuevos sistemas de control en la industria naval, gracias a los avances conseguidos en los computadores digitales empleados para realizar las simulaciones. A partir de las leyes de la mecanica, para un solido rgido con seis grados de libertad (3 rotaciones y 3 traslaciones), se pueden obtener las ecuaciones que gobiernan el movimiento de un buque, referidas a un sistema de referencia jado en el propio barco: Para la traslacion (fuerzas):
X = m[u_ + qw rv xG (q2 + r2) + yG(pq r_) + zG (pr + q_)] Y = m[v_ + ru pw yG(r2 + p2) + zG (qr p_) + xG (qp + r_)] Z = m[w_ + pv qu zG(p2 + q2) + xG (rp q_) + yG(rq + p_)]
(11.1)
y para el giro (pares o momentos de fuerza):
K = Ixp_ + (Iz Iy )qr + m[yG(w_ + pv qu) zG (u_ + ru pw)] M = Iy q_ + (Ix Iz )rp + m[zG (u_ + qw rv) xG(w_ + pv qu)] N = Iz r_ + (Iy Ix)pq + m[xG (v_ + ru pw) yG(u_ + qw rv)]
(11.2)
El sistema de referencia esta situado en el buque y no tiene por que coincidir con el centro de gravedad del mismo (a veces se emplea el centro de simetra). Las magnitudes que aparecen en las ecuaciones anteriores son:
m: masa del barco. Ix; Iy ; Iz : momentos de inercia respecto a cada eje coordenado. xG ; yG; zG: posicion del centro de masas. ; ; : angulos de giro respecto a los ejes coordenados (x; y; z). r = _ ; p = ;_ q = _: velocidades angulares respecto a los tres ejes.
Aplicacion de control robusto
281
u; v; w: componentes del vector velocidad referidos a los ejes coordenados (x; y; z). Tambien se emplean como: Vx = u; Vy = v; Vz = w.
X; Y; Z : componentes en cada eje de las fuerzas actuantes sobre el barco. K; M; N : componentes en cada eje de los pares o momentos actuantes sobre el buque.
En las guras (11.2),(11.3) y (11.4) se muestra el signi cado fsico de las variables mas signi cativas del modelo. Z
X
Y
Figura 11.2: Sistema con 6 grados de libertad Si solo se consideran el desplazamiento en el plano horizontal y los giros respecto a los ejes (x; z), el sistema se reduce a un problema de cuatro grados de libertad. Las ecuaciones del movimiento quedan en ese caso:
2 (1 X 00 ) 66 0 G 64 0 0
0
(1 Yv_00 ) (zG00 + Kvv00_ ) (x00G Nv00_ )
0
L(zG00 + Yp_00 ) 00 K 00 ) L(kxx p_ 00 L(zG x00G + Np00_ )
3 2 u_ 3 2 X tot L(x00G Yr_00 ) 777 666 v_ 777 = 666 Ytot L(zG00 x00G + Kr00_ ) 5 4 p_ 5 4 Ktot Ntot r_ L(kzz002 Nr00_ ) 0
3 77 75
(11:3)
282
Descripcion de la planta
Vx
V
Vy
Figura 11.3: Variables: ; ; u = Vx; v = Vy ; V
Figura 11.4: Variables: ;
Aplicacion de control robusto
283
Donde el subndice \tot" indica las fuerzas y pares totales actuando sobre el casco, debidos a los efectos: hidrodinamicos, viento, olas y corriente; y el resto de variables son las magnitudes fsicas del buque as como sus coe cientes hidrodinamicos. Para buques de grandes dimensiones, la consideracion anterior es razonable, ya que los movimientos mas signi cativos son los que afectan al gobierno del barco (rumbo y movimiento en el plano), y al movimiento de balance (giro con respecto a un eje axial al buque); despreciandose el desplazamiento vertical y el giro con respecto a un eje transversal conocido como movimiento de cabeceo. En ese caso, el modelo, desde el punto de vista del control, se caracteriza por una o dos entradas de control (angulos de timon y aletas estabilizadoras) y dos salidas (angulos de rumbo y balance); tratandose por tanto de un sistema multivariable. Si unicamente se esta interesado en el control del rumbo (por ejemplo, para el caso de grandes petroleros, en los que el movimiento de balance es menos apreciable), el modelo matematico se reduce a un sistema escalar de una entrada y una salida (ver ejemplo del control del rumbo dado en el captulo 4, apartado 4.4). Entre las razones que justi can el empleo de sistemas de control del movimiento de balance pueden destacarse: 1. Medida de seguridad en navegacion; ya que un corrimiento o desplazamiento de la carga, causado por un angulo de escora excesivo, puede poner en serio peligro la estabilidad del buque. 2. No tener que desviarse en exceso de una ruta dada debido a unas condiciones ambientales adversas. 3. Mejora en las condiciones de trabajo de la tripulacion. 4. Aumento de la comodidad del pasaje, en su caso. 5. Conseguir una plataforma estable adecuada, para el disparo y aterrizaje a bordo, en los buques de la Armada. Para ello, se pueden emplear diferentes tecnicas: 1) sistemas de depositos o tanques de agua; 2) utilizacion del timon como sistema de estabilizacion del balance (rrs); y 3) la que ha resultado ser mas e caz, al menos para velocidades superiores a 12 nudos, que utiliza super cies de control o aletas estabilizadoras. Al considerar el problema de control de los angulos de rumbo ( ) y balance (), empleando como variables de control los angulos de timon () y de las aletas (), se plantea un problema de control de un sistema multivariable. En determinados
284
Descripcion de la planta angulo de estabilizadores ()
angulo de balance ()
-
-
BUQUE angulo de timon ()
-
-
angulo de rumbo ( )
Figura 11.5: Componentes de entrada-salida del problema multivariable buques, existe una fuerte interaccion entre las distintas variables de entrada y salida, por lo que el empleo de dos controladores independientes puede no dar buenos resultados. En ese caso, si se quiere conseguir un buen comportamiento, se hace aconsejable el empleo de tecnicas de control de sistemas multivariables. Desde el punto de vista del control de un buque se puede decir que hay dos condiciones de navegacion bien diferenciadas (Lopez et al, 1995). La primera, se trata del caso en que el problema es el realizar una determinada maniobra que conlleve esfuerzos grandes y prolongados de las variables de control (timon y aletas estabilizadoras), en cuyo caso los efectos no lineales dominan el comportamiento del sistema. La otra, se da en situaciones de mantenimiento del rumbo, o cuando el proceso de regulacion para un cambio de consigna requiere unas desviaciones de las super cies de control (pala de timon y aletas estabilizadoras) que no sean excesivas en tiempo y magnitud. Bajo dichas condiciones el sistema se puede aproximar por un modelo lineal. Ello puede hacerse linealizando las ecuaciones del movimiento en torno a una solucion estacionaria, para unas condiciones nominales de funcionamiento. Otra posible forma es realizando una identi cacion de la planta por algunos de los metodos dados en el captulo 3; o una identi cacion en el dominio de la frecuencia, como se hizo para obtener el modelo matematico lineal mlmv19 que se describe a continuacion. Para ilustrar el dise~no de controladores multivariables, se emplean los modelos lineales o linealizados multivariables (dos entradas y dos salidas) para unas condiciones de operacion de dos buques. Se emplean por un lado el modelo matematico que denominaremos mlmv19 (modelo lineal de orden elevado obtenido por identi cacion); y por otro modelo no lineal y variable en el tiempo que llamaremos modnl. En el primer caso, (mlmv19) el modelo matematico corresponde a un buque
Aplicacion de control robusto
285
(s) s
- G11 (s) - m(s-) 6 - G12 (s)
(s)
s - G22(s) - m(s-) 6
- G21 (s) Figura 11.6: Diagrama de bloque del sistema multivariable tipo fragata para unas condiciones nominales de funcionamiento y una velocidad de 18 nudos1 . Fue obtenido por (Freeman et al, 1982) empleando tecnicas de respuesta en frecuencia, a partir de las cuales se obtuvieron las cuatro funciones de transferencia (G11 ; G12; G21 ; G22) que caracterizan la matriz de transferencia del sistema multivariable. Las ecuaciones descriptivas de la planta vienen dadas por: " # " #" # (s) = G11 (s) G12(s) (s) (s) G21 (s) G22(s) (s)
(11:4)
:92(1:54s2 + 0:976s + 0:0077) G11(s) = (19:84s4 + 24:34s19 3 + 7:69s2 + 5:34s + 0:234)(s2 + 3:645s + 13:28) :916(0:965s2 + 0:61s 0:176) G12(s) = (15:66s4 + 21:32s13 3 + 6:87s2 + 3:81s + 0:193)(s2 + 9:402s + 7:952) 0:1 G21(s) = (s2 + 3:645s + 13 :28)(21:5s2 + s) G22(s) = (s2 + 9:402s +0:74266 :952)(18:1s2 + s) La variable a controlar y1 corresponde al angulo de balance , la variable a controlar y2 es el angulo de rumbo , la variable de control u1 corresponde al angulo 1
Navegacion: 1 Nudo = 1852 metros/hora.
286
Descripcion de la planta
de aletas estabilizadoras , y la variable de control u2 corresponde al angulo de timon . Dado que una realizacion mnima en el espacio de estados de este modelo es de dimension elevada (diecinueve), se va a emplear un modelo de orden reducido de la planta, a n de obtener un controlador de menor dimension y para hacer un analisis posterior de la robustez del sistema de control frente a la dinamica inmodelada de alta frecuencia (debida en este caso a la diferencia entre el modelo de orden completo y el modelo de orden reducido). Si se calculan los valores singulares de Hankel del modelo completo de la planta:
Hi para: i = 1; 2; : : : ; 19 se obtiene que:
H 7 < 0:1H 6 y dado que Hi+1 Hi , se elige un modelo reducido de sexto orden. En la gura 11.7 se muestran las ganancias principales del modelo completo y del modelo reducido, como puede verse se consigue una buena aproximacion hasta una frecuencia de 3 radianes/segundo. Dado que esta frecuencia va a ser muy superior al ancho de banda del sistema en lazo cerrado, puede considerarse una aproximacion aceptable en el rango de frecuencias de interes. Las matrices de estado obtenidas para el modelo reducido de la planta son: 0 0:049 0:015 0:255 0:442 0:986 0:094 1 B 0:012 0:279 0:211 0:632 0:112 0:357 C CC B B CC B 0 : 010 0 : 151 0 : 228 0 : 443 0 : 182 0 : 555 A = B B 0:092 0:482 0:213 0:118 0:896 0:017 C C B B @ 0:053 0:179 0:080 0:067 0:569 0:117 CA 0:001 0:203 0:307 0:010 0:034 0:178 ! 0 : 001 0 : 001 0 : 013 0 : 004 0 : 039 0 : 017 T B = 0:025 0:035 0:031 0:102 0:106 0:033
C =
0:011 0:023
0:796 0:001
0:478 0:001
1:149 0:001
0:113 0:000
0:480 0:000
!
Para la sntesis del regulador se emplea el modelo reducido, sin embargo la evaluacion de la respuesta temporal se realiza con el modelo de orden completo. En la gura 11.8 se muestra el numero de condicion, (G), de la planta, a partir del cual puede comprobarse que la planta tiene una fuerte direccionalidad en la ganancia, puesto que (G) 1 para todas las frecuencias (ver captulo 8).
Aplicacion de control robusto
287
100
50
sv (db)
0 G -50
Gp
-100
Gp
-150
-200 10 -4
10 -3
10 -2
10 -1
10 0
10 1
G
10 2
w (rad/s)
Figura 11.7: Respuestas en frecuencia de modelos completo (Gp) y reducido (G) 100 90 80 70
k(G)
60 50 40 30 20 10 0 10 -3
10 -2
10 -1 w (rad/s)
Figura 11.8: Numero de condicion de la planta
10 0
288
Descripcion de la planta
En el segundo caso (modnl), el modelo matematico corresponde al desarrollado por (Kallstrom et al, 1982), y corresponde a un buque mercante del tipo ro/ropasajeros. Este modelo es multivariable, no lineal y variable en el tiempo, sirviendo para caracterizar el comportamiento del buque tanto en operacion de mantenimiento de rumbo, como en grandes maniobras. La validacion experimental de este modelo fue realizada de forma exhaustiva por sus autores, ajustando sus parametros hasta conseguir una excelente correspondencia entre los resultados experimentales y las simulaciones. Por ello, se puede considerar el modnl como un buen banco de pruebas para evaluar los dise~nos de sistemas de control desarrollados tanto escalares como multivariables (Lopez y Rubio, 1995a; Messer y Grimble, 1992; Kallstrom et al, 1982). Las expresiones correspondientes a cada uno de los terminos que aparecen en la ecuacion 11.3, correspondientes a los pares y fuerzas debidos a los factores hidrodinamicos y las perturbaciones ambientales, pueden encontrarse en (Kallstrom et al, 1982; Lopez, 1994). Los angulos de timon y aletas que se generan como magnitudes de mando a traves de un controlador, ya sea automatico o manual, han de ser ejecutados por las respectivas maquinas del timon y de las aletas estabilizadoras. Las dinamicas de estos dispositivos se modelan como sistemas de primer orden, dados por: _ = (c )=R ; j _ j _max ; j j max _ = (c )=F ; j _ j _ max ; j j max siendo c y c los angulos de mando de consigna que se remiten como orden a la sala de maquinas (con las constantes de tiempo R y F ). Para mostrar la naturaleza no lineal del modnl, se presentan a continuacion algunas pruebas de simulacion. En las guras 11.9 y 11.10 puede verse la perdida sustancial de velocidad que experimenta el sistema si se somete a una prolongada activacion de la variable de control (angulo de timon). En dichas guras se muestran la derivada del rumbo (o velocidad angular) r, y la velocidad V , para angulos de timon de 20 y 10 grados respectivamente. Se representan as mismo el angulo de balance , y su derivada p. La velocidad nominal o de crucero inicial es en ambos casos de 15 nudos. Se observa, que a mayor angulo de timon mayor es la perdida de velocidad. Y dado que la dinamica del buque depende fuertemente y de forma no lineal de dicha velocidad, as como tambien de otras magnitudes, _ ; ; ;_ ; se tendra que durante dicha operacion el sistema tendra un comportamiento no lineal y variable en el tiempo.
Aplicacion de control robusto
289
0
8
V (m/s)
r (grad/seg)
-0.2 -0.4 -0.6
7
6
-0.8 -1 0
5 0
500
8
0.6
6
0.4
4 2 0 -2
500 t (seg)
p (grad/s)
fi (grad)
t (seg)
0.2 0 -0.2
0
-0.4 0
500 t (seg)
500 t (seg)
Figura 11.9: r(t); V (t); (t); p(t) para = 20; V = 15 nudos 0
8
V (m/s)
r (grad/seg)
7 -0.5
-1
6 5 4
-1.5 0
3 0
500 t (seg)
1
15
p (grad/s)
fi (grad)
10 5 0 -5
500 t (seg)
0
500 t (seg)
0.5
0
-0.5
0
500 t (seg)
Figura 11.10: r(t); V (t); (t); p(t) para = 10; V = 7:72 m=s
290
Descripcion de la planta polos (seg) 0 -0.02825 0.30494j 3.27 -0.0081 123.17 -0.1403 7.12
Tabla 11.1: Polos y constantes de tiempo de modnl linealizado para V = 7:72m=s Para realizar el dise~no de los reguladores es necesario que se disponga de un modelo lineal de la planta. Para ello, el modnl se linealiza en torno a la solucion estacionaria u = V; v = r = = p = = = 0 donde V es la velocidad de crucero. A continuacion se dan las matrices de una representacion de estado del modelo (modnl) linealizado para una velocidad V = 15 nudos, as como la tabla 11.1 con los polos y constantes de tiempo ( ) asociados (no se considera la dinamica de los actuadores). Como puede verse el sistema tiene un par de polos complejos conjugados muy poco amortiguados.
0 0:02720 B B B 0:00250 0:00128 A=B B B 0 @
0:15048 0:04043 0:00129 1 0
0
0 0:06466 B B 0:01426 B B B = B 0:0007 B 0 @ 0
0:1747 0:01319 0:00554 0 0
0:00443 0:39268 0:13732 0 1
1 CC CC CC ; A
0:26255 0:09381 0:00204 0 0
0 BB 00 B CT = B BB 0 @1
0 0 0 0 0 1
0 0 0 0 0
1 CC CC CC A
1 CC CC CC A
Aplicacion de control robusto
291
11.3 Evaluacion de los controladores Cuando se realiza el dise~no de un regulador utilizando para ello algun criterio de optimizacion, o siguiendo una determinada tecnica, conviene evaluar las caractersticas de dicho regulador frente a diferentes indicadores de comportamiento y robustez, que proporcionen una vision mas global de las prestaciones del regulador. A continuacion se proponen un conjunto de indicadores para evaluar los dise~nos que se realicen.
Analisis de la respuesta temporal y se~nales de control. Caracterizacion del rechazo de las perturbaciones actuantes a la salida (do) y a la entrada (di) de la planta, por medio de:
Ido = [So (j!)];
Idi = [SoG(j!)]
Indicador de Comportamiento Nominal (una medida del grado de recuperacion a una frecuencia ! = !o dada):
(
o )] [L(j!o )] INP = min [[LL((j! ; t j!o )] [Lt (j!o )]
)
Margenes de Estabilidad (extension al caso multivariable de los margenes de
fase y ganancia clasicos, se emplean para ello los valores propios, i de la matriz de transferencia en lazo abierto):
MG = min fMG(i )g ; i
MF = min fMF (i )g i
En el caso de un sistema multivariable, los margenes de fase y ganancia as obtenidos no proporcionan la utilidad que tienen en el caso de los sistemas escalares para caracterizar la robustez del sistema. Pero s pueden utilizarse como indicadores de robustez cualitativos (Lunze, 1989; Doyle y Stein, 1981), en el sentido de que si se obtienen valores poco satisfactorios de MG y MF, ello sera indicativo de la falta de robustez.
Indicadores de Estabilidad Robusta (estimacion del tanto por ciento de incertidumbre tolerable para la que el sistema mantiene su estabilidad):
2
El subndice\i" indica que se trata de un indicador con respecto a incertidumbre de tipo multiplicativo que se considera re ejada a la entrada de la planta, mientras que con el subndice\o" se indica que se considera a la salida. 2
292
Dise~no de controladores LTR multivariables
{ Incertidumbre multiplicativa no estructurada: 3 I11i : M = Ti ; I11o : M = To min ! f1= [M (j! )]g 100% { Incertidumbre multiplicativa con estructura diagonal: I12i : M = Ti ; I12o : M = To min ! f1=[M (j! )]g 100% { Incertidumbres multiplicativas simultaneas con estructuras diagonales: I1s : min ! f1=[M (j! )]g 100% "
# T S K i i M= SG T o o Indicadores de Comportamiento Robusto (estima el tanto por ciento de incertidumbre de tipo multiplicativo con estructura diagonal tolerable para la que el sistema cumple una especi cacion de comportamiento dada de la forma (So WS ) 1): " # T KS W i o S I3i : M = SoG SoWS " # T T W o o S I3o : M = So To WS min ! f1=[M (j! )]g 100%
11.4 Dise~no de controladores LTR multivariables En este apartado se realiza el dise~no de controladores LTR (LTR-o y LTR-i) con la estructura convencional, as como para la estructura no basada en observador, ambas descritas en el captulo 9. representan los valores singulares extremos, y el valor singular estructurado. M representa el sistema de interconexion correspondiente a cada caso. 3 ;
Aplicacion de control robusto
293
11.4.1 Dise~no LTR-o Para el dise~no del regulador se sigue el procedimiento descrito en el captulo 9. El parametro\q" (ganancia de recuperacion) se incrementa solo lo necesario para realizar una recuperacion aceptable en el rango de frecuencias de interes del sistema (zonas de baja y media frecuencia). As se evita incrementar la sensibilidad del sistema a la dinamica no modelada de alta frecuencia (rs), y se aproximan las especi caciones de dise~no (np). Se desea que el sistema consiga un buen rechazo de las perturbaciones y unos errores de seguimiento lo su cientemente peque~nos (aproximacion de la accion integral). Para ello, se toman los siguientes parametros de dise~no: " # " # 10 0 0 : 9817 0 : 1342 T Ro = 0 1 ; Qo = a W a ; W = 0:1342 0:0184
Rc = I2; Qc = CaT Ca ; Ca = [C O2]; BaT = [B O2] " # " # A B O n 2 Aa = O ; ; q = q1 = 103 a= I I 2n 22 22 donde Aa ; Ba y Ca son las matrices de la planta ampliada. En la gura 11.11 se muestran las ganancias principales de L(s) para el controlador lqg/ltr-o (cbo); como puede verse, el controlador no consigue una recuperacion adecuada. Si se incrementa q hasta 1000q1, se obtiene el nivel de recuperacion deseado a baja frecuencia, pero a costa de un incremento en el ancho de banda del regulador. Esto produce como consecuencia que las ordenes generadas por el controlador sean de magnitudes mayores, con lo que se puede provocar la saturacion de los actuadores de una forma mas frecuente, una mayor sensibilidad a las incertidumbres y a las perturbaciones ambientales, as como la posible generacion de ordenes de control irrealizables fsicamente por el sistema. Si se emplea un controlador ltr-o (cnbo) con los mismos parametros de dise~no dados arriba, se observa la mejora en el grado de recuperacion conseguida a baja frecuencia con respecto al cbo ( gura 11.12); puede comprobarse que es el mismo que el obtenido con la estructura estandar (cbo) para q = 1000q1. El efecto de incrementar el valor de q puede verse al comparar las guras 11.13 y 11.14, donde se muestran las respuestas temporales y demandas de control para ambos controladores: cbo, q = 1000q1 y cnbo, q = q1. En la gura 11.15 se puede observar como el regulador dise~nado cumple las especi caciones deseadas para el rechazo de las perturbaciones actuantes tanto a la salida (i (So)), como a la entrada (i (SoG)) de la planta. En la misma gura se
294
Dise~no de controladores LTR multivariables 150 KBF 100
sv(L) (db)
50
LTR KBF
LTR 0 KBF -50 q=1000 (cbo) -100
-150 10 -5
LTR
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
w (rad/s)
Figura 11.11: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cbo 150
100
sv(L) (db)
50
0 KBF -50 q=1000 (cnbo) LTR
-100
-150 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
w (rad/s)
Figura 11.12: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cnbo
Aplicacion de control robusto
295
8 y2
y (gra)
6 4 y1
2 0 -2
0
50
100
150
200
250
300
t (seg) 60 q=1e6, (cbo)
u (gra)
40
u1
20 0 u2
-20 -40 0
10
20
30
40
50
60
70
80
90
100
t (seg)
Figura 11.13: Respuesta temporal para cbo, q = 103q1 8 y2
y (gra)
6 4 2
y1
0 -2
50
0
100
150
200
250
300
t (seg) 60
u (gra)
40
q=1e3, (cnbo)
u1
20 0 u2
-20 -40 0
10
20
30
40
50
60
70
80
90
t (seg)
Figura 11.14: Respuesta temporal para cnbo, q = q1
100
Dise~no de controladores LTR multivariables 20
20
0
0
sv(SoG) (db)
sv(So) (db)
296
-20 -40 -60 -80 10 -5
-20 -40 -60
10 -2
-80 10 -5
10 1
rad/s 60
1/[sv(M),ssv(M)] (db)
1/[sv(M),ssv(M)] (db)
10 1
rad/s
60 40 20 iMies 0 iMi -20 10 -5
10 -2
10 -2
10 1
40 iMoes
20
iMo
0 -20 10 -5
rad/s
10 -2
10 1
rad/s
Figura 11.15: Caracterstica rechazo perturbaciones y niveles de incertidumbre tolerables representan tambien unas estimaciones de las tolerancias del sistema de control a incertidumbres de tipo multiplicativo, que se den a la entrada (iMi) o a la salida de la planta (iMo) respectivamente. Para incertidumbre no estructurada se representa: 1=[M (j!)] y para el caso de incertidumbres con estructura diagonal (a la entrada de la planta puede corresponder a la dinamica no modelada de los actuadores: iMies, y si se considera a la salida de la planta se podra representar la dinamica de los sensores (iMoes), se representa: 1=[M (j!)] donde M (j!) es el sistema de interconexion. Con 1=[M (j!)] se obtienen unas estimaciones de las tolerancias a las incertidumbres mayores que con 1=[M (j!)], o lo que es lo mismo: se obtiene una estimacion de la robustez de la estabilidad superior. Esto es logico, al suponer la primera una condicion menos conservativa que la ultima. Puede comprobarse tambien, que el sistema es mas robusto frente a incertidumbres situadas a la salida de la planta que frente a incertidumbres situadas a la entrada; ello es consecuencia de que el dise~no realizado es ltr-o. En la tabla 11.2 se resumen los valores de los indicadores de robustez consegui-
Aplicacion de control robusto Controlador cbo: q = 1000q1 cnbo: q = q1
297
I11i I12i I11o I12o I1s MG MF I3o I3i % % % % % db gra % % 23.0 27.5 76.1 76.1 22.0 26.9 59.8 38.3 24.5 25.3 62.1 74.9 74.9 34.3 18.9 51.8 53.5 40.9
Tabla 11.2: Indicadores de robustez de los controladores LTR-o (mlmv19) dos por ambos controladores ltr-o para el mismo grado de recuperacion (inp) 4. Finalmente, se puede realizar una implementacion del regulador en tiempo discreto, empleando un perodo de muestreo de hasta 1 segundo, con el cual el regulador de tiempo discreto proporciona un comportamiento en lazo cerrado equivalente al de tiempo continuo.
11.4.2 Dise~no LTR-i En este apartado se presentan los resultados de simulacion obtenidos con el modelo no lineal multivariable; a n de evaluar los controladores que se dise~nan a partir de modelos linealizados para distintas condiciones de trabajo. En la seccion anterior se ha realizado un dise~no ltr-o, en esta se hace uno ltr-i, para as ilustrar aplicaciones de ambas metodologas. Una discusion mas amplia sobre el dise~no y analisis de reguladores ltr-i para distintas condiciones de funcionamiento puede encontrarse en (Lopez, 1994; Lopez y Rubio, 1995a). Con el modelo linealizado de la planta (modnl) para una velocidad de V = 15 nudos y los parametros de dise~no: # " # " 0 : 1 0 10 0 T Rc = 0 1 Qc = C QC Q = 0 1 Ro = I2 Qo = BB T q = 106 se obtiene un regulador lqg/ltr-i. En la gura 11.16 se tiene la respuesta obtenida con el modelo lineal, que puede compararse con la obtenida para el modelo no lineal dada en la gura 11.17. El controlador se ha calculado para una condicion de trabajo dada, por lo que interesa ver el comportamiento del sistema en otras condiciones diferentes. Esto se Los valores de la tabla 11.2 estan expresados: MF en grados, MG en decibelios y el resto de indicadores en tanto por ciento de incertidumbre tolerable. 4
298
Dise~no de controladores LTR multivariables 8 y2
y (gra)
6 4 2
y1
0 -2
0
20
40
60
80
100
120
140
160
180
200
120
140
160
180
200
t (seg) 10 u2
u (gra)
5 0 u1
-5 -10 0
20
40
60
80
100 t (seg)
Figura 11.16: Respuesta con modelo linealizado de modnl 8
y (gra)
6
y2
4 2
y1
0 -2
0
20
40
60
80
100
120
140
160
180
200
120
140
160
180
200
t (seg) 10
u (gra)
5
u2
0 u1
-5 -10 0
20
40
60
80
100 t (seg)
Figura 11.17: Respuesta con modelo no lineal (modnl)
Aplicacion de control robusto
299
hace analizando las respuestas temporales del sistema a cambio de consigna tipo escalon de 5 grados, para velocidades de crucero de V1 = 10 nudos y V2 = 21 nudos respectivamente, que se muestran en la gura 11.18. Como puede verse, ambas respuestas son satisfactorias.
4
0.4 0.2
V2
roll (deg)
heading (deg)
6
V1 2
V2
0
V1 -0.2
0 0
50
100
150
-0.4 0
200
50
t (sec)
V2
fin (deg)
rudder (deg)
0 -2 V1 -4
0
150
200
150
200
2
2
-6
100 t (sec)
50
100 t (sec)
150
200
0
V2 V1
-2
-4
0
50
100 t (sec)
Figura 11.18: Respuestas temporales para diferentes condiciones de navegacion Se ha visto que, para excursiones moderadas del vector de control, el sistema no lineal (modnl) responde adecuadamente con el regulador lineal dise~nado. Sin embargo, el modelo es fuertemente no lineal, por ello se trata de evaluar al controlador en una situacion en la que los efectos no lineales dominen el comportamiento del sistema. Esta circunstancia se da en el caso de grandes cambios de consigna, en los que el vector de control puede llegar a saturarse o tomar valores elevados, durante perodos de tiempo relativamente largos; con las consiguientes perdidas de velocidad y cambios en la planta que ello produce. En la gura 11.19 se muestra la respuesta del sistema para un cambio de consigna de 180 grados; como puede verse, el comportamiento es excelente: no produce una sobreoscilacion apreciable y la interaccion con la otra variable a controlar es muy baja, si se compara con los resultados obtenidos para la misma maniobra empleando un controlador monovariable (ver gura 11.20). La importancia de este controlador estriba en que al reducir el angulo de inclinacion o balance (tambien denominado de
300
Dise~no de controladores LTR multivariables
200
40
150
20
u2 (gra)
y2 (gra)
escora) durante la maniobra, se mejora la robustez del sistema frente a un angulo de escora excesivo, que circunstancialmente puede a su vez provocar un desplazamiento de la carga y por tanto un fuerte cambio en las caractersticas que determinan la estabilidad del buque, aumentando el peligro de vuelco.
100 50
0 -20
0 0
500
-40 0
1000
t (seg)
500
1000
t (seg) 40 20
u1 (gra)
y1 (gra)
10
0
-20
-10 0
0
500 t (seg)
1000
-40 0
500
1000
t (seg)
Figura 11.19: Respuesta modnl controlador multivariable, ltr-i El regulador anterior se ha desarrollado para conseguir un funcionamiento adecuado para cambios en la referencia. Como ya se ha dicho, otra importante condicion de funcionamiento se re ere a la situacion de mantenimiento del rumbo y reduccion del movimiento de balance. La exigencia anterior no esta garantizada en presencia de perturbaciones para el controlador LTR-i anterior (ver gura 11.21). En dicha gura se muestran las tolerancias a incertidumbres y la caracterstica en frecuencia para el rechazo de las perturbaciones que se den tanto a la entrada como a la salida de la planta. El comportamiento esperado del sistema frente a perturbaciones, se puede determinar a partir de las respuestas en frecuencia de So(s)G(s) y So(s), dadas en la gura 11.21; de la que se deduce que las perturbaciones no van a ser atenuadas independientemente de la direccion en que estas se den. Para ello se propone modi car las matrices de ponderacion y ampliar el modelo de la planta para el dise~no del controlador ltr-i; incorporando una caracterstica de alta ganancia en lazo abierto
301
200
40
150
20
u2 (gra)
y2 (gra)
Aplicacion de control robusto
100 50
0 -20
0 0
500
-40 0
1000
t (seg)
500
1000
t (seg) 40 20
u1 (gra)
y1 (gra)
10
0
-20
-10 0
0
500
1000
-40 0
t (seg)
500
1000
t (seg)
Figura 11.20: Respuesta modnl controlador monovariable a baja frecuencia (aproximacion de la accion integral). Para ello se emplea un modelo linealizado de la planta para una velocidad de crucero de 21 nudos. Los parametros de dise~no tomados para el regulador ltr-i 5 son los siguientes:
! ! B C T Aa = ; Ba = O ; Ca = O 22 22 " # 1 0 Rc = 5 0 1 Qc = MaT QMa " # " # 100 0 0 : 1 0 Q = 0 1 Ma = C 0 0:1 = Ba Ro = I2 Qo = T ; q = 106 donde las matrices Aa ; Ba y Ca corresponden al modelo de la planta ampliada utilizado para el calculo del regulador. A On2 C O22
!
Se emplea la version no basada en observador, dado que a baja frecuencia se produce una recuperacion del lazo abierto sensiblemente superior que con un regulador lqg/ltr-i estandar. 5
302
Dise~no de controladores LTR multivariables 80
1/sv_max(M) (db)
1/sv_max(M) (db)
80 60 40
iMi
20 0 -20 10 -4
10 -1
60 40 20 0 -20 10 -4
10 2
10 -1
10 2
w (rad/s)
20
20
0
0
sv(SoG) (db)
sv(So) (db)
w (rad/s)
-20 -40 -60 -80 10 -4
iMo
-20 -40 -60
10 -1 w (rad/s)
10 2
-80 10 -4
10 -1
10 2
w (rad/s)
Figura 11.21: Caractersticas de la tolerancia a incertidumbres y rechazo de las perturbaciones En la gura 11.22 se muestran los valores singulares extremos de So(j!) y So (j!)G(j!). Como puede verse, [So (j!)G(j!)] < 1 ( 4:96db) para toda !; as mismo, [So (j!)G(j!)] y [So(j!)] son ambos lo su cientemente peque~nos en la zona de baja frecuencia, como es deseable. Con este controlador se obtienen los siguientes indicadores de robustez: I11i = 62%; I12i = 70%; I11o = 61%; I12o = 63%; I1s = 38%. La gura 11.23 muestra las respuestas temporales del sistema para el controlador LTR-i (NOBC) multivariable, y para un controlador que no tiene en cuenta el caracter vectorial de la planta. En las simulaciones se emplea una altura signi cativa de olas de 4m y un angulo de incidencia de 45 relativo al curso de referencia del buque. Puede verse que hay una mejora notable en la reduccion del movimiento del balance si se emplea el controlador LTR-i multivariable. La gura 11.24 muestra el rumbo (heading) y el balance (roll) para condiciones de velocidad no nominales (18 nudos y 16:5 nudos); se observa que el comportamiento es adecuado, lo cual representa otra prueba de la robustez del controlador dise~nado. Debido a las dinamicas asociadas a la planta y a los reguladores, estos se pueden implementar directamente en un computador digital con un perodo de muestreo de
Aplicacion de control robusto
303 80
1/sv_max(M) (db)
1/sv_max(M) (db)
80 60 40
iMi
20 0 -20 10 -4
10 -1
60 40 20 0 -20 10 -4
10 2
10 -1
10 2
w (rad/s)
20
20
0
0
sv(SoG) (db)
sv(So) (db)
w (rad/s)
-20 -40 -60 -80 10 -4
iMo
-20 -40 -60
10 -1
-80 10 -4
10 2
w (rad/s)
10 -1
10 2
w (rad/s)
Figura 11.22: Caractersticas de la tolerancia a incertidumbres y rechazo de las perturbaciones 10
10 SISO controller
SISO controller
heading (deg)
roll (deg)
5 0 -5 -10 0
5 0 -5 -10 0
500 t (sec)
10
10 MIMO controller
MIMO controller
heading (deg)
5
roll (deg)
500 t (sec)
0 -5 -10 0
500 t (sec)
5 0 -5 -10 0
500 t (sec)
Figura 11.23: Operacion con rumbo constante bajo accion de las olas
Dise~no de controladores H2 y H1 multivariables 10
10
5
5
heading (deg)
roll (deg)
304
0 -5 -10 0
0 -5 -10 0
500
10
10
5
5
0 -5 -10 0
500 t (sec), V=9.5m/s
heading (deg)
roll (deg)
t (sec), V=9.5m/s
500
0 -5 -10 0
t (sec), V=8m/s
500 t (sec), V=8m/s
Figura 11.24: Comportamiento para condiciones de trabajo no nominales 0:1 segundos, sin tener en cuenta de una manera explcita el caracter muestreado del sistema de control. Todas las implementaciones de los algoritmos LTR-i empleados en las simulaciones con el modelo no lineal (modnl) se realizan de esta forma (Lopez y Rubio, 1995a). Otra posibilidad sera utilizar un regulador de tiempo discreto equivalente, empleando por ejemplo un perodo de muestreo de 0.5 segundos.
11.5 Dise~no de controladores riables
2
H
y
1
H
multiva-
Para obtener un conjunto (WH ) de matrices de ponderacion implicadas en los problemas de dise~no H2 y H1 (ver captulo 10):
WH = fWS (s); WU (s); WT (s); Wr (s); Wn(s); Wdo (s); Wdi (s)g
(11:5)
que den una solucion fsicamente realizable y satisfactoria, se pueden emplear dos procedimientos:
Aplicacion de control robusto
305
1. Empezar sin informacion previa sobre la di cultad del problema de dise~no a tratar, e interpretar las especi caciones de dise~no en el dominio frecuencial como elementos de WH . Ensayar distintas combinaciones, hasta conseguir unos resultados adecuados. 2. Comenzar a partir de unos resultados previos, obtenidos con alguna tecnica de dise~no, que pongan de mani esto la di cultad del problema de control, den una interpretacion en frecuencia de los resultados y sirvan para sugerir posibles mejoras, a partir de una adecuada seleccion de los elementos de WH . En este captulo se emplea el segundo procedimiento, de forma que se aprovechan los resultados de una primera fase de dise~no de un controlador ltr, a partir de los cuales se sugieren los elementos de WH , comparando nalmente los resultados obtenidos por los reguladores ltr, H2 y H1. La metodologa de dise~no propuesta tiene dos etapas o fases. La primera fase es opcional y consiste en el dise~no de un controlador H2. En la segunda fase se obtiene un regulador H1 basado en los resultados de la primera etapa. Si as se considera, solo se realiza la segunda etapa (Lopez y Rubio, 1995c; Lopez 1994). El algoritmo propuesto sigue los siguientes pasos: 1. Seleccionar los elementos de WH . 2. Resolver el problema del regulador optimo H2 (captulo 10). 3. Ver si las respuestas temporal y frecuencial son adecuadas (analizar los indicadores de comportamiento y robustez); si no es as, se vuelve al paso 1. 4. Calcular el valor 2:
kTzw k1 = 2
5. Hacer: = 2 6. Resolver el problema del regulador H1 para el valor de (ver captulo 10). 7. Si no se encuentra solucion para el valor de empleado, se toma uno mayor y se vuelve al paso 6. Para encontrar el valor de para el que se consigue el regulador optimo H1, se puede emplear, por ejemplo, el metodo de la biseccion como procedimiento iterativo de busqueda del optimo. 8. Calcular el valor 1:
kTzw k1 = 1
306
Dise~no de controladores H2 y H1 multivariables
9. Ver si las respuestas temporal y frecuencial son adecuadas; si no es as, se aumenta el valor de y se vuelve al paso 6. 10. Disminuir el valor de y volver al paso 6. El proceso iterativo anterior, se interrumpe cuando se llega al valor optimo
= opt, o a un valor de > opt, para el que al disminuir su valor el regulador H1 obtenido no da una respuesta temporal adecuada (por ejemplo: un excesivo aumento de la magnitud de control comparado con el regulador H2 previo); o si ocurre que aun a pesar de disminuir el valor de kTzw k1, el controlador obtenido tiene globalmente unos indicadores de robustez menos satisfactorios. Puede igualmente darse el caso, de que al calcular el regulador H1 optimo directamente empleando algunas de las funciones que tienen incorporadas los paquetes de programas de Dise~no de Sistemas de Control por Computador (cacsd), tales como Program CC, y Robust Control Toolbox, sea necesario el empleo de un regulador suboptimo que de mejores caractersticas de robustez globales. De ah la importancia del conjunto de indicadores de robustez propuesto (Lopez, 1994).
11.5.1 Controladores H1 para sistema de orden elevado Se plantea el problema de obtener el dise~no de controladores H2 y H1, a n de realizar un analisis comparativo entre ellos y con los resultados anteriores obtenidos con los reguladores LTR-o. Para realizar los dise~nos se emplea el modelo de orden reducido (sexto orden) obtenido para el modelo mlmv19 descrito anteriormente, el cual es de orden diecinueve. Una vez obtenidos los reguladores se evaluan con el modelo de orden completo del buque. En primer lugar se plantea el problema de optimizacion de sensibilidad mixta descrito en el captulo 10. Para seleccionar las funciones de ponderacion: WS (s) y WT (s), se utilizan como ayuda los per les (respuestas en frecuencia) de la ftlad empleados para el dise~no ltr. O en otro caso, se parte simplemente de las especi caciones de dise~no sin disponer de dise~nos anteriores. Tras algunos ensayos, se toma para la especi cacion del comportamiento nominal (np):
2 3:1623s + 9:0 10 6 s + 0:09 WS 1(s) = 664 0
6
3 0 77 3:1623s + 4:510 6 75 s + 0:045
Aplicacion de control robusto
307
y como funcion de ponderacion de la funcion de sensibilidad complementaria To(s): 2 3:1623s + 1500 3 0 6 7 WT 1(s) = 64 3162:3s + 474:34 3:1623s + 750 75 0 3162:3s + 237:17 en la gura 11.25 se muestran ambas funciones (matrices) de ponderacion, las cuales re ejan las especi caciones de dise~no en el dominio de la frecuencia. 80 70 W_S
sv(W_S),sv(W_T) (db)
60 50 40
W_T 30 20 10 0 -10 -20 10 -6
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
rad/s
Figura 11.25: Respuestas en frecuencia de WS y WT Se calcula el regulador optimo H2 (sensibilidad mixta) de la forma descrita en el captulo 10. Este regulador consigue: kTzw (j!)k1 2 = 0:566 El valor = 2 se utiliza como valor de partida para resolver el problema de optimizacion H1. Empleando un proceso iterativo para el calculo del regulador H1, se obtiene: kTzw (j!)k1 = o = 0:480 Dado que o < 2, se consigue una mejora con respecto al regulador H2 anterior, en el sentido de que se veri ca la desigualdad kTzw k1 1
Dise~no de controladores H2 y H1 multivariables
308
con mas holgura. Las respuestas temporales de ambos reguladores, para un cambio tipo escalon de [0; 5]T grados en la referencia, son muy similares; en la gura 11.26 se muestran para el regulador H1. 6 y2
y (gra)
4 2 0
y1 -2
0
20
40
60
80
100
120
140
160
180
200
60
70
80
90
100
t (seg) 60
u (gra)
40
u1
20 0 u2
-20 -40 0
10
20
30
40
50 t (seg)
Figura 11.26: Respuesta temporal controlador H1 (sensibilidad mixta) Como se describe en el captulo 8, la responsabilidad de la atenuacion de las perturbaciones que actuen sobre la planta, y de conseguir un seguimiento adecuado a cambios de referencia, recae sobre las matrices de transferencia So(s) y So(s)G(s). En la gura 11.27 se tienen los valores singulares de ambas para el controlador H1 (sensibilidad mixta). El comportamiento de So es totalmente satisfactorio,
[So(j!)] 1;
a baja frecuencia
como era de esperar del planteamiento hecho con el problema de sensibilidad mixta. Sin embargo, no ocurre lo mismo con SoG; dado que segun se deduce de la gura 11.27, se pueden dar perturbaciones vectoriales, actuantes a la entrada de la planta, que no sean atenuadas por el sistema. Para conseguir una caracterstica similar a la del controlador ltr-o dise~nado en la seccion anterior, se modi ca la funcion de coste de modo que Tzw incluya un termino que pondere tambien al factor SoG, puesto que de lo visto en el captulo 8
Aplicacion de control robusto
309
20
sv(So) (db)
0 -20 -40 -60 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 0
10 1
10 2
w (rad/s)
sv(SoG) (db)
50 0 -50 -100 -150 10 -5
10 -4
10 -3
10 -2
10 -1 w (rad/s)
Figura 11.27: So y So G para controlador H1 (sensibilidad mixta) se obtiene que el vector de error entre la referencia y la respuesta del sistema viene dado por,
e = r y = So (r do n) SoGdi En el planteamiento general del problema de optimizacion realizado en el captulo 10, se considera el caso particular:
"
# " #" # z1(s) = WS (s)So(s) WS (s)So(s)G(s)Wdi (s) r(s) z3(s) WT (s)To (s) WT (s)So(s)G(s)Wdi (s) di(s)
donde Wdi (s) se elige de forma que se especi que, con los elementos (1,2) y (2,2) de Tzw , el objetivo de conseguir como resultado un controlador que a baja frecuencia satisfaga: [So (j!)G(j!)] 1 (11:6) Este objetivo puede alcanzarse (ver gura 11.30) tomando las siguientes matrices
Dise~no de controladores H2 y H1 multivariables
310 de ponderacion:
Wdi (s) = s +1 1 I 2 2 0 66 3:1623ss++72:210 :2768 10 5 WS (s) = 64 s + 3:6 10 2 0 3:1623s + 1:1384 2 3162:3s + 379:47 3 10 0 6 7 WT (s) = 64 3:1623s + 1200 3162:3s + 189:74 75 0 3:1623s + 600
5
3 77 75
En las guras 11.28 y 11.29 se muestran respectivamente las funciones de ponderacion WS , WT , as como WS Wdi y WT Wdi , para el caso del problema de rechazo a las perturbaciones. 80 70 W_S
sv(W_S),sv(W_T) (db)
60 50 40 30
W_T
20 10 0 -10 -20 10 -6
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
rad/s
Figura 11.28: Respuestas en frecuencia de WS y WT Con el regulador H2 se obtiene kTzw k1 = 1:533; mientras que el regulador H1, consigue kTzw k1 = 1:195. En la gura 11.31 se muestra la respuesta temporal del sistema con el controlador H1 para un cambio de consigna [0; 5]T grados. Si se calculan los indicadores de robustez propuestos para los controladores
Aplicacion de control robusto
311
60 W_S W_di
sv(W_S W_di),sv(W_T W_di) (db)
40
20 W_T W_di 0
-20
-40
-60
-80 10 -6
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
rad/s
Figura 11.29: Respuestas en frecuencia de WS Wdi y WT Wdi
sv(So) (db)
50
0
-50
-100 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 0
10 1
10 2
w (rad/s)
sv(SoG) (db)
50 0 -50 -100 -150 10 -5
10 -4
10 -3
10 -2
10 -1 w (rad/s)
Figura 11.30: So y SoG controlador H1
Dise~no de controladores H2 y H1 multivariables
312 8
y2
y (gra)
6 4 2
y1
0 -2
0
50
100
150
200
250
300
200
250
300
t (seg) 60
u (gra)
40
u1
20 0 u2
-20 -40 0
50
100
150 t (seg)
Figura 11.31: Respuesta temporal controlador H1
dise~nados, se obtienen los resultados que se resumen en la tabla 11.3. Los valores de la tabla estan expresados: MF en grados, MG en decibelios y el resto en tanto por ciento de incertidumbre tolerable.
I11i % H2 (s. mixta) 37 H1 (s. mixta) 45.2 H2 42.1 H1 31.7 Controlador
I12i % 82.4 86.3 45.8 39.8
I11o % 100 100 72.9 74.4
I12o % 100 100 74.1 74.4
I1s % 42.5 44.5 34.8 28.8
MG db 37.6 72.1 12.3 9.1
MF gra 74.9 80.6 58.7 58.2
I3o % 68.1 73.5 51.8 52.3
I3i % 51.0 55.6 37.9 33.2
Tabla 11.3: Indicadores de robustez de los controladores H2 y H1 (mlmv19)
Aplicacion de control robusto
313
11.5.2 Regulador H1 para una planta no lineal En este apartado se va a dise~nar un controlador H1 para el modnl, cuyos objetivos son: 1) obtener un rechazo adecuado de las perturbaciones ambientales (las cuales se mani estan a la entrada y a la salida de la planta), y 2) una estabilidad robusta para ciertos niveles de incertidumbre. Para ello, como se ha justi cado en el apartado anterior, se toma la siguiente matriz de transferencia:
"
WS (s)So(s) WS (s)So(s)G(s)Wdi (s) Tzw = W T (s)To (s) WT (s)So (s)G(s)Wdi (s)
#
y por tanto, en la funcion de coste,
kTzw k1 aparecen de manera explcita las matrices de transferencia So y SoG; las cuales son como ya se ha indicado, las responsables directas que determinan la atenuacion de las perturbaciones que actuen sobre la planta. Las respectivas matrices de ponderacion (dependientes de la frecuencia) WS ; Wdi se eligen para conseguir tales objetivos. El termino WT To se emplea para tener en cuenta la incertidumbre en el modelo de la planta, y se elige de forma que se consiga una tolerancia a incertidumbres de tipo multiplicativo de un 50% en el peor caso. El modelo de la planta es no lineal, sin embargo para hacer el dise~no se emplea un modelo linealizado, y posteriormente el controlador se prueba con el modelo matematico no lineal. El regulador obtenido es suboptimo para las condiciones de operacion para las que se ha realizado la linealizacion, por ello no esta garantizado para el conjunto de puntos en su vecindad debido a la dinamica no lineal del sistema. Sin embargo, el controlador se dise~na con unas buenas propiedades de robustez, siendo los resultados obtenidos por simulacion satisfactorios. Para una velocidad de crucero de 21 nudos se eligen (tras algunos ensayos, y ayudado de los resultados obtenidos con el regulador ltr-i dise~nado en la seccion anterior) las siguientes matrices de transferencia de ponderacion:
2 s + 0:072 66 3:1623s + 2:2768 10 WS (s) = 4 0
Wdi (s) = s +1 1 I
5
0 s + 3:6 10 2 3:1623s + 1:1384 10
5
3 77 5
314
Dise~no de controladores H2 y H1 multivariables
2 3162:3s + 379:47 0 6 WT (s) = 64 3:1623s + 1200 3162:3s + 189:74 0 3:1623s + 600
3 77 5
Con las cuales, el regulador H2 obtiene kTzw k1 = 1:046, y el H1 reduce dicho valor a kTzw k1 = 0:91. En la gura 11.32 se muestran las respuestas en frecuencia de [So(j!)] y [So (j!)G(j!)]; como puede comprobarse, ambas magnitudes son lo su cientemente peque~nas en el rango de baja frecuencia. La gura 11.33 muestra los niveles estimados de incertidumbre multiplicativa no estructurada tolerables por el sistema a la entrada de la planta (iMi), y a la salida (iMo). Esta gura representa 1=(M ), donde M es el sistema de interconexcion para cada tipo particular de incertidumbre. Si se trata de incertidumbre no estructurada, de la gura 11.33 se desprende que para el caso de incertidumbre multiplicativa situada a la entrada de la planta Ei (donde G0 = G(I + Ei)), esta no causara la inestabilidad del sistema, siempre que kEik1 < 0:56 (o sea, que el sistema permite hasta un 56% de incertidumbre relativa). Igualmente, para el caso en que la incertidumbre este a la salida Eo (tal que = (I + Eo )G) se obtiene que kEok1 < 0:66 (lo cual supone un 66% de incertidumbre tolerable en el caso mas desfavorable). Si se analiza la robustez del sistema con respecto a incertidumbres estructuradas (estructura diagonal), se obtienen respectivamente unas tolerancias del 62% y 67% respectivamente, lo cual implica una estimacion menos conservativa, ya que en estos casos se emplea 1=(M ), donde (M ) es el valor singular estructurado de M .
G0
Para evaluar el comportamiento del controlador dise~nado frente a las perturbaciones ambientales, el sistema se somete a unas condiciones de navegacion caracterizadas por una altura signi cativa de olas de 4m, corriente de 2m=s, y viento con velocidad de 20m=s, actuando las perturbaciones en una direccion de 45 grados relativa al curso de referencia del buque. Las respuestas temporales obtenidas se muestran en las guras 11.34 y 11.35, en las que se puede comparar el comportamiento obtenido con el regulador H1 multivariable, y un controlador escalar que no considera la naturaleza multivariable de la planta. Puede comprobarse que con el regulador H1 se obtiene una mejora considerable en la reduccion del movimiento de balance, as como en el mantenimiento del rumbo. En la gura 11.36 se muestra el comportamiento obtenido con el mismo controlador para una velocidad de crucero de 18 nudos, diferente a la nominal empleada para el dise~no. Para la implementacion del regulador en un computador digital se emplea un controlador de tiempo discreto equivalente con un perodo de muestreo
Aplicacion de control robusto
315
sv(So) (db)
50 0 -50 -100 -150 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 0
10 1
10 2
w (rad/s)
sv(SoG) (db)
50 0 -50 -100 -150 10 -5
10 -4
10 -3
10 -2
10 -1 w (rad/s)
Figura 11.32: [So(j!)] y [So(j!)G(j!)]
1/sv(M) (db)
40
20
Multiplicativa a la entrada (iMi)
0 10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 -1
10 0
10 1
w (rad/s)
1/sv(M) (db)
40 Multiplicativa a la salida (iMo) 20
0 10 -5
10 -4
10 -3
10 -2 w (rad/s)
Figura 11.33: Tolerancias a incertidumbres (1=[M (j!)])
Dise~no de controladores H2 y H1 multivariables
316 5
heading (deg)
Controlador SISO 0
-5
0
50
100
150
200
250
300
350
400
450
500
300
350
400
450
500
t (sec) 5
heading (deg)
Controlador MIMO 0
-5
0
50
100
150
200
250 t (sec)
Figura 11.34: Rumbo para controladores SISO y MIMO 15 Controlador SISO
roll (deg)
10 5 0 -5
0
50
100
150
200
250
300
350
400
450
500
300
350
400
450
500
t (sec) 15 Controlador MIMO
roll (deg)
10 5 0 -5
0
50
100
150
200
250 t (sec)
Figura 11.35: Movimiento de balance para controladores SISO y MIMO
Aplicacion de control robusto
I11i % 1: LTR-i 68.5 2: LTR-i 62.3 3: H2 52.3 4: H1 56.2 Contrl
I12i % 78.7 69.8 58.3 61.9
317
I11o % 60.7 60.5 63.7 67.3
I12o % 71.7 63.1 63.7 67.3
I1s % 44.4 37.6 31.3 33.5
MG db 25.8 27.6 17.8 11.5
MF I3o I3i gra % % 66.7 59.5 52.1 53.1 46 49.7 39.7 50.3 53.2 42.6
Tabla 11.4: Indicadores de robustez de los controladores para modnl de 0:1 segundos (se utiliza para ello la transformacion bilineal, ver captulo 10). Se emplea este perodo con el criterio de obtener unas respuestas temporales del sistema en lazo cerrado equivalentes para el regulador de tiempo continuo y el de tiempo discreto. En la tabla 11.4 se resumen los indicadores de robustez de los controladores dise~nados para el modelo no lineal (modnl).
heading (deg)
5
0
-5
0
50
100
150
200
250
300
350
400
450
500
300
350
400
450
500
t (sec) 15
roll (deg)
10 5 0 -5
0
50
100
150
200
250 t (sec)
Figura 11.36: Comportamiento para condicion no nominal
318
Sntesis de los resultados obtenidos
11.6 Sntesis de los resultados obtenidos En este apartado se trata de resumir y remarcar los principales resultados obtenidos en los estudios llevados a cabo. De ello cabe destacar: 1. Se han realizado diversos dise~nos para el control de un sistema multivariable, como es el control del rumbo y balance de un buque. 2. Para evaluar los diferentes dise~nos LTR, H2 y H1 se ha propuesto un conjunto de indicadores de comportamiento y robustez. 3. El problema de dise~no de un sistema de control multivariable es sensiblemente mas complejo que el de un sistema escalar. Sin embargo, los algoritmos empleados para resolver tales problemas se realizan en el espacio de estados y son independientes de la dimension y caracter vectorial o escalar de la planta. Sin embargo puede ser necesario emplear un metodo de calculo alternativo en algunos de los pasos intermedios del algoritmo, debido a los problemas numericos que aparecen con mayor frecuencia en el caso de sistemas multivariables y/o en sistemas de dimension elevada. 4. Se han empleado las metodologas LTR-i y LTR-o, en sus versiones de estructura basada en observador (cbo), o convencional, y no basada en observador (cnbo). Mostrandose que para un mismo nivel de recuperacion es aconsejable, en general, el empleo de la ultima, siempre que el sistema en lazo abierto presente elevada ganancia a baja frecuencia. Ya que, para un nivel de recuperacion dado, proporciona unos reguladores mas robustos y mas realizables desde un punto de vista de la aplicacion industrial. En otro caso (para controladores que no aproximen la accion integral, como los empleados para obtener respuestas sin sobre-oscilacion apreciable a cambios de consigna tipo escalon), la estructura cbo se caracteriza por conseguir mejores propiedades de robustez. 5. La eleccion de la sntesis LTR-i o de la LTR-o, va a depender de las especi caciones de dise~no y de que en cada caso concreto la eleccion de una de ellas sea mas propicia para satisfacer tales especi caciones. As, si se conoce a priori que los efectos de las incertidumbres del sistema pueden quedar re ejados a la salida de la planta, o si esta tiene mas salidas que entradas, sera mas ventajoso emplear la metodologa LTR-o. Mientras que si la planta tiene mas entradas que salidas y/o la incertidumbre puede considerarse que queda re ejada a la entrada de la planta, resulta mas aconsejable utilizar el metodo LTR-i.
Aplicacion de control robusto
319
6. El metodo de dise~no seguido para los reguladores H2 y H1, calcula en primera fase un regulador H2, a partir del cual se obtiene el H1, con el que se consigue disminuir el valor de la funcion de coste kTzw k1 obtenido con el dise~no H2. La robustez del sistema, en general, mejora para el controlador H1, pero en cada caso hay que examinarla, antes de decidir entre los reguladores H2 y H1. 7. Un regulador H1 suboptimo puede proporcionar unas propiedades de robustez y comportamiento globalmente mas satisfactorias que el regulador H1 optimo. 8. Los resultados del empleo de una u otra metodologa de dise~no, van a depender en gran manera de diversos factores: (a) De los requerimientos de control que se precisen. (b) Del modo en que estos se expresen de forma matematica. (c) De la experiencia que se tenga a la hora de seleccionar los parametros de dise~no. (d) De seguir un procedimiento iterativo sistematico que simpli que el dise~no y reduzca el numero de iteraciones. Se han obtenido buenos resultados con cada una de las metodologas analizadas: LTR, H2 y H1. 9. Se ha comprobado, al menos para los casos analizados, que un controlador H1 con prestaciones similares a un controlador LTR, requiere una dimension mayor, necesita perodos de muestreo sensiblemente inferiores y posee propiedades numericas menos favorables; por lo que desde un punto de vista practico, y en determinados casos concretos, podra ser mas recomendable el empleo de controladores ltr (Lopez y Rubio, 1995b). La metodologa H1 aborda de una forma explcita las especi caciones del sistema en lazo cerrado y los niveles de incertidumbre que el sistema de control debe soportar, por lo que resulta mas simple la formulacion de ciertos problemas de control robusto. La metodologa LTR consiste sin embargo, en un procedimiento indirecto, ya que trata con las funciones (matrices) de transferencia en lazo abierto, no pudiendose expresar de manera directa (a partir de las matrices de ponderacion empleadas para el dise~no) los niveles de incertidumbre tolerables, teniendo que calcularse estos a posteriori. Por otro lado, la metodologa H1 junto con el procedimiento de dise~no conocido como sntesis- (Balas et al, 1991) puede proporcionar de forma directa reguladores con un comportamiento robusto.
320
Sntesis de los resultados obtenidos
En general, se puede decir que ningun metodo proporciona la solucion total al problema de dise~no; ya que con tecnicas diferentes, y con distintos grados de so sticacion, pueden obtenerse resultados similares. En cada caso particular habra que determinar a partir de las caractersticas del sistema a controlar y de las exigencias de dise~no, cual es la metodologa que proporciona los mejores resultados. Resulta por tanto de interes el desarrollo de metodos iterativos informatizados para el ajuste y seleccion automatizada de los parametros de dise~no, en funcion de unas especi caciones realizadas por el operador (cosa que no siempre es sencilla, especialmente en el caso de sistemas multivariables). Integrando diferentes tecnicas de control robusto en un sistema que ofrezca al usuario la posibilidad de comparar y decidir la estrategia de control que pueda conseguir mejores resultados, o que mejor se adapte al problema concreto de dise~no. Hay que remarcar que la teora de control en torno a los metodos H1 esta en continua evolucion, as como el desarrollo de tecnicas de dise~no de controladores multi-objetivos, tales como la conocida por H2=H1; existiendo la en actualidad grandes esfuerzos de investigacion en torno a tales metodos (Doyle et al. 1994, Haddad et al, 1994; Rotea et al, 1991; Stoorvogel, 1992; Khargonekar et al, 1991; Green y Limebeer, 1995; Grimble, 1994).
Apendice A Analisis de los sistemas de control basados en observador A.1 Analisis de robustez con y sin observador Sea un sistema de control por realimentacion del vector de estado, y el correspondiente sistema que emplea un observador para estimar el estado del proceso, tal como muestran las guras A.1 y A.2 respectivamente. Entre los esquemas correspondientes de estas guras (Doyle y Stein, 1979), se cumplen las siguientes propiedades: 1. La funcion de transferencia de los bucles cerrados es la misma en ambos casos. 2. La funcion de transferencia en bucle abierto abriendo en el esquema de la
G(s)
r - as B - 6 b s
(s)
Kc
C
-
x
Figura A.1: Realimentacion del vector de estado 321
y
322
Analisis de robustez con y sin observador
r
0 - j u (1)t (2)t u - 6
-
u^ Kc
y
Planta
-
B
?j
(s)
-
Ko
j 6
C
Figura A.2: Diagrama del controlador LQG gura A.2 por el punto (1) es la misma. En efecto:
en la gura A.1, u = Kc x = KcB u0 en la gura A.2, u = Kc x^ = KcB u0 ya que x^ = Bu0, al tener los dos sistemas (planta y observador) la misma se~nal de entrada. 3. Las funciones de transferencia abriendo en el esquema completo (A.2) por (2) son diferentes. Se puede demostrar que solo son iguales si se modi ca Ko , pasando a depender de un parametro q y tendiendo este a in nito. Ello se demostrara en la proxima seccion. El hecho de que sean distintos en este caso, se debe a que la dinamica del error del observador (y y^) es tenida en cuenta, si se rompe el bucle (o si se introducen perturbaciones) por (2), cosa que no ocurre si se abre por (1) (A.2).
-
Analisis de los sistemas de control basados en observador
323
A.2 Condicion su ciente para la recuperacion A continuacion se va a desarrollar la condicion su ciente para que el bucle abierto lqg tienda al lqr. A partir de la gura A.1 se tiene que la funcion de transferencia en lazo abierto (que relaciona la se~nal que entra por el punto a y sale por el punto b) del regulador lqr viene dada por, Hc(s) = LLQR (s) = Kc(sI A) 1B (A:1) Para ello, se hacen depender las ganancias del ltro de Kalman de un determinado parametro q. Si se cumple que: Ko(q) = BW (A:2) lim q!1 q siendo W cualquier matriz no singular entonces; el bucle abierto lqg se aproxima asintoticamente al lqr. En efecto, la funcion de transferencia de bucle abierto con observador viene dada por, LLQG = Kc(sI A + BKc + KoC ) 1Ko C B (A:3) Si se hace = (sI A + BKc) 1 y teniendo en cuenta el lema de inversion de matrices, (A + BCD) 1 = A 1 A 1 B (C 1 + DA 1 B ) 1DA 1 (A:4) dicha expresion, puede ser escrita como: LLQG = Kc[ Ko(1 + C Ko) 1 C ]Ko C B = = [Kc Ko Kc Ko(1 + C Ko) 1 C Ko] C B = = [Kc Ko(1 (1 + C Ko) 1 )C Ko] C B = = Kc Ko(1 + C Ko) 1 C B
(A.5)
Si en esta ultima expresion se aplica la condicion de recuperacion dada por la expresion (A.2), se tiene, LLQG = Kc qBW (1 + C qBW ) 1 C B que cuando se hace tender q a in nito se reduce a: LLQG = Kc BW (C BW ) 1 C B
324
Condicion su ciente para la recuperacion
Aplicando a esta ultima expresion, nuevamente el lema de inversion de matrices (A.4) y sustituyendo por su valor se llega a,
LLQG = = = =
Kc BW (C BW ) 1 C B = KcBW (1 + KcB ) 1 [C BW (1 + KcB ) 1 ] KcBW (C BW ) 1 C B = KcB
1
C B =
Luego la expresion nal que se obtiene es,
LLQG(s) = KcB la cual es identica a la expresion (A.1) correspondiente a LLQR (s). Con esto queda demostrada la convergencia al tender el parametro q a in nito, de las funciones de transferencia en bucle abierto, cuando se tiene una estructura de realimentacion directa del estado o con un observador ( ltro de Kalman). Para que Ko cumpla la condicion de recuperacion se tendra que introducir alguna modi cacion en el ltro de Kalman. Para ello, se dise~na el ltro de Kalman con unas matrices de covarianzas cticias. Se tomaran:
Q = Qo + q2 BV B T R = Ro
(A.6) (A.7)
siendo V cualquier matriz no singular y donde Qo y Ro son las matrices de covarianzas nominales de w y v; y q es un parametro escalar conocido como ganancia de recuperacion. Con estas modi caciones se calcula el ltro de Kalman:
Ko = PC T R 1 AP + PAT + Q PC T R 1CP = 0
(A:8) (A:9)
Introduciendo las anteriores matrices de covarianzas en la ecuacion (A.9), resulta:
AP + PAT + Qo + q2BV B T PC T R 1CP = 0
(A:10)
Analisis de los sistemas de control basados en observador y dividiendo la expresion por q2 se llega a, A qP2 + qP2 AT + Qq2o + BV B T q2( qP2 )C T R 1C ( qP2 ) = 0
325 (A:11)
Hay que destacar el hecho de que en la anterior ecuacion (A.11), existen dos tipos de variables: q, que es el parametro cuyo valor se modi ca para recuperar la funcion de transferencia, y la matriz P , de la cual dependen los valores de las ganancias del ltro de Kalman y que solo puede ser encontrada una vez asignado a q un valor determinado. Por tanto, si se hace tender q a in nito se tendra:
! BV B T q2( qP2 )C T R 1 C ( qP2 ) q!1 y teniendo en cuenta el valor de Ko (ecuacion A.8), se tiene: Ko(q)RKoT (q) q!1 ! BV B T q2 que descomponiendo lo anterior se llega a: 1 1 1 Ko(q) q!1 2 2 ! B V | (R{z ) } = BW q
W
Se cumple, por tanto, la condicion de recuperacion (ecuacion A.2). Se calculara, por tanto, el ltro de Kalman a partir de la matriz de covarianza modi cada, de este modo, a medida que se aumente el valor del parametro q mas cerca se estara de la funcion de transferencia en bucle abierto del lqr. Al hacer esto, se pierde precision en la estimacion del estado, ya que se esta calculando el ltro de Kalman con unas covarianzas cticias, sin embargo, se gana en robustez.
A.3 Planteamiento del Metodo LQG en el Dominio de la Frecuencia La ecuacion de Riccati se puede interpretar en el dominio de la frecuencia, de forma que proporcione expresiones en terminos de funciones de transferencia. Sea el sis-
326
Planteamiento del Metodo LQG en el Dominio de la Frecuencia
tema,
x_ = Ax + Bu
(A:12)
donde u es de dimension 1 por simplicidad, y sometido al criterio de funcionamiento:
J=
Z1 0
(xT Qcx + u2) dt
(A:13)
Se supone r = 1 sin perdida de generalidad, ya que puede ser englobado en los elementos de la matriz Qc. La ecuacion de Riccati correspondiente viene dada por:
AT Pc + PcA PcBR 1B T Pc + Qc = 0 que a su vez puede ser reordenada de la forma:
Pc A AT Pc = Qc PcBB T Pc Sumando y restando sPc al primer miembro se tiene:
Pc(sI A) + ( sI AT )Pc = Qc PcBB T Pc que llamando (s) = (sI A) 1 conduce a:
Pc 1 (s) + T 1 ( s)Pc = Qc KcT Kc Premultiplicando por B T T ( s) y postmultiplicando por (s)B se llega a:
B T T ( s)Pc | 1 ({z s)(s}) B + B T | T ( s){zT 1 ( s)} Pc(s)B = I
I
T B T T ( s)[Qc KcT Kc](s)BB T T ( s) P|{z} cB + B | {zP}c (s)B =
B T T ( s)Qc(s)B B T T (
Kc KcT s)KcT Kc(s)B
Analisis de los sistemas de control basados en observador
327
La funcion de transferencia en bucle abierto cuando se aplica la ley de control
lqr es Hc = Kc (s)B = B T T (s)KcT , luego la anterior expresion se puede escribir:
HcT ( s) + Hc(s) = B T T ( s)Qc(s)B HcT ( s)Hc(s)
(A:14)
que a su vez se puede reescribir de la forma: [1 + HcT ( s)][1 + Hc(s)] = 1 + B T T ( s)Qc (s)B
(A:15)
Se de ne: Fc(s) 1 + Hc(s), y Fc(s) se conoce como la funcion de diferencias del retorno. Ahora supongase el segundo miembro de (A.15) factorizado de la forma (factorizacion espectral): 1 + B T T ( s)Qc(s)B = c(s)c( s)
(A:16)
se tiene entonces que (A.15) se puede reescribir:
Fc(s)Fc( s) = c(s)c( s) y por tanto:
Fc(s) = c(s) con lo que se llega a la expresion que da la funcion de transferencia del sistema en bucle abierto, con la realimentacion de las variables de estado: Hc(s) = c(s) 1 Observese que mediante la factorizacion espectral anterior se ha resuelto la ecuacion de Riccati al determinar c(s). En efecto se ha obtenido Hc (s), lo cual es equivalente a determinar Kc, ya que ambas vienen relacionadas por la expresion Hc(s) = KcB . Es decir, manipulando exclusivamente funciones de transferencia se llega a determinar la solucion al problema lqr. Una vez demostrado lo anterior se puede comprobar lo que se haba a rmado sobre la robustez de los reguladores lqr. Si se factoriza Qc de la forma Qc = M T M y se hace s = j! en la ecuacion de Riccati (A.15) se obtiene:
328
Planteamiento del Metodo LQG en el Dominio de la Frecuencia
j 1 + Hc(j!) j2= 1+ j M (j!)B j2 de donde:
k1 + Hc(j!)k > 1
(A:17)
Si se interpreta esta condicion en el plano polar, la curva de Hc(j!) no puede entrar dentro de un crculo de centro ( 1; 0) y radio 1, por lo que se asegura un margen de fase mayor de 60 grados y un margen de ganancia in nito. Un desarrollo analogo para el problema de la observacion llevara a un resultado del mismo tipo. Para el ltro de Kalman se tiene que la matriz de ganancia del observador esta dada por, Ko = PoC T obteniendose esta de la ecuacion de Riccati:
APo + PoAT + Qo PoC T CPo = 0 Si se de ne la funcion de transferencia en bucle abierto del observador como la que resulta de cortar el bucle del ltro de Kalman por el punto (1) en la gura A.2, se tendra: Ho = C Ko (A:18) Y efectuando un desarrollo similar al realizado para el control se llegara a:
Ho(s) = o (s) 1 con:
o (s)o( s) = 1 + C (s)QoT ( s)C T
(A:19)
Lo que se obtiene no es Ko, sino Ho(s), pero ambos resultados, como se ha visto, son equivalentes.
Procedimiento de calculo De lo desarrollado en esta seccion se puede resumir que mediante la manipulacion de funciones de transferencias, se llega a resolver el problema lqg. El procedimiento sera especi car la matriz Qc en forma factorizada como Qc = M T M , lo cual es equivalente a especi car la funcion de transferencia Gc(s) = M (s)B . A partir de
Analisis de los sistemas de control basados en observador
329
esta funcion de transferencia y mediante la factorizacion de la ecuacion de diferencias del retorno: [1 + HcT ( s)][1 + Hc(s)] = 1 + GTc ( s)Gc(s) (A:20) se puede llegar a deducir Hc(s), funcion de transferencia de bucle abierto del lqr. De forma analoga, especi cando la matriz Qo en forma factorizada como Qo = o bien especi car la funcion de transferencia Go(s) = C (s) , y mediante la factorizacion de la ecuacion de diferencias del retorno: [1 + Ho(s)][1 + HoT ( s)] = 1 + Go (s)GTo ( s) (A:21) se puede calcular Ho(s). T
Con estas dos funciones de transferencia: Hc(s); Ho(s), se pueden calcular las ganancias de la ley de control y del ltro de Kalman Kc y Ko, ya que estan directamente relacionadas por las expresiones (A.1) y (A.18) rese~nadas anteriormente.
A.4 Regulador LQG obtenido mediante ecuacion diofantica A continuacion se deduce una ecuacion diofantica, que puede ser utilizada como alternativa para obtener la expresion del regulador lqg. Este regulador a partir de la (ecuacion A.3) viene dado por, GR (s) = Kc(sI A + BKc + KoC ) 1Ko (A:22) que operando como se ha visto en la seccion (A.2), se llega a la expresion (A.5) de la funcion de transferencia en bucle abierto, y por tanto para el regulador sera, GR(s) = Kc Ko(1 + C Ko) 1 (A:23) Utilizando nuevamente el lema de inversion de matrices (A.4) se obtiene la expresion: GR (s) = [KcKo KcB (1 + C B ) 1 KcKo ](1 + C Ko) 1 (A:24) que llamando kk(s) = KcKo , y teniendo en cuenta las expresiones de Gc (A.1) y Go (A.18), puede escribirse, GR (s) = [kk Gc(1 + Gc) 1 kk](1 + C Ko) 1 = = [kk(1 Gc(1 + Gc) 1)][1 + C Ko C B (1 + Gc) 1kcKo] 1 = = kk(1 + Gc) 1[1 + Go Gp(1 + Gc) 1 kk] 1 (A.25)
330
Regulador LQG obtenido mediante ecuacion diofantica
GR(s) = 1 + G + G +kkG G G kk c o c o p GR(s) = (1 + G )(1 +kkG ) G kk c o p
(A:26) (A:27)
Esta expresion da una relacion en terminos de funciones de transferencia para el regulador lqg. Si se expresan las funciones de transferencia deseadas Gdc y Gdo como cociente de dos polinomios en s, y sustituyendo en la expresion (A.27) se tiene:
Gdc(s) = nd1((ss)) y Gdo (s) = nd((ss)) 1
(A:28)
(s) kk(s)d1(s) nr (s) (A:29) GR (s) = (s) kk = = c(s)o (s) n(s)kk(s)d1(s) dr (s) c o (s) n(s)kk(s) d ( s ) d1(s)d(s) d(s) donde c(s) es el factor positivo procedente de la factorizacion del termino derecho de la ecuacion (A.20) y o(s) el correspondiente a la ecuacion (A.21). A partir de la ecuacion (A.29), se puede llegar a la ecuacion diofantica que permite obtener la expresion del regulador mediante la manipulacion de polinomios en s, donde nr (s) y dr (s) son las incognitas. En efecto, haciendo nr (s) = kk(s)d1(s), se tiene: c(s)o(s) = dr (s) d(s) + n(s) nr (s) (A:30)
Apendice B Elementos matematicos utiles en la teora de control B.1 Polos y ceros de un sistema multivariable Sea un sistema lineal e invariante en el tiempo (slit) descrito por el conjunto de ecuaciones: x_ (t) = Ax(t) + Bu(t) y(t) = Cx(t) + Du(t) (B.1) donde x 2